Szeged, 2015. január 15–16. 195 TrendMiner: politikai témájú Facebook-üzenetek feldolgozása és szociálpszichológiai elemzése Miháltz Márton, Váradi Tamás MTA Nyelvtudományi Intézet Nyelvtechnológiai és Alkalmazott Nyelvészeti Osztály, Nyelv- technológiai Kutatócsoport 1068 Budapest, Benczúr utca 33. {mihaltz.marton, varadi.tamas}@nytud.mta.hu Kivonat Az előadásban bemutatjuk a Trendminer projekt 1 módszereit és eredményeit. Az FP7- es finanszírozású, európai kooperációban megvalósuló munkálatok célja közösségi média stream-ek valós idejű figyelése, trendkövetése és összegzése. Ezen belül az MTA NYTI által fejlesztett, MTA TTK KPI Narratív Pszichológiai Kutatócsoportjá- nak munkatársaival együttműködésben készített eszközök célkitűzése a magyar Facebook-felhasználók politikai tartalmú posztokra adott nyilvános kommentjeinek nagymennyiségű gyűjtése, elemzése és szociálpszichológiai aspektusokból történő automatikus kiértékelése volt. Ezzel a kutatással reményeink szerint támogatást nyúj- tunk annak vizsgálatához, hogy milyen érzelmi és társas pszichológiai jelenségek, trendek figyelhetők meg a magyar közösségimédia-hozzászólók politikai témákra rea- gáló üzeneteiben. A projektben a Facebook Graph API segítségével 12 hónap alatt mintegy 140 ezer publikus posztot és az ezekre érkezett mintegy 2 millió publikus kommentet gyűjtöt- tünk össze több mint 1300 Facebook-oldalról, melyek Magyarországon bejegyzett politikai pártokhoz, azok tagszervezeteihez, képviselőihez és -jelöltjeihez kötődnek. Figyelmet fordítottunk a 2014-es évben lezajlott országgyűlési és európai parlamenti választások jelöltjeinek és tisztséget elnyerő képviselőinek oldalain megjelent üzene- tek gyűjtésére is. A begyűjtött üzeneteket adatbázisban tárolás után az alábbi pipeline segítségével dolgoztuk fel: mondatszegmentálás, tokenizálás (huntoken eszköz), morfológiai elem- zés és szófaji egyértelműsítés (hunpos és hunmorph eszközök), szótő és morfológiai elemzés egyértelműsítése (saját eszköz). Ezt követte a domain számára releváns enti- tások azonosítása, illetve a tartalomelemzés a NooJ eszköz nyílt forrású változatával, melyhez parancssori változatot készítettünk 2 . A tartalomelemzés az üzenetek érzelmi polaritásának (sentiment) vizsgálatán túl további 5 pszichológiai dimenziót érintett [2] (elsődleges-másodlagos gondolkodási szint, közösségiség-ágencia, optimizmus- pesszimizmus, individualizmus-kollektivizmus), melyek ilyen célú felhasználására tudomásunk szerint ez az első példa. 1 http://www.trendminer-project.eu 2 https://bitbucket.org/tkb-/nooj-cmd