A Neticle véleményárfolyamról röviden

A Neticle rendszer (lásd: http://demo.neticle.hu/) számokban foglalja össze a web véleményét, hangulatát egy adott témával, ha úgy tetszik, kulcsszóval kapcsolatban. Ehhez az egyik legfontosabb mutatónk az úgynevezett webes véleményárfolyam. Most ezt a mutatót és számításának alapjait szeretnénk röviden bemutatni.

Neticle véleményárfolyam (WOI)
Véleményárfolyam a Neticle-ben

 

 

 

 

 

 

 

 

 

A Neticle véleményárfolyam (WOI, Web Opinion Index) egy univerzális mutató, amely összefoglalja a webes tartalmak véleményét egyetlen dinamikusan változó számba. (Ez a mutató tulajdonképpen a tőzsdei részvényárfolyam analógiája, a weben publikálók véleményét, hangulatát tükrözi.)

A pozitív és negatív webes tartalmak alapján számolt véleményárfolyam egyértelműen mutatja egy cég/termék/téma webes megítélését illetve annak változását. Ha egy pozitív írás jelenik meg a témában a weben, akkor az árfolyam növekszik, ha pedig valaki negatívan nyilatkozik egy fórumon például a termékről, akkor a véleményárfolyam csökken. Az árfolyam összevethető múltbeli adatokkal és a versenytársak árfolyamaival, vizsgálhatóak a marketingkampányok hatásai is például.

De hogyan tudja a Neticle ezt automatikusan kiszámolni?

A természetes nyelvek feldolgozása (NLP) témakörbe tartozik minden olyan terület, amikor emberek által beszélt/írt nyelvet dolgozunk fel, jellemzően számítógéppel. A véleményelemzés vagy sentiment analysis célja olyan algoritmusok kialakítása, melyek számszerűsítik különböző szövegek véleménypolaritását valamilyen pozitív-negatív skálán.

A tudományos alapokat tehát meglepő módon nem mi találtuk fel:) Azonban a korábbi magyar nyelvre készült véleményelemző megoldások sajnos nem elég pontosak üzleti felhasználáshoz. Az általunk kifejlesztett nyelvi véleményelemző algoritmus a következő sajátosságokkal bír többek között:

  • a polaritásmérést a szópolaritás meghatározásán túl több dimenzióval is kiegészítjük,
  • jellemző idiómák, hasonlatok, metaforák és kifejezések kezelésével javítjuk a pontosságot,
  • illetve kezeljük például a jellemző ironikus megnyilvánulásokat is.

A fejlesztés során az elképzelésünk az volt, hogy a magyar nyelvű webes mondatok véleménypolaritásának (tehát pozitív-negatív voltának) számítógépes meghatározása a megfelelő algoritmussal elérheti az emberi ítélőképesség határát. Azaz közel 82%-ban egyezhet egy ember által elvégzett manuális pozitív-semleges-negatív értékeléssel. Ez egy általunk kijelölt elméleti határ volt: a jelenlegi kutatási tapasztalatok alapján két különböző ember ugyanazon szöveghalmazon végzett véleményértékelései legfeljebb ilyen mértékben egyeznek meg. De inkább a 70-75%-os mértékű egyezés a jellemző.

A Neticle polaritásmérő pontossága
Magyar nyelvre készült automatikus polaritásmérők pontosságai

A  saját módszereink alkalmazásával 80,48%-os pontosságú véleményelemző megoldást sikerült építeni, melyet ha összevetünk ismert véleményelemzési tesztelések adataival, akkor látható, hogy igen tekintélyes eredménynek számít.

A Neticle-é a magyar nyelvű kutatások közül az eddigi legpontosabb megoldás ismereteink szerint, míg megközelíti a jóval kevesebb nyelvi nehézségű angol megoldások pontosságát is. (Természetesen itt fontos megjegyezni, hogy az összevetés hozzávetőlegesnek tekinthető abból a szempontból, hogy különböző szövegeken lettek tesztelve az egyes algoritmusok.)

Az automatikus polaritásméréssel megvalósított közel valós idejű webes véleményárfolyam számítással egyszerűen követhető a Neticle-ben, hogy mit gondol a web a cégünkről, termékünkről, stb. A jövőben igyekszünk majd minél több érdekes véleményárfolyam (WOI) elemzést készíteni és megosztani azokat.