Magyarok a piacon

Digitális szövegbányászat

/ 2017.11.08., szerda 15:56 /

A mesterséges intelligencián alapuló számítógépes nyelvészeti megoldások a gazdaság szinte minden ágazatát hozzásegíthetik a fejlődéshez – mondja a kaposvári Precognox Kft. ügyvezetője, Jóföldi Endre.

A Nemzetgazdasági Minisztérium a Precognoxot választotta a hónap cégének. Mivel vívták ki az elismerést?

Számítógépes nyelvészettel, szövegbányászattal és keresőrendszerekkel foglalkozunk. Ezek kifejezetten innovatív informatikai területek, de valószínűleg legalább ennyit nyomott a latban az is, hogy az országnak olyan régiójában dolgozunk, ahol alulfejlett a számítástechnikai ágazat. Délnyugat-Magyarország az Európai Unió tíz legelmaradottabb térségének egyike; Somogy megyében például a statisztikák szerint összesen 320 informatikus dolgozik – ennek a tizede nálunk, Kaposváron. Bár most már a fővárosban is van irodánk, igazán nagy hozzáadott értéket azzal állítunk elő, ha Somogyban hozunk létre nemzetközi szinten is elismert tudásközpontot és versenyképes munkahelyeket.

Hogyan lehet informatikai céget építeni olyan városban, ahol nincs felsőfokú műszaki képzés?

Nemcsak a városban, de az egész megyében kevés olyan szakember van, aki megfelelően képzett ahhoz a munkához, amit végzünk. Ez nehézség, de nem áthidalhatatlan. Kollégáink jellemzően kezdőként kerülnek hozzánk, és mi tanítjuk meg őket a cég által végzett feladatokra.

Tehát nem szégyen bevallanunk, hogy bajban lennénk, ha meg kellene határoznunk a számítógépes szövegbányászat definícióját?

Az egyszerű meghatározás számunkra is kihívás, hiszen munkánk megértéséhez előbb át kell látni, hogyan működnek különböző, nagy adattömeget kezelő informatikai rendszerek vagy online szolgáltatások. Ahhoz például, hogy egy álláskereső portálon tetszőleges keresőkifejezésre a hirdetők által feltöltött sok ezer álláspályázat közül a legpontosabb találatokat kapjuk, szükség van egy háttérfolyamatra, melynek során a rendszer feltérképezi a feltöltött szövegeket, és azonosítja bennük a kiválasztás alapjául szolgáló kifejezéseket. Ez számítógépes nyelvészeti vagy szövegbányászati feladat.

Miben több ez, mint az egyszerű keresés?

A keresés során egyetlen, előre meghatározott karaktersort szeretnénk megtalálni a szövegben. A mi esetünkben azonban a rendszernek fel kell ismernie minden olyan kifejezést, ami releváns lehet a kulcsszó kapcsán – hiszen aki a nővér szóra keres, nyilván kíváncsi a betegápolói álláshirdetésekre is.

Azt feltételeznénk, hogy egy számítógép csak a szóalakokat képes vizsgálni, a jelentést nem.

Ezen a szinten már túlléptünk. A számítógépes nyelvészet kapcsán sokat emlegetik például a 2013-as bostoni merényletet, melynek csecsen elkövetőjét nyilvántartotta ugyan a rendőrség, de ezekben az adatbázisokban másként volt „angolosítva” a neve, mint ahogy a személyes dokumentumaiban szerepelt. Azért tudott a merénylet előtt szabadon mozogni az országban, mert az akkori hatósági rendszerek a szóalakok eltérése miatt nem ismerték fel az egyezést – ma az azonosítás már gyerekjáték lenne. A megfelelő állami szervek használják is azt a technológiát, amely kivédi az ilyen hibákat.

Néhány karakternyi eltérés kiszűrése még nem egyenlő a jelentés felismerésével.

Nem, de a példán keresztül megérthetjük, hogyan jutunk egyre közelebb a szavak jelentéséhez. Ahogy nő a számítási sebesség, a szövegelemző rendszerek egyre pontosabbakká válnak. Ugyanakkor nem érdemes bedőlni a mesterséges intelligencia körül kialakult túlzott felhajtásnak sem. Robbanásszerű a fejlődés ezen a területen, de a jelentésalapú „gondolkodásnak” számos fokozata van – és a jelenlegi technológiák még csak az első néhány lépcsőfokon járnak. Például egy jogosítvánnyal rendelkező autóvezető meglehetősen könnyen tud alkalmazkodni soha nem tapasztalt útviszonyokhoz és körülményekhez, de egy önvezető autó erre még nem képes.

Akkor egyelőre nem kell féltenünk állásunkat az intelligens szoftverektől?

Egy jól megírt szoftver képes az online sajtóból nagy pontossággal, automatikusan kigyűjteni az összes magyar gazdasági újságíró nevét, de nem tud megírni egy elemző cikket. Ugyanakkor kisebb kreativitást igénylő, például számviteli feladatokat már ma is rábízhatunk számítógépes rendszerekre. A jogászok helyében szintén nem aludnék nyugodtan, hiszen a jogi munka jelentős része kodifikált szövegek rutinszerű visszakeresésére és értelmezésére épül. Mivel egy meghatározott szabályrendszeren belül kell mozogni, ennek a feladatnak a jelentős részét pár éven belül át tudják majd venni a szoftverek. Persze optimistábban úgy is fogalmazhatunk, hogy a munkánk unalmas részeit egyre inkább átveszik a számítógépek, így mi szabadabban foglalkozhatunk a kreatív területekkel.

Napjainkban milyen ágazatok hasznosítják leginkább a számítógépes nyelvészet szolgáltatásait?

Már ma is szinte minden nagyobb gazdasági ágazat alkalmazza a technológiát, és a jövőben ez egyre kiterjedtebb lesz. Mi is dolgoztunk már rengeteg különböző területen – az egészségügytől a közigazgatáson át az egyetemi kutatási projektekig –, és egy nemrég megkötött, amerikai együttműködésnek köszönhetően nemzetközi jelenlétünk is erősödik.

Jóföldi Endre
1975-ben született Kaposváron. • Mérnökinformatikusként szerzett diplomát. • A főiskola után programozóként helyezkedett el. • 2008-ban indította a Precognox Kft.-t.

Rosta

V. Nagy Viktória

Találkozunk 2016-ban!

Az Orbán-modell alappillérei – Magyarország, projektország?

Hogyan sikerül a Fidesznek 2017 végén is vezetni a népszerűségi listát? Miért támogatja őket sok baloldali is? Hogyan érték el, hogy tömegek egzisztenciája függjön a sikerüktől? Ezekre a kérdésekre is válaszol egy új tanulmánykötet – illetve a friss Heti Válasz.

Őrfi József bátorsága és lelki ereje mindent vitt az idei gálán

Mesébe illő Őrfi József piliscsabai házának története. Nem tündérmesébe, hanem olyan magyar népmesébe, amelyben a hősnek számos próbát kell kiállnia. Az építész-családfő bátorsága és lelki ereje a Média Építészeti Díja idei gáláján mindent vitt. Részletes háttér a friss Heti Válaszban.

Famaffia Romániában – Adjátok vissza az erdeinket!

Egy friss botrány és egy dokumentumfilm is felhívja a figyelmet az Európa utolsó érintetlen vadonjainak otthont adó Romániában dúló illegális fakitermelésre. Nemcsak a korrupt politika vagy a profitéhes multi a hibás: székely falusi közösségeket is megvadított a fából szerezhető könnyű pénz. Részletes háttér a friss Heti Válaszban.

Rockenbauer 30 – Pali mögött volt értelme gyalogolni

Pali után nem lehet ilyen filmet csinálni – vélik a Másfélmillió lépés Magyarországon alkotói. Rockenbauer Pál halálának 30. évfordulóján azt kutatjuk a friss Heti Válaszban, mi a titka a sorozat népszerűségének, és miért nem született azóta sem hasonló.

Nyolcvanezres pezsgőt locsolt az egyik Mugabe-fiú

Voltak nála véreskezűbb afrikai vezetők is, de kártékonyabbak kevesen. Robert Mugabe nemcsak a gazdag Zimbabwét juttatta koldusbotra, de igyekezett egész Afrikát a Nyugat ellen hangolni. A csütörtöki Heti Válaszból kiderül, hogy bukása ennek ellenére miért is nem Nyugat diadala.