Magyarok a piacon

Digitális szövegbányászat

/ 2017.11.08., szerda 15:56 /

A mesterséges intelligencián alapuló számítógépes nyelvészeti megoldások a gazdaság szinte minden ágazatát hozzásegíthetik a fejlődéshez – mondja a kaposvári Precognox Kft. ügyvezetője, Jóföldi Endre.

A Nemzetgazdasági Minisztérium a Precognoxot választotta a hónap cégének. Mivel vívták ki az elismerést?

Számítógépes nyelvészettel, szövegbányászattal és keresőrendszerekkel foglalkozunk. Ezek kifejezetten innovatív informatikai területek, de valószínűleg legalább ennyit nyomott a latban az is, hogy az országnak olyan régiójában dolgozunk, ahol alulfejlett a számítástechnikai ágazat. Délnyugat-Magyarország az Európai Unió tíz legelmaradottabb térségének egyike; Somogy megyében például a statisztikák szerint összesen 320 informatikus dolgozik – ennek a tizede nálunk, Kaposváron. Bár most már a fővárosban is van irodánk, igazán nagy hozzáadott értéket azzal állítunk elő, ha Somogyban hozunk létre nemzetközi szinten is elismert tudásközpontot és versenyképes munkahelyeket.

Hogyan lehet informatikai céget építeni olyan városban, ahol nincs felsőfokú műszaki képzés?

Nemcsak a városban, de az egész megyében kevés olyan szakember van, aki megfelelően képzett ahhoz a munkához, amit végzünk. Ez nehézség, de nem áthidalhatatlan. Kollégáink jellemzően kezdőként kerülnek hozzánk, és mi tanítjuk meg őket a cég által végzett feladatokra.

Tehát nem szégyen bevallanunk, hogy bajban lennénk, ha meg kellene határoznunk a számítógépes szövegbányászat definícióját?

Az egyszerű meghatározás számunkra is kihívás, hiszen munkánk megértéséhez előbb át kell látni, hogyan működnek különböző, nagy adattömeget kezelő informatikai rendszerek vagy online szolgáltatások. Ahhoz például, hogy egy álláskereső portálon tetszőleges keresőkifejezésre a hirdetők által feltöltött sok ezer álláspályázat közül a legpontosabb találatokat kapjuk, szükség van egy háttérfolyamatra, melynek során a rendszer feltérképezi a feltöltött szövegeket, és azonosítja bennük a kiválasztás alapjául szolgáló kifejezéseket. Ez számítógépes nyelvészeti vagy szövegbányászati feladat.

Miben több ez, mint az egyszerű keresés?

A keresés során egyetlen, előre meghatározott karaktersort szeretnénk megtalálni a szövegben. A mi esetünkben azonban a rendszernek fel kell ismernie minden olyan kifejezést, ami releváns lehet a kulcsszó kapcsán – hiszen aki a nővér szóra keres, nyilván kíváncsi a betegápolói álláshirdetésekre is.

Azt feltételeznénk, hogy egy számítógép csak a szóalakokat képes vizsgálni, a jelentést nem.

Ezen a szinten már túlléptünk. A számítógépes nyelvészet kapcsán sokat emlegetik például a 2013-as bostoni merényletet, melynek csecsen elkövetőjét nyilvántartotta ugyan a rendőrség, de ezekben az adatbázisokban másként volt „angolosítva” a neve, mint ahogy a személyes dokumentumaiban szerepelt. Azért tudott a merénylet előtt szabadon mozogni az országban, mert az akkori hatósági rendszerek a szóalakok eltérése miatt nem ismerték fel az egyezést – ma az azonosítás már gyerekjáték lenne. A megfelelő állami szervek használják is azt a technológiát, amely kivédi az ilyen hibákat.

Néhány karakternyi eltérés kiszűrése még nem egyenlő a jelentés felismerésével.

Nem, de a példán keresztül megérthetjük, hogyan jutunk egyre közelebb a szavak jelentéséhez. Ahogy nő a számítási sebesség, a szövegelemző rendszerek egyre pontosabbakká válnak. Ugyanakkor nem érdemes bedőlni a mesterséges intelligencia körül kialakult túlzott felhajtásnak sem. Robbanásszerű a fejlődés ezen a területen, de a jelentésalapú „gondolkodásnak” számos fokozata van – és a jelenlegi technológiák még csak az első néhány lépcsőfokon járnak. Például egy jogosítvánnyal rendelkező autóvezető meglehetősen könnyen tud alkalmazkodni soha nem tapasztalt útviszonyokhoz és körülményekhez, de egy önvezető autó erre még nem képes.

Akkor egyelőre nem kell féltenünk állásunkat az intelligens szoftverektől?

Egy jól megírt szoftver képes az online sajtóból nagy pontossággal, automatikusan kigyűjteni az összes magyar gazdasági újságíró nevét, de nem tud megírni egy elemző cikket. Ugyanakkor kisebb kreativitást igénylő, például számviteli feladatokat már ma is rábízhatunk számítógépes rendszerekre. A jogászok helyében szintén nem aludnék nyugodtan, hiszen a jogi munka jelentős része kodifikált szövegek rutinszerű visszakeresésére és értelmezésére épül. Mivel egy meghatározott szabályrendszeren belül kell mozogni, ennek a feladatnak a jelentős részét pár éven belül át tudják majd venni a szoftverek. Persze optimistábban úgy is fogalmazhatunk, hogy a munkánk unalmas részeit egyre inkább átveszik a számítógépek, így mi szabadabban foglalkozhatunk a kreatív területekkel.

Napjainkban milyen ágazatok hasznosítják leginkább a számítógépes nyelvészet szolgáltatásait?

Már ma is szinte minden nagyobb gazdasági ágazat alkalmazza a technológiát, és a jövőben ez egyre kiterjedtebb lesz. Mi is dolgoztunk már rengeteg különböző területen – az egészségügytől a közigazgatáson át az egyetemi kutatási projektekig –, és egy nemrég megkötött, amerikai együttműködésnek köszönhetően nemzetközi jelenlétünk is erősödik.

Jóföldi Endre
1975-ben született Kaposváron. • Mérnökinformatikusként szerzett diplomát. • A főiskola után programozóként helyezkedett el. • 2008-ban indította a Precognox Kft.-t.

Rosta

Sümegi Noémi

Találkozunk 2016-ban!

Milo országa

Egészen elképesztő jelenség, hogy mifelénk a hangadók jelentős hányada éppen az ellenkezőjét hirdeti annak, ahogyan él. Kormánypártiak és ellenzékiek egyaránt.

Július elsejéig oda kell érnie Balatonfüredre!

Tüdőbeteg, alkoholista alkotók és orvosuk közötti kötelékek formálták Levendel László képzőművészeti gyűjteményét. A tüdőgyógyász által irányított Korányi Intézet egyszerre volt menedék és lehetőség a traumákat túlélt művészeknek. A kollekcióból július 1-jéig Balatonfüreden látható tárlat azonban jóval több puszta képzőművészeti bemutatónál. Részletek a friss Heti Válaszban.

A mobilitás jövője, a jövő mobilitása

A június 7-én megrendezésre kerülő Infoparlament idén a mobilitás egyre bővülő témakörét járja körbe, hiszen mozgásban a világ, a mobilitás pedig a korábbiaknál jóval több értelmezéssel bír.

„Hillary is utálta, ahogy róla tudósítottunk”

A nagymarosi vízlépcső elleni tiltakozás emblematikus alakjának fia a The New York Times újságírója. Interjú Adam Liptakkal a szólásszabadság kihívásairól, a liberális sajtó elfogultságairól és a politikai korrektség fonákságairól – a friss Heti Válaszban.

Fordulat: összeköltözött Vuk, Süsü, Ursula és Frakk

Újra forog az óriáshordó és a műemlék körhinta a nyolc hektárral bővült pesti állatkertben, ahol a pünkösdi hétvégén a legkisebbek birtokba vehették a Holnemvolt Várat. Jön a sünispotály, ősszel nyit a Cápasuli, épül a Pannon Park. Részletes háttér a csütörtöki Heti Válaszban.

Tényleg a homokhiány miatt drágulnak a magyar építkezések?

Mind gyakoribb a nyersanyaghiány a magyar építőiparban, de ez semmi Ázsiához képest. A gigaépítkezésekhez rengeteg homok kell, de hiába van belőle sok a sivatagban, az nem alkalmas rá. Homokmaffiák és lehetséges megoldások a csütörtöki Heti Válaszban.

Rangon alul házasodnak: így foglalta el a palotákat a középosztály

A 21. századra megmaradt európai monarchiák hercegei és hercegnői már szinte mind közemberekkel házasodnak. Henry herceg és Meghan Markle esküvőjét beárnyékolták a menyasszony családjának botrányai, de az új modell Spanyolországtól Dániáig alapvetően jól működik. Részletes háttér a csütörtöki Heti Válaszban.