Tech
Megjelent a HuSpaCy, a nyílt forráskódú magyar nyelvi elemzőlánc
A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.
Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel – olvasható a SZTAKI közleményében.
A most elkészült magyar nyelvi elemzőrendszer már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik, használatával egyszerűbbé válik a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.
“A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, amely valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek által is értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár e-mail-értelmező rendszerekhez is”
– idézik a közleményben Farkas Richárdot, a Szegedi Tudományegyetem kutatóját.
Kitérnek rá, hogy az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.
A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az úgynevezett tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására.
Az ilyen rendszerek problémája, hogy alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak.
Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik, és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.
A közleményben felidézik, hogy
a magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.
A HuSpaCy rendszer ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, satöbbi), illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben.
A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek – teszik hozzá.
Mint írják, a most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.
Tech
IPCEI-minősítést kapott a 4iG Nyrt. és az E-Group ICT Software Zrt.
Fábián Gergely, a Gazdaságfejlesztési Minisztérium (GFM) iparpolitikáért és technológiáért felelős államtitkára hivatalában fogadta az IPCEI-minősítést kapott 4iG Nyrt. és az E-Group ICT Software Zrt. képviselőit, Blénessy László technológiáért felelős általános vezérigazgató-helyettest, valamint Kuthy Antal vezérigazgatót – jelentette be csütörtöki közleményében a minisztérium.
Felidézték:
az Európai Bizottság tájékoztatása szerint 19 felhőipari projekt kapta meg az IPCEI-minősítést, köztük most két magyar cég: a 4iG Nyrt. “Digital Trust Service” nevű projektjével, ami egy blockchain alapú adathitelesítési platform, valamint az E-Group ICT Sofware Zrt. “FedEU.ai” nevű projektjével, ami az MI technológia globális kihívására – az adatokhoz tömeges hozzáférés és feldolgozás biztonsága – ad megoldást.
Fábián Gergely gratulált a két magyar gazdasági társaságnak. Kiemelte: “kormányzati koordináció mellett Magyarország 2020 óta vesz aktívan részt az IPCEI-folyamatban. Idén júniusban a mikroelektronika terén egy félvezetőipari kerámialapka projekt kapott lehetőséget az európai ökoszisztémába történő csatlakozáshoz, de hazánk jelen van a hidrogéntechnológiai, és az egészségipari együttműködésekben is. Most a felhőalapú infrastruktúra és szolgáltatások terén született meg az első két hazai IPCEI-minősítésű projekt. Az állam örömmel áll ilyen áttörő, modern technológián alapuló projektek mellé, a szektor fejlődésében kiemelten aktív szerepet kíván a jövőben is vállalni.”
Tech
Nyílt forráskódú mesterséges intelligenciát fejlesztenek az amerikai techóriások
Nagyobb hangsúlyt fektetnének a biztonsági és a védelmi eszközökre, ami eddig hiányzott az ágazatból.

A Világgazdaság a Bloombergre hivatkozva azt írja, hogy a Facebook anyavállalata, a Meta Platforms, valamint az International Business Machines (IBM) vezetésével több mint 40 amerikai technológiai óriás új iparági csoportot alapított, hogy biztonságosabb, nyílt forráskódú mesterséges intelligenciákat fejlesszenek.
Az AI Alliance elnevezésű koalíció a keddi közleményük szerint a mesterséges intelligencia technológiájának felelős fejlesztésére összpontosít majd, ahol nagyobb hangsúlyt fektetnének a biztonsági és a védelmi eszközökre, ami eddig hiányzott az ágazatból.
Az ágazati szövetség emellett arra is törekedne, hogy megnövelje a nyílt forráskódú AI-modellek számát – az egyes vállalatok által szabadalmaztatott rendszerek helyett –, együttműködve a tudományos kutatókkal és a hardver-fejlesztőkkel.
A teljes cikk IDE kattintva érhető el.
Borítókép: illusztráció
Tech
Az EU az informatika területét érintő állami támogatásokat hagyott jóvá
Az Európai Bizottság jóváhagyta, hogy hét tagállam, köztük Magyarország összesen legfeljebb 1,2 milliárd euró (mintegy 470 milliárd forint) állami támogatást nyújtson egy, a felhő- és pereminformatika-technológiák területét érintő közös európai kezdeményezéshez – közölte a brüsszeli testület kedden.
Az uniós bizottság közleménye szerint a jóváhagyott Újgenerációs felhőinfrastruktúra és felhőszolgáltatások (CIS) nevű kezdeményezés elő fogja segíteni, hogy különböző európai szolgáltatók kutatást folytassanak, fejlesztést végezzenek és első ipari bevezetést hajtsanak végre a továbbfejlesztett felhő- és pereminformatika-technológiák terén.
A kezdeményezést hét ország, Franciaország, Hollandia, Lengyelország, Magyarország, Németország, Olaszország és Spanyolország közösen nyújtotta be. Magyarországról a 4iG távközlési és infokommunikációs vállalatcsoport a résztvevő.
A tagállamok a kezdeményezéshez összesen 1,2 milliárd euróig terjedő közfinanszírozást biztosítanak, amely várhatóan további 1,4 milliárd eurónyi magánberuházást fog mozgósítani
– írták. A kezdeményezés megvalósításhoz 19 vállalkozás 19 “kimagaslóan innovatív” projektet fog végrehajtani – emelték ki.
A CIS az első olyan, közös európai érdeket szolgáló projekt, mely a felhő- és pereminformatika-technológiák területén valósul meg. Az első interoperábilis és nyílt hozzáférésű európai adatfeldolgozási ökoszisztéma, azaz egy több szolgáltató által nyújtott, felhő-perem kontinuum létrehozásáról van szó. A projektben adatfeldolgozási képességeket, valamint szoftver- és adatmegosztó eszközöket fejlesztenek ki, amelyek egyesített, energiahatékony és megbízható felhő- és peremalapú adatfeldolgozási technológiák és kapcsolódó szolgáltatások kialakítását teszik lehetővé – írták.
Tájékoztattak továbbá, hogy az uniós bizottsági jóváhagyásról szóló határozat nyilvános változatában több információ áll majd rendelkezésre arról, hogy az egyes résztvevők milyen összegű támogatást kapnak. A határozat részletes adatokat tartalmazó változatát azt követően teszik majd közzé, ha sikerült rendezni a tagállamokkal és az érintett felekkel az adatok bizalmas jellegével kapcsolatos kérdéseket – tették hozzá.