Kövess minket!

Tech

Megjelent a HuSpaCy, a nyílt forráskódú magyar nyelvi elemzőlánc

A SZTAKI által koordinált Mesterséges Intelligencia Nemzeti Laboratórium (MILAB) projekt keretében a Szegedi Tudományegyetem kutatói elkészítették, és szabadon hozzáférhetővé tették a HuSpaCy magyar nyelvi elemzőrendszert, amely a mesterséges intelligencia és nyelvtechnológia legújabb kutatási eredményeit ötvözi egy magyar szövegeket elemezni képes könnyen használható eszközzé.

Az elmúlt évtized áttörést hozott a nyelvtechnológiában, nemcsak a kutatásokban, hanem abban is, hogy az akadémiai eredmények eljutottak arra a technológiai érettségi szintre, hogy azok már ipari forgalomban is használhatóak. Ma már olyan – akár kisebb – cégek is képesek szövegelemzési problémák megoldására, amelyek nem rendelkeznek MI-szakértelemmel – olvasható a SZTAKI közleményében.

A most elkészült magyar nyelvi elemzőrendszer már az iparban is használható erőforrásigénnyel és integrálhatósággal dolgozik, használatával egyszerűbbé válik a magyar nyelvű szövegek nyelvtani és jelentéstani értelmezése.

“A kifejezetten magyar nyelvű szöveges tartalmak, mondatok előfeldolgozási eszközkészletét készítettük el. Erre azért van szükség, mert minden alkalmazás, amely valamilyen szöveggel kapcsolatos problémát akar megoldani, csupán nyers karaktersorozatokból még nem tud működni. Természetes nyelvi szövegeken működő algoritmusok emberek által is értelmezhető nyelvtani szimbólumokra építenek, így a HuSpaCy megfelelő alapul szolgálhat csetbotokhoz vagy akár e-mail-értelmező rendszerekhez is”

– idézik a közleményben Farkas Richárdot, a Szegedi Tudományegyetem kutatóját.

Kitérnek rá, hogy az elmúlt évtizedben forradalom zajlott a mesterséges intelligencia kutatásában: a gépi tanulásos megoldásokon belül előre tört az úgynevezett mélytanulás (deep learning) módszere, ahol mesterséges neurális hálók képesek megtanulni, hogy mit hogy kell értelmezniük.

A ma használatos természetes nyelveket feldolgozó rendszerek nagy része így működik, azaz nem nyelvészek írnak szabályokat, hanem az úgynevezett tanuló algoritmusok képesek mélyebb összefüggések, predikciók elsajátítására.

Az ilyen rendszerek problémája, hogy alapvetően fekete dobozként viselkednek. Működésük alig megfigyelhető, tehát még ha jó eredményt is adnak, akkor sem tudjuk, hogyan jutottak erre a következtetésre. Ebből következik, hogy nem is jól kontrollálhatók, ezért ipari alkalmazásokban sokszor csak korlátozottan használhatóak.

Napjaink angol nyelvet támogató célalkalmazásaiban is gyakran csak a szövegek előelemzésére használnak gépi tanulás alapú megoldásokat, hogy aztán ezek alapján az emberi szakértő által írt szabályok hozzák meg a végső döntést. Így egy-egy döntés átláthatóvá válik, és kérdéses esetben az emberi szakértő akár meg is tudja változtatni a rendszer viselkedését.

A közleményben felidézik, hogy

a magyar nyelvű szövegelemző szoftverek fejlesztése nem ma kezdődött. A magyar kutatói közösség már a kétezres években elkezdte építeni a szükséges nyelvi adatbázisokat. Ezeket az adatbázisokat használták a HuSpaCy fejlesztői is, mint tanító adatbázis.

A HuSpaCy rendszer ötvözi a mély tanulási módszerek előnyeit a nyelvészeti elemzések interpretálhatóságával és kontrollálhatóságával. A rendszer képes mondatok teljes nyelvi elemzésére (szótő, szófajok, satöbbi), illetve névelemek (például személynevek, helységek) azonosítására is folyó szövegben.

A HuSpaCy napjaink MI-eszközeiből építkezik: tartalmaz neurális nyelvi modelleket, amelyeket a felhasználó akár szövegek hasonlóságának vizsgálatára is használhat, de a fent említett nyelvtani elemző lépések is mind modern algoritmusokra épülnek – teszik hozzá.

Mint írják, a most létrehozott HuSpaCy rendszer alapja lehet hangalapú vagy írásos csetbotoknak is (ilyeneket a Mesterséges Intelligencia Nemzeti Laboratóriumban is fejlesztenek), de hasznos lehet szövegkategorizálásra (például ügyfélszolgálatra beérkező panaszok automatikus leválogatására), információ kinyerésre és szövegek automatikus generálására is.

Tech

Idegenek privát képeit mutogathatja az Apple

Súlyos gond lehet az iCloud Photos képtárhely Windows 11-es integrációjával.

Közzétéve:

A borítókép illusztráció, a forrása: Pixabay

Körülbelül két héttel ezelőtt elérhetővé vált az Apple és a Microsoft ritka együttműködéseinek egyik gyümölcse, az aktuális iCloud for Windows kliensprogram telepítését követően böngészhetővé váltak a Windows 11 gyári képnézegető appjában az iPhone-okkal készített fotók és videók.

Ugyan az integráció meglehetősen fapadosnak tűnt, azonban potenciálisan ez lehet vele a legkisebb probléma. Az időközben befutott felhasználói panaszok szerint az iPhone 13 és iPhone 14 mobilokkal készített videók nem tekinthetőek meg a Windows 11 képnézegetőjében, a jelek szerint a lejátszási hibának a HDR-es videórögzítéshez és a HEVC kodek használatához van köze.

Ez még hagyján volna, azonban a felhasználók szerint a problémás videók lejátszási kísérletekor időnként számukra teljesen ismeretlen, minden bizonnyal más iCloud-felhasználóktól származó állóképek jelennek meg. Az egyik panaszos többek közt más családi fotóját és egy focimeccs képkockáját látta, míg a másiknak egy pizsamás kislány képe ugrott be – számolt be róla az Origo.hu.

Tovább olvasom

Tech

Pornóképekkel hekkelték meg az internetes adatvédelmi konferenciát

Egy résztvevő így próbált üzenni a kutatásért, innovációért és digitalizációért felelős minisztérium kiberbiztonsági rendezvénye szervezőinek Romániában.

Közzétéve:

Borítóképünk illusztráció, fotó: Pixabay

Amint a Főtér nevű erdélyi hírportál beszámolt róla, a pénteki rendezvényhez online csatlakozó résztvevők számára elhelyezett óriáskivetítőn megjelent egy pornóképekből álló kollázs.

Mint kiderült, az egyik résztvevő hamis avatart használva belépett a Zoom online platformra, és a képernyőmegosztás opciót használva „feldobta” a konferencia hangulatát néhány pornós fotóval.

A román kutatási, innovációs és digitalizációs minisztérium az incidens után közleményben magyarázkodott. Úgy érvelt, a konferenciát a teljes átláthatóság jegyében szervezték meg, bárki csatlakozhatott hozzá, így sikerülhetett a hekkerakció.

Tovább olvasom

Tech

Egyszerűbbé teszi a Netflix a fiókmegosztások kezelését

Jó hírekkel jelentkezik a Netflix azok számára, akik másokkal osztják meg a fiókjukat. Az egész átláthatóbbá és könnyebben menedzselhetővé válik.

Közzétéve:

A borítókép forrása: Pixabay

Szuper lehetőség, hogy a Netflix-fiókunkat megoszthatjuk másokkal, azonban problémás lehet, amikor egyszerre túl sokan próbálnak egy fiókról tartalmat fogyasztani, vagy bejelentkezve maradnak egy készüléken. Aztán persze ott van az is, ha valakitől meg akarjuk vonni a lehetőséget, hogy a továbbiakban a fiókunkat használja.

A Netflix most egy húzással ezt az egészet leegyszerűsíti: bekerül egy új lehetőség, ami angolul  a Manage Access and Devices nevet kapta. Ez egy egységesített felület, ahol könnyedén átlátható, hogy ki, mikor és honnan használta a fiókunkat, mikor nézett legutoljára valamit, és milyen eszközről.

A felületről egyszerűen kijelentkeztethetjük az esetlegesen véletlenül bejelentkezve maradt eszközöket, és ha úgy döntünk, vissza is vonhatjuk a használati jogosultságot – írta az Origo.hu.

Egy ideje egyébként már arról hallani, hogy a Netflix valahogy meg akarja változtatni, hogy a jelszavunk megadásával megoszthassuk a fiókunkat. Hogy ezt pontosan hogyan és mennyire szigorúan tervezi a cég, az viszont még mindig nem tiszta.

Tovább olvasom