2023.5.30 15:05
Olvasási idő 2:10
Maier Péter

A következő lépés a gondolatolvasás? – Szöveggé írta át az emberek gondolatait a mesterséges intelligencia

 A következő lépés a gondolatolvasás? – Szöveggé írta át az emberek gondolatait a mesterséges intelligencia
Forrás Getty Images
TECH-TUDOMÁNY MESTERSÉGES INTELLIGENCIA

Egy friss kutatás által létrehoztak egy rendszert, ami szöveggé képes átkonvertálni az agyi tevékenységeket. Kanyarban volna a gondolatolvasás?

A Texasi Egyetem idegtudósainak olyasvalami sikerült, ami még senkinek: létrehoztak egy rendszert, amely képes az agy tevékenységét szövegfolyamba átírni. A Nature Neuroscience szaklapban megjelent tanulmányukban azt írják, hogy képesek voltak dekódolni a nem invazív agyi szkennelések adatait, és ezek segítségével rekonstruálni a nyelvezetet és történeteket, amelyeket az emberek hallottak, láttak vagy akár elképzeltek.

A technológia, amely képes agyi jelekből szöveget létrehozni, afféle „beszéddekódereket“ használ – ezek eddig csak az agyba műtéti úton beültetett eszközökkel működtek. Más korábbi dekóderek ezzel szemben az agyi aktivitás nem invazív felvételeit használták, egyes szavakat vagy rövid mondatokat tudtak dekódolni, viszont összefüggő nyelvet nem.

„Nincs jogsim“ -> „Nem tanulok vezetni“

A kutatásban tudósok a funkcionális mágneses rezonanciavizsgálat (fMRI) jeleivel dolgoztak, amelyek a vér oxigénszintjétől függenek. Az fMRI a véráramlás és az oxigénszint változásait mutatja az agy különböző részein.

Minden résztvevő befeküdt az fMRI-szkennerbe, és 16 órán keresztül különböző sztorikat hallgatott, a kutatók pedig eközben rögzítették az agyi reakciókat. Ezeket aztán arra használták, hogy betanítsanak egy kódolót, egy olyan számítási modellt, amely megpróbálja megjósolni, hogyan reagál az agy bizonyos szavakra. Az ellenkező megközelítés – az agy tartalmának szavakká való átírása – azonban nehezebbnek bizonyult.

Kiemelt tartalom
Magyarországon startol el az első nemzetközi AI Filmfesztivál Magyarországon startol el az első nemzetközi AI Filmfesztivál 2024.2.29 17:36

Ennek érdekében a kutatók úgy tervezték meg a technológiát, hogy az agyi válaszokat a szemantikai tulajdonságokhoz, azaz a szavak és mondatok tág értelemben vett jelentéséhez kapcsolják. Ehhez a rendszer az eredeti GPT nyelvi modellt használja, amely a mai GPT-4 modell elődje.

Generatív mesterséges intelligencia absztrakt nézete Forrás Getty Images

A betanítás után a kódoló olyan szósorozatokat generált, amelyek nagyon jól érzékeltették a történetek általános lényegét, és néhány esetben pontos szavakat és kifejezéseket tartalmaztak. A kutatók a résztvevőkkel némafilmeket is nézettek, és elképzelték a történeteket, a dekódoló pedig többször is meg tudta határozni a történetek lényegét. 

Az egyik alany például arra gondolt, hogy „még nincs meg a jogosítványom“, a dekóder pedig azt írta, hogy „még el sem kezdtem vezetni tanulni“. A tényleges és a dekódolt gondolatok összehasonlítása egyébként itt megtalálható.

Nem tökéletes a rendszer

Az fMRI-adatok használatának egyik korlátja az időben keresendő. A jel, amely a vér oxigénszintjétől függ, körülbelül 10 másodperc alatt emelkedik és csökken, ennyi idő alatt az ember 20 vagy több szót is hallhat. Ennek következtében ez a technika csak a szavak sorozatának lehetséges jelentését érzékeli, mintsem az egyes szavakat. 

Kiemelt tartalom
Hamarosan itt a Sora, a mesterséges intelligencia hiperrealisztikus videói pedig már most a frászt hozzák a filmiparra Hamarosan itt a Sora, a mesterséges intelligencia hiperrealisztikus videói pedig már most a frászt hozzák a filmiparra 2024.2.27 18:25

Ráadásul ahhoz, hogy a jelzések a lehető legpontosabbak legyenek, több agyterületről – a beszéd hálózatból, a parietális-temporális-okcipitális területről és a prefrontális kéregből – származó adatokra van szükség.

Generált kép egy agyról Forrás Getty Images

A gondolatolvasás még nem jelent fenyegetést

Azt, hogy tulajdonképpen kvázi „gondolatolvasó“ technológiák fejlődnek, a Svájci Szövetségi Technológiai Intézet tudósainak legújabb kutatása bizonyítja. Olyan új gépi tanulási algoritmust fejlesztettek ki, amely képes az agyi jeleket videókká alakítani.

Ehhez olyan mesterséges intelligenciát használtak, amely egy laboratóriumi egér agyát „olvasta“, miközben az egy videoklipet nézett, ezeket a jeleket pedig a látókéreg egy területére behelyezett elektródaszondákkal mérte. Az algoritmus ezután pontosan megadta, hogy az egér milyen képkockasorozatot nézett.

A The Conversation szerint egyelőre nagyon valószínűtlen, hogy a gondolatainkat akaratunk ellenére olvasni fogják. A folyamathoz ugyanis a résztvevő együttműködésére van szükség, hiszen az alany könnyen megzavarhatja a dekódolást  például azzal, hogy figyelmét valami másra irányítja át.