Lassan nemcsak elképesztő képeket, hanem videókat is létrehozhatunk majd pusztán a mesterséges intelligenciára támaszkodva, ezzel pedig most éppen egy rakás filmesre próbálják meg ráhozni a frászt.
Újabb fordulat állt be a mesterséges intelligenciával generált tartalmak terén. Eleinte csak beszélgethettünk a géppel, később képeket hozhattunk létre, és ugyan korábban is voltak a videók megalkotásával kapcsolatos próbálkozások, az Open AI most megmutatta, hogy az ő modelljük mire képes. Ha a vállalat neve ismerősen cseng, az nem véletlen, hiszen ők hozták létre a meglepően fejlett párbeszédekre képes ChatGPT-t és a DALL-E képalkotót is, vagyis nem kispályás versenyzőről van szó.
Az új mumus neve: Sora
A Sora hasonlóan működik a DALL-E-hoz, vagyis azoknak, akik ilyen mozgóképekre vágynak, elég csak pár kulcsszót megadni, a többiről a mesterséges értelem gondoskodik. Oldalukon rengeteg példát mutatnak arról, hogy pontosan mire képes, néhányat lentebb linkelünk is, cikkünkben pedig kitérünk a hivatalos bejelentésben elrejtett óvatosságra is, amely azóta érhető tetten az Open AI bármilyen technikai fejlesztésén, mióta a ChatGPT és a DALL-E is komplett pánikot okozott a művészek között.
Azt az Open AI is elismeri, hogy a technológia még nem tökéletes mindenhol. Ők maguk hívják fel a figyelmet például arra, hogy a fizikai érintkezések még gondot jelentenek; és ugyanígy problémát okoz a mesterséges intelligenciának a következetesség, őket idézve:
Előfordul, hogy a létrehozott szereplő beleharap például valamibe, de a videón nem látszik a harapásnyom, a kamera térbeli mozgása sem tökéletes, és az irányokat sem feltétlenül tudja még értelmezni.
Ezektől függetlenül, főleg a korai, mások által létrehozott videókhoz képest az Open AI megoldása, a Sora már most félelmetes. Nem a klasszikus – horrorisztikus – értelemben, hanem abban, hogy bár időnként erőteljesen egy videójátékra emlékeztet néhány effekt (a fentebbi videók közül például a tükröződés), sokszor elég nehéz megállapítani, hogy amit látunk, az nem valódi. És akkor most gondoljuk el, hogy a Sora első, publikus változatát látjuk, vagyis még rengeteg ideje van a technológiának kiforrni. A ChatGPT-t, vagyis az AI chatbotot eleinte pillanatokon belül össze lehetett zavarni, napjainkra szinte tökéletesen szimulál le egy élő emberrel történő beszélgetést; a DALL-E képgenerátor pedig korábban sokszor inkább félelmetes, semmint realisztikus dolgokat hozott össze, most meg már ott tartunk, hogy a segítségével létrehozott festményeket és fotókat simán árusítják magukat művésznek hazudó (?) emberek egy kis utómunka után. Márpedig ezek a technológiák pár hónap alatt rengeteget fejlődtek, a Sora pedig még csak most bontogatja a szárnyait.
Félnetek nem kell, jó lesz
Az Open AI abban a sajtóközleményben, amelyben bemutatta a Sorát, feltűnően arra helyezi a hangsúlyt, hogy a mesterséges intelligenciával történő videóalkotást az emberek megsegítésére, bizonyos munkák megkönnyítésére szánják. Vagyis már most igyekeznek kihangsúlyozni, hogy ezúttal sem (?) arra megy ki a játék, hogy emberek elveszítsék az állásukat, hanem arra, hogy könnyebben tudjanak dolgozni – más kérdés, hogy ezzel sikerül-e megnyugtatni bárkit is. Az mindenesetre biztos, hogy az Open AI most sokkal óvatosabb, mint eddig bármikor volt: a videógenerálót egyelőre nem hozták nyilvánosságra, sőt leszögezték, hogy mielőtt publikussá teszik, szakemberek és szakértők sokaságát vonják be a munkába, hogy a Sorával ne lehessen majd visszaélni. Más kérdés, hogy mennyire gondolják ezt komolyan?
Márpedig itt komolyabb szükség lehet rá, mint korábban bármikor. Most nem egy chatbot születik, amely kész válaszokkal csalhat ki pénzt az arra fogékonyakra, vagy egy képgeneráló, amelyet bizonyos kulcsszavak tiltásával együtt is fel lehet használni aljas célokra (akár félrevezető képek megalkotására), hanem egy mozgóképeket létrehozó algoritmus. A fél világ a választásokra készül, gondoljunk bele, mi történne, ha mondjuk egy homályos videón Trump vagy Biden csinálna kompromittáló dolgokat. Pillanatok alatt ki lehetne deríteni, hogy a felvétel nem valós, de erről meggyőzni azokat, akik nem is nagyon értik a technológiát, vagy a cáfolat már nem jut el hozzájuk, az már egészen más tészta. Arra egyébként, hogy AI generálta videót és nem valódi felvételt látunk, több fronton is készül a cég: beépítenek például egy olyan eljárást, amely a mozgókép leírásában jelzi, hogy nem valódi felvételeket látunk, és a Sorával párhuzamosan olyan eszközt vagy eszközöket is terveznek alkotni, amelyek képesek lesznek megállapítani, hogy egy-egy videó az ő mesterséges intelligenciájukkal készül.
Miután a Sora egyelőre nem érhető el publikusan, a fejlesztésével párhuzamosan a megfigyelése és megzabolázása is folyamatban van, egyelőre nem is keltett akkora pánikot, mint a korábbi technológiák, amelyeket előbb nyilvánosságra hoztak, majd utóbb próbáltak meg olyan változtatásokat eszközölni rajtuk, amelyekkel csökkenteni lehet a visszaélések számát. Persze akadnak most is olyanok – különösen a közösségi médiában –, akik már a filmpipar halálát látják bele a Sorába, de annyi bizonyos, hogy az Open AI sokkal okosabban cselekszik, mint eddig bármikor. Más kérdés, hogy tényleg vissza tudnak-e majd fogni mindenféle visszaélést, de ez a jövő zenéje. Ahogy a mesterséges intelligenciával működő videógeneráló publikusan felhasználható verziójának debütálása is: egyelőre ugyanis még nem tudjuk, pontosan mikor férhetnek majd hozzá az átlagos felhasználók is.