2024.2.27 18:25
Olvasási idő 4:35
Vank Antal

Hamarosan itt a Sora, a mesterséges intelligencia hiperrealisztikus videói pedig már most a frászt hozzák a filmiparra

Hamarosan itt a Sora, a mesterséges intelligencia hiperrealisztikus videói pedig már most a frászt hozzák a filmiparra
Forrás Open AI
TECH-TUDOMÁNY AI MESTERSÉGES INTELLIGENCIA TECHNOLÓGIA

Lassan nemcsak elképesztő képeket, hanem videókat is létrehozhatunk majd pusztán a mesterséges intelligenciára támaszkodva, ezzel pedig most éppen egy rakás filmesre próbálják meg ráhozni a frászt.

Újabb fordulat állt be a mesterséges intelligenciával generált tartalmak terén. Eleinte csak beszélgethettünk a géppel, később képeket hozhattunk létre, és ugyan korábban is voltak a videók megalkotásával kapcsolatos próbálkozások, az Open AI most megmutatta, hogy az ő modelljük mire képes. Ha a vállalat neve ismerősen cseng, az nem véletlen, hiszen ők hozták létre a meglepően fejlett párbeszédekre képes ChatGPT-t és a DALL-E képalkotót is, vagyis nem kispályás versenyzőről van szó.

Az új mumus neve: Sora

A Sora hasonlóan működik a DALL-E-hoz, vagyis azoknak, akik ilyen mozgóképekre vágynak, elég csak pár kulcsszót megadni, a többiről a mesterséges értelem gondoskodik. Oldalukon rengeteg példát mutatnak arról, hogy pontosan mire képes, néhányat lentebb linkelünk is, cikkünkben pedig kitérünk a hivatalos bejelentésben elrejtett óvatosságra is, amely azóta érhető tetten az Open AI bármilyen technikai fejlesztésén, mióta a ChatGPT és a DALL-E is komplett pánikot okozott a művészek között.

Ami alapján az AI létrehozta a videót: „Az animációs jelenet egy olvadó piros gyertya mellett térdelő, alacsony, bolyhos szörnyeteget ábrázol közelképben. A művészeti stílus 3D-s és realisztikus, a hangsúlyt a világításra és a textúrára helyezi. A kép hangulata a csodálkozás és a kíváncsiság hangulata, ahogy a szörny nagy szemekkel és nyitott szájjal bámulja a lángot. A póza és arckifejezése az ártatlanság és a játékosság érzését közvetíti, mintha most fedezné fel először a körülötte lévő világot. A meleg színek és a drámai világítás használata tovább fokozza a kép bájos hangulatát.”
Ami alapján az AI létrehozta a videót: „Egy elegáns nő sétál egy tokiói utcán, amely tele van melegen izzó neonnal és animált városi feliratokkal. Fekete bőrdzsekit, hosszú piros ruhát és fekete csizmát visel, és fekete táskát tart magánál. Napszemüveget hord és piros rúzst használ. Magabiztosan és lazán sétál. Az utca párás és tükröződik, különleges hatást keltve a színes fényekkel. Nagy tömeg veszi körbe.”
Ami alapján az AI létrehozta a videót: „Egy 30 éves, piros gyapjúból kötött motoros sisakot viselő űrhajós kalandjait bemutató filmelőzetes, kék ég, sós sivatag, filmes stílus, 35 mm-es filmre felvéve, élénk színek.”

 
Azt az Open AI is elismeri, hogy a technológia még nem tökéletes mindenhol. Ők maguk hívják fel a figyelmet például arra, hogy a fizikai érintkezések még gondot jelentenek; és ugyanígy problémát okoz a mesterséges intelligenciának a következetesség, őket idézve:

Előfordul, hogy a létrehozott szereplő beleharap például valamibe, de a videón nem látszik a harapásnyom, a kamera térbeli mozgása sem tökéletes, és az irányokat sem feltétlenül tudja még értelmezni.


Ezektől függetlenül, főleg a korai, mások által létrehozott videókhoz képest az Open AI megoldása, a Sora már most félelmetes. Nem a klasszikus – horrorisztikus – értelemben, hanem abban, hogy bár időnként erőteljesen egy videójátékra emlékeztet néhány effekt (a fentebbi videók közül például a tükröződés), sokszor elég nehéz megállapítani, hogy amit látunk, az nem valódi. És akkor most gondoljuk el, hogy a Sora első, publikus változatát látjuk, vagyis még rengeteg ideje van a technológiának kiforrni. A ChatGPT-t, vagyis az AI chatbotot eleinte pillanatokon belül össze lehetett zavarni, napjainkra szinte tökéletesen szimulál le egy élő emberrel történő beszélgetést; a DALL-E képgenerátor pedig korábban sokszor inkább félelmetes, semmint realisztikus dolgokat hozott össze, most meg már ott tartunk, hogy a segítségével létrehozott festményeket és fotókat simán árusítják magukat művésznek hazudó (?) emberek egy kis utómunka után. Márpedig ezek a technológiák pár hónap alatt rengeteget fejlődtek, a Sora pedig még csak most bontogatja a szárnyait.

Kiemelt tartalom
Elkészült a mesterséges intelligencia legrandomabb szerzeménye: a Tankcsapda Pokémon-feldolgozása Elkészült a mesterséges intelligencia legrandomabb szerzeménye: a Tankcsapda Pokémon-feldolgozása 2024.2.22 10:15

Félnetek nem kell, jó lesz

Az Open AI abban a sajtóközleményben, amelyben bemutatta a Sorát, feltűnően arra helyezi a hangsúlyt, hogy a mesterséges intelligenciával történő videóalkotást az emberek megsegítésére, bizonyos munkák megkönnyítésére szánják. Vagyis már most igyekeznek kihangsúlyozni, hogy ezúttal sem (?) arra megy ki a játék, hogy emberek elveszítsék az állásukat, hanem arra, hogy könnyebben tudjanak dolgozni – más kérdés, hogy ezzel sikerül-e megnyugtatni bárkit is. Az mindenesetre biztos, hogy az Open AI most sokkal óvatosabb, mint eddig bármikor volt: a videógenerálót egyelőre nem hozták nyilvánosságra, sőt leszögezték, hogy mielőtt publikussá teszik, szakemberek és szakértők sokaságát vonják be a munkába, hogy a Sorával ne lehessen majd visszaélni. Más kérdés, hogy mennyire gondolják ezt komolyan?

Egyes, az AI térnyerése ellen felszólaló szakértők szerint semennyire, egyszerűen csak a botrányt próbálják meg elkerülni. Mások szerint a szándék lehet, hogy tényleg komoly, de többek között a DALL-E és a ChatGPT is bizonyította, hogy a technológiát nem feltétlenül lehet korlátok közé szorítani.


Márpedig itt komolyabb szükség lehet rá, mint korábban bármikor. Most nem egy chatbot születik, amely kész válaszokkal csalhat ki pénzt az arra fogékonyakra, vagy egy képgeneráló, amelyet bizonyos kulcsszavak tiltásával együtt is fel lehet használni aljas célokra (akár félrevezető képek megalkotására), hanem egy mozgóképeket létrehozó algoritmus. A fél világ a választásokra készül, gondoljunk bele, mi történne, ha mondjuk egy homályos videón Trump vagy Biden csinálna kompromittáló dolgokat. Pillanatok alatt ki lehetne deríteni, hogy a felvétel nem valós, de erről meggyőzni azokat, akik nem is nagyon értik a technológiát, vagy a cáfolat már nem jut el hozzájuk, az már egészen más tészta. Arra egyébként, hogy AI generálta videót és nem valódi felvételt látunk, több fronton is készül a cég: beépítenek például egy olyan eljárást, amely a mozgókép leírásában jelzi, hogy nem valódi felvételeket látunk, és a Sorával párhuzamosan olyan eszközt vagy eszközöket is terveznek alkotni, amelyek képesek lesznek megállapítani, hogy egy-egy videó az ő mesterséges intelligenciájukkal készül.

A mesterséges intelligencia már videókat is generál Forrás Open AI

Miután a Sora egyelőre nem érhető el publikusan, a fejlesztésével párhuzamosan a megfigyelése és megzabolázása is folyamatban van, egyelőre nem is keltett akkora pánikot, mint a korábbi technológiák, amelyeket előbb nyilvánosságra hoztak, majd utóbb próbáltak meg olyan változtatásokat eszközölni rajtuk, amelyekkel csökkenteni lehet a visszaélések számát. Persze akadnak most is olyanok – különösen a közösségi médiában –, akik már a filmpipar halálát látják bele a Sorába, de annyi bizonyos, hogy az Open AI sokkal okosabban cselekszik, mint eddig bármikor. Más kérdés, hogy tényleg vissza tudnak-e majd fogni mindenféle visszaélést, de ez a jövő zenéje. Ahogy a mesterséges intelligenciával működő videógeneráló publikusan felhasználható verziójának debütálása is: egyelőre ugyanis még nem tudjuk, pontosan mikor férhetnek majd hozzá az átlagos felhasználók is.

Kövessétek a REFRESHER-t, iratkozzatok fel közösségi csatornáinkra is, hogy ne maradjatok le a folyamatosan frissülő tartalmainkról: @refresherhu néven ott vagyunk a TikTokon, az Instagramon, a YouTube-on és a Facebookon is!