A ChatGPT fejlesztéséért is felelős OpenAI bejelentette legújabb MI modelljét, amely a Sora névre hallgat. Ez a mesterséges intelligencia modell képes különböző felbontású és képarányú videók létrehozására, illetve meglévő mozgóképes tartalmak szerkesztésére, lehetővé téve a táj, a világítás és a felvételi stílus gyors megváltoztatását mindössze szöveges parancsok alapján.
Az új mesterséges intelligencia modellnek nem okoz gondot videókat generálni állóképekből, sőt, hiányzó képkockákat is kitölthet egy már meglévő videóban. A Sora jelenleg egy perces, legfeljebb Full HD felbontású videótartalmakat képes létrehozni, és az eddig közzétett minták egészen ígéretesnek tűnnek. A Sora működése a ChatGPT-hez hasonló transzformátor architektúrán alapul, amelyben a videók és képek kisebb adategységek, úgynevezett patchek formájában jelennek meg.
A Sora által generált videók statikus zajként kezdik létüket, a modell pedig fokozatosan távolítja el a zajt, így alakítva ki a végleges változatot. Az OpenAI azt is megosztotta velünk, hogy az új modell esetében a DALL-E3-ban használt meglévő biztonsági protokolljait alkalmazza. A Sorát jelenleg is szakértők tesztelik, akik különböző vizsgálatokat végeznek, és értékelik a modellt a potenciális kockázatok szempontjából, mielőtt megtörténne a hivatalos bevezetés.
Az új modellnek nem az a célja, hogy elvegye a munkát olyanoktól, mint Tarr Béla vagy James Cameron, netán meglopja őket. Hogy ez ne csak egy üres kijelentés legyen, az OpenAI tárgyalásokat folytat majd döntéshozókkal, művészekkel és pedagógusokkal, hogy tisztázzák a Sora lehetséges felhasználási lehetőségeit, illetve az MI modell jelentette aggályokat. Azt egyelőre nem hozták nyilvánosságra, hogy mikortól lehet használni a videószerkesztő mesterséges intelligenciát.
Forrás: OpenAI