OpenAI, känt för sin AI-språkmodell ChatGPT, gör vågor inom området för videogenomgång med sin nyaste skapelse, modellen Sora AI. Med utgångspunkt i framgången med ChatGPT, har OpenAI för avsikt att omvandla skapandet av videoinnehåll genom kraften av artificiell intelligens.
Nyligen avtäckta, Sora fungerar på ett liknande sätt som OpenAI:s bildgenereringsverktyg, DALL-E. Användare kan ange sin önskade scen eller tillhandahålla stillbilder, och Sora kommer att generera högupplösta videoklipp därefter. Oavsett om det handlar om att förlänga befintliga videor eller fylla i saknade ramar visar Sora sin anmärkningsvärda mångsidighet inom generering av videoinnehåll.
Denna steg in i video markerar en betydande expansion för generativ AI. Efter att ha bevittnat framgången för chatbots och bildgenereringsverktyg inom både konsument- och affärsapplikationer, var videodomänen den logiska nästa gränsen. Dock, i takt med att AI-genererade deepfakes har blivit allt vanligare, har även oro angående desinformation ökat. Clarity, ett maskininlärningsföretag, rapporterar en imponerande 900% ökning av AI-genererade deepfakes jämfört med föregående år.
För att konkurrera med teknikgiganter som Meta och Google, som nyligen introducerat sina egna video-genererings-AI-verktyg kallade Lumiere, positionerar OpenAI Sora som en ledande aktör på marknaden. Dessutom har uppstartsföretag som Stability AI och Amazon gjort sina egna första steg inom detta område med video-genereringsmodeller.
För närvarande kan Sora generera videor upp till en minut i längd. OpenAI, med stöd från Microsoft, siktar på att uppnå multimodalitet genom att integrera text, bild och videogenerering i sin svit av AI-modeller. OpenAIs COO, Brad Lightcap, betonar vikten av multimodalitet och hävdar att ”världen är multimodal… världen är mycket större än text.” Medveten om behovet av att AI-modeller omfattar olika modaliteter strävar OpenAI efter att skapa modeller som bättre speglar mänsklig uppfattning och interaktion med världen.
Sammanfattningsvis är OpenAIs Sora AI-modell på väg att revolutionera landskapet för generering av videoinnehåll. Genom att kombinera kraften i AI med videokreation driver OpenAI gränserna för vad som är möjligt och banar väg för en ny era av multimedia innehåll.