OpenAI, която стои зад създаването на чатбота ChatGPT, пуска ново приложение, което ще може да превръща текст във видео с помощта на изкуствен интелект.

Новият инструмент се нарича Sora и, според информацията от компанията, цитирана от The Verge, ще може да създава реалистични и въображаеми сцени на база текстови инструкции.

Моделът текст-към-видео позволява на потребителите да създават фотореалистични видеоклипове с дължина до една минута. Те ще бъдат визуализирани според текстовите команди, които са подадени към модела.

Sora е в състояние да създава "сложни сцени с множество герои, специфични типове движение и точни детайли на обекта и фона“, според уводната публикация в блога на OpenAI. 

Компанията също така отбелязва, че моделът може да "разбере" как обектите съществуват във физическия свят и „да интерпретира точно реквизити и да генерира завладяващи герои, които изразяват живи емоции“. 

Моделът може също така да генерира видео въз основа на неподвижно изображение, да попълва липсващи кадри на съществуващо видео или да го разшири. 

Генерираните от Sora демонстрации, посочени в публикацията в блога на OpenAI, включват въздушна сцена на Калифорния по време на т. нар. "златната треска", видео, което изглежда така, сякаш е заснето от вътрешността на влак в Токио и други.

От OpenAI казват, че моделът може да се затрудни с точното симулиране на физиката на някои от по-сложните сцени, но като цяло резултатите са доста впечатляващи.

Преди няколко години генераторите на текст към изображение, като Midjourney, бяха върхът на технологията в сферата на генеративния изкуствен интелект, но напоследък видеото започва да се подобрява със забележителни темпове. 

Компании, като Runway и Pika, показаха впечатляващи собствени модели за преобразуване на текст към видео, а Lumiere на Google се счита за един от основните конкуренти на OpenAI в това пространство.

Подобно на Sora, Lumiere предоставя на потребителите инструменти за преобразуване на текст към видео и също така им позволява да създават видеоклипове от неподвижни изображения.

Понастоящем Sora е достъпна само за ограничен кръг от "тестъри", които оценяват модела за потенциални вреди и рискове. OpenAI също така предлага достъп на някои артисти, дизайнери и режисьори, за да получи обратна връзка от тях.