OpenAI пуска приложение за преобразуване на текст във видео

OpenAI, която стои зад създаването на чатбота ChatGPT, пуска ново приложение, което ще може да превръща текст във видео с помощта на изкуствен интелект.

Новият инструмент се нарича Sora и, според информацията от компанията, цитирана от The Verge, ще може да създава реалистични и въображаеми сцени на база текстови инструкции.

Моделът текст-към-видео позволява на потребителите да създават фотореалистични видеоклипове с дължина до една минута. Те ще бъдат визуализирани според текстовите команди, които са подадени към модела.

Sora е в състояние да създава "сложни сцени с множество герои, специфични типове движение и точни детайли на обекта и фона“, според уводната публикация в блога на OpenAI.

Компанията също така отбелязва, че моделът може да "разбере" как обектите съществуват във физическия свят и „да интерпретира точно реквизити и да генерира завладяващи герои, които изразяват живи емоции“.

Сам Алтман: ChatGPT е особено полезен на служителите в три индустрии

Моделът може също така да генерира видео въз основа на неподвижно изображение, да попълва липсващи кадри на съществуващо видео или да го разшири.

Генерираните от Sora демонстрации, посочени в публикацията в блога на OpenAI, включват въздушна сцена на Калифорния по време на т. нар. "златната треска", видео, което изглежда така, сякаш е заснето от вътрешността на влак в Токио и други.

От OpenAI казват, че моделът може да се затрудни с точното симулиране на физиката на някои от по-сложните сцени, но като цяло резултатите са доста впечатляващи.

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024

Преди няколко години генераторите на текст към изображение, като Midjourney, бяха върхът на технологията в сферата на генеративния изкуствен интелект, но напоследък видеото започва да се подобрява със забележителни темпове.

Компании, като Runway и Pika, показаха впечатляващи собствени модели за преобразуване на текст към видео, а Lumiere на Google се счита за един от основните конкуренти на OpenAI в това пространство.

Подобно на Sora, Lumiere предоставя на потребителите инструменти за преобразуване на текст към видео и също така им позволява да създават видеоклипове от неподвижни изображения.

Понастоящем Sora е достъпна само за ограничен кръг от "тестъри", които оценяват модела за потенциални вреди и рискове. OpenAI също така предлага достъп на някои артисти, дизайнери и режисьори, за да получи обратна връзка от тях.

Новините на Darik Business Review във Facebook , Instagram , LinkedIn и Twitter !