По официална информация от Института за компютърни науки, изкуствен интелект и технологии (INSAIT) към Софийския университет „Св. Климент Охридски“, организацията работи по значим съвместен проект с една от най-големите световни стрийминг платформи – Netflix. Двете институции разработиха иновативен AI модел, наречен VOID, който е предназначен за усъвършенствана обработка на видео с изкуствен интелект. Основната функция на новата технология е да премахва обекти от видеоклипове, като едновременно с това пресъздава напълно реалистично как се променя останалата част от сцената.

Как работи AI моделът VOID?

За разлика от стандартните софтуерни инструменти, които просто „запълват“ изтритите пиксели или части от кадъра, VOID притежава способността да разбира как обектите си взаимодействат в пространството. Ако например от дадено видео бъде премахнат човек, който държи предмет, изкуственият интелект симулира как този предмет пада или се движи по естествен начин. Крайният резултат изглежда така, сякаш сцената първоначално е заснета без премахнатия участник.

Технологична основа и обучение на системата

Новата технология стъпва върху базата на CogVideoX и използва специализиран подход, известен като quadmask. Този метод позволява на системата прецизно да разграничи:

  • Самите обекти в кадъра;
  • Зоните на взаимодействие между тях;
  • Фоновата среда на сцената.

Това разделение помага на AI модела да запази логиката и динамиката на видеото, без да оставя видими дефекти или артефакти. Тъй като реални тренировъчни данни за подобни сложни взаимодействия почти липсват, екипите на INSAIT и Netflix са използвали симулирани сцени. Те са генерирани чрез популярния софтуер Blender, което е позволило на модела да се научи какво се случва в реалния свят, когато даден обект внезапно изчезне.

Предимства за създателите на видео съдържание

В сравнение с вече съществуващите решения на пазара, VOID постига значително по-добра визуална последователност и много по-реалистично поведение на оставащите обекти. Тази иновация може да даде огромна свобода на производителите на видео съдържание. Технологията би спестила сериозен финансов ресурс, който иначе би бил изразходван за скъпоструващо презаснемане на различни сцени.

Важен детайл е, че моделът VOID е с отворен код. Това предоставя възможност на софтуерни разработчици и изследователи от цял свят да работят свободно с него и да надграждат технологията. Този съвместен проект е поредното доказателство за ключовата роля на INSAIT в създаването на технологии със световно значение.