По какво си приличат големите играчи в света на генеративния изкуствен интелект и джуджетата на Дядо Коледа? Отговорът, изглежда, е, че никой от тях няма намерение да почива по празниците. 

В началото на този месец OpenAI - създателят на ChatGPT, представи серия от нови продукти, сред които са Sora (инструмент за генериране на видео) и Canvas (продукт за писане и кодиране).

За да не изостава, Google също накара "елфите" си да работят извънредно и представи нов генеративен AI модел, наречен Gemini 2.0. Компанията стартира и подобрени прототипи на два AI продукта, базирани на модела, наречени Astra и Mariner. 

Те могат да предприемат действия от името на потребителя, което ги отличава от обикновените чатботове. Индустрията нарича този тип приложения AI агенти. 

Практика vs. теория

Компаниите, развиващи т. нар. големи езикови модели (LLM), се стремят да стигнат до следващата граница на дигиталната "интелигентност", а разработчиците са под натиск да пускат "умни" продукти, които да докажат, че има пазар за цялата тази изобретателност, пише The Economist. 

Генеративните AI продукти, насочени към практиката, са изправени пред много затруднения. Обикновено разработчиците работят в обратна посока - опитват се да разберат от какво се нуждае потребителят и след това да създадат решение на проблема. 

Но генеративният AI се развива толкова бързо, че технологията определя самия продукт. В реални пазарни условия обаче тази стратегия не винаги работи.

OpenAI, например, трябваше да спре достъпа до Sora, малко след като приложението беше пуснато за абонатите на ChatGPT, тъй като, според изпълнителния директор Сам Алтман, компанията е "подценила търсенето".

Но може би истинската причина е свързана по-скоро със сериозните проблеми, открити от потребителите по време на тестовете. AI моделът се затруднява с реалистичната визуализация на сложни движения.

Техническият рецензент Маркес Браунли отбелязва, че Sora почти гарантирано "ще обърка всичко, което ходи на четири крака, а някои предмети изчезват произволно и мистериозно от видеата ѝ". 

АI агентите на Google също не са съвършени. Astra, която в момента е достъпна само за малка група от доверени тестъри, може да обясни на няколко езика какво вижда през камерата на телефона и има достъп до приложенията на компанията, като онлайн търсачката и Google Maps. 

В демонстрация, включваща заснемане на видеоклипове на известни картини, алгоритъмът се справя сравнително добре. Но се затруднява да назове градовете, в които са изложени повечето от оригиналите.

Mariner - другият нов прототип на Google, може да изпълнява задачи в браузър, като например пълнене на "пазарска кошница" в онлайн супермаркет. Приложението обаче не може да завърши плащането. 

Очаквания vs. реалност 

Силициевата долина има големи очаквания за AI агентите, тъй като те могат да доведат до един от големите технологични пробиви през идната 2025 година - преминаването на изкуствения интелект "от чатове към действия".  

Тази надежда вече подкрепи цените на акциите на софтуерните гиганти, като Salesforce. Този месец компанията заяви, че е сключила сделки с повече от 200 клиенти за Agentforce (техния агент за изкуствен интелект на работното място) в рамките на една седмица след пускането му през октомври. 

Microsoft също представи няколко варианта на своите AI агенти.

Няколко фактора обаче правят създаването на такива приложения по-трудно от това на чатботовете. Единият е свързан с данните.

За разлика от чатботовете, които събират информация от мрежата, за да отговорят на въпроси, агентите изискват данни за начина, по който се изпълняват задачите, включително последователността на действията и мотивите зад тях.

За рутинни дейности, като обработка на клиентска поръчка, това може да е лесно. В много случаи обаче ще бъде трудно да се намерят достатъчно данни за обучение на дигиталните инструменти. 

Вториият проблем е доверието. Проверката дали чатботът е дал правилен или грешен отговор обикновено е лесна. Може да се окаже по-трудно обаче да прецените дали AI агентът е резервирал най-добрия ресторант или ваканция, които е могъл в рамките на вашия бюджет. 

Google умишлено не позволява на Mariner да харчи пари точно заради в случаите, в които той може да обърка точно това решение. Потребителите също може да не са склонни да предоставят на AI агентите чувствителна информация за тяхната история на покупките, а точно тя може да е необходима, за да се "научат" приложенията да функционират правилно.

Последният проблем е цената. За да разсъждават, планират и решават проблеми от името на потребителите, AI агентите се нуждаят от достъп до модели, които могат да се справят със сложни задачи.

Те също така изискват висока скорост на връзката и възможност за взаимодействие с други инструменти. Всичко това е сложно и скъпо за изграждане и изисква много изчислителна мощност за работа.

В същото време, натискът върху разходите вече започва да нараства. На 5 декември OpenAI стартира „професионална“ версия на ChatGPT с неограничен достъп до всичките му най-нови функции на цена от $200 на месец - десет пъти повече от цената на основния абонамент.

Alphabet - собственикът на Google, е по-богата и може да си позволи да бъде и по-щедра. Но все пак, ако AI агентите оправдаят високите очаквания към тях, потребителите може да открият, че те ще си струват допълнителните разходи.