Китайската технологична компания Alibaba пусна нова версия на своя езиков модел Qwen 2.5.

Компанията твърди, че показателите му надминават тези на DeepSeek-V3, представен преди няколко седмици и предизвикал сътресения на пазара.

Необичайното време за пазарния дебют на Qwen 2.5-Max - в първия ден от Лунната нова година, когато повечето китайци са в отпуск и са със семействата си, е доказателство за натиска, предизвикан от китайския стартъп DeepSeek през последните седмици.

Той засяга не само чуждестранната, но и вътрешната конкуренция, пише Yahoo FInance.

"Qwen 2.5-Max превъзхожда почти във всяко отношение GPT-4o, DeepSeek-V3 и Llama-3.1-405B“, се посочва в изявлението на Alibaba, публикувано в официалния акаунт на компанията в WeChat.

На 10 януари беше пуснат в експлоатация асистентът за изкуствен интелект на DeepSeek, задвижван от модела DeepSeek-V3, който шокира Силициевата долина и предизвика спад в цената на акциите на технологичните компании, включително и на производителя на чипове Nvidia. 

Предполага се, че китайският стартъп постига резултатите си с много по-ниски разходи, което накара инвеститорите да поставят под съмнение огромните инвестиционни планове на водещите фирми за изкуствен интелект в Съединените щати.

Но успехът на DeepSeek доведе и до битка сред местните китайски конкуренти за надграждане на техните собствени AI модели.

Два дни след пускането на DeepSeek-R1, собственикът на TikTok - ByteDance, пусна актуализация на своя водещ AI модел, за който твърди, че надминава поддържания от Microsoft OpenAI o1 в AIME - сравнителен тест, който измерва колко добре езиковите модели разбират и реагират на сложни инструкции.

DeepSeek срещу местните конкуренти

Предшественикът на модела V3 на DeepSeek - DeepSeek-V2, предизвика ценова война на AI моделите в Китай, след като беше пуснат миналия май.

DeepSeek-V2 беше с отворен код и безпрецедентно евтин - само 1 юан ($0.14) за 1 милион токена (единици данни, обработени от AI модела). Това накара облачното звено на Alibaba да обяви намаления на цените до 97% на своята гама от езикови модели.

Други китайски технологични компании последваха примера, включително и Baidu, която пусна първия китайски еквивалент на ChatGPT през март 2023 г., както и най-скъпата интернет компания в страната Tencent.

Енигматичният основател на DeepSeek Лиан Венфенг коментира в свое интервю за китайската медия Waves през юли, че стартъпът не се интересува от ценовите войни и че постигането на AGI (изкуствен общ интелект) е основната му цел.

OpenAI определя AGI като автономни системи, които превъзхождат хората в повечето задачи.

Докато големите китайски технологични компании, като Alibaba, имат стотици хиляди служители, DeepSeek е изследователска лаборатория, в която работят предимно млади висшисти и докторанти от водещи китайски университети.