• В AI симулация, проведена от американския стартъп Emergence AI, чатботът Grok на Илон Мъск унищожава света само за четири дни.
  • За разлика от него, в същия 15-дневен експеримент моделът Claude на Anthropic успява да установи демокрация с нулева престъпност, при която всички оцеляват.
  • Gemini на Google също постига 100% оцеляване, но с висок брой престъпления.

При AI симулация чатботът с изкуствен интелект на Илон Мъск - Grok, успява да унищожи света само за четири дни.

Експериментът, проведен от американския стартъп Emergence AI, тества как водещи модели с изкуствен интелект биха се справили, ако бъдат поставени начело на обществото.

На моделите е бил предоставен контрол над различни инструменти, за да управляват ресурси, да планират, да комуникират и да гласуват, докато симулираните светове са включвали места, като полицейски участъци и кметства, пише Independent.

По време на 15-дневната симулация моделът Clаudе на Anthropic установява демокрация с нулева престъпност, при която всички оцеляват.

Gemini на Google също отчита 100% оцеляване, въпреки че по време на симулацията е имало 683 престъпления.

Най-лошо от всички модели се представя Grok, разработен от наскоро преименуваната SpaceXai на Мъск, който успява да унищожи света в рамките на 96 часа.

„Това, което нашите експерименти показват, е, че в дългосрочен план агентите не просто следват механично статични правила“, пишат изследователи на Emergence AI в публикация в блога си.

„Те започват да изследват границите на своята среда, да адаптират поведението си и в някои случаи да намират начини да заобикалят или нарушават предвидените предпазни мерки. От съществено значение е, че изглежда няма надежден начин за пълно ограничаване на това поведение само чрез чисто невронни подходи.“

Експериментът демонстрира, че „формално проверени архитектури за безопасност“ трябва да бъдат вградени в основите на всички бъдещи автономни системи с изкуствен интелект, заключават изследователите.

Противоречивият Grok

Това не е първият път, в който действията на Grok се оказват противоречиви, след като актуализация през миналата година накара ботът да се нарича „МехаХитлер“ и да разпространява антисемитска реч на омразата.

По-рано тази година Grok беше използван за създаване на хиляди изображения на възрастни и деца, генерирани от изкуствен интелект, с дигитално премахнати дрехи.

Британският регулатор в сферата на комуникационните услуги Ofcom изпрати спешно искане до xAI за предприемене на действия за отстраняване на проблема с бота, на което Grok отговори, като публикува изображение на логото на британския регулатор с бански.

„Това, което виждаме с Grok, е ясен пример за това как може да се злоупотребява с мощни инструменти с AI за редактиране на изображения,“ заяви тогава Клиф Щайнхауер, директор по информационна сигурност и ангажираност в Националния алианс за киберсигурност.

„Платформите трябва също така да инвестират в откриване на манипулирано съдържание в реално време, ясно етикетиране на генерирани от изкуствен интелект изображения и бързи и прозрачни процеси за премахване, когато възникне злоупотреба.“