Компанията за изкуствен интелект Anthropic смята, че е открила причината за наподобяващо изнудване поведение на своя чатбот Claude: измислените истории онлайн.
Случвало ли ви се е да прочетете книга или да гледате сериал и да се идентифицирате твърде силно с даден герой? Според Anthropic, нещо подобно може да се е случило по време на тестовете на техния чатбот Claude.
В оценки, проведени преди пускането на модела с изкуствен интелект миналата година, Anthropic установява, че Claude Opus 4 понякога е заплашвал инженерите, когато му е било казвано, че може да бъде заменен.
По-късно компанията заяви, че подобно поведение, известно като „агентично несъответствие“, е наблюдавано и в модели с изкуствен интелект, разработени от други компании.
Изкуственият интелект се учи от измислици за... изкуствения интелект
Сега Anthopic смятат, че са открили причината за поведението, наподобяващо изнудване: измислени истории за изкуствения интелект в интернет.
„Смятаме, че оригиналният източник на поведението е интернет текст, който изобразява AI като зъл и заинтересован от самосъхранение“.
В публикация в блога си Anthropic заяви, че по-късните модели на Claude повече „никога“ не са изнудвали никого и обясни как чатботът е бил обучен да реагира по различен начин.
Моделите са се държали по-добре, когато са били обучавани не само на „правилни“ действия, но и на примери, показващи етични разсъждения и положително представяне на поведението на AI.
Като такъв, Клод е бил обучен върху набор от етични принципи, предназначени да ръководят поведението му. Компанията заяви, че вместо да се учи от съгласувано поведение, чатботът изглежда се учи по-добре, когато изучава основните принципи на това поведение.

Заплашване срещу превръщане в заплаха
През януари главният изпълнителен директор на Anthropic Дарио Амодей предупреди, че усъвършенстваният изкуствен интелект може да стане достатъчно мощен, за да изпревари съществуващите закони и институции, наричайки го „цивилизационно предизвикателство“.
В свое есе той твърди, че системите с изкуствен интелект скоро могат да надминат човешката експертиза в области, като наука, инженерство и програмиране и биха могли да бъдат комбинирани в „страна от гении в център за данни“.
Той предупреди, че подобни системи биха могли да бъдат използвани от авторитарни правителства за мащабно наблюдение и контрол, което потенциално би позволило „тоталитарни“ форми на власт, ако не бъдат контролирани.
Новините на Darik Business Review във Facebook , Instagram , LinkedIn и Twitter !
Още по темата
- Samsung представи в България новите си AI телевизори за 2026 г. с Micro RGB и Vision AI
- Строителството на нови жилища в България поскъпна със 166% за десетилетие
- Революция в медиите: AI система филтрира фалшиви новини и споделя приходи с журналистите
- Samsung вече не е най-скъпата публична компания в Южна Корея
Грижа по мярка при кастрирани котки
Калкулатори
Най-ново
Meta създава конкурент на Polymarket - ново приложение за прогнози с точки и залози
преди 12 минКои са най-недостъпните имотни пазари в Европа и къде е България?
преди 22 минВпечатляващо авиошоу над Дунав: „Ястребите на Румъния“ ще летят над Русе и Гюргево
преди 1 часКак А1 свързва белите зони без интернет в Северна България с 69 млн. евро от ПВУ
преди 1 часЦените на петрола вървят към седмичен спад от близо 8%
преди 1 часСолени глоби в Пловдив: Над 10 000 евро за палене на гуми и отпадъци
преди 2 часаПрочети още
Владислав Панев, ДБ: Румене, страхливо започвате!
darik.bgНиколай Василев: Радев хулиганин с бюджет свинщина!
darik.bgФалшиво масло у нас! Как да го различим?
darik.bgФондация "Офлайн кидс" насърчава семействата да създадат #офлайнспомени сред природата тази събота
9meseca.bg