Чатботове с изкуствен интелект (AI), като ChatGPT на OpenAI, могат да ръководят софтуерна компания по един бърз и рентабилен начин с минимална човешка намеса, сочи ново проучване.

Тази констатация идва след като учени публикуваха друго изследване, според което AI агенти, зад които стоят големи езикови модели, успяват да управляват виртуален град сами.

В публикувания наскоро доклад, екип от учени от университет Браун и няколко китайски университета провеждат експеримент, за да установят дали AI ботове, зад които стои версията 3.5 на ChatGPT модела, биха могли да изпълнят процес по създаването на софтуер без предварително обучение.

За да изпробват това, учените създали хипотетична софтуерна компания на име ChatDev. Използвайки модела на водопада за създаване на софтуер, компанията е разделена на четири етапа в хронологичен ред – дизайн, програмиране, тестване и документиране.

След това учените възлагат на AI ботовете конкретни роли, като предоставят на всеки от тях "съществено важни подробности", които описват "определената задача и роли, протоколи за комуникация, критерии за прекратяване и ограничения".

След като учените възлагат на AI ботовете техните роли, всеки бот е разпределен към съответните етапи. "Главният изпълнителен директор" и "Главният технологичен директор" на ChatDev, например, са работили по етапа с "дизайна", докато "програмистът" и "арт дизайнерът" са участвали в етапа с "програмирането".

По време на всеки етап AI служителите са комуникирали помежду си с минимална човешка намеса за извършването на конкретни части от процеса по разработка на софтуера — от вземането на решение кой език за програмиране да се използва до откриването на бъгове, докато софтуерът не бил завършен.

Учените са провели експеримента с различни софтуерни сценарии и са направили поредица от анализи, за да установят колко време е отнело на ChatDev, за да завърши всеки вид софтуер и колко би струвало във всеки един от случаите.

Авторите на доклада, например, възлагат на ChatDev да проектира базова версия на Гомоку - абстрактна настолна игра.

При етапа на дизайна, главният изпълнителен директор моли главния технически директор "да предложи конкретен език за програмиране", който би "задоволил търсенето от страна на новите потребители," на което последният предлага с Python. На свой ред главният изпълнителен директор казва, че това е страхотен избор и обяснява, че "простотата и четливостта на този език за програмиране го правят популярен избор както за начинаещите, така и за опитните разработчици."

След като главният технологичен директор казва "Да започваме," ChatDev пристъпва към етапа с програмирането, при който същият директор моли програмиста да напише файл. След това програмистът моли дизайнера да придаде на софтуера "красив потребителски интерфейс." Тази верига на разговори се повтаря на всеки етап до разработката на софтуера.

След възлагането на 70 задачи на ChatDev, авторите на проучването установяват, че задвижваната от AI компания успява да завърши пълния процес по разработката на софтуера средно "за по-малко от седем минути на цена от под 1 долар", като същевременно установява "потенциални уязвимости".

В доклада се посочва, че около 86.66% от генерираните софтуерни системи са били "изпълнени безупречно."

"Нашите експериментални резултати демонстрират ефективността и рентабилността на автоматизирания процес на разработка на софтуер на ChatDev", посочват авторите в доклада.

Констатациите от доклада показват един от многото начини, по които мощните технологии с генеративен AI, като ChatGPT, могат да изпълняват конкретни работни функции. След пускането му през ноември, служители в различни индустрии използват чатбота за спестяване на време и повишаване на продуктивността на работното място.

Програмистите, по-конкретно, могат да сметнат инструментите с генеративен AI за полезни техния личен и професионален живот. Даниел Диполд, програмист от Берлин, използва ChatGPT, за да създаде програма, която му помага да си намери апартамент, а служители на Amazon използваха чатбота за разработка на софтуер.

Проучването обаче установява, че не всичко е идеално. Учените установяват ограничения, като грешки и пристрастия в езиковите модели, които биха могли да доведат до проблеми при създаването на софтуер. Въпреки това, те смятат, че след време направените констатации "биха могли да помогнат на младши програмисти или инженери в реалния свят".