Въпреки че Африка е дом на над една четвърт от световните езици, много от тях отсъстват от бързо развиващия се свят на изкуствения интелект.

Проблемът се корени както в липсата на инвестиции, така и в недостига на леснодостъпни данни за обучение на AI моделите.

Повечето популярни инструменти за изкуствен интелект, като Chat GPT, са обучени предимно на английски, европейски и китайски езици. Те разчитат на огромни масиви от онлайн текст, от които да черпят информация.

Но тъй като много африкански езици се използват основно в устна форма, липсва писмен материал, който да послужи за обучението на AI. В резултат на това милиони хора на континента са практически изключени от тази технологична революция.

Дигиталната пропаст: защо AI не говори африкански?

Изследователи, решени да се справят с това предизвикателство, наскоро публикуваха най-големия известен до момента набор от данни за африкански езици. Техният труд е ключова стъпка към преодоляване на езиковата бариера в технологиите.

„Ние мислим на собствените си езици, мечтаем на тях и интерпретираме света чрез тях. Ако технологиите не отразяват това, цяла група рискува да изостане“, коментира пред BBC проф. Вукоси Маривате от Университета в Претория, който е част от проекта.

„Преживяваме тази революция на изкуствения интелект, представяйки си всичко, което може да се направи с него. Сега си представете, че има част от населението, която просто няма този достъп, защото цялата информация е на английски.“

Africa Next Voices: Мост към технологичното бъдеще

Проектът Africa Next Voices обединява усилията на лингвисти и компютърни специалисти за създаването на готови за употреба от изкуствен интелект набори от данни на 18 африкански езика. Макар това да е малка част от над 2000 езика, които се говорят на континента, участниците вярват, че това е само началото.

За две години екипът успява да запише 9000 часа реч в Кения, Нигерия и Южна Африка, улавяйки ежедневни разговори в сферата на земеделието, здравеопазването и образованието. Сред записаните езици са:

  • В Кения: кикую и дхолуо
  • В Нигерия: хауса и йоруба
  • В Южна Африка: исизулу и чивенда

Проектът е реализиран благодарение на грант от 2.2 милиона долара от фондация „Гейтс“. Събраните данни ще бъдат с отворен достъп, което ще позволи на разработчиците по света да създават инструменти за превод, транскрипция и гласови асистенти на африкански езици.

Реални решения: AI в помощ на фермери и бизнеса

Вече съществуват примери как използването на местни езици в изкуствения интелект може да реши реални проблеми в Африка. Такъв е случаят с фермера Келебогиле Мосиме, която обработва 21 хектара земя в Ръстенбург, Южна Африка.

Тя използва приложението AI-Farmer, което разпознава няколко южноафрикански езика, включително сетсвана, исизулу и африкаанс.

„Всеки ден виждам ползите от възможността да използвам родния си език сетсвана в приложението, когато се сблъскам с проблеми във фермата. Мога да попитам за различни варианти за борба с насекомите, това беше полезно и при диагностициране на болни растения“.

Междувременно, южноафриканската компания Lelapa AI разработва AI инструменти на африкански езици за банковия и телекомуникационния сектор. Нейният изпълнителен директор Пелономи Мойлоа подчертава, че езикът може да бъде огромна бариера пред достъпа до основни услуги като здравеопазване и финансови продукти.

Повече от думи: Запазване на култура и знание

За проф. Маривате значението на тези инициативи надхвърля удобството и бизнеса. Съществува реален риск без интегрирането на африканските езици в дигиталния свят да се загуби нещо много по-ценно. „Езикът е достъп до въображението“, казва той.

„Това не са просто думи – това е история, култура, знания. Ако местните езици не са включени, губим повече от данни; губим начини да виждаме и разбираме света.“