Ярослав Кутиловски говори немски, полски и английски (и може да си поръча Coca-Cola на френски език). С DeepL, използващият изкуствен интелект (AI) инструмент на неговия стартъп, той може да чете и да пише на още около 30 езика.

Основаната през 2017 г. DeepL е разработила преводен софтуер, които според нея е много по-точен в сравнение с конкурентни продукти, предлагани от Google и други компании. Това се дължи на мощния изкуствен интелект, който си сътрудничи с хора говорещи на своя майчин език.

Разработената от DeepL’s невронна мрежова архитектура (техника за машинно обучение, която помага на компютрите да научават информация по същия начин, както човешкия мозък) е обучена върху огромна база данни от публично наличен двуезичен (преведен) и едноезичен (непреведен) текст на 31 различни езика, в това число китайски, руски, испански и италиански.

Това е малка част от 130-те езика, на които можете да превеждате, използвайки Google. Преводите на DeepL обаче се коригират с отделни нюанси от човешки редактори и от хора на техния майчин език. Стартъп компанията има собствени 20 редактора и над 1 000, които работят към различни контрактори по цял свят, както и хора, използващи майчиния си език, които оценяват качеството на преводите, направени от модела на DeepL и ги коригират, за да бъдат по-точни.

“Имаме нужда от много данни, преведени от хора, за да научим особеностите на даден език и да превеждаме обикновен и официален текст”, казва Кутиловски.

DeepL има над 10 милиона активни потребители месечно, 500 000 от които плащат между 9 и 59 долара  на месец. Това включва баби и дядовци, които използват DeepL, за да говорят с внуците си на майчиния им език и двойки, които имат проблеми с езиковата бариера. По-голяма част от дейността на DeepL обаче се генерира от нейните 20 000 корпоративни клиенти, като Mercedes Benz, Fujitsu и Deutsche Bahn, които използват софтуера на компанията за да превеждат всичко, от уебсайтове, през  правни договори и клиентски споразумения до имейли и PowerPoint презентации.

През януари тази година базираният в Кьолн стартъп набра около 100 млн. долара финансиране от глобални компании за рисков капитал, сред които Institutional Venture Partners (IVP), Atomico и Bessemer Venture Partners, което определи на компанията пазарна капитализация от 1 млрд. долара, според данни на Pitchbook. Кутиловски, който е главен изпълнителен директор и основател на компанията, не разкрива общото финансиране, което тя е набрала от създаването си досега.

Приложението DeepL е изтеглено на 25 млн. устройства, което е нищожно в сравнение с инсталираната над 1 млрд. пъти Google Translate. Тези, които са го използвали обаче, са доволни от прецизността на преводите. Нина Гафни, професионален преводач от Вашингтон, която преди това е работила за ФБР като лингвист и преводач, използва DeepL, за да превежда от френски, немски и италиански на английски език. Тя казва, че системите за машинно обучение никога не са идеални в преводите си, но тези на DeepL улавят повече културни нюанси и са по-прецизни от повечето.

“Понякога автоматичните преводачи превеждат прекалено буквално и това е голям проблем”, казва Гафни. “Ако съм затруднена, знам, че мога да разчитам много повече на DeepL, отколкото на Google Translate.”

Това вероятно се дължи на човешката калибровка, в масата филмови субтитри, преводи на книги и патенти и форумни разговори, използвани за обучението на DeepL.

Майчиният език на Акико Тагучи е японски, а тя работи за DeepL. Тагучи казва пред Forbes, че през повечето време следи за това преводите на DeepL да са контекстуално правилни и да звучат като човешки преводи.

“Предоставях на машината моята обратна връзка, когато объркваше учтивостите, използвани в писмения японски език”, казва Тагучи. “Преводите се подобриха значително след това.”

DeepL, която бе отделена от търсачката за преводи Linguee, позволява на потребителите да превеждат цели документи, като PDF, Word и PowerPoint като в същото време запазва форматирането. Програмата предлага алтернативни преводи и тонални модификации и позволява на потребителите да си създават персонализиран речник, в който уточняват как определени думи трябва да бъдат превеждани.

Кутиловски, който има докторска степен по компютърни науки, разработвал технологията за машинно обучение, която е в основата на DeepL през 2016 г., като по същото време от Google работели по Transformers, базираният на превод технологичен пробив, който стои зад ChatGPT. Той обаче твърди, че към момента DeepL не използва Transformers, нито големи езикови модели за превод, като отказва да разкрие точната архитектура на своя продукт. “Знаехме, че невронните мрежи ще доминират в тази сфера много скоро,” казва Кутиловски. “Бяхме убедени, че всичко, което е използвани за преводи преди, като статистически методи, няма да има никакво приложение в бъдеще.”

Това се оказва точно така, според Картик Рамакришан, партньор в IVP, която е с основен принос за набраните от DeepL 100 млн. долара през януари. Глобалният пазар за преводни услуги се оценява на 27.9 млрд. долара и той не е разработен добре.

С положителните отзиви за работата си и своята пазарна оценка от 1 млрд. долара, DeepL е в добра позиция да се възползва от пазара, който Рамакришнан е набелязал. Това обаче важи и за други играчи. Въпреки че инструментът за преводи на Google не е толкова прецизен като DeepL, той поддържа 130 езика и има зад гърба си гигант, който инвестира от десетилетия в изкуствения интелект. Друг голям конкурент е Microsoft Translator, който поддържа над 100 езика и диалекта и има големи корпоративни клиенти като Volkswagen Group. Междувременно, ChatGPTв момента може да превежда на 50 езика (но има редица проблеми с превода). Тези възможности единствено ще се подобряват, благодарение на развитието на водещите в индустрията големи езикови модели на неговата компания майка OpenAI.

DeepL засега не разполага със собствен голям езиков модел (LLM). Кутиловски казва пред Forbes, че планира да създаде собствен модел и да го комбинира с настоящия по-малък модел за преводи за постигането на по-добри резултати. За тази цел DeepL изгражда свои собствени изчислителни ресурси за обучаване на AI модели, използвайки центъра за данни на Nvidia в Швеция. “Генеративният изкуствен интелект е огромна възможност”, казва той. “Той ще ни позволи да изграждаме отделни функции в добавка към преводите, където преводачът става по-интерактивен или по-диалогичен с вас”.