Google използва своята годишна конференция за разработчици, за да представи това, което компанията определя като най-леките и най-ефективните си модели с изкуствен интелект.

По време на Google I/O компанията представи Gemini 1.5 Flash, най-новото допълнение към поредицата Gemini. В блогпост от Google обявиха, че новият модел може бързо да обобщава разговори, да слага текстове под снимки и видеа и да извлича данни от големи документи и таблици.

“Разработчиците искат нещо по-бързо и дори още по-рентабилно”, заяви Демис Хасабис, главен изпълнителен директор на Google DeepMind.

Представянето идва на фона на пренасочващия се фокус на технологичните компании към генеративния изкуствен интелект (AI) при разработката и пускането на нови продукти, което е от особено значение за Google, защото новите инструменти предоставят на потребителите по-усъвършенствани и креативни начини за достъпване на онлайн информация, в сравнение с традиционното търсене в мрежата.

Конкуренцията 

В понеделник OpenAI представи нов AI модел и десктоп версия на ChatGPT, заедно с нов потребителски интерефейс. Новият модел GPT-4o е два пъти по-бърз от GPT-4 Turbo, а разработването му е струвало наполовина, обявиха от компанията.

От Google наскоро представиха подобрен Gemini 1.5 Pro модел, който може да извади смислен текст от множество големи документи (общо 1 500 страници) или да обобщава 100 имейла, според вицепрезидент на компанията, работещ по Gemini.

Gemini 1.5 Pro скоро ще може да се с справя с едночасово видеосъдържание, или кодови бази с повече от 30 000 реда, заяви Сиси Хсиао, вицепрезидент на Google и генерален мениджър за Gemini.

Най-новата актуализация на OpenAI носи със себе си подобрено качество и скорост и позволява на ChatGPT да се справя с 50 различни езика. Той също така ще бъе наличен през приложно-програмния интерефейс на OpenAI, което ще позволи на разработчиците да започнат да създават приложения използвайки нови модел.

С 35 езика, от Google казват, че Gemini 1.5 Pro поддържа контекстен прозорец от 2 милиона токена. Новия модел е с подобрено мислене, планиране и разбиране на образи, казаха ръководители в компанията.

“Той предоставя най-големия контекстен прозорец измежду всички основни модели досега,” заяви главният изпълнителен директор на Alphabet Сундар Пичай.

По време на събитието той даде пример с родител, който иска от Gemini да обобщи всички имейли в последно време от училището на своето дете.

Gemini 1.5 Pro първоначално ще бъде наличен за тестване в Workspace Labs. Gemini 1.5 Flash ще може да се тества и да се ползва във Vertex AI, платформата за машинно обучение на Google, която позволява на разработчициите да обучават и внедряват AI приложения.