Езиковият модел GPT-4 се справя по-добре от лекарите в поставянето на диагнози, но в същото време прави и повече грешки. Това показват данните от изследване, цитирано от Forbes. 

В ново проучване учените от Beth Israel Deaconess Medical Center (BIDMC) сравняват способностите за клинична диагностика на езиковия модел, в сравнение с тези на реални лекари.

Изследователите са използвали ревизирания резултат IDEA (r-IDEA), който е често използван инструмент за оценка на клиничните разсъждения.

Проучването включва чатбот, задвижван от GPT-4, 21 лекуващи лекари и 18 резидентни лекари на 20 клинични случая за установяване на диагностични аргументи и работа по тях. След това всичките три групи отговори са оценени с помощта на критериите на r-IDEA. 

Според изследването, чатботът всъщност е получил най-високите резултати на r-IDEA, което е доказателство за впечатляващите му способности по отношение на диагностичните разсъждения. Авторите обаче отбелязват, че в същото време той е допускал и повече грешки. 

Водещият автор на изследването д-р Стефани Кабрал обяснява, че са необходими допълнителни проучвания, за да се определи как езиковите модели могат да бъдат интегрирани най-добре в клиничната практика.

Но дори и сега те могат да бъдат полезни, помагайки на медицинските специалисти да са сигурни, че не пропускат нещо.

Резултатите показват солидни разсъждения от чатбота, но и значителни грешки.

Това допълнително подкрепя идеята, че базираните на изкуствения интелект системи са най-подходящи (поне на сегашните им нива на зрялост) като инструменти за разширяване на лекарската практика, но не биха могли да заменят диагностичните възможности на лекаря. 

И медиците, и инженерите дават обяснение за това - медицинската практика не се основава единствено на алгоритмични резултати от правила, а по-скоро на дълбоко чувство за разсъждение и клинична интуиция, което е трудно да се възпроизведе от езиков модел.

Въпреки това, инструментите от този тип могат да осигурят диагностична или клинична подкрепа и могат да бъдат невероятно мощен актив в работния процес на лекаря. 

Например, ако системите могат разумно да осигурят предложение за първоначална диагноза въз основа на наличните данни, като история на пациента или съществуващи записи, това може да позволи на лекарите да спестят значително време в техния диагностичен процес.

Освен това алгоритмите могат да ускорят работния процес и да подобрят средствата за обработка на голямо количество клинична информация от медицинското досие.

Много организации се възползват от тези потенциални средства за подобряване на клиничната работа. Захранваните с изкуствен интелект технологии за писане, например, използват обработката на естествен език, за да помогнат на лекарите да попълват клиничната документация по-ефективно.

Корпоративните инструменти за търсене се интегрират в организациите и с EMR системите, за да помогнат на лекарите да търсят големи масиви от данни, да насърчат оперативната съвместимост и да съберат повече съществуващи данни за пациентите. 

Други системи могат дори да помогнат да се предложи първоначална диагноза. В областта на радиологията и дерматологията се появяват инструменти, които са в състояние да предложат потенциална диагноза чрез анализиране на качена снимка.

Но има още много работа, която трябва да се свърши, преди AI да се намеси по-сериозно в работата на медиците.