Подобно на историите, нашите животи се развиват като разказ. Всеки един тече по уникален начин с епизоди, които имат сходни заглавия – училище, кариера, нанасяне в нов дом, наранявания, болести. Всяка сюжетна линия, или живот, има начало, средна част и непредсказуем край. 

Днес учени твърдят, че всяка житейска история е хроника на предсказаната смърт.

Използвайки данни от официалните регистри на Дания, които съдържат богата информация за образованието, заплатата, работата, жилищата и посещенията при лекар, те са разработили алгоритъм, който може да предвижда жизнения път на човек, в това число и преждевременна смърт, до голяма степен по същия начин, по който големите езикови модели, като ChatGPT, могат да предвиждат изречения.

Алгоритъмът се представя по-добре от други прогнозни модели, в това число и актюерски таблици, използвани от застрахователната индустрия.

Това, че нашите сложни съществувания могат да бъдат анализирани като части от текст, е едновременно въодушевяващо и притеснително.

Въпреки че знаем, че по-високите доходи са свързани с по-голямата продължителност на живота, свързването на огромни количества данни би могло да разкрие други начини, по които социалните фактори влияят върху здравето.

Това би могло да бъде полезно за политиците, които искат да подобрят шансовете ни да живеем по-дълго и по-здравословно.

Минусът е, че има нещо почти абсурдно ограничаващо в идеята за DeathGPT. Всяко мънисто от огърлицата на живота, като посещаване на лекции, увеличение на заплата и загуба на родител, изглежда прекалено лично, за да захранва предвидим набор от данни.

В епохата на големите масиви от данни обаче, и AI, който да ги събира, ще трябва да приемем, че тези дълбоко усещани качествени преживявания могат да бъдат улавяни количествено по начини, които очертават индивидуални съдби.

Суне Леман от Датския техническия университет, който ръководи изследването, публикувано миналия месец в Nature Computational Science, не намира идеята за объркваща.

“Смятам, че приликата между текст и живота на хората е дълбока и многостранна,” казва той пред FT. “За мен е логично, че нашият алгоритъм може да предвижда следващата стъпка в човешките животи.”

И езикът, и животът представляват последователности. Учени от Университета на Копенахаген и университета Нортийстърн в Бостън използват това сходство.

Първо, те са съставили “речник” на житейските събития, създавайки нещо като синтетичен език и са го използвали, за да конструират “изречения”. Такова просто изречение би могло да бъде: “По време на третата си година в средното училище-интернат Хърмаяни изучаваше пет избирателни предмета.”

Точно както големите езикови модели анализират текст, за да установят отношенията между думите, алгоритъмът life2vec, захранван с реконструираните житейски истории на датчаните от периода 2008 – 2015 г., анализира тези резюмета за сходни връзки.

След това идва моментът за равносметка – колко добре бихме могли да прилагаме това обширно обучение за прогнози за периода 2016 – 2020 г.?

При тестовете на алгоритъма учените анализират извадка от 100 000 души на възраст между 35 и 65 г., за половината от които са знае, че са оцелели, а другата половина са починали през този период.

Когато бъде подканен да познае кои са починалите хора, life2vec дава правилен отговор в 79% от случаите (произволното отгатване дава 50% точност). Алгоритъмът се представя с 11% по-добре от следващите най-добри прогнозни модели, казва Леман.

И докато в доклада се твърди, че “точните индивидуални прогнози наистина са възможни”, алгоритъмът предоставя вероятност от смърт за определен период, а не за точна дата.

Трябва да се уточни, че това, което важи за Дания, може да не важи за други места, а алгоритъмът кодира отклоненията в данните за обучение.

Въпреки това, предвид потенциала му да прави фина настройка на прогнозирането на риска, си струва да се следи влиянието му върху застрахователната индустрия.

От своя страна, изследователите не искат работата им да се използва от застрахователи и засега пазят алгоритъма и данните в тайна.

Те наблягат на факта, че по-въодушевяващото от резултатите е това, че life2vec действа на общ принцип, а не по-конкретни задачи. При съществуващите прогнозни модели изследователите трябва да уточняват предварително важни променливи, като възраст, пол и доходи.

Този подход, от своя страна, поглъща всичките данни и може самостоятелно да се ориентира към съответните фактори (той забелязва, че доходите са с положителен знак за оцеляването, а диагноза, свързана с психическото здраве – с отрицателен).

Това може да насочи изследвателите към неизследвани досега влияния върху здравето и може да разкрие нови връзки между на пръв поглед несвързани модели на поведение.

Едно от засилващите се опасения на Леман е поверителността. Той посочва, че компании, като Google, работят по сходни машини за прогнозиране, използвайки изобилие от лични данни, събрани от интернет.

Това е епоха на несравнима предсказуемост на човешкия живот и епоха на несравнима власт за онези, които могат да прочитат нашата история, преди да сме я изживели.