Изкуственият интелект започна да предсказва съдбата на хората и времето на смъртта им
Моделът е създаден за обработка на последователности като текст на естествен език
Модел на изкуствен интелект, обучен на базата на данни от дългогодишно наблюдение на 6 милиона датчани, е в състояние точно да предскаже важни събития в живота на хората до датата на тяхната смърт. Точността на прогнозите може да се подобри още повече, като към данните се добавят видеоклипове, кореспонденция и социални връзки. Но първо трябва да се реши етичен въпрос.
Съвместен проект на изследователи от Университета в Копенхаген (Дания) и Североизточния университет в Бостън (САЩ) показа, че модел за машинно обучение от типа "трансформатор" може да се използва за предсказване на събития в живота на хората.
Моделът е създаден за обработка на последователности като текст на естествен език. Той се различава от други модели по по-мащабното паралелизиране на задачите и не изисква последователност при анализа на данните. Оказа се, че той успешно организира данните и предсказва какво ще се случи в живота на даден човек и дори е в състояние да посочи приблизителното време на смъртта. Нещо повече, новият модел превъзхожда всички създадени преди това подобни модели по отношение на точността при предсказване на поведението на даден човек и времето на смъртта му.
Статията "Използване на последователност от житейски събития за предсказване на човешкия живот" с описание на модела life2vec, създаден в експеримента въз основа на данни за 6 милиона датчани, е публикувана в списание Nature Computational Science. Той е също така свободно достъпен на agXiv.org.
"Използвахме модела, за да отговорим на един фундаментален въпрос. До каква степен можем да предскажем събитията във вашето бъдеще въз основа на условията и събитията във вашето минало? От научна гледна точка ние се интересуваме не толкова от самото предсказване, колкото от нюансите в информацията, които позволяват на модела да дава толкова точни отговори" - посочва Суне Леман, професор от ДТУ и първи автор на статията.
Авторите на статията използват последователността на събитията в живота на хората по начин, подобен на начина, по който едно изречение се изгражда от думи. По тази причина е използван моделът Transformer, който е създаден за анализ на текстове. В същото време моделът работи, като отчита известни социални закономерности и наблюдения, въз основа на които не само изкуственият интелект, но и обикновените специалисти могат да правят заключения за по-нататъшния житейски път на даден човек въз основа на неговото местоживеене, професия, социален статус, пол, навици и медицински досиета (посещения при лекари).
Данните за обучението на модела life2vec са взети от информация за пазара на труда и данни от Националния регистър на пациентите (НРП) и Статистическата служба на Дания. Наборът от данни включва информация за всички 6 милиона датчани и съдържа информация за доходите, заплатите, стипендиите, вида на работата, отрасъла, социалните придобивки и др. Наборът от медицински данни включва записи за посещенията при доставчици на здравни услуги или в болници, диагнозата, вида на пациента и колко внезапно или спешно е било повикването за здравна помощ. Данните за модела са представени за периода 2008-2020 г., въпреки че за ограничена възрастова група са взети данни за периода 2008-2016 година.
Авторите на изследването отбелязват, че има много етични въпроси, на които трябва да се отговори, преди подобен модел да може да се използва пълноценно за социални цели. В същото време те подчертават, че широко разпространените механизми за оценка на целевата аудитория за реклама не научават много по-малко за хората и това вече се използва. Така че няма нищо лошо, ако моделът може да предвиди някакво негативно събитие в живота на конкретен човек, което може да бъде избегнато по един или друг начин. Между другото, датата на смъртта моделът предсказва с точност до четири години.
Според изследователите следващата стъпка ще бъде да се включат в модела и други видове информация, като например текст и изображения или информация за нашите социални взаимоотношения. Това използване на данни открива изцяло нов интерфейс между социалните и здравните науки.