AI моделите не могат да се учат, както го правят хората
След началната фаза на обучение, алгоритмите за изкуствен интелект не могат да се актуализират и да се учат от нови данни
Алгоритмите, които стоят в основата на системите с изкуствен интелект като ChatGPT, не могат да се учат в движение. Това от своя страна принуждава технологичните компании да харчат милиарди долари за обучение на нови модели от нулата. Въпреки че този проблем е известен в индустрията от известно време, ново изследване предполага, че има вграден проблем в начина, по който са проектирани моделите - но може би има начин той да се реши, пише NewScientist.
Повечето AI модели днес са така наречените невронни мрежи, вдъхновени от начина, по който работят мозъците, с процесорни единици, известни като изкуствени неврони.
Обикновено те преминават през различни фази на развитие. Първо, AI се обучава, като неговите изкуствени неврони се финализират от алгоритъм, за да отразяват по-добре даден набор от данни. След това AI може да се използва за отговор на нови данни, като текстови въпроси, например тези, които се въвеждат в ChatGPT. Въпреки това, след като невроните на модела са настроени в обучителната фаза, те не могат да се актуализират и да се учат от нови данни.
Това означава, че повечето големи AI модели трябва да бъдат преобучавани, ако се появят нови данни, което може да бъде изключително скъпо, особено когато тези нови набори от данни се състоят от голяма част от интернет.
Изследователи се питат дали тези модели могат да включат нови знания след началното обучение, което би намалило разходите, но не беше ясно дали те са способни на това.
Сега, Шибханш Дохаре от Университета на Алберта в Канада и неговите колеги са изследвали дали най-често срещаните AI модели могат да бъдат адаптирани да се учат непрекъснато.
Екипът открива, че те бързо губят способността си да учат нови неща, като огромен брой изкуствени неврони се "блокират" на стойност нула след излагане на нови данни.
"Ако мислите за това като за вашия мозък, тогава приемете все едно 90% от невроните ви са мъртви," казва Дохаре. "Просто не остава достатъчно, за да можете да учите."
Дохаре и екипът му първо обучават AI системи с базата данни ImageNet, която се състои от 14 милиона обозначени изображения на прости обекти като къщи или котки. Но вместо да обучават AI веднъж и след това да го тестват, като се опитват да разграничат две изображения няколко пъти, както е стандартно, те преобучават модела след всяка двойка изображения.
Те тестват различни алгоритми за обучение по този начин и установяват, че след няколко хиляди цикъла на преобучение, мрежите изглеждат неспособни да учат и се представят зле, с много "мъртви" неврони, или такива със стойност нула.
Екипът също така обучава AI, за да симулира мравка, която се учи да ходи чрез метод на подкрепящо обучение. Това е често срещан метод, при който AI се учи как изглежда успехът и открива правилата чрез опити и грешки.
Когато се опитват да адаптират тази техника, за да позволят непрекъснато обучение чрез преобучаване на алгоритъма след ходене по различни повърхности, те откриват, че това също води до значителна неспособност за учене.
Този проблем изглежда е присъщ на начина, по който тези системи учат, казва Дохаре, но има възможен начин за заобикаляне.
Изследователите разработват алгоритъм, който случайно активира някои неврони след всеки кръг на обучение, и това изглежда намалява лошото представяне. "Ако един [неврон] е умрял, ние просто го съживяваме," казва Дохаре. "Сега той може да учи отново."
Алгоритъмът изглежда обещаващ, но ще трябва да бъде тестван на много по-големи системи, преди да сме сигурни, че ще помогне, казва Марк ван дер Вилк от Оксфордския университет.
"Решение за непрекъснатото учене буквално е въпрос за милиарди долари", казва той. "Истинско, цялостно решение, което би позволило непрекъснато актуализиране на модел, би намалило значително разходите за обучение на тези модели."