Изтекли документи, получени от 404 Media, разкриват, че технологичният гигант Nvidia тихомълком е събирал астрономически количества видеоданни от YouTube, за да обучи своите модели на изкуствен интелект.

Клиповете са били използвани за задълбочено обучение на модела Cosmos, за алгоритъм за самоуправляваща се кола, както и за дигиталния AI аватар Omniverse.

Nvidia е положила усилия да скрие дейностите си от YouTube, използвайки десетки "виртуални машини", които автоматично променят своите IP адреси, за да избегнат откриването.Така гигантът не е поискал позволение нито от създателите на клиповете, нито от собственика на YouTube - Google.

Само за един ден алгоритмите са били обучавани на видеа с обща продължителност 80 години.

В един от документите, получени от 404, се споменава, че Nvidia съзнателно е обучила своите модели на 130 милиона видеоклипа от YouTube, създадени изрично за академични изследвания.

"Мисля, че има огромна разлика между комерсиализиране на нещо без нечие съгласие", каза Шайн Лонгпре, докторант в MIT Media Lab.

Nvidia се очерта като централен играч в AI индустрията поради пазарното си господство в сегмента на графичните процесори (GPU). Тези чипове стоят в основата на тежки изчислителни системи на AI. Компаниите за изкуствен интелект, включително OpenAI, Microsoft, Meta и - отново - Google, се смятат за клиенти на Nvidia. Това обаче не е попречило на технологичния гигант да "изчегъртва" без позволение съдържание от своите клиенти.

В изявление до 404 Nvidia твърди, че нейните практики за обучение на AI са "в пълно съответствие с буквата и духа на закона за авторското право". 

Главният изпълнителен директор на YouTube Нийл Мохан обаче заяви пред Bloomberg, че използването на данни на YouTube без разрешение е в "явно нарушение" на условията на услугата на платформата.