Cloudflare стартира инструмент за борба с ботове, които събират данни за изкуствен интелект
Услугата ще изготвя ръчно черен списък на ботовете с изкуствен интелект
Cloudflare, доставчика на облачни услуги за предоставяне на DNS и защита от DDoS, представи ново решение за борба с ботове за изкуствен интелект, които неоторизирано събират данни от уебсайтове. Новият безплатен инструмент ще защитава уебсайтовете, хоствани в платформата на Cloudflare, от извличане на съдържанието им за обучение на модели на изкуствен интелект.
Въпреки че някои големи играчи в областта на изкуствения интелект като Google, OpenAI и Apple позволяват на собствениците на сайтове да блокират ботове чрез специален файл robots.txt, не всички собственици на такива ботове спазват тези правила. Cloudflare отбелязва, че някои компании за ИИ умишлено заобикалят ограниченията за достъп до съдържание, като постоянно адаптират и променят алгоритмите си, за да избегнат откриване.
За да се справи с този проблем, Cloudflare анализира трафика и разработи автоматични модели за откриването им, които отчитат различни фактори, включително и ботове, които се опитват да имитират действията на човек, използващ уеб браузър. Тя е създала и специален формуляр за докладване на подозрителни ботове и скенери. Въз основа на данните Cloudflare ще изготвя ръчно черен списък на ботовете с изкуствен интелект.
Въпросът за събирането на данни от ботове с изкуствен интелект стана особено актуален на фона на бума на генеративния изкуствен интелект. Много сайтове се опасяват, че доставчиците на ИИ ще използват тяхното съдържание без разрешение или каквато и да е компенсация. Според проучване около 26% от 100-те най-големи новинарски сайта са блокирали бота на OpenAI, а 242 сайта от първите 1000 в момента блокират и GPTBot. Друго проучване установи, че повече от 600 големи издатели на новини вече са блокирали различни ботове.
Тъй като много ботове с изкуствен интелект пренебрегват правилата, описани в robots.txt, трябва да се търсят нови методи за решаване на проблема. Инструменти като разработката на Cloudflare могат да помогнат в борбата срещу неразрешеното събиране на данни. Но времето ще покаже колко ефективни ще бъдат те.