Google оголосила про випуск Google-Extended, щоб надати веб-творцям більше контролю над своїми власними даними та запобігти використанню компанією цих даних для навчання своїх пропозицій генеративного штучного інтелекту.
Google-Extended — це окремий маркер продукту, який веб-видавці можуть використовувати, щоб керувати тим, чи допомагають їхні сайти вдосконалювати генеративні API Bard і Vertex AI, включно з моделями майбутніх поколінь, які забезпечують ці продукти.
Компонент пошукової системи Google використовує Googlebot для сканування та індексування веб-сторінок, але Google також сканував ці веб-сторінки, щоб зібрати дані, які використовуються для навчання моделі штучного інтелекту.
Оскільки Google є пошуковою системою, яку вибирають приблизно 90% усіх користувачів, це змусило багато компаній зробити важкий вибір між тим, щоб їх знайшли клієнти, чи, можливо, спрощенням ШІ для емуляції вашого вмісту.
Це особливо неприємно для компаній з великим обсягом контенту, таких як новинні компанії, такі як The Washington Post або New York Times.
Google-Extended відокремлює роботу свого GoogleBot для ефективного індексування сторінок, дозволяючи компаніям погоджуватися на пошукову індексацію та відмовлятися від навчання ШІ.
OpenAI нещодавно оголосив про подібну функцію відмови.
Це відбувається, оскільки все більше і більше творців контенту приєднуються до колективних позовів, щоб запобігти використанню їхніх матеріалів, захищених авторським правом.
New York Times оновила свої умови використання, щоб запобігти використанню статей для навчання ШІ до того, як Google випустить Google-Extended як опцію.
Що залишається незрозумілим, так це те, як Google, OpenAI та інші видалять і очистять усі знання, які вони вже використали, щоб привести свої двигуни туди, де вони є сьогодні.