Безлика армія робітників навчає моделі ШІ

Однією з нових вакансій, створених у результаті революції штучного інтелекту, є робота спеціалістів зі збагачення даних, яким доручено позначати великі набори даних, які використовуються для навчання моделей штучного інтелекту.

Багато було зроблено про те, щоб OpenAI збирав Інтернет для створення великих мовних моделей (LLM), які є основою ChatGPT.

Однак після збору цих даних успіх чи невдача LLM залежить від того, наскільки чистими та точними є дані.

Це вимагає людського втручання у вигляді тисяч підрядників зі збагачення даних, яких наймають для маркування та класифікації інформації, щоб покращити кінцевий результат генеративних інструментів ШІ.

Один із таких співробітників, Олексій Савре, сказав: «Ви можете розробляти будь-які нейронні мережі, які хочете, ви можете залучати всіх дослідників, яких хочете, але без міток у вас немає ChatGPT. У вас нічого немає».

Робота зі збагачення даних часто є низькооплачуваною, оскільки не потребує спеціальної підготовки чи наукового ступеня.

Хоча робота, безсумнівно, забезпечила новий тип широкодоступної роботи, оплата зазвичай погодинна без будь-яких переваг і вимагає довгих годин повторюваних завдань.

Кілька років тому Time опублікував статтю, в якій розповідалося, як OpenAI передала навчання Sama, компанії в Сан-Франциско, яка покладалася на десятки працівників у Кенії, Уганді та Індії для позначення графічних зображень сексуального насильства над дітьми, зоофілії, вбивств, самогубств, катування, самоушкодження та інцест.

Робітникам платили від 1,20 до 2 доларів на годину, щоб вони позначали ці графічні зображення, щоб допомогти навчити ChatGPT розпізнавати речі, які засмучують.

Відкриття цих зображень вплинуло на цих працівників, і зрештою Sama скасував свій контракт з OpenAI і більше не виконує таку роботу.

Некомерційна наглядова група The Partnership on AI опублікувала низку вказівок із описом безпечного робочого середовища для працівників із збагачення даних.

Наразі лише DeepMind від Google погодився дотримуватися цих вказівок для майбутнього персоналу з навчання.