Безлика армія робітників навчає моделі ШІ

Однією з нових вакансій, створених у результаті революції штучного інтелекту, є робота спеціалістів зі збагачення даних, яким доручено позначати великі набори даних, які використовуються для навчання моделей штучного інтелекту.

Багато було зроблено про те, щоб OpenAI збирав Інтернет для створення великих мовних моделей (LLM), які є основою ChatGPT.

Однак після збору цих даних успіх чи невдача LLM залежить від того, наскільки чистими та точними є дані.

Це вимагає людського втручання у вигляді тисяч підрядників зі збагачення даних, яких наймають для маркування та класифікації інформації, щоб покращити кінцевий результат генеративних інструментів ШІ.

Один із таких співробітників, Олексій Савре, сказав: «Ви можете розробляти будь-які нейронні мережі, які хочете, ви можете залучати всіх дослідників, яких хочете, але без міток у вас немає ChatGPT. У вас нічого немає».

Робота зі збагачення даних часто є низькооплачуваною, оскільки не потребує спеціальної підготовки чи наукового ступеня.

Хоча робота, безсумнівно, забезпечила новий тип широкодоступної роботи, оплата зазвичай погодинна без будь-яких переваг і вимагає довгих годин повторюваних завдань.

Кілька років тому Time опублікував статтю, в якій розповідалося, як OpenAI передала навчання Sama, компанії в Сан-Франциско, яка покладалася на десятки працівників у Кенії, Уганді та Індії для позначення графічних зображень сексуального насильства над дітьми, зоофілії, вбивств, самогубств, катування, самоушкодження та інцест.

Робітникам платили від 1,20 до 2 доларів на годину, щоб вони позначали ці графічні зображення, щоб допомогти навчити ChatGPT розпізнавати речі, які засмучують.

Відкриття цих зображень вплинуло на цих працівників, і зрештою Sama скасував свій контракт з OpenAI і більше не виконує таку роботу.

Некомерційна наглядова група The Partnership on AI опублікувала низку вказівок із описом безпечного робочого середовища для працівників із збагачення даних.

Наразі лише DeepMind від Google погодився дотримуватися цих вказівок для майбутнього персоналу з навчання.

vetal12v

Recent Posts

Seagate BarraCuda проти WD Blue (відмінності, плюси, мінуси)

Внутрішні жорсткі диски пройшли довгий шлях за десятиліття, пропонуючи більше місця для зберігання, швидкість і…

4 години ago

Як отримати Snapchat на ПК без BlueStacks (все, що потрібно знати)

BlueStacks більше не запускатиме Snapchat. Що сталося? Доступ до мобільних додатків через звичайний комп’ютер складний…

2 дні ago

Чи потрібен мені ноутбук (10 причин, чому вам може бути)

Ноутбук – це, як правило, невеликий портативний настільний комп’ютер, який переважно використовується в офісах і…

2 дні ago

FAA закриває розслідування Blue Origin, але ракети все ще приземлені

(Фото Chip Somodevilla/Getty Images) Blue Origin, ракетна компанія, заснована Джеффом Безосом, залишається припиненою, незважаючи на…

3 дні ago

Чи законний Newegg (плюси, мінуси, повний огляд)

З початком пандемії покупки в Інтернеті стали невід’ємною частиною нашого життя. Чудово, що людям стало…

3 дні ago

OpenAI проводить першу в історії конференцію розробників для ChatGPT

Останнім часом ширяться чутки про те, що OpenAI має тенденцію до зниження, і людям набридає…

4 дні ago