Безлика армія робітників навчає моделі ШІ

Однією з нових вакансій, створених у результаті революції штучного інтелекту, є робота спеціалістів зі збагачення даних, яким доручено позначати великі набори даних, які використовуються для навчання моделей штучного інтелекту.

Багато було зроблено про те, щоб OpenAI збирав Інтернет для створення великих мовних моделей (LLM), які є основою ChatGPT.

Однак після збору цих даних успіх чи невдача LLM залежить від того, наскільки чистими та точними є дані.

Це вимагає людського втручання у вигляді тисяч підрядників зі збагачення даних, яких наймають для маркування та класифікації інформації, щоб покращити кінцевий результат генеративних інструментів ШІ.

Один із таких співробітників, Олексій Савре, сказав: «Ви можете розробляти будь-які нейронні мережі, які хочете, ви можете залучати всіх дослідників, яких хочете, але без міток у вас немає ChatGPT. У вас нічого немає».

Робота зі збагачення даних часто є низькооплачуваною, оскільки не потребує спеціальної підготовки чи наукового ступеня.

Хоча робота, безсумнівно, забезпечила новий тип широкодоступної роботи, оплата зазвичай погодинна без будь-яких переваг і вимагає довгих годин повторюваних завдань.

Кілька років тому Time опублікував статтю, в якій розповідалося, як OpenAI передала навчання Sama, компанії в Сан-Франциско, яка покладалася на десятки працівників у Кенії, Уганді та Індії для позначення графічних зображень сексуального насильства над дітьми, зоофілії, вбивств, самогубств, катування, самоушкодження та інцест.

Робітникам платили від 1,20 до 2 доларів на годину, щоб вони позначали ці графічні зображення, щоб допомогти навчити ChatGPT розпізнавати речі, які засмучують.

Відкриття цих зображень вплинуло на цих працівників, і зрештою Sama скасував свій контракт з OpenAI і більше не виконує таку роботу.

Некомерційна наглядова група The Partnership on AI опублікувала низку вказівок із описом безпечного робочого середовища для працівників із збагачення даних.

Наразі лише DeepMind від Google погодився дотримуватися цих вказівок для майбутнього персоналу з навчання.

vetal12v

Recent Posts

Чому мій TikTok не отримує переглядів (15 причин, виправлення)

Раптове зниження кількості переглядів може засмучувати, особливо якщо ви як творець маєте значну кількість переглядів.…

4 години ago

Скільки порушень призведе до блокування користувача в TikTok (оновлено 2023)

Кожна платформа соціальних медіа прагне запровадити Умови обслуговування (TOS), щоб зробити Інтернет чистим і дружнім…

13 години ago

Rite Aid заборонено використовувати технологію розпізнавання обличчя

Федеральна торгова комісія (FTC) заборонила аптечній мережі Rite Aid використовувати технологію розпізнавання облич протягом п'яти…

22 години ago

Що станеться, якщо ваше джерело живлення надто слабке (7 речей)

Загальноприйнятою порадою щодо блоків живлення є те, що потрібно вашій системі. Багато експертів рекомендують купувати…

2 дні ago

Чи прискорює дефрагментація ваш комп’ютер (пояснення)

Комп'ютерний світ сповнений міфів, у яких є частка правди. Однак багато з цих істин уже…

3 дні ago

Як ШІ рятує слонів від браконьєрів

Іноді засоби масової інформації зосереджуються на всьому негативному, що представляє штучний інтелект, і легко забути,…

4 дні ago