OpenAI оголошує про зміни у внутрішньому моніторингу безпеки

Нещодавно OpenAI оголосила про кардинальні зміни в системі моніторингу безпеки компанії, включаючи призначення групи систем безпеки, якій доручено постійно оцінювати ChatGPT та інші пропозиції компанії.

Ця команда приєднується до двох існуючих команд: Superalignment, яка зосереджена на потенціалі загального ШІ та суперінтелектуальних систем, і Preparedness, яка зосереджена на безпеці в так званих «передових моделях» ШІ.

Команда Safety Systems має право накладати вето на рішення та навіть закривати випуски продуктів, які вважаються небезпечними, і можуть перекрити корпоративне керівництво, включаючи генерального директора Сема Альтмана.

Зміни відбулися після хвилювань серед керівників компанії, які призвели до спроби правління звільнити Альтмана.

Після того, як персонал компанії та інвестори повстали проти вигнання, Альтман був відновлений на посаді.

Хоча, як повідомляється, багато факторів призвели до спроби правління змінити режим, одними з ключових тем були ідея безпеки штучного інтелекту та зростаюча влада Альтмана розширювати межі технології.

Нова команда систем безпеки буде розділена на чотири частини:

  • Техніка безпеки: зосереджена на проектуванні архітектури, яка сприяє забезпеченню безпеки та контролю в масштабі
  • Дослідження безпеки моделі: зосереджено на створенні безпечніших LLM, які моделюють основні цінності компанії
  • Safety Reasoning Research: зосереджено на розробці етичних стандартів для навчання LLM
  • Взаємодія людини та штучного інтелекту: зосереджено на розробці розроблених людьми політик, на яких можна навчати моделі ШІ

За допомогою цієї нової структури компанія сподівається подолати поширені страхи щодо майбутнього ШІ та його продуктів.

Як зазначено в блозі компанії, «існує делікатний компроміс між безпечною поведінкою та корисністю моделі».

Хоча створення команди Safety Systems є принаймні визнанням ризиків, цей крихкий баланс включає багато етичних запитань, які залишаються без відповіді та залишатимуться викликом у наступні роки.

vetal12v

Recent Posts

Чому мій TikTok не отримує переглядів (15 причин, виправлення)

Раптове зниження кількості переглядів може засмучувати, особливо якщо ви як творець маєте значну кількість переглядів.…

5 години ago

Скільки порушень призведе до блокування користувача в TikTok (оновлено 2023)

Кожна платформа соціальних медіа прагне запровадити Умови обслуговування (TOS), щоб зробити Інтернет чистим і дружнім…

14 години ago

Rite Aid заборонено використовувати технологію розпізнавання обличчя

Федеральна торгова комісія (FTC) заборонила аптечній мережі Rite Aid використовувати технологію розпізнавання облич протягом п'яти…

22 години ago

Що станеться, якщо ваше джерело живлення надто слабке (7 речей)

Загальноприйнятою порадою щодо блоків живлення є те, що потрібно вашій системі. Багато експертів рекомендують купувати…

2 дні ago

Чи прискорює дефрагментація ваш комп’ютер (пояснення)

Комп'ютерний світ сповнений міфів, у яких є частка правди. Однак багато з цих істин уже…

3 дні ago

Як ШІ рятує слонів від браконьєрів

Іноді засоби масової інформації зосереджуються на всьому негативному, що представляє штучний інтелект, і легко забути,…

4 дні ago