OpenAI оголошує про зміни у внутрішньому моніторингу безпеки

Нещодавно OpenAI оголосила про кардинальні зміни в системі моніторингу безпеки компанії, включаючи призначення групи систем безпеки, якій доручено постійно оцінювати ChatGPT та інші пропозиції компанії. Ця команда приєднується до двох існуючих команд: Superalignment, яка зосереджена на потенціалі загального ШІ та суперінтелектуальних систем, і Preparedness, яка зосереджена на безпеці в так званих «передових моделях» ШІ. Команда Safety Systems має право накладати вето на рішення та навіть закривати випуски продуктів, які вважаються небезпечними, і можуть перекрити корпоративне керівництво, включаючи генерального директора Сема Альтмана. Зміни відбулися після хвилювань серед керівників компанії, які призвели до спроби правління звільнити Альтмана. Після того, як персонал компанії та інвестори повстали проти вигнання, Альтман був відновлений на посаді.

>Хоча, як повідомляється, багато факторів призвели до спроби правління змінити режим, одними з ключових тем були ідея безпеки штучного інтелекту та зростаюча влада Альтмана розширювати межі технології. Нова команда систем безпеки буде розділена на чотири частини:

  • Техніка безпеки: зосереджена на проектуванні архітектури, яка сприяє забезпеченню безпеки та контролю в масштабі
  • Дослідження безпеки моделі: зосереджено на створенні безпечніших LLM, які моделюють основні цінності компанії
  • Safety Reasoning Research: зосереджено на розробці етичних стандартів для навчання LLM
  • Взаємодія людини та штучного інтелекту: зосереджено на розробці розроблених людьми політик, на яких можна навчати моделі ШІ

За допомогою цієї нової структури компанія сподівається подолати поширені страхи щодо майбутнього ШІ та його продуктів. Як зазначено в блозі компанії, «існує делікатний компроміс між безпечною поведінкою та корисністю моделі». Хоча створення команди Safety Systems є принаймні визнанням ризиків, цей крихкий баланс включає багато етичних запитань, які залишаються без відповіді та залишатимуться викликом у наступні роки.

vetal12v

Recent Posts

Карти Google додають більше можливостей користувача для відстеження місцезнаходження

Google запустив оновлення для свого популярного додатка Maps, яке дозволяє користувачам зберігати історію місцезнаходжень безпосередньо…

1 день ago

Як довго працюють жорсткі диски WD Blue (пояснення)

Western Digital є авторитетним брендом серед виробників HDD та SSD. WD Blue є одним із…

2 дні ago

Як переглянути журнали Dropbox (оновлено 2023)

Dropbox, як сервіс, чудово підходить для синхронізації ваших файлів і папок між пристроями та членами…

3 дні ago

Apple Music перестає відтворюватися (причини, вирішення)

Хоча Apple має репутацію високоякісних продуктів і послуг, бувають випадки, коли у неї виникають проблеми.…

3 дні ago

ШІ прискорює генеалогічні дослідження

Однією із загальних переваг штучного інтелекту є його здатність отримувати величезну кількість даних за допомогою…

4 дні ago

Anthropic шукає додаткові 750 мільйонів доларів інвестицій

(Фото Ноа Бергера/Getty Images для Amazon Web Services) Стартап зі штучним інтелектом Anthropic знаходиться на…

4 дні ago