Вы можете отправить нам 1,5% своих польских налогов
Беларусы на войне
  1. «Там большое количество контактных лиц». В Солигорске проводят эпидрасследование в связи с заражением гепатитом С
  2. «Я пошутил». Спецпосланник Трампа Джон Коул — о своих словах про Беларусь
  3. Врачи сказали беларусу, что ему осталось жить около двух недель. Рассказываем, как он использовал это драгоценное время
  4. «Калийные удобрения из Беларуси должны идти через Литву». Джон Коул — о снятых с Минска санкциях
  5. «Второго мая посадила картошку, четвертого — посадили меня». Доцент вернулась из Польши помочь маме — и села за поддержку Украины
  6. «Попробуй-ка меня побей прямо сейчас». Бывший сотрудник ГУБОПиК попал за решетку в отряд с политическими
  7. В апреле заработает валютное ограничение. Оно затрагивает население
  8. «Подходы меняются». Почему посланник Трампа позволил себе рассказать непубличные детали переговоров с Лукашенко
  9. Если у вас электрическое отопление жилья, в будущем это может обернуться финансовой ловушкой. Вот почему
  10. Блогер отправил в милицию ИИ-фото людей с бело-красно-белыми флагами в Минске. Через 30 минут там уже были силовики с автоматами
  11. Заплатили 70 долларов. По госТВ заявляли о «сотрудниках», которые снимали марш на День Воли в Вильнюсе, — этих людей нашли


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.