Поддержать команду Зеркала
Беларусы на войне
  1. «Беларусь является союзником России в войне». ISW о том, зачем воздушные шары с беларусской территории атакуют вильнюсский аэропорт
  2. Вернулся в соцсети один из гродненских блогеров, обвиненных в мошенничестве со сбором на лечение ребенка. Вот что он рассказал
  3. Спортсмены меняли имена, команды и изображали судей. Подробности о масштабной схеме договорных матчей, которые транслировались на 1XBET
  4. Лукашенко объяснил, как разговаривает с Кочановой без мобильных телефонов
  5. Литва снова обратится к Минску из-за застрявших фур — на этот раз на более высоком уровне
  6. Литовские фуры отгонят на неработающий погранпереход, где могут применить «все предусмотренные законом меры»
  7. «В следующий раз будешь думать дважды». Электромобиль беларуски «сгорел» на зарядке — по делу вынесли первый в своем роде приговор
  8. Чтобы попасть утром, очередь занимали с вечера. Рассказываем историю магазина, где бывал каждый минчанин и многие беларусы
  9. Милиция грозила «административкой» тем, кто не придет в комиссию по «тунеядцам». Теперь дошло до реального наказания
  10. Трамп назначит специального посланника по Беларуси. Он поблагодарил Лукашенко и анонсировал освобождение политзаключенных
  11. Стало понятно, куда двинется курс доллара в ноябре: прогноз для валют


Чат-боты с искусственным интеллектом ведут себя непредсказуемо и создают риск ядерной эскалации. К такому выводу пришла команда ученых из Стэнфордского университета в ходе недавнего исследования, сообщает New Scientist.

Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash
Снимок носит иллюстративный характер. Источник: Christian Wiediger / Unsplash

В ходе эксперимента они изучали четыре чат-бота с искусственным интеллектом. Это GPT-3.5 и GPT-4 от компании OpenAI, Claude 2 от стартапа Anthropic и Llama 2 от компании Meta.

Этим моделям во время исследования предлагали принять важное решение от имени государства в военной игре. На выбор предлагалось три сценария: вторжение, кибератака и нейтральный без каких-либо конфликтов. В каждом раунде чат-боты с ИИ обосновывали свои дальнейшие возможные действия. Им нужно было выбирать из 27 вариантов развития событий, включая мирные переговоры и агрессивные действия (начиная от «ввести торговые ограничения» и заканчивая «полномасштабной ядерной атакой»).

В игре нейросети показали склонность к агрессивным вариантам. Самой непредсказуемой и жестокой оказалась GPT-4, которая давала бессмысленные объяснения по поводу того, почему посоветовала начать ядерную атаку. В одном случае она ответила, процитировав вступительный текст «Эпизода IV Звездных войн: Новая надежда». В другом — объяснила решение устроить ядерную атаку тем, что просто такое оружие есть в наличии у ее государства.

Ученые отметили, что непредсказуемое поведение и странные объяснения этих моделей вызывают особую тревогу, поскольку это исследование показало, насколько легко можно обойти или устранить защитные меры, которые принимаются, чтобы ИИ не давал вредных советов.