Поддержать команду Зеркала
Беларусы на войне
  1. Скандальный функционер и сенатор Басков в прошлом году занялся новым бизнесом. Что сейчас с сетью и как она расширяется
  2. Умер старейший католический иерарх Беларуси епископ Казимир Великоселец
  3. Россия имитирует новое наступление на севере Украины — ISW
  4. Один из самых известных беларусских актеров стал водителем автобуса в Польше
  5. Лукашенко говорил, на что можно потратить деньги, сэкономленные на освещении. Стали известны подробности этих планов
  6. Протасевич рассказал, как работа в КГБ помогает ему на провластном телеканале
  7. Доллар переходит в стадию роста: какими будут курсы в феврале? Прогноз по валютам
  8. Популярная блогерка из Минска работает в Израиле уборщицей и рассказывает, сколько получает
  9. Крупная IT-компания увольняет 23% команды в Польше. Значительная часть сотрудников офиса — беларусы, релоцированные в 2022 году
  10. «Народ начал подуспокаиваться». Глава КГК рассказал о «нехорошей тенденции» после взбучки от Лукашенко


/

На прошлой неделе американская технологическая компания OpenAI представила новейшие большие языковые модели искусственного интеллекта, получившие названия o3 и o4-mini. Однако, как показали тесты, обе модели, по-видимому, сделали значительный шаг назад: они склонны придумывать — или галлюцинировать — сильнее, чем их более ранние версии, пишет Naked Science.

Изображение носит иллюстративный характер. Фото: Freepik.com
Изображение носит иллюстративный характер. Фото: Freepik.com

По данным издания TechCrunch, новые модели OpenAI противоречат исторической тенденции, согласно которой каждая новая модель давала все меньше галлюцинаций, чем предыдущая, что позволяет предположить, что OpenAI теперь движется в неверном направлении.

Согласно результатам внутреннего тестирования OpenAI, o3 и o4-mini склонны к галлюцинациям чаще, чем старые модели, включая o1, o1-mini и даже o3-mini. Модель o3 выдала 33% ошибок на тесте точности компании. Это примерно вдвое больше, чем у предыдущих моделей OpenAI. Тогда как o4-mini показала еще более худший результат — 48%.

Хуже того, специалисты компании, похоже, не до конца понимают причины проблем. Согласно их техническому отчету, «необходимы дополнительные исследования, чтобы понять причину» этих ошибок.