Вышел Grok 4.1 со сниженным уровнем «галлюцинаций»

Кто-то играет в догонялки с ChatGPT

Вышел Grok 4.1 со сниженным уровнем «галлюцинаций»

Компания xAI Илона Маска выпустила Grok 4.1 — обновлённую версию своего флагманского ИИ. Модель уже доступна на сайте grok.com, в X и в приложениях для iOS и Android.

По данным xAI, Grok 4.1 стал заметно точнее: уровень «галлюцинаций» снизился почти втрое — с 12,09% до 4,22% по внутренним тестам. В отдельном тесте FActScore (500 биографических вопросов) показатель улучшился с 9,89% до 2,97%.

В рейтинге LMArena модель взяла первое место в режиме quasarflux — 1483 балла Elo, обойдя конкурентов на 31 балл. В более лёгком режиме tensor Grok 4.1 стал вторым.

Чтобы добиться таких результатов, в xAI обновили пост-тренинг модели и усилили контроль качества ответов на фактологические вопросы. Теперь модель автоматически обращается к веб-поиску, если недостаточно уверена в своём ответе.

Изображение: Grok

Вам слово

Приходите к нам в соцсети поделиться своим мнением о статье и почитать, что пишут другие. А ещё там выходит дополнительный контент, которого нет на сайте — шпаргалки, опросы и разная дурка. В общем, вот тележка, вот ВК — велком!

Редактор:

Екатерина Гришина

Соцсети:

Юлия Зубарева

Получите ИТ-профессию
В «Яндекс Практикуме» можно стать разработчиком, тестировщиком, аналитиком и менеджером цифровых продуктов. Первая часть обучения всегда бесплатная, чтобы попробовать и найти то, что вам по душе. Дальше — программы трудоустройства.
Вам может быть интересно
easy
[anycomment]
Exit mobile version