Вышел Grok 4.1 со сниженным уровнем «галлюцинаций»

Кто-то играет в догонялки с ChatGPT

Компания xAI Илона Маска выпустила Grok 4.1 — обновлённую версию своего флагманского ИИ. Модель уже доступна на сайте grok.com, в X и в приложениях для iOS и Android.

По данным xAI, Grok 4.1 стал заметно точнее: уровень «галлюцинаций» снизился почти втрое — с 12,09% до 4,22% по внутренним тестам. В отдельном тесте FActScore (500 биографических вопросов) показатель улучшился с 9,89% до 2,97%.

В рейтинге LMArena модель взяла первое место в режиме quasarflux — 1483 балла Elo, обойдя конкурентов на 31 балл. В более лёгком режиме tensor Grok 4.1 стал вторым.

Чтобы добиться таких результатов, в xAI обновили пост-тренинг модели и усилили контроль качества ответов на фактологические вопросы. Теперь модель автоматически обращается к веб-поиску, если недостаточно уверена в своём ответе.

Изображение: Grok

Редактор:

Екатерина Гришина

Соцсети:

Юлия Зубарева