Компания xAI Илона Маска выпустила Grok 4.1 — обновлённую версию своего флагманского ИИ. Модель уже доступна на сайте grok.com, в X и в приложениях для iOS и Android.
По данным xAI, Grok 4.1 стал заметно точнее: уровень «галлюцинаций» снизился почти втрое — с 12,09% до 4,22% по внутренним тестам. В отдельном тесте FActScore (500 биографических вопросов) показатель улучшился с 9,89% до 2,97%.
В рейтинге LMArena модель взяла первое место в режиме quasarflux — 1483 балла Elo, обойдя конкурентов на 31 балл. В более лёгком режиме tensor Grok 4.1 стал вторым.
Чтобы добиться таких результатов, в xAI обновили пост-тренинг модели и усилили контроль качества ответов на фактологические вопросы. Теперь модель автоматически обращается к веб-поиску, если недостаточно уверена в своём ответе.
Изображение: Grok
Вам слово
Приходите к нам в соцсети поделиться своим мнением о статье и почитать, что пишут другие. А ещё там выходит дополнительный контент, которого нет на сайте — шпаргалки, опросы и разная дурка. В общем, вот тележка, вот ВК — велком!