Anthropic выпустила Claude Opus 4.8 — модель научилась признавать свои ошибки

И это гигантский шаг вперед

Anthropic выпустила Claude Opus 4.8 — модель научилась признавать свои ошибки

Компания Anthropic представила новую версию своей флагманской модели — Claude Opus 4.8. 

Главный акцент релиза  был сделан не только на росте производительности, но и на снижение числа «уверенных галлюцинаций». Это когда ИИ делает сомнительные выводы, а подает их как факт.

Claude стал реже «придумывать» результаты

Anthropic утверждает, что Opus 4.8 заметно осторожнее относится к собственным выводам. В компании говорят, что модель теперь чаще помечает неопределенность и реже скрывает ошибки в своем коде или рассуждениях.

По внутренним тестам Anthropic, Opus 4.8 примерно в четыре раза реже пропускает собственные баги без комментариев по сравнению с предыдущей версией. Разработчики описывают это как одно из главных улучшений модели:

В Anthropic считают, что новая версия лучше подходит для длинных агентных задач, где модель должна самостоятельно планировать действия, проверять результаты и работать с большим количеством шагов.

Anthropic выпустила Claude Opus 4.8 — модель научилась признавать свои ошибки
Источник: Anthropic

Улучшили кодинг, агентность и большие задачи

Вместе с моделью компания запустила новую функцию Dynamic Workflows для Claude Code. Она позволяет запускать сотни параллельных субагентов внутри одной сессии.

Anthropic приводит пример миграции крупных кодовых баз: Opus 4.8 может самостоятельно разбивать задачу на этапы, выполнять изменения в сотнях тысяч строк кода, запускать тесты и проверять результат перед финальным ответом.

Также пользователям добавили настройку effort control — теперь можно выбирать, сколько вычислительных ресурсов модель тратит на ответ:

  • low — быстрее и дешевле;
  • high — баланс качества и скорости;
  • extra/max — для сложных задач и длинных workflow.

По умолчанию Opus 4.8 работает в high-режиме.

Faster mode стал дешевле

Anthropic также обновила fast mode — ускоренный режим работы модели. 

Компания заявляет, что теперь он работает в 2,5 раза быстрее, а стоимость снизилась втрое относительно прошлых версий. Цена обычного режима осталась прежней:

  • $5 за миллион входящих токенов;
  • $25 за миллион исходящих.

Fast mode стоит дороже:

  • $10 за миллион входящих токенов;
  • $50 за миллион исходящих.

Модель доступна через Claude API и в чат-боте Claude.ai.

Anthropic готовит модель «умнее Opus»

В конце анонса компания подтвердила существование нового семейства моделей в рамках Project Glasswing. Сейчас ограниченный доступ к ним есть только у отдельных организаций в сфере кибербезопасности.

Anthropic утверждает, что эти модели превосходят Opus по уровню интеллекта, но требуют дополнительных защитных механизмов перед публичным запуском. Компания рассчитывает открыть доступ к Mythos-классу моделей уже в ближайшие недели.

ЧИТАЙТЕ НОВОСТИ В ТГ

Нравятся наши новости? Получайте их первыми — мы каждый день отбираем лучшее из всего, что происходит в IT, чтобы вы ничего не пропустили. ССЫЛКА на подписку (можно просто кликнуть) — ждём внутри канала :)

А ещё…сохраните промокод Практикума на любой платный курс: KOD. Он даст скидку при покупке и позволит сэкономить на обучении.

Бесплатные курсы в Практикуме тоже есть — по всем специальностям и направлениям.

Соцсети: Юлия Зубарева
Через год — лучше работа, выше зарплата
В «Яндекс Практикуме» становятся разработчиками с нуля. Выберите язык — веб, Python, Java, C++ — и учитесь. Джуны зарабатывают от 80 000 ₽, мидлы — от 150 000 ₽. Дальше — программы трудоустройства и компенсация, если пойдёте в Яндекс.
Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата
Вам может быть интересно
easy