Вышла Claude Opus 4.8, умеющая признавать свои ошибки

Компания Anthropic представила новую версию своей флагманской модели — Claude Opus 4.8.

Главный акцент релиза был сделан не только на росте производительности, но и на снижение числа «уверенных галлюцинаций». Это когда ИИ делает сомнительные выводы, а подает их как факт.

Claude стал реже «придумывать» результаты

Anthropic утверждает, что Opus 4.8 заметно осторожнее относится к собственным выводам. В компании говорят, что модель теперь чаще помечает неопределенность и реже скрывает ошибки в своем коде или рассуждениях.

По внутренним тестам Anthropic, Opus 4.8 примерно в четыре раза реже пропускает собственные баги без комментариев по сравнению с предыдущей версией. Разработчики описывают это как одно из главных улучшений модели:

В Anthropic считают, что новая версия лучше подходит для длинных агентных задач, где модель должна самостоятельно планировать действия, проверять результаты и работать с большим количеством шагов.

Anthropic выпустила Claude Opus 4.8 — модель научилась признавать свои ошибки — *Источник: Anthropic*

Улучшили кодинг, агентность и большие задачи

Вместе с моделью компания запустила новую функцию Dynamic Workflows для Claude Code. Она позволяет запускать сотни параллельных субагентов внутри одной сессии.

Anthropic приводит пример миграции крупных кодовых баз: Opus 4.8 может самостоятельно разбивать задачу на этапы, выполнять изменения в сотнях тысяч строк кода, запускать тесты и проверять результат перед финальным ответом.

Также пользователям добавили настройку effort control — теперь можно выбирать, сколько вычислительных ресурсов модель тратит на ответ:

low — быстрее и дешевле;
high — баланс качества и скорости;
extra/max — для сложных задач и длинных workflow.

По умолчанию Opus 4.8 работает в high-режиме.

Faster mode стал дешевле

Anthropic также обновила fast mode — ускоренный режим работы модели.

Компания заявляет, что теперь он работает в 2,5 раза быстрее, а стоимость снизилась втрое относительно прошлых версий. Цена обычного режима осталась прежней:

$5 за миллион входящих токенов;
$25 за миллион исходящих.

Fast mode стоит дороже:

$10 за миллион входящих токенов;
$50 за миллион исходящих.

Модель доступна через Claude API и в чат-боте Claude.ai.

Anthropic готовит модель «умнее Opus»

В конце анонса компания подтвердила существование нового семейства моделей в рамках Project Glasswing. Сейчас ограниченный доступ к ним есть только у отдельных организаций в сфере кибербезопасности.

Anthropic утверждает, что эти модели превосходят Opus по уровню интеллекта, но требуют дополнительных защитных механизмов перед публичным запуском. Компания рассчитывает открыть доступ к Mythos-классу моделей уже в ближайшие недели.

ЧИТАЙТЕ НОВОСТИ В ТГ

Нравятся наши новости? Получайте их первыми — мы каждый день отбираем лучшее из всего, что происходит в IT, чтобы вы ничего не пропустили. ССЫЛКА на подписку (можно просто кликнуть) — ждём внутри канала :)

А ещё…сохраните промокод Практикума на любой платный курс: KOD. Он даст скидку при покупке и позволит сэкономить на обучении.

Бесплатные курсы в Практикуме тоже есть — по всем специальностям и направлениям.

Автор: Булат Кармак

Соцсети: Юлия Зубарева