Alibaba представила Qwen3.7-Max — модель за 1,5 дня ускорила GPU-ядро в 10 раз

Звучит как заявка на лидерство

Alibaba представила Qwen3.7-Max — модель за 1,5 дня ускорила GPU-ядро в 10 раз

Alibaba показала Qwen3.7-Max — новый флагман линейки Qwen. Новинка заточена под длинные агентные задачи и многошаговое планирование.

Главный пример из презентации звучит почти как реклама AGI: модель за 34,7 часа самостоятельно сделала 1158 вызовов утилит и в процессе в 10 раз ускорила GPU-ядро SGLang Triton Kernel. Это компонент популярной open-source библиотеки для инференса больших моделей.

На той же задаче другие ИИ-модели показали более скромные результаты: DeepSeek V4 Pro ускорил ядро в 3,3 раза, Kimi K2.6 — в 5 раз, а GLM 5.1 — в 7,3 раза.

Модель учили работать как «агент»

В Alibaba говорят, что Qwen3.7-Max обучали более чем на 8200 разных окружениях. Внутри них модель тренировалась разбивать задачи на этапы, вызывать внешние инструменты и анализировать ответы.

Компания утверждает, что увеличение числа окружений почти линейно улучшило результаты на агентских бенчмарках. По внутренней статистике Alibaba, базовая версия модели занимала девятое место, а финальная поднялась до третьего.

Qwen обошла Claude на ряде тестов

На 12 выбранных Alibaba публичных бенчмарках модель лидирует почти везде.

Например, на Terminal-Bench 2.0 для агентского кодинга в терминале Qwen3.7-Max набрала 69,7 балла против 65,4 у Anthropic Claude Opus 4.6 Max Thinking. На SWE-bench Pro — 60,6 против 57,3, а на MCP-Atlas для работы с MCP-серверами — 76,4 против 75,8.

Правда, здесь есть нюанс. Alibaba не включила в сравнение некоторые более свежие версии конкурентов. Например, Claude Opus 4.7 уже показывает 69,4% в Terminal-Bench 2.0 — почти полный паритет. А GPT-5.5 вообще уходит далеко вперед с результатом 82,7%.

Открытых весов снова не будет

Qwen3.7-Max уже доступна бесплатно в чат-боте Alibaba и через API.

Цены:

  • $2,5 за миллион входящих токенов;
  • $7,5 за миллион исходящих токенов.

При этом открытые веса компания публиковать не планирует — как и в случае с предыдущими Max-версиями Qwen.

ЧИТАЙТЕ НОВОСТИ В ТГ

Нравятся наши новости? Получайте их первыми — мы каждый день отбираем лучшее из всего, что происходит в IT, чтобы вы ничего не пропустили. ССЫЛКА на подписку (можно просто кликнуть) — ждём внутри канала :)

А ещё…сохраните промокод Практикума на любой платный курс: KOD. Он даст скидку при покупке и позволит сэкономить на обучении.

Бесплатные курсы в Практикуме тоже есть — по всем специальностям и направлениям.

Соцсети: Юлия Зубарева
Вам может быть интересно
easy
[anycomment]
Exit mobile version