GPT-5.4 занял первое место на Vibe Code Bench v1.1, по данным Vals.ai. С результатом 67,42%, он обошел предыдущего лидера GPT-5.3 Codex на 5,7 процентных пункта.
На третьем месте оказался Claude Opus 4.6 без режима рассуждений, набравший 57,57%. Бенчмарк оценивает способность модели создавать полноценные веб-приложения от начала до конца по текстовому описанию.
Фото: Unsplash
