Alibaba представила Qwen-Image-2.0 — новую модель генерации изображений, ориентированную на инфографику, постеры и визуалы с большим количеством текста, сообщает Medium.
Модель может генерировать изображения с надписями без типичных ошибок и искажений, а также выбирать стиль шрифта. Поддерживаются подробные текстовые запросы, что позволяет задавать сложную композицию.
Qwen-Image-2.0 умеет создавать инфографику, презентации, плакаты, комиксы и фотореалистичные сцены. Alibaba подчёркивает, что модель лучше справляется с композицией и размещением текста, чем многие конкуренты.
В слепом тестировании на платформе AI Arena модель уступила в генерации только Google Gemini-3-Pro-Image-Preview и OpenAI GPT Image 1.5, а в редактировании — только флагманской версии Gemini.
Фото: Unsplash
