😊 Как работает: алгоритм натренирован на большом датасете фотографий вместе с текстовыми тегами. Каждый тег привязали к определенному объекту на изображении. Потом модель тренировали на базе подписанных изображений, чтобы научить складывать слова в предложения.
✅ Результат: до обновления алгоритм распознавания говорил, например, «серый кот», а теперь — «серый кот с закрытыми глазами».
😎 Зачем: модель уже добавили в Seeing AI — приложение для слабовидящих людей, которые используют его для описания местности и объектов.
👉 Почитать: microsoft.com
Источник: The Next Web