😒 Проблема: искусственный интеллект не очень умён. Например, не может сказать, какое утверждение о видео верно, а какое неверно.
😮 И тут научили ИИ понимать контекст видео, исходя из сложного массива информации — видео и текста.
🙂 Как научили: взяли реальных людей, заставили их смотреть 30-секундные нарезки видео с субтитрами и пояснять коротко, что там происходит в сто пятой серии «Санта-Барбары». Получили огромный массив информации. ИИ всё посмотрел, проанализировал и научился.
👥 Кто: Microsoft и ученые из Калифорнийского университета.
😎 И что: теперь можно создавать ИИ-софт, который сможет безошибочно транскрибировать встречи, понимая как визуальную информацию, так и текстовую.
👉 Почитать: https://arxiv.org/pdf/2003.11618.pdf