Микрософт научил ИИ понимать, что происходит на видео

ИИ посмотрел «Друзей», «Как я встретил вашу маму» и немного YouTube.

Микрософт научил ИИ понимать, что происходит на видео

😒 Проблема: искусственный интеллект не очень умён. Например, не может сказать, какое утверждение о видео верно, а какое неверно.

😮 И тут научили ИИ понимать контекст видео, исходя из сложного массива информации — видео и текста.

🙂 Как научили: взяли реальных людей, заставили их смотреть 30-секундные нарезки видео с субтитрами и пояснять коротко, что там происходит в сто пятой серии «Санта-Барбары». Получили огромный массив информации. ИИ всё посмотрел, проанализировал и научился.

👥 Кто: Microsoft и ученые из Калифорнийского университета.

😎 И что: теперь можно создавать ИИ-софт, который сможет безошибочно транскрибировать встречи, понимая как визуальную информацию, так и текстовую.

👉 Почитать: https://arxiv.org/pdf/2003.11618.pdf

Через год — лучше работа, выше зарплата
В «Яндекс Практикуме» становятся разработчиками с нуля. Выберите язык — веб, Python, Java, C++ — и учитесь. Джуны зарабатывают от 80 000 ₽, мидлы — от 150 000 ₽. Дальше — программы трудоустройства и компенсация, если пойдёте в Яндекс.
Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата
Вам может быть интересно
Зацените: роботы готовят хот-доги, но пока без кетчупа
Зацените: роботы готовят хот-доги, но пока без кетчупа

И горчицу мы не получим.

Изобрели: наноматериал, который может предупреждать о травмах и болезнях на ранней стадии
Изобрели: наноматериал, который может предупреждать о травмах и болезнях на ранней стадии

Он делает выводы, измеряя температуру тела.

ИИ предсказывает эпилептический припадок за час до первых признаков
ИИ предсказывает эпилептический припадок за час до первых признаков

Точность предсказания припадка — 99%.

Linux портировали на Sega Mega Drive спустя 38 лет после выхода консоли
Linux портировали на Sega Mega Drive спустя 38 лет после выхода консоли

У портов DOOM появился конкурент

easy
Локальный ИИ Qwen 3.6 почти догнал GPT-5 в кодинге
Локальный ИИ Qwen 3.6 почти догнал GPT-5 в кодинге

Вот это рывок

easy
Higgsfield показал в Москве ИИ-фильм за $500 000 — его сделали всего за две недели
Higgsfield показал в Москве ИИ-фильм за $500 000 — его сделали всего за две недели

Будущее кино уже здесь

easy
Новую ИИ-капчу от Google удалось обмануть обычным стоковым фото

Как же это забавно

От $411 млрд до $3 за гигабайт — как подешевела память за 70 лет
От $411 млрд до $3 за гигабайт — как подешевела память за 70 лет

И даже текущий дефицит не сильно испортил картину

easy
OpenAI представила GPT-5.6: три модели и ограниченный запуск
OpenAI представила GPT-5.6: три модели и ограниченный запуск

Доступ ограничили из-за властей США

easy