Четыре проекта, где Machine Learning приносит пользу
vk f t

Четыре проекта, где Machine Learning приносит пользу

Кроме дип-фейков!

Машинное обучение — одно из направлений в разработке искусственного интеллекта. Про него много говорят, и уже есть первые заметные результаты его работы. Мы собрали проекты, где машинное обучение приносит пользу.

Почти все эти проекты используют Python — оказывается, этот язык идеально подходит для машинного обучения. Про Python у нас есть отдельная статья, и там не только про искусственный интеллект.

Здравоохранение, IBM и Watson

Чтобы сделать мир здоровее, IBM сделал Ватсона. Это нейросеть, которая следит за медицинскими показателями пациентов и на их основе делает выводы об их здоровье. Программа уже работает в нескольких госпиталях и медцентрах, где Ватсон смог распознать рак намного раньше врачей.

Одна из главных проблем в современной медицине — большое количество разрозненных данных о пациенте. Ватсон как раз и занимается тем, что ищет закономерности в данных, которые не видит человек.

Преобразование текста в голос и распознавание речи

В основе технологий распознавания и преобразования речи лежит машинное обучение: система составляет речь из отдельных звуков, которые есть у неё в базе. Чем больше база и примеров произношения — тем точнее преобразование и тем естественнее звучит компьютерная речь. Точно так же работает и распознавание голоса — звук разбивается на отдельные элементы и идёт сопосотавление по буквам.

Так как алгоритмы работают по одному принципу, но в разных направлениях, их часто используют вместе. У Яндекса и у Гугла есть свои голосовые движки, но Яндекс точнее работает с русским языком, а Гугл говорит с заметным акцентом.

С помощью этой технологии можно делать, например, роботизированные автоответчики и автоинформаторы. Можно распознавать данные клиента и сразу заносить их в письменном виде в базу данных. Можно сразу получать протоколы планерок и переговоров. Можно готовить конспекты лекций, записав лектора на диктофон. 

Обратный вариант — озвучивание сайтов и книг для слепых и слабовидящих и создание голосового интерфейса. Главное в них — распознавать команды на слух и отвечать тоже голосом, а это как раз и умеют голосовые движки.

Распознавание лиц

Как говорят специалисты, Face Recognition — самый простой в мире API для распознавания лиц для Python. Точность распознавания — 99,38% в тесте Labeled Faces in the Wild. Тест моделирует реальное использование технологии, смотрит, как она распознаёт людей на фото и даже с экранов телефонов.

Нейросеть работает в режиме реального времени и на лету разпознаёт несколько лиц, одновременно попавших в кадр. Если сюда подключить соцсети, то система сможет распознать каждого, кто входит в магазин. Или может вывести на экран историю прошлых покупок человека и дать рекомендации по продажам.


Восстановление испорченных изображений

Deep-image-prior — программа для  восстановление изображений с помощью нейронных сетей, автор — Дмитрий Ульянов из Сколково. Звучит скучно, но вот, что она умеет:

Ещё по теме