Продвинутые алгоритмы копирования голоса обманывают алгоритмы распознавания голоса

Продвинутые алгоритмы копирования голоса обманывают алгоритмы распознавания голоса

Кусала жаба гадюку.

😱 Что случилось: SV2TTS и AutoVC — два распространённых алгоритма воспроизведения голоса, которые настолько преисполнились продвинулись вперёд, что теперь могут обманывать алгоритмы распознавания голоса. 

В тестах они смогли обмануть систему распознавания Resemblyzer в половине случаев, Microsoft Azure в 50% случаев, Amazon Alexa — примерно в 62% случаев. 

В исследовании также участвовали 200 добровольцев, но и они чаще не могли понять, где говорит нейронка, а где реальный человек, особенно если образец голоса принадлежал знаменитости.

📺 Посмотреть:

🙂 Кто: исследователи Чикагского университета, США.

Источники: techxplore.com и arxiv.org

Получите ИТ-профессию
В «Яндекс Практикуме» можно стать разработчиком, тестировщиком, аналитиком и менеджером цифровых продуктов. Первая часть обучения всегда бесплатная, чтобы попробовать и найти то, что вам по душе. Дальше — программы трудоустройства.
Получите ИТ-профессию Получите ИТ-профессию Получите ИТ-профессию Получите ИТ-профессию
Вам может быть интересно