Нейронку научили правильно называть органические соединения

Нейронку научили правильно называть органические соединения

😢 Проблема: для названий органических соединений используют международный язык — номенклатуру ИЮПАК. Название должно полностью отражать химическую структуру, поэтому может быть очень громоздким. 

Ошибка даже в одном символе будет критичной, поэтому от химиков требуется внимательность и знание многочисленных правил языка. На рынке есть коммерческие продукты для автоматической генерации названий, но нет программ под свободной лицензией.

😎 Решение:  нейросеть для генерации названий органических соединений. За основу взяли Transformer, нейросеть Google для машинного перевода с одного языка на другой. Для обучения и тестирования использовали самую большую открытую базу PubChem, которая содержит около 100 миллионов соединений.

Созданная примерно за полтора месяца нейросеть способна переводить названия почти с той же точностью, что и алгоритмические решения на базе химических правил.

👨‍💻 Кто: исследователи Сколковского института науки и технологий, МГУ им. М. В. Ломоносова и стартапа Syntelly, Россия.

Источники: skoltech.ru и nature.com

Получите ИТ-профессию
В «Яндекс Практикуме» можно стать разработчиком, тестировщиком, аналитиком и менеджером цифровых продуктов. Первая часть обучения всегда бесплатная, чтобы попробовать и найти то, что вам по душе. Дальше — программы трудоустройства.
Получите ИТ-профессию Получите ИТ-профессию Получите ИТ-профессию Получите ИТ-профессию
Вам может быть интересно
[Посмотрите] первые испытания летающего гоночного беспилотника
[Посмотрите] первые испытания летающего гоночного беспилотника

Новое поколение гоночного спорта.

Google добавит фактчекинг для изображений
Google добавит фактчекинг для изображений

Google продолжает бороться с дезинформацией. На этот раз через картинки.

[Почитайте] как алгоритмы проектируют крутые здания
[Почитайте] как алгоритмы проектируют крутые здания

Алгоритмы не только рисуют логотипы, но и занимаются полезными делами.

Придумали, как очищать сточные воды от токсичных красителей с помощью целлюлозы и света
Придумали, как очищать сточные воды от токсичных красителей с помощью целлюлозы и света
Разработали биочернила для 3D-печати, которые могут самовосстанавливаться
Разработали биочернила для 3D-печати, которые могут самовосстанавливаться
Создали российскую систему распознавания объектов
Создали российскую систему распознавания объектов
Студент создал «третий глаз» для обхода препятствий
Студент создал «третий глаз» для обхода препятствий

Когда глаза действительно полезли на лоб.

В России сделали магнитный сплав из немагнитных порошков
В России сделали магнитный сплав из немагнитных порошков
Пикап Теслы вставили в «Назад в будущее», это забавно
Пикап Теслы вставили в «Назад в будущее», это забавно

«Когда эта крошка разгонится до 88 миль в час, ты такое увидишь...»