Сделали систему, которая чистит «грязные» данные в таблицах

Напачкают, потом убирай за ними.

Сделали систему, которая чистит «грязные» данные в таблицах

😢 Проблема: очистка данных в таблицах может занять четверть рабочего времени аналитика. Автоматизировать эту задачу сложно, потому что для разных наборов данных требуются разные типы очистки. Кроме того, часто необходимо рассуждать об объектах, опираясь на кругозор, которого нет у нейросетей.

😎 Решение: PClean — система, которая сочетает знания о предметной области с базовым уровнем практических суждений для автоматической очистки баз данных от миллионов записей. Она автоматически убирает опечатки, повторы, пропущенные значения, орфографические ошибки и несоответствия в данных. 

Пользователь предоставляет системе базовые знания о предмете и информацию о возможных ошибках, а PClean объединяет эти знания с помощью вероятностных рассуждений и наводит в данных порядок. Технология упрощает и удешевляет объединение беспорядочных несовместимых баз данных в чистые записи.

👨‍🔬 Кто: инженеры Массачусетского технологического института.

Источник: Tech Xplore

Получите ИТ-профессию
В «Яндекс Практикуме» можно стать разработчиком, тестировщиком, аналитиком и менеджером цифровых продуктов. Первая часть обучения всегда бесплатная, чтобы попробовать и найти то, что вам по душе. Дальше — программы трудоустройства.
Получите ИТ-профессию Получите ИТ-профессию Получите ИТ-профессию Получите ИТ-профессию
Вам может быть интересно
«Браслет тишины» запретит смарт-устройствам подслушивать
«Браслет тишины» запретит смарт-устройствам подслушивать

Так им!

«Алиса» научилась расшифровывать и переводить текст
«Алиса» научилась расшифровывать и переводить текст

Не только говорит, но и делает.

«Вконтакте» запустил конкурс мини-приложений. Призовой фонд — 2 млн
«Вконтакте» запустил конкурс мини-приложений. Призовой фонд — 2 млн

ВКонтакте проводит конкурс приложений, созданных на платформе VK Mini Apps.

Технодурка: голосовой помощник, который работает без интернета и API
Технодурка: голосовой помощник, который работает без интернета и API
[Почитайте] как сайты манипулируют пользователями, чтобы собирать больше данных
[Почитайте] как сайты манипулируют пользователями, чтобы собирать больше данных
ИИ восстанавливает размытые фотографии
ИИ восстанавливает размытые фотографии

Но лучше бы он этого не делал.

Инженер запустил Doom на ёлочной игрушке
Инженер запустил Doom на ёлочной игрушке
Сделали пластырь, который следит за артериальным давлением
Сделали пластырь, который следит за артериальным давлением

Умный пластырь.

Дипфейк недели — нейросеть заменила актрису из «Ведьмака» на игрового персонажа
Дипфейк недели — нейросеть заменила актрису из «Ведьмака» на игрового персонажа

Вот что бывает, когда недовольный фанат садится за компьютер.