Сделали систему, которая чистит «грязные» данные в таблицах

Напачкают, потом убирай за ними.

Сделали систему, которая чистит «грязные» данные в таблицах

😢 Проблема: очистка данных в таблицах может занять четверть рабочего времени аналитика. Автоматизировать эту задачу сложно, потому что для разных наборов данных требуются разные типы очистки. Кроме того, часто необходимо рассуждать об объектах, опираясь на кругозор, которого нет у нейросетей.

😎 Решение: PClean — система, которая сочетает знания о предметной области с базовым уровнем практических суждений для автоматической очистки баз данных от миллионов записей. Она автоматически убирает опечатки, повторы, пропущенные значения, орфографические ошибки и несоответствия в данных. 

Пользователь предоставляет системе базовые знания о предмете и информацию о возможных ошибках, а PClean объединяет эти знания с помощью вероятностных рассуждений и наводит в данных порядок. Технология упрощает и удешевляет объединение беспорядочных несовместимых баз данных в чистые записи.

👨‍🔬 Кто: инженеры Массачусетского технологического института.

Источник: Tech Xplore

Через год — лучше работа, выше зарплата
В «Яндекс Практикуме» становятся разработчиками с нуля. Выберите язык — веб, Python, Java, C++ — и учитесь. Джуны зарабатывают от 80 000 ₽, мидлы — от 150 000 ₽. Дальше — программы трудоустройства и компенсация, если пойдёте в Яндекс.
Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата
Вам может быть интересно
«Алиса» научилась расшифровывать и переводить текст
«Алиса» научилась расшифровывать и переводить текст

Не только говорит, но и делает.

«Браслет тишины» запретит смарт-устройствам подслушивать
«Браслет тишины» запретит смарт-устройствам подслушивать

Так им!

«Вконтакте» запустил конкурс мини-приложений. Призовой фонд — 2 млн
«Вконтакте» запустил конкурс мини-приложений. Призовой фонд — 2 млн

ВКонтакте проводит конкурс приложений, созданных на платформе VK Mini Apps.

Linux портировали на Sega Mega Drive спустя 38 лет после выхода консоли
Linux портировали на Sega Mega Drive спустя 38 лет после выхода консоли

У портов DOOM появился конкурент

easy
Локальный ИИ Qwen 3.6 почти догнал GPT-5 в кодинге
Локальный ИИ Qwen 3.6 почти догнал GPT-5 в кодинге

Вот это рывок

easy
Higgsfield показал в Москве ИИ-фильм за $500 000 — его сделали всего за две недели
Higgsfield показал в Москве ИИ-фильм за $500 000 — его сделали всего за две недели

Будущее кино уже здесь

easy
Новую ИИ-капчу от Google удалось обмануть обычным стоковым фото

Как же это забавно

От $411 млрд до $3 за гигабайт — как подешевела память за 70 лет
От $411 млрд до $3 за гигабайт — как подешевела память за 70 лет

И даже текущий дефицит не сильно испортил картину

easy
OpenAI представила GPT-5.6: три модели и ограниченный запуск
OpenAI представила GPT-5.6: три модели и ограниченный запуск

Доступ ограничили из-за властей США

easy