Сделали систему, которая чистит «грязные» данные в таблицах

Напачкают, потом убирай за ними.

Сделали систему, которая чистит «грязные» данные в таблицах

😢 Проблема: очистка данных в таблицах может занять четверть рабочего времени аналитика. Автоматизировать эту задачу сложно, потому что для разных наборов данных требуются разные типы очистки. Кроме того, часто необходимо рассуждать об объектах, опираясь на кругозор, которого нет у нейросетей.

😎 Решение: PClean — система, которая сочетает знания о предметной области с базовым уровнем практических суждений для автоматической очистки баз данных от миллионов записей. Она автоматически убирает опечатки, повторы, пропущенные значения, орфографические ошибки и несоответствия в данных. 

Пользователь предоставляет системе базовые знания о предмете и информацию о возможных ошибках, а PClean объединяет эти знания с помощью вероятностных рассуждений и наводит в данных порядок. Технология упрощает и удешевляет объединение беспорядочных несовместимых баз данных в чистые записи.

👨‍🔬 Кто: инженеры Массачусетского технологического института.

Источник: Tech Xplore

Через год — лучше работа, выше зарплата
В «Яндекс Практикуме» становятся разработчиками с нуля. Выберите язык — веб, Python, Java, C++ — и учитесь. Джуны зарабатывают от 80 000 ₽, мидлы — от 150 000 ₽. Дальше — программы трудоустройства и компенсация, если пойдёте в Яндекс.
Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата
Вам может быть интересно
«Алиса» научилась расшифровывать и переводить текст
«Алиса» научилась расшифровывать и переводить текст

Не только говорит, но и делает.

«Браслет тишины» запретит смарт-устройствам подслушивать
«Браслет тишины» запретит смарт-устройствам подслушивать

Так им!

«Вконтакте» запустил конкурс мини-приложений. Призовой фонд — 2 млн
«Вконтакте» запустил конкурс мини-приложений. Призовой фонд — 2 млн

ВКонтакте проводит конкурс приложений, созданных на платформе VK Mini Apps.

DeepSeek V4 Preview вышла и оказалась лучшим ИИ в математике и коде среди open source моделей
DeepSeek V4 Preview вышла и оказалась лучшим ИИ в математике и коде среди open source моделей

Есть Pro и Flash версии

easy
OpenAI представила GPT-5.5 с агентными функциями — ИИ все меньше нуждается в человеке
OpenAI представила GPT-5.5 с агентными функциями — ИИ все меньше нуждается в человеке

Ждем ответа от Claude

easy
ИИ уместили в 25 КБ и запустили на компьютере Commodore 1982 года
ИИ уместили в 25 КБ и запустили на компьютере Commodore 1982 года

Это как DOOM на калькуляторе, только круче

easy
Claude Code теперь можно использовать бесплатно — прокси на GitHub подменяет платное API
Claude Code теперь можно использовать бесплатно — прокси на GitHub подменяет платное API

Как неожиданно и приятно

easy
Вышла Ubuntu 26.04 LTS с Linux 7.0, GNOME 50 и нативной поддержкой ARM-чипов
Вышла Ubuntu 26.04 LTS с Linux 7.0, GNOME 50 и нативной поддержкой ARM-чипов

Есть даже постквантовая защита

easy
Claude Code пропал из подписки Pro за $20 у части пользователей

Им за доступ к ИИ-агенту придется платить по $100 в месяц

easy