Сделали систему, которая чистит «грязные» данные в таблицах

Напачкают, потом убирай за ними.

Сделали систему, которая чистит «грязные» данные в таблицах

😢 Проблема: очистка данных в таблицах может занять четверть рабочего времени аналитика. Автоматизировать эту задачу сложно, потому что для разных наборов данных требуются разные типы очистки. Кроме того, часто необходимо рассуждать об объектах, опираясь на кругозор, которого нет у нейросетей.

😎 Решение: PClean — система, которая сочетает знания о предметной области с базовым уровнем практических суждений для автоматической очистки баз данных от миллионов записей. Она автоматически убирает опечатки, повторы, пропущенные значения, орфографические ошибки и несоответствия в данных. 

Пользователь предоставляет системе базовые знания о предмете и информацию о возможных ошибках, а PClean объединяет эти знания с помощью вероятностных рассуждений и наводит в данных порядок. Технология упрощает и удешевляет объединение беспорядочных несовместимых баз данных в чистые записи.

👨‍🔬 Кто: инженеры Массачусетского технологического института.

Источник: Tech Xplore

Через год — лучше работа, выше зарплата
В «Яндекс Практикуме» становятся разработчиками с нуля. Выберите язык — веб, Python, Java, C++ — и учитесь. Джуны зарабатывают от 80 000 ₽, мидлы — от 150 000 ₽. Дальше — программы трудоустройства и компенсация, если пойдёте в Яндекс.
Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата
Вам может быть интересно
«Алиса» научилась расшифровывать и переводить текст
«Алиса» научилась расшифровывать и переводить текст

Не только говорит, но и делает.

«Браслет тишины» запретит смарт-устройствам подслушивать
«Браслет тишины» запретит смарт-устройствам подслушивать

Так им!

«Вконтакте» запустил конкурс мини-приложений. Призовой фонд — 2 млн
«Вконтакте» запустил конкурс мини-приложений. Призовой фонд — 2 млн

ВКонтакте проводит конкурс приложений, созданных на платформе VK Mini Apps.

Утечка исходников показала, что Claude Code — это полноценная ОС для ИИ
Утечка исходников показала, что Claude Code — это полноценная ОС для ИИ

За это Anthropic и платят

easy
Стартап Cortical Labs создал небольшой дата-центр на базе клеток мозга
Стартап Cortical Labs создал небольшой дата-центр на базе клеток мозга

Но у технологии уже есть скептики

easy
Выявить VPN-трафик на iPhone практически невозможно — Минцифры
Выявить VPN-трафик на iPhone практически невозможно — Минцифры

На Android с этим все гораздо проще

easy
Пользователи Сбера, Т-Банка и ВТБ массово столкнулись со сбоем — что происходит
Пользователи Сбера, Т-Банка и ВТБ массово столкнулись со сбоем — что происходит

И насколько все серьезно

easy
Apple разрешила россиянам менять регион без привязки иностранной карты
Apple разрешила россиянам менять регион без привязки иностранной карты

Даже с активными подписками

easy
Вышел Cursor 3: больше это не IDE, а полноценный центр управления ИИ-агентами
Вышел Cursor 3: больше это не IDE, а полноценный центр управления ИИ-агентами

Это самое крупное обновление проекта за всю историю

easy