🧐 Что это: Tuplex — новая программная платформа для анализа данных, которая способна почти в сто раз быстрее обрабатывать запросы Python, любимого языка дата-аналитиков. Это делает Tuplex серьёзным конкурентом традиционных платформ Apache Spark и Dask.
Новая платформа не только ускоряет работу, но и по-новому подходит к аномалиям. Если набор данных содержит повреждённые записи или поля не в том формате, Tuplex просто исключает их из обработки, чтобы избежать сбоя. После запуска программы у пользователя появляется возможность исправить обнаруженные аномалии.
📖 Почитать и попробовать: https://tuplex.cs.brown.edu/
📺 Посмотреть презентацию:
👨💻Кто: исследователи Брауновского университета и Массачусетского технологического института, США.
Источники: Brown и Tech Xplore