Нейронка распознаёт и классифицирует миллионы газет для Библиотеки Конгресса

Можно почитать газеты прошлых веков.

Нейронка распознаёт и классифицирует миллионы газет для Библиотеки Конгресса

🤔 Как обычно: бумажные исторические документы (в том числе газеты) хранятся в архивах. Иногда их сканируют и оцифровывают, но только самые важные из них. Да и потом: когда газету сканируют, получается большая картинка, по которой так просто не поищешь текст.

👍 И тут: С помощью проекта Newspaper Navigator удалось начать оцифровку огромного исторического архива Библиотеки Конгресса. Это газеты, иллюстрации, листовки и прочее. Навскидку архив насчитывает 16 миллионов страниц.

Оцифровка — это не просто сканирование. Это когда алгоритм отличает заголовок от основного текста; связывает текст и иллюстрации; распознаёт буквы и превращает их в сплошной цифровой текст. В общем, почти как веб — только газеты.

👉 Подробнее: news-navigator.labs.loc.gov/

👉 Проект на GitHub: https://github.com/LibraryOfCongress/newspaper-navigator

👉 Скачать исследование: https://arxiv.org/abs/2005.01583

Источник: TechCrunch

Через год — лучше работа, выше зарплата
В «Яндекс Практикуме» становятся разработчиками с нуля. Выберите язык — веб, Python, Java, C++ — и учитесь. Джуны зарабатывают от 80 000 ₽, мидлы — от 150 000 ₽. Дальше — программы трудоустройства и компенсация, если пойдёте в Яндекс.
Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата Через год — лучше работа, выше зарплата
Вам может быть интересно
Изобрели: свеча с дистанционным зажиганием (но не автомобильная)
Изобрели: свеча с дистанционным зажиганием (но не автомобильная)

Для тех, у кого уже всё есть.

Нейронка ведёт деловые переговоры
Нейронка ведёт деловые переговоры

Люди не нужны!

Нейросеть удаляет воду с подводных снимков
Нейросеть удаляет воду с подводных снимков

На фотографиях подводного мира вода искажает цвета растений и местных жителей.

Cloudflare уволит 20% сотрудников и заменит их ИИ
Cloudflare уволит 20% сотрудников и заменит их ИИ

Решили пойти по пути Макйрослопа?

easy
Claude начал массово банить пользователей из России
Claude начал массово банить пользователей из России

И ты, Брут…

easy
Энтузиаст создал «детектор» блокировок Роскомнадзора и DPI-фильтрации
Энтузиаст создал «детектор» блокировок Роскомнадзора и DPI-фильтрации

Во времена с такими пет-проектами живем

easy
Российские компании стали реже нанимать вернувшихся релокантов
Российские компании стали реже нанимать вернувшихся релокантов

Неожиданный поворот

easy
«Кладбище ИИ»: в сети список из 178 ИИ-сервисов, которые закрылись или были поглощены
«Кладбище ИИ»: в сети список из 178 ИИ-сервисов, которые закрылись или были поглощены

Явный признак очередного пузыря

easy
Android получит крупнейшее обновление в истории — его покажут уже 12 мая
Android получит крупнейшее обновление в истории — его покажут уже 12 мая

Заинтриговали

easy