Новость

Нейросети «Яндекса» распознали 24 тысячи выпусков газеты «Советский спорт»

Читать 1 мин
0

Теперь они доступны в сервисе «Поиск по архивам». Пользователи не только увидят сканы практически всех выходивших с 1922 по 2022 год номеров легендарной газеты, но и получат возможность искать в них информацию так же, как в интернете.

Для работы с «Советским спортом» распознающую тексты нейросеть потребовалось адаптировать под особую верстку газетных страниц. Разработчики научили нейросети ориентироваться в газетах на примере специально созданного набора данных. Специалисты вручную обработали тысячи страниц, выделив на каждой десятки текстовых блоков.

Проект реализован в рамках партнерства «Яндекса» с «Советским спортом» и Национальной электронной библиотекой (НЭБ), которая агрегирует и представляет пользователям в цифровом формате документы из фондов российских библиотек. Архив «Советского спорта» был передан Российской государственной библиотекой (оператором НЭБ).

АВ
Понравилась статья?
Подпишись на автора, чтобы не пропустить новые публикации
Подписаться

Бонусы для вас

Сохрани РБ в избранное

Комментарии0

Похожие новости

Читать 1 мин