Нейросети «Яндекса» распознали 24 тысячи выпусков газеты «Советский спорт»
Теперь они доступны в сервисе «Поиск по архивам». Пользователи не только увидят сканы практически всех выходивших с 1922 по 2022 год номеров легендарной газеты, но и получат возможность искать в них информацию так же, как в интернете.
Для работы с «Советским спортом» распознающую тексты нейросеть потребовалось адаптировать под особую верстку газетных страниц. Разработчики научили нейросети ориентироваться в газетах на примере специально созданного набора данных. Специалисты вручную обработали тысячи страниц, выделив на каждой десятки текстовых блоков.
Проект реализован в рамках партнерства «Яндекса» с «Советским спортом» и Национальной электронной библиотекой (НЭБ), которая агрегирует и представляет пользователям в цифровом формате документы из фондов российских библиотек. Архив «Советского спорта» был передан Российской государственной библиотекой (оператором НЭБ).
Бонусы для вас
Сохрани РБ в избранное





