Роскомнадзор собирается в 2026 году внедрить систему фильтрации интернет-трафика с применением технологий машинного обучения, сообщает Forbes. На проект планируется потратить 2,27 млрд рублей.
Сейчас доступ к запрещенным в России сайтам ограничивается с помощью специальных технических комплексов, установленных на сетях операторов связи. Эти системы анализируют интернет-трафик и блокируют ресурсы, которые признаны незаконными. Их обслуживанием занимается сам Роскомнадзор.
По данным ведомства, такие комплексы уже заблокировали более 1 млн сайтов. Каждый день доступ ограничивается в среднем к 5500 новым адресам и доменам.
Кроме того, Роскомнадзор ведет реестр запрещенных сайтов, который действует с 2012 года. Операторы связи обязаны закрывать доступ ко всем ресурсам, включенным в этот список.
Использование машинного обучения должно сделать блокировки более точными и быстрыми. Источник, близкий к аппарату вице-премьера Дмитрия Григоренко, отмечает, что ведомство может рассчитывать на автоматический поиск запрещенного контента и выявление VPN-сервисов.
«Насколько это выполнимо на практике и эффективно с финансовой точки зрения, с учетом необходимости доработки ТСПУ (технических средств противодействия угрозам), не очевидно», — сказал он.
В самом Роскомнадзоре комментировать планы отказались.
Эксперты объясняют, что новые технологии нужны из-за усложнения интернет-трафика. Многие сайты, попавшие под блокировку, создают копии — так называемые «зеркала», меняя адреса и способы доступа.
«Инструменты машинного обучения позволят блокировать такой контент не по интернет-адресам, а по словам, выражениям, предложениям или каким-то другим признакам», — считает партнер Comnews Research Леонид Коник.
В РКН уже применяются ИИ-инструменты для мониторинга интернета. Глава ведомства Андрей Липов ранее сообщал, что использование нейросетей позволило сократить среднее время обнаружения запрещенной информации с 48 часов в 2020 году до шести часов. Замруководителя службы Вадим Субботин отмечал, что автоматизированные системы ежедневно анализируют около 0,5 млн материалов, из которых порядка 2000 содержат нарушения законодательства.
По словам бизнес-консультанта по информационной безопасности Positive Technologies Алексея Лукацкого, машинное обучение может помочь выявлять зашифрованный трафик и способы обхода блокировок, в том числе работу VPN-сервисов. Также такие технологии позволяют обнаруживать кибератаки, вредоносные программы и отличать легальный трафик от пиратского.
При этом эффективность таких решений не всегда высокая. Так, в системе мониторинга персональных данных нейросети показали точность около 60%. Как объяснял замруководителя РКН Милош Вагнер, для улучшения результатов потребовались бы слишком большие массивы данных, что сочли неоправданным по затратам.