Роскомнадзор будет формировать реестр запрещённой информации с применением ИИ

moder

moder

Администратор
Команда форума
Согласно новой версии паспорта программы цифровой трансформации, Роскомнадзор планирует с 2024 года формировать и вести реестр заблокированных сайтов с применением искусственного интеллекта (ИИ). Об этом сообщает «Ъ», ознакомившийся с документом.

В 2023 году, исходя из данных паспорта, реестр запрещенных сайтов велся без применения ИИ. Информационная система мониторинга интернет-ресурсов (ИС МИР), следует из тендерной документации от 2021 года, предназначена для отслеживания текстов с запрещенной информацией, их классификации по характеру (нейтральное, негативное или позитивное мнение автора) и поиска перепечаток. В прошлом году подведомственный Роскомнадзору ФГУП «Главный радиочастотный центр» объявлял тендер на интеграцию ИС МИР с другими системами, в том числе с ИС «Окулус», предназначенной для поиска изображений и символов.

В 2023 году, говорится в документе, Роскомнадзор выявлял незаконный контент в интернете спустя три часа после публикации. В 2024 году показатель планируется сократить до двух часов, а по итогам 2026 года — до одного.

Также служба планирует повысить эффективность работы: в частности, снизить показатель ошибочно выявленных признаков нарушений в СМИ с 20% в 2023 году до 10% в 2026 году.

Использование ИИ, а не заданных алгоритмов обработки текстов позволит сократить объем человеческих ресурсов для обслуживания системы, считает менеджер продуктов Innostage Евгений Сурков. Для этого нужно обучить ИИ-модель на выборке материалов верифицированной и контролируемой оператором системы. Затем модель может работать с минимальным участием человека, уточнил он.

В 2026 году, согласно паспорту, Роскомнадзор также намерен наполнять с помощью ИИ реестр операторов персональных данных. Аналитик профильного Telegram-канала abloud62 Алексей Бойко допускает, что выявлять операторов персональных данных в автоматическом режиме можно по открытой информации:
«Но есть риск, что на первых порах такой ИИ станет выдавать ложные обнаружения».
Выявление операторов сопряжено с трудностями, подчеркивает гендиректор разработчика систем анализа данных «Социальная лаборатория» Наталия Тылевич:
«Даже если оператор опубликовал юридические документы в виде, удобном для автоматического извлечения, их "чтение" требует глубокого семантического анализа. А ведь, например, интернет-магазин может отображать их только в процессе регистрации пользователя или оформления заказа».
В последнем случае, уточняет она, создателям решений придется найти способ автоматической регистрации на сайтах, администраторы которых обычно блокируют подобные действия.
 
Сверху