ИИ принял Драгунского за наркотик: «Эксмо» рассказали о трудностях поиска запрещенного контента в книгах
Издательство «Эксмо» затратило значительные средства на анализ собственного ассортимента, выпущенного с 1990 года, чтобы соответствовать требованиям законодательства о маркировке запрещенной информации. Для выявления в книгах упоминаний наркотиков, экстремистских материалов и пропаганды «международного движения ЛГБТ» (признанного в России экстремистским) используется искусственный интеллект.
Как сообщили РБК в издательстве, основная нагрузка легла на проверку многомиллионного массива текстов. Глава «Эксмо» Евгений Капьев на недавней пресс-конференции подробно описал работу системы: текст разбивается на фрагменты для анализа контекста, затем ИИ выявляет проблемные места по нескольким категориям, отсеивает ложные срабатывания и классифицирует нарушения. Для этого используются «самые дорогие и продвинутые модели», обученные на законах и судебной практике.
Однако, подчеркнул Капьев, окончательное решение всегда остается за человеком. В планах издательства — внедрение интерактивной функции, которая позволит редакторам задавать системе уточняющие запросы (например, «найти все упоминания слова „мак“»).
Сложность работы иллюстрирует курьезный случай, о котором Капьев рассказал ранее. Искусственный интеллект счел фамилию классика детской литературы Виктора Драгунского пропагандой наркотиков из-за созвучности с английским drug («наркотик»). «Это лишь в очередной раз иллюстрирует, как непросто нам, книжникам, подстроиться под требования о маркировке», — посетовал глава «Эксмо», отметив, что ИИ настраивают максимально широко, чтобы ничего не пропустить.







Для того чтобы видеть и оставлять комментарии необходимо авторизоваться!