Нейросеть разоблачает мошенников по разговору

Нейросеть разоблачает мошенников по разговору

    Гатауллин Сергей Тимурович

    Гатауллин Сергей Тимурович
    Московский технический университет связи и информатики (МТУСИ)
    Декан факультета «Цифровая экономика и массовые коммуникации»

Учёные автоматизировали противодействие «социальным инженерам»


Интервью с первым заместителем руководителя Департамента информационной безопасности Финансового университета, кандидатом технических наук, доцентом Екатериной Плешаковой на тему разработки программных комплексов противодействия телефонным мошенникам с использованием искусственного интеллекта.

– Екатерина Сергеевна, наверное, не осталось ни одного гражданина РФ, который пользуясь телефоном не столкнулся бы с телефонными мошенниками. Вопрос риторический, но тем не менее мне известно, что группой ученых под вашим руководством разработан и реализован прототип программного комплекса, который в режиме разговора может анализировать содержание и выдавать рекомендации абоненту относительно предполагаемых противоправных действиях со стороны собеседника. Расскажите, пожалуйста, подробнее.

– Да, действительно, в учебно-научной специализированной лаборатории искусственного интеллекта для обеспечения кибербезопасности группой ученых в рамках государственного задания Правительства Российской Федерации Финансовому университету на 2022 год. По теме «Модели и методы распознавания текстов в системах противодействия телефонному мошенничеству» разработан программный комплекс противодействия киберпреступникам, который реализован на базе модели, состоящей из четырех модулей: модуль анализа эмоций по фразе; модуль анализа стоп слов; модуль анализа динамики стоп слов; модуль анализа динамики разговора.

– Честно говоря, когда звучит «модуль анализа стоп-слов», мне в голову приходят истории двадцатилетней давности, такие модули давно реализованы и повсеместно используются, в чем новизна Вашего исследования?

–  Совершенно верно, это один из базовых подходов, но научная новизна проекта заключается в создании новой технологии, основанной на методах искусственного интеллекта для обработки естественного языка и распознавания синтеза речи. В рамках исследования применена сквозная нейротехнология и технология искусственного интеллекта, а именно субтехнологии обработки естественного языка распознавания синтеза речи рекомендательных и интеллектуальных систем поддержки принятия решений и методов и технологий в области искусственного интеллекта. Объектом исследования являются тексты диалогов жертвы и мошенника в системах телефонной связи.

Имея текстовое представление разговора с предполагаемым мошенником, мы делаем две взаимодополняющие проверки: проверка на эмоциональное давление со стороны одного из участников разговора (модуль анализа эмоций) и проверка на характерные шаблоны построения фраз (модуль анализа стоп-слов). Причем при первой проверке мы применяем авторский метод, который использует отклонения по частотам встречаемости разных букв в разговоре. Частоты встречаемости букв для нормального разговора, разговора на эмоциях, манипулятивного разговора отличаются друг от друга.

– Интересная идея, а каким образом был сформирован датасет и что представляет из себя конфигурация нейросетки?

– Для формирования датасета были взяты сообщения различных тематик из социальных сетей. Анализ эмоций осуществлялся в два этапа. На первом этапе с помощью сетей Кохонена было выявлено количество групп, на которые можно было разделить все сообщения. На втором этапе использовалась классическая нейронная сеть (персептрон) для обучения на выявление манипулирования в сообщении. При формировании внутренней структуры сети использовалась информация о количестве кластеров, которая была получена на первом этапе. На первом этапе было выявлено 12 кластеров. На основании результатов первого этапа была создана нейронная сеть со следующей конфигурацией:
– количество нейронов во входном слое – 32;
– количество нейронов в скрытом слое – 12;
– количество нейронов в выходном слое – 2;
– тип нейронной сети – персептрон;
–  алгоритм обучения – Resilient Propagation;
– метод оптимизации структуры сети – метод динамического добавления нейронов.

– Не секрет, что телефонные мошенники постоянно совершенствуют свои методы и модели, зачастую оставаясь на шаг впереди правоохранительных органов. Каким образом можно адаптировать Ваш программный комплекс к видоизменяющимся схемам мошенничества?

– В этом заключается еще одно преимущество нашей разработки. Предложенный нами подход анализа не только смысловой, но и эмоциональной составляющей телефонного разговора является наиболее сложным в реализации по сравнению с анализом внешних характеристик беседы (телефонный номер, время звонка, продолжительность звонков, частота и другие характеристики), но в то же время данный подход позволяет достичь наиболее точных результатов, равно как и оперативно перенастроить модель при изменении схемы мошенничества.

–  Возможно ли будет встроить этот программный комплекс, например, как модуль российской операционной системы?

– Думаю, более целесообразно говорить о приложении, которое абонент может установить на телефон, либо предустановить производитель. В случае заинтересованности со стороны бизнеса или органов государственной власти мы можем портировать исходный код программного комплекса на C++ с целью обеспечения кроссплатформенности и возможности интегрирования в сторонние приложения.

–  Спасибо за интересный разговор.