Разработка модуля распознавания эмоций разговора колл-центра с использованием рекуррентных искусственных нейронных сетей, для выявления нежелательного контента

Создание сервиса, который будет давать оценку эмоционального состояния, говорящего при разговоре с оператором колл-центра, что поможет анализировать эффективность центра обработки звонков. Применение нейросетей для более качественного решения проблемы.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 23.12.2024
Размер файла 135,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Разработка модуля распознавания эмоций разговора колл-центра с использованием рекуррентных искусственных нейронных сетей, для выявления нежелательного контента

Никифоров А.А.

Аннотация

Задача данного исследования состоит в разработке сервиса, который будет давать оценку эмоционального состояния, говорящего при разговоре с оператором колл-центра, что поможет анализировать эффективность центра обработки звонков.

Ключевые слова: искусственный интеллект, машинное обучение, искусственные нейронные сети, эмоции, эмоциональное состояние, анализ аудиозаписи, классификация текста, классификация изображений.

Abstract

Nikiforov A.A.

DEVELOPMENT OF A CALL CENTER CONVERSATION EMOTION RECOGNITION MODULE USING RECURRENT ARTIFICIAL NEURAL NETWORKS TO IDENTIFY UNWANTED CONTENT

The objective of this study is to develop a service that will assess the emotional state of the speaker when talking to a call center operator, which will help analyze the effectiveness of the call center.

Keywords: artificial intelligence, machine learning, artificial neural networks, emotions, emotional state, audio recording analysis, text classification, image classification.

Развитие технологий позволяет систематизировать и автоматизировать все больше процессов. Год за годом в компаниях растет количество информации, которую нужно получить и обработать, в связи с чем люди пытаются создать средства, что будут автоматически делать за них ту или иную работу. Такой подход к решению вопроса затрагивает как микропроцессы, так и целые системы.

В частности, можно выделить анализ работы колл-центров. Возможность оценки качества разговора представителя компании с клиентом позволит выявить нежелательные моменты, в которых, например, был потерян потребитель.

Анализ эмоций поможет понять, например, как клиент реагировал на предложения компании или же как оператор реагировал на критику.

Основной целью реализации сервиса является обработка аудиофайла для выявления нежелательного контента как со стороны клиента, так и со стороны сотрудника центра обработки звонков.

Список эмоций может быть крайне большим, начиная от легкой симпатии и заканчивая явным презрением. Однако, для облегчения решения задачи они были обобщены в три группы: положительные, негативные, нейтральные. Так как даже при виде человека в живую, очень сложно определить каждую даже опытным специалистам.

Каждая из трех групп эмоций включает в себя:

положительные: симпатия, удовольствие, восторг, нежность, радость, любовь, уверенность, блаженство;

негативные: страх, тревога, злорадство, отчаяние, месть, горе, тоска, гнев;

нейтральные: изумление, любопытство, безразличие. [5]

Распознавание эмоций из звуковой информации можно реализовать двумя способами:

анализировать сам звуковой файл;

анализировать содержимое из звукового файла, а именно текст.

Современным подходом к решению задачи будет использование нейросетей, что позволит более качественно решить поставленную проблему, в отличие от обычных алгоритмических решений.

Анализ звукового файла: По различным акустическим признакам (таким как тон, громкость, высота голоса и др.) возможно определить, в каком эмоциональном состоянии находится говорящий. Использование специальных алгоритмов и ПО позволит приблизительно определить эмоции по различным параметрам.

Эмоциональное состояние человека может быть определено при помощи фонетических и просодических свойств их речи. Экспериментально доказано, что скорость речи возрастает на участках диалога, где возникают переживания беспокойства и тревоги, вызывающие неэффективность саморегуляции речи. Снижение громкости при одновременном возрастании или, наоборот, при резком уменьшении высоты голоса приводит к оцениванию звучащей речи как неприятной.

Крайне важно учитывать тонкие речевые компоненты и их изменение в процессе разговора. Помимо того, человек часто выражает смешанные эмоции, например, одновременно и сочувствие, и раздражение. Такие смешанные эмоции чрезвычайно трудно распознать.

Также немаловажно отметить, что звуковые записи страдают от фонового шума практически всегда. Естественно, это существенно уменьшает процент распознавания эмоционального состояния, говорящего по его речи. Качество записи также влияет на процент распознавания эмоций.[4]

Конструирование искусственной нейронной сети, которая является решением задачи с определением эмоций, должно учитывать тот факт, что в таком виде машинного обучения работа напрямую со звуком не предусмотрена, поэтому на вход нейронной сети будет подаваться спектрограмма звука, которая в ходе преобразований становится набором из чисел. Пример мел - спектрограммы показан на рисунке 1.

Рис. 1. Мел-спектрограмма звука

Деля звуковую запись на части, каждая из которых длится не более пяти секунд, можно достичь более качественного анализа. Таким образом, из каждого полученного отрывка получается одна спектрограмма.

Обработка спектрограммы с помощью нейросети представляет из себя наличие в ней сверточных слоев, которые могут принимать на вход изображение и обрабатывать его. Суть операции свертки заключается в том, что каждый фрагмент рисунка умножается на матрицу свёртки поэлементно, а результат суммируется и записывается в аналогичную позицию выходного изображения.[2]

Проанализировав мел-спектрограмму каждого отрезка нейросетью, сервис сможет собирать количество каждой выявленной эмоции и выводить отношение друг к другу, и эмоция, имеющая наивысший процент над остальными двумя, будет результатом работы данного алгоритма.

Анализ эмоций из текста: сложность определения эмоционального состояния человека в тексте заключается в:

сильной зависимости от контекста;

расположении слов, что зачастую более важно, нежели их частота;

наличии сарказма или иронии.

Так как для распознавания эмоциональной окраски предоставляется звуковая запись, то, в первую очередь, необходимо расшифровать в ней все слова и перевести их в текст. Только после этого можно приступать к распознаванию эмоций непосредственно из предложений.

Для выполнения этой роли отлично подходит модель нейронной сети «whisper» от американской компании «OpenAI», которая находится в свободном доступе. эмоциональный сервис нейросеть

Далее полученный текст необходимо обработать: провести процедуру лемматизации, то есть приведение всех слов к их начальной форме, и очистить от слов, не несущих смысловой нагрузки, например: ну, это, типа и т.п. Эти этапы необходимы для увеличения точности выходного результата. Также необходимо ограничить количество слов, поступающих в будущую нейронную сеть, чтобы не было избытка информации на долю обрабатываемого текста, поэтому вся информация делится на части, состоящие из 15 слов каждая. Так как вычислительные системы работают напрямую с цифрами, то все элементы каждой части заменяются на заранее сформированный токен, который будет сгенерирован при процедуре обучения модели нейронной сети. Таким образом, подготовку аудиозаписи к анализу можно считать завершенной.

При создании нейросети стоит учитывать, что слова в предложении не являются отдельными независимыми элементами, поэтому стоит отказаться от традиционных искусственных нейронных сетей и использовать рекуррентные. Главным преимуществом является то, что такие сети способны запоминать значения как на короткие, так и на длинные промежутки времени, что позволит, в данном случае, отслеживать взаимосвязь слов между собой.[3]

Генерация токена (уникального номера) для каждого слова происходит при обработке датасета, который подобран для обучения математической модели. Если при подаче в готовую ИНС обнаружится слово, которому не присвоен номер (не было в обучающей выборке), то оно будет игнорироваться.

Подводя черту, можно сказать, что на вход сконструированной нейросети поочередно подаются все раннее образованные части, и результатом работы будет вероятная эмоция. После обработки всего текста все результаты сравниваются и выводится процентное соотношение эмоций относительно друг друга. Как и в варианте с анализом самого звукового файла эмоция, имеющая наивысший процент над остальными двумя, будет результатом работы данного алгоритма.

В конце концов, особенностью такого сервиса является использование сразу нескольких различных нейросетей, которые заточены под разные задачи, для увеличения качества обработки информации.

Поиск эмоций из телефонного разговора в данном случае разделен на два процесса, выполняющих свои вычисления. Первым из них является обработка звука посредством выделения из его частей спектрограмм, в результате анализа которых выводится результат. Вторым из них - расшифровка текста из аудиозаписи и его анализ.

Результатом работы сервиса будет предоставление данных об анализе на каждом из процессов, а также итоговый вывод одной эмоции, на основе оценки полученной информации.

Разработанный алгоритм определения эмоционального состояния человека в аудиозаписи позволит оценить качество общения людей между собой.

Также стоит отметить, что главным минусом, которого не удастся избежать - разделение голосов на разные звуковые дорожки. Этот факт может ввести в заблуждение человека, который будет анализировать результаты работы сервиса.

Список литературы

1. Беженарь, А. Е. Нейронная сеть, распознающая рукописные цифры на языке программирования Python // А. Е. Беженарь, Ю. П. Беженарь // Молодой ученый. -- 2020. -- № 7 (297). -- С. 5-10. (дата обращения: 15.05.2023).

2. Свёрточная нейронная сеть [Электронный ресурс].

3. Рекуррентная нейронная сеть [Электронный ресурс].

4. На самом ли деле возможно распознавание эмоций? [Электронный ресурс].

5. Могут ли боты распознавать эмоции в диалоге? Мы решили проверить [Электронный ресурс].

Размещено на Allbest.ru

...

Подобные документы

  • Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.

    дипломная работа [1,8 M], добавлен 08.02.2017

  • Возможности программ моделирования нейронных сетей. Виды нейросетей: персептроны, сети Кохонена, сети радиальных базисных функций. Генетический алгоритм, его применение для оптимизации нейросетей. Система моделирования нейронных сетей Trajan 2.0.

    дипломная работа [2,3 M], добавлен 13.10.2015

  • Создание программного средства, осуществляющего распознавание зрительных образов на базе искусственных нейронных сетей. Методы, использующиеся для распознавания образов. Пандемониум Селфриджа. Персептрон Розенблатта. Правило формирования цепного кода.

    дипломная работа [554,8 K], добавлен 06.04.2014

  • Основные принципы моделирования систем массового обслуживания (СМО) на ЭВМ. Разработка моделирующего алгоритма и составление блок-схемы имитации торгового центра на ПЭВМ. Программа моделирования торгового центра на одном из языков программирования.

    лабораторная работа [77,4 K], добавлен 15.06.2010

  • Технологии решения задач с использованием нейронных сетей в пакетах расширения Neural Networks Toolbox и Simulink. Создание этого вида сети, анализ сценария формирования и степени достоверности результатов вычислений на тестовом массиве входных векторов.

    лабораторная работа [352,2 K], добавлен 20.05.2013

  • Особенности нейронных сетей как параллельных вычислительных структур, ассоциируемых с работой человеческого мозга. История искусственных нейронных сетей как универсального инструмента для решения широкого класса задач. Программное обеспечение их работы.

    презентация [582,1 K], добавлен 25.06.2013

  • Характеристика предприятия, особенности работы оператора сервисного центра. Требования к программному и техническому обеспечению. Проектирование моделей данных, модулей и структуры информационной системы. Разработка интерфейса и тестирование программы.

    дипломная работа [1,2 M], добавлен 16.02.2013

  • Рассмотрение особенностей информационного обеспечения современного фитнес-центра. Разработка проекта базы данных, содержащей сведения о фитнес-центре. Создание таблиц и запросов в системе MS Access 2007. Описание инструкции для пользователя системы.

    курсовая работа [1014,0 K], добавлен 03.03.2015

  • Основные понятия IP телефонии и виды строения сетей IP телефонии. Голосовые шлюзы Cisco Systems для IP-телефонии. IP IVR как средство автоматического ответа на вызовы. Преимущества построения распределенного Контакт Центра, архитектура его построения.

    дипломная работа [3,0 M], добавлен 21.04.2016

  • Понятие и классификация локальных вычислительных сетей, технологии построения. Выбор структуры сети учебного центра. Расчет стоимости сетевого оборудования. Анализ вредных факторов, воздействующих на программиста. Организация рабочего места инженера.

    дипломная работа [7,3 M], добавлен 11.03.2013

  • Рост активности в области теории и технической реализации искусственных нейронных сетей. Основные архитектуры нейронных сетей, их общие и функциональные свойства и наиболее распространенные алгоритмы обучения. Решение проблемы мертвых нейронов.

    реферат [347,6 K], добавлен 17.12.2011

  • Применение нейрокомпьютеров на российском финансовом рынке. Прогнозирование временных рядов на основе нейросетевых методов обработки. Определение курсов облигаций и акций предприятий. Применение нейронных сетей к задачам анализа биржевой деятельности.

    курсовая работа [527,2 K], добавлен 28.05.2009

  • Виды сделок на рынке драгоценных металлов. Основы нейросетей и нейросетевого моделирования. Проектирование и разработка приложения с использованием искусственного интеллекта для решения задач по прогнозированию цен на рынке драгоценных металлов.

    дипломная работа [3,6 M], добавлен 30.06.2012

  • Принцип работы нейросетей и модели синтеза. Ключевые моменты проблемы распознавания речи. Система распознавания речи как самообучающаяся система. Описание системы: ввод звука, наложение первичных признаков на вход нейросети, модель и обучение нейросети.

    курсовая работа [215,2 K], добавлен 19.10.2010

  • Первое систематическое изучение искусственных нейронных сетей. Описание элементарного перцептрона. Программная реализация модели распознавания графических образов на основе перцептрона. Интерфейс программы, основные окна. Составление алгоритма приложения.

    реферат [100,5 K], добавлен 18.01.2014

  • Анализ существующих алгоритмов распознавания режимов работы газотурбинного двигателя. Метод группового учета аргументов, метод Байеса. Применение технологий системного моделирования на этапе проектирования интеллектуальной системы распознавания режимов.

    курсовая работа [1,4 M], добавлен 11.04.2012

  • Разработка проекта веб-сайта для медицинского центра, предоставляющего платные услуги. Анализ целевой аудитории создаваемого сайта как информационного ресурса. Навигация сайта, описание профилей пользователей и алгоритмов их взаимодействия с системой.

    курсовая работа [1,9 M], добавлен 13.12.2014

  • Теоретичні аспекти вивчення інформаційних технологій: поняття та визначення, формування ринку технологій. Поняття, значення і завдання аутсорсінгу, колл-центр як його нова форма. Розвиток аутсорсінгу в світі, проблеми та перспективи розвитку в Україні.

    курсовая работа [57,8 K], добавлен 13.10.2012

  • Понятие и свойства искусственных нейронных сетей, их функциональное сходство с человеческим мозгом, принцип их работы, области использования. Экспертная система и надежность нейронных сетей. Модель искусственного нейрона с активационной функцией.

    реферат [158,2 K], добавлен 16.03.2011

  • Нейрокомпьютеры и их применение в современном обществе. Некоторые характеризующие нейрокомпьютеры свойства. Задачи, решаемые с помощью нейрокомпьютеров. Типы искусственных нейронов. Классификация искусственных нейронных сетей, их достоинства и недостатки.

    курсовая работа [835,9 K], добавлен 17.06.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.