О создании программного комплекса для распознавания эмоций с использованием методов машинного обучения

Описание анализа систем распознавания эмоций с применением методов машинного обучения, находящихся в открытом доступе, в рамках курсового проекта по дисциплине Обучающие Технические Системы "Machine Learning". Neurobotics EmoDetect. Cognitive Emotion.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 14.03.2019
Размер файла 985,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

О СОЗДАНИИ ПРОГРАММНОГО КОМПЛЕКСА ДЛЯ РАСПОЗНАВАНИЯ ЭМОЦИЙ С ИСПОЛЬЗОВАНИЕМ МЕТОДОВ МАШИННОГО ОБУЧЕНИЯ

Пак Гу Вон

В статье кратко описывается анализ систем распознавания эмоций с применением методов машинного обучения, находящихся в открытом доступе, в рамках курсового проекта по дисциплине Обучающие Технические Системы "Machine Learning". Научный руководитель: к.т.н., доц. Воронов В.И..

В текущее время определение эмоционального состояния человека обрело высокую важность и может использоваться для решения следующих задач:

- Определение агрессивно настроенных людей;

- Проведение психологической диагностики;

- Тестирование и оценка рекламных роликов или нового продукта по эмоциональной реакции фокус-группы.

Эффективным решением данных задач является использование автоматизированных программных средств распознавания эмоций.

Целью данной статьи является анализ работы приложений по распознаванию эмоций с использованием методов машинного обучения на примере Neurobotics EmoDetect и Emotion API Microsoft Cognitive Services.

Распознавание эмоций

машинный обучение распознавание эмоция

Эмоция - психический процесс средней продолжительности, отражающий субъективное оценочное отношение к существующим или возможным ситуациям.

Все эмоции характеризуются валентностью (тоном), т. е. могут быть положительными или отрицательными, интенсивностью, стеничностью (побуждать к действию или расслаблять), а также содержанием. Различают семь основных видов эмоций: презрение, отвращение, гнев, печаль, счастье, удивление, страх и нейтральное состояние[1].

Для выделения признаков лица исследователи обычно используют так называемые "двигательные единицы лица" (Action Units, AU). Все AU объединены в систему кодирования лицевых движений (Facial Action Coding System, FACS), разработанную американским психологом, специалистом в области психологии эмоций Полом Экманом[2]. Некоторые коды AU представлены в таблице 1.

Таблица 1 Система кодирования лицевых движений (FACS)[2]

Код AU

Значение

Код AU

Значение

1

Приподнята внутренняя часть брови

15

Опущен уголок губы

2

Приподнята внешняя часть брови

16

Опущена нижняя губа

4

Опущена бровь

17

Приподнят подбородок

5

Приподнято верхнее веко

18

Сморщены губы

6

Приподнята щека

20

Растянуты губы

7

Натянуты веки

22

Губы воронкой

8

Губы навстречу друг другу

23

Натянуты губы

9

Сморщен нос

24

Сжаты губ

10

Приподнята верхняя губа

25

Губы разведены

11

Углубитель носогубной складки

26

Челюсть опущена

12

Приподнят уголок губы

27

Рот широко открыт

13

Остро приподнят уголок губы

54

Голова вниз

14

Ямочка на щеке

64

Глаза вниз

В таблице 2 представлена эмоциональная система кодирования лицевых движений (англ. Emotion Facial Action Coding System (EmFACS)) по П. Экману[2]. В данной таблице отображены прототипы эмоций и коды двигательных единиц лица (ДЕ), соответствующих им. Для обозначения интенсивности задействования ДЕ к номеру ДЕ добавляют латинские буквы от A до E, в зависимости от минимальной - максимальной интенсивности движения.

• А Слабо различимое

• B Незначительное

• С Заметное или ярко выраженное

• D Сильное или крайне заметное

• E Предельное

Таблица 2 Эмоциональная система кодирования лицевых движений[2]

Эмоция

Прототип (Код AU)

Удивление

1+2+5B+26; 1+2+5B+27;

Страх

1+2+4+5*+20*+25, 26, или 27;

1+2+4+5*+25, 26, или 27;

Радость

6+12*; 12C/D;

Печаль

1+4+11+15B с/без 54+64;

1+4+15* с/без 54+64;

6+15* с/без 54+64;

Отвращение

9; 9+16+15+26; 9+17;

10*; 10*+16+25, 26; 10+17;

Презрение

9 или одностороннее 10;

12; 14;

Гнев

4+5*+7+10*+22+23+25, 26;

4+5*+7+10*+23+25, 26;

4+5*+7+23+25, 26;

4+5*+7+17+23, 24;

4+5*+7+23, 24;

Neurobotics EmoDetect

Программный комплекс Neurobotics EmoDetect, основанный на анализе двигательных единиц лица, был разработан с использованием мультиклассификатора, состоящего из вероятностного классификатора, нейронной сети и набора логических правил[3].

При разработке системы распознавания проводилась нормировка признаков двух видов: относительно опорного кадра и по диапазону значений. При нормировке относительно опорного кадра за признаки принимаются усредненные значения признаков для нескольких имеющихся в базе изображений нейтрального выражения лица субъекта. Нормировку по диапазону значений выполняют для приведения признаков к единой шкале[4]. После нормировки признаков на вход вероятностного классификатора и нейронной сети подаются 20 признаков-маркеров, представленных в таблице 3.

Таблица 3 Признаки лица и связанные с ними AU[4]

Признак

Код AU

Признак

Код AU

1. Высота прически над уровнем бровей

-

11. Подъем внутренней части бровей

1, 9

2. Морщины в области лба

1, 2, 38

12. Толщина верхней губы

9, 10, 23

3. Складки между бровями

4, 9

13. Складки в области под бородка

17

4. Ширина глазной щели

5, 6, 7, 43

14. Степень открытия рта

25-27

5. Складки по сторонам носа

9, 10

15. Складки в уголках рта

15

6. Подъем верхней губы

10

16. Толщина нижней губы

17, 23

7. Подъем бровей

2

17. Морщины под нижним веком

6, 9

8. Ориентация уголков рта

12-15, 17

18. Тип открытия рта

25-27

9. Радиус дуги нижнего века

6

19. Ориентация губ

12-15, 17

10. Радиус дуги крыла носа

9

20. Форм-фактор области рта

20, 25-27

В том случае, когда полученные результаты двух классификаторов не однозначны, набор логических правил разрешает спорную ситуацию.

Выходными данными приложения являются шесть показателей

эмоций: страх, радость, удивление, гнев, отвращение, грусть и нейтральное состояние.

Cognitive Emotion

Cognitive Emotion - когнитивный сервис распознавания эмоций от Microsoft. Данная программа принимает изображение в качестве входных данных и возвращает набор эмоций для каждого лица на изображении, ограничивающую рамку лица от Cognitive Face. Результатом работы программы являются показатели для каждого вида эмоции, сумма которых равна 1[5].

Тестирование работы программ для распознавания эмоций

Автором статьи протестированы рассматриваемые приложения на примере изображения мужчины.

Neurobotics EmoDetect.

Рассмотрим работу программы Neurobotics EmoDetect, предварительно подав на вход изображение для калибровки.

Размещено на http://www.allbest.ru/

Рисунок 1. Вводное изображение (а); изображение для распознавания эмоции (б); результаты распознавания EmoDetect.

На рисунке 1а отображено вводное изображение, предназначенное для определения нейтрального состояния. После его анализа получен результат выбранного изображения (рисунок 1б). Доля каждой эмоции представлена на рисунке 1 в. Microsoft Cognitive Emotion

На рисунке 2 отображены результаты программы, разработанной Microsoft, Cognitive Emotion.

Рисунок 2. Результаты распознавания Cognitive Emotion.

В правой части представлены данные о квадратной области, обозначающей положение лица (координаты левого верхнего угла, ширина и высота рамки). В следующем блоке отображены показатели для семи видов эмоций и нейтрального состояния. Для более наглядного вида результирующие данные представлены графически на самом изображении.

Аналитический вывод

На рассматриваемом изображении автор статьи проанализировал «действующие единицы лица» и получил следующие результаты:

• Односторонняя приподнятая верхняя губа (Код AU: 10C)

• Приподнят уголок губы (Код AU: 12D)

• Ямочка на щеке (Код AU: 14D)

Таким образом, в соответствии с таблицей 2 сделан вывод, что превалирующая эмоция - презрение.

Анализ результатов

Результаты работы программ и аналитический вывод вынесены в таблицу 4.

Таблица 4 Результаты распознавания эмоций на тренировочном примере

Эмоция

EmoDetect

Cognitive Emotion

Аналитический вывод

Нейтральное состояние

0, 58

0, 47

0, 27

Удивление

0, 26

0, 00

0, 00

Страх

0, 42

0, 00

0, 00

Радость

0, 3

0, 12

0, 00

Печаль

0, 00

0, 01

0, 00

Отвращение

0, 07

0, 01

0, 00

Презрение

-

0, 38

0, 73

Гнев

0, 07

0, 02

0, 00

Оба приложения показали, что нейтральное состояние преобладает над остальными эмоциями. Вторым по величине показателем являются страх (EmoDetect) и презрение (Cognitive Emotion). Опираясь на аналитический вывод автора статьи можно сказать, что программный комплекс от Microsoft обладает более точным прогнозированием в отличие от EmoDetect, но преобладающая эмоция была выбрано неверно. В связи с этим было принято решение о разработке собственного программного комплекса для распознавания эмоций.

Список литературы

1. https://ru.wikipedia.org/wiki/Эмоция

2. Ekman P., Friesen W.V., Hager J.C. - Facial Acton Coding System. The Manual. Research Nexus division of Network Information Research Corporation Publ., 2002.

3. http://neurobotics.ru/phychophysiology/emodetect - официальный сайт Neurobotics EmoDetect

4. Бобе А.С., Конышев Д.В., Воротников С.А. Система распознавания базовых эмоций на основе анализа двигательных единиц лица. Инженерный журнал: наука и инновации, 2016, вып. 9.

5. https://www.microsoft.com/cognitive-services - официальный сайт когнитивных сервисов компании Microsoft.

6. Заболеева-Зотова А.В. Развитие системы автоматизированного определения эмоций и возможные сферы применения. Открытое образование, 2011, № 2, с. 59-62

7. Князев Б.А., Гапанюк Ю.Е. Распознавание аномального поведения человека по его эмоциональному состоянию и уровню напряженности с использованием экспертных правил. Инженерный Вестник, 2013, с. 509-524.

8. Tariq U., Lin K., Li Z., Zhou Z., Wang Z., Le V., Huang T.S., Lv X., Han T.X. Emotion Recognition from an Ensemble of Features. Systems, Man, and Cybernetics, Part B: Cybernetics, IEEE Transactions, 2012, vol. 42 (4), pp. 1017- 1026.

9. https://www.microsoft.com/cognitive-services/en-us/Emotionapi/documentation - документация о программах распознавания эмоций на официальном сайте Microsoft.

Размещено на Allbest.ru

...

Подобные документы

  • Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.

    дипломная работа [1,8 M], добавлен 08.02.2017

  • Machine Learning как процесс обучения машины без участия человека, основные требования, предъявляемые к нему в сфере медицины. Экономическое обоснование эффективности данной технологии. Используемое программное обеспечение, его функции и возможности.

    статья [16,1 K], добавлен 16.05.2016

  • Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.

    курсовая работа [16,2 M], добавлен 21.06.2014

  • Теоретические основы распознавания образов. Функциональная схема системы распознавания. Применение байесовских методов при решении задачи распознавания образов. Байесовская сегментация изображений. Модель TAN при решении задачи классификации образов.

    дипломная работа [1019,9 K], добавлен 13.10.2017

  • Основные понятия теории распознавания образов и ее значение. Сущность математической теории распознавания образов. Основные задачи, возникающие при разработке систем распознавания образов. Классификация систем распознавания образов реального времени.

    курсовая работа [462,2 K], добавлен 15.01.2014

  • Появление технических систем автоматического распознавания. Человек как элемент или звено сложных автоматических систем. Возможности автоматических распознающих устройств. Этапы создания системы распознавания образов. Процессы измерения и кодирования.

    презентация [523,7 K], добавлен 14.08.2013

  • Методы распознавания образов (классификаторы): байесовский, линейный, метод потенциальных функций. Разработка программы распознавания человека по его фотографиям. Примеры работы классификаторов, экспериментальные результаты о точности работы методов.

    курсовая работа [2,7 M], добавлен 15.08.2011

  • Понятие и особенности построения алгоритмов распознавания образов. Различные подходы к типологии методов распознавания. Изучение основных способов представления знаний. Характеристика интенсиональных и экстенсиональных методов, оценка их качества.

    презентация [31,6 K], добавлен 06.01.2014

  • Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.

    презентация [469,2 K], добавлен 15.03.2015

  • Анализ проблем, возникающих при применении методов и алгоритмов кластеризации. Основные алгоритмы разбиения на кластеры. Программа RapidMiner как среда для машинного обучения и анализа данных. Оценка качества кластеризации с помощью методов Data Mining.

    курсовая работа [3,9 M], добавлен 22.10.2012

  • Выбор типа и структуры нейронной сети. Подбор метода распознавания, структурная схема сети Хопфилда. Обучение системы распознавания образов. Особенности работы с программой, ее достоинства и недостатки. Описание интерфейса пользователя и экранных форм.

    курсовая работа [3,0 M], добавлен 14.11.2013

  • Создание системы предобработки данных; разработка системы классификации на базе методов и алгоритмов машинного обучения, их реализация в программной системе. Предобработка информации, инструкция пользователя, система классификации, машинный эксперимент.

    дипломная работа [917,1 K], добавлен 31.01.2015

  • Історія машинного перекладу як науково-прикладного напряму. Теорія машинного перекладу. Особливості використання систем, орієнтованих на персональні комп’ютери. Напрямки розвитку та застосування машинного перекладу. Приклади систем машинного перекладу.

    реферат [21,5 K], добавлен 19.02.2011

  • Компьютерные обучающие системы. Принципы новых информационных технологий обучения. Типы обучающих программ. Активизация обучения. Компьютерное тестирование. Перспективные исследования в области компьютерного обучения. Интернет-технологии, мультимедиа.

    контрольная работа [60,3 K], добавлен 10.09.2008

  • Литературный обзор методов распознавания кромок для схожих задач. Объекты в приложении и их отображение. Генерация выходных данных. Алгоритм распознавания линии (графика), отличный от градиентных подходов и использующий алгоритм предварительной обработки.

    дипломная работа [711,8 K], добавлен 27.04.2014

  • Первое систематическое изучение искусственных нейронных сетей. Описание элементарного перцептрона. Программная реализация модели распознавания графических образов на основе перцептрона. Интерфейс программы, основные окна. Составление алгоритма приложения.

    реферат [100,5 K], добавлен 18.01.2014

  • Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.

    дипломная работа [887,3 K], добавлен 26.11.2013

  • Обзор математических методов распознавания. Общая архитектура программы преобразования автомобильного номерного знака. Детальное описание алгоритмов: бинаризация изображения, удаление обрамления, сегментация символов и распознавание шаблонным методом.

    курсовая работа [4,8 M], добавлен 22.06.2011

  • Основные цели и задачи построения систем распознавания. Построение математической модели системы распознавания образов на примере алгоритма идентификации объектов военной техники в автоматизированных телекоммуникационных комплексах систем управления.

    дипломная работа [332,2 K], добавлен 30.11.2012

  • Принцип работы нейросетей и модели синтеза. Ключевые моменты проблемы распознавания речи. Система распознавания речи как самообучающаяся система. Описание системы: ввод звука, наложение первичных признаков на вход нейросети, модель и обучение нейросети.

    курсовая работа [215,2 K], добавлен 19.10.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.