Разработка нейронной сети
Обзор технологии Text Mining. Алгоритмы для многоклассовой классификации текстов для выделения тега. Моделирование нейронной сети с использованием среды программирования Python для анализа данных и построения предсказательных моделей и библиотек.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 07.09.2018 |
Размер файла | 2,0 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Полносвязная нейронная сеть |
||
Accuracy |
0.71 |
|
F1-score |
0.69 |
Таблица 8. Сравнительная таблица
Accuracy |
F1-score |
Время работы |
||
Random Forest |
0.15 |
0.12 |
2min 50s |
|
Vowpal Wabbit |
0.63 |
0.66 |
9.47 s |
|
GRU |
0.69 |
0.68 |
12h 9min 29s |
|
LSTM |
0.73 |
0.72 |
4h 51min 36s |
|
Полносвязная нейронная сеть |
0.71 |
0.69 |
18h 7min 28s |
Наилучший результат относительно метрик качества был показан рекуррентной нейронной сетью типа LSTM, однако линейный алгоритм, реализованный с помощью библиотеки Vowpal Wabbit, несмотря на то, что время, затраченное на обучение, почти в 2000 раз меньше, чем у нейронной сети LSTM, получило качество, которое уступает лидеру менее чем на 10%. Полученные результаты подтверждают предположения о том, что более сложные модели, такие как рекуррентные сети, показывают лучшее значение метрик. Однако при правильно выбранной архитектуре более простых нейронных сетей, какими являются полносвязные нейронные сети, качество модели может несильно отставать от сложных моделей.
3.7 Переформирование классов и оценка качества модели
Для улучшения качества классификации было принято решение объединить некоторые из классов и вновь построить модель нейронной сети - LSTM, как модель нейронной сети с наилучшими показателями метрик и наиболее быстрым обучением среди сетей.
Уменьшение количества классов
Некоторые классы объединены в один общий, так как они являлись подклассами.
Для объединения были выделены следующие группы:
· anjularjs, javascript, jquery, node.js
· sql, sql-server, mysql
· ios, iphone
· .net, asp.net
· c, c#, c++
Снова построим распределение данных по новым классам. Количество классов уменьшилось до 17.
Рисунок 36. Reduced tag frequency
Нейронная сеть LSTM с уменьшенным количеством классов
Этапы обучения нейронной сети можно увидеть на рисунке 37.
Рисунок 37. Обучение LSTM
Качество данной модели после уменьшения количества классов увеличилось и превзошло качество, получившееся на большем количестве классов.
Таблица 9. LSTM метрики с меньшим количеством классов
LSTM model |
||
Accuracy |
0.81 |
|
F1-score |
0.81 |
Уменьшение количества классов пошло на пользу нейронным сетям. По сравнению с предыдущими результатами, качество LSTM увеличилось на 0.08. Такой результат был вполне ожидаем, так как задача стала существенно проще:
· уменьшилось количество классов
· классы стали более четко детерминированы
алгоритм тег нейронный сеть
Заключение
В ходе проделанной работы были решены поставленные задачи и достигнуты следующие результаты:
1. Сделан обзор технологии Text Mining и задач, решаемых с помощью данной технологии.
2. Произведен обзор нейросетевых технологий: как устроена искусственная нейронная сеть, какие задачи можно решать с помощью нейросетей. Приведены примеры часто используемых нейронных сетей и подробно разобраны принципы работы рекуррентных нейронных сетей.
3. На основе проделанного обзора нейронных сетей реализованы архитектуры нейронных сетей типа LSTM, GRU и полносвязной нейронной сети для решения задачи выделения тега в тексте.
4. Реализован линейный метод с помощью библиотеки Vowpal Wabbit и метод решающих деревьев Random Forest.
5. Произведено сравнение построенных моделей, которое производилось на данных с платформы stackoverflow, где для каждого вопроса необходимо выделить тег, характеризующий тему вопроса.
6. Построенная модель нейронной сети LSTM показала наилучший результат и самое быстрое время обучения среди представленных нейронных сетей. Однако самое быстрое обучение и неплохое качество показывает линейная модель, реализованная с помощью пакета Vowpal Wabbit.
7. Во время анализа ошибок моделей было выявлено, что некоторые классы слабо отличаются друг от друга, поэтому при объединении классов и обучении модели LSTM с той же архитектурой, качество заметно увеличилось.
Список литературы
Чубукова И. А. Data Mining: учебное пособие //М.: Интернет-университет информационных технологий: БИНОМ: Лаборатория знаний. - 2006. - С. 208-221.
Mining K. D. T. D. What Is Knowledge Discovery //Tandem Computers Inc. - 1996. - Т. 2.
Экономическая информатика: Учебник / Под ред. В.П. Косарева. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2004. - 592 с.
Мерков А. Б. Введение в методы статистического обучения //М.: Editorial URSS. - 2009.
Барсегян А. А. и др. Барсегян А, А. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP.-2-е изд., перераб. и доп. - 2007.
Воронцов, К. В. Курс лекций по машинному обучению / К. В. Воронцов. -- 2015.
Роберт К. Основные концепции нейронных сетей: Пер. с англ //М.: Издательский дом «Вильямс. - 2001.
Пескова О. В. и др. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика. - 2015.
Осовский С. Нейронные сети для обработки информации. - Финансы и статистика, 2004.
Krizhevsky A., Sutskever I., Hinton G. E. Imagenet classification with deep convolutional neural networks //Advances in neural information processing systems. - 2012. - С. 1097-1105.
Zhang Q. et al. Keyphrase extraction using deep recurrent neural networks on Twitter //Proceedings of the 2016 Conference on Empirical Methods in Natural Language Processing. - 2016. - С. 836-845.
Hochreiter S., Schmidhuber J. Long short-term memory //Neural computation. - 1997. - Т. 9. - №. 8. - С. 1735-1780.
Chung J. et al. Empirical evaluation of gated recurrent neural networks on sequence modeling //arXiv preprint arXiv:1412.3555. - 2014.
Agarwal A. et al. A reliable effective terascale linear learning system //The Journal of Machine Learning Research. - 2014. - Т. 15. - №. 1. - С. 1111-1133.
Boyd S. et al. Distributed optimization and statistical learning via the alternating direction method of multipliers //Foundations and Trends® in Machine learning. - 2011. - Т. 3. - №. 1. - С. 1-122.
Weinberger K. et al. Feature hashing for large scale multitask learning //Proceedings of the 26th Annual International Conference on Machine Learning. - ACM, 2009. - С. 1113-1120.
Хайкин С. Нейронные сети: полный курс, 2-е издание. - Издательский дом Вильямс, 2008.
Elman J. L. Finding structure in time //Cognitive science. - 1990. - Т. 14. - №. 2. - С. 179-211.
Louppe G. Understanding random forests: From theory to practice //arXiv preprint arXiv:1407.7502. - 2014.
Горожанина, Е.И. Г Нейронные сети. Учебное пособие. [Текст] / Е.И. Горожанина. - Самара. ФГБОУ ВО ПГУТИ, 2017. - 84 с.)
Nielsen M. A. Neural networks and deep learning. - Determination Press, 2015.
McCulloch W. S., Pitts W. A logical calculus of the ideas immanent in nervous activity //The bulletin of mathematical biophysics. - 1943. - Т. 5. - №. 4. - С. 115-133.
Рудой Г. И. Выбор функции активации при прогнозировании нейронными сетями //Машинное обучение и анализ данных. - 2011. - Т. 1. - №. 1. - С. 16-39.
Patterson J., Gibson A. Deep Learning: A Practitioner's Approach. - " O'Reilly Media, Inc.", 2017.
Короткий С. Нейронные сети: алгоритм обратного распространения //Доступный с http://www. gotai. net/documents/doc-nn-003. aspx. - 2000.
Neubig G. Neural machine translation and sequence-to-sequence models: A tutorial //arXiv preprint arXiv:1703.01619. - 2017.
...Подобные документы
Разработка алгоритма и программы для распознавания пола по фотографии с использованием искусственной нейронной сети. Создание алгоритмов: математического, работы с приложением, установки весов, реализации функции активации и обучения нейронной сети.
курсовая работа [1,0 M], добавлен 05.01.2013Прогнозирование на фондовом рынке с помощью нейронных сетей. Описание типа нейронной сети. Определение входных данных и их обработка. Архитектура нейронной сети. Точность результата. Моделирование торговли. Нейронная сеть прямого распространения сигнала.
дипломная работа [2,7 M], добавлен 18.02.2017Прогнозирование валютных курсов с использованием искусственной нейронной сети. Общая характеристика среды программирования Delphi 7. Существующие методы прогнозирования. Характеристика нечетких нейронных сетей. Инструкция по работе с программой.
курсовая работа [2,2 M], добавлен 12.11.2010Математическая модель нейронной сети. Однослойный и многослойный персептрон, рекуррентные сети. Обучение нейронных сетей с учителем и без него. Алгоритм обратного распространения ошибки. Подготовка данных, схема системы сети с динамическим объектом.
дипломная работа [2,6 M], добавлен 23.09.2013Этап предварительной обработки данных, классификации, принятия решения. Изображения обучающих рукописных символов, тестового символа. Выход нейронной сети для тестового символа. График тренировки нейронной сети. Последовательность точек. Входные вектора.
статья [245,7 K], добавлен 29.09.2008Перспективные направления анализа данных: анализ текстовой информации, интеллектуальный анализ данных. Анализ структурированной информации, хранящейся в базах данных. Процесс анализа текстовых документов. Особенности предварительной обработки данных.
реферат [443,2 K], добавлен 13.02.2014Исследование нечеткой модели управления. Создание нейронной сети, выполняющей различные функции. Исследование генетического алгоритма поиска экстремума целевой функции. Сравнительный анализ нечеткой логики и нейронной сети на примере печи кипящего слоя.
лабораторная работа [2,3 M], добавлен 25.03.2014Описание структурной схемы искусственного нейрона. Характеристика искусственной нейронной сети как математической модели и устройств параллельных вычислений на основе микропроцессоров. Применение нейронной сети для распознавания образов и сжатия данных.
презентация [387,5 K], добавлен 11.12.2015Создание структуры интеллектуального анализа данных. Дерево решений. Характеристики кластера, определение групп объектов или событий. Линейная и логистическая регрессии. Правила ассоциативных решений. Алгоритм Байеса. Анализ с помощью нейронной сети.
контрольная работа [2,0 M], добавлен 13.06.2014Изучение и реализация системы, использующей возможности Microsoft Azure для распределенного обучения нейронной сети. Рассмотрение функционирования распределенных вычислений. Выбор задачи для исследования; тестирование данного программного ресурса.
дипломная работа [2,0 M], добавлен 20.07.2015Математические модели, построенные по принципу организации и функционирования биологических нейронных сетей, их программные или аппаратные реализации. Разработка нейронной сети типа "многослойный персептрон" для прогнозирования выбора токарного станка.
курсовая работа [549,7 K], добавлен 03.03.2015Принцип построения и описание прибора. Назначение и область применения спектрометра космических излучений на алмазных детекторах. Аппроксимация степенным многочленом. Математическая модель нейронной сети. Описание интерфейса программного комплекса.
дипломная работа [591,1 K], добавлен 03.09.2017Модель и задачи искусственного нейрона. Проектирование двуслойной нейронной сети прямого распространения с обратным распространением ошибки, способной подбирать коэффициенты ПИД-регулятора, для управления движения робота. Комплект “LEGO Mindstorms NXT.
отчет по практике [797,8 K], добавлен 13.04.2015Математическая модель искусственной нейронной сети. Структура многослойного персептрона. Обучение без учителя, методом соревнования. Правило коррекции по ошибке. Метод Хэбба. Генетический алгоритм. Применение нейронных сетей для синтеза регуляторов.
дипломная работа [1,5 M], добавлен 17.09.2013Нейронные сети и оценка возможности их применения к распознаванию подвижных объектов. Обучение нейронной сети распознаванию вращающегося трехмерного объекта. Задача управления огнем самолета по самолету. Оценка экономической эффективности программы.
дипломная работа [2,4 M], добавлен 07.02.2013Выявление закономерностей и свойств, применимых в искусственной нейронной сети. Построение графиков и диаграмм, определяющих степень удаленности между объектами. Моделирование, тестирование и отладка программной модели, использующей клеточный автомат.
дипломная работа [4,1 M], добавлен 25.02.2015Понятие искусственного нейрона и искусственных нейронных сетей. Сущность процесса обучения нейронной сети и аппроксимации функции. Смысл алгоритма обучения с учителем. Построение и обучение нейронной сети для аппроксимации функции в среде Matlab.
лабораторная работа [1,1 M], добавлен 05.10.2010Выбор публичных показателей для построения, обучения и тестирования модели нейронной сети, которая будет использована в основе информационной системы прогнозирования банкротства банков. Обзор моделей прогнозирования банкротства кредитных организаций.
дипломная работа [1,2 M], добавлен 30.06.2017Разработка структуры базы данных для хранения дипломных проектов в среде объектно-ориентированного программирования Python. Создание внешнего вида окон ввода-вывода информации, технологии переходов. Листинг программы с пояснениями; направления улучшения.
курсовая работа [3,1 M], добавлен 27.02.2015Разработка методики оценки кредитоспособности индивидуальных предпринимателей с использованием нейросетевых технологий. Оптимизация и упрощение нейронной сети. Экономическая эффективность инвестиций в разработанную интеллектуальную информационную систему.
дипломная работа [2,6 M], добавлен 29.06.2012