Автоматизированное проектирование коллективов интеллектуальных информационных технологий для задач анализа данных
Решение сложных интеллектуальных задач с помощью искусственных нейронных сетей. Автоматизация и гибридизация генетических алгоритмов аппарата нечеткой логики. Применения метода генетического программирования в селекции и репродукции новых пород деревьев.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 18.01.2018 |
Размер файла | 23,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://allbest.ru
Сибирский государственный аэрокосмический университет имени академика М.Ф. Решетнева,
Автоматизированное проектирование коллективов интеллектуальных информационных технологий для задач анализа данных
Е.С. Семенкин (saor_semenkin@sibsau.ru)
А.А. Шабалов (shabalov-andrey@mail.ru)
Красноярск
Введение
Интеллектуальные технологии, такие как искусственные нейронные сети [Rojas, 1996], нечеткая логика [Yager et al., 1994], нейро-нечеткие ситемы [Tommi, 1995], эволюционные алгоритмы [Eiben, 2003], являются популярными инструментами исследования в силу их способности решать сложные интеллектуальные задачи, которые трудно решить с помощью классических методов [Konar, 2005]. Гибридные подходы привели к значительному росту интереса в сообществе проектирования ИИТ. Наиболее популярными являются гибридизация нейронных сетей и генетических алгоритмов (ГА), нечеткой логики и ГА, нейронных сетей и аппарата нечеткой логики.
Автоматическое проектирование ИИТ является сложной оптимизационной задачей, структура которой не позволяет эффективно решить ее с помощью классических методов. ГА - это хорошо известный и широко применяемый подход с возможностью исследовать большие и сложные пространства для поиска приемлемых решений, требуя только значение меры качества. Алгоритм генетического программирования оперирует компьютерными программами, представленными деревьями. Желаемая цель достигается путем выращивания популяции деревьев, используя принцип естественного отбора и генетические операторы (селекция, репродукция, рекомбинация, мутация и др.) [Koza, 1998].
В данной статье в первом разделе описывается предлагаемый подход к автоматизированному проектированию ИИТ, во втором - идея применения метода генетического программирования для формирования коллективов ИИТ, в третьем представлены результаты решения практических задач. В заключении подводятся итоги проделанной работы и обсуждаются направления развития подхода.
1. Автоматизированное проектирование ИИТ
Нейросетевые модели. В качестве структуры нейронной сети был взят многослойный персептрон ввиду его широкой распространенности. Обучение данной структуры обычно проводится на основе алгоритма обратного распространения ошибки. Сложность проектирования заключается в исходном выборе количества скрытых слоев и числа нейронов на каждом скрытом слое, структура которых для каждой задачи заранее неизвестна, а также в выборе функций активации нейронов. Недостатками алгоритма обратного распространения ошибки являются низкая скорость сходимости, чувствительность к шуму, зависимость качества функционирования от эвристики шага обучения, и, как правило, недостижение глобально экстремума ошибки моделирования в виду ее сложности [Уоссермен, 1992].
Для преодоления упомянутых проблем предлагается применить генетические алгоритмы для генерирования структуры персептрона и настройки его весовых коэффициентов.
Изначально исследователем задается максимальный размер сети, т.е. максимальное количество скрытых слоев и максимальное количество скрытых нейронов на каждом слое. Структура сети кодируется в бинарную строку при последовательном проходе по каждому нейрону. Первый бит отдельного нейрона определяет его наличие или отсутствие в сети. Остальные биты определяют вид активационной функции (4 бита - набор из 8 активационных функций, 5 бит - из 16). Аналогично кодируются весовые коэффициенты.
Таким образом, необходимо сгенерировать популяцию индивидов, представляющих структуры нейронной сети, и для каждой структуры - отдельную популяцию весовых коэффициентов. Условием останова является либо число поколений структуры, либо ошибка моделирования (обычно, среднеквадратичная).
Системы на нечеткой логике. При проектировании нечетких систем эксперт сталкивается с проблемой выбора исходных нечетких правил, набор которых может оказаться неполным или противоречивым. Выбор параметров функций принадлежности, описывающих входные и выходные переменные объекта, происходит субъективно и может некорректно отображать реальную действительность [Круглов и др., 2001].
Поэтому для повышения обоснованности принятия решений при проектировании нечетких систем были применены ГА. Кодирование битовой строки происходит следующим образом. Вначале кодируются входные параметры функций принадлежности, далее - выходные параметры и в конце строки добавляется на каждую входную переменную терм “игнорирования”, позволяющий управлять как размером базы правил (общее количество правил), так и ее длиной (количество условий в антецеденте). Априори исследователю необходимо задать максимальное количество правил.
Нейро-нечеткие системы. Процесс генерирования нейро-нечетких моделей происходит в два этапа [Castellano et al., 2000], [Castellano et al., 2001]. Первый этап (“обучение без учителя”) заключается в кластеризации исходных числовых данных методами конкурентного обучения с механизмом штрафования соперника, алгоритмом адаптивной резонансной теории или др., после чего получаем “грубые” нечеткие правила. Второй этап (“обучение с учителем”) состоит в “тонкой” настройке базы правил (семантики лингвистических термов) на основе градиентных алгоритмов, недостатки которых широко известны и препятствуют эффективному использованию нейро-нечетких систем. Поэтому в работе применяется ГА, эффективность использования которого на практических задачах показана в [Шабалов, 2009], [Шабалов, 2010] и превосходит метод наискорейшего спуска.
2. Применение метода генетического программирования при формировании коллектива ИИТ
Для повышения эффективности и надежности ИИТ предлагается применять метод генетического программирования при формировании состава коллектива ИИТ для решения сложных задач и формы взаимодействия участников коллектива при получении результирующего решения, основанного на частных решениях индивидуальных технологий.
В данном подходе существует два варианта гибридизации ИИТ. Первый заключается в построении математического выражения из результатов отдельных членов коллектива.
Таким образом, элементами терминального множества алгоритма генетического программирования являются частные решения отдельных систем. интеллектуальный нейронный генетический алгоритм
Второй - в формировании гибридной многослойной системы, состоящей из отдельных членов этого коллектива. Здесь терминальное множество представляется отдельной структурой ИИТ.
При первом подходе на предварительном этапе необходимо заранее сгенерировать и обучить заданное число элементов терминального множества, которые будут в дальнейшем использоваться в работе алгоритма.
При такой постановке задачи существует два способа реализации мутации в алгоритме генетического программирования: либо случайным образом выбирать элемент из терминального множества, либо генерировать полностью новую интеллектуальную систему. Функциональное множество при данном подходе включает в себя математические выражения.
При реализации второго подхода изначально необходимо задать число циклов обучения каждой технологии. При генерации новой популяции индивидов получаются новые структуры, вследствие чего каждая отдельная технология заново проектируется.
Элементами функционального множества в данном случае являются правила соединения отдельных технологий между собой.
3. Апробация на практических задачах
Для апробации предложенных схем генерирования алгоритмического ядра интеллектуальных информационных технологий была разработана программная система решения прикладных задач - моделирования, классификации, кластеризации, прогнозирования, управления.
При реализации генетического алгоритма вместо стандартного за основу был принят ГА с модифицированным оператором множественной равномерной рекомбинации [Шабалов, 2008a], [Шабалов, 2008b].
Были использованы следующие практические задачи, часть которых была взята из репозитория машинного обучения UCI:
Классификация ирисов (4 признака, 3 класса, обучающая выборка - 135 единиц, контрольная - 15) - UCI;
Классификация вин (13 признаков, 3 класса, обучающая выборка - 163 единиц, контрольная - 15) - UCI;
Предсказание лесных пожаров (12 входных переменных и 1 выходная, обучающая выборка - 477 единиц, контрольная - 40) - UCI;
Распознавание типов земель по спутниковым изображениям (36 признаков, 6 классов, обучающая выборка - 4435 единиц, контрольная - 2000) - UCI;
Прогнозирование состояния турбины по вибрационным характеристикам (11 входных и 12 выходных переменных, обучающая выборка - 1000 единиц, контрольная - 400) - реальные данные;
Моделирование процесса рудно-термической плавки (12 входных переменных и 1 выходная, обучающая выборка - 37 единиц, контрольная - 10) - реальные данные.
Прогнозирование деградации электрических характеристик солнечных батарей космического аппарата (7 входных и 4 выходных переменных, обучающая выборка - 177 единиц, контрольная - 20) - реальные данные.
Для каждого типа ИИТ было выполнено 20 запусков программы. При каждом запуске были получены работоспособные системы. В таблице 1 приведены лучшие результаты.
Табл. 1.
№ |
Нейронная сеть |
Система на нечеткой логике |
Нейро-нечеткая система |
||||
Ошибка |
|||||||
О |
Э |
О |
Э |
О |
Э |
||
1 |
5 |
1 |
2 |
0 |
2 |
0 |
|
2 |
1 |
1 |
0 |
0 |
0 |
0 |
|
3 |
16,87% |
19,61% |
15,67% |
17,5% |
|||
4 |
1,78% |
1,79% |
1,11% |
1,11% |
1,45% |
1,46% |
|
5 |
9,11% |
9,14% |
8,07% |
8,09% |
7,99% |
7,97% |
|
6 |
4,86% |
4,97% |
2,99% |
3,01% |
2,81% |
2,92% |
|
7 |
5,66% |
7,66% |
5,05% |
5,87% |
В таблице 1 приняты обозначения: О - обучение, Э - экзамен. В задачах классификации в качестве ошибки приводится количество неправильно классифицируемых признаков, в остальных задачах - средняя относительная ошибка.
Как видно из таблицы 1, во многих случаях наилучшее качество моделирования имеет нейро-нечеткая система. При этом все типы ИИТ демонстрируют эффективность, сопоставимую с известными результатами.
Ниже приведены примеры построения коллектива на основе математического выражения из частных решений отдельных технологий. Изначально заранее были сгенерированы и обучены по 10 ИИТ каждого типа.
В задаче классификации вин была получена следующая формула:
,
где C - номер класса. При этом ошибка распознавания составила 0% как на обучающей выборке, так и на контрольной, что лучше, чем у нейросетевых и нечетких моделей по отдельности и сравнимо с нейро-нечеткими. При этом отдельные ИИТ, превосходящие остальные по качеству моделирования, в коллектив не вошли.
В задаче моделирования процесса рудно-термической плавки получено выражение:
,
определяющее процентное содержание никеля в отработанном шлаке. Относительная ошибка составила: 2,21% на обучающей выборке и 2,33% на тестовой, что лучше, чем у каждой индивидуальной ИИТ в отдельности.
В ходе многочисленных экспериментов было выявлено, что отдельные технологии, превосходящие по качеству моделирования остальные, не всегда присутствуют в конечной формуле. В композиции могут принимать участие технологии с разным качеством моделирования, коллектив которых позволяет тем самым увеличить эффективность и надежность системы в целом.
Заключение
Таким образом, программная система, реализующая разработанный подход, позволяет автоматически генерировать нейросетевые модели, нечеткие и нейро-нечеткие системы, т.е. позволяет решать сложные задачи анализа данных и принятия решений (задачи моделирования, классификации, прогнозирования, управления и др.). Автоматическое формирование коллектива ИИТ позволяет увеличить надежность и эффективность системы. Полученные результаты подтверждены решением ряда практических задач.
Дальнейшее развитие системы направлено на расширение ее функциональности за счет включения других типов ИИТ (динамические нейросети, сети Кохонена и Хопфилда-Танка, деревья решений, многокритериальный выбор и т.д.), повышения адаптивности за счет автоматизации настройки эволюционных алгоритмов, а также доработки методов проектирования коллективов при сетевом подходе.
Список литературы
1. [Круглов и др., 2001] Круглов В.В., Дли М.И., Голунов Р.Ю. Нечеткая логика и искусственные нейронные сети - М.: Физматлит, 2001.
2. [Уоссермен, 1992] Уоссермен Ф. Нейрокомпьютерная техника: Теория и практика. - Пер. с англ., 1992.
3. [Шабалов, 2008a] Шабалов А.А. Исследование эффективности модификации оператора равномерного скрещивания эволюционного алгоритма в задаче управления реальными инвестициями // Информационные технологии и математическое моделирование: сб. научн. тр. VII Всероссийской научно-практической конференции с международным участием. - Томск:, 2008. - Ч. 1.
4. [Шабалов, 2008b] Шабалов А.А. Применение эволюционных алгоритмов с модифицированным оператором равномерного скрещивания в задаче поддержки принятия решений при управлении реальными инвестициями // «Решетневские чтения». - Материалы XII Международной научной конференции. - Красноярск, 2008.
5. [Шабалов, 2009] Шабалов А.А. Автоматическая настройка параметров нейро-нечетких систем генетическим алгоритмом // Информационные технологии и математическое моделирование: сб. научн. тр. VIII Всероссийской научно-практической конференции с международным участием. - Томск, 2009. Ч.2.
6. [Шабалов, 2010] Шабалов А.А. Автоматизация проектирования нейро-нечетких систем с помощью эволюционного алгоритма // Студент и научно-технический прогресс. Материалы XLVIII международной научной студенческой конференции - Новосибирск, 2010.
7. [Castellano et al., 2000] Castellano G. and Fanelli A. M. A self-organizing neural fuzzy inference network. In Proc. of IEEE Int. Joint Conference on Neural Networks (IJCNN2000), vol.5, Italy.
8. [Castellano et al., 2001] Castellano G. and Fanelli A. M. Information granulation via neural network based learning. In Proc. of Joint 9th IFSA World Congress and 20th NAFIPS International Conference (IFSA-NAFIPS 2001).
9. [Eiben, 2003] Eiben A.E., Smith J.E. Introduction to evolutionary computation. Springer, Berlin, 2003.
10. [Goldberg, 1989] Goldberg D.E. Genetic algorithms in search, optimization, and machine learning. Addison-Wesley, Reading, 1989.
11. [Konar, 2005] Konar A. Computational Intelligence: Principles, techniques and applications. Springer, Berlin, 2005.
12. [Koza, 1998] Koza J.R. Genetic programming. The MIT Press, London, England, 1998.
13. [Rojas, 1996] Rojas R. Neural networks: a systematic introduction. Springer, Berlin, 1996.
14. [Tommi, 1995] Tommi O. Neuro-fuzzy in control, Tampere University of Technology, 1995.
15. [UCI] UCI Machine Learning Repository http://kdd.ics.uci.edu/.
16. [Yager et al., 1994] Yager R.R. and Filev D.P. Essentials of fuzzy modeling and control. Wiley, New York, 1994.
Аннотация
Автоматизированное проектирование коллективов интеллектуальных информационных технологий для задач анализа данных. Е.С. Семенкин (saor_semenkin@sibsau.ru); А.А. Шабалов (shabalov-andrey@mail.ru). Сибирский государственный аэрокосмический университет имени академика М.Ф. Решетнева, Красноярск
В работе рассматривается автоматизированное проектирование интеллектуальных информационных технологий (ИИТ) для решения сложных задач анализа данных и принятия решений. На основе эволюционных алгоритмов автоматически генерируются ядра нейросетевых моделей, систем на нечеткой логике и нейро-нечетких систем. Предложена идея применения метода генетического программирования в проектировании коллектива ИИТ с целью повышения эффективности и надежности системы.
Размещено на Allbest.ru
...Подобные документы
Изучение методов разработки систем управления на основе аппарата нечеткой логики и нейронных сетей. Емкость с двумя клапанами с целью установки заданного уровня жидкости и построение нескольких типов регуляторов. Проведение сравнительного анализа.
курсовая работа [322,5 K], добавлен 14.03.2009Разработка и внедрение автоматизированной системы управления дорожным движением. Специфика применения программы интеллектуальных транспортных сетей, использующей принцип нейронных схем, в городе Хабаровске на языке программирования Turbo Pascal 7.0.
дипломная работа [1,7 M], добавлен 19.06.2012Сущность и экономическое обоснование, методы и подходы к прогнозированию валютного курса. Описание технологии интеллектуальных вычислений. Применение генетических алгоритмов для настройки архитектуры нейронных сетей. Основные способы улучшения модели.
курсовая работа [1,3 M], добавлен 26.03.2016Алгоритмы кластеризации данных, отбора факторов, построения множественной линейной регрессии, оценки параметров процесса на скользящем постоянном интервале. Решение задач анализа данных на нейронных сетях и результаты моделирования нелинейных функций.
контрольная работа [1,5 M], добавлен 11.01.2016Признаки и отличительные черты интеллектуальных информационных систем, их классификация и использование при разработке экономических и управленческих решений. Определение, назначение и области применения экспертных систем. Использование нейронных сетей.
курс лекций [1,7 M], добавлен 27.04.2009Возможности современных компьютерных технологий решения задач в средах MS Excel, MS Word. Область программирования в офисных пакетах. Применение ЭВМ в решении математических задач. Разработка программного обеспечения. Разработка приложений с помощью VBA.
дипломная работа [742,2 K], добавлен 29.01.2009Комплексное исследование истории развития, основных понятий, области применения и особенностей генетических алгоритмов. Анализ преимуществ генетических алгоритмов. Построение генетического алгоритма, позволяющего находить максимум целочисленной функции.
курсовая работа [27,9 K], добавлен 23.07.2011Особенности нейронных сетей как параллельных вычислительных структур, ассоциируемых с работой человеческого мозга. История искусственных нейронных сетей как универсального инструмента для решения широкого класса задач. Программное обеспечение их работы.
презентация [582,1 K], добавлен 25.06.2013Технологии решения задач с использованием нейронных сетей в пакетах расширения Neural Networks Toolbox и Simulink. Создание этого вида сети, анализ сценария формирования и степени достоверности результатов вычислений на тестовом массиве входных векторов.
лабораторная работа [352,2 K], добавлен 20.05.2013Характеристика принципов решения инженерных задач с помощью различных информационных компьютерных комплексов. Решение задачи на языке программирования Pascal, с помощью средств математического пакета MathCAD, так же с помощь табличного процессора Excel.
курсовая работа [218,1 K], добавлен 22.08.2013Изучение и укрепление на практике всех моментов графического метода решения задач линейного программирования о производстве журналов "Автомеханик" и "Инструмент". Построение математической модели. Решение задачи с помощью электронной таблицы Excel.
курсовая работа [663,9 K], добавлен 10.06.2014Алгоритмическое решение задач как метод формализации, его использование на современном этапе, применение информационных технологий. Разработка программы для определения функциональной зависимости в массиве данных с помощью языка программирования С++.
курсовая работа [99,4 K], добавлен 04.11.2009Искусственные нейронные сети как одна из широко известных и используемых моделей машинного обучения. Знакомство с особенностями разработки системы распознавания изображений на основе аппарата искусственных нейронных сетей. Анализ типов машинного обучения.
дипломная работа [1,8 M], добавлен 08.02.2017Анализ и решение логических задач с помощью ЭВМ. Умение рассуждать как сущность логики. Освоение алгебры высказываний в информатике. Получение на компьютере таблицы истинности некоторого сложного выражения. Решение задач на языке программирования Паскаль.
реферат [36,8 K], добавлен 29.01.2010Техническое задание на проектирование системы автоматизированного решения задач механики. Разработка комплекта математических моделей систем с распределенными параметрами при действии динамических нагрузок. Выбор базового программного обеспечения.
дипломная работа [679,7 K], добавлен 15.01.2010Основные особенности эволюционных алгоритмов. Описание алгоритмов селекции, мутации, скрещивания, применяемых для реализации генетических алгоритмов. Вычисление функции приспособленности. Программная реализация. Тестирование и руководство пользователя.
курсовая работа [1,3 M], добавлен 11.03.2014Понятие и суть нечеткой логики и генетических алгоритмов. Характеристика программных пакетов для работы с системами искусственного интеллекта в среде Matlab R2009b. Реализация аппроксимации функции с применением аппарата нечеткого логического вывода.
курсовая работа [2,3 M], добавлен 23.06.2012Анализ применения нейронных сетей для прогнозирования ситуации и принятия решений на фондовом рынке с помощью программного пакета моделирования нейронных сетей Trajan 3.0. Преобразование первичных данных, таблиц. Эргономическая оценка программы.
дипломная работа [3,8 M], добавлен 27.06.2011Модульная структура программного продукта и типовые управляющие структуры алгоритмов обработки данных различных программных модулей в основе структурного программирования. Особенности пошаговой разработки программ. Основные типы базовых конструкций.
контрольная работа [163,7 K], добавлен 04.06.2013Первые работы по симуляции эволюции. Основные понятия генетических алгоритмов. Постановка задачи и функция приспособленности. Инициализация, формирование исходной популяции. Выбор исходной популяции для генетического алгоритма, решение задач оптимизации.
курсовая работа [714,1 K], добавлен 31.03.2015