Исследование основных параметров генетического алгоритма метода генетических схем в интеллектуальных системах, основанных на знаниях

Рассмотрение особенностей параметров генетического алгоритма: численности популяции, длины бинарных кодировок, механизма отбора родительских пар, выбора схемы размножения. Исследование влияния численности популяции на количество холостых гипотез.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 28.04.2017
Размер файла 1,6 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Кубанский государственный технологический университет

Исследование основных параметров генетического алгоритма метода генетических схем в интеллектуальных системах, основанных на знаниях

Частикова Вера Аркадьевна, к.т.н., доцент

Краснодар

Аннотация

Данная статья посвящена исследованию влияния основных параметров генетического алгоритма метода генетических схем на эффективность поиска решений в экспертных системах. Рассматриваются следующие параметры генетического алгоритма: численность популяции, длина бинарных кодировок, механизм отбора родительских пар, выбор схемы размножения.

Ключевые слова: экспертная система, база знаний, гипотеза, генетический алгоритм, бинарная кодировка, численность популяции

Для исследования эффективности использования и оценки качественных характеристик теоретически обоснованного и разработанного автором метода генетических схем (ГС) для оптимального поиска решений в продукционных экспертных системах (ЭС) с использованием генетических алгоритмов и специальным образом организованных метазнаний и сравнения его с другими методами и алгоритмами оптимизации был создан специальный программный исследовательский комплекс (ПИК) «Поиск», ядром которого является формальная модель экспертной системы (ФМЭС) [1, 4]. ПИК «Поиск» решает следующие задачи:

- создание базы знаний (БЗ) в соответствии с требуемой сложностью (число уровней, количество терминальных фактов, количество гипотез, максимальное число условий в правиле);

- сохранение базы знаний;

- выбор для исследования любой из хранимых баз знаний;

- создание и поддержка функционирования машины логического вывода [5];

- реализация ряда методов, в том числе метода ГС, поиска оптимальных решений в активной базе знаний;

- поддержка пользовательского интерфейса режима генерации метауровней базы знаний методом ГС с возможностью вариации ряда ключевых параметров как генетических алгоритмов, так и ряда других алгоритмов, используемых методом ГС;

- поддержка процесса поиска оптимальных решений в активной базе знаний любым реализованным методом, либо любой совокупностью выбранных из их числа методов;

- поддержка сравнительного анализа качества поиска выбранных для исследования методов.

Данная статья посвящена изучению эффективности разработанного автором метода ГС для применения его в экспертных системах продукционного типа. Исследованию подлежит влияние основных параметров генетического алгоритма (ГА) на эффективность поиска и их оптимизация, причем, чтобы не ограничивать область применения данного метода в определенной для него сфере, автор намеренно исключает из рассмотрения какие-либо особенности построения деревьев вывода ЭС, делая ставку на универсальность этого метода.

Рассматриваются следующие основные параметры ГА:

- численность популяции;

- длина бинарных кодировок;

- механизм отбора родительских пар;

- выбор схемы размножения.

Оценка метода ГС, а также сравнение его с другими методами должна базироваться на некотором «алгоритмонезависимом» признаке, в качестве которого используется число оценок целевой функции (ЦФ), или иначе -- число гипотез, доказанных вхолостую [5].

Влияние численности популяции на точность выхода на достоверную гипотезу. Исследование влияния численности популяции на эффективность поиска оптимального решения в ЭС проводилось при различных фиксированных значениях прочих параметров [2]. Характер влияния практически везде одинаков и совпадает с приведенным ниже случаем.

Для значений параметров, установленных в окне «Консультации» ПИК «Поиск» и представленных на рисунках 1 и 2, и различной численности популяций получены результаты, приведенные в таблице 1 и на диаграмме рисунка 3.

Рисунок 1 - Значения параметров метода ГС окна «Консультации»

Рисунок 2 - Метод ГС: окно «Параметры генетики»

Таблица 1 - Влияние численности популяции на количество холостых гипотез

Численность популяции

30

50

100

200

300

400

500

600

700

800

Количество

холостых

гипотез

223

209

147

85

131

88

105

83

130

81

На диаграмме рисунка 3 приведено суммарное число холостых гипотез, полученное при выполнении 100 экспериментов при каждом запуске теста для одного и того же дерева БЗ.

Рисунок 3 - Влияние численности популяции на число гипотез, доказанных вхолостую

Линейный тренд диаграммы влияния численности популяции на число гипотез, доказанных методом ГС вхолостую, приведенный на рисунке 4, свидетельствует о постепенном убывании числа холостых гипотез с ростом численности популяции ГА, и уже при числе особей в популяции большем 200 данный метод дает стабильно удовлетворительные результаты.

Рисунок 4 - Линейный тренд результатов поиска

Влияние численности популяции на время работы ГА. От того, какова численность популяции, безусловно, зависит время работы ГА. Так, например, для дерева БЗ с 15-ю гипотезами и 4-мя уровнями при 200 особях в популяции максимальное время выполнения ГА max(tГА) = 0.016с., а при 800 особей при прочих равных условиях - max(tГА)=0.109 с. Помимо этого возрастает также время на упаковку хромосом в схемы. Тем не менее, стоит отметить тот факт, что, хотя с ростом численности популяции общее время на формирование метауровней БЗ возрастает, но это возрастание не столь масштабно. К тому же работа ГА осуществляется в рамках подсистемы «Подготовка» и на режим «Консультации» напрямую не влияет. Косвенное же влияние численности популяции на режим «Консультаций» сказывается в том, что увеличение числа особей в поколении приводит к более плотному покрытию хромосомами, а значит и схемами, ландшафта целевой функции и, следовательно, более эффективному использованию метауровней БЗ экспертной системы. бинарный кодировка генетический

Определив порог численности популяции, преодолев который метод ГС позволяет выйти на стабильные результаты поиска решений в ЭС, в дальнейшем все внимание сосредоточено на исследовании влияния ряда параметров метода ГС, которые позволяют еще более повысить его эффективность.

Длина бинарных кодировок

Для поиска оптимального разбиения пространства параметров на гиперкубы [3], кодируемые хромосомными наборами соответствующей длины N*L (N - размерность задачи, L - длина кодировки одного гена), проводились испытания для L1=4, L2=8, L3=12. Эффективность поиска (при численности популяции 300 особей) определялась по отношению к двум показателям:

- суммарному количеству холостых гипотез по 20 запускам;

- времени работы ГА.

Результаты эксперимента для нескольких деревьев БЗ с 15-ю гипотезами и 4-мя уровнями при 300 особях в популяции приведены в табл. 2 и 3 и на рис. 5, 6.

Таблица 2 - Влияние длины бинарных кодировок на количество холостых гипотез

Число бит на ген

4

8

12

Дерево 1

32

68

56

Дерево 2

5

48

41

Дерево 3

9

37

28

Как видно из представленных диаграмм, для рассматриваемых случаев при увеличении длины бинарного кода гена с 4 до 12 не происходит улучшения эффективности поиска. Вообще, многочисленные эксперименты свидетельствуют, что необходимая длина кодировки в значительной мере зависит от ландшафта целевой функции, ее увеличение положительно сказывается на функциях, ландшафту которых присущи скачкообразные изменения, и наоборот, непрерывная функция слабо чувствительна к длине кодировки. Иногда даже, как в рассматриваем случае, увеличение длины кодировки отрицательно влияет на показатели метода.

Очевидно, такая особенность объясняется разбросом значений приспособленности особей, имеющих одинаковые генотипы, этот разброс тем больше, чем крупнее гиперкубы разбиения пространства [3, 4]. Поэтому в процессе поиска для таких функций сложнее определить хромосомные наборы, которые бы соответствовали оптимальному решению.

Рисунок 5 - Влияние длины кода на количество холостых гипотез

Осторожное отношение к увеличению длины кодировки вызывает и тот факт, что оно ускоряет процесс сходимости всех членов популяции к лучшему найденному решению. Такой эффект очень часто нежелателен из-за того, что большая часть пространства поиска остается неисследованной, а преждевременная сходимость может не привести к оптимальному решению, кроме того, быстрая сходимость к одной области не гарантирует обнаружения нескольких равных экстремумов. Поэтому в вопросе выбора оптимальной длины кодировки нужно достичь некоторого компромиссного решения: с одной стороны, L должно быть достаточно большим, чтобы все-таки обеспечить быстрый поиск, с другой стороны, - по возможности малым, чтобы не допускать преждевременной сходимости и оставить алгоритму шанс отыскать несколько оптимальных значений.

Таблица 3 - Влияние длины кода гена на время выполнения ГА

Число бит на ген

4

8

12

1000* Время ГА

Дерево 1

32

47

63

Дерево 2

32

63

125

Дерево 3

30

57

98

Рисунок 6 - Влияние длины кода гена на время выполнения ГА

Здесь уместно еще раз отметить, что ландшафт ЦФ при работе с ЭС продукционного типа, как правило, неизвестен, и, более того, - у каждой гипотезы он индивидуален [2,5]. Как раз выяснению характерных деталей ландшафтов во многом способствуют экспериментальные исследования с использованием ПИК «Поиск». И в отношении длины бинарной кодировки гена единственный выход - ее экспериментальное определение - такое, которое, будучи использовано для всех ГА, обеспечит в целом лучшую эффективность метода ГС.

Таким образом, экспериментально опробовав ряд режимов для сформированного выше дерева БЗ, необходимо сделать вывод, что по обоим анализируемым параметрам предпочтительнее установить бинарную длину гена L=4.

Механизм отбора родительских пар

В ГС с целью предотвращения преждевременной сходимости процесса поиска к квазиоптимальному решению, заложен специальный механизм - механизм отбора.

В ГС использованы два механизма отбора, дающие в совместном использовании наилучшие результаты: элитный отбор и отбор с вытеснением.

Элитный отбор, основан на построении новой популяции только из лучших особей репродукционной группы, объединяющей в себе родителей, их потомков и мутантов. Он используется для ускорения процесса поиска и поэтому обладает потенциальной опасностью преждевременной сходимости. Поэтому в ГС применен очень осторожный подход в реализации этого отбора: в новое поколение отбирается только одна особь с наилучшим значением функции приспособленности [1].

Для компенсации быстрой сходимости, обеспечиваемой элитным отбором, необходимо предусмотреть некоторый противовес. С этой целью применен отбор родительских пар с вытеснением. В данном отборе перенос особи из репродукционной группы в популяцию нового поколения определяется не только величиной ее приспособленности, но и тем, есть ли уже в формируемой популяции следующего поколения особь с аналогичным хромосомным набором.

Из всех особей с одинаковыми генотипами предпочтение сначала, конечно же, отдается тем, чья приспособленность выше. Таким образом, достигаются две цели: во-первых, не теряются лучшие найденные решения, обладающие различными хромосомными наборами, а во-вторых, в популяции постоянно поддерживается достаточное генетическое разнообразие. Вытеснение в данном случае формирует новую популяцию скорее из далеко расположенных особей, вместо особей, группирующихся около текущего найденного решения.

Реализованный в методе ГС механизм особенно хорошо себя показал при решении многоэкстремальных задач [1], при этом помимо определения глобальных экстремумов появляется возможность выделить и те локальные экстремумы, значения которых близки к глобальным.

Помимо описанного выше и заложенного алгоритмически в метод ГС механизма отбора пар, обеспечивающего необходимый баланс между поддержанием на удовлетворительном уровне скорости поиска и предотвращением преждевременной сходимости процесса поиска к квазиоптимальному решению, в методе ГС имеется еще и ряд дополнительных рычагов регулирования сходимости поискового процесса. С помощью этих рычагов еще в большей степени можно влиять на расширение области поиска для ее детального исследования и тем самым использовать их для доводки режима работы метода ГС до оптимального уровня.

Выбор схемы размножения

На рисунке 7 представлена панель установки значений параметров кроссовера ГА, с помощью которой перед запуском формирования метауровней БЗ можно выбрать ряд установок, в частности, схему размножения особей в ГА.

Рисунок 7 - Панель установки параметров кроссовера ГА

Одной из особенностей реализации ГА в ПИК «Поиск» состоит в том, что в нем предусмотрена возможность использования двух схем размножения особей:

- традиционной (вероятностной) схемы;

- альтернативной (детерминированной) схемы.

Использование традиционной схемы предполагает ограничение численности потомков посредством вероятности кроссовера. Алгоритмически вероятностный кроссовер организован следующим образом: в неупорядоченном списке хромосом в соответствии с установкой величины вероятности на панели рисунка 7 находится первый родитель, который скрещивается со следующей за ним хромосомой. Для выбора этой схемы репродукции необходимо выбрать режим «Вероятностный» и в поле «Вероятность/количество пар» установить подходящую величину вероятности кроссовера.

Альтернативная схема позволяет использовать фиксированное число брачных пар в каждом поколении. Для формирования потомков в соответствии с этой схемой на панели рисунка 7 необходимо выбрать режим «Детерминированный» и в расположенном рядом поле «Вероятность/количество пар» задать число брачных пар. В рассматриваемой ситуации алгоритм кроссовера для репродукции берет заданное число первых расположенных по порядку пар хромосом.

Вычислительные эксперименты показали, что при определенных обстоятельствах даже для простых случаев поиска оптимальных решений в продукционной экспертной системе нельзя говорить о преимуществе той или иной схемы размножения [1,4]. Так, например, для одного и того же дерева БЗ с 15-ю гипотезами и 4-мя уровнями при 300 особях в популяции в различных сеансах формирования метауровней с последующими консультациями получены результаты, приведенные на рисунках 8 и 9.

Во всех трех сеансах с различным числом экспериментов для двух схем репродукции получены схожие результаты, и небольшие преимущества, имеющиеся у одной схемы размножения в одном сеансе, могут быть потеряны ею в следующем сеансе. Таким образом, можно сделать вывод о том, что при решении задач поиска оптимальных решений в данной предметной области оказываются приемлемыми обе схемы репродукции, а выбор конкретной схемы для определенной базы знаний может быть возложен на ее проектировщика. Оправданность этого выбора может быть проверена или подкреплена проведением экспериментов с использованием ПИК «Поиск» [1].

Рисунок 8 - Сравнительная оценка двух схем размножения ГА: а) детерминированная схема б) вероятностная схема

Рисунок 9 - Сравнительная оценка двух схем размножения ГА: а) текущие результаты экспериментов; б) суммарный нарастающий итог от эксперимента к эксперименту

Литература

1. Частикова В.А. Оптимизация процессов поиска решений в интеллектуальных системах обработки экспертной информации на основе генетических алгоритмов. Автореферат диссертации на соискание ученой степени кандидата технических наук. - Краснодар: Изд-во КубГТУ, 2005.

2. Симанков В.С., Частикова В.А. Генетический поиск решений в экспертных системах. Монография. - Краснодар: Просвещение-Юг, 2008.

3. Частикова В.А. Структура и способы формирования метауровней базы знаний для эффективного поиска решений в продукционной экспертной системе. - Материалы V Международной научно-практической конференции «Интеллектуальные технологии в образовании, экономике и управлении», Воронеж, 2008.

4. Коломиец Т.В., Малыхина М.П. Формирование базы знаний экспертной системы диагностики СУБД. - Известия высших учебных заведений. Северо-Кавказский регион. Серия: Технические науки. 2007. № 3. С. 5-6.

5. Занин Д.Е., Частиков А.П. Эффективность решения задач ранжировки в информационно-поисковых системах на основе динамических нейронных сетей Хопфилда. - Известия высших учебных заведений. Северо-Кавказский регион. Серия: Технические науки. 2008. № 6. С. 62-65.

Размещено на Allbest.ru

...

Подобные документы

  • Этапы работы генетического алгоритма, область его применения. Структура данных, генерация первоначальной популяции. Алгоритм кроссинговера - поиск локальных оптимумов. Селекция особей в популяции. Техническое описание программы и руководство пользователя.

    реферат [1014,2 K], добавлен 14.01.2016

  • Первые работы по симуляции эволюции. Основные понятия генетических алгоритмов. Постановка задачи и функция приспособленности. Инициализация, формирование исходной популяции. Выбор исходной популяции для генетического алгоритма, решение задач оптимизации.

    курсовая работа [714,1 K], добавлен 31.03.2015

  • Описание принципа работы генетического алгоритма, проверка его работы на функции согласно варианту на основе готовой программы. Основные параметры генетического алгоритма, его структура и содержание. Способы реализации алгоритма и его компонентов.

    лабораторная работа [20,2 K], добавлен 03.12.2014

  • Комплексное исследование истории развития, основных понятий, области применения и особенностей генетических алгоритмов. Анализ преимуществ генетических алгоритмов. Построение генетического алгоритма, позволяющего находить максимум целочисленной функции.

    курсовая работа [27,9 K], добавлен 23.07.2011

  • Программа реализации генетического алгоритма, использование визуальной среды программирования. Руководство пользователя, листинг программы. Возможность ввода параметров: объем популяции, число поколений, коэффициент скрещивания и мутации, число городов.

    курсовая работа [2,9 M], добавлен 20.08.2009

  • Оптимизация показателей эффективности функционирования технологического контура системы управления космическим аппаратом, исследование свойств его показателей. Настройка нейронной сети, гибридизация генетического алгоритма с алгоритмами локального поиска.

    дипломная работа [4,5 M], добавлен 02.06.2011

  • Операторы генетического алгоритма. Пример простейшей программы. Процесс генерации и накопления информации о выживании и продолжении рода в ряде поколений популяции. Программа, реализующая простой генетический алгоритм для нахождения минимума функции.

    курсовая работа [39,3 K], добавлен 29.10.2012

  • Создание дискретной модели популяции и определение развития численности популяции в зависимости от начального числа особей. Составление карты поведения системы. Процесс проектирования информационных систем, реализующих новую информационную технологию.

    дипломная работа [1002,8 K], добавлен 09.10.2013

  • Характеристика методов нечеткого моделирования и изучение системы кластеризации в пакетах прикладных программ. Разработка и реализация алгоритма для оптимизации базы правил нечеткого классификатора с помощью генетического алгоритма аппроксимации функции.

    дипломная работа [1,9 M], добавлен 21.06.2014

  • Описание генетических алгоритмов. Применение генетического алгоритма для решения задачи коммивояжера. Постановка задачи безусловной оптимизации. Изучение распространения генетических алгоритмов на модель с несколькими взаимодействующими популяциями.

    дипломная работа [979,1 K], добавлен 30.05.2015

  • Сущность интеллектуальных систем. Запись математического выражения в виде ориентированного графа. Особенности разработки генетического алгоритма для решения задачи аппроксимации логического вывода экспертной системы на основе метода сетевого оператора.

    дипломная работа [1,0 M], добавлен 17.09.2013

  • Основные генетические операторы. Схема функционирования генетического алгоритма. Задачи, решаемые с помощью генетических алгоритмов. Математическая постановка задачи оптимизации. Решение Диофантова уравнения. Программная реализация. Создание пособия.

    курсовая работа [391,4 K], добавлен 20.02.2008

  • Создание программы для поиска минимума функции двух вещественных переменных в заданной области с помощью генетического алгоритма. Генетические алгоритмы и операторы. Создание начальной популяции. Размножение. Мутация и селекция. Тестирование программы.

    курсовая работа [131,6 K], добавлен 22.02.2015

  • Анализ современного состояния общей проблемы синтеза моделей многофакторного оценивания и подходов к ее решению. Разработка математической модели метода компараторной идентификации модели многофакторного оценивания. Описание генетического алгоритма.

    дипломная работа [851,7 K], добавлен 11.09.2012

  • Основные особенности эволюционных алгоритмов. Описание алгоритмов селекции, мутации, скрещивания, применяемых для реализации генетических алгоритмов. Вычисление функции приспособленности. Программная реализация. Тестирование и руководство пользователя.

    курсовая работа [1,3 M], добавлен 11.03.2014

  • Теоретические основы и проблемы принятия решений. Синтез модели многофакторного оценивания, метод компараторной идентификации. Особенности реализации базового генетического алгоритма. Программный способ определения эффективного состава команды проекта.

    дипломная работа [733,1 K], добавлен 09.06.2012

  • Содержание фундаментальной теории гена. Описание простого генетического алгоритма поиска оптимальных решений. Сущность понятий "кроссинговер", "сайт", "иллегальная рекомбинация". Этапы реализации алгоритма Девиса по перераспределению участков хромосом.

    контрольная работа [23,7 K], добавлен 17.09.2010

  • Исследование нечеткой модели управления. Создание нейронной сети, выполняющей различные функции. Исследование генетического алгоритма поиска экстремума целевой функции. Сравнительный анализ нечеткой логики и нейронной сети на примере печи кипящего слоя.

    лабораторная работа [2,3 M], добавлен 25.03.2014

  • Сравнение результатов работы генетического алгоритма по решению "несимметричной незамкнутой задачи коммивояжера" с результатами работы алгоритма динамического программирования по параметрам - время работы, точность результата и объем используемой памяти.

    курсовая работа [65,3 K], добавлен 16.04.2014

  • Исследование процедуры ввода графического изображения основных компонентов аналоговых электронных схем, с присвоением им определенных параметров и с созданием чертежей принципиальных схем. Принципиальные схемы пассивного фильтра и усилительного каскада.

    лабораторная работа [220,4 K], добавлен 22.10.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.