Исследование основных параметров генетического алгоритма метода генетических схем в интеллектуальных системах, основанных на знаниях
Рассмотрение особенностей параметров генетического алгоритма: численности популяции, длины бинарных кодировок, механизма отбора родительских пар, выбора схемы размножения. Исследование влияния численности популяции на количество холостых гипотез.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 28.04.2017 |
Размер файла | 1,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Кубанский государственный технологический университет
Исследование основных параметров генетического алгоритма метода генетических схем в интеллектуальных системах, основанных на знаниях
Частикова Вера Аркадьевна, к.т.н., доцент
Краснодар
Аннотация
Данная статья посвящена исследованию влияния основных параметров генетического алгоритма метода генетических схем на эффективность поиска решений в экспертных системах. Рассматриваются следующие параметры генетического алгоритма: численность популяции, длина бинарных кодировок, механизм отбора родительских пар, выбор схемы размножения.
Ключевые слова: экспертная система, база знаний, гипотеза, генетический алгоритм, бинарная кодировка, численность популяции
Для исследования эффективности использования и оценки качественных характеристик теоретически обоснованного и разработанного автором метода генетических схем (ГС) для оптимального поиска решений в продукционных экспертных системах (ЭС) с использованием генетических алгоритмов и специальным образом организованных метазнаний и сравнения его с другими методами и алгоритмами оптимизации был создан специальный программный исследовательский комплекс (ПИК) «Поиск», ядром которого является формальная модель экспертной системы (ФМЭС) [1, 4]. ПИК «Поиск» решает следующие задачи:
- создание базы знаний (БЗ) в соответствии с требуемой сложностью (число уровней, количество терминальных фактов, количество гипотез, максимальное число условий в правиле);
- сохранение базы знаний;
- выбор для исследования любой из хранимых баз знаний;
- создание и поддержка функционирования машины логического вывода [5];
- реализация ряда методов, в том числе метода ГС, поиска оптимальных решений в активной базе знаний;
- поддержка пользовательского интерфейса режима генерации метауровней базы знаний методом ГС с возможностью вариации ряда ключевых параметров как генетических алгоритмов, так и ряда других алгоритмов, используемых методом ГС;
- поддержка процесса поиска оптимальных решений в активной базе знаний любым реализованным методом, либо любой совокупностью выбранных из их числа методов;
- поддержка сравнительного анализа качества поиска выбранных для исследования методов.
Данная статья посвящена изучению эффективности разработанного автором метода ГС для применения его в экспертных системах продукционного типа. Исследованию подлежит влияние основных параметров генетического алгоритма (ГА) на эффективность поиска и их оптимизация, причем, чтобы не ограничивать область применения данного метода в определенной для него сфере, автор намеренно исключает из рассмотрения какие-либо особенности построения деревьев вывода ЭС, делая ставку на универсальность этого метода.
Рассматриваются следующие основные параметры ГА:
- численность популяции;
- длина бинарных кодировок;
- механизм отбора родительских пар;
- выбор схемы размножения.
Оценка метода ГС, а также сравнение его с другими методами должна базироваться на некотором «алгоритмонезависимом» признаке, в качестве которого используется число оценок целевой функции (ЦФ), или иначе -- число гипотез, доказанных вхолостую [5].
Влияние численности популяции на точность выхода на достоверную гипотезу. Исследование влияния численности популяции на эффективность поиска оптимального решения в ЭС проводилось при различных фиксированных значениях прочих параметров [2]. Характер влияния практически везде одинаков и совпадает с приведенным ниже случаем.
Для значений параметров, установленных в окне «Консультации» ПИК «Поиск» и представленных на рисунках 1 и 2, и различной численности популяций получены результаты, приведенные в таблице 1 и на диаграмме рисунка 3.
Рисунок 1 - Значения параметров метода ГС окна «Консультации»
Рисунок 2 - Метод ГС: окно «Параметры генетики»
Таблица 1 - Влияние численности популяции на количество холостых гипотез
Численность популяции |
30 |
50 |
100 |
200 |
300 |
400 |
500 |
600 |
700 |
800 |
|
Количество холостых гипотез |
223 |
209 |
147 |
85 |
131 |
88 |
105 |
83 |
130 |
81 |
На диаграмме рисунка 3 приведено суммарное число холостых гипотез, полученное при выполнении 100 экспериментов при каждом запуске теста для одного и того же дерева БЗ.
Рисунок 3 - Влияние численности популяции на число гипотез, доказанных вхолостую
Линейный тренд диаграммы влияния численности популяции на число гипотез, доказанных методом ГС вхолостую, приведенный на рисунке 4, свидетельствует о постепенном убывании числа холостых гипотез с ростом численности популяции ГА, и уже при числе особей в популяции большем 200 данный метод дает стабильно удовлетворительные результаты.
Рисунок 4 - Линейный тренд результатов поиска
Влияние численности популяции на время работы ГА. От того, какова численность популяции, безусловно, зависит время работы ГА. Так, например, для дерева БЗ с 15-ю гипотезами и 4-мя уровнями при 200 особях в популяции максимальное время выполнения ГА max(tГА) = 0.016с., а при 800 особей при прочих равных условиях - max(tГА)=0.109 с. Помимо этого возрастает также время на упаковку хромосом в схемы. Тем не менее, стоит отметить тот факт, что, хотя с ростом численности популяции общее время на формирование метауровней БЗ возрастает, но это возрастание не столь масштабно. К тому же работа ГА осуществляется в рамках подсистемы «Подготовка» и на режим «Консультации» напрямую не влияет. Косвенное же влияние численности популяции на режим «Консультаций» сказывается в том, что увеличение числа особей в поколении приводит к более плотному покрытию хромосомами, а значит и схемами, ландшафта целевой функции и, следовательно, более эффективному использованию метауровней БЗ экспертной системы. бинарный кодировка генетический
Определив порог численности популяции, преодолев который метод ГС позволяет выйти на стабильные результаты поиска решений в ЭС, в дальнейшем все внимание сосредоточено на исследовании влияния ряда параметров метода ГС, которые позволяют еще более повысить его эффективность.
Длина бинарных кодировок
Для поиска оптимального разбиения пространства параметров на гиперкубы [3], кодируемые хромосомными наборами соответствующей длины N*L (N - размерность задачи, L - длина кодировки одного гена), проводились испытания для L1=4, L2=8, L3=12. Эффективность поиска (при численности популяции 300 особей) определялась по отношению к двум показателям:
- суммарному количеству холостых гипотез по 20 запускам;
- времени работы ГА.
Результаты эксперимента для нескольких деревьев БЗ с 15-ю гипотезами и 4-мя уровнями при 300 особях в популяции приведены в табл. 2 и 3 и на рис. 5, 6.
Таблица 2 - Влияние длины бинарных кодировок на количество холостых гипотез
Число бит на ген |
4 |
8 |
12 |
|
Дерево 1 |
32 |
68 |
56 |
|
Дерево 2 |
5 |
48 |
41 |
|
Дерево 3 |
9 |
37 |
28 |
Как видно из представленных диаграмм, для рассматриваемых случаев при увеличении длины бинарного кода гена с 4 до 12 не происходит улучшения эффективности поиска. Вообще, многочисленные эксперименты свидетельствуют, что необходимая длина кодировки в значительной мере зависит от ландшафта целевой функции, ее увеличение положительно сказывается на функциях, ландшафту которых присущи скачкообразные изменения, и наоборот, непрерывная функция слабо чувствительна к длине кодировки. Иногда даже, как в рассматриваем случае, увеличение длины кодировки отрицательно влияет на показатели метода.
Очевидно, такая особенность объясняется разбросом значений приспособленности особей, имеющих одинаковые генотипы, этот разброс тем больше, чем крупнее гиперкубы разбиения пространства [3, 4]. Поэтому в процессе поиска для таких функций сложнее определить хромосомные наборы, которые бы соответствовали оптимальному решению.
Рисунок 5 - Влияние длины кода на количество холостых гипотез
Осторожное отношение к увеличению длины кодировки вызывает и тот факт, что оно ускоряет процесс сходимости всех членов популяции к лучшему найденному решению. Такой эффект очень часто нежелателен из-за того, что большая часть пространства поиска остается неисследованной, а преждевременная сходимость может не привести к оптимальному решению, кроме того, быстрая сходимость к одной области не гарантирует обнаружения нескольких равных экстремумов. Поэтому в вопросе выбора оптимальной длины кодировки нужно достичь некоторого компромиссного решения: с одной стороны, L должно быть достаточно большим, чтобы все-таки обеспечить быстрый поиск, с другой стороны, - по возможности малым, чтобы не допускать преждевременной сходимости и оставить алгоритму шанс отыскать несколько оптимальных значений.
Таблица 3 - Влияние длины кода гена на время выполнения ГА
Число бит на ген |
4 |
8 |
12 |
||
1000* Время ГА |
Дерево 1 |
32 |
47 |
63 |
|
Дерево 2 |
32 |
63 |
125 |
||
Дерево 3 |
30 |
57 |
98 |
Рисунок 6 - Влияние длины кода гена на время выполнения ГА
Здесь уместно еще раз отметить, что ландшафт ЦФ при работе с ЭС продукционного типа, как правило, неизвестен, и, более того, - у каждой гипотезы он индивидуален [2,5]. Как раз выяснению характерных деталей ландшафтов во многом способствуют экспериментальные исследования с использованием ПИК «Поиск». И в отношении длины бинарной кодировки гена единственный выход - ее экспериментальное определение - такое, которое, будучи использовано для всех ГА, обеспечит в целом лучшую эффективность метода ГС.
Таким образом, экспериментально опробовав ряд режимов для сформированного выше дерева БЗ, необходимо сделать вывод, что по обоим анализируемым параметрам предпочтительнее установить бинарную длину гена L=4.
Механизм отбора родительских пар
В ГС с целью предотвращения преждевременной сходимости процесса поиска к квазиоптимальному решению, заложен специальный механизм - механизм отбора.
В ГС использованы два механизма отбора, дающие в совместном использовании наилучшие результаты: элитный отбор и отбор с вытеснением.
Элитный отбор, основан на построении новой популяции только из лучших особей репродукционной группы, объединяющей в себе родителей, их потомков и мутантов. Он используется для ускорения процесса поиска и поэтому обладает потенциальной опасностью преждевременной сходимости. Поэтому в ГС применен очень осторожный подход в реализации этого отбора: в новое поколение отбирается только одна особь с наилучшим значением функции приспособленности [1].
Для компенсации быстрой сходимости, обеспечиваемой элитным отбором, необходимо предусмотреть некоторый противовес. С этой целью применен отбор родительских пар с вытеснением. В данном отборе перенос особи из репродукционной группы в популяцию нового поколения определяется не только величиной ее приспособленности, но и тем, есть ли уже в формируемой популяции следующего поколения особь с аналогичным хромосомным набором.
Из всех особей с одинаковыми генотипами предпочтение сначала, конечно же, отдается тем, чья приспособленность выше. Таким образом, достигаются две цели: во-первых, не теряются лучшие найденные решения, обладающие различными хромосомными наборами, а во-вторых, в популяции постоянно поддерживается достаточное генетическое разнообразие. Вытеснение в данном случае формирует новую популяцию скорее из далеко расположенных особей, вместо особей, группирующихся около текущего найденного решения.
Реализованный в методе ГС механизм особенно хорошо себя показал при решении многоэкстремальных задач [1], при этом помимо определения глобальных экстремумов появляется возможность выделить и те локальные экстремумы, значения которых близки к глобальным.
Помимо описанного выше и заложенного алгоритмически в метод ГС механизма отбора пар, обеспечивающего необходимый баланс между поддержанием на удовлетворительном уровне скорости поиска и предотвращением преждевременной сходимости процесса поиска к квазиоптимальному решению, в методе ГС имеется еще и ряд дополнительных рычагов регулирования сходимости поискового процесса. С помощью этих рычагов еще в большей степени можно влиять на расширение области поиска для ее детального исследования и тем самым использовать их для доводки режима работы метода ГС до оптимального уровня.
Выбор схемы размножения
На рисунке 7 представлена панель установки значений параметров кроссовера ГА, с помощью которой перед запуском формирования метауровней БЗ можно выбрать ряд установок, в частности, схему размножения особей в ГА.
Рисунок 7 - Панель установки параметров кроссовера ГА
Одной из особенностей реализации ГА в ПИК «Поиск» состоит в том, что в нем предусмотрена возможность использования двух схем размножения особей:
- традиционной (вероятностной) схемы;
- альтернативной (детерминированной) схемы.
Использование традиционной схемы предполагает ограничение численности потомков посредством вероятности кроссовера. Алгоритмически вероятностный кроссовер организован следующим образом: в неупорядоченном списке хромосом в соответствии с установкой величины вероятности на панели рисунка 7 находится первый родитель, который скрещивается со следующей за ним хромосомой. Для выбора этой схемы репродукции необходимо выбрать режим «Вероятностный» и в поле «Вероятность/количество пар» установить подходящую величину вероятности кроссовера.
Альтернативная схема позволяет использовать фиксированное число брачных пар в каждом поколении. Для формирования потомков в соответствии с этой схемой на панели рисунка 7 необходимо выбрать режим «Детерминированный» и в расположенном рядом поле «Вероятность/количество пар» задать число брачных пар. В рассматриваемой ситуации алгоритм кроссовера для репродукции берет заданное число первых расположенных по порядку пар хромосом.
Вычислительные эксперименты показали, что при определенных обстоятельствах даже для простых случаев поиска оптимальных решений в продукционной экспертной системе нельзя говорить о преимуществе той или иной схемы размножения [1,4]. Так, например, для одного и того же дерева БЗ с 15-ю гипотезами и 4-мя уровнями при 300 особях в популяции в различных сеансах формирования метауровней с последующими консультациями получены результаты, приведенные на рисунках 8 и 9.
Во всех трех сеансах с различным числом экспериментов для двух схем репродукции получены схожие результаты, и небольшие преимущества, имеющиеся у одной схемы размножения в одном сеансе, могут быть потеряны ею в следующем сеансе. Таким образом, можно сделать вывод о том, что при решении задач поиска оптимальных решений в данной предметной области оказываются приемлемыми обе схемы репродукции, а выбор конкретной схемы для определенной базы знаний может быть возложен на ее проектировщика. Оправданность этого выбора может быть проверена или подкреплена проведением экспериментов с использованием ПИК «Поиск» [1].
Рисунок 8 - Сравнительная оценка двух схем размножения ГА: а) детерминированная схема б) вероятностная схема
Рисунок 9 - Сравнительная оценка двух схем размножения ГА: а) текущие результаты экспериментов; б) суммарный нарастающий итог от эксперимента к эксперименту
Литература
1. Частикова В.А. Оптимизация процессов поиска решений в интеллектуальных системах обработки экспертной информации на основе генетических алгоритмов. Автореферат диссертации на соискание ученой степени кандидата технических наук. - Краснодар: Изд-во КубГТУ, 2005.
2. Симанков В.С., Частикова В.А. Генетический поиск решений в экспертных системах. Монография. - Краснодар: Просвещение-Юг, 2008.
3. Частикова В.А. Структура и способы формирования метауровней базы знаний для эффективного поиска решений в продукционной экспертной системе. - Материалы V Международной научно-практической конференции «Интеллектуальные технологии в образовании, экономике и управлении», Воронеж, 2008.
4. Коломиец Т.В., Малыхина М.П. Формирование базы знаний экспертной системы диагностики СУБД. - Известия высших учебных заведений. Северо-Кавказский регион. Серия: Технические науки. 2007. № 3. С. 5-6.
5. Занин Д.Е., Частиков А.П. Эффективность решения задач ранжировки в информационно-поисковых системах на основе динамических нейронных сетей Хопфилда. - Известия высших учебных заведений. Северо-Кавказский регион. Серия: Технические науки. 2008. № 6. С. 62-65.
Размещено на Allbest.ru
...Подобные документы
Этапы работы генетического алгоритма, область его применения. Структура данных, генерация первоначальной популяции. Алгоритм кроссинговера - поиск локальных оптимумов. Селекция особей в популяции. Техническое описание программы и руководство пользователя.
реферат [1014,2 K], добавлен 14.01.2016Первые работы по симуляции эволюции. Основные понятия генетических алгоритмов. Постановка задачи и функция приспособленности. Инициализация, формирование исходной популяции. Выбор исходной популяции для генетического алгоритма, решение задач оптимизации.
курсовая работа [714,1 K], добавлен 31.03.2015Описание принципа работы генетического алгоритма, проверка его работы на функции согласно варианту на основе готовой программы. Основные параметры генетического алгоритма, его структура и содержание. Способы реализации алгоритма и его компонентов.
лабораторная работа [20,2 K], добавлен 03.12.2014Комплексное исследование истории развития, основных понятий, области применения и особенностей генетических алгоритмов. Анализ преимуществ генетических алгоритмов. Построение генетического алгоритма, позволяющего находить максимум целочисленной функции.
курсовая работа [27,9 K], добавлен 23.07.2011Программа реализации генетического алгоритма, использование визуальной среды программирования. Руководство пользователя, листинг программы. Возможность ввода параметров: объем популяции, число поколений, коэффициент скрещивания и мутации, число городов.
курсовая работа [2,9 M], добавлен 20.08.2009Оптимизация показателей эффективности функционирования технологического контура системы управления космическим аппаратом, исследование свойств его показателей. Настройка нейронной сети, гибридизация генетического алгоритма с алгоритмами локального поиска.
дипломная работа [4,5 M], добавлен 02.06.2011Операторы генетического алгоритма. Пример простейшей программы. Процесс генерации и накопления информации о выживании и продолжении рода в ряде поколений популяции. Программа, реализующая простой генетический алгоритм для нахождения минимума функции.
курсовая работа [39,3 K], добавлен 29.10.2012Создание дискретной модели популяции и определение развития численности популяции в зависимости от начального числа особей. Составление карты поведения системы. Процесс проектирования информационных систем, реализующих новую информационную технологию.
дипломная работа [1002,8 K], добавлен 09.10.2013Характеристика методов нечеткого моделирования и изучение системы кластеризации в пакетах прикладных программ. Разработка и реализация алгоритма для оптимизации базы правил нечеткого классификатора с помощью генетического алгоритма аппроксимации функции.
дипломная работа [1,9 M], добавлен 21.06.2014Описание генетических алгоритмов. Применение генетического алгоритма для решения задачи коммивояжера. Постановка задачи безусловной оптимизации. Изучение распространения генетических алгоритмов на модель с несколькими взаимодействующими популяциями.
дипломная работа [979,1 K], добавлен 30.05.2015Сущность интеллектуальных систем. Запись математического выражения в виде ориентированного графа. Особенности разработки генетического алгоритма для решения задачи аппроксимации логического вывода экспертной системы на основе метода сетевого оператора.
дипломная работа [1,0 M], добавлен 17.09.2013Основные генетические операторы. Схема функционирования генетического алгоритма. Задачи, решаемые с помощью генетических алгоритмов. Математическая постановка задачи оптимизации. Решение Диофантова уравнения. Программная реализация. Создание пособия.
курсовая работа [391,4 K], добавлен 20.02.2008Создание программы для поиска минимума функции двух вещественных переменных в заданной области с помощью генетического алгоритма. Генетические алгоритмы и операторы. Создание начальной популяции. Размножение. Мутация и селекция. Тестирование программы.
курсовая работа [131,6 K], добавлен 22.02.2015Анализ современного состояния общей проблемы синтеза моделей многофакторного оценивания и подходов к ее решению. Разработка математической модели метода компараторной идентификации модели многофакторного оценивания. Описание генетического алгоритма.
дипломная работа [851,7 K], добавлен 11.09.2012Основные особенности эволюционных алгоритмов. Описание алгоритмов селекции, мутации, скрещивания, применяемых для реализации генетических алгоритмов. Вычисление функции приспособленности. Программная реализация. Тестирование и руководство пользователя.
курсовая работа [1,3 M], добавлен 11.03.2014Теоретические основы и проблемы принятия решений. Синтез модели многофакторного оценивания, метод компараторной идентификации. Особенности реализации базового генетического алгоритма. Программный способ определения эффективного состава команды проекта.
дипломная работа [733,1 K], добавлен 09.06.2012Содержание фундаментальной теории гена. Описание простого генетического алгоритма поиска оптимальных решений. Сущность понятий "кроссинговер", "сайт", "иллегальная рекомбинация". Этапы реализации алгоритма Девиса по перераспределению участков хромосом.
контрольная работа [23,7 K], добавлен 17.09.2010Исследование нечеткой модели управления. Создание нейронной сети, выполняющей различные функции. Исследование генетического алгоритма поиска экстремума целевой функции. Сравнительный анализ нечеткой логики и нейронной сети на примере печи кипящего слоя.
лабораторная работа [2,3 M], добавлен 25.03.2014Сравнение результатов работы генетического алгоритма по решению "несимметричной незамкнутой задачи коммивояжера" с результатами работы алгоритма динамического программирования по параметрам - время работы, точность результата и объем используемой памяти.
курсовая работа [65,3 K], добавлен 16.04.2014Исследование процедуры ввода графического изображения основных компонентов аналоговых электронных схем, с присвоением им определенных параметров и с созданием чертежей принципиальных схем. Принципиальные схемы пассивного фильтра и усилительного каскада.
лабораторная работа [220,4 K], добавлен 22.10.2015