Представление преобразования "генотип – фенотип" для генетических вычислений
Анализ способа повышения эффективности эволюционно-генетического поиска. Разработка конкретных механизмов кодирования модульных сетевых структур, описание процедур прямых и обратных преобразований. Применение графовых грамматик для перехода к фенотипу.
Рубрика | Биология и естествознание |
Вид | статья |
Язык | русский |
Дата добавления | 26.04.2019 |
Размер файла | 118,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
П. П.Макарычев, Н. В. Слепцов
Размещено на http://www.allbest.ru/
72
ВЕСТНИК ПЕРМСКОГО УНИВЕРСИТЕТА
2011 Математика. Механика. Информатика Вып. 1(5)
62
Пензенский государственный университет
Представление преобразования "генотип - фенотип" для генетических вычислений
П.П. Макарычев, Н.В. Слепцов
Аннотация
Рассмотрен способ повышения эффективности эволюционно-генетического поиска. Предложены конкретные механизмы кодирования модульных сетевых структур, описаны процедуры прямых и обратных преобразований.
Ключевые слова: эволюционно-генетический поиск; кодирование; сетевые структуры; преобразования.
Annotation
Transformation representation "a genotype - a phenotype" for Genetic calculations
P. P. Makarychev, N. V. Sleptsov Penza State University
The way of increase of efficiency avolution - genetic search is considered. Concrete mechanisms of coding of modular network structures are offered, procedures of direct and return transformations are described.
Key words: evolutionary and genetic search; encryption; network structure; transform.
1. Введение
Эффективность работы элементов биологических систем обусловила использование принципов биологической эволюции для оптимизации деятельности важных систем.
В общем виде эволюционный алгоритм - это оптимизационный метод, базирующийся на эволюции популяции "особей". Каждая особь характеризуется приспособленностью - многомерной функцией ее генов. Задача оптимизации состоит в максимизации функции приспособленности. В процессе эволюции в результате действия генетических операций - отбора, рекомбинаций и мутаций - геномов особей происходит поиск особей с высокими показателями приспособленности.
Преимущества эволюционных алгоритмов в свою очередь способствовали разработке способов формального и целенаправленного управления методами эволюционно-генетических вычислений (ЭГВ). Конкретизация применений данных методов предполагает реализацию 2 составляющих: представление исходной проблемы и обеспечение конструктивности получаемых/генерируемых решений. Обе составляющие тесно связаны друг с другом и поэтому методы решения, применяемые в одном случае, востребованы, хотя бы частично, в другом.
Представление исходной проблемы - формирование отображения структуры данных задачи в код ЭГВ [1, 7]. Принципиально здесь речь идет о прямом кодировании задачи в генотипе особи или о кодировании алгоритма получения (точнее - развертывания) решения в фенотипе. Достоинства и недостатки подходов очевидны: в первом случае обеспечивается наглядность, но возникают проблемы с манипулированием строками большой размерности, что ограничивает размерность и модульность итоговых решений, во втором случае обеспечивается и размерность, и модульность решений, но мы отказываемся от прозрачности представления задачи в генетическом коде и дополнительно решаем проблему преобразования генотипа в фенотип. Последняя проблема принципиально не может быть разрешена однозначно [2, 3, 4], требует анализа и учета дополнительных факторов и механизмов, однако ее потенциальная мощность должна интенсивно исследоваться [7].
2. Кодирование модульности
Процесс построения любой сложной структуры предполагает использование одних и тех же фрагментов, комбинирование которых с различными вариациями и масштабами обеспечивает быстрое конструктивное решение проблемы с оптимально эффективным использованием ресурсов. В значительной степени все природные структуры в своем построении и развитии используют этот принцип на всех уровнях - от развития кодирующих фрагментов в ДНК до развития целостных организмов и эволюции видов. Можно сказать, что основой этого принципа является итеративная самоподобность.
Из итерационной природы перехода от генов к организмам (или от генотипа к фенотипу) следует, что генетический код не описывает точно конечную форму организма, а определяет множество правил, выполнение которых приведет к конечной форме. Это означает, что отсутствует взаимно однозначное соответствие между частью генетического кода и частью фактического организма. Такой подход позволяет при генетическом поиске использовать раз обнаруженные принципы многократно: в развитии, эволюции объединяются, комбинируются не получившиеся организмы, фрагменты, модули, а рецепты, по которым они построены.
Важная характеристика любых природных систем - модульность - в значительной степени присуща мозгу, поэтому правомерно выявить преимущества, которые можно получить при применении данного принципа для создания искусственных нейронных сетей (ИНС). Очевидные преимущества - относительная простота, большая определенность функций, меньшие затраты на проектирование и обучение, принципиальная возможность простой модификации сети для получения новых характеристик - представляются исключительно многообещающими, и, как показывают результаты ряда исследований, в целом эти преимущества обеспечиваются на деле [5, 6, 10, 12]. Однако результатов исследований по большим ИНС с модульной структурой мало. Проблема в том, что поведение ИНС является очень сложным: даже для хорошо разработанных алгоритмов, типа алгоритма обратного распространения, очень трудно, если не невозможно, точно определить, что происходит внутри сети, особенно при наличии скрытых слоев. Ситуация еще больше осложняется при использовании рекуррентных сетей, свободных от ограничений, накладываемых алгоритмом обратного распространения ошибки. Поведение таких сетей описывается большим числом связанных дифференциальных уравнений, малоразрешимых на практике. В результате невозможно заранее вычислить оптимальную топологию сети для определенной задачи и единственным способом проверки качества работы конкретной сети является тестирование, а единственное описание поведения сети можно получить при ее моделировании.
Использование ЭГВ и конкретно генетических алгоритмов (ГА) освобождает нас от рассмотрения упомянутой выше проблемы: невозможности описания, почему одна сеть выполняет действия лучше другой. Единственным двигателем репродуктивного функционирования ГА является пригодность к его использованию членов популяции. Эта оценка пригодности может быть легко вычислена. В результате действия сводятся к генерации нейронной сети, код которой представлен одним из членов популяции, и к проверке ее свойств.
Для поиска решений нейронной сетью с применением ГА есть несколько методов, главные из них приведены ниже.
· Применение ГА для поиска весов данной структуры сети, которые дают минимальную ошибку. При этом ГА используется вместо алгоритма обучения, например алгоритма обратного распространения. Гены применяемого ГА имеют взаимно однозначное соответствие весам сети. Незначительные модификации этого метода дают ГА для поиска весов, обеспечивая очень точную настройку алгоритма обучения [6 и 12].
· Использование ГА для поиска структуры сети. Этот метод ГА осуществляет поиск оптимальной структуры сети, а не настройку весов для данной структуры. Гены ГА содержат кодировку для топологии сети, определяя наличие связей. Веса сети должны настраиваться в процессе обычного обучения [10].
Возможны также комбинации этих двух методов: кодирование существующих связей и их весов в генах. Однако большее внимание раздельному использованию методов объясняется тем, что при удачной топологии сети процесс настройки весов быстро сходится и такую настройку легче проводить обычными алгоритмами обучения.
В большинстве работ, посвященных поиску удачных топологий сети с применением ГА, использован подход, основанный на методе проекта кодирования топологии в генах членов популяции [9]. Но фактически такой подход означает упрощение, поскольку кодировка генами определяет не проект, а способ, рецепт получения окончательного результата. Поэтому представляет особый интерес способ описания развертывания кодировки в результат перехода от генотипа к фенотипу. Задача облегчается тем, что окончательный объект - ИНС - допускает четкое формальное описание.
3. Применение графовых грамматик для перехода к фенотипу
генетический фенотип графовый модульный
Нейронная сеть, рассматриваемая как соединение узлов и дуг, является графом; соответственно метод описания кодирования ИНС должен относиться к методам генерации графов. Недостатком существующих формальных языков описания графов [10] является то, что они не позволяют в явной форме отражать развитие исследуемых форм (конструкций, растений и т.д.). L-системы - модель реального мира, основанная на имитации роста и развития биологических объектов. Математически L-системы - специальный класс фракталов. L-систему можно определить как параллельный строковый перезаписывающий механизм, являющийся одной из разновидностей грамматик.
Рис. 1 Представление системы L1: аксиома F F> F [+F]F[-F]F 5 шагов, д = 26°
По определению грамматика включает начальную строку и набор правил продукций (вывода). Начальная строка - аксиома - переписывается с применением правил вывода, каждое такое правило определяет, каким образом определенный символ или подстрока будут перезаписаны другими символами. Практически во всех грамматиках правила вывода применяются последовательно, одно за другим, а в L-системе все символы в строке при формировании новой строки переписываются параллельно. При присвоении символам строки определенной интерпретации можно обеспечить ее визуализацию.
Каждый символ может интерпретироваться как направление, например, если F будет означать рисование линии, - и + соответственно левый и правый повороты, то действия при разборе элементов строки будут состоять из рисования линии и поворотов. Величину угла для символов - и +, которая может меняться, обозначим д. Левая часть правила вывода (до -->) описывает подстроку, которая будет заменена.
Принципиально могут использоваться любые другие символы помимо приведенных, например, f может интерпретироваться как перемещение без рисования. Для реальных естественных и технических систем необходимо представление точек ветвления, для которых введем два специальных символа:
[ - запомнить текущую позицию и направление перемещения;
] - восстановить последнюю сохраненную позицию и направление.
Применение этих скобочных символов обеспечивает реалистичное отображение (см. рис. 1 [11]).
Одно из главных преимуществ L-систем по сравнению с обычными графовыми грамматиками - простота включения контекста, что позволяет задать явную аналогию дифференциации узла (фрагмента, ячейки) при росте ИНС.
а б
Рис 2 Правила вывода
Предпринимается попытка объединить три метода, имеющих в той или иной степени исходные точки происхождения в биологии:
· генетические алгоритмы,
· L-системы,
· искусственные нейронные сети,
для того чтобы спроектировать метод автоматического поиска оптимальных модульных нейросетевых структур.
Применяемый подход основывается на следующей совокупности шагов:
1. ГА генерирует строку битов, хромосому члена популяции. Поиск ГА направлен на получение членов популяции с высокой пригодностью, оцениваемой по данным, получаемым на шаге 3.
2. L-система обеспечивает развитие ИНС, следуя правилам, закодированным в хромосоме. Хромосома декодируется и преобразуется в ряд правил вывода. Они применены к аксиоме для произведения ряда итераций, и получающаяся строка преобразуется в спецификацию структуры для сети.
3. Полученная ИНС обучается для выполнения конкретной задачи. Итоговая ошибка преобразуется в оценку пригодности, это значение возвращается ГА (рис. 3).
Рис. 3 Взаимодействие применяемых методов
4. Кодирование и переход от сетевого представления к строковому
В соответствии с изложенным ГА должен управлять определенной популяцией, состоящей из наборов правил вывода. Каждый член популяции - двоичная строка, содержащая одно или более правил вывода для L-системы. Для определения пригодности строки производится извлечение из нее правила вывода, далее L-система перезаписывает аксиому, используя эти правила. Получающаяся строка интерпретируется как сеть, которая далее обучается, например, методом обратного распространения. Применение метода обратного распространения ограничивает возможную топологию прямонаправленными сетями: все узлы индексируются так, что присутствуют только связи от ni до nj для i<j.
Способы представления сети можно выбирать различными. Так, возможен способ представления, при котором строки не содержат нумерованных скобок (сами скобки присутствуют), а для указания относительного перехода в пределах строки с целью идентификации определенной связи используются цифры. Варианты представления - соседние символы (они же узлы) связываются по умолчанию, и применяемая запятая используется для обозначения отсутствия такого соединения, либо соседние символы по умолчанию не связаны, и для указания связи между соседними символами применяется знак минус. Такое представление можно назвать строками с относительным пропуском.
Примеры сетей. Рассмотрим ряд структур, применяемых для оценки эффективности применяемых строчных нотаций.
Рис. 4 Базовые элементы сети
На рис. 4. показаны четыре основных элемента, применяемых при оценке строк; a и b - простые структуры, c и d комбинируют эти элементы, вводя элементы модульности, что необходимо для представления грамматики.
На рис. 5 представлены две стандартные сети, способные разрешить столь же стандартную проблему исключающего ИЛИ (XOR). Дополнительная связь в b обеспечивает лучшие результаты, хотя кодирование строки в этом случае будет сложнее.
a b Строки с относительным пропуско
Рис. 5 Сети XOR
Строки с относительным пропуском. Строки образованы символами {A-Z, 1-9, [,]} {,}.Узлы сети представляются символами алфавита (A-Z). Два смежных символа по умолчанию определяют прямую связь. Два разделенных запятой символа означают отсутствие связи. Модули указываются группировкой узлов (или других модулей) внутри квадратных скобок.
Скобки, в отличие от многоуровневых строк, не индексированы. Два смежных модуля не являются полносвязанными, по умолчанию для таких модулей все выходные узлы продукции первого модуля связаны со всеми входными узлами второго модуля.
Входной узел не имеет ни одного входа из внутренней части модуля, выходной узел продукции не имеет никаких выходов к узлам в пределах модуля.
Такое соединение модулей облегчает комплексирование независимых сетей в одну большую сеть. Для предотвращения связи двух смежных модулей, как и в случае с одиночными символами, используется запятая. Для указания связей между несмежными узлами или модулями в строке применяются одиночные цифры, обозначающие пропуск определенного числа узлов\модулей в пределах строки.
Цифра x интерпретируется как "пропуск x узлов и/или модули с правой стороны от текущей позиции и образование связи со следующим узлом или модулем".
Для строки A1BC узел A связан с C (1-пропуск B), но также и с B, поскольку между A и B отсутствует запятая). Для строк A1, BC или A,1BC узел A связан только с С. При пропуске модули интерпретируются как одно целое, поэтому для строки A1,[BC]D узел A связан с D, но не с C.
Если указатель пропуска содержится в модуле и выходит за пределы закрывающей скобки, пропуск продолжается после ].
В строке [A2 [B, C] D] E узел A связан с узлами B и C, потому они оба являются входными узлами модуля [B, C] (при отсутствии запятой между B и C A не был бы связан с C). Узел A также связан с узлом E, поскольку указатель пропуска 2 обеспечивает пропуск [B, C] и D и соединяет узел с E (несмотря на то, что E находится вне модуля, содержащего A).
Сеть, закодированная такой строкой, представлена на рис. 6.
Рис 6 Интерпретация строки [A2 [B, C] D] E
Базовые сети
Кодирование базовых сетей осуществляется примитивно:
сеть 4a: А (или любой другой символ из A-Z),
сеть 4b: AA,
сеть 4c: [A,A] A (оба узла А в [A, A] - выходные),
сеть 4d: [A, A2] A, AA
сети XOR
сеть 5a: [A, A] [A, A] A
сеть 5b: [A, A1] [A, A] A (отметим, что строки подобны).
Для генерации внутренних несвязанных узлов (модулей) правила вывода должны обеспечивать вставку символов разделения - запятых - в строки. Проще всего такую возможность обеспечить незначительной модификацией правил, например, смежные символы могут по умолчанию интерпретироваться как несоединенные узлы, а для соединения явно указывается символ нулевого пропуска - `-`. Тогда имеем
сеть 4c: [AA]-A,
сеть 4d: [AA2] - AA-A,
сеть 5a: [AA] - [AA]-A,
сеть 5b: [AA1] - [AA]-A.
Правила вывода. L-система, используемая для генерации строк, описанная выше, относится к классу 2L-систем: каждое правило вывода может иметь и левый, и правый контекст. Формат правила вывода: L <P> R >S.
На компоненты правил вывода накладываются следующие ограничения.
Предшественник (P) может содержать только завершенные модули и узлы, поэтому число левых и правых скобок должно быть равным и иметь определенную последовательность. Каждый модуль должен быть завершенным, поэтому строки типа A] BC [D недопустимы. Кроме того, предшественник не должен содержать пустых модулей ([ ]) и наконец, он должен содержать по крайней мере один узел (символ).
Преемник (S) имеет те же самые ограничения. Преемник может отсутствовать, когда предшественник удален из строки по правилам вывода.
При наличии контекста применяют те же самые ограничения, что к предшественнику и преемнику. Дополнительно недопустимы никакие свободные цифры: каждая цифра должна следовать за узлом или модулем, так, строка 1A [B] недопустима (лидирующая 1).
В данной L-системе контекст сопоставляется с кодирующими символами узлов, при этом один или более узлов в предшественнике получают свой вход (левый контекст), или символы узлов связаны с выходом одного или более узлов в предшественнике (правый контекст). Из-за такой интерпретации контекста строку контекста следует рассматривать как список множества узлов и/или модулей, каждый их которых связан с предшественником в момент образования.
Контекст должен быть подмножеством всех узлов, связанных с предшественником (левый контекст), или всех узлов, с которыми предшественник связан (правый контекст), перечисленным в порядке просмотра.
Рассмотрим правила вывода (рис. 7). Если в качестве аксиомы берется символ А, процесс вывода может быть описан следующим образом.
Сначала мы имеем аксиому А (рис. 8,a).
Рис. 7 Типовые правила вывода
После первого шага перезаписи получили строку BBB (рис. 8,b).
В течение второго шага первый символ B перезаписывается с использованием правила 2, поскольку первый символ B связан со вторым (рис. 8,c). Второй символ B также перезаписывается по правилу 2 (рис. 8,d). К третьему символу B применяется правило 3, потому что этот символ не связан с другими (есть только связь от другого B). В конечном счете это приводит к появлению строки [C,D][C,D]C, (рис. 8,е). Поскольку вся перезапись проводится параллельно, строки для 8,c и 8,d не формируются отдельно, а производится непосредственное преобразование сети 8,b в 8,е. Промежуточные стадии приводятся для пояснения.
Третий шаг - первый символ D перезаписывается по правилу 5, поскольку первый символ D связан со вторым (рис. 8,f), а второй символ D перезаписывается по правилу 4, поскольку первый символ C связан со вторым символом D.
Рис. 8 Преобразования для правил на рис. 7
Дальнейшее применение правил вывода невозможно, поэтому конечная строка имеет вид, приведенный на рис. 8,g. Аналогично рис. 8,с и 8,d рис. 8,f приведен только для пояснения, в действительности при параллельной перезаписи переход производится из рис. 8,е в рис. 8,g.
5. Кодирование правил вывода
ГА работают с закодированными параметрами задачи. В нашем случае параметры представляют ряд правил вывода.
Правило вывода включает четыре (возможно пустых) части, каждая является строкой алфавита {A-Z, 1-9, [,]} {,}. Полный алфавит подразумевает использование 26 различных символов, хотя возможно их любое количество. То же относится к количеству символов пропуска. Например, мы может произвольно допустить применение 8 различных символов (A-H) для узлов и 5 - для пропусков (1-5), что дает нам 16 символов алфавита 16 (8+5+2+1).
Каждый символ правила будем представлять двоичной строкой фиксированной длины. Двоичная строка длиной l обеспечивает кодирование 2l различающихся символов. Любой из 2l кодов может быть назначен каждому из символов нашего алфавита, поэтому необходимо определить как величину l, так и закрепленные коды за символами.
В качестве основы выберем биологический генетический код, использующий четыре кода символа. Каждое из четырех различных оснований, используемых в генетическом коде, закодировано набором из двух цифр, поэтому каждый триплет оснований в нашем представлении будет заменен двоичной строкой длиной 6.
64 возможных значения строки длиной 6 распределены среди 17 символов, эти 17 символов включают 16 символов нашего алфавита плюс специальный символ (звездочка), используемый для отделения составных частей правил вывода (контекст, предшественник, преемник) друг от друга в пределах хромосомы. Звездочки аналогичны маркерам начала и конца, используемым при преобразовании РНК - > белок. Полученная таблица представлена ниже.
Для определения символа, соответствующего битовой строке, находим, какое из четырех обозначений групп рядов слева соответствует первым двум битам строки. Далее выбираем колонку по значениям двух средних битов и наконец выбираем ряд справа по двум последним битам. Так, символ для кода 100100 - первое А в таблице.
Таблица преобразования
00 |
01 |
10 |
11 |
|||
3 |
[ |
D |
] |
00 |
||
3 |
[ |
D |
] |
01 |
||
00 |
||||||
* |
[ |
2 |
2 |
10 |
||
* |
[ |
2 |
5 |
11 |
||
* |
1 |
E |
] |
00 |
||
* |
1 |
E |
] |
01 |
||
01 |
||||||
* |
1 |
F |
] |
10 |
||
* |
1 |
F |
] |
11 |
||
2 |
A |
G |
[ |
00 |
||
2 |
A |
G |
[ |
01 |
||
10 |
||||||
2 |
A |
H |
] |
10 |
||
4 |
A |
H |
] |
11 |
||
, |
B |
* |
C |
00 |
||
, |
B |
* |
C |
01 |
||
11 |
||||||
, |
B |
[ |
C |
10 |
||
, |
B |
[ |
C |
11 |
Обратное преобразование символ - код производится по тому же принципу: двум первым битам соответствуют обозначения слева, следующим битам - сверху и последним битам соответствуют обозначения справа. Так, для символа 5 битовой строкой является 001111.
Символ '*' применяется для отделения четырех частей единой продукции. Для извлечения из хромосомы правила вывода выполняются следующие шаги.
1. В битовой строке (хромосоме) выбирается отправная точка. С этого момента начинается чтение L-части правила вывода.
2. Выполняется чтение по 6 битов одновременно и по таблице определяется соответствие символа считанным 6 битам.
3. Если символ не является разделителем, он добавляется к уже считанной строке.
4. Иначе, уже считанная строка (она может быть пустой) назначается текущей частью правила вывода (L, P, R или S). Производится переход к следующей части правила вывода. Если последняя прочитанная часть - S, осуществляется переход к началу считывания следующего правила вывода.
5. Шаги 2-4 повторяются, пока не прочитаны все биты хромосомы. Если битов для окончания текущего правила вывода нет, данное правило отбрасывается.
Для реальной ДНК чтение информации выполняется начиная с выбора отправной точки последующим чтением триплетов оснований до точки останова, что является признаком окончания процесса `создания` текущего белка, после чего начинается построение нового белка.
Результаты ряда исследований показывают, что одной и той же генетической информацией могут быть закодированы различные белки. Различные белки строят регулированием отправной точки, для чего выбирают только одно основание вместо трех, необходимых для одного кодового слова, поэтому реальная генетическая информация может рассматриваться как множество перекрывающихся рецептов для различных белков.
Для реализации такого механизма при выбранном нами способе кодирования хромосом алгоритм может начать считывание в любом двоичном разряде.
В результате этого хромосома может быть прочитана различным образом двенадцать раз для прямого и обратного порядка чтения. Из-за высокого уровня кодированной информации, содержавшейся в хромосомах, уровень неявного параллелизма может в конечном счете быть значительно выше по сравнению с ГА, у которого строки являются доступными только для однократного чтения.
Рис. 9 Битовые строки, полученные при проходах трансляции хромосомы
На рис. 9 показана битовая строка для четырех проходов трансляции. Остальные проходы не приведены, чтобы не перегружать рисунок.
Запишем эти четыре трансляции с учетом направления просмотра:
*2][[]A*
, H[2[D,
*A*BBB*
,*2]]C1,
Ни одна из этих строк не формирует полное правило вывода самостоятельно, но если мы будем интерпретировать третью строку как часть длинной строки, например F1, **A*BBB*C*A]] (где полужирная часть - третья строка), подчеркнутая часть может рассматриваться как полное правило вывода (она содержит пять звездочек). При записи продукции в обычной нотации получаем
A> BBB > C
Механизм коррекции. Хромосомы длиной l могут задать 2*6*(l/6) символов (число символов больше, чем общее количество битов). Для хромосом длиной 1024 битов это даст строку в 2040 символов. Общее количество возможных допустимых правил вывода для строки этой длины около 250: 64-символьная адресная таблица содержит 8 `*`, таким образом, строка в 2040 символов содержит примерно 255 маркеров. Почти каждый маркер может использоваться как отправная точка для вывода правила (кроме последних четырех в конце каждой десятой строки). Если отказаться от всех правил вывода с комбинацией запрещенного символа, число правил вывода значительно уменьшится.
При работе реальной ДНК за несколько часов между репликацией (дублированием ДНК) и митозом (фактическим делением клетки) проходит период очень активного восстановления и корректуры кода. Специальные ферменты выключают дефектные области и заменяют их соответствующими нуклеотидами, именно из-за этого в процессе дублирования клетки очень редко происходят ошибки (если это действительно случается, то идет процесс, который называется мутацией). Отсюда следует, что и программная реализация ГА может содержать функции восстановления дефектных строк. Эти функции удаляют свободные скобки, запятые, цифры и т.д. для строки, чтобы выполнить ограничения, накладываемые на строки правилами вывода. Число пригодных для использования правил вывода после такого процесса коррекции - обычно около 50.
6. Заключение
Предлагаемый подход для кодирования представления задачи при эволюционных вычислениях обеспечивает сочетание компактности, модульности кодирования с конструктивизмом при отсутствии ограничений на размер генерируемых решений.
В приложениях, связанных с построением ИНС, с помощью этого подхода возможно формирование модульных решений с характеристиками, близкими к оптимальным по соотношению критериев: время получения работоспособной сети / качество решения /число узлов / число связей.
Список литературы
1. Емельянов В.В., Курейчик В.В., Курейчик В.М. Теория и практика эволюционного моделирования. М.: ФМЛ, 2003. 432 с.
2. Мосалов О.П., Редько В.Г. Модель эволюционной ассимиляции приобретенных навыков в нейросетевых системах управления адаптивных агентов // Нейроинформатика-2005: сб. науч. тр. В 2-х ч. Ч.1. М.: Изд-во МИФИ, 2005. C. 210-217.
3. Редько В.Г. Эволюционная кибернетика. М.: Наука, 2001. 156 с.
4. Фогель Л., Оуэнс А., Уолш М. Искусственный интеллект и эволюционное моделирование. М.: Мир, 1969. 230 с.
5. Цой Ю.Р., Спицын В.Г. Эволюционный подход к настройке и обучению ИНС // Нейроинформатика. 2006. № 1. С.30-61.
6. Angeline P.J., Saunders G.M., Pollack J.B. An Evolutionary Algorithm that Constructs Recurrent Neural Networks // IEEE Transactions on Neural Networks. 1994. №. 5(1). P.54-65. См. также: http://citeseer.ist.psu.edu/
7. Chambers Practical handbook of genetic algorithms v 3 Complex coding systems 2 ed, 2001. 659 р.
8. Gruau F. Genetic synthesis of Boolean neural networks with a cell rewriting developmental process // Proceedings of the International Workshop on Combination of Genetic Algorithms and Neural Networks (COGANN-92). Los Alamos, CA: IEEE Computer Society Press, 1992. P.55-74. См. также: http: //www.cs.colostate.edu/~genitor/
9. Holland J.H. Building Blocks, Cohort Genetic Algorithms, and Hyperplane-Defined Functions // Evolutionary Computation. 2000. №4(8). P.373-391.
10. Kitano H. Designing neural network using genetic algorithm with graph generation system // Complex Systems. 1990. № 4. P.461-476.
11.Koza J. Genetic programming: a paradigm for genetically breeding computer population of сomputer programs to solve problems. Cambridge, MA: MIT Press, 1992. 452 р.
12.Yao X. Evolving artificial neural networks // Proceedings of the IEEE. 1999. №9(87). P.1423-1447. См. также: http: //www.cs.bham.ac.uk/~xin/
Размещено на Allbest.ru
...Подобные документы
Модификационная изменчивость - процесс взаимосвязи организма со средой; популяции и чистые линии; фенотип и генотип. Мутационная изменчивость: типы, классификация. Закон гомологических рядов в наследственной изменчивости, использование в селекции.
курсовая работа [53,6 K], добавлен 09.06.2011Материальные основы наследственности. Системы пищеварения, кровообращения, кроветворения человека. Понятие о предельно-допустимых концентрациях и классах опасности загрязняющих веществ. Ксенобиотики и кумулятивный эффект. Изменчивость, генотип и фенотип.
реферат [1023,7 K], добавлен 10.03.2015Особенности эволюции человека как биологического и социального существа, а также понятие "генотип" и "фенотип". Классификация мутации, основанной на размерах сегментов генома. Комплементация функционального дефекта в клетках больных анемией Фанкони.
курсовая работа [48,2 K], добавлен 15.08.2014Механизм эволюции прокариотического и эукариотического геномов. Свойства, отбор и динамика рисунка локализации мобильных генетических элементов. Роль мобильных генетических элементов и горизонтального переноса генетического материала в эволюции генома.
курсовая работа [84,5 K], добавлен 30.09.2009Генотип и среда как факторы межиндивидуальной изменчивости кожно-гальванической реакции человека, характер и особенности их влияния. Генетические исследования деятельности сердечнососудистой системы, этапы и принципы их проведения, анализ результатов.
контрольная работа [25,0 K], добавлен 12.02.2016Исследование механизмов передачи генетического материала и создание новых способов генетического картирования. Перенос генетического материала с помощью плазмид, с помощью рекомбинации и посредством трансдукции. Генетическое картирование актиномицетов.
реферат [25,9 K], добавлен 15.12.2010Явление малой периодичности. Число изотопов в элементе. Факты дивергенции таксонов по фенотипу. Периодичность фенотипа на уровне популяции. Признак феноформ ранневесеннего распускания деревьев. Периодичность норм фенотипа на уровне среднего индивида.
статья [1,2 M], добавлен 04.01.2012Генотип как совокупность всех наследственных факторов организма, его отличие от фенотипа. Возможные комбинации взаимосвязи генотипа со средой. Роль биологическая и социальной наследственности и среды в формировании индивидуальных свойств личности.
презентация [873,3 K], добавлен 21.03.2014Основные типы взаимодействия неаллельных генов. Комплементарное взаимодействие на примере наследования формы гребня у кур. Расщепление по фенотипу. Эпистатическое взаимодействие генов. Доминантный эпистаз на примере наследования масти у лошадей.
презентация [121,3 K], добавлен 12.10.2015Применение основных эволюционных методов для поиска предпочтительных решений. Приближенные методы решения задач оптимизации и структурного синтеза. Процесс минимизации потенциальной энергии тела. Реализация простого генетического алгоритма в MATLAB.
курсовая работа [106,9 K], добавлен 15.12.2011История исследования возможности получения потомков с точной генетической копией организма. Описание методов трансплантации ядер, генетического перепрограммирования клеток кожи и SLIC (sequence and ligation-independent cloning) способа клонирования.
реферат [113,1 K], добавлен 15.06.2010Этапы проведения экспериментов по переносу генетического материала, применение технологий для изучения процессов дифференцировки, канцерогенеза. Условия культивирования клеток. Виды и назначение селекции. Перенос генов, опосредованный хромосомами и ДНК.
учебное пособие [25,1 K], добавлен 11.08.2009Фенотип и программа для его построения, передающаяся по наследству. Физическое распределение Максвелла. Основные каналы передачи информации от ДНК к признакам организма и от ДНК родителей к ДНК потомков. Дарвиновская неопределенная изменчивость.
презентация [573,4 K], добавлен 17.10.2014Разработка метода рекомбинантных ДНК. Анализ наследования семейных заболеваний и изучение генетического сцепления у человека в случаях, когда возникают осложнения: генетическая гетерогенность и фенокопии. Карта генетического сцепления генома человека.
учебное пособие [2,0 M], добавлен 11.08.2009Методы предупреждения наследственных заболеваний. Методологический план понятия "генетические факторы". Особенности генотипа человека, классификация факторов, на него воздействующих. Мутации как наследственно закрепленные изменения генетического кода.
презентация [125,9 K], добавлен 15.12.2010Полимеризация и тканевая субституция биологических структур. Исследования генетических основ редукции органов. Ослабление функций, редукция и исчезновение органов в филогенезе. Генетические механизмы сохранения рудиментарных образований в организме.
реферат [325,7 K], добавлен 31.01.2015Амплификация как важный механизм увеличения объема генома. Роль горизонтального переноса генетического материала в эволюции генома. Значение сохранения дозового баланса генов в генотипе для формирования фенотипа. Взаимодействия между генами в генотипе.
реферат [18,7 K], добавлен 24.02.2010Операторы выбора родителей. Рекомбинация бинарных строк. Моделирование одно-, двух- и многоточечного, триадного кроссинговеров. Построение рулетки для отбора хромосом. Выбор партнера для скрещивания. Результаты применения генетических операторов.
курсовая работа [362,5 K], добавлен 27.03.2016Понятие и принцип работы генетического алгоритма. Вычисление функций приспособленности для особей популяции. Модель "эволюционного процесса". Основные операции генетических алгоритмов. Восстановление генов, выпавших из популяции в ходе операции выбора.
презентация [8,4 M], добавлен 25.06.2013Фундаментальные свойства живого: наследственность и изменчивость. История формирования представлений об организации материального субстрата наследственности и изменчивости. Свойства генетического материала и уровни организации генетического аппарата.
дипломная работа [2,8 M], добавлен 30.07.2009