Об одной модификации схемы алгоритма in silico-картирования генома
Описание варианта модификации схемы алгоритма in silico-картирования генома для случая полигенной модели влияния генотипа на фенотип. Случай наличия базовой и вариативной частей генома. Указание на ограничения детерминистской модели контроля признаков.
Рубрика | Биология и естествознание |
Вид | статья |
Язык | русский |
Дата добавления | 26.04.2019 |
Размер файла | 59,3 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Об одной модификации схемы алгоритма in silico-картирования генома
В.Л. Чечулин, С.В. Боронникова, В.В. Морозенко
Пермский государственный университет, Россия
Описан вариант модификации схемы алгоритма in silico-картирования генома для случая полигенной модели влияния генотипа на фенотип, и при наличии базовой и вариативной частей генома; указано на ограничения детерминистской модели контроля признаков.
Ключевые слова: алгоритм in-silico картирования генома; полигенная модель; алгебра подмножеств генома; дерево корреляций; интерпретация теоремы Гёделя о неполноте.
V.L. Chechulin, S.V. Boronnikova, V.V. Morozenko
One modified scheme of the algorithm in silico-mapping of the genome
The modified version of the scheme of the algorithm in silico-genome mapping was described for the case of polygenic model of influence of genotype on phenotype, and the availability of basic and variant parts of the genome, as reported on the limitations of the deterministic model of control features.
Key words: algorithm in-silico mapping of the genome; polygenic mode; the algebra of subsets of the genome; a tree correlations; the interpretation of Gцdel's incompleteness.
Предисловие
Алгоритмы in silico-картирования генов широко применяются в прикладной генетике [8]. В [1] описан алгоритм in silico-картирования генов, работоспособный только в случае моногенной модели наследования (моногенной модели влияния генома на фенотипические признаки). Как показали модельные и экспериментальные исследования, при полигенной модели наследования процесс идентификации не столь однозначен и полон [1]. Поэтому с учетом полигенной модели наследования [5], подтверждаемой широким набором экспериментальных фактов (см. напр. [3]), возникает потребность модификации этого алгоритма, учитывающего действительный характер наследования признаков. Модификация алгоритма in silico-картирования генов с обозначением условий его сходимости и описана ниже.
1. Модель наследования
Вообще возможные предполагаемые модели влияния генов на фенотипические признаки таковы:
1) моногенная модель (теоретическое предположение, алгоритм картирования генома в этом случае описан в [1]),
2) полигенная (подтверждаемая экспериментальными исследованиями, см. [2, 5]),
3) полногенная (маловероятный случай, если на фенотипический признак влияет вся совокупность генетического кода, не допускающий идентификации ввиду невозможности локализовать гены, влияющие на признак).
Полногенный случай является теоретическим предположением, отличным от реалий ввиду того, что геном имеет "облигатную часть, содержащую структурные и регуляторные гены, необходимые для нормального развития организма, и на факультативную, варьирующую часть, содержащую мобильные элементы разных классов, а также другие формы повторов" [4, 2], т. е. не все гены генома определяют набор фенотипических признаков организма, даже если имеются сети связанных генов, влияющих на фенотип [5].
При полигенной модели допустимы следующие очень приближенные предположения о геноме:
а) имеется базовая (облигатная) часть, задающая фенотипическую структуру организму (обеспечивающую его жизнедеятельность),
б) дополнительно к базовой части кода имеется вариативная часть, задающая вариацию фенотипических признаков.
в) базовая часть одинакова у разных линий одного вида, вариативная, соответственно различна; доля вариативной части не более чем доля базовой части генетического кода.
При таких, очень общих предположениях прозрачно строятся математические модели модифицированного алгоритма картирования.
На геноме, как на единице, задаваема некоторая дискретная сигма-алгебра А его подмножеств (не обязательно связных, допустимы и несвязные подмножества). Мера всего генома (длина) нормируется как единичная.
Рис. 1. Пример разбивки генома на 1-м шаге. При дальнейших шагах выделенный предыдущий фрагмент объединяется в непрерывный отрезок и для него производится аналогичная разбивка на части. Корреляция считается по выделенным фрагментам (и отдельно по их дополнению - невыделенным фрагментам) для каждого слоя разбиения
В первом приближении рассматривается множество А1i из А определенной меры (например 1/2, (А1i)=1/2). Определяя коэффициент корреляции вариаций генотипа каждого множества А1i (в линиях генома) с вариациями фенотипа, можно выбрать множество А1k с максимальным коэффициентом корреляции и далее к нему (так же, как к множеству А) рекурсивно применить эти же рассуждения (на втором шаге (А2i)=1/4 и т. д.).
Остановка алгоритма по достижению максимума означенного коэффициента корреляции имела бы место при унимодальном характере роста коэффициента корреляции, однако это предположение далеко от реальности. Поэтому требуется полный перебор всех подмножеств из А с конечным числом шагов, допустимым вычислительными ресурсами.
Рассмотрим алгоритм подробнее.
2. Описание алгоритма
Последовательность действий в упомянутом алгоритме такая же, как и в алгоритме in silico-картирования (см. подробное описание в [1]), с отличием в определении областей кода для вычисления коэффициента корреляции.
1. Из базы данных выбираются n линий с известными генотипами. У каждой из этих линий определяется количественное значение признака, характеризующего ее фенотип.
2. Формируются все возможные пары линий.
3. Для каждой пары линий i и j определяется разница фенотипов xij.
4. Геном разбивается на районы [1] длиной около 1000 нуклеотидов (всего районов r), и для каждой пары линий i и j подсчитывается доля различающихся аллелей в каждом k-м районе.
Эти районы группируются определенным образом, как указано ниже.
Далее следуют рассуждения для одного признака (для каждого признака повторяются).
При дихотомическом сужении области (предполагается, что вариативная часть не более чем Ѕ генома) геном разбивается на 1-м шаге на 10 равных отрезков Можно в общем случае разбивать на q отрезков. (см. рис. 1) и выделяется половина этих отрезков (всего вариантов такого выделения половины отрезков С105 = 252). Корреляция между количеством различающихся аллелей и разницей фенотипов определяется по выделенным отрезкам для всех вариантов выделения. Выбирается вариант с максимальным коэффициентом корреляции corr("1", "0"). Аналогично параллельно вычисляются корреляции с дополнительными к выделенным отрезками (второй половиной при всех вариантах выделения). Так же выбирается вариант с максимальным коэффициентом корреляции, corr("1", "1").
5. В дальнейшем для выделенных отрезков (и их дополнений) производится такая же дихотомия и вычисляются корреляции (по п. 4) при полном переборе возможных подмножеств их сигма-алгебры над А.
6. Строится 2-е дерево коэффициентов корреляций, количество слоев дерева log2r (см. рис. 2).
Рис. 2. Фрагменты 2-е дерева корреляций: а - корреляция со всей цепочкой кода, далее каждой максимальной, из вариантов разбивки, корреляции на слое s (шаге s-1) соответствует двоичное слово длиной s, например 011 (путь к ней выделен)
7. На завершающем m-м слое этого 2-го дерева выбирается максимальный коэффициент корреляции и сравнивается с максимальным на (m-1)-м слое и т. д., выбирается максимальный коэффициент из максимальных по слоям и соответствующая ему выделенная область генома, в ней с максимальной вероятностной мерой, равной коэффициенту корреляции, находятся задающие фенотипический признак гены.
В итоге по максимуму коэффициента корреляции выделяется коррелирующий с вариацией фенотипического признака фраг-мент генома (множество из сигма-алгебры А), содержащий гены, влияющие на этот признак.
3. О сходимости алгоритма
модификация алгоритм silico картирование
При полном переборе вариантов набора фрагментов генома Объем вычислений пропорционален 2N, где N - количество рассматриваемых минимальных фрагментов генома, или в иной интерпретации перебор всех возможных фрагментов от меры м1 до меры (1- м1), где м1 - мера минимального фрагмента, а 1 - мера всей генетической цепи, дает приблизительно 2(1/м1) варианта выбора фрагментов и соответствующий объем вычислений корреляций., коррелирующих с определенным фенотипическим признаком, очевидно, что существует фрагмент (область фрагментов, не обязательно связная) с макси-мальным коэффициентом корреляции, что и доказывает сходимость алгоритма в случае полного перебора всех вариантов выделения фрагментов генома В случае неполного перебора подмножеств сигма-алгебры А, описанного выше, алгоритм очевидно сходится при монотонном от слоя к слою неубывании коэффициента корреляции, слой с максимальной корреляцией, и соответствует искомомой (не обязательно связной) области генома, однако это непроверенное и достаточно произвольное предположение, хотя и основанное на интуитивном понимании механизма генетического кодирования. Поэтому обоснованным является полный перебор вариантов..
Заключение
Таким образом, при предположении о связи генотипа и фенотипа (непредикативный способ рассуждения) возможно использова-ние модификации алгоритма.
В упомянутой выше модели соответствия фенотипических признаков генотипу используется предикативный подход, аналогичный предикативному выводу в формальных системах. (Ограничения предикативного подхода были приведены ранее для некоторых классов моделей [10]. В рассматриваемом случае ограничения аналогичны.) Даже не зная конкретных правил вывода фенотипа из генотипа, фенотипические признаки можно представить как некоторые предикативные выводы из генотипических аксиом:
(G1, …, Gn) |= Fi, (1)
причем Fi (G1, …, Gn) = (условие предикативности), где Gj - фрагменты генома, Fi - фенотипические признаки.
Если же предполагать сложную, многоуровневую схему формирования признаков, то возможно
(G1, …, Gn, FK1, …, FKr) |= Fi, (2)
(G1, …, Gn, FK1, …, FKr) Fi = , т. е. формирование фенотипических признаков обусловлено наличием иных признаков, проявляющихся в той или иной мере в зависимости от влияния окружающей среды).
Тогда на схему (1) и на схему (2) действуют ограничения теоремы Гёделя о неполноте [6], [7], т. е. в предикативной формальной теории L, содержащей правила вывода (1) и (2), имеются утверждения, не выводимые из аксиом (G1, …, Gn). Это означает, что в L имеются утверждения (фенотипические признаки), не обусловленные генотипом и средой (которая так же предикативно учитывается). Если привлекать к этим рассуждениям не генотипическую наследственность (наследственность через митохоиндральные РНК и т. п.), то ограничения остаются точно такими же. Таким образом, ввиду ограничений предикативного аппарата описания наследственности имеются фенотипические признаки, не обусловленные известной материальной наследственностью. То есть "центральный постулат генетики <который> гласит, что развитие и свойства организма определяются дискретным фактором наследственности - геномом" [8], подлежит, в свете вышеозначенных ограничений, уточнению в том плане, что существует некоторая мера этой определенности, меньшая единицы, ввиду, как следует из теорем Гёделя, наличия признаков, не определяемых геномом. (Религиозному мировоззрению эти выводы лишний раз указали бы на наличие Творца, продолжающего и сейчас творить мир и все живое, и человека, поддерживая жизнь (как сказал поэт, "Творца, творящего творенье,-- оно им живо и сейчас…"); но в свете материалистического мировоззрения эти ограничения лишь свидетельствуют об ограниченности научного знания в этой области на современном этапе развития науки.)
Описанный алгоритм аналогичен алгоритму поиска экстремума функции методом дихотомии, с учетом того, что множества, на которых задается функция (указанный коэффициент корреляции) на одном слое (шаге разбиения), имеют одинаковую меру (длину) и от слоя к слою их мера (длина) уменьшается вдвое.
Такая схема алгоритма позволяет картировать области генома (а не единичные гены, как в моногенной модели), связанные с фенотипическим признаком.
Теоретические положения об очевидной сходимости алгоритма подлежат экспериментальной проверке.
Список литературы
1. Аксенович Т.И., Зыкович А.С. Оценка мощности in silico-картирования // Генетика. 2006. Т. 42, №6. С.850-857.
2. Голубковский М.Д. Век генетики: эволюция идей и понятий, М.; СПб., 2000.
3. Гончаров Н.П., Глушков С.А., Шумный В.К. Доместикация злаков Старого Света: поиск новых подходов для решения строй проблемы // Журн. общей биологии. 2007. Т. 68, №2. С.126-148.
4. Евгеньев М. Б. Мобильные элементы и эволюция генома // Молекулярная биология. 2007. Т.41, №2. С.234-245.
5. Cуслов В.В., Колчанов Н.А. Дарвиновская эволюция и регуляторные генетические системы // Вестн. ВОГиС. 2009. Том 13, №2. С.410-439.
6. Чечулин В.Л. О приложениях семантики самопринадлежности // Вестн. Перм. ун-та. Сер. Математика. Механика. Информатика. 2009, вып. 3 (29). С.10-17.
7. Чечулин В.Л. О кратком варианте доказательства теорем Гёделя // Фундаментальные проблемы математики и информационных наук: материалы междунар. конф. при ИПМ ДВО РАН, Хабаровск, 2009. С.60-62.
8. Хесин Р.Б. Непостоянство генома. М.: Наука, 1984. 472 с.
9. Dadashev S. Ya., Grishaeva T. M., Bogdanov Yu.F. In Silico Identification and Characterization of Meiotic DNA: AluJb Possibly Participates in the Attachment of Chromatin Loops to Synaptonemal Complex // Russian Journal of Genetics. 2005. Vol.41, №12. P.1419-1424.
10. Chechulin V.L., Ardavichus V.G., Kolbasina O.V. Informatization of the process of producing formalin // Russian Journal of Applied Chemistry, MAIK Nauka / Interperiodica. 2008. Vol. 81. № 6. P1112-1116.
Размещено на Allbest.ru
...Подобные документы
Генетическая терминология, организация генома вирусов, понятие о лизогенном и литическом цикле. Особенности генома и жизненного цикла ретровирусов, геном бактерий. Современные представления о геноме человека: теоретические и практические аспекты.
презентация [125,3 K], добавлен 04.04.2011Амплификация как важный механизм увеличения объема генома. Роль горизонтального переноса генетического материала в эволюции генома. Значение сохранения дозового баланса генов в генотипе для формирования фенотипа. Взаимодействия между генами в генотипе.
реферат [18,7 K], добавлен 24.02.2010Определение нуклеотидной последовательности генома человека. Идентификация генов на основе физического, хромосомного и функционалного картирования, клонирования и секвенирования. Новая отрасль биологии - протеомика. Изучение структуры и функции белков.
лекция [39,8 K], добавлен 21.07.2009Кодирование информации в анализаторах. Слуховой анализатор: информация звукового стимула в виде нейронного возбуждения. Обезболивающая (антиноцицептивная) система. Роль генома в пластических изменениях нервной ткани. Физиологическое значение эмоций.
реферат [31,2 K], добавлен 03.09.2010Механизм эволюции прокариотического и эукариотического геномов. Свойства, отбор и динамика рисунка локализации мобильных генетических элементов. Роль мобильных генетических элементов и горизонтального переноса генетического материала в эволюции генома.
курсовая работа [84,5 K], добавлен 30.09.2009Классификация и свойства генов, особенности структурных и регуляторных генов. Структурные единицы наследственности организмов. Особенности генома человека. Наследственный материал, заключенный в клетке человека. Уровни структурной организации хромосом.
презентация [564,6 K], добавлен 28.10.2014Роль наследственности в непрерывности жизни. Непрерывность передачи генетической информации от родителей к потомству - обеспечение единства организмов и среды. Понятие генома, генотипа и фенотипа. Генетические модели и уровни изучения наследственности.
реферат [27,4 K], добавлен 27.01.2010Особенности эволюции человека как биологического и социального существа, а также понятие "генотип" и "фенотип". Классификация мутации, основанной на размерах сегментов генома. Комплементация функционального дефекта в клетках больных анемией Фанкони.
курсовая работа [48,2 K], добавлен 15.08.2014Разработка метода рекомбинантных ДНК. Анализ наследования семейных заболеваний и изучение генетического сцепления у человека в случаях, когда возникают осложнения: генетическая гетерогенность и фенокопии. Карта генетического сцепления генома человека.
учебное пособие [2,0 M], добавлен 11.08.2009Анализ проблемы изучения структуры и функции ДНК, а также возможности ее искусственного изменения и создания организмов с заданными наследственными свойствами. Описание экспериментального получения Ad-вектора на основе генома аденовируса птиц CELO.
курсовая работа [9,1 M], добавлен 04.12.2010Структура геномов эукариот. Опыты Фредерика Гриффита. Принципы строения ДНК. Сюрпризы митохондриального генома. Эксперимент Альфреда Херши и Марты Чейз. Особенности структуры хроматина. Характеристика нуклеосомы и ее состав. Понятие структурного гена.
лекция [247,9 K], добавлен 21.07.2009Общие понятия о молочнокислых бактериях, их классификация и разновидности, морфология. Особенности генома молочнокислых бактерий, их историческая перспектива, размножение и рост. Типы стрептококков. Механизм гомоферментативного молочнокислого брожения.
реферат [267,8 K], добавлен 04.04.2015Понятие генетического кода как единой системы записи наследственной информации в молекулах нуклеиновых кислот в виде последовательности нуклеотидов. Этапы реализации, свойства и расшифровка хромосомы в клетке. Работа по секвенсированию генома человека.
реферат [89,1 K], добавлен 18.01.2011Матричная функция, комплементарное копирование оснований, перенос дезоксинуклеотидов и лигирование ДНК при репликации. Ключевые ферменты в синтезе ДНК. Инициация образования новых цепей ДНК и их рост в репликативных вилках. Репарация ДНК и ее значение.
курсовая работа [50,6 K], добавлен 26.07.2009Ч. Дарвин - основатель теории биологической эволюции. Преемственность в психической организации животных. Установление структуры молекулы ДНК и расшифровка генома человека. Стволовые клетки: популяция клеток-предшественников. Прионы и клонирование.
контрольная работа [36,2 K], добавлен 14.06.2009Формирование геномики и протеомики как новых фундаментальных дисциплин в 1990-х гг. Установление матричного механизма белкового синтеза с передачей генетического кода от ДНК к белку. Методы решения задачи полного секвенирования генома микроорганизмов.
реферат [25,8 K], добавлен 16.11.2013Семейство вирусов, поражающих человека и обезьян. Строение филовируса и его генома. Полные нуклеотидные последовательности геномов вирусов Эбола и Марбург. Передача инфекции, симптомы и течение, инкубационный период и сдерживание распространения.
доклад [969,8 K], добавлен 07.01.2011Характеристика и разнообразие гибридогенных позвоночных. Генетические механизмы гибридной несовместимости. Клональные позвоночные, сетчатое видообразование. Исследование генома гибридогенного позвоночного. Локус-специфическая полимеразно-цепная реакция.
дипломная работа [559,0 K], добавлен 02.02.2018Картирование генома для построения физической и генетической карты. Клонирование известных генов и способствование поиску в геноме интересующих клонов, сравнение клонов. Картирование путем подбора пар по методу "отпечатков пальцев" с лигазной обработкой.
контрольная работа [15,1 K], добавлен 11.08.2009Хранение и передача генетической информации у живых организмов. Способы изменения генома, генная инженерия. Риски для здоровья человека и окружающей среды, связанные с генетически модифицированными организмами (ГМО), возможные неблагоприятные эффекты.
курсовая работа [164,0 K], добавлен 27.04.2011