Полногеномное сравнение распределения ретроэлементов в ДНК человека и шимпанзе
Краткая характеристика и классификация мобильных элементов ДНК человека. Общая характеристика ретроэлементов. Эволюция автономных ретроэлементов. Появление метода репрезентативного дифференциального анализа и метода супрессионной вычитающей гибридизации.
Рубрика | Биология и естествознание |
Вид | диссертация |
Язык | русский |
Дата добавления | 18.11.2018 |
Размер файла | 4,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
После того, как выступающие оц концы последних упомянутых гетеродуплексов заполнены ДНК-полимеразой, эти гетеродуплексы получают сайт посадки праймера А1 с обоих флангов и становятся единственными фрагментами, которые могут быть экспоненциально ПЦР-амплифицированы с этим праймером. Продукты последующего ПЦР клонируют в E. coli и далее анализируют вставки полученных клонов. Прохождение самой ВГ может быть описано формулой (цитируется по работе Е. Свердлова и О. Ермолаевой [494]):
Ed(t)=(1+RD0 t)/(1+RT0 t), где Ed(t) - это значение ожидаемого обогащения вычтенной ДНК дифференциальными последовательностями, R [M-1сек-1] - константа скорости реассоциации. D0 и T0 - исходные молярные концентрации драйвера и трейсера, соответственно. Максимальным обогащением при t®Ґ является соотношение концентраций трейсера и драйвера D0 /T0. Для ограниченных значений времени, таких как 14 часов, обогащение должно быть тем больше, чем больше RD0. Таким образом, для получения наилучших показателей обогащения следует повышать значения R или D0, либо обе эти величины.
Мы применили TGDA для поиска последовательностей мобильных элементов, специфичных для генома человека. Такими мобильными элементами являются те, которые интегрировали в геном представителей предковой линии человека уже после расхождения её с предковой линией ближайшего родственника H. sapiens - шимпанзе. Сейчас известны 5 таких семейств мобильных элементов, все они являются ретроэлементами. Это некоторые представители эндогенных ретровирусов HERV-K (HML-2), LINE L1 и ретропозонов Alu, SINE-R и SVA. Идентификация специфичных для генома человека (чс) внедрений таких ретроэлементов является важной задачей генетики H. sapiens, мы же таким образом ещё и проверяли возможности техники TGDA, тем самым одновременно “убивая двух зайцев”. Для проведения экспериментов мы выбрали два семейства ретротранспозонов: HERV-K (HML-2) и L1, которые, в отличие от ретропозонов, обладают гораздо более сложной структурой и большим спектром воздействия на функционирование генома (см. Главы 1.5, 1.7 и 1.9).
Глава 3.3 Полногеномная идентификация интеграций HERV-K (HML-2), специфичных для генома человека
Применение TGDA для поиска интеграций HERV-K(HML-2), специфичных для ДНК человека. Большинство геномных копий HERV-K (HML-2) в ходе эволюции претерпели гомологичную рекомбинацию по последовательностям своих длинных концевых повторов (LTR), и теперь существуют в виде одиночных LTR. Поэтому праймеры, выбранные для специфической амплификации HERV-K-фланкирующих областей, были подобраны именно на консервативные последовательности LTR этих эндогенных ретровирусов. Мы решили проводить амплификацию 5'-фланкирующих LTR последовательностей, поэтому оба LTR-специфичных праймера (обозначены на Рис. 3.2.1 как Т1 и Т2) имеют обратную ориентацию относительно последовательности LTR (структура праймеров приведена в разделе Материалы и Методы).
В геноме человека представлено около 2,000 HERV-K(HML-2) и их одиночных LTR (см. Гл.1.7), поэтому можно подсчитать, насколько смесь, содержащая только 5'-фланкирующие LTR последовательности, упрощена относительно исходной рестрицированной смеси геномной ДНК, и каких значений обогащения по фланкам чсLTR можно ожидать в ходе ВГ. Сложность анализируемой смеси (С) зависит от количества геномных повторов (в нашем случае 2,000) и от частоты встречаемости в геноме рестриктных сайтов выбранной для фрагментации ДНК эндонуклеазы (в нашем случае примерно 1 сайт на 256 нуклеотидов). Таким образом, сложность нашей смеси составляет C= 256 x 2000 ~5x105 , что в 6000 раз меньше сложности человеческого генома.
Это приводит к драматическому (3.6x107) возрастанию скорости гибридизации упрощённой ДНК в сравнении с исходной рестрицированной смесью геномной ДНК [494]. Массовым концентрациям трейсера и драйвера, соответственно, 1.5 нг и 150 нг в 1l, которые были использованы в данной работе, соответствуют молярные концентрации индивидуальных фрагментов в смеси 5x10-12 для трейсера и 5x10-10 для драйвера. При значении R=106 [526], можно ожидать 20-кратное обогащение после 14 часов гибридизации. Важно подчеркнуть, что в случае использования неупрощённой смеси рассчётное значение обогащения составляет пренебрежимо малую величину.
Для того, чтобы проверить, насколько эти теоретические данные согласуются с реальностью, мы нашли экспериментальное значение обогащения результирующей смеси по фланкам чсLTR: мы определяли концентрацию фланкирующей последовательности известного чсLTR из локуса 19q13.2 [313] в исходном трейсере и в смеси, полученной в ходе ВГ. При этом, если метод TGDA работает, должно происходить обогащение результирующей смеси по этой последовательности.
Действительно, в случае использования матрицы смеси после вычитания, видимый чс ПЦР продукт появлялся на 4 цикла раньше, чем в случае использования исходного трейсера, что свидетельствует о 16-кратном обогащении вычтенной библиотеки фланками чсLTR. Это значение хорошо согласуются с теоретически предсказанным (~20-кратное обогащение), что свидетельствует о том, что приведённое выше уравнение верно описывает происходящие при TGDA процессы и может быть успешно применено для прогнозирования эффективности использования метода.
Дальнейший анализ полученной библиотеки, обогащённой фланками чс LTR, включал в себя определение первичной структуры вставок в 55 случайно выбранных клонах и экспериментальную проверку “человек-специфичности” соответствующих LTR. Все вставки содержали ожидаемые фрагменты LTR, что свидетельствует о высокой специфичности селекции на первой стадии TGDA. Длины фланкирующих LTR областей различались от 49 до 385 нуклеотидов, средняя длина составляла 138 нуклеотидов. Для 50 из этих последовательностей в базах данных GenBank были найдены гомологичные протяжённые последовательности, содержащие полноразмерные LTR (коды доступа в GenBank приведены в Приложении 1 раздела Материалы и Методы). 4 таких LTR были интегрированы в слабо-дивергировавшие повторяющиеся элементы, такие как Alu и L1, что сделало невозможным создание праймеров для специфической амплификации соответствующих геномных локусов. 29 из 46 оставшихся клонов содержали уникальные вставки, 10 клонов встретились дважды, одна последовательность была найдена в 3 клонах, ещё одна - в 4-х. В сумме были идентифицированы 36 независимых последовательностей. Две из них фланкировали LTR, ранее опубликованные как чс: AC002508 [314] и AC044819, он же HERV-K 102 [311]. Для остальных 34 последовательностей мы проверяли человек-специфичность внедрений соответствующих LTR или провирусов HERV-K с помощью ПЦР с матриц геномной ДНК человека и других высших приматов (см. Рис. 3.3.1).
Выводы о наличии или отсутствии одиночных LTR в соответствующих геномных локусах делали на основании результатов ПЦР со специфическими праймерами, фланкирующими исследуемое внедрение ретроэлемента (структура праймеров дана в Приложении 1 раздела Материалы и Методы). При этом ДНК, содержащая LTR в соответствующем локусе, должна давать продукт примерно на 970 пн длиннее, чем продукт, полученный с матрицы, не содержащей LTR.
В случае, когда сайт интеграции содержал провирус HERV-K, мы проводили три ПЦР-амплификации с геномными праймерами G1, G2, и с LTR-специфичными праймерами T1 и T3. Присутствие провируса в анализируемом сайте приводит к успешной ПЦР-амплификации с парами праймеров G1+T1 и G2+T3, но не G1+G2. И наоборот, полученные продукты амплификации с праймерами G1+G2, но не G1+T1 или G2+T3 обозначают отсутствие провируса в этом локусе (данные не представлены).
5 из 55 вставок не имели гомологичных последовательностей в базах данных. Четыре из них содержали дополнительные повторы, как Alu или L1, и далее не анализировались. Последняя последовательность, AF370125, была признана чс по результатам геномных ПЦР с уникальным праймером 23F (Материалы и Методы, Приложение 1) и с LTR_специфичным праймером T1.
Подводя итоги, в 55 случайно отобранных клонах мы нашли 23 чс последовательности, 21 из которых была идентифицирована впервые. Эти 23 последовательности были представлены 33 клонами, что свидетельствует о том, что чс последовательности занимают ~60% полученной библиотеки. 14 клонов (25,5%) содержатся также в геноме шимпанзе, а 8 клонов (14,5%) не могли быть охарактеризованы.
Кроме того, мы провели дифференциальную дот-блот гибридизацию ПЦР-амплифицированных вставок из 288 клонов с тотальными зондами на LTR-фланкирующие последовательности человека и шимпанзе. Результаты дифференциальной гибридизации представлены на Рис. 3.3.2. 150 клонов (52%) гибридизовались только с “человеческим” зондом, но не с зондом на фланки LTR шимпанзе, что хорошо согласуется с представленной выше оценкой 60%. Мы отсеквенировали вставки 6 случайно отобранных дифференциальных клонов, 4 из них являлись повторениями ранее охарактеризованных чс клонов из нашей библиотеки, а 2 новых вставки имели гомологичные последовательности в
GenBank и были идентифицированы нами как чс при помощи геномных ПЦР со специфическими LTR-фланкирующими праймерами.
Всего нами было найдено в библиотеке 25 чс LTR, 23 из них были идентифицированы нами впервые. Полученная с помощью TGDA библиотека содержала 60% клонов, несущих вставки, специфичные для генома человека.
Структурный анализ известных чс LTR. Проанализировав 23 последовательности человек-специфичных LTR, найденные нами, а также 18 чс LTR, найденные другими авторами (всего 41 последовательность), мы обратили внимание, что все они, за исключением одного LTR, обладают значительной структурной гомологией и формируют один кластер на филогенетическом древе, значения внутригрупповой дивергенции для них варьировали от 0.1 до 3.5% со средним значением 2.3%. Один чс LTR (AC022567) сильно отличался от остальных 40 LTR (средняя дивергенция 6%) и, поэтому, не мог быть отнесён к той же группе. В соответствии с классификацией, опубликованной в [316], этот LTR принадлежит к группе II-T.
Основываясь на 40 последовательностях высоко гомологичных чс LTR, мы создали консенсусную последовательность (HS консенсус) для эволюционно молодого семейства HS (Рис. 3.3.3). Эта последовательность содержит 9 характеристических нуклеотидных позиций.
1 31 61
cons_HS TGTGGGGAAAAGCAAGAGAGATCAGATTGT TACTTGTTCTGTGTAGAAAGAAGTAGACAT AGGAGACTCCATTTTGTTATGTACTAAGAA
cons_HS-a .............................. .............................. ..............................
cons_HS-b .............................. .............................. ..................S...........
cons_II-N ****************************** ****************************** ******************************
cons_II-T .............................. .............................. ..............................
cons_II-V ............A................. .............................. ..............................
cons_II-B ****************************** ****************************** ******************************
cons_II-O ............A................. .............................. ..............................
91 121 151 +
cons_HS AAATTCTTCTGCCTTGAGATTCTGTTAATC TATAACCTTACCCCCAACCCCGTGCTCTCT GAAACRTGTGCTGTGTCAA-CTCAGAGTTR
cons_HS-a .............................. .............................. ...................-..........
cons_HS-b .............................. .............................. ...................-..........
cons_II-N **.....................A....C. ...G.......................... ...................A.....G...A
cons_II-T ....................K......... ...G.......................... ...................A.....G...A
cons_II-V ....................K......... ...G.......................... .................C.-.....G...A
cons_II-B **............................ ...G.......................... ...................-.....G...A
cons_II-O ....................G......... .G.....C...................C.. ..G................-.....G...A
181 211 241
cons_HS AATGGATTAAGGGCGGTGCAAGATGTGCTT TGTTAAACAGATGCTTGAAGGCAGCATGCT CCTTAAGAGTCATCACCACTCCCTAATCTC
cons_HS-a ....................R......... .............................. ..............................
cons_HS-b ....................A......... .............................. ..............................
cons_II-N .............TT......A........ .............................. ..............................
cons_II-T .............................. .............................. ..............................
cons_II-V ..............K............... .............................. ..............................
cons_II-B ..............T............... .............................. ..............................
cons_II-O ..............K.....R......... .............................. ..............................
271 + 301 331
cons_HS AAGTACCCAGGGACACAAA-AACTGCGGAA GGCCGCAGGGACCTCTGCCTAGGAAAGCCA GGTATTGTCCAAGGTTTCTCCCCATGTGAT
cons_HS-a ...................-.......... .............................. ..............................
cons_HS-b ...................-.......... .............................. ..............................
cons_II-N ...................-C......... .............................. ..............................
cons_II-T ...................-C......... .............................. ..............................
cons_II-V ...................-C......... .............................. ..........R...................
cons_II-B ...................-C......... .............................. ..............................
cons_II-O ...................AC......... .............................. ..............................
361 391 421
cons_HS AGTCTGAAATATGGCCTCGTGGGAAGGGAA AGACCTGACCRTCCCCCAGCCCGACACCCG TAAAGGGTCTGTGCTGAGGAGGATTAGTAA
cons_HS-a .............................. ..........G................... ..............................
cons_HS-b .............................. ..........R................... ..............................
cons_II-N ..................T........... ..........G................... .............................T
cons_II-T .............................. ..........G................... .............................T
cons_II-V .............................. ..........G................... .............................W
cons_II-B .............................. ..........G................... ..............................
cons_II-O .............................. ..........G................... ..............................
451 481 511
cons_HS AAGAGGAAGGAATGCCTCTTGCAGTTGAGA CAAGAGGAAGGCATCTGTCTCCTGCCTGTC CCTGGGCAATGGAATGTCTCGGTATAAAAC
cons_HS-a .............................. .............................. ..............................
cons_HS-b .............................. ..........................C... ..............................
cons_II-N ..........C................... ...........................A.. ....................C.........
cons_II-T ..........C................... .............................. ..............................
cons_II-V ..........C................... .............................. ..............................
cons_II-B ..........CC.--..-............ T........................T.... .......................G......
cons_II-O ............C................. .............................. .......................G......
+
541 + 571 601
cons_HS CCGATTGTATGCTCCATCTACTGAGATAGG GAAAAACCGCCTTAGGGCTGGAGGTGGGAC CTGCGGGCAGCAATACTGCTTTGTAAAGCA
cons_HS-a .............................. .............................. ..............................
cons_HS-b .............................. .............................. ..............................
cons_II-N .........C.T.................. .G..............C.........A... A.............................
cons_II-T .........C.T.................. .............................. A.............................
cons_II-V ...........T.................. .G............................ A.........................G...
cons_II-B ...........T.................. AG........................A... A...K...............Y.T...T...
cons_II-O ...........T.................. .G............................ A...................C.T...G...
631 661 + 691
cons_HS TTGAGATGTTTATGTGTATGCATATCTAAA AGCACAGCACTTAATCCTTTACATTGTCTA TGATGCAAAGACCTTTGTTCACGTGTTTGT
cons_HS-a .............................. .............................. ..............................
cons_HS-b .............................. .............................. ..............................
cons_II-N .............................. ............G..T.....TC....... .......G......................
cons_II-T .............................. ............R.........C....... ..............................
cons_II-V .......R...................... -..............T......C....S.R .......G..............S.....A.
cons_II-B ......................Y....... ...............T......C....... .......G....................A.
cons_II-O ............C......ATG........ -..............T......C....T.. .......G....................AC
721 + 751 + 781
cons_HS CTGCTGACCCTCTCCCCACAATTGTCTTGT GACCCTGACACATCCCCCTCTTCGAGAA-A CACCCACRRATGATCAATAAATACTAAGGG
cons_HS-a .............................. ............................-. .......AG.....................
cons_HS-b .............................. ............................-. .......G......................
cons_II-N T..................T.......... .....................CA.....-. ..............................
cons_II-T ...................T.......... .....................CG.....-. .......G......................
cons_II-V S........TY...T....T...A..Y.A. .....................C......-. ......AG......................
cons_II-B ..............T....T...A....A. ...................T.C......-. ......AGG.....................
cons_II-O .........T....T....T...A..C.A. .......C.............C......C. ......AT......................
811 841 871
cons_HS AACTCAGAGGCTGGCGGGATCCTCCATATG CTGAACGCTGGTTCCCCGGGTCCCCTTATT TCTTTCTCTATACTTTGTCTCTGTGTCTTT
cons_HS-a .............................. .............................. ..............................
cons_HS-b .............................. .............................. ..............................
cons_II-N ................A............. ................T..C********** ******************************
cons_II-T .............................. ....................C......... ..............................
cons_II-V ...........C.............R.... ....................********** ******************************
cons_II-B ...........C.............G.... .............................. ..............................
cons_II-O ...........C.............G.... ........C...C...T...C...T..T.. ............................C.
901 931 961 + 971
cons_HS TTCTTTTCCAAATCTCTCGTCCCACCTTAC GAGAAACACCCACAGGTGTGTAGGGGCAAC CCACCCCTACA
cons_HS-a .............................. .............................. ...........
cons_HS-b ......C.T..G........T......... ....................G......... ...........
cons_II-N ****************************** ****************************** ***********
cons_II-T ...........G........T......W.. ....................G......... ........T..
cons_II-V ........T..G......C.T......A.. ....................G......... ........T..
cons_II-B ****************************** ****************************** ***********
cons_II-O ...........G......A.T......A.. ....................G......... ........T..
Рисунок 3.3.3. Структурное выравнивание консенсусных последовательностей семейств LTR HS, HS-a, и HS-b с консенсусными последовательностями других относительно эволюционно молодых групп LTR HERV-K. Диагностические позиции, специфичные для групп HS, затемнены и обозначены "+" (Позиции 176, 291, 553, 601, 683, 740, 772 и 969). Нуклеотидные замены, различающие группы HS-a и HS-b выделены жирным шрифтом и помечены стрелочками. (*) обозначают отсутствие структурных данных. Для обозначения нуклеотидов была применена номенклатура IUPAC-IUB: R- A, G; Y- C, T; K- G, T; S- C, G; W- A, T.
Проведённый с помощью программы BLAST (http://www.ncbi.nlm.nih.gov/BLAST/) поиск выявил в геномных базах данных Non-Redundant и High Throughout Genome Sequences 273 полноразмерных (длиной ~970 пн) последовательности, от 100 дo 97% идентичных HS консенсусу. Мы выбрали этот диапозон идентичности, поскольку степень взаимной гомологии среди 40 LTR, использованных для создания консенсуса, варьировала от 99.8 дo 97.6% со средним значением 98.1%.
После того, как дублирующие друг друга контиги были отброшены, количество индивидуальных последовательностей LTR семейства HS составило 142 (Приведены в Табл. 1 раздела Supplementary Material на нашем web сайте http://humgen.siobc.ras.ru). 14 из них (10%) входили в состав полноразмерных провирусов HERV-K (HML-2), тогда как 128 последовательностей (90%) являлись одиночными LTR. Учитывая, что только ~90% последовательности генома человека присутствовало на тот момент в использованных базах данных, мы оцениваем количество членов HS семейства в геноме человека как приблизительно 150-160 (142 / 0.9, где 142 - это число найденных в базах данных LTR группы HS). Единственный чс LTR из контига AC022567, который не мог быть отнесён к семейству HS (см. выше), не имел высоко (более 97%) гомологичных последовательностей в геномных базах данных.
Для того, чтобы найти частоты встречаемости характеристических нуклеотидных позиций HS консенсуса во всех членах HS семейства, а также в LTR, не являющихся членами группы HS, мы сделали множественное выравнивание найденных в этой работе 142 HS и 89 известных не-HS LTR, опубликованных в статьях [308, 311-314, 316, 527, 528] (выравнивание помещено в разделе Supplementary Material на нашем web сайте http://humgen.siobc.ras.ru). Результаты чётко показывают, что 8 диагностических позиций консенсусной последовательности являются уникальными характеристиками семейства HS (Taбл. 3.3.1).
Таблица 1. Частота встречаемости диагностических нуклеотидных позиций консенсуса семейства HS в чс и не-чс LTR HERV-K (HML-2) .
a Диагностические нуклеотидные позиции консенсусной последовательности HS. Частоты встречаемости: б в известных 40 человек-специфичных LTR, в в 141 LTR семейства HS, г в 82 известных не человек-специфичных LTR HERV-K.
Д. П.a |
Ч. чсб, % |
Ч. HSв, % |
Ч. не чсг, % |
|
1. A (176) |
92 |
92 |
6 |
|
2. A (291) |
89 |
91 |
13 |
|
3. C (553) |
97 |
84 |
2 |
|
4. C (601) |
100 |
91 |
4 |
|
5. A (683) |
92 |
86 |
4 |
|
6. A (740) |
100 |
94 |
7 |
|
7. T (772) |
97 |
87 |
5 |
|
8. A (969) |
100 |
95 |
1 |
Анализ генного окружения LTR семейства HS. С помощью сервера UCSC Browser (http://genome.ucsc.edu/cgi-bin/hgGateway) мы предприняли поиск генов, соседствующих с HS LTR. 12 LTR семейства HS были картированы в интронах известных генов. 4 из этих LTR были ранее опубликованы как человек-специфичные [311, 312, 314]. Специфичность для генома человека остальных 8 LTR, вместе с другими 7 членами HS семейства, локализованными вблизи генов, была проверена с помощью ПЦР-анализа.
ПЦР-анализ проводили как указано в предыдущей главе, с использованием уникальных 15 пар праймеров, фланкирующих LTR (Материалы и Методы, Приложение 3), и геномных ДНК человека и шимпанзе в качестве матриц. 13 из 15 LTR оказались чс, а 2 остальные (GenBank ac. AC022148 and AC023201) присутствовали также в геноме шимпанзе. Данные ПЦР-анализа для 13 чс LTR были подтверждены определением первичной структуры ампликонов, полученных с матрицы геномной ДНК шимпанзе. Действительно, все эти ампликоны представляли геномные локусы, ортологичные человеческим LTR-содержащим локусам, и отличались от них отсутствием LTR в соответствующем сайте (GenBank ac. AY134884-AY134891 и AF532734-AF532738). В сумме, из 19 выбранных HS LTR (12 локализованных в интронах и 7 расположенных вблизи генов), 17 оказались чс (4 опубликованы ранее и 13 найдены в этом исследовании). Считая, что эта пропорция чс LTR 17/19 является характеристикой HS семейства в целом, и принимая во внимание, что ~90% последовательности генома человека было доступно в тот момент в геномных базах данных, можно оценить число чс интеграций HERV-K (HML-2) LTR в геноме как 141 (142x17/19/0.9, где 142 -это число HS LTR, найденных в базах данных).
Разделение семейства HS на два подсемейства. Средняя внутригрупповая дивергенция LTR семейства HS, составляющая 2.3%, соответствует эволюционному возрасту группы 8.7 миллионов лет, принимая значение скорости мутирования LTR 0.13% за миллион лет [20]. Дальнейший анализ последовательностей представителей семейства HS позволил нам выделить в его составе два подсемейства, названные нами HS-a и HS-b, представленные, соответственно, 89 (63%) и 53 (37%) последовательностями LTR.
Подсемейство HS-a высоко гомологично консенсусной последовательности HS и характеризуется внутригрупповой дивергенцией 1.5%, что соответствует возрасту 5.8 миллионов лет. Все LTR семейства HS-a, для которых это было исследовано, являются специфичными для генома человека.
Представители подсемейства HS-b несут 5 характеристических сцепленных однонуклеотидных замен в положениях 907, 909, 912, 921 и 950 консенсусной последовательности HS (см. Рис. 3.3.3). Подсемейство HS-b эволюционно старше чем HS-a, для него значение внутригрупповой дивергенции составляет 2.6%, соответственно, возраст 10.3 миллиона лет. По крайней мере 3 члена подсемейства HS-b не являются человек-специфичными, а присутствуют также в геноме шимпанзе. Это LTR из AC023281 [312], а также LTR из AC022148 и AC023201, найденные в данной работе.
Интересно, что 12/14 (86%) всех провирусов HERV-K (HML-2), несущих HS LTR, обладают длинными концевыми повторами подсемейства HS-a, и только 14% провирусов содержат LTR HS-b. Следовательно, 13% из 89 представителей эволюционно более молодого подсемейства HS-a включено в состав провирусов, против всего 4% из 53 членов более старой группы HS-b. Это может рассматриваться как пример временной инактивации эволюционно более старой группы эндогенных ретровирусов.
Эволюционная история семейства HS. В этой главе описывается новая, эволюционно молодая группа HERV-K (HML-2) LTR, представленная в геноме человека приблизительно 150-160 последовательностями, названная нами семейством HS. Пик ретропозиционной активности этой группы пришёлся на период после разделения предковых линий человека и шимпанзе, которое произошло по разным оценкам 4 - 6 миллионов лет назад. Примерно 90% представителей семейства HS специфичны для генома человека. Некоторые из них даже полиморфны в современной человеческой популяции [314, 315], это свидетельствует о том, что члены HS семейства оставались транспозиционно активны вплоть до самого недавнего времени в эволюционной истории вида Homo sapiens, оставаясь, возможно, активными и поныне.
По всей вероятности, материнские последовательности HS семейства возникли в геноме общего предка линий гориллы, шимпанзе и человека около 10.7 миллионов лет назад, породив группу HS-b. Эта группа, оставаясь ретропозиционно активной, 5.8 миллионов лет назад, то есть примерно во время расхождения предковых линий человека и шимпанзе, в свою очередь, дала начало более ретропозиционно активной группе HS-a, которая на настоящий момент составляет большую часть (63%) всего семейства HS. Интересно, что 5 сцепленных нуклеотидных замен, различающих группы HS-a и HS-b, лежат в регионе, ранее охарактеризованном как цис-негативный регулятор промоторной активности одного из LTR семейства HS-b (код доступа в GenBank L47334). Делеция 70 пар нуклеотидов из этого региона в 2 раза повысила промотерную активность соответствующего LTR [529]. Более высокие темпы ретропозиции более эволюционно молодой группы HS-a могут являться следствием этих 5 мутаций в регионе негативного регулятора LTR.
Также интересно, что группа HS-b оставалась активной после расхождения линий предков человека и шимпанзе как в линии человека, так и в линии шимпанзе. С помощью поиска в программе BLAST, мы выявили шимпанзе-специфичный LTR HERV-K (HML-2) (GenBank M57949), очень близкий (идентичность 98%) консенсусной последовательности группы HS-b. Ортологичный локус генома человека (AC018639) с хромосомы 7 не имеет LTR.
Представители обеих групп HS-a и HS-b были ретропозиционно активны вплоть до относительно недавнего времени в эволюции человека. Это следует из трёх найденных на настоящее время примеров LTR, полиморфных в человеческой популяции: два представителя HS-a в составе провирусов HERV-K (HML-2) 113 (AY037928) и HERV-K (HML-2) 115 (AY037929) [315], и один одиночный LTR семейства HS-b (Z80898) [314].
Идентификация одного чс LTR, принадлежащего к семейству II-T, а не
HS (см. выше) свидетельствует о том, что по крайней мере три мастер-гена LTR HERV-K (HML-2), а именно HS-a, HS-b и II-T, были активны в эволюционной линии гоминид. Интеграции LTR вблизи генов или в даже в интронах генов могли существенно повлиять на их экспрессию. В свою очередь, изменения в экспрессии некоторых генов, особенно кодирующих регуляторные белки, могли повлиять на развитие эмбриона, тем самым давая начало образованию новых видов.
Анализ чс LTR HERV-K (HML-2), картированных в интронах генов. С помощью сервера UCSC Browser (http://genome.ucsc.edu/cgi-bin/hgGateway), мы обнаружили 12 представителей семейства в интронах известных человеческих генов. Дальнейший ПЦР анализ геномных ДНК человека и высших приматов показал, что 10 из них являются чс LTR. Эти внедрения несомненно являются кандидатами на кооптированные регуляторные модули и требуют дальнейшего анализа. В данной работе были проанализированы все 10 интронных чс LTR. Было установлено: (i), что все они являются уникальными, т.е. не имеют гомологичных копий в геноме и, во-вторых (ii), чс LTR в интронах генов имеют неслучайную ориентацию: в 9 из 10 генов LTR направлен в сторону, противоположную направлению транскрипции гена.
Для одного из этих 9 генов, cbf2, при анализе баз данных нами были найдены транскрипты, противоположно ориентированные по отношению транскрипции гена и захватывающие его экзон. Вполне возможно, что помимо промоторно энхансерной активности LTR могут принимать участие в регуляции генов на посттранскрипционном уровне, например, за счет РНК-интерференции [530] (см. Рис. 2). Этот механизм регуляции основан на образовании двухцепочечных РНК между мРНК и антисмысловым транскриптом с последующей каталитической деградацией всех мРНК, содержащих участки гомологичные двухцепочечному фрагменту.
Уникальность 10 генов, в которые интегрировали чс LTR, необычна для генома человека, если предположить, что LTR после внедрения сохранили функциональные свойства. Чаще всего функциональные новшества появляются после дупликации генов в одной из дуплицированных копий [531]. Это позволяет второй копии сохранять неизменную функцию, и, таким образом, новшество имеет меньше шансов принести негативные последствия для организма. Воспользовавшись программным обеспечением UCSC Browser, мы показали, что 9 из 10 чс LTR в интронах генов внедрены в ориентациях, противоположных направлению транскрипции соответствующих генов (см. Рис. 3.3.4).
Это может быть объяснено тем, что внедрение LTR, обладающих сильным сигналом терминации транскрипции, в интроны генов в прямой ориентации вызывало бы преждевременную терминацию транскрипции этих генов, и, как следствие, приводило бы к их инактивации. В случае важности продуктов таких генов для организма аллели, несущие в интронах LTR в прямой ориентации, должны были неизбежно отбрасываться в ходе эволюции генома человека. Сохранение аллеля, содержащего LTR в прямой ориентации в интроне flj20276 (см. Рис. 3.3.4), возможно, связано с инактивацией терминатора этого LTR. В некоторых генах внедрения чс LTR произошли в непосредственной близости от экзонов, что наряду с мощным регуляторным потенциалом LTR могло привести к плавному изменению экспрессии этих генов по механизму тканеспецифической антисмысловой регуляции (тканеспецефичность работы промотора и энхансера LTR HERV-K показана в работах [270, 529, 532]).
Для поиска таких антисмысловых транскриптов, располагающихся в непосредственной близости от LTR и комплементарных экзонам соответствующих генов, мы провели поиск в базе данных экспрессирующихся последовательностей человека est_human. В результате нами были найдены два транскрипта (коды доступа в GenBank AA704979 и R99122), лежащие во втором интроне гена cbf2 (второе название cebf) вблизи от LTR (менее 1 т.п.н.) и совпадающие с ним по ориентации (см. Рис. 3.3.4).
Оба транскрипта содержат область, комплементарную второму экзону cbf2, и могут рассматриваться как возможные кандидаты на роль антисмысловых регуляторов этого гена (см. Рис. 2). LTR в данном случае может являться тканеспецифическим регулятором экспрессии (например энхансером, активирующим криптический промотор) указанных транскриптов.
Важно, что ген cbf2, кодирует в свою очередь транскрипционный регулятор CCAAT-Binding Factor, обуславливающий, например, экспрессию с промотора hsp70 [533]. Изменение экспрессии такого фактора могла бы приводить к множественным эффектам за счет одновременного изменения уровня экспрессии тех генов, с которыми взаимодействует данный фактор. Таким образом, вероятно участие антисмысловых мРНК, образующихся с интронных одиночных LTR, в регуляции экспрессии клеточных генов. Интересно, что как cbf2, так и LTR HERV-K транскрипционно активны в основном в зародышевых тканях. Некоторые из этих изменений могли бы повлечь за собой изменения в эмбриональном развитии, и, соответственно, в фенотипах взрослых представителей Homo sapiens и шимпанзе Pan paniscus и Pan troglodytes
Найденные в реультате работы 36 интеграций LTR HERV-K, специфичных для генома человека, представлены в Таблице 3.3.2.
Таблица 3.3.2. Найденные в данной работе специфичные для генома человека внедрения провирусов HERV-K (HML-2) и их одиночных LTR.
a Коды доступа в GenBank соответствующих LTR, базы данных Non-Redundant и High Throughout Genome Sequences; b Названия генов даны в соответствии с номенклатурой HUGO Gene Nomenclature Committee; c Хромосомная локализация LTR, найденная с помощью сервера UCSC Human Genome Browser, по состоянию на июль 2002; d Локализация LTR относительно известных генов.
No |
GenBanka |
Геныb |
Х. Л.c |
Г. Л.d |
|
1 |
AC007390 |
cbf2 |
2p22 |
Интрон 2 |
|
2 |
AL121753 |
mmp24 |
20q11 |
Интрон 4 |
|
3 |
AC006432 |
klrb1 |
12p13 |
Интрон 2 |
|
4 |
AC016577 |
sgcd |
5q33 |
Интрон 5 |
|
5 |
AC008648 |
kiaa0209 |
5q35 |
Интрон 30 |
|
6 |
AC025548 |
kif9 |
3p21 |
Интрон 9 |
|
7 |
AC027750 |
slc4a8 |
12q13 |
Интрон 5 |
|
8 |
AC015640 |
flj20276 |
9p22 |
Интрон 13 |
|
9 |
AL352982 |
and-1 |
14q22 |
Интрон 1 |
|
10 |
AC055844 |
npgpr |
4q13 |
Интрон 1 |
|
11 |
AC074117 |
ppm1G |
2p23 |
2 тпн выше |
|
12 |
AC021987 |
cabp2 |
11q13 |
3 тпн выше |
|
13 |
AC068887 |
bicd1 |
12p11 |
8 тпн выше |
|
14 |
AL135927 |
flj12287 |
1q23 |
1,5 тпн ниже |
|
15 |
AL356736 |
pde4b |
1p31 |
50 тпн ниже |
|
16 |
AC025574 |
il23a |
12q13 |
6 тпн выше |
|
17 |
AC069420 |
senp2 |
3q27 |
15 тпн выше |
|
18 |
AF370125 |
1p22 |
|||
19 |
AL139404 |
10p12 |
|||
20 |
AC023559 |
5q35 |
|||
21 |
AC019120 |
2p23 |
|||
22 |
AF271408 |
3q21 |
|||
23 |
AC032016 |
17q22 |
|||
24 |
AL139090 |
6q15 |
|||
25 |
AL162412 |
9q13 |
|||
26 |
AC068566 |
3q26 |
|||
27 |
AC006029 |
7q31 |
|||
28 |
AL139421 |
1p22 |
|||
29 |
AC022567 |
6p21 |
|||
30 |
AC012146 |
17p13 |
|||
31 |
AL158039 |
9q34 |
|||
32 |
AL139022 |
14q23 |
|||
33 |
AC010267 |
5q22 |
|||
34 |
AC074261 |
12q14 |
|||
35 |
AC084028 |
? |
|||
36 |
AC013633 |
? |
Глава 3.4 Применение TGDA для поиска чс внедрений L1
Следующим объектом, для которого мы применили метод TGDA, стало семейство ретротранспозонов L1, содержащее чс ретроэлементы, а также около 50 до сих пор активных представителей в геноме человека (см. Главу 1.5.). Как и в случае HERV-K(HML-2), мы искали чс интеграции ретроэлементов.
Поскольку подавляющее большинство L1 укорочено с 5' -конца, на первой стадии мы амплифицировали последовательности геномов человека (трейсер) и шимпанзе (драйвер), граничащие с 3'- концевыми районами L1.
Для проведения ПЦР мы выбрали последовательность 3'UTR L1 как цель для подбора праймеров, направленных наружу от L1 (схема расположения праймеров представлена на Рис. 3.4.1), поскольку район L1 3'UTR высоко вариабелен среди различных семейств L1 генома человека, будучи в то же время относительно консервативным для представителей молодых семейств L1. Это делает возможным дискриминировать эволюционно молодые L1. Мы подобрали праймеры на позиции 311-335 и 352-378 консенсусных последовательностей 3'UTR семейств L1Hs (оно же: L1PA1) и L1PA2 [58]. Это позволило нам селективно амплифицировать 3'- фланкирующие регионы L1 этих двух молодых семейств, некоторые представители которых (точнее, которого, L1Hs) в геноме человека известны как активные транспозоны.
Оценочное число членов этих двух семейств в ДНК человека составляет 17.600, или 3,4% всех человеческих L1 [58]. Селективная амплификация фланкирующих их последовательностей позволяет получить смесь достаточно кинетически упрощённую для того, чтобы фрагменты реассоциировали в разумное для проведения эксперимента время. В этом исследовании при проведении ВГ мы использовали следующие условия: концентрация трейсера 1,9x10-12 M, концентрация драйвера 3,6x10-10 M, время реассоциации 14 часов. Согласно оценке, за это время должна пройти 99% реассоциация трейсера, а итогом должно стать 17-кратное обогащение ренатурировавших фрагментов трейсера фланками чс L1.
Продукты ВГ клонировали в E. coli, затем были определены последовательности вставок из 29 случайно отобранных клонов. Вставки содержали ожидаемые фрагменты L1 семейств L1PA2 и L1Hs, что, как и в случае LTR HERV-K (HML-2), демонстрировало высокую специфичность селекции. Единственным исключением являлся клон, содержащий область, фланкирующую LINE семейства L1PA3. Длины фланкирующих L1 последовательностей в составе клонов различались от 129 дo 621 нуклеотидов, со средней длиной 270 нуклеотидов. Поиск в GenBank позволил для 28 из этих фланков L1 обнаружить в базах данных гомологичные уникальные последовательности, в соответствующих локусах 9 из которых содержали полноразмерные L1 и 19 - 5'-укороченные (коды доступа в GenBank представлены в Табл. 3.4.1). Ни один из этих LINE не был ранее опубликован как чс.
Как и в случае LTR HERV-K(HML-2), с целью определения специфичности данных L1 для генома человека мы проводили ПЦР-анализ (Рис. 3.2.4) со специфичными геномными (G1 и G2, см. Приложение 2 раздела Материалы и Методы) праймерами, фланкирующими интеграцию ретроэлемента, а также с праймером, специфичным для L1 (праймер T2, см. Материалы и Методы).
Из 29 отобранных клонов мы определили видоспецифичность интеграции для 26 последовательностей, 24 из них были чс, а 2 клона содержались также в геноме шимпанзе (Tab. 3.4.1, клоны 17 и 24). Это говорит о том, что чс последовательности содержатся приблизительно в 92% клонов библиотеки. По крайней мере 3 последовательности L1 из 24 (13%) являются полиморфными в человеческой популяции (Tab. 3.4.1, клоны 1, 22, 25). Три других клона из 29 (Tab. 3.4.1, клоны 2, 8, 14) не были охарактеризованы окончательно: не были получены продукты ПЦР с праймерами G1+G2, хотя результаты геномных ПЦР с парами праймеров G1+T2 свидетельствовали в пользу человек-специфичности этих L1.
Для того, чтобы найти значение обогащения вычтенной библиотеки по чс последовательностям, мы определили значения обогащения библиотеки последовательностями 4 фланков чс L1, найденных в этой работе (для этого использовались локусы 3q14 (AF496639), 15q21 (AF496640), 1p21 (AF496647) и 13q32 (AF496650)). Во всех случаях продукты ПЦР появлялись на 2 цикла раньше при использовании “вычтенной” матрицы, чем при использовании “невычтенной”, что свидетельствует о 4-кратном обогащении полученной библиотеки чс последовательностями.
Это экспериментально полученное значение обогащения 4 существенно меньше рассчётного (17, см. выше), что, по-видимому, вызвано исходно высоким содержанием чс последовательностей в “невычтенном” трейсере. Действительно, ~92% клонов обогащённой библиотеки являются чс L1. Это обозначает, что примерно четверть исходной “невычтенной” библиотеки составляют чс L1.
Эти факты ((1) фракция ДНК, использованная для ВГ, содержала 3'-фланки приблизительно 17.600 L1, (2) обогащение вычтенной библиотеки чс последовательностями составило 4, (3) чс фланки L1 занимают примерно 92% клонов вычтенной библиотеки) позволяют оценить суммарное количество чс интеграций L1 в ДНК человека как 4048 (17600 x 1/4 x 0,92).
Таблица 3.2.1. Краткая характеристика 24 специфичных для генома человека интеграций L1, найденных с помощью TGDA.
Na |
Sb |
GenBankc |
Ld |
Fe |
Ph |
GenLl |
|
1 |
AF496637 |
AL138764 |
1323 |
L1Hs |
+ |
10p13 |
|
2 |
AF496639 |
AL157765 |
678 |
L1PA2 |
ND |
13q14 |
|
3 |
AF496640 |
AC020892 |
2292 |
L1Hs |
ND |
15q21 |
|
4 |
AF496641 |
AJ271735 |
3210 |
L1Hs |
ND |
Xq28 |
|
5 |
AF496642 |
AC007512 |
6032 |
L1Hs |
ND |
Не найдено |
|
6 |
AF496643 |
AC027296 |
836 |
L1Hs |
ND |
3q13 |
|
7 |
AF496645 |
AL022153 |
6032 |
L1Hs |
ND |
Xq25 |
|
8 |
AF496646 |
AC037430 |
1378 |
L1PA2 |
ND |
3p11 |
|
9 |
AF496647 |
AL354987 |
775 |
L1PA2 |
ND |
1p21 |
|
10 |
AF496648 |
AC005105 |
402 |
L1Hs |
ND |
7p14 |
|
11 |
AF496649 |
AC025097 |
6026 |
L1Hs |
ND |
12q13 |
|
12 |
AF496651 |
AL590646 |
6032 |
L1Hs |
ND |
9q31 |
|
13 |
AF496652 |
AL049792 |
6013 |
L1PA2 |
ND |
Xq25 |
|
14 |
AF496654 |
AC034130 |
6033 |
L1Hs |
ND |
12q21 |
|
15 |
AF512797 |
AL591438 AC032021 |
ND |
ND |
? |
9q21 4q28 |
|
16 |
AF512798 |
AL139115 |
1405 |
L1PA2 |
ND |
9p22 |
|
17 |
AF512799 |
AC074281 |
277 |
L1PA2 |
ND |
Xp22 |
|
18 |
AF512800 |
AC108516 |
6023 |
L1Hs |
+ |
4 |
|
19 |
AF512801 |
AC093527 |
1233 |
L1PA2 |
ND |
5q23 |
|
20 |
AF512803 |
AL162731 |
568 |
L1PA2 |
+ |
9q12 |
|
21 |
AF512804 |
AC026169 |
1232 |
L1Hs |
ND |
3p26 |
|
22 |
AF512805 |
AL158958 |
3369 |
L1PA2 |
ND |
14q12 |
|
23 |
AF512806 |
AC079773 |
1047 |
L1PA2 |
ND |
2p23 |
|
24 |
AF512807 |
AL353751 |
302 |
L1PA2 |
ND |
10q23 |
aНомер клона; bПоследовательность клона, код доступа в GenBank; cГомологичная последовательность из GenBank, код доступа; dДлина L1, пн.
eСемейство L1; hПолиморфизм в человеческой популяции, если обнаружен; lГеномная локализация интеграции L1, найденная с помощью сервера UCSC Human Genome Browser.
Большинство найденных в этой работе чс L1 (70%) являются 5'-укороченными транспозонами (Табл. 3.2.1), что хорошо согласуется с данными, опубликованными Буассино и др. [103] для представителей эволюционно молодой группы LINE человека L1-Ta (от англ. transcriptionnaly active), 34% которой составляют полноразмерные L1s против 66% укороченных. Такие значения гораздо выше, чем среднее содержание полноразмерных L1 в геноме человека (менее 1%) среди всего множества L1. Это свидетельствует в пользу того, что в ходе эволюции генома человека L1 подвергались направленным делециям, сходным с направленным удалением L1 из GC-богатых локусов генома, описанным в работе Овчинникова и др. [166].
Среди 24 чс L1, найденных в этой работе, 17% содержат инверсии и 26% (7 ретроэлементов) содержат трансдуцированные 3'-фланкирующие последовательности, вероятно захваченные при ретропозиции L1 [95, 119, 120, 534]. 3 из этих 7 последовательностей слишком короткие, чтобы найти для них предковые последовательности, откуда они были трансдуцированы (Табл. 3.2.1, клоны 14, 26 и 27), для одной другой последовательности (Табл. 3.2.1, клон 18) мы не нашли предкового локуса в доступных на тот момент (конец июня 2002) базах данных генома человека. Для 3 остальных чс L1, несущих трансдуцированные последовательности (Табл. 3.2.1, клоны 5, 15, 21), нам удалось найти предковые геномные последовательности; знаменательно, что лишь одна такая предковая последовательность (см. Табл. 3.2.1, клон 15) содержит внедрение L1 в соответствующем сайте, следовательно, лишь в этом случае мы можем сказать с полной определённостью, что эта последовательность была перенесена в ходе процесса, названного L1-трансдукцией.
Поскольку для селективной амплификации L1 автором были использованы праймеры, специфичные для семейств L1PA2 и L1Hs, неудивительно, что все найденные в данной работе чс L1 принадлежали к этим двум группам. Лишь небольшая часть (26%) этих чс L1 принадлежала к группе Ta, которая известна как единственная транспозиционно активная в настоящее время группа L1. В этой работе нами было найдено внедрение L1, принадлежащего к группе L1PA2, которое является полиморфным в человеческой популяции (Табл. 3.2.1, клон 25). Следовательно, (i) по крайней мере два семейства L1 были активны в предковой линии человека после расхождения её с предковой линией шимпанзе и (ii) при поиске полиморфных интеграций L1 не следует ограничивать поиск группой L1 Ta.
Один чс L1 (Табл. 3.2.1, клон 1) являлся представителем открытого в данной работе химерного семейства ретротранскриптов U6-L1, детально описанного в следующей главе. Ретроэлемент содержал на 5'-конце полную копию U6 малой ядерной РНК и 5'-укороченный L1 на своём 3'-конце.
Глава 3.5 Химерное семейство ретроэлементов U6-L1
Химерное семейство U6-L1. Пожалуй, наиболее неожиданным результатом анализа библиотеки чс внедрений L1 стало открытие нового семейства ретроэлементов, образованных при происходящей in vivo РНК-рекомбинации в ходе обратной транскрипции L1. Упомянутый механизм также впервые предложен автором в данной работе.
В ходе анализа полученной с помощью TGDA библиотеки чс L1-фланкирующих последовательностей, мы нашли один клон, соответствовавший внедрению ретроэлемента весьма необычной структуры, см. Рис. 3.5.1. Последовательность вставки была гомологична геномной ДНК человека хромосомного локуса 10p13 (код доступа в GenBank AL138764). Ретроэлемент представлял собой химеру полной копии U6 мя РНК с 3'-концевой частью L1. Последовательность ретротранскрипта была названа нами U6-L1 10p13. Её 5'-часть является полноразмерной последовательностью U6 мяРНК длиной 107 пн, 100% идентичная консенсусной последовательности человеческой U6 (взята из базы данных RepBase Update, http://www.girinst.org/server/RepBase/). Сразу за U6 следует 3'- концевая последовательность элемента L1 семейства L1Hs в прямой ориентации длиной 1324 пн. На своём 3'- конце эта последовательность несёт поли-А “хвост” длиной 40 пн. Химерный ретротранскрипт фланкирован прямыми повторами AAAAATGTTAAACCATGGGT длиной 20 пн.
Гексануклеотид TTAAAA, расположенный на 22 пн выше сайта интеграции U6-L1, идентичен последовательности T2A4, которую предпочтительно узнаёт эндонуклеаза L1 (L1-EN), инициирующая интеграцию L1 копий в соответствующие сайты генома [91, 535].
Предпринятый нами с помощью программы BLAT (http://genome.ucsc.edu/cgi-bin/hgBLAT) поиск в геномных базах данных человека выявил 161 полноразмерную последовательность U6 мяРНК, от 85 дo 100% идентичную человеческой консенсусной последовательности U6.
105 из этих 161 последовательности представляли собой одиночные гены или псевдогены U6, из них 52% (55 последовательностей) фланкированы короткими (12-20 пн) прямыми повторами и несут поли-(А) на своих 3'-концах. Другие 56 (35%) последовательностей U6 являлись химерными ретротранскриптами, сходными с изображённым на Рис. 3.5.1, представлены в Табл. 3.5.1. Все такие химеры U6-3'-L1 были фланкированы прямыми повторами длиной 11-21 пн, что свидетельствует об интеграции химеры как единой последовательности. Как и у химеры U6-L1 10p13, все они имели рядом со своими 5'- концами либо гексануклеотид TTAAAA, либо его производные с однонуклеотидными заменами A/G либо T/C.
Перечисленные выше особенности сайтов интеграции химер свидетельствуют о том, что их внедрения в геном были произведены интеграционным аппаратом ретротранспозонов L1. Далее перед автором встал вопрос, имеют ли все эти химеры U6-L1 общую предковую последовательность, либо же всякий раз они формировались индивидуально, в течение многих независимых событий. Существующие доказательства поддерживают скорее вторую гипотезу. Во-первых, структуры пограничных последовательностей между U6- и L1- частями химер различаются во всех найденных U6-L1 и, кроме того, L1-фрагменты разных элементов U6-L1 принадлежат к различным семействам L1, образованным разными мастер-генами.
На Рис. 3.5.2 показана практически линейная корреляция между значениями дивергенции U6-фрагментов химер от консенсуса U6 и дивергенции L1-фрагментов химер от консенсуса соответствующей группы L1. Эти значения дивергенции отражают возраст соответствующих ретротранскриптов. Наиболее молодые и наименее дивергировавшие (различие с консенсусной последовательностью 0-2%) U6 элементы объединены с представителями L1 молодых семейств - L1PA3, L1PA2 и L1Hs. Напротив, более (3_8%) дивергировавшие последовательности U6 соединены с членами более ...
Подобные документы
Общая характеристика отряда приматов: образ жизни, строение. Особенности подотряда полуобезьян. Характеристика высших приматов - семейств широконосых, узконосых и человекообразных обезьян. Сравнение кисти руки гориллы и человека, стопы гориллы и шимпанзе.
презентация [869,9 K], добавлен 16.05.2012Развитие взглядов на происхождение человека. Центр происхождения человека. Доказательства происхождения человека от животных. Влияние окружающей среды на появление человека. Эволюция гоминид. Биологический, социальный и трудовой факторы эволюции.
реферат [37,7 K], добавлен 26.04.2006Анализ влияния мозга человека на его деятельность и чувства, с указанием многочисленных примеров из жизни, а также его основные отличия от мозга шимпанзе. Сравнение мужского и женского пространственного мышления. Сущность развития мышления человека.
реферат [50,8 K], добавлен 24.11.2009Сущность генеалогического метода и его применение в генетике человека. Особенности наследования различных признаков. Гипотеза и ход исследования родословной. Генетические закономерности наследования признаков человека и сравнение результатов с гипотезой.
практическая работа [90,5 K], добавлен 20.05.2009Характеристика изменений, которые происходят в геноме клетки, и возникают при вставке мобильных генетических элементов в геном. Мобильные генетические элементы в геноме Drosophila Melanogaster (дрозофила чернобрюхая). Мобильные элементы гетерохроматина.
курсовая работа [72,8 K], добавлен 29.05.2015Тайна происхождения человека и его расселения на территории Земли. Путь гоминизации многих видов приматов. Теория африканского происхождения человека. Родословная человека, факторы антропогенеза. Основные этапы эволюции человека. Современный тип людей.
презентация [1,3 M], добавлен 21.05.2015Эволюция человека, ее отличие от эволюции животных и движущие силы. Гипотезы естественного происхождения человека. Признаки человека и его место в системе животного мира. Основные этапы антропогенеза и характерные черты развития предков человека.
контрольная работа [27,6 K], добавлен 03.09.2010Систематическое положение человека. Род гиббонов, орангутангов, горилл, шимпанзе: виды, места обитания, строение тела, образ жизни. Биологическая теория происхождения человека Ч. Дарвина. Основные группы доказательств происхождения человека от животных.
презентация [8,7 M], добавлен 18.05.2010Возраст человека: абсолютный, биологический, паспортный, психический, социальный. Критерии биологического возраста. Эволюция человека. Характеристика австралопитека. Расизм, его социальные корни. Прогрессивная общественность в борьбе против расизма.
реферат [33,0 K], добавлен 31.10.2008Характеристика радиочастотных (РЧ) воздействий. Выводы ученых по исследованию популярных марок телефонов и их влияния на здоровье человека, системы организма человека, наиболее подверженные вредному влиянию. Меры по защите населения от РЧ-излучения.
научная работа [21,5 K], добавлен 09.02.2009Основные признаки этапов эволюции человека. Размер и образ жизни дриопитеков. Отличия австралопитеков от человека умелого, период его появления и размер мозга. Внешний вид человека прямоходящего. Ареал обитания неандертальцев. Орудия труда кроманьонца.
презентация [2,2 M], добавлен 06.04.2015Начало научного представления о происхождении человека. Идеи Дарвина и их революционная роль в учении об антропогенезе. Австралопитек как прямой предок рода Homo. Эволюция приматов до человека, ее движущие силы. Виды рода Homo и появление Homo sapiens.
реферат [613,2 K], добавлен 09.09.2012Механизм эволюции прокариотического и эукариотического геномов. Свойства, отбор и динамика рисунка локализации мобильных генетических элементов. Роль мобильных генетических элементов и горизонтального переноса генетического материала в эволюции генома.
курсовая работа [84,5 K], добавлен 30.09.2009Представления о происхождении человека в Европейском средневековье. Современные взгляды на проблему происхождения человека. Предположения Ч. Дарвина о происхождении человека. Проблема прародины современного человека. Особенности хода эволюции человека.
реферат [36,8 K], добавлен 26.11.2010Вопросы происхождения и сущности жизни издавна стали предметом интереса человека в его стремлении разобраться в окружающем мире. Гипотезы возникновения жизни. Доказательство родства человека и животных. Эволюция человека. Теории появления человека.
реферат [33,0 K], добавлен 05.06.2008Исследование различных версий о происхождении человека: появление во Вселенной, сотворение, рождение, прибытие из других миров, метаморфоз. Портреты пращуров. Закономерности эволюции предков людей. О прямохождении (причины формирования "двуногости").
реферат [27,3 K], добавлен 01.06.2010Характеристика и классификация микроорганизмов. Систематика, метаболизм и клиническое значение энтеробактерий. Сравнительный анализ традиционного и экспресс-метода биохимической идентификации при определении представителей семейства Enterobacteriaceae.
дипломная работа [8,9 M], добавлен 23.01.2018Розвиток палеонтологічних, ембріологічних, гістологічних досліджень; порівняльна анатомія та її значення. Співвідношення обсягу мозку з вагою тіла як найбільш поширений показник рівня інтелекту. Характерні відмінності в будові черепів людини та шимпанзе.
реферат [363,9 K], добавлен 16.08.2010Первый экологический кризис – смена анаэробной атмосферы на аэробную. Особенности биосинтеза органических соединений при хемосинтезе. Нюансы фотосинтеза, цикл превращения солнечной энергии в углеводы. Эволюция живых организмов, появление человека.
реферат [35,8 K], добавлен 18.11.2009Разработка метода рекомбинантных ДНК. Анализ наследования семейных заболеваний и изучение генетического сцепления у человека в случаях, когда возникают осложнения: генетическая гетерогенность и фенокопии. Карта генетического сцепления генома человека.
учебное пособие [2,0 M], добавлен 11.08.2009