Полногеномное сравнение распределения ретроэлементов в ДНК человека и шимпанзе
Краткая характеристика и классификация мобильных элементов ДНК человека. Общая характеристика ретроэлементов. Эволюция автономных ретроэлементов. Появление метода репрезентативного дифференциального анализа и метода супрессионной вычитающей гибридизации.
Рубрика | Биология и естествознание |
Вид | диссертация |
Язык | русский |
Дата добавления | 18.11.2018 |
Размер файла | 4,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Группа L1. Элементы группы L1 присутствуют в геномах животных, растений и грибов. Сюда относят сами L1 млекопитающих, Cin4 и Tal1 растений (из геномов Zea mays и Arabidopsis thaliana, соответственно), DRE из генома представителя миксомицет Dictyosteliun discoidium, Zorro из генома дрожжей Candida albicans [61], а также многие другие ретротранспозоны [16, 52, 56, 102] (см. Рис.1.5.1).
Размер их составляет от 5,5 до 7 т.п.н. Все они кодируют 2 белка, один из которых (ORF1) связывается с нуклеиновыми кислотами (т.к. имеет СН-мотивы), а другой (ORF2) обладает эндонуклеазным EN и ревертазным RT доменами [16, 52, 56]. Кроме того, на С-конце белка ORF2 находится ДНК/РНК-связывающий домен, с одним или несколькими мотивами цинковых пальцев. Более подробно я остановлюсь на наиболее изученных представителях этой группы - LINE1 (L1).
L1 произошли 100-170 млн. лет назад (по различным данным), перед разделением млекопитающих на порядки, и распространились по их геномам [48, 56, 103]. Сейчас примерно 15-20% геномной ДНК млекопитающих состоит из L1 [4, 8, 56]. Большинство L1 укорочены с 5' конца, хотя существует и небольшое количество полноразмерных L1, длина которых составляет 6-7 т.п.н. В геноме человека содержится около 5x105 укороченных с 5' конца и 3000-5000 полноразмерных L1, примерно 50 из которых еще сохраняют ретротранспозиционную активность [102].
Значительно большее количество полноразмерных и активных L1 описано в геномах грызунов, например ДНК одной из лабораторных линий мышей содержит около 2000 активных L1 (из 3000 полноразмерных) [56, 94]. По всей видимости, активные L1 присутствуют и в геномах других млекопитающих, пока еще недостаточно изученных.
Все L1 включают в себя 4 основных сегмента: 5'-UTR, ORF1, ORF2 и 3'-UTR (см. Рис.1.5.4) [56]. Наиболее консервативной является последовательность ORF2, кодирующая мультифункциональный белок. Особенностью ревертазного домена ORF2 L1 является низкая специфичность к РНК ретроэлемента [56, 94]. Поэтому неавтономные ретроэлементы - например, ретропозоны - могут использовать ее для своей интеграции в геном.
5'-UTR - самый дивергировавший участок в составе L1, настолько, что для последовательностей 5'-UTR L1 человека и грызунов гомологии вообще не прослеживается. Интересно, что 5'-UTR активных L1 из генома кролика не обладают сходством ни с 5'-UTR грызунов, ни с 5'-UTR человека, а гомологичны мРНК кератина. На Рис.1.5.4 показано, что, в отличие от 5'-UTR L1 приматов, аналогичный район L1 грызунов состоит из двух частей [56]. Первая часть представляет собой несколько тандемно расположенных мономеров, а вторая - пограничную часть (или “tether”). Причем у крыс 5' мономер лишь частично дуплицирован, тогда как 5'-UTR L1 мышей содержит до десятка практически идентичных мономеров. Представляется вероятным, что в функциональном смысле добавление и закрепление повторов в 5'-UTR L1 элемента было направлено либо против инактивирующих мутаций в регуляторном участке, либо против репрессорных механизмов хозяина.
Для транскрипции L1 используют РНК-полимеразу II (хотя и не содержат ТАТА-бокс в своем основном промоторе) [52, 55, 56, 94]. Вместе с тем, в составе 5'-UTR обнаружен также промотор РНК-полимеразы III (выше промотора РНК-полимеразы II) [56]. Промотор РНК-полимеразы II связывает некоторые факторы транскрипции (например, YY1) [56]. Как правило, экспрессия L1 в клетках блокируется с помощью метилирования 5'-UTR (транскрипция L1 осуществляется только в том случае, если 5'-UTR не метилирован) [104, 105].
Первая треть ORF1 грызунов также не гомологична аналогичному участку L1 приматов [52, 56]. Она представляет собой так называемый гипервариабельный домен. Возможно, что, как и добавление повторов в 5'-UTR, этот домен необходим для противодействия защитным системам "клетки-хозяина". Остальная часть ORF1 гомологична для всех структур L1 из ДНК различных млекопитающих. Интересно, что для 5'-концевой трети ORF1 как приматов, так и грызунов показаны сходные функции: участие в белок-белковых взаимодействиях, ORF1 приматов даже содержит мотив лейциновой молнии (Leucine Zipper) [106].
То, что 5'-UTR и первая треть ORF1 не гомологичны у различных представителей L1, может быть объяснено независимым приобретением этих участков различными группами L1. Как минимум три таких независимых события имели место в эволюции L1: в линиях L1 приматов, грызунов и кролика. Причиной таких событий могла быть негомологичная рекомбинация между L1 и геномной ДНК, в результате которой 5'-концевая часть L1 оказалась отброшена, а оставшаяся часть ретроэлемента оказалась в новом геномном окружении. При этом, если 5'-прилегающая часть геномной ДНК обладает свойствами энхансера и внутреннего промотера, а также содержит новый инициаторный кодон для ORF1, не сбивающий нормальную рамку считывания, то может образоваться новый ретротранспозон, 3'-конец которого гомологичен другим L1, а 5'-конец - нет. То же самое может произойти и в случае интеграции в новые геномные локусы 5'-усечённых (в результате абортивной обратной транскрипции) копий L1. Исходя из полученных в данной работе результатов (см. главу 3.5.), автором может быть предложено ещё одно возможное объяснение наблюдаемого явления: приобретение L1 новых 5'-концевых последовательностей в результате рекомбинации двух мРНК на стадии обратной транскрипции мРНК L1. Это хорошо согласуется с тем фактом, что 5'-концевая последовательность L1 кролика гомологична клеточной мРНК кератина.
Возвратимся, однако же, к дальнейшему описанию структурных особенностей L1. ORF1p, обладающий молекулярной массой 40 кДа, а потому часто называемый в литературе р40, это -спиральный белок, который специфически связывается с полноразмерной РНК L1 по двум определенным последовательностям в ORF2 [93] и участвует в ретротранспозиции данных элементов.
3'-UTR разных L1, хотя и сильно варьируют по длине (от 200 п.н. у человека до 1,4 т.п.н. у кролика), содержат гомологичные последовательности [52, 56]. В них находится G-богатый тракт, который в принципе может способствовать образованию тетраплексных структур, возможно, нужных для распознавания мРНК L1 ревертазой [107]. Кроме того, 3'-UTR мРНК L1 человека содержат сигнал экспорта в ядро: последовательность, специфически связывающую белок Фактор ядерного экспорта 1, NXF1(TAP) [108].
На основе последовательностей 3'-UTR семейство L1 делится на подсемейства: L1Hs (L1PA1), L1PA2-16, L1PB1-3, L1MA1-10, L1MB1-8, L1MC, L1MD, L1ME, где L1H самое молодое (и содержит еще активные копии), а L1ME - самое старое [58]. Район 3'-UTR был выбран для построения классификации постольку, поскольку он гораздо менее консервативен, чем последовательность ORF2 и, следовательно, такая классификация будет обладать большей разрешающей способностью, хотя и будет охватывать меньший временной интервал.
Для классификации L1 используется следующая номенклатура. После названия семейства - L1 - идут буквы P (Primate) или M (Mammalian), которые обозначают, что элемент присутствует исключительно в геномах приматов или же всех млекопитающих, соответственно. Буква в четвертой позиции определяет дальнейшее разделение группы, базирующееся на полной структуре 3'-UTR. Арабские цифры примерно указывают процент дивергенции членов данной группы от групповой консенсусной последовательности и, следовательно, приблизительный возраст группы. Ретротранспозоны групп L1PA(1-5) специфичны для геномов обезьян Старого Света. Кроме того, около 4000 интеграций L1 специфичны для генома человека (найдено в данной работе, см. Главу 3.2.). Самая молодая группа - L1PA1 (или L1Hs, или L1Ta) - произошла около 4 млн. лет назад, а пик ретропозиций её представителей в геноме человека был приблизительно 3 млн. лет назад [58, 103, 109] (время расхождения эволюционных ветвей человека и шимпанзе - по разным оценкам, от 5 до 7 млн. лет назад). Она насчитывает приблизительно 700 копий, 240 из которых полноразмерные [103]. Как уже было сказано, некоторые представители L1PA1 все еще активны. Кроме того, существуют полиморфные вставки L1 этого семейства среди различных популяций человека (более 55% от всех Та) [103].
В геноме мыши группа L1, способная к ретротранспозиции, называется TF [56, 103]. Ретротранспозоны групп L1PA(6-15) распространены и в обезьянах Старого Света, и в обезьянах Нового Света, а групп L1PA(15-16), L1MA(1-3) - во всех приматах. Остальные L1 распространены в геномах не только приматов, но и других млекопитающих, хотя и не обязательно во всех порядках этого класса [58].
Сравнительно недавно обнаружили представителя нового семейства группы L1 - HAL1 [5]. Они содержат единственную ORF, похожую на ORF1 L1. В геноме человека насчитывается примерно 20.000 копий HAL1. По-видимому, HAL1 - одно из самых древних семейств данной группы и, видимо, сегодняшние L1 - это продукт рекомбинации HAL1 с другим LINE (в пользу этой гипотезы говорит то, что ORF1 L1 похожа только на ORF HAL1, но не на какие-либо ORF других LINE).
Присутствие такого огромного количества повторяющихся последовательностей в геноме клетки не может не сказаться на ее функционировании. Множество генетических заболеваний связано с рекомбинацией по последовательностям этих повторов, в том числе и гомологичной рекомбинацией между L1 элементами [48, 52, 110, 111]. Примером является делеция 7,5 т.п.н. в гене -субъединицы киназы фосфорилазы (PHKB), приводящая к возникновению наследственного заболевания, связанного с неспособностью запасать гликоген [110]. Другим примером является синдром Альпорта, ассоциированный с лейкомиоматозом - здесь происходит гомологичная рекомбинацией между L1 двух соседних генов коллагена типа IV [111]. Таким образом, L1 (также как и другие LINE) могут представлять собой “горячие точки” гомологичной рекомбинации. С помощью неравного кроссинговера между L1 сестринских хроматид могут формироваться генные семейства (один из таких примеров - это дупликация генов -глобина) [102]. Кроме того, ретротранспозиция L1 в гены также может вызывать различные генетические дефекты. На данный момент известно 14 подобных случаев [48, 52, 56, 94, 112, 113] - например, гемофилия А (вставка L1 в ген фактора VIII [112]) и мышечная дистрофия Дюшенна (вставка L1 в ген дистрофина [113]). Все эти L1 элементы относятся к подгруппе L1PA1.
Следующим фактором воздействия L1 элементов на организм хозяина является то, что они участвуют в регуляции экспресии различных генов [47, 52, 56, 114, 115]. Промотор L1 используется для экспресии у мышей одной из копий гена -субъединицы протеасомного активатора 28 (РА28), который играет важную роль в процессе презентации антигена с помощью MHC I (Псевдоген РА28 внедрился в прямой ориентации в 5'-район транскрипционно активного L1 и успешно считывается с его промотора) [114]. Другой L1 предоставляет свой сигнал полиаденилирования гену, который кодирует Нуклеосомы Связывающий Белок 1 (NSBP1) [115]. L1 могут предоставлять также и последовательность энхансера, что показано для гена аполипопротеина А человека. Кроме того, вставки L1 могут являться и репрессорами транскрипции, как это показано для гена инсулина I крысы [47, 56] и для гена С1D человека [116]. L1, расположенный в 5'-UTR гена ZNF-177, влияет на экспрессию этого гена как на уровне транскрипции, так и на уровне трансляции [117].
Транскрипты L1 обнаружены в различных типах клеток и тканей человека и мыши (в сперматозоидах, в опухолевых тканях и др.) [56, 94, 104, 105, 118]. Многочисленные примеры воздействия L1 на экспрессию генов приведены в обзорах: [47, 48, 52, 56, 94].
Ещё одно интересное свойство L1: активные элементы способны переносить клеточную ДНК, фланкирующую их 3' конец (эффект, называемый `L1-трансдукцией') [119, 120]. Это объясняется тем, что белки процессинга РНК могут пропустить слабый сигнал полиаденилирования самого L1, и использовать какой-либо нижележащий сигнал. Последние исследования показали, что L1 в состоянии переносить до 15% добавочной ДНК от своей длины [120]. Таким образом, если учесть количество копий L1 в геноме человека (около 700.000), можно предположить, что L1 перенесли приблизительно 1% геномной ДНК человека (фракция, сравнимая с общим размером экзонов в геноме человека). Перенос собственно экзонов также был показан для L1: в результате L1-трансдукции один из экзонов гена CFTR был перенесён в 10 новых локусов генома человека [121]. Энхансер гена резус-ассоциированного гликопротеина (RHAG) человека и мыши фланкирован с обеих сторон L1 и SINE. Предполагается, что данный энхансер был перенесен в ген RHAG вместе с одним из ретроэлементов, изменив, в результате, экспрессию этого гена [122].
Кроме того, как показано в недавних работах [81, 123], L1 человека обладают дополнительным промотором, локализованным в 5'-UTR области ретроэлемента и ориентированным не внутрь последовательности L1, а наружу. Авторы названных работ продемонстрировали широкий репертуар и различную представленность таких транскриптов в различных тканях человека. Возможно, некоторые из этих транскриптов обладают какими-либо регуляторными функциями в геноме человека [123]; вместе с тем, непонятно, для чего такой промотер нужен самим L1.
Метилирование - это один из основных клеточных механизмов репрессии L1 элементов. Показано, что Метил-CpG Связывающий Белок 2 (MeCP2) репрессирует транскрипцию метилированных L1 человека; интересно, что на транскрипцию метилированных Alu этот белок никакого эффекта не имел [124]. Большинство L1 гиперметилированы и, следовательно, неактивны, однако существует и фракция гипометилированных L1, которые способны экспрессироваться [52, 56, 94]. В ряде случаев гипометилирование L1 ассоциировано с различного вида опухолями (например, с гепатоклеточной карциномой [104] или карциномой мочевого пузыря [105]).
Ещё одним интересным свойством L1 является найденная в данной работе способность L1 формировать и вставлять в геномную ДНК химерные ретротранскрипты, образованные во время ретропозиции при рекомбинации различных видов клеточных РНК (см. главу 3.5.). Сходное явление было совсем недавно описано и для ревертазы LINE группы R2 [99]. В принципе такой механизм может приводить к формированию новых генов.
Также L1 могут содействовать гетерохроматинизации геномной ДНК [125-129]. Например, они являются основными структурными элементами гетерохроматиновых сателлитов китообразных [125].
Как и SINE, L1 используются для построения филогенетических деревьев [130]. Кроме того, L1 в составе генноинженерных конструкций могут использоваться для экспериментов с инсерционным мутагенезом или как векторы для доставки генов в клетку [48, 131].
Группа Tad1 объединяет ретротранспозоны грибов Tad (Neurospora crassa), Mars1 (Ascobulus), Mgr583 (Magnaporthe) и др. [16, 132]. Tad элементы все еще активны в геноме Neurospora, что показано, например, для Tad1-1 и Tad3-2. Их длина составляет примерно 7 т.п.н., а 3' конец несёт поли (А) последовательность (см. Рис.17).
Они содержат 2 ORF, первая из которых гомологична ORF1 из других LINE [132]. Считываемый с нее белок имеет 3 СН-мотива, расположенных вблизи С-конца, и принимает участие в связывание нуклеиновых кислот [16]. ORF2 представляет собой ген обратной транскриптазы, в которой находятся мотивы АР-EN и RT. На С-конце ORF2p находятся один или несколько СН-мотивов. У некоторых представителей этой группы - например, Mgr583 - в состав ORF2 входит еще и домен РНКазы Н, который расположен между доменом RT и концевыми СН-мотивами [16].
Группа LOA представлена только в геноме членистоногих - LOA (D. silvestris), Bilbo (D. subobscura), Lian (Aedes) и др. [16, 133]. Длина LOA элемента составляет 7,7 т.п.н., на его 3' конце находятся тандемные повторы (ТАА)n. Как и другие LINE, LOA элементы часто укорочены с 5' конца, а иногда содержат обширные внутренние делеции. LOA содержит 2 ORF. Белок, считываемый с ORF1, имеет 2 СН-мотива [133]. ORF2 включает в себя мотивы характерные для доменов AP-EN, RT, а также РНКазы Н. На 3'-конце ORF2 обычно присутствует один СН-мотив [16, 133].
Группа R1, так же как и предыдущая, представлена ретротранспозонами членистоногих [16, 70]. Основной из них - это R1 элемент из геномов различных Drosophila (melanogaster, yakubu и др.), тутового шелкопряда (Bombyx mori), тарантулов и других организмов. Другие элементы данной группы менее распространены среди членистоногих (например, Waldo из D. melanogaster и TRAS1 из Bombyx mori).
Большинство LINE этой группы интегрируют специфически в определенный сайт генома, т.е. сайт-специфичны. Для R1 элементов таким специфическим сайтом является внутренняя последовательность гена 28S рРНК (всего на несколько десятков нуклеотидов “ниже”, чем сайт интеграции R2) [70, 87]. Длина R1 составляет 5-6 т.п.н. (см. Рис.17). ORF1 кодирует белок, который связывает нуклеиновые кислоты, т.к. он содержит 3 СН-мотива [16, 70]. ORF2 включает в себя последовательности, характерные для АР-EN и RT. С-концевая часть ORF2p также включает в себя СН-мотив. Несмотря на то, что EN R1 относится к классу апуриновых/апиримидиновых эндонуклеаз, она является сайт-специфической эндонуклеазой. При сравнении структур различных R1 элементов в пределах одного вида обнаружена сильная дивергенция последовательностей - например, аминокислотная последовательность белков ORF2р идентична всего на 35% [70].
На основе последовательностей элементов TRAS u SART, представителей семейства R1, удалось сконструировать вектор для сайт-специфической доставки ДНК в геномы [134]. Вектор интегрирует специфически в последовательность (TTAGG)n (правда, последовательности эти, мягко говоря, нередки в геномах высших эукариот, но использование специфических интеграз некоторых семейств LINE представляется весьма многообещающим подходом).
Группа CR1 распространена в геномах практически всех изученных позвоночных и некоторых беспозвоночных. К ним относят: непосредственно CR1 элементы, присутствующие в геномах многих позвоночных [135], Q и Т1 из генома Anopheles [16], а также LINE2 (L2) из генома человека [5] и др. Средний размер элементов данной группы - 4,5 т.п.н. Так же как и большинство других LINE, СR1-подобные элементы содержат 2 ORF - ДНК/РНК-связывающий белок (ORF1), с одним СН-мотивом, и ревертазу (ORF2), которая имеет в своей структуре домены RT и EN (исключением являются L2 - они содержат одну единственную ORF2) [16, 135].
Более подробно я остановлюсь на двух представителях группы CR1 - непосредственно на CR1 элементах и на L2. Ретротранспозоны CR1 - наиболее распространенные в данной группе. Это многокопийное семейство - например, в геноме курицы находится более 100.000 копий CR1, большинство из них укорочены с 5' конца. Отличительным признаком подобных элементов является отсутствие поли (А) “хвоста”, вместо которого наблюдается 2-4 повтора по 8 п.н. [135]. Структура ORF1 и 2, а также 3'-UTR среди подсемейств CR1 более или менее консервативна, но 5'-UTR сильно различаются (как и в случае L1) [16, 135]. По-видимому, новые подсемейства CR1 формировались путем добавления различных 5'-UTR (внутри которых находится промотор) к открытым рамкам считывания. Для одного из CR1 показано, что он является репрессором транскрипции гена лизозима курицы [47].
Ретротранспозоны L2 специфичны для ДНК плацентарных млекопитающих. В геноме человека содержится примерно 315.000 копий L2, большая часть которых укорочена с 5' конца [4, 5] и ни одна из которых не активна. Длина этих элементов составляет приблизительно 3,3 т.п.н. В их состав входит лишь одна ORF, кодирующая ген обратной транскриптазы.
Группа Jockey представлена исключительно ретротранспозонами членистоногих, основной элемент которой - Jockey (5,2 т.п.н.) - присутствует в геноме различных видов рода Drosophila. Кроме него, в эту группу входят: F, G, BS, Helena и Doc элементы (описанные в геноме D. melanogaster), TART (которые вместе с HeT-A элементами участвуют в сохранении размера теломер Drosophila), Juan (присутствуюшие в геномах Aedes, Culex и Drosophila), а также многие другие LINE [16, 84, 96]. Длина ретротранспозонов группы Jockey варьирует от 3 до 5,5 т.п.н. По строению все представители группы Jockey напоминают группу CR1, хотя белок, кодируемый ORF1 Jockey, имеет три СН-мотива, в отличие от CR1, которые имеют лишь один [16].
Ниже описаны два наиболее распространенных элемента группы Jockey - непосредственно Jockey и TART. Приблизительно 50-100 копий Jockey находятся в геноме D. melanogaster, причем около половины из них расположены в прицентромерных участках [16]. Одни представители группы Jockey - TART элементы - вместе с HeT-A участвуют в воспроизведении теломер Drosophila [84, 96], см. Рис.1.5.5. TART ретротранспозоны, длина которых примерно 10 т.п.н., содержат 2 стандартные ORF .
Однако же, существует одна отличительная черта TART - совершенные повторы в 3' и 5'-UTR, причем, как видно из Рис.1.5.5, повтор в 3'-UTR не терминальный, а повтор в 5' области заканчивается в ORF1. Подобные повторы найдены и у ретроэлемента DRE из Dictyostelium discoideum, хотя DRE относят к группе L1 [96].
Последовательность TART элементов включает в себя 2 промотора, на 5' конце и на 3' конце, вследствие чего образуются 2 вида полноразмерных транскриптов - смысловой и антисмысловой, соответственно. Количество антисмыслового транскрипта в клетках обычно превышает количество смыслового в 10 раз [84]. Возможно, это необходимо для эффективной репликации TART. Кроме полноразмерных транскриптов, обнаружены и процессированные мРНК TART. Еще одно необычное качество TART - это внутренняя инициация трансляции ORF2р с полноразмерной смысловой РНК [84, 96].
Существуют несколько гипотез происхождения TART. Возможно, что HeT-A и TART произошли от одного предка, т.к. оба элемента имеют похожие ORF1. В процессе дальнейшей эволюции, HeT-A потеряли последовательность ORF2, а TART - нет. Однако же, эта гипотеза не очень правдоподобна, если принять во внимание наличие повторов в 3' и 5'-UTR TART. Скорее всего, HeT-A и TART произошли от разных элементов, а их похожая структура объясняется конвергенцией [96]. Направленность HeT-A и TART к теломерам (т.е. наличие пула таких ретроэлементов вблизи теломер), по-видимому, и определяется единственным белком HeT-A или же белком ORF1 для TART.
Группа RTE включает ретротранспозоны из геномов нематод (RTE1 и 2), насекомых (JAM1) и млекопитающих (BDDF или Bov-B LINE) [16, 136, 137]. Эти элементы кодируют всего один белок, в который включены мотивы AP-EN и RT. В отличие от всех остальных LINE, ORF RTE не содержат каких-либо других функциональных мотивов (т.е., CH-мотивов, РНКазы Н и др.). RTE1 и 2 элементы нематод впервые выявили в виде последовательности длиной 3,3 т.п.н., фланкированной прямыми повторами в 200 п.н. В среднем, на гаплоидный геном приходится около 10-20 копий RTE, причем среди различных представителей одного вида наблюдается полиморфизм по вставкам RTE [137].
Bov-B LINE - это ретротранспозоны, обнаруженные в геномах некоторых млекопитающих и рептилий. Их длина составляет 3,1 т.п.н., они имеют ORF, кодирующую белок примерно в 1000 аминокислот, со стандартными для данной группы доменами. Среди млекопитающих Bov-B LINE встречаются только лишь у различных представителей подпорядка Ruminantia, в которых находится от 50.000 до 270.000 копий Bov-B LINE на гаплоидный геном. Большинство этих элементов укорочены с 5' конца. Недавно Bov-B LINE-подобные элементы обнаружили в геноме разнообразных рептилий (в определенных семействах змей и ящериц) в количестве 60.000-75.000 копий на геном [136]. По всей видимости, Bov-B LINE возникли в геномах рептилий, а их основная амплификация произошла 140-210 млн. лет назад. В геном Ruminantia они внедрились путем горизонтального переноса 40-50 млн. лет назад. Некоторые элементы данной группы все еще активны, о чем свидетельствуют их недавние интеграции. Один Bov-B LINE входит в состав кодирующей последовательности гена bbcnt (соответствующий белок - Bucentaur) коровы [47].
Группа I. Сюда собраны сильно дивергировавшие друг от друга последовательности и, возможно, при более тщательном анализе эту группу можно разбить на несколько отдельных групп. Представители группы I встречаются в геномах насекомых (I и You элементы различных видов рода Drosophila), моллюсков (BGR улиток), а также трипаносом (Ingi T. brucei и L1Tc T. сruzi) [16, 137]. Длина этих ретроэлементов - от 5 до 6,5 т.п.н. Они имеют 2 ORF. ORF1 кодирует ДНК/РНК-связывающий белок, который включает в себя 2-3 СН-мотива. ORF2 кодирует белок, содержащий домены AP-EN, RT, и РНКазы Н. На 3' конце ORF2 находится различное количество СН-мотивов (в зависимости от конкретного ретротранспозона) [16].
Глава 1.6 Не содержащие LTR ретроэлементы. Ретропозоны (SINE и процессированные псевдогены)
SINE-элементы являются вторым подклассом не содержащих LTR ретроэлементов эукариот [54]. В отличие от LINE, они не содержат кодирующих последовательностей и, следовательно, при транспозициях должны использовать обратную транскриптазу из других источников. Предполагается, что в качестве таких «доноров» выступают как раз LINE [75], поскольку вставки ДНК SINE-элементов имеют все черты, свойственные этим ретрогенам, в частности, дупликации сайта мишени вариабельной длины. Последовательность SINE обычно заканчивается олиго (А)-трактом, реже - блоком другого (обычно А-богатого ) микросателлита [138]. Однако, в отличие от LINE-элементов, SINE обычно гомогенны по длине внутри одного семейства и практически не содержат 5'-концевых делеций, поэтому нумерацию нуклеотидов ведут для них с 5'-конца.
SINE широко распространены в живой природе и обнаруживаются у растений, грибов, беспозвоночных и позвоночных животных (см. обзор [139]). Геном человека, например, примерно на 12% состоит из SINE, подавляющее большинство из которых относятся к группе Alu [4]. Не обнаружены SINE в геномах таких классических объектов молекулярной биологии, как S. cerevisia (чего и следовало ожидать: ведь в геноме дрожжей нет представителей LINE) и D. melanogaster (ретроэлемент suffix, опубликованный ранее как единственный SINE дрозофилы [59], оказался набором 5'-усечённых копий F элемента, представителя LINE).
Большинство известных SINE является очень эффективными транспозонами и представлено в геномах хозяев в количествах от нескольких тысяч до нескольких миллионов копий.
Принцип ретропозиции подразумевает транскрипцию мобильного элемента. Действительно, почти у всех известных SINE на 5'-конце расположен внутренний расщеплённый промотор для РНК-полимеразы III, наличие которого, как правило, связано с эволюционным происхождением данного семейства из аберрантно полиаденилированного транскрипта полимеразы III. Классическим считается случай происхождения SINE из 7SL РНК с внутренней делецией (B1 грызунов [140] и Alu приматов [141] - последний представляет из себя димер). Большое количество других SINE (MIR всех млекопитающих [142], В2 грызунов [143], TS табака [144]) обнаруживают в своей 5'-части высокую гомологию с последовательностями определённых тРНК (в англоязычной литературе для таких ретропозонов используется термин “tRNA-derived SINE”). В то же время их 3'-концевой домен является АТ-богатым и происходит, по-видимому, из 3'-конца LINE-элементов (см. Главу 2). Известны случаи происхождения SINE из генов малых ядерных РНК (например, элемент Bm1 генома B. mori - произошёл от U1 мяРНК [145]).
Следует, однако, заметить, что термин ”short interspersed element” сам по себе не подразумевает наличие промотора для РНК-полимеразы III и эволюционное происхождение, подобное вышеописанным. Любой короткий некодирующий ретропозон иной природы также попадает под это определение. Например, SINE-R из генома человека обязан своим происхождением длинному концевому повтору эндогенного ретровируса семейства HERV-K [146], а Ср1 из хирономид, хотя и содержит внутреннюю область, гомологичную тРНК, по-видимому, транскрибируется РНК-полимеразой I, поскольку master gene этого элемента находится в гене 28S рРНК [147]. Кстати, предложенная в [147] схема происхождения Cp1 подразумевает внедрение некоего гипотетического ретрогена-предшественника точно в сайт, в который обычно внедряется R2-LINE насекомых. Едва ли такое совпадение является случайностью, поэтому данный пример может рассматриваться как подтверждение гипотезы об участии ферментативного аппарата LINE в ретропозициях других элементов.
Таким образом, SINE - это гетерогенная группа элементов, однако наиболее распространенными и хорошо изученными являются короткие ретропозоны, произошедшие из малых РНК и транскрибируемые РНК-полимеразой III.
Для многих SINE характерна активная транскрипция в определённых тканях. Транскрипты SINE обычно гетерогенны по длине. Причин этому несколько. Так, некоторые копии могут читаться с близлежащих гетерологичных промоторов [139]. Однако же нас прежде всего будут интересовать типы РНК, синтезирующиеся с собственных внутренних промоторов SINE, находящихся на 5'-конце элементов. В этом случае разная длина транскриптов объясняется, во-первых, использованием разных сайтов терминации, и, во-вторых, процессингом транскрипта. Как известно, в случае РНК-полимеразы III терминатором служат любые четыре или более подряд идущих звеньев тимидина (в нематричной цепи), окружённые GC-богатой последовательностью [148]. Транскрипция SINE обычно продолжается за 3'-конец в прилежащую область до первого случайно встретившегося сайта с подобной структурой. Понятно, что от разных копий такой терминатор отстоит на разное расстояние. Впрочем, для Alu была показана возможность терминации точно на 3'-конце элемента при условии наличия определённого нуклеотидного 3'-микроокружения [149]. Известно, что транскрипты SINE претерпевают посттранскрипционные модификации. На 5'-конец (по крайней мере, в случае B2 грызунов) навешивается -метилмонофосфатный кэп [150], а 3'-концы большей части транскриптов подвергаются процессингу. При процессинге РНК SINE-элемента разрезается точно по определённому сайту вблизи 3'-конца (для В1 и В2 [151]), либо во внутренней области (для Alu: здесь разрезание происходит по границе левого и правого мономеров [152]). 3'-процессирующая активность, специфичная в отношении В1, имеется в ядерных экстрактах клеток культуры грызунов [153]. Зрелые транскрипты некоторых SINE обнаруживаются в ядре и цитоплазме в составе малых РНП-частиц [154]. Другие процессированные молекулы РНК подвергаются полиаденилированию (показано на примере B2 [154]).
Неясно, чем обусловлена такая сложная картина созревания транскриптов. Было высказано предположение, что SINE в составе РНП-частиц может выполнять какие-то клеточные функции, полиаденилирование же является тупиком [151]. Большое значение придаётся также и небольшому числу транскриптов, не подвергающихся 3'-концевому процессингу. Некоторые авторы предполагают [139], что в качестве затравки при синтезе кДНК SINE используется олиго(Т), соответствующий сигналу терминации транскрипции на 3'-конце непроцессированной РНК: эта область может отжигаться с олиго (А), ограничивающим последовательность ретропозона внутри транскрипта, и служить праймером (гипотеза самозатравочного механизма). Получившаяся кДНК может затем интегрироваться в геном. Заметим, однако, что существуют SINE, копии которых заканчиваются не А-богатым микросателлитом [155]; к тому же, если для ретропозиций SINE действительно используются белки, кодируемые LINE, то обратная транскрипция скорее всего протекает по схеме, аналогичной TPRT.
Остановимся подробнее на описании основных групп SINE:
7SL РНК-подобные SINE. В геномной ДНК млекопитающих содержится множество SINE. Большинство из них произошли от 7SL РНК - это Alu элементы приматов, В1 элементы грызунов и другие похожие ретропозоны (см. Рис.1.6.1) [5, 11, 15, 47, 52]. В других организмах пока не найдено 7SL РНК-подобных ретропозонов.
Более 1 млн. копий Alu присутствует в геноме человека (что составляет около 11% от всей геномной ДНК), в среднем 1 копия на 3 т.п.н. [4]. Длина Alu составляет примерно 300 п.н., из которых 282 п.н. - консенсусная последовательность, а остальные нуклеотиды входят в полиА хвост на 3'конце (Рис.1.6.1) [15, 41, 47]. Консенсусная последовательность Alu представляет собой 2 тандемно расположенных мономера, разделенных А-богатым участком.
Правый мономер (англ. free right Alu monomer - FRAM), находящийся на 3' конце Alu отличается от левого (англ. free left Alu monomer - FLAM), расположенного на 5' конце, наличием вставки в 30 п.н. и некоторыми другими незначительными изменениями [15, 47, 156]. Оба мономера (за исключением 30-ти нуклеотидной вставки в правом мономере) гомологичны 7SL РНК [15, 47]. В 5' участке FLAM находится тРНК-подобный промотор для РНК-полимеразы III. По всей видимости, этот промотор образовался в результате мутации 2 п.н. 5' участка интегрировавшей копии 7SL РНК [157].
Большинство Alu фланкированы короткими прямыми повторами (10-20 п.н.), которые являются дупликациями сайта ДНК-мишени и образуются в процессе ретропозиции [5].
На основе диагностических позиций нуклеотидов в консенсусной последовательности, Alu из генома человека разделяются на 3 подкласса - J, S и Y - которые в свою очередь разделяются на семейства: Jo и Jb; Sq, Sp, Sx, Sc, Sg и Sg1; Ya5, Ya8, Yb8, Yc3, Yc5. (Сейчас выделяют еще несколько подсемейств AluY - a1, c2 и с6 [158]). Возраст самых первых Alu, интегрировавших в геном приматов, составляет приблизительно 80 млн. лет. Подкласс AluJ включает в себя самых старых представителей данной группы, которые интегрировали в геном приматов 50-80 млн. лет назад. Возраст групп AluS и AluY равен 35 и 20 млн. лет, соответственно. Наиболее молодые группы Alu (некоторые представители семейств Ya5 и Ya8) [159-162] специфичны для генома человека.
Кроме Alu, в геноме приматов содержатся отдельно FLAM и FRAM, а также FAM - (англ. fossil Alu monomer, “ископаемый” Alu мономер (см. Рис.1.6.1) [47, 156]. FAM является одним из самых древних представителей Alu. В целом он гомологичен FRAM. Основные различия между FAM и FRAM заключаются в наличии вставки в 10 п.н., которая находится внутри участка, отличающего FRAM от FLAM [156].
В отличие от Alu, В1 элементы грызунов - это мономеры 7SL РНК, интегрировавшей в геном, которые гомологичны FLAM. Эти элементы тоже имеют поли (А) хвост на 3' конце и фланкированы прямыми повторами [47, 163, 164].
Alu/B1 используют транспозиционный аппарат представителей L1. ORF2p L1 предпочтительно расщепляет последовательность 5'-TTAAAA-3', в такие же сайты генома внедряются и Alu/B1 элементы. С этим, казалось бы, вступает в противоречие тот факт, что в целом для Alu характерны интеграции в GC-богатые участки, тогда как для L1 - в GC-бедные [8, 11, 165]. При детальном исследовании этой проблемы выяснили, что GC- состав участков генома, содержащих интеграции наиболее молодых семейств L1, идентичен таковому для Alu. По-видимому, в ходе эволюции генома человека последовательности L1 (в отличие Alu) активно удалялись из GC-богатых регионов [166], возможно, в силу своего опасного для клетки кодирующего потенциала (ведь GC-богатые фракции геномов млекопитающих обогащены последовательностями эухроматина).
Как уже было сказано, Alu/B1 SINE произошли от 7SL РНК, которая внедрилась в геномную ДНК. Затем, в результате мутаций, псевдоген 7SL РНК превратился в мономер Alu, содержащий промотор для РНК-полимеразы III. При этом и Alu, и В1 имеют внутреннюю делецию в 155 п.н. по сравнению с 7SL РНК [47, 157]. Этот мономер начал распространяться по геному и одна (или несколько) из его копий интегрировала непосредственно перед 5' концом еще одного псевдогена 7SL РНК. Вслед за этим произошло распространение новообразованного димера в геноме. Таким образом, в геноме человека присутствуют и Alu, и FLAM, и FRAM, и FAM [15, 47, 157]. При этом, большинство Alu встроилось в геном приматов уже после дивергенции линии человекообразных от остальных приматов.
По всей видимости, В1 элементы имели общего предка с Alu, т.е. общий предок Alu и В1 появился до дивергенции эволюционных линий грызунов и приматов [167]. Также показано, что Alu/B1 могли распространяться по геному с помощью генной конверсии (например, Sb2 Alu в локусе LDLR) [168].
Члены семейства Alu/B1 принимают участие во множестве клеточных процессов [15, 47, 52, 169-173]. Они влияют на экспрессию соседних генов, могут вызывать различные хромосомные перестройки и т.д. Например, в результате рекомбинации между двумя Alu могут делетироваться или транслоцироваться значительные участки хромосом [47, 170]. Благодаря Alu-опосредованной делеции, у человека инактивирован ген гидролазы ЦМФ-N-ацетилнейраминовой кислоты; во всех остальных приматах этот ген нормально функционирует [174].
Большая часть Alu/B1 элементов неактивна в связи с наличием мутаций в промоторных областях, метилированием CpG островков, содержащихся в Alu/B1 и др. Однако же, присутствуют и активные копии этих ретроэлементов [15, 47, 170]. Транскрипты Alu/B1 обнаружены во многих тканях и органах, в том числе в мозге, в печени, генеративных тканях и др. [15, 47, 52]. На данный момент известно 17 примеров наследственных генетических заболеваний, которые возникли в результате de novo ретропозиции Alu элементов в определенные участки генома человека (например, интеграция Alu в ген APC вызывает образование десмоидных опухолей, а в ген фактора IX - гемофилию). Подобные болезни описаны и для мышей [48].
Возможно, Alu вовлечены в созревание сперматозоидов при сперматогенезе человека. В Alu расположено более трети всех сайтов метилирования геномной ДНК [15]. Многие представители молодых семейств Alu не метилированы на ранних стадиях сперматогенеза, тогда как практически все копии старых Alu полностью или частично метилированы. Более того, в ооцитах метилированы и старые, и молодые Alu. Это свидетельствует о том, что эмбрион наследует различную систему метилирования Alu матери и отца. Возможно, Alu принимают участие в геномном импринтинге (различной экспрессии геномов родителей) или в компактизации ДНК сперматозоидов (т.к. метилированные сайты служат сигналом для деацетилирования гистонов, что, в свою очередь, влияет на компактизацию ДНК) [15, 171]. Выявили специфический Alu-связывающий белок в сперматозоидах, который препятствует метилированию их ДНК [171]. Кроме того, показано, что при стрессовом воздействии в клетке увеличивается количество транскриптов Alu. Полноразмерные транскрипты Alu способны связываться с белком PKR (киназа eIF2, регулируемая двуцепочечной РНК) - ингибитором трансляции - и подавлять его активность, а следовательно, восстанавливать синтез белка [15, 172].
Транскрипты Alu/B1 имеют все структурные характеристики 7SL РНК (SRP РНК). Обнаружили, что Alu могут взаимодействовать с белками 9/14 SRP и, таким образом, потенциально участвовать в сортинге белков или в других активностях связанных с SRP [15].
ВС200 РНК - это нейрон-специфичекая РНК, которая найдена во всех Anthropoidea или высших приматах (таким образом, ее возраст приблизительно 35-55 млн. лет) [163]. 5' домен этой РНК представляет собой FLAM-подобный элемент длиной 120 п.н. За ним следует центральный А-богатый участок и 3' уникальный район. ВС200 РНК транспортируется в дендриты и, по всей видимости, принимает участие в регуляции трансляции дендритных мРНК. В дендритах эта РНК находится в виде рибонуклеопротеиновых (РНП) комплексов [47, 163].
К настоящему времени известно множество примеров воздействия Alu на экспрессию различных генов. Alu могут служить энхансером транскрипции (для гена аденозиндезаминазы), модулятором транскрипции (для гена с-myc), сайленсером транскрипции (для гена PCNA), обеспечивать альтернативный сплайсинг (для одной из субъединиц ацетилхолина), входить в состав кодирующей последовательности (для гена 1С-2 субъединицы интегрина), являться инсулятором (для гена кератина 18) и т.д. (см. обзоры [15, 41, 47, 52]).
Входящая в состав транслируемой области гена печёночной изоформы казеин киназы 2 человека (CK2alpha") последовательность Alu обеспечивает ядерную локализацию этого фермента [175], а привнесённый Alu в транслируемую последовательность некоторых генов мотив обеспечивает связывание их белковых продуктов с ассоциированным с микротрубочками белком Tau [176]. Для гена ZNF-177 показано, что располагающийся в его 5'-UTR Alu, вместе с находящимся там же L1, влияет на экспрессию этого гена как на уровне транскрипции, так и на уровне трансляции [117]. В связи с этим важно, что около 5% 5'-UTR человеческих генов содержат последовательности Alu [117]. В составе одного из таких генов, гена глобулина, связывающего половые гормоны (Sex hormone-binding globulin, SHBG), в последовательности находящегося в его 5'-UTR Alu, размножился микросателлит (ТАААА)n, так что в различных аллелях количество мономеров различается от 6 до 10. Показано, что в зависимости от количества таких мономеров ген экспрессируется с различной эффективностью [177]. Эти примеры иллюстрируют степень влияния 7SL-подобных SINE на геном человека.
В недавно опубликованной работе [178] предложен метод определения исчезающе малых концентраций ДНК (от 2,5 пг) для нужд судебно-медицинской экспертизы при помощи ПЦР с праймерами, специфичными к консервативным последовательностям Alu. Применение этого подхода позволило в 60 раз повысить чувствительность метода (ранее минимальное количество ДНК в пробе составляло 150 пг). Кроме того, последовательности Alu/B1 можно использовать для филогенетических исследований [15, 179]. С помощью результатов анализа распределения Alu повторов авторам работы [161] удалось оценить размер популяции предковой линии человека миллионы лет назад.
тРНК-подобные SINE. В отличие от Alu/B1, тРНК-подобные SINE обнаружены практически во всех эукариотах. Видимо, самые ранние SINE произошли от тРНК. К данному классу ретроэлементов относят MIR (англ. mammalian-wide interspersed repeats) млекопитающих, В2 элементы грызунов, S1 растений и др. [15, 47, 52, 180-182].
В геноме человека находятся около полумиллиона тРНК-подобных SINE (около 2,3% генома) [4], большинство из которых представляют собой MIR [4, 180, 183], см. Рис. 1.6.2. Длина этих элементов составляет приблизительно 190-280 п.н. Они состоят из двух частей: консервативной и вариабельной (5' и 3' сегменты, соответственно). В консервативную часть входит участок промотора тРНК (80-90 п.н.) и коровый домен (65 п.н.); в вариабельную - участок, гомологичный 3' концу какого-либо семейства LINE (50-130 п.н.) [180, 184, 185]. Обнаружили, что MIR-подобные элементы присутствуют не только у млекопитающих, но и у птиц, рептилий, амфибий, рыб и беспозвоночных [180]. Большинство из них укорочены с 5' и/или с 3' конца, но есть и полноразмерные элементы (например, у рыб и птиц). Вместе с тем, MIR-подобные элементы в геномах низших позвоночных и беспозвоночных пока еще не достаточно хорошо изучены.
На основе сравнения последовательностей MIR из геномов различных животных, данную группу разделили на 5 семейств. 3' сегменты 4-х из 5-ти семейств MIR гомологичны различным LINE. Ранее найденные MIR2 элементы представляют собой 3' концевые последовательности LINE2 [142].
В последнее время появились свидетельства того, что МIR - это потомки стронг-стоп ДНК ретровирусов [29, 185]. Коровый домен MIR содержит консервативные участки, которые обнаружены в U5 области LTR ретровирусов, использующих в качестве праймера тРНК лизина. На основе 5' тРНК-подобных участков, MIR элементы можно поделить на несколько подгрупп. Большинство MIR произошли от тРНК лизина, но существуют и те, которые произошли от других тРНК (например, тРНК аланина или тРНК глицина). Остается вопрос: каким образом MIR приобрели 3' участки различных ретротранспозонов? Согласно предположительной модели ко-эволюции MIR и LINE (см. Рис.14) [185], стронг-стоп ДНК ретровируса или LTR-ретротранспозона интегрировала в геном либо в сам 3' участок LINE, либо выше него, поблизости. Аналогично и 5'-усечённая копия LINE могла встроиться в геном поблизости от стронг-стоп ДНК. Новообразованный ретроэлемент содержал фрагмент ретротранспозона, стронг-стоп ДНК и тРНК (последняя является праймером для синтеза стронг-стоп ДНК). В дальнейшем, встроенный ретроэлемент мог транскрибироваться РНК-полимеразой III и распространяться по геному.
В процессе эволюции эукариот, в одно и то же время существовало несколько линий LINE, которые впоследствии могли заменяться другими линиями. Происходило постоянное "вытеснение”, за счет изменений ретропозиционных активностей одних LINE другими, и, следовательно, изменение специфичности транспозиционного аппарата. Таким образом, приобретая 3' участки различных LINE, MIR приспосабливались к изменяющимся условиям среды обитания [180, 185].
Поскольку MIR обнаружены в геноме головоногих моллюсков (Cephalopoda), то можно сделать вывод о том, что первая интеграция MIR в геном животных произошла более 550 млн. лет назад - во время дивергенции предковых линий головоногих моллюсков и позвоночных [180]. В дальнейшем, MIR ко-эволюционировали вместе с LINE, при этом одни активные MIR постепенно сменялись на другие. Количество копий MIR в геномах млекопитающих различается в различных порядках. По-видимому, основная амплификация MIR произошла около 65 млн. лет назад [186], во время разделения класса млекопитающих на порядки, о чем также свидетельствует малая представленность MIR в геномах других позвоночных - птиц, рептилий, амфибий и рыб. Некоторые MIR специфичны для определенных групп млекопитающих, например, В2 элементы специфичны для порядка Rodentia, т.е. грызунов [182, 187].
В2 элементы - это типичные тРНК-подобные SINE, специфичные для трех семейств грызунов: Muridae, Cricetidae и Spalacidae. Количество копий В2 варьирует от 2.500 до 100.000 на гаплоидный геном. Длина этих элементов составляет примерно 200 п.н. Как и другие MIR, они состоят из трех частей: 5' тРНК-подобного участка (а именно - тРНК лизина), содержащего промотор РНК-полимеразы III, корового домена, негомологичного тРНК, и 3' АТ-богатого участка. Примечательно, что АТ-богатый участок В2 несёт промотор РНК-полимеразы II, который, судя по всему, совершенно не нужен для ретропозиции В2. Показано, что этот промотор стимулируется транскрипционным фактором USF. Таким образом, при размножении В2 происходит перенос функционального промотора РНК-полимеразы II в новые локусы генома, что может иметь важные эволюционные последствия [188].
По всей видимости, В2 элементы образовались в геноме грызунов уже после дивергенции последних от остальных млекопитающих, т.е. 40-55 млн. лет назад [15, 182, 187]. В последнее время появляются данные о том, что В2-подобные элементы присутствуют в геноме человека и других приматов. Количество таких элементов в геномах приматов очень мало - 100 и менее, возможно, что В2 встроились в геном млекопитающих до разделения последних на порядки, а увеличение количества их копий произошло только в грызунах [182].
В геномах грызунов присутствуют еще 4 семейства ретропозонов, входящие в суперсемейство В2 - это DIP, MEN, ID элементы и псевдогены 4,5S1РНК [187]. Все они содержат гомологичную 5' часть, А-богатый 3' конец и фланкированы прямыми повторами, но различаются по другим последовательностям, расположенными в середине элемента. Из всех этих семейств лучше всего изучены ID элементы [47, 187, 189].
Количество ID колеблется от 200 в геноме морской свинки до 100.000 в геноме крысы. Длина ID элементов составляет 85-105 п.н., из которых 75 п.н. коровый участок, а остальные 10-40 п.н. - поли (А) "хвост". Эти элементы произошли от тРНК аланина [187, 189].
Псевдогены 4,5S1РНК являются, как ясно из их названия, потомками 4,5S1РНК. Их длина - 98 п.н., а количество копий на геном, например, крысы - 10.000 [187].
MEN представляет собой химерный ретропозон, 5' часть которого гомологична В2 элементу, а 3' часть - В1. Недавно одной из групп исследователей найден еще один химерный элемент, специфичный для грызунов. Его 5' мономер произошел от В1, а 3' - от ID [164].
DIP - это элементы суперсемейства В2 (100.000 копий в геноме тушканчика), отличительная особенность которых - СТ-богатый мотив, расположенный непосредственно перед А-богатым 3' концом [187].
По-видимому, предком всех представителей суперсемейства В2 были ID-подобные элементы. Самыми молодыми в этом суперсемействе являются непосредственно В2 и DIP ретропозоны, т.к. они присутствуют лишь у отдельных групп грызунов [47, 187, 189].
Как и большинство других ретроэлементов, тРНК-подобные SINE могут оказывать влияние на экспрессию генов клетки, в геном которой они интегрировали. Одним из таких примеров является нейрон-специфическая BC1 РНК грызунов [47, 189]. Эта РНК длиной в 152 п.н. представляет собой сохранившийся мастер-ген ID элементов. Ее 5' часть гомологична тРНК аланина (75 п.н.), а 3' часть - состоит из центрального А-богатого участка (50 п.н.) и концевого уникального участка (25 п.н.). Предполагается, что BC1 РНК участвует в регуляции трансляции дендритной мРНК (как и РНК ВС200) [189]. Другие ID элементы могут входить в состав энхансеров или стабилизировать структуру мРНК (например, для гена pIL2) [47]. Обнаружили, что MIR элементы могут включаться в кодирующие области генов, в результате альтернативного сплайсинга. Подобное явление было описано для гена ацетилхолинового рецептора человека [190]. Более того, некоторые MIR предоставляют свои сигналы полиаденилирования (расположенные на их 3'-конце) для различных генов млекопитающих. Например, сайт полиаденилирования одного из В2 элементов используется геном глютатион-S-трансферазы мышей [47].
Также, MIR используются клеточными генами в качестве разнообразных регуляторных последовательностей (активатора, репрессора и др.) [47]. Они могут входить в состав экзонов и участвовать в альтернативном сплайсинге (например, последовательность MIR сплайсируется во второй экзон гена ATM [191]). тРНК-подобные SINE используются в молекулярной систематике [192, 193], т.к. обладают практически всеми необходимыми для этого свойствами, такими как необратимость интеграций и наличие большого количества копий на геном.
SINE-R - это одна из самых малоисследованных групп ретропозонов. Первый представитель данного подкласса, SINE-R.C2, нашли как человек-специфичную вставку в ген системы комплемента С2 [146]. В дальнейшем обнаружили еще несколько представителей данного семейства в геноме человека [194-197]. По всей видимости, эти элементы произошли от одного из семейств эндогенных ретровирусов - HERV-K (HML-2). Большая часть последовательности SINE-R гомологична 3' концу HERV-K: небольшой части внутренней последовательности и части LTR вплоть до сигнала полиаденилирования (см. Рис.1.6.3). Кроме того, на 5' конце они содержат несколько блоков повторов (названных GC повторами) по 40 п.н. (обычно 2-3).
...Подобные документы
Общая характеристика отряда приматов: образ жизни, строение. Особенности подотряда полуобезьян. Характеристика высших приматов - семейств широконосых, узконосых и человекообразных обезьян. Сравнение кисти руки гориллы и человека, стопы гориллы и шимпанзе.
презентация [869,9 K], добавлен 16.05.2012Развитие взглядов на происхождение человека. Центр происхождения человека. Доказательства происхождения человека от животных. Влияние окружающей среды на появление человека. Эволюция гоминид. Биологический, социальный и трудовой факторы эволюции.
реферат [37,7 K], добавлен 26.04.2006Анализ влияния мозга человека на его деятельность и чувства, с указанием многочисленных примеров из жизни, а также его основные отличия от мозга шимпанзе. Сравнение мужского и женского пространственного мышления. Сущность развития мышления человека.
реферат [50,8 K], добавлен 24.11.2009Сущность генеалогического метода и его применение в генетике человека. Особенности наследования различных признаков. Гипотеза и ход исследования родословной. Генетические закономерности наследования признаков человека и сравнение результатов с гипотезой.
практическая работа [90,5 K], добавлен 20.05.2009Характеристика изменений, которые происходят в геноме клетки, и возникают при вставке мобильных генетических элементов в геном. Мобильные генетические элементы в геноме Drosophila Melanogaster (дрозофила чернобрюхая). Мобильные элементы гетерохроматина.
курсовая работа [72,8 K], добавлен 29.05.2015Тайна происхождения человека и его расселения на территории Земли. Путь гоминизации многих видов приматов. Теория африканского происхождения человека. Родословная человека, факторы антропогенеза. Основные этапы эволюции человека. Современный тип людей.
презентация [1,3 M], добавлен 21.05.2015Эволюция человека, ее отличие от эволюции животных и движущие силы. Гипотезы естественного происхождения человека. Признаки человека и его место в системе животного мира. Основные этапы антропогенеза и характерные черты развития предков человека.
контрольная работа [27,6 K], добавлен 03.09.2010Систематическое положение человека. Род гиббонов, орангутангов, горилл, шимпанзе: виды, места обитания, строение тела, образ жизни. Биологическая теория происхождения человека Ч. Дарвина. Основные группы доказательств происхождения человека от животных.
презентация [8,7 M], добавлен 18.05.2010Возраст человека: абсолютный, биологический, паспортный, психический, социальный. Критерии биологического возраста. Эволюция человека. Характеристика австралопитека. Расизм, его социальные корни. Прогрессивная общественность в борьбе против расизма.
реферат [33,0 K], добавлен 31.10.2008Характеристика радиочастотных (РЧ) воздействий. Выводы ученых по исследованию популярных марок телефонов и их влияния на здоровье человека, системы организма человека, наиболее подверженные вредному влиянию. Меры по защите населения от РЧ-излучения.
научная работа [21,5 K], добавлен 09.02.2009Основные признаки этапов эволюции человека. Размер и образ жизни дриопитеков. Отличия австралопитеков от человека умелого, период его появления и размер мозга. Внешний вид человека прямоходящего. Ареал обитания неандертальцев. Орудия труда кроманьонца.
презентация [2,2 M], добавлен 06.04.2015Начало научного представления о происхождении человека. Идеи Дарвина и их революционная роль в учении об антропогенезе. Австралопитек как прямой предок рода Homo. Эволюция приматов до человека, ее движущие силы. Виды рода Homo и появление Homo sapiens.
реферат [613,2 K], добавлен 09.09.2012Механизм эволюции прокариотического и эукариотического геномов. Свойства, отбор и динамика рисунка локализации мобильных генетических элементов. Роль мобильных генетических элементов и горизонтального переноса генетического материала в эволюции генома.
курсовая работа [84,5 K], добавлен 30.09.2009Представления о происхождении человека в Европейском средневековье. Современные взгляды на проблему происхождения человека. Предположения Ч. Дарвина о происхождении человека. Проблема прародины современного человека. Особенности хода эволюции человека.
реферат [36,8 K], добавлен 26.11.2010Вопросы происхождения и сущности жизни издавна стали предметом интереса человека в его стремлении разобраться в окружающем мире. Гипотезы возникновения жизни. Доказательство родства человека и животных. Эволюция человека. Теории появления человека.
реферат [33,0 K], добавлен 05.06.2008Исследование различных версий о происхождении человека: появление во Вселенной, сотворение, рождение, прибытие из других миров, метаморфоз. Портреты пращуров. Закономерности эволюции предков людей. О прямохождении (причины формирования "двуногости").
реферат [27,3 K], добавлен 01.06.2010Характеристика и классификация микроорганизмов. Систематика, метаболизм и клиническое значение энтеробактерий. Сравнительный анализ традиционного и экспресс-метода биохимической идентификации при определении представителей семейства Enterobacteriaceae.
дипломная работа [8,9 M], добавлен 23.01.2018Розвиток палеонтологічних, ембріологічних, гістологічних досліджень; порівняльна анатомія та її значення. Співвідношення обсягу мозку з вагою тіла як найбільш поширений показник рівня інтелекту. Характерні відмінності в будові черепів людини та шимпанзе.
реферат [363,9 K], добавлен 16.08.2010Первый экологический кризис – смена анаэробной атмосферы на аэробную. Особенности биосинтеза органических соединений при хемосинтезе. Нюансы фотосинтеза, цикл превращения солнечной энергии в углеводы. Эволюция живых организмов, появление человека.
реферат [35,8 K], добавлен 18.11.2009Разработка метода рекомбинантных ДНК. Анализ наследования семейных заболеваний и изучение генетического сцепления у человека в случаях, когда возникают осложнения: генетическая гетерогенность и фенокопии. Карта генетического сцепления генома человека.
учебное пособие [2,0 M], добавлен 11.08.2009