Полногеномное сравнение распределения ретроэлементов в ДНК человека и шимпанзе
Краткая характеристика и классификация мобильных элементов ДНК человека. Общая характеристика ретроэлементов. Эволюция автономных ретроэлементов. Появление метода репрезентативного дифференциального анализа и метода супрессионной вычитающей гибридизации.
Рубрика | Биология и естествознание |
Вид | диссертация |
Язык | русский |
Дата добавления | 18.11.2018 |
Размер файла | 4,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
РОССИЙСКАЯ АКАДЕМИЯ НАУК
Институт Биоорганической Химии им. М.М. Шемякина и Ю.А. Овчинникова
ДИССЕРТАЦИЯ
на соискание учёной степени кандидата биологических наук
Полногеномное сравнение распределения ретроэлементов в ДНК человека и шимпанзе
03.00.03 - Молекулярная биология
Буздин Антон Александрович
Научный руководитель:
Старший научный сотрудник ИБХ РАН, кандидат биологических наук
Лебедев Ю. Б.
Москва - 2002
Оглавление
Список использованных сокращений
Введение
Часть 1. Разнообразие мобильных элементов
Глава 1.1 Краткая характеристика и классификация мобильных элементов
Глава 1.2 ДНК-транспозоны, или мобильные элементы класса II
Глава 1.3 Общая характеристика ретроэлементов
Глава 1.4 Не содержащие LTR ретроэлементы. Ретроинтроны (интроны группы II)
Глава 1.5 Не содержащие LTR ретроэлементы. Группа LINE
Глава 1.6 Не содержащие LTR ретроэлементы. Ретропозоны (SINE и процессированные псевдогены)
Глава 1.7. LTR-содержащие ретроэлементы: LTR-ретротранспозоны и эндогенные ретровирусы
Глава 1.8 Некоторые аспекты происхождения и эволюции
Глава 1.9 Функции ретроэлементов в клетке и их влияние на геном хозяина: факты и гипотезы
Часть 2. Техника вычитающей гибридизации: эффективный подход к решению задач молекулярной генетики
Глава 2.1 Появление метода
Глава 2.2 Применение ПЦР для усовершенствования ВГ
Глава 2.3 Появление метода Репрезентативного Дифференциального Анализа (RDA)
Глава 2.4 Метод Супрессионной Вычитающей Гибридизации (SSH)
Глава 2.5 Дальнейшие перспективы развития техники ВГ
Экспериментальная часть работы
Часть 3. Разработка метода TGDA и применение его для поиска специфичных для генома человека внедрений ретроэлементов
Глава 3.1 Актуальность метода
Глава 3.2 TGDA: экспериментальная техника, позволяющая проводить полногеномное сравнение распределения мобильных элементов между организмами без предварительного знания первичной структуры их геномов
Принцип метода
Глава 3.3 Полногеномная идентификация интеграций HERV-K (HML-2), специфичных для генома человека.
Глава 3.4 Применение TGDA для поиска чс внедрений L1
Глава 3.5 Химерное семейство ретроэлементов U6-L1
Глава 3.6 Заключение
4. Материалы и методы
4.1 Образцы геномных ДНК
4.2 Олигонуклеотиды
4.3 Приготовление ДНК Трейсера и Драйвера
4.4 Вычитающая гибридизация
4.5 Создание библиотек и дифференциальный скрининг фланков LTR
4.6 Определение первичной структуры клонов
4.7 Анализ последовательностей ДНК
4.8 ПЦР-анализ
4.9 Гибридизация с зондами на последовательности U6 мяРНК и L1
4.10 Образцы кДНК тканей человека
Приложение 1. Структура уникальных геномных праймеров, использованных для амплификации локусов, содержащих интеграции LTR
Приложение 2. Структура уникальных геномных праймеров, использованных для амплификации локусов, содержащих интеграции L1
Приложение 3. Структура уникальных геномных праймеров, использованных для амплификации локусов, содержащих отобранные для анализа интеграции LTR HERV-K(HML-2), принадлежащих семейству HS
Список литературных источников
Благодарности
Список использованных сокращений
ВГ - Вычитающая Гибридизация
мяРНК - Малая Ядерная РНК
ПЦР - Полимеразная Цепная Реакция
п.н. - пары нуклеотидов
т.п.н. - тысяч пар нуклеотидов
чс - специфичный для генома человека
EN - эндонуклеаза, или эндонуклеазный домен; от англ. EndoNuclease
ERV - эндогенный ретровирус, от англ. Endogenous RetroVirus
HERV - эндогенный ретровирус человека, от англ. Human Endogenous RetroVirus
LINE - название таксона автономных LTR- несодержащих ретроэлементов, от англ. Long Interspersed Nuclear Element
LTR - длинный концевой повтор, от англ. Long Terminal Repeat
ORF - открытая рамка считывания, от англ. Open Reading Frame
PBS - участок посадки праймеров, от англ. Primer Binding Site
RT - обратная транскриптаза, или домен обратной транскриптазы, в зависимости от контекста; от англ. Reverse Transcriptase
SINE - название таксона неавтономных LTR- несодержащих ретроэлементов, от англ. Short Interspersed Nuclear Element
TE - мобильные элементы, от англ. Transposable Element
TGDA - метод полногеномного сравнения интеграций мобильных элементов между ДНК родственных видов, от англ. Targeted Genomic Differences Analysis
VLP - вирусоподобные частицы, от англ. Virus Like Particles
Введение
Чем дальше продвигается наука в постижении механизмов и назначения обратного потока генетической информации, тем больше вопросов встаёт перед исследователями. Обнаружение в геномах живых организмов всё новых и новых мобильных элементов постоянно заставляет пересматривать или корректировать многие воззрения на эволюцию и функционирование генетического аппарата клетки. Успехи в технологиях клонирования и секвенирования протяжённых последовательностей ДНК выводят молекулярную генетику на новый, доселе невиданный, уровень - уровень исследования целых геномов. Вместе с тем понятно, что (i), хотя количество определённых полногеномных последовательностей ДНК различных организмов и возрастает год от года, далеко не для всех видов живых организмов эти последовательности будут установлены в обозримом будущем. К тому же (ii), при осуществлении любого такого масштабного геномного проекта оперируют лишь небольшой выборкой геномов представителей изучаемого вида и большинство полиморфных для данного вида аллелей при этом ускользают от анализа. В связи со сказанным выше чётко встаёт проблема создания новых техник, позволяющих проводить полногеномное сравнение ДНК различных видов организмов или особей одного вида без масштабного секвенирования. Данная работа была посвящена созданию такого метода, позволяющего проводить сравнение распределения повторяющихся элементов между организмами на уровне целых геномов. Метод был применён для поиска внедрений мобильных элементов, специфичных для генома человека.
Часть I. Разнообразие мобильных элементов
Глава 1.1 Краткая характеристика и классификация мобильных элементов
Мобильные элементы, или транспозоны (англ. Transposable Elements - TE) - это фрагменты ДНК, способные каким-либо способом размножаться и перемещаться в геноме. Первые TE около 50 лет назад были описаны в геноме кукурузы Барбарой МакКлинток [1]. С тех пор мобильные элементы были обнаружены в геномах практически всех организмов. Они являются одним из основных компонентов геномов эукариот. Например, TE составляют более 50% генома кукурузы (Zea mays) [2, 3], 10-15% генома Drosophila [3] и 42% генома человека [4]. При этом разные группы транспозонов представлены различным количеством копий на гаплоидный геном - от единиц и до миллионов [2-19].
В связи с огромной представленностью в геномах эукариот, TE рассматриваются как один из основных факторов эволюции эукариотических геномов [2, 3, 6, 9, 10, 15, 20-22]. Их интеграции в различные участки геномной ДНК могли придавать организму либо определённые преимущества по отношению к другим, либо же, наоборот, могли снижать жизненный статус организма и приводить к его гибели. Показано, что внедрения транспозонов могут изменять регуляторные участки генов, вызывать хромосомные перестройки и изменения структуры хроматина, могут даже участвовать в процессе удлинения теломер, а также в репарации ДНК [2, 3, 5-7, 9-12, 20-24].
Абсолютно все TE зависят от функционирования клетки-хозяина и, следовательно, “заинтересованы” в поддержании ее жизнедеятельности. Ко-эволюция и ко-адаптация ТЕ и генома клетки, в который они интегрировали, играют важную роль в поддержании активности мобильных элементов.
ТЕ различаются по своей структуре и по типу транспозиции. Выделяют 2 основных класса ТЕ - I и II [2-6, 9, 11]. Класс I представляет собой ретроэлементы - мобильные элементы, размножающиеся посредством РНК-копий своего генома. Для транспозиции они используют фермент РНК-зависимую ДНК-полимеразу (альтернативные названия этого фермента: обратная транскриптаза (reverse transcriptase - RT), ревертаза), которая осуществляет синтез ДНК на матрице РНК. Класс II ТЕ включает в себя элементы, которые перемещаются непосредственно с помощью своих ДНК-копий (так называемые ДНК-транспозоны). Их транспозиция осуществляется путем вырезания и реинтеграции в новое место генома. При этом иногда происходит размножение таких мобильных элементов: исходный экземпляр остается в прежнем сайте, а копия встраивается в новый район ДНК. Дупликация элемента может также происходить при перемещении транспозона из реплицированной в еще не реплицированную часть генома или же при генной конверсии. Для транспозиции элементы класса II используют фермент транспозазу.
Первая часть настоящего обзора посвящена рассмотрению общих структурных свойств, эволюции и функциональной активности ТЕ. Наиболее пристальное внимание будет уделено ретроэлементам, поскольку именно представители этого класса транспозонов были активны в предковой линии человека и остаются активными в геноме Homo sapiens и поныне.
Глава 1.2 ДНК-транспозоны, или мобильные элементы класса II
Мобильные элементы данного класса имеют инвертированные концевые повторы - TIR, от англ. tandem inverted repeats - длиной от 10 до 500 п.н. и подразделяются на две группы: автономные и неавтономные ДНК-транспозоны [2, 3, 5, 11, 14]. Автономные элементы кодируют транспозазу, которая специфически связывается с TIR и катализирует вырезание и интеграцию мобильного элемента, т.е. транспозицию. Неавтономные элементы используют транспозазу других ТЕ для своего перемещения по геному. Интеграция в геном приводит к образованию фланкирующих элемент коротких прямых повторов (англ. direct repeats - DR). Длина DR обычно cоставляет 2-8 п.н. [25-27]. Классификация ДНК транспозонов построена на основе сходства их TIR и последовательностей транспозаз. Наиболее простой структурой обладают так называемые IS (от англ. insertion sequence) элементы прокариот, которые образуют отдельный подкласс ДНК-транспозонов [24, 27].
IS прокариот - это небольшие фрагменты ДНК (длиной обычно менее 2,5 т.п.н.), которые характеризуются несложной структурой. Схематическое изображение типичного IS элемента представлено на Рис.2. Довольно сложно определить границы этого подкласса TE, поэтому некоторые IS, например IS101 и IS1071 [27], иногда относят к собственно ДНК транспозонам. На концах IS содержат инвертированные повторы в 8-40 п.н., причем обычно правый и левый повторы не полностью идентичны друг другу (для IS1, например, гомологичны 18 из 23 п.н.). Как правило IS содержат только одну открытую рамку считывания (англ. open reading frame - ORF), кодирующую белок транспозазу, необходимый для перемещения IS по геному. В процессе интеграции IS в геном происходит дупликация сайта ДНК-мишени, вследствие чего IS содержат на концах прямые повторы от 2 до 12 п.н. Некоторые IS элементы могут формировать собой концы других, более высокоорганизованных прокариотических транспозонов. Так, например, концы Tn10 представляют собой два противоположно ориентированных IS10, а концы Tn5 - два IS50 [27]. Заканчивая описание IS элементов, необходимо упомянуть, что именно ими опосредовано взаимодействие между F-фактором и бактериальной хромосомой.
Собственно ДНК транспозоны содержатся в геномах как прокариот, так и эукариот (например, в среднем около 1,5% генома эукариот составляют ДНК транспозоны [4, 5, 11]). Эти элементы обычно содержат короткие инвертированные повторы, хотя некоторые представители этой группы их не имеют (например, бактериофаг Mu) [28]. В отличие от IS, ДНК транспозоны прокариот являются более сложно организованными мобильными элементами, которые, в большинстве случаев, кодируют не только транспозазу, но и другие белки, содействующие их распространению по геному. Как уже было сказано, ДНК транспозоны разделяются на автономные и неавтономные элементы. Мобильность ДНК транспозонов обеспечивается инвертированными повторами, которые опознаются транспозазой в процессе вырезания этих мобильных элементов из геномной ДНК [25, 26]. Неавтономные элементы не кодируют собственной транспозазы, но содержат TIR, гомологичные инвертированным повторам автономных элементов, и всегда используют “чужую” транспозазу для своего перемещения по геному [25, 29, 30]. Одним из примеров неавтономного ДНК-транспозона является элемент Ds из Zea mays, который использует транспозазу элемента Ас, т.к. последние 11 п.н. в последовательности инвертированных повторов у него такие же как и у Ac [25]. Механизм транспозиции ДНК транспозонов представлен на Рис.3. Согласно классификации, построенной на сходстве транспозаз, ДНК-транспозоны подразделяют на два семейства: Ac/hobo и Tc1/mariner [11, 25, 26, 31].
Семейство Ac/hobo включает в себя транспозоны различной длины - от 3 до 8 т.п.н., кодирующие, как правило, не только транспозазу, но и различные вспомогательные белки (например, вспомогательный ДНК-связывающий белок). Представители данного семейства имеют похожие TIR длиной 12-15 п.н. [14]. Полноразмерные активные представители семейства обнаружены в геномах многих растений, а также животных - от беспозвоночных до Xenopus laevis. Элементы семейства Ac/hobo, содержащие большие внутренние делеции, обнаружены и у других эукариот - элемент Tourist в геноме Zea mays [2], элемент Pony в ДНК Aedes aegypti [32], элемент Emigrant в геноме Arabidopsis thaliana [33] и др. [5, 34, 35]. В геноме человека также присутствуют такие элементы, длиной от 150 до 500 п.н. Их относят к группе MER1 (medium reiterated frequency repeats), количество их составляет около 105 на гаплоидный геном. Все вышеописанные содержащие делеции транспозоны Ac/hobo являются дефектными автономными транспозонами. Есть среди представителей Ac/hobo и неавтономные элементы, например элемент Sol3 или упоминавшийся уже элемент Ds. В заключение необходимо упомянуть о том, что в геноме человека найдены и полноразмерные транспозоны семейства Ac/hobo - элементы Charlie1-8, Cheshire, Zaphnod и MER69, которые кодируют транспозазу гомологичную транспозазам hobo, Ac/Ds и Tam [5, 14]. Однако же рамки считывания этих транспозонов человека прерваны большим количеством мутаций. Вообще, по всей видимости, геномы всех млекопитающих не содержат активных ДНК-транспозонов.
Второе семейство ДНК-транспозонов, Tc1/mariner, характеризуется инвертированными повторами длиной 23-30 п.н. и сайтом ДНК-мишени ТА [13, 26, 30]. Представители Tc1/mariner кодируют либо единственный белок - транспозазу, либо имеют одну дополнительную рамку считывания (например, элемент pogo). Семейство Tc1/mariner в большинстве своем, как и семейство Ac/hobo, представлено дефектными ТЕ. Длина таких элементов обычно составляет 100-2500 п.н. В геноме человека это группа MER2, у представителей которой делетирована большая часть внутренней последовательности. В геноме человека найдены и полноразмерные представители MER2 - Tigger1 и Tigger2. Размер Tigger1 и Tigger2 составляет примерно 2,4 и 2,7 т.п.н., соответственно, а размер элементов с внутренней делецией (подавляющее большинство представителей группы MER2) - от 200 до 1200 п.н. [5, 34, 36].
ДНК транспозон mariner (его размер приблизительно 1300 п.н.) изначально обнаружили в насекомых - Drosophila, Carpelimus, Mellifera и др. Он кодирует единственный белок - транспозазу. В последнее время mariner-подобные копии выявили и в геномах некоторых млекопитающих, например в ДНК человека и овцы [11, 14, 36, 37]. Не исключено, что mariner представлен и в геномах других организмов.
В настоящее время многие исследователи рассматривают ДНК-транспозоны как один из важных факторов эволюции организмов. В ходе эволюции вставки транспозонов могли изменять транскрипцию близлежащих генов или процессинг их транскриптов, участвовать в выключении генов, способствовать перемещению больших участков ДНК (с помощью альтернативной транспозиции или гомологичной рекомбинации) [2, 3, 22, 24]. Возможно, что происхождением антиген-специфичного иммунитета позвоночные обязаны именно ДНК транспозонам. Рекомбинационная система VDJ обладает двумя основными признаками ДНК транспозонов: рекомбиназой (кодируемой генами RAG1 и RAG2) и мобильной ДНК, ограниченной специфическими сайтами, которые узнает рекомбиназа. Кроме того, RAG белки гомологичны транспозазе элемента Тс1 [5]. Кроме того, основной связывающий центромеры белок млекопитающих СENP-B гомологичен транспозазе pogo [14]. Также показано наличие фрагментов последовательностей различных ДНК-транспозонов в экзонах некоторых клеточных мРНК - например, для мРНК генов eIF4G2 и p52rlPK [5].
Глава 1.3 Общая характеристика ретроэлементов
Термин “ретроэлементы” относится к обширному классу последовательностей нуклеиновых кислот, появление и/или поддержание которых в клеточном геноме так или иначе связано с процессом переноса генетической информации от РНК к ДНК, называемым обратной транскрипцией. Возможность этого явления, показанная ещё в 60-е годы советским генетиком С.М.Гершензоном в опытах с вирусом полиэдроза насекомых [38], впервые была чётко продемонстрирована в 1970 г. в работах Г.Тёмина и Д.Балтимора.
Этим авторам удалось выделить и охарактеризовать фермент РНК-зависимую ДНК-полимеразу, или ревертазу, способную катализировать синтез ДНК-копии (кДНК) на РНК-матрице [39, 40]. С тех пор последовательности, кодирующие гомологичные обратной транскриптазе белки, были обнаружены в составе самых разных генетических элементов. Кроме ретровирусов, с которыми работали Тёмин и Балтимор, и ряда других представителей вирусного царства (гепаднавирусы, каулимовирусы), в эту группу оказались включены несколько типов мобильных элементов эукариот, интроны группы II из митохондрий дрожжей, бактериальные ретроны и некоторые плазмиды. Ретроэлементы можно разделить на два класса: (1) те, которые для для размножения используют собственные белки, или ретротранспозоны, и (2) те, которые не кодируют собственных белков и перемещаются по геному при помощи ферментного аппарата ретроэлементов класса (1), или ретропозоны [41] - такая классификация аналогична разбиению ДНК-транспозонов на автономные и неавтономные.
Разными исследователями неоднократно предпринимались попытки создать классификацию всех известных ретроэлементов класса (1) на основе эволюционного родства закодированных в них ревертаз [42-44]. Авторам наиболее полной из них [43] не только удалось показать общность происхождения обратных транскриптаз, взятых из разных источников, но и обосновать гипотезу, согласно которой возможными предками всех ретроэлементов следует считать предшественников современных вирусов с (+)РНК-геномом, поскольку именно РНК-зависимая РНК-полимераза этих вирусов наиболее близка по своей первичной структуре к ревертазе.
Все эти спекуляции, тем не менее, касаются лишь происхождения и эволюции гена обратной транскриптазы, в то время как многие ретроэлементы имеют рамки считывания и для других белков, причём филогенетические деревья, построенные на основе сравнения их последовательностей, могут не совпадать с таковыми для ревертаз [44]. В данной работе автор будет придерживаться традиционной классификации, приведённой ниже, которая построена на основе морфофункциональных признаков. К рассмотрению же филогении гена обратной транскриптазы мы ещё на раз будем возвращаться по ходу изложения материала.
Как было сказано выше, к первому (1) классу ретроэлементов относятся ретротранспозоны, обладающие собственным геном ревертазы. Их подразделяют на элементы, содержащие и не содержащие длинные концевые повторы (англ. long terminal repeats, LTR) - последовательности длиной 100-1800 п.н., фланкирующие “тело” ретроэлемента в геномной ДНК. LTR-содержащие ретротранспозоны и ретровирусы имеют также несколько открытых рамок считывания - gag, pol и env [19, 41]. LTR-ретротранспозоны, в отличие от ретровирусов, не имеют гена env [5, 17, 41]. Не содержащие LTR элементы как правило относят к LINE (англ. long interspersed nuclear element). Размер LINE составляет 3,5-8 т.п.н. В геноме LINE содержится ген ревертазы и, иногда, другие гены, кодирующие белки, необходимые для эффективного размножения ретроэлементов. На 3'-конце LINE содержат поли (А) участок, который, вероятно, играет важную роль в процессе их интеграции в новые локусы геномной ДНК.
Ретроэлементы класса (2), не содержащие гена ревертазы, представляют собой либо SINE (англ. short interspersed nuclear elements), либо процессированные псевдогены. SINE - это последовательности длиной 50-700 п.н., как правило обладающие внутренним промотором РНК-полимеразы III. На 3'-конце они, как правило, имеют поли (А) последовательность. К SINE относятся Alu, В1, MIR и многие другие ретроэлементы [15, 41].
Таким образом, ретроэлементы подразделяются на 3 основных систематических группы: LTR-содержащие, LINE и SINE. Также в состав мобильных ретроэлементов включают ещё одну, стоящую особняком, группу: ретроинтроны (мобильные интроны группы II). Каждая из названных групп ретроэлементов будет описана далее в соответствующих главах настоящего обзора.
Основная гипотеза происхождения ретроэлементов была предложена Теминым [45]. Она заключается в следующем: ретроэлементы могли эволюционировать вместе с геном обратной транскриптазы, т.е. происходила последовательная специализация РНК-зависимой ДНК-полимеразы. Предполагаемый путь эволюции шёл от гена обратной транскриптазы, через LTR-несодержащие ретротранспозоны, к LTR-содержащим ретротранспозонам и ретровирусам. Анализ структуры различных классов ретроэлементов, представленных в геномах эукариот, показывает постепенное приобретение предшественниками эндогенных ретровирусов (ERV, англ. endogenous retrovirus) дополнительных ферментативных активностей - РНКазы Н, интегразы (IN), протеазы (PR), а также некоторых регуляторных белков. Одновременно происходила успешная ассоциации этого предшественника с последовательностями, влияющими на его регуляторный потенциал (такими как LTR). Есть некоторые подтверждения этой гипотезы. Филогенетический анализ последовательностей гена обратной транскриптазы показал, что ретроинтроны и LINE (ретротранспозоны, не содержащие LTR) являются более древней формой, чем ретровирусы [41].
Механизм ретропозиции ретроинтронов и LINE также значительно проще, чем у LTR-ретротранспозонов и ретровирусов. Возможно, фермент теломераза, который имеет активность ДНК-зависимой РНК-полимеразы, является наименее дивергировавшим потомком того самого гена обратной транскриптазы, от которого произошли ретроэлементы (хотя не исключено и обратное) [46].
По всей видимости, каждая отдельная группа ретроэлементов произошла от одного предка - так называемого “мастер гена”, с которого начинается история любой группы ретроэлементов. Это можно проиллюстрировать на любезно предоставленном эволюцией примере ID элементов крыс, для которых сохранился все еще активный “мастер ген” [47]. На определенном этапе эволюции, одна из копий тРНК аланина интегрировала в геномную ДНК клетки. Затем, в результате некоторого количества мутаций, эта копия тРНК приобрела внутренний промотор, достаточный для инициации транскрипции РНК-полимеразой III и, таким образом, превратился в BC1, которая, посредством своих РНК-копий, распространилась по геному с помощью ретропозиции. Сейчас ее копии распределены по всему геному крыс - они называются ID элементы. Таким образом, BC1 РНК и является “мастер геном” для ID.
Трудно переоценить влияние ретроэлементов на эволюцию геномов эукариот, а, стало быть, и на эволюцию эукариот в целом. Ретроэлементы могут вызывать различные перестройки геномной ДНК (делеции, инверсии, транслокации, дупликации), влиять на регуляцию экспрессии генов (на различных уровнях - от транскрипции до трансляции), а также участвовать в появлении новых генов (см. обзоры: [3, 15, 19, 20, 41, 47, 48]). Подробнее воздействие ретроэлементов на различные клеточные процессы и на организм рассматривается в Главах 1.4-1.7, а также отдельно в Главе 1.9.
Глава 1.4 Не содержащие LTR ретроэлементы. Ретроинтроны (интроны группы II)
Поскольку, как это было изложено в предыдущей главе, наиболее древней группой ретроэлементов являются LTR-несодержащие, а LTR-содержащие ретротранспозоны, и, особенно, ретровирусы, являются своеобразным венцом эволюции ретроэлементов, то, из уважения к возрасту LTR-несодержащих элементов, автор считает нужным именно с них начать подробное описание отдельных групп ретроэлементов.
Cтарейшей среди LTR-несодержащих ретротранспозонов считают группу ретроинтронов, или интронов группы II. До недавнего времени считалось, что наличие ретроэлементов свойственно лишь геному эукариот. Теперь ясно, что это не так.
Интроны группы II - это один из двух классов самосплайсирующихся интронов, которые находятся в геномах прокариот или органелл эукариот [49, 50]. Вероятно, первые мобильные интроны группы II появились в геноме бактерий. В процессе образования эукариотической клетки, ретроинтроны проникли в неё, находясь в геноме бактерий - предков современных митохондрий и пластид [49].
В геноме интронов группы II содержится одна открытая рамка считывания (ORF), которая кодирует белок, содержащий 3 домена: домен обратной транскриптазы (RT), домен эндонуклеазы (Zn домен) и домен, функция которого пока не установлена (X домен). Домен RT осуществляет обратную транскрипцию РНК, содержащих интрон(ы) группы II (хотя в принципе может использовать в качестве матрицы и другие клеточные РНК).
Транскрипция ретроинтрона начинается с промотора гена, в котором находится внедрение этого элемента (Рис.1.4.1). РНК ретроинтронов обладает рибозимной активностью, в результате которой осуществляется самосплайсинг РНК интронов группы II из пре-мРНК содержащих их генов. Сплайсированная РНК ретроинтрона транслируется, в результате чего образуется химерный белок, небольшой
N-концевой фрагмент которого кодируется клеточным геном, а основная С-концевая часть - ретроинтроном. Количество единственного белка ретроинтрона регулируется с помощью сплайсинга последовательности ретроинтрона из пре-мРНК. Транспозиция этих ретроэлементов происходит следующим образом (Рис.1.4.1): Сначала вносится одно-цепочечный сайт-специфический разрыв в последовательность ДНК-мишени. По всей видимости, в этом процессе принимает участие сама РНК самосплайсирующегося интрона, образующая похожую на лассо структуру. РНК ретроинтрона при этом ковалентно соединяется с 5' концом разрыва. Второй разрыв (во вторую цепь ДНК), примерно на 10 п.н. выше первого, вносит уже белок ретроинтрона - по-видимому, домен Zn. Затем домен RT осуществляет обратную транскрипцию РНК ретроинтрона, инициируя синтез с новообразованного 3'-ОН конца ДНК-мишени. Таким образом, происходит перемещение копии ретроинтрона в геноме (intron homing) [50].
Если ретроинтроны в геномах эукариотических органелл внедряются только в строго определённые последовательности внутри некоторых генов, то некоторые ретроинтроны бактерий обладают менее ярко выраженной специфичностью к сайтам-мишеням при интеграции, так что внедрения некоторых из них наблюдаются даже вне генов (разумеется, в последнем случае они не транскрибируются и ретропозиционно не активны) [51].
По всей видимости, интроны группы II являются предками остальных ретротранспозонов, не содержащих LTR, т.е. LINE. Об этом свидетельствуют данные филогенетического анализа последовательностей домена RT различных ретроэлементов [52]. Более подробно эта гипотеза обсуждается в следующей главе, посвящённой LINE.
Кроме того, вероятно, именно от ретроинтронов произошли некоторые малые ядерные РНК, осуществляющие сплайсинг пре-мРНК эукариот [52].
Глава 1.5 Не содержащие LTR ретроэлементы. Группа LINE
Помимо ретровирусов и LTR-ретротранспозонов, в геноме эукариот существует большое количество ретроэлементов совсем иного рода. Их ДНК не имеет концевых повторов и заканчивается олигоадениловым трактом, длина которого варьирует от копии к копии и обычно находится в пределах 5-40 п.н. Границы ретроэлементных вставок легко выявляются по дупликациям сайта мишени, окружающим каждую копию в геноме. В отличие от дупликаций, осуществляемых LTR-содержащими элементами, их длина не является строго фиксированной и может составлять от 4 до 18 п.н. Как правило, внутри таких элементов не обнаруживается сайтов сплайсинга. Наличие олиго(А) на конце интегрированной ДНК-копии и отсутствие интронов позволяют предположить, что в качестве матрицы для её синтеза у представителей данной группы используется полиаденилированный РНК-транскрипт. Впрочем, вместо олиго(А) на 3'-конце иногда может находиться какой-либо более сложный микросателлит.
Последовательности такого вида принято называть ретрогенами [53]. Название это собирательное и отражает лишь наличие у ретроэлемента элемента вышеперечисленных признаков. Функционально ретрогены сильно различаются в зависимости от того, какая РНК послужила матрицей для синтеза данной конкретной копии. Наиболее интересны ретрогены, имеющие способность к мобилизации. ДНК-копии таких элементов, при условии отсутствия повреждений (а иногда и вопреки им), могут давать начало новым геномным копиям своего семейства. Мобильные не содержащие LTR ретроэлементы подразделяются на два подкласса: длинные рассеянные повторы (англ. long interspersed elements, LINE) и короткие рассеянные повторы (англ. short interspersed elements, SINE) [54]. Хотя они действительно сильно различаются по длине (3,5-8 т.п.н. для LINE, 50-700 п.н. - для SINE), деление это затрагивает гораздо более глубинные принципы организации.
LINE являются кодирующими ретротранспозонами. Они присутствуют в геномах грибов, растений, беспозвоночных и позвоночных и являются одними из наиболее распространенных ретроэлементов. Приблизительно 16% геномной ДНК человека составляют LINE [4]. Полноразмерные представители данного класса ретроэлементов имеют длину 3,5-8 т.п.н. и кодируют как правило 2 белка. Первый - это ДНК/РНК-связывающий белок, в состав которого обычно входят несколько цистеин-гистидиновых (СН) мотивов. Второй - мультифункциональный белок, содержащий домены эндонуклеазы (англ. еndonuclease - EN) и обратной транскриптазы (RT), а в некоторых случаях также и домены цинковых пальцев (они же СН-мотивы) и РНКазы Н [16, 52, 55, 56]. Среди LINE встречаются и элементы, содержащие только одну ORF - либо ORF1 (элементы CM-gag и HeT-A), либо ORF2 (более многочисленные примеры; элементы NeSL-1, CRE, R1, R2, RTE) [16]. Кроме того, есть примеры LINE, содержащих дополнительную ORF (ORF3), см. [57].
Домен RT, состоящий из 440 аминокислот, гомологичен ревертазам ретроинтронов и ретровирусов и включает в себя 11 консервативных блоков. На 5'-конце элементов, называемом 5'-UTR (англ. untranslated region), расположен промотор РНК-полимеразы II. На 3' конце LINE находится 3'-UTR и, сразу за ним - поли(А) “хвост”. Как и другие ретроэлементы, LINE фланкированы прямыми повторами различной длины (обычно от 4 до 18 п.н., но у элемента RTE1 из генома C. еlegans - до 200 п.н.) [16, 52, 55].
Для LINE характерна частая усечённость копий с 5'-конца (англ. 5'-truncation), поэтому иногда довольно трудно определить истинный 5'-конец ретроэлемента (например, короткие усечённые копии ретропозона приматов L1 сначала были описаны как отдельный мобильный элемент [58], а укороченные копии F-элемента (LINE из генома D. melanogaster) вплоть до недавнего времени были известны под названием ретропозона Suffix [59]. По этой причине нумерацию нуклеотидов в последовательности LINE часто ведут с 3'-конца и выражают в отрицательных числах. Усечённость объясняется, по-видимому, абортивной обратной транскрипцией, когда синтез кДНК по какой-то причине обрывается, не дойдя до 5'-конца РНК-матрицы (см. ниже).
Количество копий LINE-элементов сильно варьирует у разных таксономических групп (ретропозоны данного типа описаны для большинства изученных эукариотических организмов; одним из немногочисленных исключений является геном дрожжей S. cerevisiae и Schizosaccharomyces pombe, где LINE не обнаружены - см. обзоры [54, 60]; зато геном дрожжей Candida albicans содержит LINE [61]).
Считается, что для млекопитающих характерно наличие небольшого числа семейств LINE (возможно, только одного - L1 [58]) - но это малое число семейств представлено огромным количеством копий (например, около 5х105 копий L1 находятся в геноме человека, что составляет примерно 17% всей геномной ДНК [4]). Большинство этих копий дефектно (например, в геноме человека только 50-60 копий L1 из 5х105 активны). У беспозвоночных же, напротив, имеется большое количество семейств LINE (для одной только дрозофилы их известно не меньше десятка: F, Doc, G, R1, R2, HeT, jockey [62], BS [63], TART [64] и др.) - но каждое из этих семейств представлено числом копий порядка нескольких тысяч, согласно данным гибридизации in situ с флуоресцентным зондом (FISH) [65]. К сожалению, имеется гораздо меньше данных о количестве копий LINE у простейших, растений, амфибий, птиц и т.д, хотя скорее всего характер распределения LINE по геномам всех животных, за исключением позвоночных, напоминает случай дрозофилы, а для геномa растений характерна гораздо более высокая копийность LINE [66].
Разницу в копийности ретрогенов (если она всё-таки существует) можно объяснить двояко. Одна гипотеза [54] отводит большую роль в этом вопросе наличию у млекопитающих сильно пролонгированной стадии диплотены профазы I мейоза (стадия «ламповых щёток») при оогенезе, в которой предположительно и происходит основная масса ретропозиций. Эта гипотеза не может объяснить факт наличия огромного количества ретротрансопозонов в нерекомбинирующей Y-хромосоме самцов [67]. Другая гипотеза [68] объясняет небольшое число копий ретрогенов, в частности, у дрозофилы крайне высокой частотой возникновения делеций, характерных для её генома: ясно, что при этом вся «ненужная» ДНК, в том числе дефектные копии ретропозонов, элиминируется, в геноме сохраняются лишь жизненно необходимые последовательности, утеря которых приводит к летальным мутациям. Эта гипотеза хорошо согласуется с известным фактом, что в подавляющем большинстве случаев в геноме дрозофилы ретроэлементы имеют гетерохроматиновую локализацию [В. Капитонов, личное сообщение]. У млекопитающих же этот механизм функционирует гораздо медленнее, в результате чего в геноме накапливается «мусор» (эволюционные аспекты проблемы будут рассмотрены в Главе 1.9.).
На основе последовательностей ревертазы (домена RT ORF2) практически все LINE подразделяются на 12 групп: NeSL-1, CRE, R2, R4, L1, RTE, Tad1, R1, LOA, Jockey, CR1 и I [16] (Рис.1.5.1.). Самыми древними группами являются CRE и NeSL-1, затем появились R2 и R4, а после них L1. Остальные 7 групп (RTE, Tad1, R1, LOA, Jockey, CR1 и I) имеют приблизительно одинаковое время происхождения и, по-видимому, их всех объединяет один предок.
Классификации, основанные на последовательностях эндонуклеазного (EN) домена и РНКазы Н гена ORF2, совпадают с предыдущей, хотя и охватывают меньший эволюционный период (поскольку структура этих доменов менее консервативна). Используя последовательность RT установили, что первые LINE возникли более 600 млн. лет назад [16]. Скорее всего, все LINE произошли от мобильных интронов группы II [16], хотя существует альтернативная гипотеза происхождения LINE, считающая их предком ген теломеразы [46]. Первые LINE интегрировали лишь в определенные сайты генома, т.е. использовали сайт-специфическую эндонуклеазу, так называемую REL-EN (сейчас сохранилась у представителей наиболее древних групп NeSL-1, CRE, R2 и R4). В отличие от остальных LINE, домен EN у них находится на 3'-конце ORF2, которая имеет структуру RT-EN (у других - на 5' конце и, соответственно, EN-RT), см. Рис.1.5.1.
Древняя эндонуклеаза REL-EN гомологична домену EN из мобильных интронов группы II [16, 69] и работает как сайт-специфическая эндонуклеаза. Кроме того, механизм ретротранспозиции мобильных интронов группы II сходен с таковым LINE, хотя на некоторых стадиях и различается (см. далее). В процессе эволюции, домен сайт-специфической REL-EN вытеснила апуриновая/апиримидиновая эндонуклеаза (AP-EN) - см. Рис.1.5.1, которую ретротранспозоны заимствовали из аппарата репарации ДНК.
Это произошло на ранней стадии эволюции LINE, до образования группы L1. Теперь, в отличие от сайт-специфических LINE, ретротранспозоны, содержащие домен AP-EN, могли интегрировать практически в любой сайт генома, что было несомненным преимуществом. От REL-EN остался только потенциальный ДНК/РНК-связывающий домен, содержащий один или несколько СН-мотивов, да и то не у всех групп LINE.
Вместе с тем, для некоторых LINE показано, что AP-EN также может является и сайт-специфической эндонуклеазой (группа R1; DRE и Tx1 из группы L1) [16, 70]. Видимо, на более поздних стадиях эволюции домен AP-EN претерпел определенные изменения, которые привели к приобретению вторичной сайт-специфической активности. Представители четырёх относительно молодых групп LINE, Tad1, R1, LOA и I, приобрели в последовательности своей ORF2 дополнительно ещё и домен РНКазы Н [16, 52, 70].
Приблизительно в то же время, что и AP-EN, в составе LINE появилась новая рамка считывания - ORF1. Она присутствует практически во всех представителях 8 наиболее молодых групп LINE, только представители группы RTE не имеют ее [16]. Главной особенностью ORF1 LINE является ДНК/РНК-связывающий домен (с несколькими СН-мотивами), хотя ORF1 L1 человека содержит еще один характерный мотив - лейциновую молнию, мотив, обеспечивающий олигомеризацию белков [56]. Механизм появления ORF1 в LINE пока ещё не очень понятен.
Транскрипция «классических» LINE-элементов осуществляется клеточной РНК-полимеразой II с внутреннего промотора, находящегося в 5'-нетранслирумой области (сама возможность существования внутреннего промотора для РНК-полимеразы II была впервые оказана на LINE-элементе jockey [71]). На 3'-конце большинства LINE обнаруживается сигнал 3'-процессинга (разрезания и полиаденилирования транскрипта) ААТААА [72], причём вместо обычных в этом случае нижележащих сигналов [73] энхансером полиаденилирования служит олиго(А)-тракт ДНК-копии, с которой происходит транскрипция. Многие из изученных LINE демонстрируют сложные пространственно-временные особенности экспрессии [74]. Постулировано, что полноразмерная полиаденилированная (+)РНК, получившаяся в результате транскрипции с внутреннего промотора на 5'-конце, является одновременно матрицей для синтеза белков ретропозона и транспозиционным РНК-интермедиатом [75].
Как уже говорилось, количество полноценных копий (способных транскрибироваться и кодирующих полноразмерные белки) невелико по сравнению с общим числом копий в геноме [76]. Транскрипты LINE обнаруживаются в клетках в составе рибонуклеопротеидных частиц в ядре и в цитоплазме [77, 78]. Точный белковый состав частиц неизвестен, однако показано, что в них входят продукты генов ORF1 u ORF2 и что такие частицы обладают ревертазной активностью [77, 79].
Интересно, что, помимо основного (+)РНК-транскрипта, для некоторых LINE показано наличие и других их типов. Так, по крайней мере в случае F-элемента дрозофилы и L1 человека, находящийся недалеко от 5'-конца промотор РНК-полимеразы II направляет синтез антисмысловой (по отношению к кодирующей) РНК в 5'-прилежащую область “наружу” от элемента [80, 81]. Возможно, этот транскрипт имеет регуляторное значение. У уже упоминавшегося ретропозона HeT-A единственный обнаруженный промотор находится в 3'-нетранслируемой области, которая у этого элемента составляет 2,5 т.п.н. [82]. Два необычных по своей структуре ретропозона, TART дрозофилы и DRE Dictyostelium discoideum [83], имеющие длинные несовершенные повторы на концах, способны давать как обычные (+)РНК-транскрипты, так и некодирующие полноразмерные (-)РНК-транскрипты, начинающиеся (в случае DRE) на 3'-концевом олиго(А)-тракте ретропозона под влиянием внутренней области в 3'-UTR [84]. Ретропозон Tad из Neurospora crassa способен давать 5 различных типов транскриптов: по два типа смысловых и антисмысловых, начинающихся соответственно на 5'- и 3'-концах элемента, и один (смысловой) с внутреннего промотора [85].
Долгое время оставалось загадкой, каким образом осуществляются процессы обратной транскрипции и интеграции у LINE. Работы последних лет позволили для некоторых LINE установить механизм ретропозиции. Для элемента R2 из генома B. mori благодаря его специфике (он интегрирует строго в определённые последовательности внутри генов 28S рибосомальной РНК) удалось разработать систему ретропозиции in vitro, состоящую из рекомбинантного белка его единственной ORF (ORF2p), искусственно получаемого РНК-транскрипта и ДНК, содержащей специфический сайт внедрения [86]. Было показано, что процессы обратной транскрипции и интеграции сопряжены. В реакции, названной авторами TPRT (англ. target-primed reverse transcription), в ДНК-мишень вносится одноцепочечный разрыв и 3'-конец одной из цепей используется в качестве затравки для синтеза кДНК, после чего происходит разрезание второй цепи ДНК-мишени [там же]. РНК R2, по-видимому, не взаимодействует как-то специфически с ДНК, а лишь регулирует активность ORF2p. Более того, существуют данные, что ORF2p сам по себе может создавать одноцепочечный разрыв, а РНК R2 необходима только для расщепления второй цепочки [87, 88]. Для R2 показано, что их ORF2p работает, по-крайней мере, в виде димера (или даже мультимера) - один из мономеров расщепляет первую цепочку, а другой - вторую [88]. Очевидно, что in vivo за этим должно происходить лигирование цепей ДНК, разрушение РНК в составе гетеродуплекса и репаративный синтез второй цепи ДНК. Фермент специфичен к РНК R2-элемента (узнаются последние 250 п.н., соответствующие 3'-UTR [89], точнее, определённые вторичные структуры РНК, находящиеся в этой области [90]).
Способность вносить одноцепочечный разрыв в ДНК-мишень была показана и для продукта ORF2 L1-элемента [91]. Предполагаемая схема ретропозиции L1 выглядит так: после транскрипции и процессинга пре-мРНК LINE, она транспортируется из ядра в цитоплазму, где осуществляется трансляция белков ORF1p и ORF2p. ORF1p специфически связывается с полноразмерной РНК LINE, по-видимому, котрансляционно [92]. Недавно показали, что ORF1p, кодируемый активным L1 человека, связывается с двумя участками полноразмерной РНК L1: первый из них находится в 5' части эндонуклеазного (EN) домена ORF2, а второй между доменами обратной транскриптазы (RT) и концевым доменом цинкового пальца [93]. Возможно, ORF1p, содержащий сигнал ядерной локализации (nls, nuclear localisation signal), участвует в транспорте РНК LINE к сайту интеграции. Важно, что ORF1p как правило взаимодействует с РНК именно того ретротранспозона, который его кодирует, другие мРНК он связывает с гораздо меньшей эффективностью [55, 94]. ORF2p тоже связывается с 3' концом РНК LINE - по-видимому, непосредственно с поли(А) последовательностью. На следующем этапе ORF2p, в виде комплекса с полноразмерной РНК LINE и мультимером ORF1p, связывается с сайтом-мишенью на ДНК, после чего домен EN расщепляет одну из цепей двуцепочечной ДНК. Поскольку ретротранспозоны обладают двумя различными типами EN - AP-EN и REL-EN - то, возможно, механизмы их интеграции несколько различаются. На Рис.1.5.2 изображен предполагаемый механизм ретротранспозиции L1 (т.е., с использованием AP-EN). Поли (А) конец РНК L1 взаимодействует с одной из цепочек ДНК в месте разрыва, образуя стандартные Уотсон-Криковские пары [55, 56].
Второй разрыв при интеграции L1 осуществляется менее специфично, хотя обычно это полипуриновая последовательность. Непосредственно реакцию обратной транскрипции проводит RT домен [56] (см. Рис.1.5.2). Во время синтеза первой цепи кДНК с матрицы РНК LINE вносится разрыв во вторую цепь геномной ДНК и, в следующую очередь, начинается синтез второй цепи ретротранспозона. Скорее всего, для этого используется еще одна молекула ORF2p, но доказано подобное явление только для элемента R2 [88]. В завершение, образовавшиеся одноцепочечные разрывы зашивает клеточная лигаза.
Большинство LINE присутствуют в геномах в виде 5'-усечённых копий. Такие укороченные с 5'-конца копии могут получаться в результате абортивной обратной транскрипции, вызываемой низкой процессивностью RT [56, 87, 88, 94]. Кроме того, большое количество LINE семейства L1, находящихся в геномах млекопитающих, содержат инверсии различной длины. На основании описанной выше модели распространения этих ретроэлементов был предложен вероятный механизм образования этих инверсий (Рис.1.5.3). Как и в случае обычного внедрения, первым шагом является образование одноцепочечного разрыва в ДНК с появлением свободного 3'-гидроксила, после чего начинается обратная транскрипция. Однако разрыв во второй цепи эндонуклеаза осуществляет еще до завершения синтеза ДНК. Получившаяся таким образом еще одна свободная 3'ОН- группа может использоваться обратной транскриптазой в качестве затравки на любом участке РНК ретротранспозона. В результате, синтез кДНК завершается созданием инверсии на 5'- конце [95].
Выстроенная согласно сходству RT доменов классификация представителей LINE не может быть применена к одному из наиболее важных LINE генома Drosophila - HeT-A. Этот ретроэлемент не содержит гена обратной транскриптазы и, следовательно, не является автономным LINE. HeT-A, наряду с TART (группа Jockey), принимает участие в удлинении теломерных повторов (см. далее в разделе “Группа Jockey”) [84, 96].
Хотя HeT-A имеет некоторую гомологию с TART, эти транспозоны нельзя объединить в одну группу. Длина HeT-A примерно 6 т.п.н., а его 5' и 3'- UTR составляют более половины его генома. Единственная ORF кодирует ДНК/РНК-связывающий белок, с несколькими СН-мотивами. На 3' конце, как и у других ретротранспозонов, находится поли (А) последовательность. Для своей ретротранспозиции HeT-A использует ревертазы других ретротранспозонов (например, RT элемента TART) [96]. Парадоксальной особенностью HeT-A является то, что его промотор расположен не на 5' конце элемента, а на его 3' конце, поэтому считывается с него нижележащий элемент. Причем РНК-полимераза проскакивает ближайший сигнал полиаденилирования (находящийся в на 3'конце того же элемента, с промотора которого осуществляется транскрипция), а срабатывает только на втором сигнале, находящемся на следующем элементе. В итоге образуется транскрипт с поли (А) “хвостом”, содержащий прямые повторы на 5' и 3' концах [96]. Таким образом, 2 тандемно расположенных HeT-A можно представить как 1 ретротранспозон, содержащий “псевдо-LTR”. Возможно, HeT-A элементы представляют собой промежуточное звено между двумя классами ретротранспозонов - содержащих и не содержащих LTR.
Далее будет приведено описание основных групп LINE, полученных на основании сходства последовательностей их ревертаз.
Группа CRE - это самая древняя группа LINE, которая состоит из сайт-специфических ретротранспозонов, присутствующих исключительно в геноме трипаносом [16, 69, 97, 98]. Сюда входят элементы CRE1 (3,5 т.п.н.) и CRE2 (9,6 т.п.н.) из Crithidia fasciculata [98], SLACS из Tripanosoma brucei [16] и CZAR из T. сruzi [97]. Все эти ретроэлементы интегрируют специфически в высоко консервативную область генома [97, 98].
Данная группа представлена небольшим количеством копий (несколько копий на геном) и для её представителей пока не найдено укороченных с 5' конца элементов. Все представители CRE содержат лишь одну ORF (хотя ранее предполагалось наличие двух ORF). В нее включены последовательности ДНК/РНК-связывающего домена, содержащего несколько СН-мотивов, домены RT и REL-EN [16]. Аминокислотная последовательность белка, кодируемого единственной ORF, сильно варьирует в пределах группы. Возможно, подобные ретроэлементы играют какую-то функциональную роль в клетках трипаносом [97, 98].
Группа NeSL-1 представляет собой недавно описанные LINE аскариды C. elegans - NeSL-1 (Nematode Spliced Leader-1) - см. Рис.17 [16]. Наряду с CRE, эта группа одна из самых древних среди LINE (ее возраст оценивается как более чем 600 млн. лет). Они представляют собой сайт-специфические LINE, и интегрируют исключительно в так называемый “сплайс лидерный сегмент 1” C. elegans. Длина полноразмерного NeSL-1 - около 7 т.п.н., но по большей части, в геноме C. elegans содержатся укороченные NeSL-1 (общее количество NeSL-1 пока точно не известно). К настоящему времени выявлен только 1 полноразмерный представитель NeSL-1 [16]. В отличие от всех остальных LINE, NeSL-1 кодируют протеазу (PR), ген которой находится в 5' части элемента. Возможно, PR участвует в процессинге полипротеина, считываемого с мРНК NeSL-1. С другой стороны, PR может участвовать в функционировании клетки, как обычная клеточная цистеиновая протеаза.
Группа R2 включает сайт-специфические LINE, которые находятся исключительно в геномах членистоногих - Drosophila, Bombyx mori и др. [16, 70]. Эти элементы специфически интегрируют в уникальный сайт гена 28S рРНК. Длина R2 элементов варьирует от 3,5 т.п.н. до 5,5 т.п.н. в различных видах, в основном за счет 5'- и 3'-UTR [70]. В некоторых осах присутствует химерный ретротранспозон длиной 7,2 т.п.н, 5' часть которого, вместе с ORF1, произошла от R1, а 3' часть (ORF2) - от R2 [70]. R2 содержат одну единственную ORF, кодирующую белок со стандартным ДНК/РНК-связывающим доменом, а также с доменами RT и REL-EN. Этот белок состоит из 1000-1200 аминокислот, а его наиболее вариабельная часть - это N-конец, где даже инициаторные кодоны метионина не консервативны [69]. Идентичность аминокислотной последовательности ORF среди различных R2 составляет всего 23%-62%. Наиболее консервативным доменом является домен обратной транскриптазы. N-концевой домен включает в себя C2H2-мотив цинкового пальца и C-myb-связывающий мотив (т.е. N-концевой домен является ДНК/РНК-связывающим). RT домен состоит из 450 аминокислот [16, 69, 87, 88]. Недавно показали, что третичная структура домена RT R2 гомологична RT вируса HIV-1 [87]. На С-конце ORF находится домен эндонуклеазы, в котором расположены ДНК/РНК-связывающий мотив и мотив сайт-специфической REL-EN.
В недавней работе [99] было показано, что в процессе обратной транскрипции ревертаза R2 может переходить с одной матрицы на другую, осуществляя, таким образом, РНК-РНК рекомбинацию.
Группа R4, как и три предыдущие, состоит из сайт-специфических ретротранспозонов. К ней относят сам R4, содержащийся в геномах различных нематод, и Dong из Bombyx mori (хотя, возможно, эта группа включает еще некоторое количество пока не обнаруженных представителей) [16, 100]. Сайтом интеграции для R4 является ген 26S рРНК, а для Dong - спейсерный участок между субъединицами рДНК насекомых.
Длина полноразмерного R4 элемента составляет 4,7 т.п.н. [100]. Единственная ORF R4 кодирует белок, обладающий ДНК/РНК-связывающей активностью, а также активностями RT и REL-EN [16, 69]. Как и в случае CRE, NeSL-1 и R2, домен сайт-специфической REL-EN находится в 3' части ORF. В работе [101] к группе R4 причислен ещё один элемент, недавно открытый в геноме некоторых рыб - Rex6.
...Подобные документы
Общая характеристика отряда приматов: образ жизни, строение. Особенности подотряда полуобезьян. Характеристика высших приматов - семейств широконосых, узконосых и человекообразных обезьян. Сравнение кисти руки гориллы и человека, стопы гориллы и шимпанзе.
презентация [869,9 K], добавлен 16.05.2012Развитие взглядов на происхождение человека. Центр происхождения человека. Доказательства происхождения человека от животных. Влияние окружающей среды на появление человека. Эволюция гоминид. Биологический, социальный и трудовой факторы эволюции.
реферат [37,7 K], добавлен 26.04.2006Анализ влияния мозга человека на его деятельность и чувства, с указанием многочисленных примеров из жизни, а также его основные отличия от мозга шимпанзе. Сравнение мужского и женского пространственного мышления. Сущность развития мышления человека.
реферат [50,8 K], добавлен 24.11.2009Сущность генеалогического метода и его применение в генетике человека. Особенности наследования различных признаков. Гипотеза и ход исследования родословной. Генетические закономерности наследования признаков человека и сравнение результатов с гипотезой.
практическая работа [90,5 K], добавлен 20.05.2009Характеристика изменений, которые происходят в геноме клетки, и возникают при вставке мобильных генетических элементов в геном. Мобильные генетические элементы в геноме Drosophila Melanogaster (дрозофила чернобрюхая). Мобильные элементы гетерохроматина.
курсовая работа [72,8 K], добавлен 29.05.2015Тайна происхождения человека и его расселения на территории Земли. Путь гоминизации многих видов приматов. Теория африканского происхождения человека. Родословная человека, факторы антропогенеза. Основные этапы эволюции человека. Современный тип людей.
презентация [1,3 M], добавлен 21.05.2015Эволюция человека, ее отличие от эволюции животных и движущие силы. Гипотезы естественного происхождения человека. Признаки человека и его место в системе животного мира. Основные этапы антропогенеза и характерные черты развития предков человека.
контрольная работа [27,6 K], добавлен 03.09.2010Систематическое положение человека. Род гиббонов, орангутангов, горилл, шимпанзе: виды, места обитания, строение тела, образ жизни. Биологическая теория происхождения человека Ч. Дарвина. Основные группы доказательств происхождения человека от животных.
презентация [8,7 M], добавлен 18.05.2010Возраст человека: абсолютный, биологический, паспортный, психический, социальный. Критерии биологического возраста. Эволюция человека. Характеристика австралопитека. Расизм, его социальные корни. Прогрессивная общественность в борьбе против расизма.
реферат [33,0 K], добавлен 31.10.2008Характеристика радиочастотных (РЧ) воздействий. Выводы ученых по исследованию популярных марок телефонов и их влияния на здоровье человека, системы организма человека, наиболее подверженные вредному влиянию. Меры по защите населения от РЧ-излучения.
научная работа [21,5 K], добавлен 09.02.2009Основные признаки этапов эволюции человека. Размер и образ жизни дриопитеков. Отличия австралопитеков от человека умелого, период его появления и размер мозга. Внешний вид человека прямоходящего. Ареал обитания неандертальцев. Орудия труда кроманьонца.
презентация [2,2 M], добавлен 06.04.2015Начало научного представления о происхождении человека. Идеи Дарвина и их революционная роль в учении об антропогенезе. Австралопитек как прямой предок рода Homo. Эволюция приматов до человека, ее движущие силы. Виды рода Homo и появление Homo sapiens.
реферат [613,2 K], добавлен 09.09.2012Механизм эволюции прокариотического и эукариотического геномов. Свойства, отбор и динамика рисунка локализации мобильных генетических элементов. Роль мобильных генетических элементов и горизонтального переноса генетического материала в эволюции генома.
курсовая работа [84,5 K], добавлен 30.09.2009Представления о происхождении человека в Европейском средневековье. Современные взгляды на проблему происхождения человека. Предположения Ч. Дарвина о происхождении человека. Проблема прародины современного человека. Особенности хода эволюции человека.
реферат [36,8 K], добавлен 26.11.2010Вопросы происхождения и сущности жизни издавна стали предметом интереса человека в его стремлении разобраться в окружающем мире. Гипотезы возникновения жизни. Доказательство родства человека и животных. Эволюция человека. Теории появления человека.
реферат [33,0 K], добавлен 05.06.2008Исследование различных версий о происхождении человека: появление во Вселенной, сотворение, рождение, прибытие из других миров, метаморфоз. Портреты пращуров. Закономерности эволюции предков людей. О прямохождении (причины формирования "двуногости").
реферат [27,3 K], добавлен 01.06.2010Характеристика и классификация микроорганизмов. Систематика, метаболизм и клиническое значение энтеробактерий. Сравнительный анализ традиционного и экспресс-метода биохимической идентификации при определении представителей семейства Enterobacteriaceae.
дипломная работа [8,9 M], добавлен 23.01.2018Розвиток палеонтологічних, ембріологічних, гістологічних досліджень; порівняльна анатомія та її значення. Співвідношення обсягу мозку з вагою тіла як найбільш поширений показник рівня інтелекту. Характерні відмінності в будові черепів людини та шимпанзе.
реферат [363,9 K], добавлен 16.08.2010Первый экологический кризис – смена анаэробной атмосферы на аэробную. Особенности биосинтеза органических соединений при хемосинтезе. Нюансы фотосинтеза, цикл превращения солнечной энергии в углеводы. Эволюция живых организмов, появление человека.
реферат [35,8 K], добавлен 18.11.2009Разработка метода рекомбинантных ДНК. Анализ наследования семейных заболеваний и изучение генетического сцепления у человека в случаях, когда возникают осложнения: генетическая гетерогенность и фенокопии. Карта генетического сцепления генома человека.
учебное пособие [2,0 M], добавлен 11.08.2009