Компьютерный анализ сплайсинга
Разработка статистической программы предсказания генов в геномах низших эукариот. Создание статистической модели сайта ветвления, улучшающей распознавание коротких интронов грибов. Изучение связи альтернативного сплайсинга и функций кодируемых белков.
Рубрика | Биология и естествознание |
Вид | автореферат |
Язык | русский |
Дата добавления | 24.09.2018 |
Размер файла | 139,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
АВТОРЕФЕРАТ
Диссертации на соискание ученой степени
кандидата биологических наук
03.00.03 - Молекулярная биология
КОМПЬЮТЕРНЫЙ АНАЛИЗ СПЛАЙСИНГА
Неверов Алексей Дмитриевич
Москва 2007
Работа выполнена в лаборатории биоинформатики Государственного научно-исследовательского института генетики и селекции промышленных микроорганизмов ФГУП “ГосНИИ генетика”.
Научный руководитель:
доктор биологических наук, кандидат физико-математических наук
Миронов Андрей Александрович
Официальные оппоненты:
Доктор биологических наук Корягина А.С.
Кандидат биологических наук Боринская С.А
Ведущая организация: Институт Математических Проблем Биологии РАН (ИМПБ РАН)
Защита диссертации состоится «06» марта 2007 г. в 14-00 на заседании Диссертационного совета Д 217.013.01 при Государственном научно-исследовательском институте генетики и селекции промышленных микроорганизмов по адресу: 117545, г. Москва, 1-й Дорожный проезд д., 1
С диссертацией можно ознакомиться в библиотеке “ГосНИИ генетика”.
Автореферат разослан “6” февраля 2007 г.
Ученый секретарь
Диссертационного совета,
Кандидат биологических наук Заиграева Г.Г.
1. Общая характеристика работы
Актуальность темы
Интенсивность секвенирования полных геномов в настоящее время достигла индустриальных темпов. В 2001 году был секвенирован геном человека и в последующие годы геномы некоторых других млекопитающих: мыши, крысы, собаки, шимпанзе и оппосума. Огромный интерес существует к последовательностям геномов различных микроорганизмов как про- так и эукариот. Очевидно, что темпы секвенирования значительно опережают темпы экспериментального анализа геномов. Для анализа огромных баз данных биологических последовательностей ДНК, различных РНК и белков требуются значительные человеческие и вычислительные ресурсы. В связи с тем, что геномы эукариот имеют более сложную организацию, чем геномы прокариот, наши знания о функциях тех или иных локусов геномов эукариот являются менее полными. Процесс аннотации эукариотического генома всегда начинается с определения экзон-интронной структуры и функций кодирующих генов, что является ключом к последующему детальному исследованию структуры и функции белков.
На следующем этапе аннотации выявляются альтернативные изоформы кодируемых мРНК и белков, регуляторные сигналы, положения однонуклеотидных полиморфизмов (SNP). На любом этапе процесс аннотации практически невозможен без применения специальных вычислительных средств. Для предсказания кодирующей части генов существует множество программ, которые могут быть разделены на два основных класса - это статистические программы, в основе которых лежат свойства самой геномной последовательности, и программы, использующие сходство с последовательностями известных белков, мРНК или ДНК, кодирующей гомологичные гены. Программы, распознающие гены по сходству, не могут обнаружить гены специфичные для нового генома, поэтому существует необходимость дополнительно использовать статистические программы. Существенным недостатком статистических программ является ненадежное предсказание границ генов, кроме того, они могут предсказывать только единственную изоформу. Одной из актуальных задач биоинформатики, связанных с аннотацией новых геномов является дальнейшее совершенствование программ предсказания генов.
Альтернативный сплайсинг является фундаментальным механизмом эволюции генов и лежит в основе разнообразия протеома - совокупности белков, кодируемых в геноме. По современным оценкам 50-70% генов млекопитающих являются альтернативно сплайсируемыми. Изучение альтернативного сплайсинга имеет большое практическое и клиническое значение, так как экспрессия различных изоформ белка зависит от ткани и стадии развития клетки. Мутации в районе сайтов сплайсинга и регуляторных сайтах могут вызывать наследственные или онкологические заболевания. Аннотация альтернативного сплайсинга является сложной задачей, для решения которой идет интенсивный поиск методов.
Цель и задачи исследования
Диссертация состоит из трех глав, в каждой из которых решаются различные, но связанные между собой задачи:
Целью исследования, представленного в первой главе, является разработка статистической программы предсказания кодирующих генов в геномах низших эукариот. При этом решались следующие задачи:
· Программа должна учитывать особенности сплайсинга, свойственного исследуемому организму.
· Математическая модель, лежащая в основе программы, должна позволять использовать широкий набор статистик, подбираемых исходя из специфики задачи, для кодирующих, некодирующих областей и сайтов сплайсинга.
· Программа должна быть интегрирована в комплекс с программами, использующими сходство с последовательностями известных белков, для эффективного решения задачи первичной аннотации генома.
Целью исследования, представленного во второй главе, является изучение альтернативно сплайсируемых областей генов человека. При этом решались следующие задачи:
· Выявление и классификация областей альтернативного сплайсинга на основании данных, полученных с помощью сплайсированного выравнивания маркеров экспрессии (случайных фрагментов мРНК) с геномом.
· Проверка гипотезы о независимости сплайсинга интронов в пре-мРНК.
Целью исследования, представленного в третьей главе, является изучение связи альтернативного сплайсинга и функции кодируемых белков. Для этого решались следующие задачи:
· Задача сборки EST - построение набора альтернативных изоформ мРНК, с высокой вероятностью, способных кодировать функциональные белки, на основании множества маркеров экспрессии.
· Изучение связи альтернативного сплайсинга и функций кодируемых белков.
· Выявление случаев альтернативного сплайсинга, являющихся результатом ошибок сплайсосомы.
Научная новизна и практическое значение
В работе впервые были получены следующие результаты:
· Была разработана статистическая программа распознавания генов в геномах низших эукариот GipsyGene, в основе которой лежит скрытая марковская модель. Программа легко обучается для анализа новых геномов и интегрируется в пакет программ автоматической аннотации.
· С помощью оригинальной модели сайта ветвления в программе GipsyGene было улучшено распознавание коротких интронов в геномах грибов: Aspergillus spp. и Neurospora crassa.
· Был разработан алгоритм анализа базы данных альтернативного сплайсинга, содержащей информацию о сплайсированных выравниваниях последовательностей EST, мРНК и белков с геномом человека. Алгоритм позволяет выявить альтернативно сплайсируемые участки пре-мРНК (альтернативы) и классифицировать их по типам, используемым в литературе.
· Алгоритм выявления альтернатив был применен для анализа альтернативного сплайсинга человека. В результате для каждого типа альтернатив были оценены характерные статистические свойства - распространенность и распределения частот вариантов сплайсинга внутри альтернативы.
· Была оценена доля генов, содержащих соседние альтернативы, в которых сплайсинг в 3'-альтернативе зависит от варианта сплайсинга в 5'-альтернативе.
· Была разработана программа IsoformCounter, позволяющая оценивать число функциональных изоформ мРНК, кодируемых альтернативно сплайсируемыми генами. Для каждого гена программа генерирует множество наиболее вероятных кодирующих изоформ.
· С помощью IsoformCounter, было показано, что альтернативно сплайсируемые гены из категорий “рибосома” и “передача сигналов посредством малых ГТФаз” имеют меньше изоформ, а гены из категории “репликация ДНК и хромосомный цикл” больше изоформ, чем в среднем по всем генам. Было показано, что среди генов, кодирующих белки, участвующие в образовании взаимодействий с другими белками, больше альтернативно сплайсируемых генов, чем в белках, не участвующих в таких взаимодействиях.
· Была оценена вероятность ошибки при сплайсинге одного интрона. Было проведено сравнение вероятности ошибки сплайсинга с вероятностями ошибок других биологических процессов - синтеза РНК и трансляции белка.
Практическое значение работы состоит в разработке методов аннотации геномов низших эукариот, что может найти применение в биотехнологии, и в разработке методов изучения альтернативного сплайсинга в геноме человека, что может найти медицинские приложения, в частности в онкогеномике.
Апробация работы
Результаты работы представлены на международных конференциях: “Third International conference on bioinformatics of genome regulation and structure (BGRS'2002, Новосибирск, 2002);
“Moscow Conference on Computational Molecular Biology” (MCCMB'03, Москва, 2003); “Moscow Conference on Computational Molecular Biology” (MCCMB'05, Москва, 2005); “5th Int. Conf. Bioinformatics of Genome Regulation and Structure” (BGRS'2006, Новосибирск, 2006).
По материалам диссертации опубликовано 10 печатных работ.
Объем и структура диссертации
Диссертация изложена на 138 страницах и состоит из 6 глав. В главах 2 - 4 представлены оригинальные результаты. Список литературы, приведенный в конце диссертации, содержит 106 наименований. Работа содержит 19 рисунков и 7 таблиц.
Глава 1 содержит введение и обзор литературы.
Глава 2 посвящена разработке статистической программы распознавания генов в геномах низших эукариот. Была предложена статистическая модель сайта ветвления значительно улучшающая качество предсказания коротких интронов в геномах низших грибов Aspergillus spp. и Neurospora crassa. ген сплайсинг белок интрон
Глава 3 посвящена разработке методов анализа альтернативного сплайсинга, показанного выравниванием EST с геномной последовательностью. В этой главе был предложен алгоритм выявления и определения типов областей альтернативного сплайсинга пре-мРНК. Было показано, что пре-мРНК некоторых генов содержат несколько областей альтернативного сплайсинга. При этом сплайсинг в альтернативной 3' области, синтезируемой позже, зависит от варианта сплайсинга ранее синтезированной части пре-мРНК.
Глава 4 содержит описание разработанного алгоритма сборки EST в полноразмерные кодирующие транскрипты. Алгоритм был применен для анализа генов, кодирующих белки с различными функциями. С помощью предложенного алгоритма была оценена вероятность ошибки сплайсинга при вырезании одного интрона.
Глава 5 описывает материалы и методы.
Глава 6 содержит сводку основных результаты и выводы.
2. Содержание работы
Глава 2. Предсказание генов в геномах низших эукариот
Низшие эукариоты имеют большое значение для науки, как модельные микроорганизмы, для медицины и сельского хозяйства, как важные патогены человека, животных и растений, а также как биотихнологические продуценты антибиотиков и биологически-активных веществ. К настоящему времени были секвенированы геномы некоторых низших грибов, в частности, Aspergillus nidulans, Neurospora crassa, Magnaporte grizea, всего около 20 наименований [Fungal Genetics Stock Center]. В будущем интерес к секвенированию геномов грибов вряд ли ослабеет. Анализ нового генома всегда начинается с автоматической аннотации, целью которой служит предсказание генов для последующего детального анализа. Программы обнаруживающие гены на основе информации о сходстве геномной последовательности и последовательностей белков, мРНК, EST позволяют идентифицировать 50-70% генов. Статистические программы предсказания генов, в основе которых лежит скрытая марковская модель (HMM), как правило, нуждаются в новом обучении для каждого нового генома. Применение таких программ является обязательным этапом аннотации, так как позволяет идентифицировать гены, специфичные для организма. Обучающее множество, необходимое для оценивания параметров HMM, может быть построено на основании генов, предсказанных по сходству с белками. К моменту начала работы над проектом существовала потребность в программе предсказания генов, которая могла бы использовать широкий набор статистических моделей, подбираемых под каждый аннотируемый геном, и могла бы легко переобучаться для аннотации новых геномов.
GipsyGene статистическая программа распознавания генов
Программа GipsyGene может использовать модель как эукариотического, так и прокариотического генома. Модель генома прокариот может рассматриваться как ограничение эукариотической модели. Для решения задачи распознавания генов строится граф, вершинами которого являются кандидаты в сайты сплайсинга, СТАРТ и СТОП кодоны. Ребра этого графа соединяют вершины, так чтобы на любом пути в экзонах в составе одного гена сохранялась открытая рамка считывания. Алгоритм находит оптимальный путь на графе, соответствующий наиболее вероятной экзон-интронной структуре.
В модель заложены следующие кодирующие и некодирующие состояния: одноэкзонный ген; начальный, внутренний и терминальный экзоны; интрон; межгенный участок (спейсер). В GipsyGene реализованы наиболее широко используемые модели донорного и акцепторного сайтов. Статистическая модель выбирается в зависимости от того, имеет ли сайт значимые корреляции между позициями. Если анализ сайтов в обучающей выборке не обнаруживает корреляций между позициями, или эти корреляции статистически не значимы, например, из-за небольшого объема обучающего множества, то вероятность вычисляется по профилю сайта. Другие две модели учитывают корреляции между позициями сайта. (1) WAM модель - неоднородная Марковская модель первого порядка, учитывающая корреляции между соседними нуклеотидами. (2) MDD модель - применяется для сайтов, которые имеет значимые корреляции, как с соседними, так и с удаленными позициями. Вероятность вычисляется по профилю в зависимости от оснований, стоящих в позициях, которые наиболее сильно взаимодействуют с другими позициями сайта.
Так как для геномов грибов многих видов сложно сформировать обучающую выборку достаточного объема, для вычисления вероятности кодирующей (некодирующей) части мы реализовали несколько различных моделей. Кодирующая ДНК может быть смоделирована с помощью: 1) статистики кодонов; 2) марковской цепи первого порядка для аминокислот и статистики синонимичных кодонов, соответствующих аминокислотам; 3) трех-периодичных марковских цепей третьего и пятого порядков. Модели для некодирующей ДНК - марковские цепи первого, третьего и пятого порядков.
Модель сайта ветвления
Для улучшения предсказаний 3'-концов интронов была разработана модель сайта ветвления. Потенциальный сайт ветвления оценивается по профилю, распределению расстояний до акцепторного сайта, распределению количества динуклеотидов AG между сайтом ветвления и акцептором. Профиль и распределения конструируются на множестве слов, наиболее похожих на сайт ветвления Saccharomyces.
Для того чтобы построить профиль сайта ветвления, в окне [-l, -r] ([-2,-40] для Aspergillus spp. и Neurospora crassa) левее акцепторного сайта осуществлялся поиск наилучшего слова, удовлетворяющего консенсусу [CT]T[AG]a[CT], идеально - CTAaC. Для кандидатов допускались отклонения от идеального слова только в двух из трех вырожденных позиций. На множестве кандидатов строилось распределение расстояний до акцепторного сайта. Применение этой же процедуры к случайным последовательностям задает уровень шума - среднюю частоту встречаемости слова в случайной последовательности. Далее, окно поиска уточнялось так, чтобы частота в окне превышала уровень шума. На множестве кандидатов, найденных в уточненном окне поиска, строилась частотная матрица размером 7 позиций, распределение расстояний до акцептора и распределение динуклеотидов AG. К каждому элементу полученной частотной матрицы добавлялось число, пропорциональное квадратному корню из числа последовательностей - псевдоотсчеты. В состоянии HMM “5' сайт экзона” генерируются нуклеотиды: собственно, акцепторного сайта сплайсинга и соответствующего сайта ветвления. Сайт ветвления определяется как мотив с наибольшим весом в окне [-1.3l,-r] от каждого динуклеотида AG, где l и r - левая и правая координаты окна в котором сайт ветвления встречается чаще, чем в случайной последовательности. Вес мотива определяется как логарифм отношения правдоподобия модели сайта ветвления к интронной модели: . Были использованы следующие обозначения: x - мотив, P(x|BPS) и P(x|Intron) вероятности мотива по профилю сайта ветвления и модели внутренней части интрона соответственно, d и NAG - количество нуклеотидов и число динуклеотидов AG между сайтом ветвления и кандидатом в акцепторный сайт соответственно.
Результаты тестирования
Программа была обучена и протестирована на генах Aspergillus spp. и Neurospora crassa на одногенных и мультигенных фрагментах. Качество предсказания GipsyGene к кодирующим нуклеотидам в одногенных фрагментах составило 96% чувствительность и 95% специфичность для Aspergillus spp, 93% и 95% соответственно для Neurospora crassa. Качество предсказания экзонов в одногенных фрагментах Aspergillus spp. (и Neurospora crassa) составило: чувствительность - 80 (75)%, специфичность - 73 (69)%, потерянных экзонов - 4 (8)%, полностью ложных экзонов - 12 (12)%, что соответствует характеристикам аналогичных программ. Вклад модели сайта ветвления в качество предсказания незначителен для статистик кодирующих нуклеотидов (~1%), однако, увеличение чувствительности и специфичности распознавания экзонов может достигать 10%, что объясняется улучшением распознавания коротких интронов.
Как и у всех программ этого класса, применение GipsyGene на многогенных фрагментах приводит к потере в специфичности, в зависимости от длины межгенных спейсеров, что объясняется тем, что в настоящее время не существует надежных моделей, позволяющих предсказывать границы генов. При тестировании программы на искусственных многогенных фрагментах ДНК, со средней длиной межгенного интервала (2000 оснований), свойственного Aspergillus, снижение специфичности составило ~5%. Чувствительность программы не зависит от длины анализируемой последовательности и длинны спейсеров.
Комплекс программ автоматической аннотации геномов
Разработанная программа GipsyGene является частью комплекса программ распознавания генов. Процесс автоматической аннотации генома состоит из нескольких последовательных этапов:
1) Первичная идентификация фрагментов генома, кодирующих аминокислотные последовательности похожие на ранее известные последовательности. Для этого используются программы семейства BLAST. Для определения экзон-интронной структуры генов эукариот необходим следующий этап, для прокариот можно сразу переходить к третьему этапу аннотации.
2) Предсказание генов по сходству. На этом этапе применяются программы сплайсового выравнивания последовательностей белков и геномной ДНК, например, PROFRAME. Для эффективной работы программ этого класса используется предыдущий этап.
3) Обучение GipsyGene. Параметры распознающих моделей оцениваются на основании обучающего множества, включающего в себя гены, предсказанные по сходству на предыдущих этапах.
4) Применение обученной программы.
5) Интегрирование результатов предсказания генов на разных этапах в заключительную аннотацию. Предсказания, сделанные различными программами, взвешиваются с помощью эвристической процедуры. Для каждого фрагмента ДНК алгоритм динамического программирования, выбирает последовательность предсказаний, максимального веса.
Процедура аннотации прокариотического генома была применена к фрагменту ДНК Saccharopolyspora erythraea (предварительная сборка, draft) длиной около 2•106 пар оснований. Качество предсказания генов программным комплексом оценивалось по отношению к тестирующему множеству 43 аннотированных последовательностей в GenBank, для которого нуклеотидная чувствительность составила 97%, специфичность - 86%. Относительно низкая специфичность объясняется неполной аннотацией последовательностей, так как для всех предсказанных генов длинной более 300 нуклеотидов с помощью BlastX было обнаружено существенное сходство с каким-либо белком.
Глава 3. Элементарные альтернативы в генах эукариот
На этапе первичной аннотации генома игнорируется тот факт, что более 50% генов может быть подвержено альтернативному сплайсингу. В настоящее время, альтернативный сплайсинг рассматривается, как важнейший механизм эволюции генов. Изоформы мРНК одного гена могут кодировать белки с различающимися функциями, специфично экспрессироваться в различных тканях, или являться ошибками сплайсинга, которые уничтожаются с помощью NMD - специального механизма, сопряженного с трансляцией. Определение вариантов альтернативного сплайсинга осуществляется на основании сплайсированного выравнивания маркеров экспрессии - мРНК и EST с геномной последовательностью. Альтернативный сплайсинг гена естественным образом может быть представлен в виде ориентированного ациклического графа, множество путей на этом графе представляет множество потенциально возможных вариантов мРНК. Вершинами графа являются сайты сплайсинга, либо сайты начала или конца транскрипции. Направление на ребрах графа соответствует 5'3' направлению цепи ДНК, содержащей ген. Два пути на графе, между вершинами u и v, являются взаимно исключающими, если они не имеют других общих вершин кроме u и v. Взаимно исключающие пути обладают следующим свойством - для них не существует общего ребра (экзона или интрона), следовательно, они соответствуют независимым событиям сплайсинга. Анализ графа сплайсинга позволяет выделять альтернативы - подграфы, в пределах которых существует путь между источником u и стоком v который является взаимно исключающим со всеми остальными путями. Менее формальное определение: альтернатива - это фрагмент пре-мРНК, внутри которого существует несколько вариантов сплайсинга. При этом среди всех вариантов сплайсинга, для которых границы этого фрагмента являются общими сайтами, существует такой, у которого внутри фрагмента нет сайтов, общих с другими
Рисунок 1. Основные типы элементарных альтернатив. А - альтернативный донорный сайт или альтернативная терминация транскрипции; Б - альтернативный акцепторный сайт или альтернативная инициация транскрипции; В - удержанный интрон; Г - кассетный экзон; Д - чередующиеся экзоны.
Традиционно в работах, исследующих альтернативнй сплайсинг, используется классификация элементарных альтернатив по основным типам (см. рис 1). Определение альтернатив в виде подграфов графа сплайсинга включает в себя все типы элементарных альтернатив. В настоящей работе предложен эффективный метод автоматической идентификации и классификации альтернатив. Данный метод был применен к анализу базы данных альтернативно сплайсируемых генов EDAS. Классификация альтернатив важна для исследования сплайсинга, так как различные типы элементарных альтернатив обладают разными свойствами.
Для фильтрации редких альтернатив, был применен биноминальный тест с параметром 0,01. Значение параметра теста подбиралось исходя из оценки частоты ошибок сплайсосомы (см. далее). Вариант сплайсинга, через который проходит наибольшее количество EST, называется базовым. Пусть через источник и сток альтернативы проходит N EST, а через минорный вариант сплайсинга K EST. Сумма соответствующих биномиальных частот:
является вероятностью того, что событие с количеством EST в минорном пути меньше наблюдаемого (K) встречаются с частотой 0,01. Если вероятность P>0,95 то отвергается нулевая гипотеза, мы считаем, что частота минорного варианта больше пороговой, иначе альтернатива считается редкой.
Свойства элементарных альтернатив
Наиболее распространенным типом элементарных альтернатив является кассетный экзон 57% - 64% (последнее значение получено без учета редких альтернатив). Около 51% кассетных экзонов являются пропусками экзона в базовой изоформе. Доля удержанных интронов составляет 8% (как с учетом, так и без учета редких делеций и вставок). В противоположность кассетным экзонам, 58% удержанных интронов являются вставками в базовую изоформу. Около 59% всех альтернатив, имеющих EST покрытие, приходится на редкие варианты сплайсинга. Несмотря на значительное число EST человека ~ 4-106 последовательностей, более половины элементарных альтернатив, по-видимому, являются ошибками сплайсинга в генах с высоким уровнем экспрессии, в то время как для большинства генов с низким и умеренным уровнем экспрессии альтернативный сплайсинг недостаточно полно представлен в EST.
Один из двух вариантов сплайсинга в элементарных альтернативах соответствует более длинной мРНК, чем другой вариант. Были построены распределения частоты включения в мРНК длинного варианта сплайсинга для каждого типа альтернатив. Диапазон частот включения от 0 до 0,4 соответствует вставкам нуклеотидов в базовую изоформу, диапазон от 0,4 до 0,6 соответствует равнозначным альтернативам и диапазон от 0,6 до 1 - делециям в базовой изоформе. Распределения частот включения для альтернативных сайтов (рис. 1 А и Б) и кассетных экзонов (рис. 1 Г) обладают большим сходством что определяется общим механизмом, лежащим в основе альтернативного сплайсинга, - конкуренцией сайтов базовой и альтернативной изоформ. В случае кассетного экзона, по-видимому, решающим является распознавание какого-нибудь одного из альтенативных сайтов.
Координированный альтернативный сплайсинг
Алгоритм выделения альтернатив позволяет обнаружить координированный альтернативный сплайсинг. Две альтернативы (не обязательно элементарные) называются соседними, если между стоком 5'- альтернативы и источником 3'-альтернативы на графе сплайсинга существует единственный путь. Для соседних альтернатив проверялась нулевая гипотеза H0 о независимости сплайсинга, в этом случае распределение наблюдаемых путей в 3'-альтернативе не зависит от пути следования через 5'- альтернативу. Для проверки гипотезы нужно рассмотреть совместное распределение числа EST на всех возможных парах путей в соседних альтернативах. Это распределение может быть представлено в виде матрицы смежности (рис. 2). Гипотеза о независимости проверяется с помощью точного теста Фишера.
Применение алгоритма идентификации соседних альтернатив позволило обнаружить гены, для которых сплайсинг в 3'- альтернативе зависит от варианта сплайсинга в 5'-альтернативе (координированный сплайсинг). Из 630 генов, содержащих соседние альтернативы с достаточным для анализа покрытием EST, только для 60 генов был показан координированный сплайсинг. Мы оценили, что около 25% генов человека содержат более одной альтернативно сплайсируемой области, следовательно, сплайсинг этих областей может быть координирован. Оценка была получена с помощью программы IsoformCounter (см. следующую главу). EST содержат в среднем четыре экзона, кроме того, 3' и 5' концы генов, кодирующих длинные транскрипты мРНК, обычно имеют значительно более высокое покрытие по сравнению с серединой. Мы идентифицировали лишь незначительную часть существующих соседних альтернатив, для которых EST покрытие было достаточно для анализа. Для пяти генов, содержащих области координированного альтернативного сплайсинга, совместное распределение вариантов в соседних альтернативах с высокой значимостью отличалось от ожидаемого исходя из модели H0 (pval<0,007). Было показано, что распределение наблюдаемых частот вариантов сплайсинга в этих генах не может быть объяснено деградацией изоформ, содержащих преждевременный СТОП-кодон (NMD). Действие тканевых факторов для четырех из пяти генов так же не может объяснить наблюдаемое распределение.
Наши коллеги на модели минигенов, содержащих два идентичных кассетных экзона EDI гена фибронектина (FN) человека, разделенные фрагментом, из трех последовательных константных экзонов и соответствующими интронами, показали, что наблюдаемый координированный сплайсинг в соседних альтернативах зависит от скорости транскрипции. Высокая скорость транскрипции уничтожает координационный эффект. Координация сплайсинга в соседних альтернативах зависит от промотора, под управлением которого инициируется транскрипция, т.е. координация исчезает под управлением промотора б-глобинового гена и восстанавливается при ингибировании полимеразной активности pol-II. Альтернативный сплайсинг одного из пяти генов (PCBP2), для которых координированный сплайсинг был показан в EST с высоким уровнем значимости, был исследован экспериментально. Было показано, что существует высокая корреляция между распределением частот изоформ, оцененным по EST-данным и по результатам ОТ-ПЦР.
Рисунок 2. Координированный альтернативный сплайсинг гена PCBP2. В каждой альтернативе содержится по два пути a, b в 5' и c, d в 3'. В таблицах показано число EST в EDAS, подтверждающее каждую пару путей в соседних альтернативах.
Распределение вариантов сплайсинга гена PCBP2 приведено на рисунке 2. Если 5' кассетный экзон пропускается (вариант a) то, 3' кассетный экзон (d) включается в состав 100% мРНК. Если 5' кассетный экзон включается (вариант b), то доля экзона d в мРНК снижается до 52%. Таким образом, введение задержки транскрипции РНК должно приводить к увеличению доли включения 5' экзона b и как следствие снижать долю мРНК, содержащих экзон d. Этот эффект был обнаружен после обработки трех клеточных линий ингибитором полимеразной активности DRB, что привело к снижению доли включения экзона d примерно на 50%.
Глава 4. Альтернативный сплайсинг и функция белков
Последовательности EST являются основным источником информации об альтернативном сплайсинге. Так как EST - это случайные фрагменты мРНК сравнительно небольшой длинны (300 - 500 нуклеотидов), то существует проблема восстановления по этим данным полноразмерных мРНК (сборка EST). Для решения задачи о сборке EST, была разработана программа IsoformCounter, с помощью которой, для каждого гена из базы данных EDAS определяется число кодирующих изоформ. IsoformCounter позволяет определить число и положение альтернативных областей относительно самой длинной белковой изоформы.
Для каждого гена альтернативный сплайсинг в EDAS представлен множеством сегментов - экзонов и интронов. Сегменты обладают уровнем достоверности (подтверждения), определяемым как число библиотек клонов, содержащих последовательности EST которые выравниваются или сплайсируются в этом сегменте. Если для некоторых сегментов существует подтверждающая последовательность мРНК, то их уровень достоверности всегда больше, чем максимальный уровень EST достоверности. Самую большую достоверность имеют экзоны и интроны, подтвержденные выравниванием с известным белком.
Программа IsoformCounter генерирует ограниченное множество кодирующих изоформ, такое, что для каждого экзона и интрона, самая длинная изоформа, проходящая через него, является элементом этого множества, причем достоверность этой изоформы равна достоверности сегмента. Достоверность изоформы определяется как минимальная достоверность ее сегментов.
Белковые изоформы альтернативно сплайсируемых генов
В основе программы IsoformCounter лежит граф сплайсинга. Граф содержит два типа вершин - ДНК-вершины и ORF-вершины. Два типа ребер ДНК-ребра и ORF-ребра соединяют вершины соответствующих типов. Множество путей на графе, проходящих по ORF-ребрам соответствует множеству открытых рамок считывания. Пути на графе, проходящие по ДНК-ребрам, соответствуют всем возможным полноразмерным транскриптам гена. IsoformCounter реализует последовательность фильтров, которые применяются к изоформам - путям на графе сплайсинга:
(1) Идентификация изоформ.
Изоформы начинаются в СТАРТ-вершинах и заканчиваются в СТОП-вершинах. Допускаются изоформы, начинающиеся в 5'-сайтах начальных экзонов, так как 5'-концы генов могут иметь недостаточное EST покрытие, а мРНК могут быть недосеквенированы влево. Для СТАРТ-кодона (ATG) создается соответствующая вершина только в том случае, если этот кодон не находится внутри какой-либо рамки считывания.
(2) Инициация трансляции.
В генах эукариот трансляция инициируется по механизму линейного сканирования. 40S субъединица рибосомы связывается с кэп-структурой на 5'-конце мРНК, затем начинает скольжение в 3' направлении до ближайшего ATG кодона, где инициирует трансляцию, если этот кодон находится в подходящем контексте. Стабильные шпильки или ATG кодоны 5' левее сайта инициации трансляции снижают эффективность линейного сканирования. Небольшая доля мРНК (2-8%) содержит внутренний сайт инициации трансляции. IsoformCounter допускает существование не более 2-х ATG кодонов 5' левее ORF-СТАРТ-вершины. Данный фильтр не применяется, если СТАРТ-вершина соответствует началу выравнивания ДНК - белок.
(3) Короткие изоформы.
Алгоритм допускает изоформы, если длина ORF превышает 50% от средней длины белка в EDAS. Под средней длинной белка понимается средняя длина RefSeq изоформ данного гена. Если для гена не существует RefSeq изоформ, то его средняя длина равна средней длине всех известных белков данного гена. Изоформы длины которых меньше 33 аминокислот не рассматриваются.
(4) Согласованность с белками
Необходимо чтобы изоформа имела как минимум одну общую аминокислоту с известной последовательностью белка, кодируемой данным геном. Основное назначение данного фильтра - удалять длинные ORF в 3' нетранслируемой мРНК.
(5) Терминация трансляции.
Транскрипты, содержащие преждевременный СТОП-кодон возникающие, например, в результате ошибочного сплайсинга, разрушаются с помощью механизма NMD. Так как не существует правила, по которому можно различать функциональные мРНК изоформы и ошибки сплайсинга, мы применили специальный фильтр, имитирующий механизм NMD. IsoformCounter допускает сплайсированные изоформы в которых СТОП-кодон находится на расстоянии не более 55 нуклеотидов от последней границы между экзонами. Фильтр не применяется к ORF-СТОП-вершинам, соответствующим 3'-концам выравниваний с последовательностями белков.
Процедура нормализации достоверности экзонов и интронов
Варианты альтернативного сплайсинга попадают в EST клонотеки с вероятностью, зависящей от уровня экспрессии гена. Для генов с низким уровнем экспрессии альтернативный сплайсинг либо не будет наблюдаться, либо наблюдаемые варианты будут иметь подтверждение небольшим числом EST клонотек. Для того чтобы сравнивать достоверность альтернативного сплайсинга различных генов необходимо произвести нормировку на общее число EST. IsoformCounter использует вероятностную модель, которая позволяет оценить минимальную достоверность экзонов и интронов, необходимую для исключения ошибочного сплайсинга на данном уровне экспрессии гена. Пусть для некоторого гена известен уровень экспрессии (среднее число транскриптов на ген). Мы предполагаем, что =f(N), где N - наблюдаемое число EST. Обозначим P(N) вероятность, что клетка содержит хотя бы одну неверно сплайсированную EST, P=1-(1-б), где б - вероятность ошибки при сплайсинге одного интрона. Вероятность, что ошибочный интервал будет иметь подтверждение k библиотеками клонов (клонотеками) равна Pk<в, где в - уровень значимости - вероятность, с которой мы допускаем ошибку сплайсинга. Решая неравенство относительно k, получаем выражение: k()ln(в)/ln(1-(1-б)). Уровень экспрессии был оценен как =N/5. Оценка б составила 0,01 (обоснование будет дано далее). В результате было использовано следующее выражения для определения порогового числа EST-клонотек для того чтобы принять или отклонить экзон или интрон: k(N)=[-1/ln(1-0,99N/5)].
Нормализация убирает зависимость числа предсказанных изоформ от степени покрытия генов EST. Однако значимого различия распределений числа изоформ на ген между нормализованными и ненормализованными данными не наблюдалось, что объясняется тем, что доля генов с большим EST покрытием (>400 EST) составляет около 4%.
Результаты анализа альтернативного сплайсинга
Программа IsoformCounter была применена для анализа альтернативного сплайсинга (АС) генов базы данных EDAS. Среди всех генов в EDAS, которые содержат интроны, 77% генов имеют более одной функциональной изоформы. Около 20% генов в геноме человека являются одноэкзонными, следовательно, оценка доли альтернативно сплайсируемых генов составляет примерно 60% (75% из 80%). Большинство генов (91%) имеют относительно небольшое число изоформ (от 1 до 15). Для каждого гена было подсчитано число альтернативных и константных сегментов в изоформе, кодирующей самый длинный белок. Было получено следующее распределение: 52-72% генов содержат единственный альтернативный сегмент, нижняя оценка получена на основании EST данных, верхняя - только белков, в промежутке (62%) находится оценка, полученная с использованием мРНК и белков вместе; 20-29% содержат два сегмента; 6-12% три; 1-6% более трех. Таким образом, около 25% генов содержат более одного альтернативного сегмента. Сплайсинг в альтернативных сегментах этих генов может быть координирован.
Были рассмотрены следующие функциональные категории онтологии генов GO [http://www.geneontology.org/GO.doc.html]: “передача сигналов посредством малых ГТФаз” (145 генов), “катаболизм” (512 генов), “репликация ДНК и хромосомный цикл” (99 генов), “рибосома” (123 гена). Число функциональных изоформ было оценено с применением нормализации на общее число EST. Было получено значимое отличие распределений числа изоформ генов из категорий “рибосома” и “передача сигналов посредством малых ГТФаз” от распределения по всем генам (p = 0,003 U-тест Манн-Уитни). В обеих категориях наблюдалось меньшее, чем в среднем, число изоформ. Категория “рибосома” содержит 46% константных генов, несмотря на очень большое EST покрытие, что является результатом нормализации. Гены, принадлежащие категории “репликация ДНК и хромосомный цикл”, имеют больше изоформ, чем в среднем (p = 0,07 U-тест Манн-Уитни), среди них более высокий процент генов являются альтернативно сплайсируемыми (имеют две и более изоформы). Для изучения связи между АС и белок-белковыми взаимодействиями из базы данных MPPI было выбрано 198 пар взаимодействующих белков, обе составляющих которых кодируются генами, представленными в EDAS (всего 262 гена). Доля альтернативного сплайсинга была выше среди генов, участвующих хотя бы в одном белок-белковом взаимодействии. Дефицит константных генов составил 17-30%, избыток альтернативно сплайсируемых - 10-25%. Несмотря на относительно небольшие различия наблюдаемых и ожидаемых значений, эти различия статистически значимы (p < 0,1-1%) на всех рассмотренных уровнях достоверности: только белки, белки и мРНК, EST с различным числом клонотек, нормализованные EST.
Частота ошибок сплайсинга
Программа IsoformCounter для каждого интрона позволяет определить существование хотя бы одной изоформы, не попадающей под действие механизма NMD и кодирующей достаточно длинную аминокислотную последовательность (фильтры (1)-(5)). Мы полагаем, что если для интрона не существует ни одной изоформы, то с высокой долей вероятности, она не может кодировать функциональный белок. Рассмотрим множество (error_introns), состоящее из интронов, подтвержденных только последовательностями EST через которые IsoformCounter не может провести ни одной изоформы. Кроме того, каждый из интронов, входящих в состав множества error_introns пересекается с каким-либо интроном, достоверным на уровне белка. Рассмотрим множество последовательностей EST (Good) из EDAS, которые сплайсированы только в тех интронах, которые имеют достоверность на уровне белка, обозначим Ngood - число таких EST. Обозначим Error множество EST, сплайсированных хотя бы в одном из ошибочных интронов из множества error_introns, при этом эти EST должны быть так же сплайсированы хотя бы в одном белковом интроне, пусть Nerror - число таких EST. EST из множества Error соответствуют транскриптам, в которых произошла ошибка при сплайсинге интронов в достоверно кодирующих изоформах. Обозначим б - вероятность ошибки сплайсинга одного интрона. Пусть EST в среднем содержит <ni> интронов, тогда (1- б)<ni> - вероятность, что EST не содержит ни одной ошибки сплайсинга. Вероятность ошибки сплайсосомы может быть получена, как решение уравнения: , результаты приведены в таблице 1. Первая оценка получена без ограничения на число клонотек, подтверждающих EST интроны, входящие в состав множества error_introns. Вторая оценка получена с ограничением одна EST-клонотека.
Таблица 1 Оценка вероятности ошибки сплайсинга одного интрона - б.
любое число клонотек |
1 EST клонотека |
||
Ngood (число EST) |
1848958 |
1848958 |
|
Nerror (число EST) |
38845 |
17926 |
|
б |
0,0069 |
0,0032 |
Для того, чтобы понять насколько приведенаая оценка близка к истине, будем рассуждать следующим образом. Рассмотрим ген содержащий ni интронов. Если б - вероятность ошибки при сплайсинге одного интрона, то (1- б)ni в, где в - доля нормальных мРНК необходимых для эффективной экспрессии гена. Несмотря на то, что среднее число интронов в генах человека относительно невелико (5,5), некоторые гены имеют очень большое число интронов. Экстремальный пример - ген титин содержит 363 экзона. Величина ошибки сплайсосомы должна находится в интервале 0,001 - 0,003, чтобы обеспечить достаточную эффективность экспрессии длинной изоформы титина (в=0,5 - 0,8). В главах 3 и 4 использована верхняя оценка ошибки сплайсомы ~0,01, так как ошибка сплайсинга может зависеть от контекста сайтов базовой изоформы. Представляет интерес сравнение вероятности ошибки сплайсинга с ошибкой РНК-полимеразы и ошибкой трансляции. Частота ошибок РНК полимеразы, не имеющей корректирующей активности, составляет 1 на 104 нуклеотидов. Ошибки трансляции происходят с частотой 1 на 104 аминокислотных остатков. Длина кодирующей части мРНК среднего гена ~900 нуклеотидов, тогда вероятность того, что при транскрипции в ней содержится хотя бы одна ошибка ~ 0,09! Таким образом, около 10% мРНК содержат ошибки в кодирующей части гена, внесенные РНК полимеразой, примерно такой же уровень ошибок вносится при сплайсинге пре-мРНК генов с 10 (верхняя оценка б) - 100 (нижняя оценка) интронами
Основные результаты и выводы
1. Была разработана статистическая программа предсказания генов в геномах низших эукариот, которая легко интегрируется в комплекс программ для первичной аннотации геномов.
2. Разработана оригинальная статистическая модель сайта ветвления, значительно улучшающая распознавание коротких интронов грибов.
3. Разработан автоматический способ выявления и классификации альтернативных областей генов на основании данных о выравнивании EST с геномом. Были исследованы статистические свойства основных типов альтернатив: донорного и акцепторного сайтов, кассетного экзона, удержанного интрона. Наиболее распространенным типом является кассетный экзон, при этом примерно в половине случаев наблюдается пропуск экзона.
4. С помощью разработанного метода выявления альтернатив было показано, что для ряда генов выбор варианта сплайсинга 3'-альтернативы зависит от способа сплайсинга 5'-альтернативы. Была дана оценка доли таких генов - не более 25%.
5. Разработан метод сборки EST в полноразмерные транскрипты. Было показано, что альтернативный сплайсинг в разной степени представлен среди групп генов, кодирующих белки с различными функциями.
6. Дана оценка вероятности ошибки сплайсинга - 10-2 -10-3 случаев ошибочного сплайсинга на интрон.
Список работ, опубликованных по теме диссертации
1. A. D. Neverov, M. S. Gelfand, A. A. Mironov 2003. GipsyGene: A Statistics-Based Gene Recognizer for Fungal Genomes. Biophysics (Moscow), Vol. 48, Suppl. 1, 2003, pp. S71-S75.
2. A. Neverov, I. Artamonova, R. Nurtdinov, D. Frishman, M. Gelfand, A. Mironov. 2005. Alternative splicing and protein function. BMC Bioinformatics 2005, Vol. 6, p. 266.
3. J. Fededa, E. Petrillo, M. Gelfand, A. Neverov, S. Kadener, G. Nogues, F. Pelisch, F. Baralle, A. Muro, A. Kornblihtt. 2005. A polar mechanism coordinates different regions of alternative splicing within a single gene. Mol Cell. 2005, Vol. 19, N. 3, pp.393-404.
4. Р.Н. Нуртдинов, А.Д. Неверов, Д.Б. Малько, И.А. Космодемьянский, Е.О. Ермакова, В.Е. Раменский, А.А. Миронов и М.С. Гельфанд. 2006. EDAS, база данных альтернативно сплайсируемых генов человека. Биофизика, 2006, т. 51, номер 4, стр. 589-592.
5. A. Neverov, A. Mironov, M. Gelfand. 2006. Splice alignment and similarity-based gene recognition. Handbook of computational molecular biology, ed. S. Aluru, Chapman & Hall 2006, part. I, pp. 2-1 ? 2-18.
6. A.D. Neverov, M.S. Gelfand, A.A. Mironov. 2002. Gene prediction in genomics DNA of Aspergillus. Proceedings of the Third International Conference on Bioinformatics of Genome Regulation and Structure. (BGRS'2002), Novosibirsk, Russia. Vol. 1, p. 116.
7. A.D. Neverov. 2003. GipsyGene: A HMM-based gene recognitional tool for lower fungi. Proceedings of the First International Moscow Conference on Computational Molecular Biology (MCCMB'03), Moscow, Russia, p. 161.
8. A.D. Neverov, L. Milanesi. 2005. A pipeline for computational gene recognition in the Sacharopolyspora erythraea genome. Proceedings of the Second International Moscow Conference on Computational Molecular Biology (MCCMB'05), Moscow, Russia, p. 246.
9. R.N. Nurtdinov, A.D. Neverov, D.B. Malko, I.A. Kosmodemyansky, A.A. Mironov, M.S. Gelfand. 2005. EDAS: EST-derived alternative splicing database, Proceedings of the Second International Moscow Conference on Computational Molecular Biology (MCCMB'05), Moscow, Russia, p. 259.
10. V. Ramensky, R. Nurtdinov, A. Neverov, A. Mironov, M. Gelfand. 2006. Proceedings of the 5th International. Conf. Bioinformatics of Genome Regulation and Structure (BGRS'2006), Novosibirsk, Russia, p. 211.
Размещено на Allbest.ru
...Подобные документы
Процессинг молекул первичных РНК в ядре клеток человека. Канонический и альтернативный сплайсинг, его механизм и значение в жизнедеятельности организма, взаимосвязь и оценка пластичности. Основные факторы сплайсинга: разнообразие, строение и функции.
курсовая работа [513,7 K], добавлен 11.05.2015Генетический аппарат прокариот и эукариот. Понятие делеции. Сплайсинг как один из этапов образования функционально активных молекул РНК из их предшественников, осуществляемый после завершения транскрипции. Механизм удаления интронов и соединения экзонов.
контрольная работа [64,4 K], добавлен 20.02.2015Созревание информационной РНК. Сплайсосомные интроны. Альтернативный сплайсинг. Сборка сплайсосомы. Структура интеинов. Современные представления о механизме белкового сплайсинга. Эндонуклеазная активность интеинов. Использование интеинов в биотехнологии.
реферат [1,1 M], добавлен 04.02.2009Каталитическая активность молекул нуклеиновой кислоты РНК, функции фермента. Процесс созревания мРНК и тРНК. Понятие и разновидности сплайсинга малых ядерных РНК, роль и свойства мяРНК. Механизм регуляции активности генов и клеточной дифференцировки.
курсовая работа [4,4 M], добавлен 09.06.2011Виды грибов в зависимости от их строения. Процесс размножения низших грибов. Их вредоносное влияние на овощные культуры. Опасные паразиты среди высших грибов – возбудители болезней злаковых. Отдел спорообразующих одноклеточных паразитических грибов.
реферат [3,1 M], добавлен 08.11.2010Механизмы регуляции экспрессии генов у прокариот и эукариот. Регуляция содержания РНК в процессе биосинтеза. Согласованная регуляция экспрессии прокариотических родственных генов. Репрессия триптофанового оперона. Суммарный эффект аттенуации и репрессии.
лекция [24,2 K], добавлен 21.07.2009Дифференциальная экспрессия генов и ее значение в жизнедеятельности организмов. Особенности регуляции активности генов у эукариот и их характеристики. Индуцибельные и репрессибельные опероны. Уровни и механизмы регуляции экспрессии генов у прокариот.
лекция [2,8 M], добавлен 31.10.2016Понятие и структура белков, аминокислоты как их мономеры. Классификация и разновидности аминокислот, характер пептидной связи. Уровни организации белковой молекулы. Химические и физические свойства белков, методы их анализа и выполняемые функции.
презентация [5,0 M], добавлен 14.04.2014Транскрипция – процесс переноса генетической информации от ДНК к РНК. Природа информационной связи между ДНК и белками. Строение и организация единиц транскрипции у прокариот и эукариот. Синтез РНК - выделение стадий инициации, элонгации и терминации.
лекция [27,1 K], добавлен 21.07.2009Теория прыгающих генов Б. Мак-Клинток, транспозоны как последовательности ДНК, способные к перемещению. Типы мобильных элементов и их свойства, значение в жизни организма. Транспозирующиеся элементы прокариот. Подвижные генетические элементы у эукариот.
лекция [38,5 K], добавлен 21.07.2009Изучение биоразнообразия мицелиальных грибов, ассоциированных с двустворчатыми моллюсками. Видовой состав мицелиальных грибов, получение их штаммов. Распределение грибов во внутренних органах моллюсков. Взаимоотношения морских беспозвоночных и грибов.
курсовая работа [117,3 K], добавлен 11.03.2013Использование трансгенных организмов: изучение роли определенных генов и белков; получение новых сортов растений и пород животных; в биотехнологическом производстве плазмид и белков. Выведение флуоресцентных свиней и генетический модифицированных кошек.
презентация [676,7 K], добавлен 25.12.2012Молекулярно-генетический уровень организации живого. Схема строения ДНК. Экспрессия гена как процесс реализации информации, закодированной в нем. Центральная догма молекулярной биологии. Транскрипционный аппарат клетки. Схемы транскрипции и сплайсинга.
презентация [725,1 K], добавлен 21.02.2014Образование и встраивание мембранных белков. Сигнальные последовательности белков. Белки, необходимые для распознавания сигналов переноса. Синтез и транспорт липидов у прокариот и эукариот. Изменение в липидном составе под действием окружающей среды.
курсовая работа [1,2 M], добавлен 10.02.2011Изучение строения гена эукариот, последовательности аминокислот в белковой молекуле. Анализ реакции матричного синтеза, процесса самоудвоения молекулы ДНК, синтеза белка на матрице и-РНК. Обзор химических реакций, происходящих в клетках живых организмов.
презентация [666,1 K], добавлен 26.03.2012Положения клеточной теории. Особенности электронной микроскопии. Детальная характеристика строения и функции клеток, их связи и отношения в органах и тканях у многоклеточных организмов. Гипотеза тяготения Роберта Гука. Сущность строения клетки эукариот.
презентация [1,6 M], добавлен 22.04.2015Анализ пищевой ценности переработанных грибов на рынках Молдовы: сушеных грибов и грибных консервов. Обобщение сведений и исследований в области анализа пищевой ценности грибной продукции для совершенствования заготовки и переработки данных грибов.
контрольная работа [36,3 K], добавлен 22.04.2009Типы взаимодействия неаллельных генов. Теория Ф. Жакоба и Ж. Моно о регуляции синтеза и-РНК и белков. Дигибридное скрещивание при неполном доминировании. Неаллельные взаимодействия генов. Механизм регуляции генетического кода, механизм индукции-репрессии.
реферат [159,6 K], добавлен 29.01.2011Общая характеристика, строение, питание и размножение сине-зеленых водорослей. Основные типы спор у низших и высших грибов. Семейства покрытосеменных растений, распространенных в умеренных широтах, их роль в сложении различных растительных сообществ.
курсовая работа [11,1 M], добавлен 27.11.2010Изменения в содержании нуклеиновых кислот при гипотермии. Гены дегидринов и гены, индуцируемые экзогенной абсцизовой кислотой, семейства генов Wcs 120, Y-бокс белков. Данные об отдельных индуцируемых низкой температурой генах у различных видов растений.
курсовая работа [44,8 K], добавлен 11.08.2009