Регуляция альтернативного сплайсинга в ходе развития органов мыши

Механизмы и роль сплайсинга, анализ роли белков с РНК-связывающими мотивами. Анализ факторов сплайсинга, паттерны в парах тканей. Регуляция развития организма, GO enrichment анализ. Характеристика и особенности эмбрионального развития организма.

Рубрика Биология и естествознание
Вид статья
Язык русский
Дата добавления 18.07.2020
Размер файла 1,9 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Аннотация

Данная работа посвящена исследованию ролиальтернативного сплайсинга (АС) в развитии организма мыши, а также поиску потенциальных регуляторов АС, ответственных за ткань-специфичное возрастное изменение сплайсинга.Исследование позволило сделать вывод, что у определенных пар тканей, как например кора мозга-мозжечок и печень-почки, чаще других происходят изменения сплайсинга одних и тех же экзонов, а также наблюдается более высокая согласованность направлений изменения сплайсинга. При этом некоторые пары тканей синхронно меняют сплайсинг только в одном направлении, например, у одних и тех же экзонов частота включения растет в ходе развития в обоих тканях, в то время как для падения частоты включения такой согласованности не наблюдается. Печень и почки имеют самую выраженную тенденцию синхроннопонижать частоту включения кассетных экзонов в процессе развития организма. GO enrichment анализ показал, что гены, содержащие такие экзоны, помимо общей биологической роли в развитии двух тканей чаще чем можно ожидать случайно отвечают за регуляцию АС.

Были проанализированыгены, кодирующие белки, содержащие РНК-связывающие мотивы. Они чаще других генов меняют экспрессию с возрастом, что подтверждает их роль в развитии организма. Экзоны, рядом с которыми находятся мотивы, распознаваемые такими белками, больше меняют АС. При этом определенные мотивы регулируют АС в множестве белков, важных для эмбрионального развития.

We study the role of alternative splicing (AS) in the development of the body, as well as the search for potential AS regulators responsible for tissue-specific age-related changes in splicing.This study allowed us to conclude that in certain pairs of tissues, such as brain-cerebellum and liver-kidney, changes in splicing of the same exons occur more often than in the other pairs. There is also a higher coherence in the directions of splicing changes in those tissues. At the same time, some pairs of tissues synchronously change splicing in only one direction, for example, both tissues more often increase inclusion of exons over time in transcripts in comparison with other tissues. The liver and kidney have the most manifest tendency to simultaneously exclude cassette exon during the development of an organism. GO enrichment analysis showed that genes containing such exons, in addition to the same biological role in the development of two tissues, are responsible for the self-regulation of AS in these tissues.

AS is regulated by splicing factors; therefore, the expression of genes that could potentially be them is considered in this work. Genes encoding proteins containing RNA-binding motifs change expression over time more often than other genes, which confirms their regulatory role. Exons, next to which there are motifs recognized by such proteins, are change ASmuch more often compared to all observed exons in general. Moreover, certain motives regulate AS in the whole set of proteins that are important for embryonic development.

Содержание

  • Введение
  • 1. Обзор литературы
    • 1.1 Механизмы и роль сплайсинга
    • 1.2 Регуляция развития организма
    • 1.3 Актуальность работы
  • 2. Методы
    • 2.1 Анализ исходного набора данных
    • 2.2 Анализ АС в парах тканей
    • 2.3 Анализ факторов сплайсинга
  • 3. Результаты
    • 3.1 Паттерны в парах тканей
    • 3.2 Корреляционный анализ
    • 3.3 GO enrichment анализ
    • 3.4 Анализ роли белков с РНК-связывающими мотивами
    • Выводы
  • Заключение
  • Списоклитературы

Введение

Процесс синтеза РНК эукариот включает в себя сплайсинг - вырезание участков пре-РНК называемых интронами и сшивание оставшихся участков - экзонов. В некоторых случаях сплайсинг одного и того же транскрипта может приводить к тому, что какой-то участок РНК в одном случае вырезается в составе интрона в другом - остается в составе транскрипта в качестве экзона, в таком случае говорят об альтернативном сплайсинге (АС). АС играет важную роль в формировании разнообразия транскриптов эукариот. Современные исследования показывают, что АС может играть регуляторную роль в результате изменения пропорции альтернативных транскриптов одного и того же гена. АС также может различаться в зависимости от дополнительных условий, таких как здоровье или возраст организма, а также в зависимости от ткани, в которой экспрессируется ген. Известно, что дефекты сплайсинга часто приводят к патологиям в организме.

Эмбриональное развитие организма является сложным поэтапным процессом. Каждый этап и участок зародыша находится под контролем множества разных регуляторных механизмов. Они включают в себя реорганизацию хроматина, эпигенетические маркеры, посттрансляционный и посттранскрипционный контроль и многое другое. Известны ключевые гены для разных процессов дифференциации клеток, которые активируются и деактивируются в определенных тканях в заданный момент времени. При этом роль других механизмов регуляции изучена значительно меньше, как по причине сложности сбора данных, так и из-за технической сложности.

Мы предполагаем, что АС может ткань-специфично меняться с развитием организма и при этом играть регуляторную роль, управляя функционированием других генов с помощью включения и исключения определенных экзонов в транскрипт в разные моменты времени.Цель данной работы состоит в выявлении и анализе кассетных экзонов, синхронно меняющих АС в разных тканях в процессе развития, а также поиске регуляторных зависимостей таких генов. При этом будут рассмотрены разные тенденции изменения АС и факторы, которые могут влиять на частоту включения экзона. сплайсинг эмбриональный организм

1. Обзор литературы

Генетические механизмы в клетках всех живых организмов подчиняются центральной догме молекулярной биологии [1]. Последовательно происходит считывание ДНК в РНК, что называется транскрипцией, после чего на основании последовательности РНК создаются белки, это процесс трансляции. Транскрипция эукариот после копирования последовательности ДНК в РНК дополнительно включает в себя несколько этапов: сплайсинг, кэпирование и полиаденилирование. Все вместе это называется процессингом РНК и является переходной стадией от первичного к зрелому транскрипту. Кэпированием называется набавление гуанозин-5-трифосфата к 5' концу молекулы РНК. При полиаденилировании на противоположный(3') конец молекулы РНК достраивается цепочка аденозинмонофосфатов, также называемая поли-А хвостом. Сплайсинг подразумевает вырезание участков РНК, называемых интронами, из итогового транскрипта, при этом участки, которые остаются в итоговом транскрипте, называются экзонами. В данной работе основное внимание будет уделяться процессу сплайсинга.

1.1 Механизмы и роль сплайсинга

Альтернативным сплайсингом (АС) называется процесс, когда один и тот же участок исходного транскрипта может как остаться в итоговом транскрипте, так и быть вырезанным во время процессинга РНК. Как минимум 95% генов в человеческом организме имеют несколько транскриптов [2]. При этом большинство экзонов (~80%) не превышает 200 пар оснований.

Сплайсинг осуществляется молекулярным комплексом, который называется сплайсосомой. Различают мажорную сплайсосомы, которая отвечает за ~95,5% всего сплайсинга, и минорную, они отличаются составом РНК и распознаваемыми последовательностями распознаваемых нуклеотидных последовательностей [3]. Мажорная сплайсосома состоит из пяти малых ядерных РНК (мяРНК): U1, U2, U4, U5 и U6 и белков, для минорной сплайсосомы основные мяРНК отличаются. Сплайсосома распознает последовательности на краях интронов, которые называются сайтами сплайсинга, а также другие цис-факторы сплайсинга, в которых отдельно выделяют экзонные и интронные энхансеры (intronic и exonic splicing enhancer, ESE и ISE) и сайленсеры (intronic и exonic splicing silencer, ISS и ESS) сплайсинга. При этом один и тот же фактор сплайсинга может являться как активатором, так и репрессором сплайсинга в зависимости от позиции относительно регулируемого сайта сплайсинга. Инструмент Find Individual Motif Occurences (FIMO) позволяет находить мотивы в последовательностях ДНК и белков и потенциально может использоваться для поиска факторов сплайсинга [14]. Инструмент доступен в виде веб-приложения и для установки на персональную машину с ОС linuх, мотивы можно использовать из существующих баз данных или загрузить свои. Алгоритм поиска мотивов основан на динамическом программировании и использует логарифмированные позиционно-весовые матрицы мотивов в собственном формате. FIMO может искать ткань- или клеточно-специфические мотивы, в этом случае делается поправка на модификацию гистонов и комплектацию хроматина, но данный поиск возможен только на данных из баз с соответствующей информацией.

Для анализа включения конкретного сегмента, где под словом сегмент имеется в виду участок исходной последовательности ДНК, в итоговый транскрипт обычно используется метрика percent spliced in (PSI) [4]. PSI считается на основании данных inclusion reads (IR) и exclusion reads (ER), которые получают из результатов RNA-seq, и представляет собой процентное соотношение IR/(IR+ER). Соответственно, PSI может принимать значения от 0 до 100% включительно. Перед подсчетом PSI значения IR и ER нормализуют по длине ридов, а IR также и по длине сегментов.

Достоверно известно, что неправильная регуляция сплайсинга приводит к развитию некоторых заболеваний, как например рак, многие генетические болезни и нейродегенеративные нарушения [2]. Согласно базе данных человеческих мутаций, около трети всех патогенных мутаций вызывают нарушения сплайсинга. Классическим примером генетического заболевания, вызванного нарушением сплайсинга, является спинальная мышечная атрофия (СМА), а также мышечные дистрофии Беккера и Дюшена. Нарушение сплайсинга может приводить к сдвигу рамки считывания и, как следствие, нонсенс-опосредованному распаду РНК (nonsense-mediated decay, NMD). Именно это становится причиной развития болезни Дюшенна, когда происходит нарушение сплайсинга в гене дистрофина (DMD) [3].Патогенные однонуклеотидные экзонные миссенс-мутации в пять раз чаще находятся в сайтах сплайсинга, чем те, что не имеют негативных последствий для организма [5]. Более 90% патогенных мутаций находятся вне белок-кодирующих последовательностей [3], что также подтверждает роль мутаций в служебных последовательностях ДНК. Специальная база данных SpliceDisease была разработана для аккумулирования информации про нарушения сплайсинга и их роли в заболеваниях, в данный момент в базе содержится информации более чем о 370 болезнях, связанных с нарушением сплайсинга [6].

Для анализа причинно-следственной связи изменения экспрессии генов и АС часто используются сети генной коэкспрессии [7-9]. Такие сети строятся с использованием IR и уровней экспрессии (total expression levels, TEs) как на всем транскриптоме, так и ткань-специфично [10]. С помощью этого подхода было продемонстрировано, что мутации, приводящие к нарушению сплайсинга, играют существенную роль в изменении в ткань- и болезнь-специфических путях [11-13].

1.2 Регуляция развития организма

Развитие организма является поэтапным процессом и включает в себя предродовую стадию, которую в свою очередь делят на дробление, гаструляцию и первичный органогенез, и постнатальную, которая в свою очередь условно можно разделить на период до полового созревания и после. Зародышевые слои также делятся на эктодерму, из которой развивается, например, мозг, мезодерму, дающую начало многим внутренним органам, например, сердцу, почкам и половым органам, а также энтодерму, из которойсреди прочегоразвиваются кишечник, печень и легкие.

Все клетки организма за исключением зигот имеют одинаковый набор генетического материала и, тем не менее, способны дифференцироваться в разные органы. Это возможно благодаря экспрессии разных белков, что регулируется эпигенетическими маркерами, химическим составом клетки и ее окружения, а также внешними сигналами. Клетки в процессе органогенеза обмениваются информацией посредством сигнальных рецепторов и, в зависимости от полученных команд, клетка идентифицирует свою позицию и роль, в результате чего происходит развитие органа. При этом происходит изменение экспрессии и АС в клетке.Изменения АС в процессе роста организма в пределах одного клеточного типа называют возрастными изменениями альтернативного сплайсинга (developmentally dynamic alternative splicing, devAS).

Одним из ключевых генов для роста и развития организма является семейство транскрипционных регуляторов hox, отвечающих за дифференциацию клеток. Существует много молекулярных механизмов, контролирующих экспрессию гена hox на протяжении развития: компактизация хроматина, процессинг РНК, микроРНК и трансляционная регуляция. Хотя ключевую роль при этом играет транскрипционная и хроматин-опосредованная регуляция, ко- и посттранскрипционные процессы также влияют на качественный и количественный состав РНК, создавая таким образом дополнительный уровень регуляции[14]. Ген Drosophila melanogaster под названием Ubx имеет шесть изоформ, отличающихся альтернативным сплайсингом. Каждая из изоформ соответствует определенному эволюционно консервативному паттерну экспрессии развития дрозофилы[15]. Разные изоформы Ubx выполняют различные функции во время эмбрионального развития и у взрослой особи. Иногда обнаруживают регуляторную роль для развития организма у генов, которые традиционно ассоциировали с совершенно иными функциями. Например, MSL2 (Male-Specific Lethal complex), отвечающий за повышение экспрессии генов с Х хромосомы в самцах дрозофилы, также регулирует аутосомные гены, играющие роль в морфогенезе [16]. Данные механизмы очень консервативны иу эукариот, данный ген был также исследован в мышах. Искусственное удаление гена Msl2 у мыши также приводит к дефектам развития, хоть и значительно менее выраженным, чем наблюдается для дрозофил. Это позволяет сделать вывод, что на данный момент не изучены многие механизмы регуляции, отвечающие за рост и развитие организма.

В данной работе для выявления генов, которые связаны с изменением сплайсинга в процессе развития, использовался функциональный анализ (GOenrichmentanalysis).Данный анализ использовался для сравнения генов с совпадением АС в определенных тканях по сравнению со всем АС в данных тканях. Это дает информацию о генетических механизмах и метаболических путях, которые претерпевают одинаковые изменения в процессе развития этих органов. Функциональный анализ был проведен при помощи пакетаtopGO [17] языка R [18].

1.3 Актуальность работы

Существует множество работ, посвященных факторам сплайсинга и роли АС в человеке [19,20]. Доказано, что важную роль в регуляции АС играют белковые и РНК-белковые взаимодействия, но конкретные механизмы изучены мало. Существующие исследования в основном концентрируются на статичном АС и не учитывают изменения сплайсинга в зависимости от внешних условий или стадии развития организма. Учитывать влияние внешних факторов затруднительно, а вот анализ динамики АС на протяжении развития является актуальной задачей.

Одно из исследований, опубликованных в Nature в 2019 году, посвящено анализу транскриптома органов разных животных в процессе развития [21]. Оно продемонстрировало схожесть в экспрессии определенных генов в пределах одного органав разных организмах на протяжении роста организма. Но в этом исследовании, как и в большинстве других существующих, не проводилось исследование траекторий изменения АС в генах, экспрессирующихся в разных органах. Данные из этого исследования прекрасно подходят для анализа АС, при этом результаты потенциально могут оказаться значимыми и для анализа изменения экспрессии некоторых генов.

2. Методы

2.1 Анализ исходного набора данных

Мы использовали опубликованные недавно [21]данные РНК-Сек, полученные из семи разных органов мышей, находящихся на различных стадиях развития. Препроцессинг данных (картирование прочтений, создание экзон-интронной аннотации, квантификация АС и поиск кассетных экзонов с значимыми изменениями АС в ходе развития) был произведен в лаборатории профессора Ф.Е. Хайтовича при помощи метода SAJR [22]. Гены были разбиты на сегменты, которые далее классифицируются двумя типами: константные(включаются или исключаются во всех транскриптах данного гена) и альтернативные (могут как остаться в зрелом транскрипте, так и быть вырезанными при процессинге). Альтернативные сегменты в свою очередь разделяются на четыре типа по типу АС: кассетные экзоны, имеющие альтернативные донорные/акцепторные сайты, и удержанные интроны. В данном исследовании использовались исключительно кассетные экзоны.Для каждого найденного сегмента был подсчитанPSI -частота включения экзона в транскрипты.Сегменты, меняющие АС во время развития, были найдены с использованием обобщенных линейных моделей с биномиальным распределением, частота включения моделировалась при помощи полинома третьей степени от логарифма возраста с момента зачатия. Частота включения считалась неопределенной, если количество прочтений относящихся к сегменту в данном образе было меньше 10. Для анализа в каждой ткани были отобраны только сегменты с частотой включения более чем в 60% образцов данной ткани и с хотя бы четырьмя образцами, в которых частота включения была больше 0.1 и меньше 0.9. После поправки Бенджамини-Хохберга были отобраны сегменты с корректированным p-value < 0.05. Для классификации направления изменения АС были использованы значения разницы минимального и максимального включения экзона dPSI и модель зависимости PSI от возраста, представляющая из себя кубический сплайн. На основании интерполяции PSI был подсчитаны изменения PSI между двумя соседними точками. С использованием полученных значений были подсчитаны четыре дополнительных статистики для идентификации направления изменения АС: up- сумма положительных измененийPSI между точками, down-абсолютнаясумма отрицательных изменений, up_timing- сумма положительных изменений помноженных на возраст значений, деленная на up и down_timing- аналогично для down. Сегменты с отношением up/(up+down) более 0.7 имеют тенденцию увеличивать включение экзонов с возрастом (паттерн “up”), а с отношением менее 0.3 - уменьшать (паттерн “down”). Экзоны с значениями соотношения в промежутке от 0.3 до 0.7 классифицировались в соответствии с максимальным значением up_timing или down_timing: при up_timing >down_timing сегменту присваивался паттерн “down-up”, в противном случае “up-down”.

В данной работе использовались данные кассетных экзоновмыши, содержащие значения PSI для каждого сегмента в каждом из семи органов (кора мозга, мозжечок, сердце, почки, печень, яички и яичники) на 10.5, 11.5, 12.5, 13.5, 14.5, 15.5, 16.5, 17.5, 18.5, 20, 23, 34, 48 и 83 дней после зачатия, для каждого сочетания орган-возраст было сделано от 1 до 2 биологических повторов для половых органов и от 3 до 5 - для остальных, в итоге в данных имеется 316 уникальных образцов. При этом данные для мозжечка и печени имеются не для всего периода наблюдений, но начиная с момента, когда орган достаточно дифференцирован для биопсии (13 и 11 дней с момента зачатия соответственно). Для каждого кассетного экзона было указано, прошел ли сегмент фильтрацию в данной ткани, происходит ли изменение PSI данного экзона в данной ткани (такие экзоны в дальнейшем обозначаются devAS) и, если происходит, то в каком направлении: повышение включения экзона “u” (up), понижение включения “d” (down), повышение до определенного возраста и дальнейшее снижение “ud” (up-down) и понижение с последующим повышением “du” (down-up).

2.2 Анализ АС в парах тканей

Для сравнения наборов devASмежду тканями использовался тест Фишера. Было проведено три анализа: во-первых, для каждой пары тканей было проверено как часто одни и те же сегменты проходят фильтрацию по покрытию в обоих тканей, в данном анализе использовались все имеющиеся сегменты. Во-вторых, для каждой пары тканей мы рассмотрели набор сегментов, прошедших фильтрацию в обоих тканях, и проверили насколько часто такие экзоны являются devASв обоих тканях. В-третьих, для каждого из четырех паттернов изменения PSI и для каждой пары тканей мы применили тест Фишера, чтобы выяснить насколько направления изменений АС совпадают между тканями. В последнем анализе использовались только сегменты, являющиеся devASв обеих тканях.

Для более точного сравнения изменения АС во времени использовался коэффициент корреляции Пирсона между средними значениями PSI экзона в конкретной ткани и момент времени. Это позволило найти не просто сегменты с одинаковым паттерном, но убедиться в синхронности изменения АС в динамике и найти наиболее похожие в этом пары тканей.

2.3 Анализ факторов сплайсинга

Данные белков, содержащих РНК-связывающие мотивы, были взяты из базы проекта CIS-BP-RNA [23]. В ней содержатся известные белки, способные связываться с РНК,с информацией о генах, в которых они кодируются и их последовательностями, а также мотивы РНК, которые они распознают. Эти белки включают в себяфакторы сплайсингаи могут влиять как на АС, так и на уровни экспрессии генов.

Мы использовали линейные модели (уровень экспрессии генов моделировался как полином третьей степени логарифма возраста с момента зачатия) для выделения генов с статистически значимым изменениям экспрессии на протяжении развития. Для оценки статистической значимости изменений экспрессии, предсказанных линейной моделью, использовался тест ANOVA с поправкой на множественное тестирование Бенджамини-Хохберга.

Программа FIMO [24]была использована для поиска мотивов около всех исследуемых экзонов, при этом поиск велся в последовательностях нуклеотидов в пределах 200 пар оснований от границы экзона. В качестве результатебыли получены идентификаторы найденных мотивов, его координаты в последовательности, нуклеотидная последовательность найденного совпадения, направление цепочки ДНК с мотивом и p- и q-value результата.Инструмент автоматически применяет поправку на множественное тестирование и контролирует falsediscoveryrate (FDR) с помощью подхода bootstrap, поэтому полученные значения p-valueдополнительно фильтровать не требуется.

Мотивы связывания факторов сплайсинга были кластеризованны по последовательностям. При этом каждый нуклеотид в последовательности переводился в числовой вид, а полученная таблица преобразовывалась при помощи метода главных компонент в двумерное пространство. Для кластеризации в данном исследовании использована библиотекаmclust [25].Для генов из каждого полученного кластера был проведен функциональный анализ в сравнении с всеми генамифакторов сплайсинга.

3. Результаты

3.1 Паттерны в парах тканей

Распределение кассетных экзонов с возрастными изменениями (devAS)по паттернам очень неравномерное и отличается для разных тканей (рис. 3.1). Абсолютное количество паттернов “u” и “d” всегда выше, чем “ud” и “du”. Больше всего devASнаблюдается в коре головного мозга и в семенниках.

Рис. 3.1. Количество кассетных экзоновс определенными паттернами изменения АС в тканях.

Схожесть наборов экзонов, прошедших фильтрацию по покрытию, существенно различается в парах тканей (рис. 3.2).

Рис. 3.2. Сравнение количества сегментов, прошедших фильтрацию по покрытию,в парах тканей. Над побочной диагональю приведены отношения шансов (тест Фишера), а в нижней половине графика значения абсолютного количества сегментов, прошедших фильтрацию по покрытиюв обеих тканях.

Количество экзонов, которые статистически значимо меняют АС в ходе развития в обоих органах, варьируется от 204 до 1363 с максимальным значением для пары кора мозга-мозжечок (рис. 3.3). Для всех пар тканей наблюдается статистически значимый избыток сегментов, являющихся devASв обоих тканях (Тест Фишера, p< 0.05). Однако даже на этом фоне в парах мозг-мозжечок и печень-почки наблюдается неожиданно большое количество общих изменений (отношение шансов > 20). Также высокое сходство (отношение шансов > 10) наблюдается для яичника-печени и яичника-почек.

Рис. 3.3. Сравнение devAS в парах тканей. Над побочной диагональю приведены отношения шансов (тест Фишера), в нижней половине графика показаны количества экзонов, являющихся devAS в обеих тканях.

Для большинства пар тканей наблюдалась статистически значимая согласованность направлений изменений PSI (Тест Фишера, p < 0.05, отношение шансов > 2), исключение составили только отдельные результаты для семенников и паттерн “ud” для пары печень-кора головного мозга (Рис. 3.4). Паттерны “du” и “ud”немногочисленны и имеют относительно низкую согласованность между тканями. Почти в любых парах тканей большинство экзонов чаще имеют одинаковые паттерны, чем можно ожидать при независимом их распределении. Например, если экзон показывал рост частоты включения экзона в процессе развития сердца, в большинстве случаев он также показывает рост в остальных тканях. Некоторым парам тканей, среди которых кора мозга-мозжечок, сердце-мозжечок и печень-почки, свойственны статистически значимые (тест Фишера, p-value < 0.05, отношение шансов > 50) синхронные изменения АСтолько для отдельных паттернов. Самым выраженным эффектом синхронного изменения АС является синхронное понижение частот включения экзона в печени и почках.

Рис. 3.4. Паттерны АС в парах тканей. В каждом блоке из четырех ячеек в левой части матрицы результатов слева-направо сверху-вниз значения “d”, “du”, “u”, “ud”, по другую сторону диагонали зеркально приведено абсолютное количество экзонов, которые соответствуют данному паттерну в обеих тканях.

3.2 Корреляционный анализ

Мы отобрали кассетные экзоны с достаточным уровнем покрытия и статистически значимыми возрастными изменениями хотя бы в одной ткани для каждой пары ткани. На рисунке 3.6 приведен пример распределения коэффициента корреляции для пары печень-почки для всех сегментов с АС. Большинство сегментов имеют корреляцию более 0.5 между тканями, а отрицательные значения корреляции встречаются существенно реже положительных.

Рис. 3.6. Распределение коэффициентов корреляции динамики АС между печенью и почками.

На данных сегментов с devASв обеих тканях самое высокое значение коэффициента корреляции Пирсона (рис. 3.7) ожидаемо относится к паре мозг-мозжечок, но также можно наблюдать высокие значения для пар почки-сердце, печень-почки, среди данных корреляции devAS экзонов в обеих тканях такжемозг-сердце и мозжечок-сердце. Относительно низкая корреляция экспрессии со другими тканями наблюдается в семенниках.

Рис. 3.7 Медианные значения коэффициента корреляции Пирсона на PSI для пар тканей.Над побочной диагональю приведены значения наэкзонах, являющихся devASв обеих тканях, а под побочной диагональю - devASкак минимум в одной.

3.3 GO enrichment анализ

Мы использовали функциональный анализ чтобы определить биологические функции генов, демонстрирующих согласованные изменения сплайсинга в нескольких тканях. В таблице 3.1 приведены10 категорий с максимальными значениями p-valueиз функционального анализа для пары печень-почки, где в качестве значимых генов используются гены с паттерном “d” в печени и почках, а в качестве фона были использованы все гены, имеющие данных паттерн хоть в одном органе из этой пары. Можно заметить две основные функциональные группы у полученных онтологий: одна отвечает за регуляцию сплайсинга, а вторая - за организацию нуклеосом и регуляцию мышечного сокращения. Альтернативному сплайсингу свойственна саморегуляция, поэтому помимо генов, сплайсинг в которых которых играет схожую роль в процессе развития печени и почек, мы находим гены, которые регулируют этот самый сплайсинг. При этом АС много в цитоскелете, которым богата мышечная ткань, поэтому биологическая роль генов из первой категории (GO:0006937) может быть связана с ошибочной аннотацией, сделанной на данных из мышечной ткани.

Таблица 3.1 Функции генов, которые чаще имеют синхронно меняющийся АС в печени и почках, по сравнению с функциями всехгенов с АС в печени или почках.

GO.ID

Term

p-value

GO:0006937

regulation of muscle contraction

0.0053

GO:0007044

cell-substrate junction assembly

0.0053

GO:0034332

adherens junction organization

0.0053

GO:0034728

nucleosome organization

0.0053

GO:0071824

protein-DNA complex sununit organization

0.0056

GO:0000380

alternative mRNA splicing via spliceosome

0.0057

GO:0048024

regulation of mRNA splicing

0.0057

GO:0048285

organelle fission

0.0058

GO:1903311

regulation of mRNA metabolic process

0.0058

GO:0000375

RNA splicing, via transesterification reactions

0.0097

3.4 Анализ роли белков с РНК-связывающими мотивами

Процент генов, статистически значимо меняющих экспрессию в процессе развития (F-тест, p-value < 0.05, поправка Бенджамини-Хохберга), выше среди генов, содержащих РНК-белок связывающие мотивы (критерий Манна-Уитни, р-value< 0.05), как видно в таблице 3.2.

Таблица 3.2 Количество генов с изменением экспрессии с возрастом в тканях.

Всего

Мозг

Мозжечок

Сердце

Печень

Почки

Яичники

Семенники

Гены, кодирующие белки с РНК-связывающими мотивами

358

295

242

281

303

261

159

215

% генов, меняющих экспрессию

82%

68%

78%

85%

73%

44%

60%

Все белок-кодирующие гены

21687

13953

11110

11587

14163

11428

7012

11910

% генов, меняющих экспрессию

64%

51%

53%

65%

53%

32%

55%

В результате поиска мотивов программой FIMO (match p-value < 1e-5) было отобрано 208 потенциальных мотивов в пределах 200 пар оснований от границ исследуемых экзонов. Один мотив мог быть найдет около нескольких АС экзонов в случае, если они находятся в одном гене на расстоянии менее 200 пар оснований. В этом случае мотив может регулировать АС как одного из экзонов, так и обоих.Экзоны, фланкирующие интроны которых содержат хотя бы один мотив,значительно чаще являются devASпо сравнению со всеми кассетными экзонами, прошедшими фильтрацию по покрытию (таблица 3.2), данный эффект статистически значим для всех (тест Фишера, р-value<3e-4) паттернов. Всего найдено было 17 уникальных мотивов, из них самые редкие (M345_0.6и M296_0.6) были найдены по 2 раза в разных генах, а самыми часто встречающимися оказались M328_0.6, M329_0.6 и M339_0.6, найденные 44, 42 и 42 раза в 37, 38 и 38 уникальных генах соответственно. Они все относятся к белку, кодируемому геном Elavl3 (Ensembl:ENSMUSG00000003410), функцией которого является процессинг РНК, при этом этот ген играет важную роль в эмбриональном развитии многоклеточного организма.

При использовании порога на match p-value в 1e-4 выло найдено 12708 белок-связывающих мотивов в фланкирующих последовательностях экзонов, из них 151 уникальные. Пять мотивов встретились более чем в 100 генах, это мотивы: M004_0.6 и M169_0.6 распознаются белком Hnrnpll (Ensembl:ENSMUSG00000024095), играющим роль в дифференциации иммунных клеток, M027_0.6 связывается белком Hnrnpl (ENSMUSG00000015165), регулирующим апоптоз в эмбриональных клетках, M049_0.6 -белком Rbm38 (ENSMUSG00000027510), принимающим участие в формировании сердца у эмбрионов мышей и препятствующий развитию опухолей и M157_0.6 соответствует белку Celf4 (ENSMUSG00000024268), регулирующему гены, отвечающие за функциональность нейронов. За исключением последнего гена все эти факторы находятся в белках, которые необходимы для нормального развития эмбриона.

Таблица 3.3 Средние значения количества АС сегментов.

Всего

Не меняет АС

Паттерн “u”

Паттерн “d”

Паттерн “du”

Паттерн “ud”

Все сегменты

66812

45903

2084

2025

274

594

Экзоны с найденными FIMO мотивами с p-value < 1e-5

208

84

66

37

6

9

Экзоны с найденными FIMO мотивами с p-value < 1e-4

12708

4818

4058

2224

441

392

Мы разбили мотивы связывания факторов сплайсинга, на кластеры(рис 3.8). Факторы сплайсинга, связывающие мотивы из одного кластера как правило вовлечены в специфические биологические функции.Например, кластер 5имеет лого практически полностью из тиминов и функциональный анализ показывает, что соответствующиегены в большинстве играют роль уже на этапе трансляции РНК. Судя по всему, это факторы трансляции, которые связаны с полиА хвостом зрелого транскрипта. При этом не удалось выделить кластер последовательностей, отвечающих за регуляцию АС или эмбрионального развития. Все последовательности с данными биологическими ролями разнятся и нет очевидной схожести в структурах управляющего мотива.

Рис. 3.8. Кластеризация мотивов по нуклеотиным последовательностям.

Выводы

Альтернативный сплайсинг одного и того же гена варьируется в зависимости от возраста и ткани, при этом наблюдаются высокая согласованность изменения сплайсинга разных тканях. Изменения гена в паре тканей в большинстве случаев имеют высокую корреляцию в динамике, исключение составляют только семенники и, в меньшей степени, кора головного мозга. При рассмотрении паттернов АС некоторые пары тканей также имеют более высокий уровень согласованности, как например мозг-мозжечок, сердце-мозжечок и печень-почки, в то время как у других тканей наблюдаетсяочень специфический сплайсинг, как например семенники, имеющие низкую согласованность АС(Тест Фишера, отношение шансов < 6) для каждого паттерна со всеми остальными тканями. В то же время паттерны “ud” и “du” менее многочисленны и всегда меньше согласованны для любых пар тканей по сравнению с “u” и “d”.Судя по всему, эти паттерны не имеют существенной роли для регуляции роста организма.

Чаще всего АС наблюдается в генах, отвечающих за процессинг РНК и сплайсинг, а также играет большую роль для нервной и мышечной тканей. Данные гены по-разному регулируют работу других генов в зависимости от собственной последовательности и часто меняют экспрессию с возрастом. Таким образом, при изменении АС в этих генах происходит изменение процессинга других транскриптов, что в свою очередь влияет на корректный рост ткани или дифференциацию клеток.

Экзоны, рядом с которыми расположены факторы сплайсинга, значительно чаще меняют АС с возрастом. Практически все гены, распознающие наиболее распространенные мотивы среди найденных, отвечают за эмбриональное развитие и дифференциацию различных типов клеток, а также поддержание функционирования определенного типа ткани и контроль патологий. Каждый из таких генов распознает мотивы, расположенные в нуклеотидных последовательностяхболее сотни других генов, в результате чего регулирует их АС. Таким образом осуществляется дополнительный уровень регуляции белков, различающихся у эмбриона и взрослой особи. Согласно сведениям NCBI, мыши с искусственным удалением любого из них (geneknockout, KO) имели нарушения развития глобально или в пределах одного органа, что также подтверждает важную роль своевременного изменения АС в эмбрионе.

Заключение

Альтернативный сплайсинг выполняет в числе прочих регуляторную роль для развития организма, возрастные изменения АС различаются в тканях. При этом экспрессия одних и тех же генов в тканях не свидетельствует о схожести в изменении АС, большим количеством изменения АС в одних генах выделяются пары тканей кора-мозжечок и печень-почки. Пара печень-почки также выделяется по сравнению с остальными парами большим количеством синхронного снижения включения экзонов в транскрипты. Гены, которые содержат исключаемые экзоны, среди прочего ответственны за регуляцию АС, что свидетельствует о саморегуляции процесса. Несмотря на наличие ткань-специфичного АС, в большинстве тканей изменение включения экзонов с возрастом происходит очень схожим образом, о чем свидетельствуют медианные значения корреляций АС в одних генах в разных тканях.

Факторы сплайсинга являются ключевыми в регуляции сплайсинга, для анализа их ткань-специфичной роли были использованы гены, содержащие РНК-взаимодействующие мотивы. Такие мотивы в большинстве содержатся в белок-кодирующих генах, которые меняют экспрессию с возрастом. При этом экзоны, рядом с которыми находятся мотивы связывания белков, чаще других меняют АС в процессе развития и в среднем чаще экспрессируются. Выделить общие для регулирующих АС мотивов нуклеотидные последовательности не удалось.

Изменение АС в процессе эмбрионального развития имеет регуляторную роль и влияет на множество других генов и процессов. Данная работа не ставила целью анализ последствий нарушения сплайсинга в регулирующих процессинг генах, но потенциально такой анализ может выявить причины некоторых заболеваний. Сейчас доказана роль нарушения сплайсинга в множестве патологий, но исследования проводятся в основном на взрослых особях и не учитывают отклонения сплайсинга, которые происходили на ранних стадиях развития. Возможно, анализ ранних изменений сплайсинга позволит найти причины генетических патологий, которые на данный момент не имеют объяснения. Исследования в этом направлении представляют собой перспективное направление для дальнейшего применения в диагностике и генетической терапии.

Список литературы

1.Crick F. Central dogma of molecular biology // Nature. 1970.

2.Daguenet E., Dujardin G., Valcбrcel J. The pathogenicity of splicing defects: mechanistic insights into pre? mRNA processing inform novel therapeutic approaches // EMBO Rep. EMBO, 2015. Vol. 16, № 12. P. 1640-1655.

3.Scotti M.M., Swanson M.S. RNA mis-splicing in disease // Nature Reviews Genetics. 2016.

4.Schafer S. et al. Alternative Splicing Signatures in RNA-seq Data: Percent Spliced in (PSI) // Curr. Protoc. Hum. Genet. 2015.

5.Xiong H.Y. et al. The human splicing code reveals new insights into the genetic determinants of disease // Science (80-. ). 2015.

6.Wang J. et al. SpliceDisease database: Linking RNA splicing and disease // Nucleic Acids Res. 2012.

7.Penrod N.M., Cowper-Sal-Lari R., Moore J.H. Systems genetics for drug target discovery // Trends in Pharmacological Sciences. 2011.

8.Xiao X. et al. Multi-tissue Analysis of Co-expression Networks by Higher-Order Generalized Singular Value Decomposition Identifies Functionally Coherent Transcriptional Modules // PLoS Genet. 2014.

9.Yang Y. et al. Gene co-expression network analysis reveals common system-level properties of prognostic genes across cancer types // Nat. Commun. 2014.

10.Saha A. et al. Co-expression networks reveal the tissue-specific regulation of transcription and splicing // Co-expression networks Reveal tissue-specific Regul. Transcr. splicing. 2016.

11.Ward A.J., Cooper T.A. The pathobiology of splicing // Journal of Pathology. 2010.

12.DeBoever C. et al. Transcriptome Sequencing Reveals Potential Mechanism of Cryptic 3' Splice Site Selection in SF3B1-mutated Cancers // PLoS Comput. Biol. 2015.

13.Li Y.I. et al. RNA splicing is a primary link between genetic variation and disease // Science (80-. ). 2016.

14.Mallo M., Alonso C.R. The regulation of Hox gene expression during animal development // Development (Cambridge). 2013. Vol. 140, № 19.

15.Bomze H.M., Lopez A.J. Evolutionary conservation of the structure and expression of alternatively spliced Ultrabithorax isoforms from Drosophila // Genetics. 1994.

16.Valsecchi C.I.K. et al. Facultative dosage compensation of developmental genes on autosomes in Drosophila and mouse embryonic stem cells // Nat. Commun. 2018.

17.Alexa, A; Rahnenfuhrer J. topGO: Enrichment Analysis for Gene Ontology. R package version 2.37.0. [Electronic resource] // Rahnenfuhrer. 2019.

18.Ihaka R., Gentleman R. R: A Language for Data Analysis and Graphics // J. Comput. Graph. Stat. 1996.

19.Xing Y. et al. MiasDB: A database of molecular interactions associated with alternative splicing of human pre-mRNAs // PLoS One. 2016.

20.Giulietti M. et al. SpliceAid-F: A database of human splicing factors and their RNA-binding sites // Nucleic Acids Res. 2013.

21.Cardoso-Moreira M. et al. Gene expression across mammalian organ development // Nature. 2019.

22.Mazin P. et al. Widespread splicing changes in human brain development and aging // Mol. Syst. Biol. 2013.

23.Ray D. et al. A compendium of RNA-binding motifs for decoding gene regulation // Nature. 2013.

24.Grant C.E., Bailey T.L., Noble W.S. FIMO: Scanning for occurrences of a given motif // Bioinformatics. 2011.

25.Scrucca L. et al. Mclust 5: Clustering, classification and density estimation using Gaussian finite mixture models // R J. 2016.

Размещено на Allbest.ru

...

Подобные документы

  • Процессинг молекул первичных РНК в ядре клеток человека. Канонический и альтернативный сплайсинг, его механизм и значение в жизнедеятельности организма, взаимосвязь и оценка пластичности. Основные факторы сплайсинга: разнообразие, строение и функции.

    курсовая работа [513,7 K], добавлен 11.05.2015

  • Созревание информационной РНК. Сплайсосомные интроны. Альтернативный сплайсинг. Сборка сплайсосомы. Структура интеинов. Современные представления о механизме белкового сплайсинга. Эндонуклеазная активность интеинов. Использование интеинов в биотехнологии.

    реферат [1,1 M], добавлен 04.02.2009

  • Белки - основные структурные элементы клеток и тканей организма. Процессы распада и синтеза белков в ходе тканевого метаболизма. Цикл сложных химических превращений белковых веществ. Процесс переваривания и всасывания белков. Регуляция белкового обмена.

    реферат [396,3 K], добавлен 30.01.2011

  • Цели приспособления организма к изменившимся условиям существования. Быстрая гомеостатическая регуляция физиологических функций, состава и свойств внутренней среды организма. Функция симпатико-адреналовой системы и источники энергии катехоламины.

    реферат [144,4 K], добавлен 20.09.2009

  • Регуляция на этапе биосинтеза и сборки компонентов аппарата трансляции и на этапе его функционирования. Регуляция круговорота белков путем избирательного протеолиза. Регуляция активности белковых посредников нековалентным взаимодействием с эффекторами.

    реферат [20,1 K], добавлен 26.07.2009

  • Регуляция метаболизма как управление скоростью биохимических процессов. Регуляция биосинтеза белков и особенности процесса репликации. Транскрипция генетической информации, механизм катаболитной репрессии, регуляция на этапе терминации транскрипции.

    контрольная работа [816,0 K], добавлен 26.07.2009

  • Особенности строения, физиологии и химического состава клетки. Типы и свойства тканей. Характеристика системы органов - частей организма, имеющих только их свойственные форму и строение и выполняющих определенную функцию. Регуляция функций в организме.

    реферат [21,9 K], добавлен 03.07.2010

  • Единство и отличительные особенности нервных и гуморальных регуляций. Механизмы гуморальной регуляции в организме. Особенности строения и свойства клеточных мембран, функции и механизм их реализации. Диффузия и транспорт веществ через клеточные мембраны.

    курсовая работа [195,5 K], добавлен 09.01.2011

  • Характеристика стадий эмбрионального развития. Изменения в центральной нервной системе. Предзиготный период, зигота, дробление, гаструляция, гисто-, органогенез. Процесс оплодотворения, зародышевые оболочки. Взаимоотношение материнского организма и плода.

    курсовая работа [38,9 K], добавлен 08.10.2012

  • Гипотеза взаимодействия электрических токов и полей внутри организма. Предположения и фактические результаты исследований, направленных на исследование роли электрических взаимодействий и биохимических процессов в регуляции функций живого организма.

    монография [959,8 K], добавлен 30.05.2010

  • Классификация процессов метаболизма и обмена. Виды организмов по различиям обменных процессов, методы их изучения. Метод учета веществ поступивших и выделившихся из организма на примере азотистого обмена. Основные функции и источники белков для организма.

    презентация [3,8 M], добавлен 12.01.2014

  • Понятие и сущность онтогенеза организмов, его основные этапы: предзародышевое развитие, эмбриогенез, метаморфоз, рост, физиологическая и репаративная регенерация, старение. Система органов живого организма на примере человека. Механизм регуляции.

    реферат [28,7 K], добавлен 26.08.2011

  • Теоретический анализ оплодотворения у животных (внешнее и внутреннее), у растений (простое и двойное). Характеристика основных этапов эмбрионального и постэмбрионального развития. Отличительные черты непрямого развития с неполным и полным метаморфозом.

    презентация [856,9 K], добавлен 19.05.2010

  • Характеристика прямого и непрямого развития. Описание этапов эмбрионального периода развития человека, периоды постэмбрионального развития у людей и животных. Регенерация. Особенности вредного влияния алкоголя и курения на развитие организма человека.

    реферат [317,1 K], добавлен 07.06.2010

  • Каталитическая активность молекул нуклеиновой кислоты РНК, функции фермента. Процесс созревания мРНК и тРНК. Понятие и разновидности сплайсинга малых ядерных РНК, роль и свойства мяРНК. Механизм регуляции активности генов и клеточной дифференцировки.

    курсовая работа [4,4 M], добавлен 09.06.2011

  • Обмен сложных белков. Переваривание, всасывание и промежуточный обмен липидов. Жирорастворимые и водорастворимые витамины. Регуляция обмена углеводов. Теплообмен и регуляция температуры тела. Регуляция липидного обмена. Роль печени в обмене веществ.

    презентация [10,2 M], добавлен 05.04.2014

  • Понятие и значение регуляции как направленного изменения интенсивности работы клеток, тканей, органов для достижения результата и удовлетворения потребностей организма. Типы регуляции и саморегуляции, а также системы, отвечающие за данные процессы.

    презентация [31,4 K], добавлен 15.02.2014

  • Генетический аппарат прокариот и эукариот. Понятие делеции. Сплайсинг как один из этапов образования функционально активных молекул РНК из их предшественников, осуществляемый после завершения транскрипции. Механизм удаления интронов и соединения экзонов.

    контрольная работа [64,4 K], добавлен 20.02.2015

  • Общая характеристика нервной системы. Рефлекторная регуляция деятельности органов, систем и организма. Физиологические роли частных образований центральной нервной системы. Деятельность периферического соматического и вегетативного отдела нервной системы.

    курсовая работа [1,6 M], добавлен 26.08.2009

  • Потребность организма в кислороде при покое и работе. Приспосабливаемость частоты и глубины дыхания к изменяющимся условиям. Реакции на изменения концентрации в крови углекислоты и кислорода. Локализация и функциональные свойства дыхательных нейронов.

    реферат [21,7 K], добавлен 05.06.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.