Розробка та застосування методів in silico для визначення сайтів зв’язування транскрипційних факторів у еукаріот на прикладі ISGF-3

Дослідження та аналіз особливостей модифікації методу філогенетичного футпринтингу для відбору еволюційно-консервативних сайтів зв’язування транскрипційних факторів у еукаріот. Визначення та характеристика можливості пошуку у масштабі всього геному.

Рубрика Биология и естествознание
Вид автореферат
Язык украинский
Дата добавления 27.07.2015
Размер файла 108,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Ключові слова: інтерферон альфа, сайт зв'язування транскрипційного фактора, ISRE, ISGF-3, позиційно-вагова матриця, приховані моделі Маркова.

Summary

Tokovenko B. T. Design and implementation of the in silico methods to identify eukaryotic transcription factor binding sites: ISGF-3 case study. - Manuscript.

Thesis for a Philosophy Doctor (PhD) degree in Biology, speciality 03.00.03 - molecular biology. - Institute of Molecular Biology and Genetics of National Academy of Sciences of Ukraine, Kyiv, 2010.

Thesis focuses on identifying genes of primary response to interferon alpha (IFNб) with bioinformatics methods, as well as developing improved methods and tools for the computational identification of transcription factor binding sites (TFBS).

Initial application of the TFBS search method based on position weight matrices (PWM) for the identification of the interferon-stimulated response element (ISRE), which is specifically bound by interferon-stimulated genes factor 3 (ISGF-3), in the Rattus norvegicus genome proved that it is possible to obtain meaningful results (or, at the very least, results matching expectations built on prior knowledge). However, high percentage of false-positive results significantly hinders results analysis: with a 0.8 similarity score threshold of the M00258 matrix from the TRANSFAC 7.0 Public database a total of 5214 ISRE-like sequences were found in 4571 promoters; 768 of the genes (16.8%) made it through the next step of a custom phylogenetic footprinting filtering (i.e. they had ISREs with conservative positions relative to the transcription start sites of the orthologous genes in both R. norvegicus and Mus musculus). Analysis of the list of genes using Gene Ontology (GO) indicated enrichment of the categories belonging to the known IFNб target systems: humoral immune response, response to virus, positive regulation of B cells differentiation, and others. Unexpectedly, the nervous system development category, which is not a known target of IFNб, was also found on the list of enriched categories.

In order to improve specificity of the TFBS search a new method based on hidden Markov models (HMMs) was developed. While PWM-based search methods assume that neighboring nucleotide frequencies are fully independent of each other, the new HMM-based method allows preserving these dependencies. After training the HMM-based model on the known nucleotide sequences of the specific TFBS, new method allows searching for similar sites with no assumptions on the independence of each binding site position. In order to simplify the use of the new method, an automatic similarity score threshold estimation procedure was developed, which attempts to estimate optimal threshold value for each set of provided known TFBS sequences.

Comparison of the methods based on PWM and HMM while searching for ISRE in the 2nd and 3rd exons of the protein-coding genes of R. norvegicus (where one would expect close to zero functional ISREs) revealed a significant difference in the frequency distribution of the similarity scores. While for the PWM-based method similarity scores were normally distributed with arithmetic mean 0.3, the HMM-based method produced a logarithmic distribution with л = 0.16. Thus, in accordance with initial expectations, the HMM-based TFBS search method has higher search specificity, than PWM-based methods.

Using the new HMM-based method, own implementation of the classical PWM-based method, and a custom implementation of phylogenetic footprinting method (based on the comparison of the orthologous genes' promoters), a free-to-use online tool called COTRASIF (conservation-aided transcription factor binding site finder) was developed. The new tool features ease of use and 20 eukaryotic promoter collections, which are regularly updated from the primary Ensembl database of genome annotations with the help of the custom-built automatic promoters import pipeline. Gene orthology information is also regularly updated from Ensembl database. Automatic updates ensure that COTRASIF will stay up-to-date for a longer period of time. TFBS matrices from both JASPAR and TRANSFAC databases are also integrated for the ease of use. Based on requests from COTRASIF users, a standalone version for Linux (32/64-bit) was made available on the COTRASIF website.

For IFNб, the dominating Jak-STAT signal transduction pathway is well-studied. It is known that ISGF-3 is the final activated factor, which specifically binds with ISREs in the promoters of target genes. Thus, identification of the ISGF-3 binding sites should help identify the genes of primary response to IFNб.

We performed a search for ISREs with the HMM-based method in the promoters of R. norvegicus and M. musculus genes obtained from Ensembl version 52. We found 743 putative ISREs in 707 R. norvegicus genes of putative primary response to IFNб. Phylogenetic footprinting reduced the list to 162 genes with evolutionary-conserved ISREs.

Gene list GO analysis with FatiGO identified a single significantly enriched (p=1,23•10-4, corrected p=8,52•10-3) category immune response (GO:0006955) with 9 genes in it. Out of 9 genes, 5 are known IFNб targets, 2 have M. musculus orthologs with experimental evidence of their regulation by IFNб, and for 2 genes (Cxcl4, Mbl1) no data on the correlation of their expression with IFNб stimulation was found.

Thorough comparison of the 162 genes with literature data revealed that for 61 genes there are already (both direct and indirect) experimental indications of their regulation by IFNб. For the remaining 101 genes no evidence of IFNб regulation was found. GO analysis of the 101 genes identified a single enriched category synapse component, containing 3 genes: Pick1 (PRKCA-binding protein), Grin3a (NMDA receptor subunit 3A), and Gabra2 (GABAA receptor subunit alpha-2). Confirmation of their regulation by IFNб will indicate the discovery of a new function of IFNб, namely regulation of the stimulating synapses functions, axon growth, and synaptogenesis. It is well-known that IFNб treatment of some viral infections and cancer types results in side-effects, including headaches, depression etc. Our results for the first time point at likely nervous system gene targets of IFNб, and enable further molecular studies of the new IFNб effects.

In conclusion, the new HMM-based search method, the COTRASIF tool, TFBS search results prospectivity criteria, and GO analysis revealed 24 novel putative targets of IFNб regulation.

Keywords: interferon alpha, transcription factor binding site, ISRE, ISGF-3, position-weight matrix, hidden Markov models.

Аннотация

Токовенко Б.Т. Разработка и применение методов in silico для определения сайтов связывания факторов транскрипции у эукариот на примере ISGF-3. - Рукопись.

Диссертация на соискание ученой степени кандидата биологических наук по специальности 03.00.03 - молекулярная биология. - Институт молекулярной биологии и генетики НАН Украины, Киев, 2010.

Разработан улучшенный метод поиска сайтов связывания факторов транскрипции (ССФТ) на основе скрытых моделей Маркова. Показано, что разработанный метод обеспечивает более высокую специфичность поиска ССФТ по сравнению с методом на основе позиционно-весовых матриц. Разработан общедоступный, бесплатный, простой в использовании онлайн-инструмент COTRASIF для нахождения в промоторах генов эукариот ССФТ в масштабах геномов. С помощью инструмента COTRASIF впервые обнаружено 162 гена первичного ответа на действие интерферона альфа (ИФНб). Установлено, что для 61 гена первичного ответа на ИФНб уже есть экспериментальные данные, которые указывают на их регуляцию ИФНб. Впервые показано, что ряд генов (Pick1, Grin3a, Gabra2), которые отвечают за развитие и функционирование нервной системы, также могут регулироваться ИФНб. Разработана система оценки перспективности результатов поиска ССФТ, которая использует 3 критерия. Определены 24 гена-кандидата первичного ответа на ИФНб для их первоочередной экспериментальной проверки.

Ключевые слова: интерферон альфа, сайт связывания фактора транскрипции, ISRE, ISGF-3, позиционно-весовая матрица, скрытые модели Маркова.

Размещено на Allbest.ru

...

Подобные документы

  • Закон Гомологічних рядів Вавілова. Сутність спадкової мінливості. Характер зміни генотипу. Генні, хромосомні та геномні мутації. Копіювання помилок в генетичному матеріалі. Аналіз мозаїчної структури еукаріот. Вивчення факторів, що викликають мутації.

    презентация [38,5 M], добавлен 06.12.2012

  • Хімічний склад вірусів, їх стійкість до навколишнього середовища. Класифікація вірусів, їх репродукція, проникнення в клітину. Реалізація генетичної інформації у вірусів. Збірка вірусних частинок, їх вихід з клітин. Групи вірусів, що викликають інфекції.

    курсовая работа [2,2 M], добавлен 10.12.2012

  • Вивчення геному людини в рамках міжнародної програми "Геном людини". Особливості гібридизації клітин у культурі, картування внутрішньо хромосомного і картування за допомогою ДНК-зондів. Можливості використання знань про структуру геному людини в медицині.

    курсовая работа [354,6 K], добавлен 21.09.2010

  • Дослідження біологічних особливостей представників класу "Двостулкові молюски", визначення їх значення в природі, житті людини. Характеристика морфологічних, фізіологічних та екологічних особливостей двостулкових молюсків. Особливості систематики класу.

    курсовая работа [5,6 M], добавлен 21.09.2010

  • Характеристика ґрунту як середовища проживання мікроорганізмів. Дослідження методів визначення складу мікроорганізмів. Аналіз їх ролі у формуванні ґрунтів та їх родючості. Біологічний кругообіг в ґрунті. Механізм дії мінеральних добрив на мікрофлору.

    реферат [96,7 K], добавлен 18.12.2014

  • Зовнішня будова тіла колорадського жука, особливості його внутрішньої будови, розмноження та розповсюдження. Визначення систематичного положення листоїдів, біологічні особливості розвитку виду. Вплив екологічних факторів на розвиток і розмноження комах.

    курсовая работа [214,3 K], добавлен 26.03.2019

  • Дослідження морфологічних та екологічних особливостей, фармакологічного застосування пеларгонії. Вивчення способів розмноження, вирощування та догляду за рослиною. Характеристика хвороб та шкідників квітки, методів лікування, використання в озелененні.

    дипломная работа [1,5 M], добавлен 29.11.2011

  • Характеристика шкідників і збудників захворювань рослин та їх біології. Дослідження основних факторів патогенності та стійкості. Аналіз взаємозв’язку організмів у біоценозі. Природна регуляція чисельності шкідливих організмів. Вивчення хвороб рослин.

    реферат [19,4 K], добавлен 25.10.2013

  • Загальнобіологічна здатність організмів у процесі онтогенезу набувати нових ознак. Роль генетичних і середовищних факторів у проявах спадкової і неспадкової (фенотипової) мінливості. Епігенетика, модифікації, фенокопії, морфози; класифікація мутацій.

    презентация [2,1 M], добавлен 04.01.2015

  • Сутність та завдання генної інженерії. Використання ферментів рестрикції у методі рекомбінантних ДНК. Механізми клонування генів і трансформації еукаріот. Методи гібридизації соматичних клітин. Структура та функції гена. Протиріччя критеріїв алелізму.

    презентация [3,1 M], добавлен 04.10.2013

  • Зміст та головні етапи процесу формування ґрунту, визначення факторів, що на нього впливають. Зелені рослини як основне джерело органічних речовин, показники їх біологічної продуктивності. Вплив кореневої системи на структуроутворення ґрунтової маси.

    реферат [20,8 K], добавлен 11.05.2014

  • Об'єкти і методи онтогенетики. Загальні закономірності і стадії індивідуального розвитку. Генетична детермінація і диференціація клітин. Диференційна активність генів і її регуляція в процесі розвитку. Летальна диференціація клітин за розвитку еукаріотів.

    презентация [631,0 K], добавлен 04.10.2013

  • Загальна характеристика та особливості природної флори ксерофітів. Відмінні властивості та розмноження штучно створеної ксенофітної флори. Опис найбільш поширених видів штучної ксерофітної флори, визначення факторів, що впливають на її розвиток.

    курсовая работа [27,3 K], добавлен 21.09.2010

  • Структура дезоксирибонуклеїнової та рібонуклеїнової кислоти. Здатність молекул ДНК самовідтворюватися. Хромосоми еукаріот. Мітоз - основний спосіб розмноження еукаріотичних клітин. Стадії мейотичного ділення. Роль ядра в спадковості, генетичний код.

    реферат [1,9 M], добавлен 02.06.2011

  • Поняття і рівні регуляції експресії генів. Їх склад і будова, механізм формування і трансформування. Транскрипційний рівень регуляції. Приклад індукції і репресії. Регуляція експресії генів прокаріот, будова оперону. Огляд цього процесу у еукаріот.

    презентация [1,7 M], добавлен 28.12.2013

  • Історія дослідження фауни прісноводних молюсків Волині. Географічна характеристика району дослідження. Систематика прісноводних двостулкових молюсків. Вплив факторів зовнішнього середовища на поширення та екологічні особливості прісноводних молюсків.

    курсовая работа [87,7 K], добавлен 16.01.2013

  • Хромосомна теорія спадковості. Кросинговер та конверсія генів. Хромосомні типи визначення статі. Експериментальне дослідження особливостей успадкування мутацій "white" та "cut" (відповідно "білі очі" та "зрізані крила") у Drosophila melanogaster.

    дипломная работа [1,3 M], добавлен 30.11.2014

  • Історія відкриття та основні гіпотези походження клітинного ядра. Типи клітин та їх схематичне зображення. Форми, типи, будова, компоненти (хроматин, ядерце) ядра еукаріоти, його функції та загальна роль. Ядерний білковий скелет: каріоплазма та матрикс.

    презентация [1,1 M], добавлен 30.03.2014

  • Дослідження класифікації і розвитку павуків у ході еволюції. Аналіз особливостей зовнішньої та внутрішньої будови, органів чуттів. Характеристика механізму харчування і розмноження. Способи життя і значення павуків, застосування павутини в промисловості.

    курсовая работа [6,8 M], добавлен 16.01.2013

  • Аналіз морфо-біологічних особливостей комах-запилювачів, визначення їх різноманітності. Пристосування ентомофільних рослин і комах до запилення. Характеристика комах-запилювачів з ряду Перетинчастокрилих. Роль представників інших рядів в запиленні рослин.

    курсовая работа [3,1 M], добавлен 21.09.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.