Розробка та застосування методів in silico для визначення сайтів зв’язування транскрипційних факторів у еукаріот на прикладі ISGF-3
Дослідження та аналіз особливостей модифікації методу філогенетичного футпринтингу для відбору еволюційно-консервативних сайтів зв’язування транскрипційних факторів у еукаріот. Визначення та характеристика можливості пошуку у масштабі всього геному.
Рубрика | Биология и естествознание |
Вид | автореферат |
Язык | украинский |
Дата добавления | 27.07.2015 |
Размер файла | 108,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
НАЦІОНАЛЬНА АКАДЕМІЯ НАУК УКРАЇНИ
ІНСТИТУТ МОЛЕКУЛЯРНОЇ БІОЛОГІЇ І ГЕНЕТИКИ
УДК 577.218
Автореферат дисертації на здобуття наукового ступеня кандидата біологічних наук
Розробка та застосування методів in silico для визначення сайтів зв'язування транскрипційних факторів у еукаріот на прикладі ISGF-3
03.00.03 - молекулярна біологія
Токовенко Богдан Тарасович
Київ - 2010
Дисертацією є рукопис.
Роботу виконано у лабораторії системної біології відділу механізмів трансляції генетичної інформації Інституту молекулярної біології і генетики НАН України.
Науковий керівник:доктор біологічних наук, старший науковий співробітник Оболенська Марія Юріївна, Інститут молекулярної біології і генетики НАН України, завідувач лабораторії системної біології відділу механізмів трансляції генетичної інформації.
Офіційні опоненти:
доктор біологічних наук, професор, член-кореспондент НАН України Кавсан Вадим Мусійович, Інститут молекулярної біології і генетики НАН України, завідувач відділу біосинтезу нуклеїнових кислот;
кандидат біологічних наук, старший науковий співробітник Карпов Павло Андрійович, Інститут харчової біотехнології та геноміки НАН України, завідувач лабораторії біоінформатики та структурної біології.
Захист відбудеться 23 березня 2010 р. о 10:00 на засіданні спеціалізованої вченої ради Д 26.237.01 Інституту молекулярної біології і генетики НАН України за адресою: 03680, Київ, вул. Академіка Заболотного, 150.
З дисертацією можна ознайомитися в бібліотеці Інституту молекулярної біології і генетики НАН України за адресою: 03680, Київ, вул. Академіка Заболотного, 150.
Автореферат розіслано 22 лютого 2010 року.
Вчений секретар спеціалізованої вченої ради, кандидат біологічних наук І. В. Крупська.
Загальна характеристика роботи
Актуальність теми. Інтерферон альфа (ІФНб) - це цитокін, відомий своєю антивірусною, антипроліферативною та імуномодулюючою дією (Pestka et al., 1987; Pestka et al., 2004). Його використовують як основний або допоміжний лікувальний засіб у терапії вірусних інфекцій та деяких видів раку. Проте про фізіологічні ефекти та механізми дії ІФНб за відсутності вірусної інфекції відомо дуже мало, тому не можна передбачити реакцію кожного пацієнта на лікування інтерфероном, а також резистентність та розвиток побічних ефектів - від головного болю та безсоння до лихоманки та сильного больового синдрому (Lindsay et al., 1996).
Помітним кроком у розумінні механізмів дії інтерферону та прогнозуванні його ефектів при лікуванні стане реконструкція мережі генної регуляції, що активується інтерфероном. Необхідним етапом моделювання мережі генної регуляції є визначення генів-мішеней, які першими змінюють рівень експресії у відповідь на зв'язування інтерферону з його рецептором. Для ІФНб, який зв'язався з рецептором, відомий домінуючий шлях передачі сигналу, а саме Jak-STAT каскад, кінцевим результатом якого є активація транскрипційного фактора інтерферон-стимульованих генів 3 (ISGF-3), який специфічно зв'язується із стимульованим ІФНб елементом відповіді (ISRE) (Horvath, 2004). Таким чином, пошук ISRE дозволить знайти ймовірні гени первинної відповіді на дію ІФНб. Автор із колегами вирішили використати (та розвинути в процесі застосування) методи біоінформатики для вирішення цього завдання.
Перші спроби використання нуклеотидних геномних послідовностей для виявлення ймовірних сайтів зв'язування транскрипційних факторів (СЗТФ) полягали у пошуку консенсусних послідовностей; цей підхід і зараз є найпоширенішим, в першу чергу - завдяки своїй простоті. Єдиним якісним стрибком було введення та розвиток на початку 1990-х складнішої та точнішої моделі сайтів зв'язування на основі врахування частот кожного із чотирьох нуклеотидів - так званої матричної моделі (Stormo et al., 1989). З того часу галузь виявлення коротких нерівномірно-консервативних нуклеотидних послідовностей еволюціонувала дуже повільно, незважаючи на ріст кількості секвенованих геномів у 1990-х роках.
Актуальність теми зумовлена не лише великою кількістю доступних для аналізу повних геномів (683 геноми еукаріот у базі даних проекту diArk) (Odronitz et al., 2007), але і бурхливим розвитком системної біології, яка потребує швидких та якісних методів аналізу великих обсягів геномної інформації з метою вивчення регуляторних схем, характерних досліджуваному геному.
Існуючі інструменти для пошуку СЗТФ мають дві основні проблеми: велику кількість невірно-позитивних результатів, та складність використання непідготовленими користувачами. Завдяки застосуванню вдосконалених методів пошуку СЗТФ можна зменшити кількість невірно-позитивних результатів, що також робить можливою часткову реконструкцію генних регуляторних мереж винятково на основі геномної інформації. Представлена робота закладає фундамент для моделювання мережі генної регуляції, що активується ІФНб, на основі геномної інформації та за допомогою потужних і простих у використанні методів, розроблених у цій роботі.
Зв'язок роботи з науковими програмами, планами, темами. Дисертація відповідає основному плану науково-дослідних робіт відділу механізмів трансляції генетичної інформації Інституту молекулярної біології і генетики НАН України та виконана в рамках бюджетної теми № 2.2.4.9 - “Особливості функціонування та множинність форм фактора елонгації трансляції 1 вищих еукаріотів” (номер державної реєстрації - 0105V005340, 2006-2010 рр.). Дослідження також було підтримано грантом № 4381 Українського Науково-Технологічного Центру (УНТЦ) за темою “Новітні технології у вивченні функціональної активності інтерферону альфа” (2007-2009 рр.) та короткостроковим грантом ЮНЕСКО (2006 р.).
Мета та завдання дослідження. Мета дослідження - розробка універсального обчислювального методу пошуку СЗТФ і визначення за його допомогою генів первинної відповіді на ISGF-3, який активується внаслідок зв'язування ІФНб з рецептором, і забезпечує домінуючий інтерферон-специфічний шлях передачі сигналу від активованого рецептора.
Відповідно до мети було поставлено такі завдання:
1) визначити придатність існуючих методів in silico для пошуку ISRE у промоторах генів Rattus norvegicus;
2) вдосконалити існуючі методи пошуку СЗТФ у промоторах еукаріот;
3) розробити загальнодоступний, безкоштовний, простий у використанні онлайн-інструмент для пошуку СЗТФ;
4) застосувати розроблений інструмент для визначення ймовірних генів первинної відповіді на ІФНб;
5) використати ефективний алгоритм для порівняння списку визначених ймовірних генів-мішеней ІФНб із переліком генів, для яких існують експериментальні підтвердження кореляції їхньої експресії зі стимуляцією ІФНб;
6) розробити критерії перспективності знайдених генів первинної відповіді на ІФНб.
Об'єкт дослідження: зв'язування транскрипційних факторів зі специфічними сайтами в промоторах генів; регуляція транскрипції генів R. norvegicus під впливом ІФНб.
Предмет дослідження: методи пошуку СЗТФ; геноми R. norvegicus та Mus musculus із бази даних Ensembl (www.ensembl.org), версії з 40 по 54 включно; розробка та застосування нового методу пошуку СЗТФ та інструменту на його основі; ймовірні гени первинної відповіді на ІФНб.
Методи дослідження: для пошуку СЗТФ використано власну реалізацію методу на основі позиційно-вагових матриць (ПВМ) та метод на основі прихованих моделей Маркова (ПММ) власної розробки; для відсіювання невірно-позитивних результатів застосовано власну модифікацію методу філогенетичного футпринтингу; аналіз на збагачення категорій Онтології Генів (ОГ) виконано за допомогою інструментів на основі гіпергеометричного тесту, точного тесту Фішера та Баєсового тесту.
Наукова новизна одержаних результатів. Розроблено вдосконалену модель СЗТФ на основі ПММ, яка враховує не лише позиційну частоту нуклеотидів, але і залежності вищого порядку, а саме консервативні пари (триплети, тощо) сусідніх нуклеотидів.
Запропоновано власну модифікацію методу філогенетичного футпринтингу для відбору еволюційно-консервативних СЗТФ, що дозволило зменшити кількість помилок першого типу (невірно-позитивних) без зростання помилок другого типу (невірно-негативних) під час пошуку СЗТФ.
Вперше розроблено загальнодоступний онлайн-інструмент для пошуку СЗТФ у промоторах генів еукаріот у масштабі всього геному із використанням як методу на основі ПВМ, так і методу на основі ПММ. Новизна онлайн-інструменту визначається як застосуванням вдосконаленої моделі СЗТФ власної розробки, так і використанням власної (швидшої та простішої у застосуванні) модифікації методу філогенетичного футпринтингу. Можливість пошуку у масштабі всього геному також вирізняє розроблений інструмент серед подібних.
За допомогою розробленого інструменту визначені ймовірні нові гени-мішені ІФНб. Вперше показано, що ІФНб може регулювати експресію групи генів, що відповідають за розвиток та функціонування нервової системи.
Практичне значення одержаних результатів. Робота характеризується можливістю широкого застосування розроблених методів та інструменту пошуку СЗТФ. Відповідно, практичне значення не обмежене наведеним у роботі прикладом, і застосування розробленого інструменту для визначення генів-мішеней інших транскрипційних факторів дозволить значно розширити знання про їхню дію. В представленій роботі за допомогою розроблених методу та інструменту визначено ймовірні гени первинної відповіді на активацію ISGF-3. Практична цінність цього застосування полягає у можливості визначити як механізми лікувальної дії ІФНб, так і його побічних ефектів. Одержані результати дозволяють почати цілеспрямовані дослідження групи генів, що регулюють функціонування нервової системи, і вперше були визначені як нові мішені ІФНб.
Висока ефективність розробленого інструментарію дозволяє застосовувати його до геномних послідовностей будь-якої довжини. Зокрема, швидкість сканування геномної нуклеотидної послідовності методом на основі ПВМ становить не менше 2500 нуклеотидів*с-1МГц-1 на процесорі AMD Athlon X2 4200+.
Особистий внесок здобувача. Результати, викладені у дисертації, одержано здобувачем особисто або за його безпосередньої участі. Здобувачем оцінено придатність методів на основі матричних моделей для пошуку ISRE, розроблено новий метод пошуку, проведено його порівняння з існуючим методом, розроблено онлайн-інструмент, застосовано його для пошуку ISRE у геномі R. norvegicus, проаналізовано результати пошуку.
Метод на основі прихованих моделей Маркова та його впровадження у вигляді інструменту проведено разом з Р. Я. Голдою. Порівняння одержаних списків генів з даними літератури виконано у співпраці з О. О. Драгущенко. Інтеграцію бази даних JASPAR здійснено спільно з О. М. Протасом.
Автор висловлює подяку колегам по лабораторії к.б.н. М. М. Перепелюк, А. В. Кукліну, Я. В. Щербі за використання та об'єктивну оцінку розробленого у дисертації інструменту. Здобувач також вдячний Н. В. Макогон, А. Гоглер та С. Шале за сприяння експериментальному визначенню ролі ІФНб у процесі регенерації печінки R. norvegicus.
Здобувач висловлює подяку академікові НАН України Г. В. Єльській за допомогу та рекомендації при написанні статей.
Слова щирої вдячності автор висловлює керівнику роботи - д.б.н., с.н.с. М. Ю. Оболенській - за керівництво, корисні поради і зауваження під час виконання дисертаційної роботи.
З усіма зазначеними колегами автор має спільні публікації.
Апробація результатів дисертації. Результати досліджень були представлені під час стендових та усних доповідей на таких конференціях: Gliwice Scientific Meetings (м. Глівіце, Польща, 2006); 41st Annual Scientific Meeting of ESCI (м. Уппсала, Швеція, 2007); Conference for young scientists, PhD students and students on molecular biology and genetics (м. Київ, Україна, 2007); Bridges in Life Sciences Annual Scientific Review (м. Печ, Угорщина, 2007); 9th International Conference on Systems Biology (м. Гетеборг, Швеція, 2008); 6th International conference on bioinformatics of genome regulation and structure BGRS-2008 (м. Новосибірськ, Росія, 2008); FEBS Advanced Course on Systems Biology: from molecules to function (м. Альпбах, Австрія, 2009).
Публікації. За темою дисертації опубліковано 4 статті у фахових наукових журналах та тези 8 доповідей у збірниках матеріалів з'їздів та конференцій.
Структура та обсяг роботи. Дисертація складається зі вступу, огляду літератури, матеріалів і методів дослідження, результатів дослідження, аналізу та узагальнення одержаних результатів, висновків, списку використаних джерел та додатків. Дисертацію викладено на 134 сторінках машинописного тексту. Робота містить 18 рисунків, 12 таблиць. Список використаної літератури охоплює 175 найменувань.
Основний зміст
Матеріали та методи досліджень. Для перевірки придатності існуючих методів на основі вагових матриць до пошуку СЗТФ у еукаріот “промоторну послідовність” було визначено, як нуклеотидну послідовність у межах 1000 нуклеотидів вище точки початку транскрипції.
Геномні нуклеотидні послідовності отримано програмними запитами до інтерфейсу BioMart/martservice (Hubbard et al., 2002; Kasprzyk et al., 2004) та за допомогою власної програми COTRASIF.
Позиційно-частотну матрицю (ПЧМ) ISRE (ідентифікатор M00258) отримано із бази даних транскрипційних факторів TRANSFAC 7.0 Public (Levy et al., 1988).
Для обчислення оцінки подібності між матрицею та нуклеотидною послідовністю в методі на основі ПВМ виконується логарифмічна трансформація ПЧМ у ПВМ (Jin et al., 2004).
Аналіз збагачення функціональних категорій в одержаних списках генів проводили з використанням проекту ОГ (Ashburner et al., 2000). Аналіз достовірності збагачення категорій ОГ виконано інструментами BayGO (Vencio et al., 2006), FatiGO (Al-Shahrour et al., 2006) та GO Tree Machine (Zhang et al., 2004).
Порівняння результатів пошуку СЗТФ із даними літератури здійснено з використанням бази даних UniGene (Wheeler et al., 2003) та системи аналізу літератури iHOP (information hyperlinked over proteins, http://www.ihop-net.org/UniPub/iHOP/). Пошук джерел літератури, в яких одночасно згадується одна із назв/ідентифікаторів досліджуваного гена та одна із назв ІФНб (наприклад, IFN або interferon), провели з використанням пошукової системи iHOP (Hoffmann et al., 2004). Подальший перегляд контексту одночасного вживання двох термінів дозволяє визначити, чи йде мова про експериментальне підтвердження регуляції експресії досліджуваного гена ІФНб. Пошукова система iHOP здійснює автоматичний лексичний аналіз тез із бази даних PubMed (Hoffmann et al., 2004).
Оцінка придатності матричних моделей для пошуку сайтів зв'язування у послідовностях промоторів генів еукаріот. З метою перевірки придатності пошуку на основі позиційно-вагових матриць до пошуку сайтів зв'язування ISGF-3 створено набір спеціалізованих програмних інструментів, проведено пошук та оцінено отримані результати. Оцінка результатів пошуку сайтів зв'язування полягала у порівнянні результатів їхнього аналізу за ОГ з відомими даними про дію ІФНб. Розробка власного набору програмних інструментів була зумовлена невідповідністю всім необхідним критеріям (зокрема, наявності готових колекцій промоторів) існуючих інструментів для пошуку в масштабі повного геному.
Пошук СЗТФ на обох ланцюгах ДНК із порогом подібності до матриці 80 % у послідовностях промоторів усіх генів R. norvegicus, що кодують білки, дозволив виявити 5214 СЗТФ у 4571 промоторі. Із 4571 генів лише 768 (16,8 %) мали позиційно-консервативні сайти ISRE у промоторах генів-ортологів. Саме набір із 768 генів використано для подальшого аналізу.
Аналіз на збагачення категорій ОГ (Ashburner et al., 2000) - тобто оцінка відхилення кількостей генів у кожній категорії від очікуваного випадкового розподілу - проведено з використанням BayGO (Vencio et al., 2006). Кількість ітерацій становила 100; враховувались лише ті категорії, які містили щонайменше один ген. Значимо збагаченими вважалися категорії з р < 0,05. У кінцевому переліку зі 768 генів 697 мали по одному ймовірному ISRE у промоторі, 59 генів мали два ймовірних ISRE, 10 генів мали три або більше ISRE у промоторі.
Проаналізовано збагачення категорій ОГ для групи 768 генів порівняно з групою всіх білок-кодуючих генів R. norvegicus. 84 категорії онтології “біологічний процес” були достовірно збагачені при р < 0,05.
Щоб оцінити ефект застосування філогенетичного футпринтингу, групу 768 генів порівняно із групою 4571 гена на збагачення категорій ОГ із використанням GO Tree Machine (Zhang et al., 2004); при цьому 20 категорій ОГ визначено, як достовірно збагачені.
Серед 84 збагачених категорій значна їх кількість безпосередньо стосується відомих систем-мішеней ІФНб (зокрема, “позитивна регуляція диференціації B-клітин”, “гуморальна імунна відповідь”, “відповідь на вірусне ураження”, “клітинна диференціація”, “позитивна регуляція активності транскрипційних факторів” та інші категорії). Деякі з категорій ОГ є спільними як для 84 категорій, отриманих після аналізу кінцевого результату, так і для 20 категорій, отриманих при оцінці ефекту застосування філогенетичного футпринтингу: “розвиток”, “клітинна диференціація”, “розвиток нервової системи”. Декілька категорій перебувають у ієрархічній залежності одна від одної, наприклад “клітинна адгезія” та “регуляція клітинної адгезії”, “життєвий цикл вірусів” та “відповідь на вірусне ураження”, “диференціація мієлоїдних клітин” та “позитивна регуляція диференціації мієлоїдних клітин” (серед 20 та 84 категорій, відповідно).
В результаті оцінювання придатності методу визначено 768 білок-кодуючих генів R. norvegicus, що містять ISRE у промоторах (у межах -1000 п.н. від точки початку транскрипції), і є потенційними генами-мішенями фактору ISGF-3, який активується ІФНб. Функціональний аналіз цієї групи генів, проведений із використанням ОГ, показав, зокрема, збагачення тих категорій ОГ, що належать до вже відомих ефектів ІФНб. На основі проведеного аналізу ПВМ-метод пошуку СЗТФ ISGF-3 визнано придатним для розв'язання поставленого завдання. В той же час, надмірна кількість знайдених генів відповіді на ІФНб (понад 25 % від кількості генів, що кодують білки) свідчить про велику кількість невірно-позитивних результатів, що обмежує корисність існуючого методу на основі вагових матриць і спонукає до розробки вдосконалених методів.
Неочікуваним результатом була поява категорії “розвиток нервової системи” в обох порівняннях, з р < 0,01 і г = 0,4 в групі 84 категорій, одержаній з використанням BayGO (Vencio et al., 2006), та з р = 0,0099 у групі 20 категорій, одержаній за допомогою GOTM (Zhang et al., 2004).
Розробка вдосконаленого методу пошуку сайтів зв'язування на основі прихованих моделей Маркова. Прихована модель Маркова (ПММ, hidden Markov model, HMM) - це набір ланцюжків Маркова (Baum et al., 1966), які всі разом формують граф. У ланцюжку Маркова послідовні незалежні події зв'язані переходами, позначеними ймовірностями таких переходів. Оскільки через граф ПMM можливо пройти різними шляхами, то його можна використати як класифікатор - за умови попереднього тренування моделі за допомогою набору відомих даних.
В той час, як пошук СЗТФ методом на основі ПВМ припускає незалежність розподілу частот сусідніх нуклеотидів, застосування ПММ дозволяє зберегти більше статистичних залежностей, виявлених у відомих сайтах зв'язування, завдяки врахуванню частот суміжності конкретних пар нуклеотидів. Для цілей застосування ПММ до пошуку СЗТФ кожна подія (стан) визначена як один нуклеотид із набору ACGT, переходи можливі лише між сусідніми станами і у кожного стану є 4 переходи, які ведуть від нього до наступних станів (нуклеотидів).
Пошук із використанням методу на основі ПММ виконується у 3 кроки. На першому кроці обчислюємо матриці частот сусідства з усіх пар сусідніх нуклеотидів з використанням усіх введених користувачем відомих послідовностей СЗТФ. Оскільки кожна така матриця частот має розмір 4x4, а загальна кількість пар нуклеотидів становить (k-l) (де k - це довжина введених відомих СЗТФ), то повна кінцева матриця сусідства буде тривимірною та матиме розмір 4x4x(k-1).
Для отриманої повної тривимірної матриці ми визначили функцію переходу tf, яка інтегрує водночас інформацію про сусідство та позиційно-ваговий компонент:
(1)
де: tf - функція переходу (транзитивна функція) між сусідніми нуклеотидами,
i - позиція нуклеотиду, звідки відбувається перехід,
i+1 - позиція нуклеотиду, у якому перехід закінчується,
ni - нуклеотид у позиції i (один із ACGT),
freq(ni , ni+1) - частота спільного знаходження двох нуклеотидів ni та ni+1 (взята із 4x4x(k-1) матриці сусідства),
N - кількість послідовностей, із яких було обчислено необов'язкову додаткову ПЧМ; N дорівнює Nseq, якщо користувач не надав додаткової ПЧМ,
Nseq - кількість введених користувачем відомих послідовностей СЗТФ,
- мінімальний компенсатор,
fn,i - кількість виявлених нуклеотидів n у колонці i ПЧМ,
fn,i+1 - кількість поточних виявлених нуклеотидів n у колонці i+1 ПЧМ.
На другому кроці за початкове значення порогу подібності приймаємо найнижчу оцінку подібності, отриману при порівнянні заданих користувачем послідовностей із моделлю, обчисленою на їхній основі. Наступним етапом генеруємо 107 випадкових нуклеотидних послідовностей довжиною k. Ті з випадкових нуклеотидних послідовностей, що отримали оцінку подібності вищу за поріг, стають основою для обчислення нової (тестової) матриці сусідства. Тестова матриця сусідства порівнюється з оригінальною матрицею 4x4x(k-1). Якщо матриці не мають статистично значимих відмінностей (p < 0,02), то поточний (нормалізований) поріг зменшується на 0,01, і процес повторюється, починаючи з генерування 107 випадкових нуклеотидних послідовностей довжиною k. Інакше ж, якщо p > 0,02 для нульової гіпотези, що матриці різні, то оптимізація порогу зупиняється на поточному його значенні. Значення p для порівняння початкової та тестової матриць сусідства обчислювали за формулою:
(2)
де: i - послідовний номер нуклеотидної пари (як у тестовій, так і в оригінальній матрицях),
k - довжина випадкових послідовностей (дорівнює довжині послідовностей відомих СЗТФ),
r - номер рядка у окремій матриці сусідства,
c - номер колонки,
Nseq - кількість поданих користувачем відомих послідовностей СЗТФ,
freq[i,r,c] - значення спостереженої частоти у рядку r та колонці c i-тої пари нуклеотидів у тестовій матриці сусідства,
tf[i,r,c] - значення функції переходу (очікувана ймовірність) у оригінальній матриці сусідства для пари i (у рядку r та колонці c).
На третьому кроці, використовуючи рухоме “вікно”, здійснюється порівняння обчисленої моделі Маркова з нуклеотидними послідовностями-кандидатами, з обчисленням оцінки подібності. Ті послідовності, що отримали оцінку подібності, вищу за порогову, записуються у файл результатів. Для обчислення оцінки подібності використовується формула:
(3)
де: HMMraw - оцінка подібності нуклеотидної послідовності до моделі Маркова,
tf - функція переходу, визначена у формулі (1),
i - позиція поточного нуклеотиду в межах сканую чого вікна,
n - фактично виявлений у позиції i нуклеотид, один із ACGT,
k - розмір вікна сканування (рівний довжині СЗТФ).
Обчислена у формулі (3) оцінка подібності HMMraw є індивідуальною для кожної використаної сукупності відомих СЗТФ, і тому її неможливо використати для порівняння з результатами інших пошуків. Це обмеження усували нормалізацією HMMraw за формулою:
(4)
де: HMMscore - нормалізована оцінка подібності моделі Маркова до нуклеотидної послідовності,
HMMraw - оцінка подібності до нормалізації,
HMMmin - мінімально можлива для моделі оцінка подібності,
HMMmax - максимально можлива для моделі оцінка подібності.
Інструмент COTRASIF для пошуку сайтів зв'язування у геномах еукаріот. Інструмент COTRASIF (conservation-aided transcription factor binding site finder) побудований на основі внутрішньої реляційної бази даних. Систему анотації геномів Ensembl (Curwen et al., 2004) використано як первинне джерело для отримання промоторів генів та інформації про ортологію генів. Оскільки база даних Ensembl регулярно оновлюється, кожного разу покращуючи якість анотації геномів, то з метою запобігання застаріванню анотацій у внутрішній базі даних інструменту COTRASIF розроблено спеціальний напівавтоматичний конвеєр для імпорту нових версій Ensembl на основі інтерфейсу MartService від BioMart (Kasprzyk et al., 2004). На рис. 1 наведено загальну схему інструменту COTRASIF.
Означення промотора в інструменті COTRASIF. За промотор гена взято нуклеотидну послідовність, що простягається від -2000 нуклеотидів відносно точки початку транскрипції до першого екзону (тобто включає нуклеотидну послідовність 5' UTR, якщо така анотована для гена). Збільшення розміру нуклеотидної послідовності, яку вважаємо промотором гена, з 1000 п.н. під час оцінки придатності методів на основі ПВМ до 2000 п.н. у розробленому інструменті пояснюється запитами користувачів інструменту, які вказували на недостатність промотора довжиною 1000 п.н.; довжина промотора 2000 п.н. також не суперечить даним літератури (Davuluri et al., 2001).
Як показано на блок-схемі інструменту COTRASIF (рис. 1), він використовує два різних алгоритми пошуку (на основі ПВМ та ПММ), а також оригінальну модифікацію методу філогенетичного футпринтингу для обчислення результатів.
Рис. 1. Організація інструменту COTRASIF та потоків обробки даних
Метод пошуку на основі позиційно-вагових матриць. Метод пошуку СЗТФ на основі ПВМ слід застосовувати, коли для ТФ вже відома позиційно-частотна матриця - наприклад, у базах даних JASPAR (Sandelin et al., 2004) або TRANSFAC (Matys et al., 2006). При використанні пошуку на основі ПВМ застосовуємо логарифмічну трансформацію ПЧМ у ПВМ (Jin et al., 2004; Wasserman et al., 2004). Для пошуку на основі ПВМ користувач може вказати бажаний мінімальний поріг подібності матриці до послідовностей-кандидатів. Інструмент COTRASIF не обчислює оптимальні пороги подібності матриці до СЗТФ для методу пошуку на основі ПВМ (Kel et al., 2003). Пошук СЗТФ із використанням методу на основі ПММ автоматично обчислює оптимальний поріг подібності.
Власна модифікація методу філогенетичного футпринтингу. Інструмент COTRASIF пропонує один етап додаткового відбору результатів пошуку, а саме “фільтр за еволюційною консервативністю” (модифікований метод філогенетичного футпринтингу), що працює шляхом порівняння двох результатів пошуку із різних геномів із використанням інформації про ортологію генів у цих геномах. Застосування додаткового відбору (фільтрування) результатів зменшує пропорцію невірно-позитивних результатів (Wasserman et al., 2004). Якщо СЗТФ виявлено у промоторі гена цільового організму та у промоторі гена-ортолога із організму, що використовується для порівняння, то такий СЗТФ проходить фільтр; всі інші СЗТФ відсіюються. В основу такого відбору покладено припущення, що за умови відсутності у СЗТФ-подібної послідовності біологічної (регуляторної) функції вона у процесі еволюції має вищу ймовірність зазнати змін (мутацій), аніж функціональна регуляторна ділянка. Крім позиційно-незалежної перевірки наявності СЗТФ у промоторах генів-ортологів, реалізовано також позиційно-залежний відбір із використанням позиції СЗТФ відносно точки початку транскрипції у кожному із генів-ортологів. Користувач може довільно задати діапазон дозволених відхилень відстані знайденого СЗТФ від точки початку транскрипції у промоторі кожного із генів-ортологів.
Пошук сайтів зв'язування за межами промоторів. Linux-версія програми (32/64-біт) доступна на сайті інструменту COTRASIF. Для вхідних файлів нуклеотидних послідовностей дозволено використовувати ENSEMBL top-level FASTA та інші FASTA-сумісні формати. Результатом роботи програми є файл у власному форматі зі значеннями, розділеними табуляцією.
Порівняння COTRASIF із іншими інструментами. Порівняння 8 подібних до COTRASIF інструментів показало, що онлайн-інструмент MAPPER (Marinescu et al., 2005) найближчий до інструменту COTRASIF за функціями. Проте, COTRASIF кращий за MAPPER за декількома ознаками. По-перше, у COTRASIF доступна більша кількість колекцій промоторів еукаріот (20 проти 3 у MAPPER). По-друге, COTRASIF розроблено як інструмент для пошуку, в той час як MAPPER початково розроблено як базу даних попередньо обчислених СЗТФ (Marinescu et al., 2005), що ускладнює використання MAPPER для пошуку з власними матрицями СЗТФ. Крім того, COTRASIF надає можливість використання як методу на основі ПВМ, так і методу на основі ПММ. Інші розглянуті інструменти поступалися функціональністю COTRASIF та MAPPER.
Порівняння специфічності методів на основі позиційно-вагових матриць та прихованих моделей Маркова. Специфічність оцінювали за кількістю та оцінками подібності знайдених ISRE-подібних сайтів у нуклеотидних послідовностях, що не повинні містити сайтів зв'язування. Пошук проводили за допомогою локальної версії програми COTRASIF з порогом подібності 0,01. Нуклеотидні послідовності другого та третього екзонів генів щура отримано запитом до сервісу BioMart. Для власної реалізації методу на основі ПВМ використано матрицю М00258, для методу на основі ПММ - 8 відомих нуклеотидних послідовностей ISRE із літератури та матрицю М00258 із бази даних TRANSFAC 7.0 Public (Wingender et al., 2000).
В результаті пошуку ISRE у другому та третьому екзонах генів R. norvegicus (де ймовірність виявлення функціональних ISRE мінімальна) знайдено 6709322 ISRE методом ПВМ та 6163339 ISRE методом ПММ. Сукупність отриманих оцінок подібності розбито на 100 груп із кроком 0,01 (від 0,01 до 1,00 включно). Для кожної групи обчислено кількість виявлених ISRE-подібних сайтів. На рис. 2 показано розподіл кількості знайдених ISRE-подібних сайтів залежно від значення оцінки подібності для методів ПВМ і ПММ, відповідно.
Як видно з рис. 2а, для методу на основі ПВМ характерний близький до нормального розподіл зі значенням середнього арифметичного 0,3, тоді як для методу на основі ПММ (рис. 2б) спостерігаємо близький до логарифмічного розподіл із максимумом виявлених ISRE-подібних ділянок у зоні з низькими оцінками подібності (менше 0,3), л = 0,16. Із наведених графіків розподілу випливає, що метод ПММ (як і очікувалось теоретично) має більшу специфічність пошуку.
В результаті проведеної роботи також визначено, що значення порогу подібності 0,98 і 0,97 (для методів ПВМ і ПММ, відповідно) є мінімізаторами невірно-негативних результатів (Kel et al., 2003) пошуку ISRE, оскільки у 2 та 3 екзонах білок-кодуючих генів щура не знайдено жодного ISRE з оцінкою подібності, вищою за вказані пороги.
Рис. 2. Розподіл кількості оцінок подібності залежно від значення оцінки подібності для методів на основі ПВМ (а) та ПММ (б)
Пошук мішеней ISGF-3 за допомогою COTRASIF. Для ІФНб, який зв'язався з рецептором, відомий домінуючий шлях передачі сигналу, а саме Jak-STAT каскад, кінцевим результатом якого є активація транскрипційного фактора ISGF-3, який специфічно зв'язується із ISRE (Horvath, 2004). Таким чином, пошук ISRE дозволить знайти ймовірні гени первинної відповіді на дію ІФНб.
Пошук ймовірних генів первинної відповіді на ІФНб проведено із використанням методу на основі ПММ у промоторах генів R. norvegicus і M. musculus із версії 52 Ensembl з порогом подібності 0,84. Виявлено 743 ISRE у 707 генах R. norvegicus ймовірної первинної відповіді на ІФНб та 1292 ймовірних ISRE у 1163 генах M. musculus. Застосування власної модифікації методу філогенетичного футпринтингу дозволило виокремити 162 гени R. norvegicus, що мали еволюційно-консервативні ймовірні ISRE.
Із використанням інструменту FatiGO (Al-Shahrour et al., 2006) ми провели аналіз на збагачення категорій ОГ для 162 генів R. norvegicus, що успішно пройшли відбір за еволюційною консервативністю. Єдиною збагаченою категорією був біологічний процес “імунна відповідь” (GO:0006955), із p = 1,23•10-4 та коригованим p = 8,52•10-3. До цієї категорії увійшло 9 генів:
Mbl1, маннозозв'язувальний білок A (MBP-A); в даних літератури не виявлено зв'язку між експресією Mbl1 та стимуляцією ІФНб, проте Mbl1 анотований у GOTM (Zhang et al., 2004) як ген вродженої імунної відповіді та має дві ділянки ISRE; білок, що є продуктом даного гена, кальцій-залежно активує систему комплементу;
LOC685067, ENSRNOG00000029191; цей ген з невідомою функцією має ортолога GBP6 у геномі M. musculus, для якого показано можливість активації ІФНб (Degrandi et al., 2007);
Мх1 та Mx2, відомі ІФНб-індуковані GTP-зв'язувальні білки (Pestka et al., 1987);
Pf4 (Cxcl4, хемокін 4 мотиву C-X-C), ймовірний медіатор запалення та імунної відповіді, учасник процесу загоєння ран; у літературі не виявлено даних про зміну рівня експресії цього гена у відповідь на дію ІФНб, за винятком свідчень про ко-експресію обох генів (Airoldi et al., 2008);
Cadm1 (NECL-2, Igsf4a) стимулюється ІФНб (Di et al., 2009);
Gzma (гранзим А) регулюється ІФНб (Zhang et al., 2008; Li et al., 2002);
Oasl2, 2'-5' олігоаденілат-синтетазоподібний білок 2; олігоаденілат-синтетази є відомими мішенями ІФНб (Stark et al., 1998);
Gbp4 (ENSRNOG00000028768), подібно до згаданого вище LOC685067, має ортолога Gbp4 у геномі M. musculus, що індукується ІФНб (Degrandi et al., 2007).
Таким чином, із 9 генів: 5 - відомі мішені ІФНб; ще у двох генів є ортологи у M. musculus, для яких показано можливість регуляції ІФНб та інтерферонами другого типу; для 2 генів у літературі не виявлено підтверджень регуляції їхньої експресії ІФНб.
Порівняння результатів пошуку ймовірних мішеней ISGF-3 з даними літератури. Для того, щоб визначити, для яких із 162 генів існують експериментальні докази їхньої регуляції ІФНб, було вивчено дані літератури за кожним із цих генів. Для 61 гена в літературі знайдено підтвердження їхньої регуляції ІФНб, а для 101 гена таких доказів не виявлено.
Аналіз за категоріями ОГ списку 101 гена за допомогою інструменту FatiGO виявив єдину достовірно збагачену категорію “компонент синапсу”, що ієрархічно підпорядковується категорії ОГ “клітинний компонент”. До цієї категорії увійшло три гени (табл. 1).
Продукти даних генів анотовані як складові частини синапсу, які локалізовані в місцях контакту між двома нейронами, а також між нейроном та м'язовим волокном або гліальною клітиною (Wang et al., 2003; Pan et al., 2007; Dev et al., 1999). Перший із генів - PRKCA-зв'язувальний білок - залучений до процесу утворення рецепторних кластерів (Pan et al., 2007).
Таблиця 1 Три гени із достовірно збагаченої категорії ОГ “компонент синапсу”
Ідентифікатор гена |
Назва |
Продукт гена |
|
ENSRNOG00000011507 |
Pick1 |
PRKCA-binding protein |
|
ENSRNOG00000005723 |
Grin3a |
NMDA receptor subunit 3A precursor |
|
ENSRNOG00000002349 |
Gabra2 |
GABAA receptor subunit alpha-2 |
Grin3a - це субодиниця 3А NMDA-рецептора. NMDA-рецептори є іонотропними рецепторами глутамату (збуджувального нейромедіатора), які селективно зв'язують N_метил-D-аспартат (NMDA), та локалізовані на постсинаптичній мембрані нейронів, де функціонують у тетрамерній формі та характеризуються високою проникністю для іонів Ca2+ (Chen et al., 2006; Furukawa et al., 2005; Wrighton et al., 2008). Активація NMDA-рецепторів підвищує активність піроглутаміл пептидази II (екзопептидази) в гіпокампі щурів - тобто в ділянці мозку, що відповідає за короткотривалу пам'ять (Rodriguez-Molina et al., 2009). Субодиниця 3A утворюється тільки протягом короткого періоду постнатального розвитку, після чого відбувається її вилучення з поверхні мембрани шляхом ендоцитозу, і синаптична мережа стає стабільною (Perez-Otano et al., 2006). Таким чином, модулюючи активність NMDA-рецептора, ІФНб може брати участь у функціонуванні збуджувальних синапсів, регуляції процесу росту аксонів та синаптогенезу.
Насамкінець, третій ген - GABAA-рецептор (Gamma-aminobutyric acid receptor) - це ліганд-залежний хлорний канал, рецептор до інгібіторного нейромедіатора г-аміномасляної кислоти (ГАМК) (Johnston, 1996).
Оскільки раніше не було відомо про участь ІФНб у регуляції процесів у нервовій системі, то ці дані дещо неочікувані. Проте, при лікуванні ІФНб хворих на гепатит та деякі форми раку спостерігають побічні ефекти - головні болі, депресію та інші (Lindsay et al., 1996), механізми виникнення яких невідомі. Отримані нами результати відкривають можливості для експериментальної перевірки нових, раніше невідомих функцій ІФНб.
Аналіз на збагачення функціональних категорій списку з 61 гена з літературними підтвердженнями їхньої регуляції ІФНб виявив три збагачені категорії ОГ, у “біологічному процесі” - “імунна відповідь” (8 генів) та “відповідь на віруси” (3 гени), у “молекулярній функції” - “ГТФазна активність” (4 гени). Всього до збагачених категорій ОГ увійшло 9 генів (декілька генів належать до декількох категорій одночасно).
Оцінка перспективності ймовірних генів-мішеней. Щоб виокремити гени, найперспективніші для подальших експериментальних досліджень, необхідно оцінити перспективність кожного гена. Запропоновано критерії оцінювання перспективності ймовірних генів-мішеней первинної відповіді на ТФ, а також їхнього ранжування від найперспективніших до найменш перспективних. Такі критерії визначено як важливі для оцінювання перспективності: кількість знайдених однотипних СЗТФ у одному промоторі (Li et al., 1998), збереження відстані від еволюційно-консервативних СЗТФ до точок початку транскрипції відповідних генів-ортологів (Hannenhalli et al., 2002), оцінка подібності вища за мінімізатор невірно-позитивних результатів для даного СЗТФ (Kel et al., 2003). На основі названих критеріїв визначено перспективні гени-мішені ІФНб (табл. 2).
Таблиця 2 Перспективні гени-мішені ІФНб, відібрані за рейтингом перспективності та належністю до достовірно збагачених категорій ОГ
№ |
Ідентифікатор |
Назва гена |
Рейтинг перспективності |
|
1 |
ENSRNOG00000007899 |
Mterf |
1,5 |
|
2 |
ENSRNOG00000008593 |
Ryk |
1,5 |
|
3 |
ENSRNOG00000009491 |
Phc3 |
1,5 |
|
4 |
ENSRNOG00000011883 |
Ccdc113 |
1,5 |
|
5 |
ENSRNOG00000014037 |
Dcun1d3 |
1,5 |
|
6 |
ENSRNOG00000014326 |
Cacng6 |
1,5 |
|
7 |
ENSRNOG00000016583 |
RGD1561517 |
1,5 |
|
8 |
ENSRNOG00000017053 |
Fbxo36 |
1,5 |
|
9 |
ENSRNOG00000018012 |
Tulp4 |
1,5 |
|
10 |
ENSRNOG00000018129 |
Ndufab1 |
1,5 |
|
11 |
ENSRNOG00000018511 |
Mrpl30 |
1,5 |
|
12 |
ENSRNOG00000018841 |
Sox8 |
1,5 |
|
13 |
ENSRNOG00000019936 |
RGD1311634 |
1,5 |
|
14 |
ENSRNOG00000020178 |
Cope |
1,5 |
|
15 |
ENSRNOG00000030374 |
Lsm6 |
1,5 |
|
16 |
ENSRNOG00000030464 |
Olr711 |
1,5 |
|
17 |
ENSRNOG00000032163 |
Olr575 |
1,5 |
|
18 |
ENSRNOG00000004744 |
Fam84b |
0,5 |
|
19 |
ENSRNOG00000017613 |
Pols |
0,5 |
|
20 |
ENSRNOG00000028768 |
Gbp4 |
0,5 |
|
21 |
ENSRNOG00000029191 |
LOC685067 |
1,1 |
|
22 |
ENSRNOG00000011507 |
Pick1 |
0,5 |
|
23 |
ENSRNOG00000005723 |
Grin3a |
0,84 |
|
24 |
ENSRNOG00000002349 |
Gabra2 |
0,84 |
Якщо взяти ймовірність наявності біологічної функції одного СЗТФ у промоторі за pb, то для N СЗТФ ймовірність Pb того, що хоча б один із N СЗТФ одного промотора буде мати біологічну функцію, визначається як . Значення pb прийнято за 0,5.
У межах одного повного оберту ДНК (10 нуклеотидів) збереження позиції СЗТФ вважають ідеальним (Bluyssen et al., 1994) - за таких умов оцінку еволюційної консервативності ECscore приймаємо за 1. Також відомо, що кооперативні СЗТФ найчастіше розділені не більше ніж 50 нуклеотидами, тобто 5 повними обертами спіралі ДНК, що зумовлено збереженням білок-білкових взаємодій факторів транскрипції (Hannenhalli et al., 2002). Відповідно, кожен промотор отримує оцінку еволюційної консервативності ECscore в межах [0; 1] для варіації відстані L від СЗТФ до точки початку транскрипції кожного гена-ортолога у межах [10; 50] нуклеотидів за формулою . філогенетичний еукаріот футпринтинг
Насамкінець, оцінка подібності, вища за мінімізатор невірно-позитивних результатів, додає 0,25 бала до сумарного рейтингу. Таким чином, у результаті оцінювання кожен ген-кандидат набирає рейтинг у межах [0,5; 2,25], який і визначає його перспективність (вищий рейтинг - перспективніший ген). Запропонований підхід застосовано до 162 генів, знайдених за допомогою COTRASIF. Фактичний максимум обчислених рейтингів цих генів становив 1,5. У групі зі 101 невідомого гена, для яких у літературі не виявлено підтверджень їхньої регуляції ІФНб, 17 генів мали найвищий рейтинг надійності і є перспективними кандидатами для першочергового дослідження.
Висновки
Розроблено новий метод пошуку сайтів зв'язування транскрипційних факторів та інструмент COTRASIF на його основі, за допомогою якого вперше виявлено 162 гени первинної відповіді на дію інтерферону альфа (ІФНб), з яких 61 ген є експериментально підтвердженими генами відповіді на дію ІФНб (за даними літератури), а для 101 гена таких підтверджень не виявлено.
1. Показано, що пошук сайту зв'язування інтерферон-стимульованого фактора 3 (ISGF-3) у промоторах генів еукаріот за допомогою методу на основі позиційно-вагових матриць можливий, проте інтерпретація результатів ускладнена через низьку специфічність пошуку.
2. Розроблено вдосконалений метод пошуку сайтів зв'язування транскрипційних факторів на основі прихованих моделей Маркова, що має вищу за метод на основі позиційно-вагових матриць специфічність пошуку сайтів зв'язування.
3. Розроблено онлайн-інструмент для виявлення у промоторах генів еукаріот сайтів зв'язування транскрипційних факторів у масштабі цілого геному. В інструменті реалізовано два методи пошуку сайтів зв'язування (на основі позиційно-вагових матриць та прихованих моделей Маркова) та один метод відсіювання невірно-позитивних результатів (оригінальна модифікація методу філогенетичного футпринтингу).
4. Перевірка 162 отриманих генів ймовірної первинної відповіді за даними літератури показала, що для 61 гена вже є експериментальні підтвердження їхньої регуляції ІФНб, а для 101 гена таких підтверджень не виявлено; це вказує на вірну роботу розроблених методу та інструменту.
5. Вперше показано, що гени, які відповідають за розвиток та функціонування нервової системи (Pick1, Grin3a, Gabra2), також можуть регулюватися ІФНб.
6. Запропоновано 3 критерії оцінки перспективності генів-результатів пошуку сайтів зв'язування.
7. За допомогою розроблених методу та інструменту, аналізу з використанням бази даних онтології генів, порівняння з даними літератури та обчислення перспективності визначено 24 найперспективніших ймовірних нових генів первинної відповіді на ІФНб.
Перелік наукових праць, опублікованих за темою дисертації
1. Tokovenko B.T. In silico approach to study and functionally analyze interferon-regulated genes / B.T. Tokovenko, A.V. El'skaya, M.Yu. Obolenskaya // Біополімери і клітина. - 2007. - Т. 23, № 4. - С. 368-375. Особистий внесок здобувача: оцінка придатності матричних моделей пошуку сайтів зв'язування до пошуку в промоторах еукаріот.
2. COTRASIF: conservation-aided transcription-factor-binding site finder / B. Tokovenko, R. Golda, O. Protas, M. Obolenskaya, A. El'skaya // Nucleic Acids Research. - 2009. - Vol. 37, № 7. - e49. - DOI 10.1093/nar/gkp084. Особистий внесок здобувача: розробка нового методу, розробка та застосування інструменту.
3. Інтерферон б та протеїнкіназа Р у процесі відновлення печінки щурів після часткової гепатектомії / М. М. Перепелюк, А. В. Куклін, Я. В. Щерба, Б. Т. Токовенко, Н. В. Макогон, А. Гоглер, С. Шале, М. Ю. Оболенська // Біополімери і клітина.-2009.-Т. 25, № 2. - С. 145-149. Особистий внесок здобувача: визначення сайтів ISRE у промоторах субодиниць рецептора ІФНб та PKR.
4. Identification of gene targets of ISGF-3 transcription factor / B. T. Tokovenko, O. O. Dragushchenko, A. V. Kuklin, M. Yu. Obolenskaya // Biopolymers and Cell.-2009.- Vol. 25, № 5.- P. 398-402. Особистий внесок здобувача: визначення мішеней ISGF-3 та оцінка їх надійності.
5. Genome-wide prediction and functional analysis of rat genes containing ISRE in promoter / B. Tokovenko, M. Obolenskaya // Abstract book, Gliwice Scientific Meetings, Gliwice, Poland.-2006.-P. 58. Особистий внесок здобувача: визначення та функціональний аналіз мішеней ISGF-3.
6. In silico prediction and functional analysis of primary interferon-response genes / B. Tokovenko, M. Obolenskaya // Journal of the European Society for Clinical Investigation (ESCI) - Abstracts of the 41st Annual Scientific Meeting of ESCI, Uppsala, Sweden.-2007.-Vol. 37/s1.- P. 30-31. Особистий внесок здобувача: функціональний аналіз генів первинної відповіді на ІФНб.
7. COTRASIF: Conservation-aided transcription factor binding site finder / B. Tokovenko, M. Obolenskaya // Abstract book of the Conference for young scientists, PhD students and students on molecular biology and genetics, Kyiv, Ukraine.-2007.-P. 148. Особистий внесок здобувача: розробка методів та схеми інструменту.
8. Novel technologies in the study of IFN alpha activity / B. Tokovenko, A. Kuklin, M. Perepelyuk, M. Obolenskaya // RECOOP HST Consortium, Bridges in Life Sciences Annual Scientific Review, Pecs, Hungary.-2007.-Vol. 1, № 1.-Р. 23. Особистий внесок здобувача: обчислювальні методи вивчення ефектів ІФНб.
9. COTRASIF: Genomics tool for systems biology / R. Golda, O. Protas, M. Obolenskaya // Abstract book of the 9th International Conference on Systems Biology, Gothenburg, Sweden.- 2008. - Р. 186. Особистий внесок здобувача: розробка інструменту.
10. COTRASIF: conservation-aided transcription factor binding site finder / B. Tokovenko, R. Golda // Abstracts of the 6th international conference on bioinformatics of genome regulation and structure, Novosibirsk, Russia. - 2008. - Р. 239. Особистий внесок здобувача: розробка методу та інструменту.
11. In silico prediction and functional analysis of primary interferon-response genes / B. Tokovenko, M. Obolenskaya // Abstracts of the 6th international conference on bioinformatics of genome regulation and structure, Novosibirsk, Russia. - 2008. - Р. 240. Особистий внесок здобувача: визначення генів первинної відповіді на ІФНб.
12. COTRASIF: genomics tool for systems biology / B. Tokovenko, R. Golda, O. Protas, M. Obolenskaya // Abstracts of the 3rd FEBS Advanced Course on Systems Biology: from molecules to function, Alpbach, Austria. - 2009. - Р. 161. Особистий внесок здобувача: розробка та впровадження методів та інструменту.
Анотація
Токовенко Б.Т. Розробка і застосування методів in silico для визначення сайтів зв'язування транскрипційних факторів у еукаріот на прикладі ISGF-3. - Рукопис.
Дисертація на здобуття наукового ступеня кандидата біологічних наук за спеціальністю 03.00.03 - молекулярна біологія. - Інститут молекулярної біології і генетики НАН України, Київ, 2010.
Розроблено вдосконалений метод пошуку сайтів зв'язування транскрипційних факторів (СЗТФ) на основі прихованих моделей Маркова. Показано, що розроблений метод має вищу за метод на основі позиційно-вагових матриць специфічність пошуку СЗТФ. Розроблено загальнодоступний, безкоштовний, простий у використанні онлайн-інструмент COTRASIF для виявлення у промоторах генів еукаріот СЗТФ у масштабах цілих геномів. За допомогою інструменту COTRASIF вперше виявлено 162 гени первинної відповіді на дію інтерферону альфа (ІФНб). Встановлено, що для 61 гена первинної відповіді на ІФНб вже є експериментальні дані, що вказують на їх регуляцію ІФНб. Вперше показано, що ряд генів (Pick1, Grin3a, Gabra2), що відповідають за розвиток та функціонування нервової системи, також можуть регулюватися ІФНб. Розроблено систему оцінки перспективності результатів пошуку СЗТФ, що використовує 3 параметри. Визначено 24 гени-кандидати первинної відповіді на ІФНб для їхньої першочергової експериментальної перевірки.
...Подобные документы
Закон Гомологічних рядів Вавілова. Сутність спадкової мінливості. Характер зміни генотипу. Генні, хромосомні та геномні мутації. Копіювання помилок в генетичному матеріалі. Аналіз мозаїчної структури еукаріот. Вивчення факторів, що викликають мутації.
презентация [38,5 M], добавлен 06.12.2012Хімічний склад вірусів, їх стійкість до навколишнього середовища. Класифікація вірусів, їх репродукція, проникнення в клітину. Реалізація генетичної інформації у вірусів. Збірка вірусних частинок, їх вихід з клітин. Групи вірусів, що викликають інфекції.
курсовая работа [2,2 M], добавлен 10.12.2012Вивчення геному людини в рамках міжнародної програми "Геном людини". Особливості гібридизації клітин у культурі, картування внутрішньо хромосомного і картування за допомогою ДНК-зондів. Можливості використання знань про структуру геному людини в медицині.
курсовая работа [354,6 K], добавлен 21.09.2010Дослідження біологічних особливостей представників класу "Двостулкові молюски", визначення їх значення в природі, житті людини. Характеристика морфологічних, фізіологічних та екологічних особливостей двостулкових молюсків. Особливості систематики класу.
курсовая работа [5,6 M], добавлен 21.09.2010Характеристика ґрунту як середовища проживання мікроорганізмів. Дослідження методів визначення складу мікроорганізмів. Аналіз їх ролі у формуванні ґрунтів та їх родючості. Біологічний кругообіг в ґрунті. Механізм дії мінеральних добрив на мікрофлору.
реферат [96,7 K], добавлен 18.12.2014Зовнішня будова тіла колорадського жука, особливості його внутрішньої будови, розмноження та розповсюдження. Визначення систематичного положення листоїдів, біологічні особливості розвитку виду. Вплив екологічних факторів на розвиток і розмноження комах.
курсовая работа [214,3 K], добавлен 26.03.2019Дослідження морфологічних та екологічних особливостей, фармакологічного застосування пеларгонії. Вивчення способів розмноження, вирощування та догляду за рослиною. Характеристика хвороб та шкідників квітки, методів лікування, використання в озелененні.
дипломная работа [1,5 M], добавлен 29.11.2011Характеристика шкідників і збудників захворювань рослин та їх біології. Дослідження основних факторів патогенності та стійкості. Аналіз взаємозв’язку організмів у біоценозі. Природна регуляція чисельності шкідливих організмів. Вивчення хвороб рослин.
реферат [19,4 K], добавлен 25.10.2013Загальнобіологічна здатність організмів у процесі онтогенезу набувати нових ознак. Роль генетичних і середовищних факторів у проявах спадкової і неспадкової (фенотипової) мінливості. Епігенетика, модифікації, фенокопії, морфози; класифікація мутацій.
презентация [2,1 M], добавлен 04.01.2015Сутність та завдання генної інженерії. Використання ферментів рестрикції у методі рекомбінантних ДНК. Механізми клонування генів і трансформації еукаріот. Методи гібридизації соматичних клітин. Структура та функції гена. Протиріччя критеріїв алелізму.
презентация [3,1 M], добавлен 04.10.2013Зміст та головні етапи процесу формування ґрунту, визначення факторів, що на нього впливають. Зелені рослини як основне джерело органічних речовин, показники їх біологічної продуктивності. Вплив кореневої системи на структуроутворення ґрунтової маси.
реферат [20,8 K], добавлен 11.05.2014Об'єкти і методи онтогенетики. Загальні закономірності і стадії індивідуального розвитку. Генетична детермінація і диференціація клітин. Диференційна активність генів і її регуляція в процесі розвитку. Летальна диференціація клітин за розвитку еукаріотів.
презентация [631,0 K], добавлен 04.10.2013Загальна характеристика та особливості природної флори ксерофітів. Відмінні властивості та розмноження штучно створеної ксенофітної флори. Опис найбільш поширених видів штучної ксерофітної флори, визначення факторів, що впливають на її розвиток.
курсовая работа [27,3 K], добавлен 21.09.2010Структура дезоксирибонуклеїнової та рібонуклеїнової кислоти. Здатність молекул ДНК самовідтворюватися. Хромосоми еукаріот. Мітоз - основний спосіб розмноження еукаріотичних клітин. Стадії мейотичного ділення. Роль ядра в спадковості, генетичний код.
реферат [1,9 M], добавлен 02.06.2011Поняття і рівні регуляції експресії генів. Їх склад і будова, механізм формування і трансформування. Транскрипційний рівень регуляції. Приклад індукції і репресії. Регуляція експресії генів прокаріот, будова оперону. Огляд цього процесу у еукаріот.
презентация [1,7 M], добавлен 28.12.2013Історія дослідження фауни прісноводних молюсків Волині. Географічна характеристика району дослідження. Систематика прісноводних двостулкових молюсків. Вплив факторів зовнішнього середовища на поширення та екологічні особливості прісноводних молюсків.
курсовая работа [87,7 K], добавлен 16.01.2013Хромосомна теорія спадковості. Кросинговер та конверсія генів. Хромосомні типи визначення статі. Експериментальне дослідження особливостей успадкування мутацій "white" та "cut" (відповідно "білі очі" та "зрізані крила") у Drosophila melanogaster.
дипломная работа [1,3 M], добавлен 30.11.2014Історія відкриття та основні гіпотези походження клітинного ядра. Типи клітин та їх схематичне зображення. Форми, типи, будова, компоненти (хроматин, ядерце) ядра еукаріоти, його функції та загальна роль. Ядерний білковий скелет: каріоплазма та матрикс.
презентация [1,1 M], добавлен 30.03.2014Дослідження класифікації і розвитку павуків у ході еволюції. Аналіз особливостей зовнішньої та внутрішньої будови, органів чуттів. Характеристика механізму харчування і розмноження. Способи життя і значення павуків, застосування павутини в промисловості.
курсовая работа [6,8 M], добавлен 16.01.2013Аналіз морфо-біологічних особливостей комах-запилювачів, визначення їх різноманітності. Пристосування ентомофільних рослин і комах до запилення. Характеристика комах-запилювачів з ряду Перетинчастокрилих. Роль представників інших рядів в запиленні рослин.
курсовая работа [3,1 M], добавлен 21.09.2010