Складність задач та ефективність процедур розпізнавання
Розробка методів розпізнавання вторинної структури білків на основі байєсівської процедури розпізнавання на нестаціонарних ланцюгах Маркова. Дослідження особливостей запису генетичної інформації в послідовностях ДНК людини та геномах вищих організмів.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | автореферат |
Язык | украинский |
Дата добавления | 26.07.2014 |
Размер файла | 57,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
На основе статистического критерия ч2 разработан аппарат распознавания гипотез относительно определения стационарности (нестационарности) переходных вероятностей для моделей цепей Маркова, а также определения порядка цепи.
Построен и экспериментально подтвержден эффективный метод распознавания вторичной структуры белков на основе байесовской процедуры на моделях цепей Маркова. Задача ставится таким образом: необходимо по полученной на вход аминокислотной последовательности определить вторичную структуру исходной последовательности. Делается предположение, что на состояние каждой аминокислоты влияют состояния ближайших соседей. Решение относительно состояния принимается на основе подсчета переходных вероятностей, которые оцениваются по обучающим выборкам. Распознавая все белки из данной обучающей выборки, и сравнивая полученный результат с действительным, получаем точность метода. Проведен обзор современных методов распознавания вторичной структуры белков и определено среди них место разработанного в диссертации метода. Наибольшая точность распознавания достигается при использовании модели нестационарной цепи Маркова порядка 3 и составляет 79,5%. Эту точность можно улучшить, используя методы распознавания состояний пар или троек аминокислот.
Исследования проведены на фактическом материале - последовательности белков загружены с публично доступных серверов NCBI (National Center of Biotechnology Information); всего более двадцати тысяч белков. Проанализирована точность распознавания для моделей стационарной и нестационарной цепи Маркова (для четырех порядков цепи). Вычисления проведены на кластерном 32-узловом компьютере «СКИТ-1» и 64-узловом «СКИТ-2». Показано, что без использования суперкомпьютера, поставленные вычислительные задачи решить невозможно.
Определен порядок модели цепи Маркова путем решения серии задач распознавания гипотез с использованием критерия ч2. Проведен статистический анализ генома человека, с помощью кластерных компьютеров выведены новые соотношения комплементарности в записи генетической информации по одной нити ДНК.
Ключевые слова: биоинформатика, байесовская процедура распознавания, оценка погрешности процедуры, нестационарная цепь Маркова, вторичная структура белка, статистический анализ ДНК.
Vasylyev S.V. Tasks complexity and effectiveness of recognition procedures. - Manuscript.
Dissertation for a candidate's scientific degree of physical and mathematical science by speciality 01.05.01 - theoretical bases of informatics and cybernetics. - The V.M. Glushkov Institute of cybernetics of National Academy of Sciences of Ukraine, Kyiv, 2008.
Determined lower and upper scores of accuracy of Bayesian recognition procedure are built in discrete case for independent criterions. Derived scores are polynomial from such input parameters as class sizes in learning sample, criterions count, and quantity of criterion values.
Effective method of protein secondary structure prediction based on Bayesian recognition procedure on Markov chains is built and experimentally confirmed. Information for learning sample is taken from opened genetics and biology databases NCBI. Markov chain order is defined by means of solving tasks of hypothesis determining with ч2-criteria use. Statistical analysis of human DNA is made; new interest complementary relationships in nucleotide disposition are given and confirmed using cluster computers for Markov chain models with orders higher than one.
Key words: bioinformatics, Bayesian recognition procedure, procedure accuracy score, non-stationary Markov chain, protein secondary structure, statistical analysis of DNA.
Размещено на Allbest.ru
...Подобные документы
Комп’ютерне моделювання системи сегментації та розпізнавання облич на зображеннях. Підвищення швидкодії моделювання за кольором шкіри та покращення якості розпізнавання при застосуванні робастних boosting-методів. Розробка алгоритмів функціонування.
дипломная работа [1,6 M], добавлен 02.07.2014Сегментація і нормалізація зображень. Основні функціональні можливості та режими роботи комплексу розпізнавання письмового тексту. Розробка комплексу оптичного розпізнавання символів. Шрифтові та безшрифтові алгоритми розпізнавання друкованого тексту.
курсовая работа [1,7 M], добавлен 19.05.2014Розробка, дослідження та реалізація методів вирішення завдань аналізу, розпізнавання і оцінювання зображень як один із провідних напрямків інформатики. Класифікація та аналіз існуючих методів розпізнавання образів, переваги та недоліки їх застосування.
статья [525,8 K], добавлен 19.09.2017Огляд методів розпізнавання образів. Основні ідеї інформаційно-екстремального методу розпізнавання рукописних символів. Критерій оптимізації параметрів функціонування даної системи. Інформаційне та програмне забезпечення обробки рукописних символів.
дипломная работа [291,0 K], добавлен 14.10.2010Ознайомлення із загальною структурою системи автоматичного розпізнавання мовлення. Визначення особливостей нейронних мереж. Дослідження та характеристика процесу побудови системи розпізнавання мовлення. Вивчення специфіки прихованої моделі Маркова.
дипломная работа [1,1 M], добавлен 25.07.2022Історія досліджень, пов’язаних з розпізнаванням образів, його практичне використання. Методи розпізнавання образів: метод перебору, глибокий аналіз характеристик образу, використання штучних нейронних мереж. Характерні риси й типи завдань розпізнавання.
реферат [61,7 K], добавлен 23.12.2013Огляд інтелектуальних принципів організації процесу розпізнавання символів. Розробка системи безклавіатурного введення документів у комп’ютер. Опис і обґрунтування проектних рішень; розрахунки і експериментальні дані; впровадження системи в експлуатацію.
дипломная работа [182,5 K], добавлен 07.05.2012Системи розпізнавання обличчя. Призначення та область застосування програми "Пошук обличчя люди у відеопотоках стандарту MPEG-4". Штучна нейронна мережа, локалізація та розпізнавання обличчя. Методи, засновані на геометричних характеристиках обличчя.
курсовая работа [1,8 M], добавлен 27.03.2010Специфіка застосування нейронних мереж. Огляд програмних засобів, що використовують нейронні мережі. Побудова загальної моделі згорткової нейронної мережі. Реалізація нейромережного модулю розпізнавання символів на прикладі номерних знаків автомобілів.
дипломная работа [3,4 M], добавлен 15.03.2022Алгоритм оптичного розпізнавання образів. Універсальність таких алгоритмів. Технологічність, зручність у процесі використання програми. Два класи алгоритмів розпізнавання друкованих символів: шрифтовий та безшрифтовий. технологія підготовки бази даних.
реферат [24,5 K], добавлен 19.11.2008Розробка методів вирішення завдань аналізу, розпізнавання, оцінювання зображень як одних з провідних напрямків інформатики. Описання методу пошуку співпадіння об’єкту-цілі з міткою-прицілом на заданому відеоряді. Виявлення об’єкта на цифровому зображенні.
статья [138,7 K], добавлен 21.09.2017Актуальність сучасної системи оптичного розпізнавання символів. Призначення даних систем для автоматичного введення друкованих документів в комп'ютер. Послідовність стадій процесу введення документу в комп'ютер. Нові можливості програми FineReader 5.0.
курсовая работа [4,5 M], добавлен 29.09.2010Принципи побудови та функціонування алгоритмів розпізнавання та виправлення помилок в кодових послідовностях. Переклад символів імені у послідовність цифр 16-річної системи числення. Заміна на протилежне значення біту і можливість його виправлення.
курсовая работа [660,0 K], добавлен 02.10.2010Навчання штучних нейронних мереж, особливості їх використання для вирішення практичних завдань. Рецепторна структура сприйняття інформації. Перцептрон як модель розпізнавання. Задача моделювання штучної нейронної мережі з розпаралелюванням процесів.
дипломная работа [2,8 M], добавлен 24.07.2013Клавіатури та маніпулятори, принципи їх дії, основні характеристики та застосування. Графічні планшети та сенсорні екрани. Автоматичні засоби вводу графічної інформації. Програма Fine Reader 4. Сканування та автоматичне розпізнавання документів.
курсовая работа [3,8 M], добавлен 30.03.2017Структура сучасних систем виявлення вторгнень (СВВ), аналіз її методів і моделей. Характеристика основних напрямків розпізнавання порушень безпеки захищених систем в сучасних СВВ. Перелік недоліків існуючих СВВ та обґрунтування напрямків їх вдосконалення.
реферат [467,9 K], добавлен 12.03.2010Аналіз сучасних методів тестування та практичних особливостей проведення тестового контролю. Основи побудови інформаційно-математичної моделі. Алгоритм запису інформації в таблицю бази даних. Характеристика та шляхи розробки інтерфейсу редактора тестів.
курсовая работа [1,7 M], добавлен 08.10.2010Елементи прихованої марківської моделі. Матриця ймовірностей переходів (або матриця переходів). Розподіл ймовірностей початкового стану. Розпізнавання мовлення із великих словників для ізольовано вимовлених слів. Попередня обробка мовного сигналу.
курсовая работа [175,1 K], добавлен 13.04.2009Методи побудови довірчих інтервалів для невідомої імовірності. Оцінка неоднорідності генеральної сукупності за допомогою лінійних сплайнів. Непараметричні критерії еквівалентності генеральних сукупностей за допомогою мір близькості між вибірками.
автореферат [32,7 K], добавлен 06.04.2009Загальна характеристика скінченних автоматів. Недетермінований скінченний автомат. Автоматні граматики та розпізнавачі. Автомати з вихідним перетворювачем: Мілі й Мура. Використання кінцевих автоматів для розпізнавання протоколів регулярних виразів.
курсовая работа [189,3 K], добавлен 15.09.2012