Объёмный принцип спектрального представления регуляторов конкатенированного типа
Методы повышения чувствительности при распознавании структурных изменений в сложных системах, представляемых текстами из четырёхбуквенных конкатенаций. Понятие коэффициента насыщенности и преобразование плоскостного представления текстов в объёмное.
Рубрика | Физика и энергетика |
Вид | статья |
Язык | русский |
Дата добавления | 31.08.2018 |
Размер файла | 78,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Самарский государственный технический университет
Объёмный принцип спектрального представления регуляторов конкатенированного типа
Л.С. Бекасов
Аннотация
Предложены методы повышения чувствительности при распознавании структурных изменений в сложных системах, представляемых текстами из четырёхбуквенных конкатенаций. Вводится понятие коэффициента насыщенности и преобразование плоскостного представления текстов в объёмное. Использование этих понятий в сочетании с Фурье-методом на базе модифицированных опорных ортогональных импульсных функций позволяет однозначно различать структурные изменения в конкатенированных текстах любой сложности.
Ключевые слова: GАТC-конкатенации, коэффициент насыщенности, модифицированная базисная система опорных импульсных ортогональных функций, расслоение данных, преобразование ранжирования, спектральные характеристики.
Информационные процессы в живых средах, как известно, определяют работу систем, характеризующихся очень высоким уровнем сложности. Их элементарные компоненты - нуклеотиды четырёх типов аденин (А), гуанин (G), цитозин (C) и тимин (Т) принято считать алфавитом, из которого составляются генетические тексты. Эти элементы при помощи водородных связей могут образовывать комплементарные пары, а именно GC и AT. Формальное описание таких текстов либо их фрагментов представляет большой интерес для биологов, например, для распознавания особенностей в организации отдельных подструктур в генетических конструкциях. В частности, при списывании инструкций, расположенных в генах, ошибка в распознавании хотя бы одной буквы может повлечь за собой исключение реализации непосредственно самого белка, изменение его аминокислотного состава, сбой в считывании самой инструкции, изменение пути сплайсинга (очистки программы синтеза белка от маскированных вставок) и т.д. [1, 2, 3, 4,]. Ещё одна особенность задачи такого распознавания определяется относительно малой величиной распознаваемой цепочки, поскольку именно такие цепочки малой протяжённости являются признаками (метками) либо начал, либо окончаний длины самой инструкции.
Эти факторы обусловливают жесткие требования к формальным методам описания таких текстов.
Исходные GАТC-конкатенации формально могут быть описаны самыми различными математическими методами [5, 6, 7, 8, 9, 10]. Доминирующее место среди этих методов занимают методы, построенные на статистических и спектральных разделах математики, а также матричном исчислении. Однако данные методы в подавляющим большинстве не обладают возможностями как по чувствительности, так и по разрешающей способности по отношению к отдельно взятым буквам подобных текстов.
Ниже приведённые методы формализации сцепленных элементов, в принципе, удовлетворяют таким требованиям распознавания с идеальным разрешением и применимы к анализу любых недетерминированных процессов.
Методы и инструменты. Сущность предлагаемого метода состоит в том, что анализируемая цепочка нуклеотидов
Ф(N) = GATCTTTTTATTTAGA
как некоторая функция количества (рис. 1), рассматривается через объединение элементарных GАТC-подпространств (непересекающихся вложений), т.е.
{}
следовательно, эти подпространства в целом можно представить в системе NYS декартовых координат. Причём в координате S эти подпространства сформированы послойно в виде отдельных система координат, у которых ось абсцисс N отражает однаковое количество N нуклеотидов, а оси ординат Y показывают ранжированный уровень нуклеотидов, соответствующих некоторому физическому критерию, в частности молекулярной массе. Такое ранжирование предусматривает замену нуклеотидов следующим образом: Гуанин (G)=4, Аденин (А)=3, Тимин Т=2, Цитозин (С)=1 [11]. Далее условимся, что оси абсцисс находятся в одной плоскости Р с одинаковыми расстояниями д между ними. Упростим задачу и представим на оси ординат всех подпространств лишь бинарное значение уровня нуклеотидов, как показано на рис. 2.
Рис. 1. Фрагмент анализируемой GАТC-нуклеотидной последовательности длиной в 16 пар оснований (oriC) в области точки начала репликации хромосомы K-12 E.coli (заимствовано из работы Г.И. Кравацкой)
Из рис. 2 следует, что двумерное представление сгруппированных данных по рис. 1 преобразовалось в трёхмерную систему координат, т.е. образовались расслоённые GАТC-пространства, находящиеся на равных расстояниях друг от друга по оси S. Причём за пределами GАТC-пространств , а внутри этих пространств . На следующем этапе вводится дифференциальная оценка места положения каждой координатной системы на оси S. Будем различать два типа значений , а именно и . Символ означает число (сумму) интервалов , находящихся между координатами и (в частности S3), а символ определяет число интервалов, находящихся между (S0) и . Принцип этого расслоения формулируется в следующем виде:
(1)
Применительно к анализу фрагмента Ф(N) (см. рис. 1) по рис. 2 получим следующие дифференциальные оценки расслоённых систем координат:
чувствительность распознавание четырёхбуквенный конкатенация
Рис. 2. Бинарное представление расслоённой GАТC-конкатенации по рис. 1
Таким образом, единичные значения на расслоённых осях можно ретрансформировать в исходное состояние (по рис.1) следующими ранжированными категориями, заимствованными из координаты S: G-импульсы представятся уровнем, равным 3, а импульсы A-, T-, C- соответственно уровнями 1, -1 и -3. Множество 3; -3; 1; -1 уровней, полученное таким способом, имеет характер кольца. В работе [12] с целью оценки отношений сцепок из соседних нуклеотидов использовались иные критерии, в частности энергия водородной связи, предложенная Полтевым и его коллегами в [13]. Числовой эквивалент ранжирования этих отношений имел тот же самый кольцевой характер.
Нелишне напомнить, что целью работы является оптимизация (в смысле точности, чувствительности и динамической разрешающей способности) формального представления сцепленных элементов, но не их физиологических возможностей, так как смена изначального ранжирования по другому критерию даст численно иной результат. Ниже при ранжировании нуклеотидов в качестве критерия условимся использовать молекулярную массу. Ещё одна особенность состоит в том, что разность по модулю между двумя пуринами/пиримидинами равна двум, тогда как та же разность при ранжировании по молекулярной массе равна единице.
Другой способ формализации предусматривает применение к расслоённой GАТC-конкатенации коэффициента насыщенности [14] раздельно для каждого нуклеотида в соответствии с выражением [14]:
(2)
где - сумма логических единиц в данном подмножестве; - длина всей пачки (r - целое число).
Сумма таких коэффициентов для конкатенации в целом будет характеризовать её однозначно, а именно:
Поскольку известными методами (аналоговыми и дискретными) невозможно получить данные о спектральных свойствах и временной структуре сигнала, что утверждается в [15], ниже предлагается использовать модифицированную базисную комплексную систему импульсных функций, с помощью которой можно получить спектр, отвечающий указанным требованиям. Эта система функций определяется на дискретном множестве
(3)
и имеет вид
(4)
где - число подинтервалов, составляющих период некоторого подлежащего анализу дискретного сигнала f(l).
Функции и формируются на основе вспомогательных функций ипосредством их сдвигов на k подинтервалов, где .
Функции и определяются как
(5)
В случае и l, изменяющегося от 0 до с шагом ,
(6)
(7)
Если l принимает другие значения, то .
e(l-m) представляет собой единичный импульс, определяемый из следующих условий:
(8)
Формирование амплитудно-частотного спектра анализируемого сигнала f(l) осуществляется в соответствии с выражением
, (9)
где
(10)
- значение анализируемого сигнала в точке , где
- значение анализируемого сигнала в точке , где
Амплитудно-частотный спектр, полученный в соответствии с выражением (10), является инвариантным к временным сдвигам сигнала
Результаты и обсуждения. Оценка эффективности рассмотренного метода ниже представляется спектральными характеристиками (табл. 1) последовательности Ф(N) путём применения к ней преобразования Фурье с нелинейно модифицированными ортогональными базисными функциями применительно к плоскостному Ф(N) и объёмному принципам ранжирования.
Таблица 1. Таблица спектральных характеристик с различными форматами ранжирования конкатенированных элементов
Плоскостное ранжирование Ф(N) |
Объёмное ранжирование |
|||
F0 |
28,295 |
F0 |
16,5576 |
|
F1 |
6,4142 |
F1 |
12.8204 |
|
F2 |
5,9906 |
F2 |
10,1289 |
|
F3 |
3,0000 |
F3 |
6,0000 |
Далее следует обратить внимание на два типа принципиально различных структурных изменений в анализируемой по рис.1 конкатенации.
В первом случае количество G, A, T, и C элементов в пачке неизменно, но эти элементы перегруппировались. Теперь эта пачка записывается как
Ф*(N)=GATTTTTTATTCAGA
Этот случай показан на рис. 3.
По сравнению с рис.1 здесь поменялись местами элементы С и Т. Элемент С переместился с третьей позиции на двенадцатую, а элемент Т с двенадцатой позиции сместился на третью.
Рис. 3. Модифицированный фрагмент анализируемой GАТC-нуклеотидной последовательности длиной в 16 пар по рис. 1, в котором поменялись местами элементы С (занимал третью позицию) и Т (занимал двенадцатую позицию)
Соответственно изменились спектральные характеристики (табл. 2), тогда как коэффициент насыщенности не изменился, поскольку количество элементов в каждом из подпространств осталось неизменным.
Во втором случае происходят структурные изменения иного характера, т.е. перераспределяется количество элементов в подпространствах, тогда как в целом число элементов в пачке остаётся постоянным (N-const.). Пусть исходная конкатенация имеет вид Ф**(N)=GATCTTTTGATTTAGA (на девятой позиции элемент Т заместился элементом G).
Теперь эти подпространства количественно определяются следующим образом. Имеется три элемента G, четыре элемента A, восемь элементов T и один элемент С. В этом случае спектральные характеристики изменились (представлены табл. 3), и изменился также коэффициент насыщенности. Теперь коэффициенты имеют значения
Таблица 2. Спектральные характеристики структурно модифицированных фрагментов регулятора
Объёмное ранжирование |
||||
Ф*(N) |
Ф**(N) |
|||
F*0 |
16,5576 |
F**0 |
16,5576 |
|
F*1 |
12.8204 |
F**1 |
12,4721 |
|
F*2 |
10,1289 |
F**2 |
10,0305 |
|
F*3 |
6,0000 |
F**3 |
4,4721 |
Анализ полученных двух таблиц позволяет сделать следующие выводы.
1. Применение процедуры расслоения позволило использовать новый критерий ранжирования элементов конкатенации, а именно дифференциальную разность между отдельными координатами, которая имеет свойство кольцевой группы чисел. Использование этого критерия ранжирования при получении спектральных характеристик позволило удвоить чувствительность Фурье-метода, применяемого для этих целей при идеальном разрешении.
2. Предложенный выше коэффициент г насыщенности для оценки расслоённого подмножества данных в сочетании с гармоническим анализом четко указывает на характер структурных изменений в исходной конкатенации. В частности, стабильное значение этого критерия указывает на количественную стабильность элементов данного подмножества в пределах анализируемой конкатенации, тогда как спектральная характеристика меняется, о чём свидетельствует сопоставление значений F(N) и Ц (N) (см. табл. 1 и 2).
3. Перемещение элементов по двум координатам S и N привело соответственно к изменениям величины коэффициента г и спектральных характеристик Ц**(N). Первоначальное значение суммарного коэффициента составляло величину , а после модификации получило значение , что указывает на структурное изменение по двум составляющим. Анализируя коэффициенты насыщенности г послойно, легко видеть конкретное значение модификации.
Библиографический список
1. Лозовская Е. От гена к белку через сплайсинг. http://www.inauka.ru/science/artikel69 210.html.
2. Информационный справочный ресурс по биологии. http://www. cellbiol. ru/book /molekulyarnaya_biologiya/processing_rnk/splajsing
3. Марков A. Почти все человеческие гены кодируют более одного белка. http://bio.fizteh.ru /student biotech /2008/altertative_splis_09112008.html?xsl:print=1
4. Марков A. Новый механизм генной регуляции без участи белков.
5. В.В. Налимов. Теоретическая биология? Ее все еще нет… http://www.biometrica.tomsk.ru/index.htm.
6 Statistical Methods for DNA Sequence Segmentation. J.V. Braun, H-G.Muller // Statistical Science. - 1998. - Vol. 13. - №2. - 142-162.
7 Петухов Н.Н. Бипериодическая таблица генетического кода и число протонов. - М., 2001 (http://members. tripod.com/vismath/sg/petoukhov.htm).
6. Статистические флуктуации в процессах регуляции экспрессии генов: рассмотрение с точки зрения статистической механики / Ю.Д. Нечипуренко, А.М. Вольф, Г.В. Гурский // Молекулярная биофизика. - 2003. - Том 48. - Вып. 6. - 986-997 с.
7. Сходство периодических структур в расположении нуклеотидов на участках начала репликации бактериальных геномов / Г.И. Кравацкая, Г.К. Франк, В.Ю. Макеев, Н.Г. Есипова // Биофизика. - 2002. - Том 47. - Вып. 4. - 595-599 с.
8. A novel Lie algebra of the gene3tic code jver the Galois field of four DNA bases Robersy Sanchez, Ricardo Grau, Eberto Morgado // Mathematical Biosciences. - 202 (2006). - 156-174.
9. Бекасов Л.С. Моделирование сайтов узнавания // Вестник Самар. гос. техн. ун-та. Сер. Технические науки. - 2009. - Вып. 41. - С. 59-64.
10. Бекасов Л.С., Тверетин А.А. Методы представления генетической информации // Вестник Самар. гос. техн. ун-та. Сер. Физико-математические науки. - 2007. - Вып. 14. - С. 129-134.
11. Взаимодействия между основаниями нуклеиновых кислот. Новые параметры потенциалов и новые минимумы энергии / В.И. Полтев, А.С. Дерябина, Э. Гонзалес, Т.И. Грохлина // Биофизика. - 2002. - Т. 47. - С. 996-1004.
12. Бекасов Л.С., Васильева Л.П., Лапаева М.М. Распознавание структурной организации конкатенированных текстов с минимальным синтаксисом и неопределённой семантикой //Актуальные проблемы информационной безопасности. Теория и практика использования программно-аппаратных средств: Тр. Всерос. конф. с международ. участием. - Самара, 2008. - С. 32-37.
13. Bachrushina G.I., Bachrushin A.P. Development and Investigation of a New Rectangular Orthogonal System Functions for Invariant Object Recognition // Proceedings of the Sixth International Conference «Advanced Computer Systems» / Szezecin-Poland. - 1999, November. - P. 64-67.
Размещено на Allbest.ru
...Подобные документы
История исследования элементарных частиц и фундаментальных взаимодействий. Минимальная модель электрослабого взаимодействия Глэшоу-Вайнберга-Салама и квантовой хромодинамики. Современные представления об иерархии структурных элементов микромира.
реферат [42,1 K], добавлен 30.01.2013Выбор системы освещения, нормированной освещенности, источника света и типа светильника с учетом технико-экономических показателей и необходимого спектрального состава. Порядок расчета мощности осветительной нагрузки методом коэффициента использования.
контрольная работа [116,5 K], добавлен 21.04.2016Развитие взглядов на электричество от древнейших времен и до наших дней. Представления человека о природе электрического тока. Основные открытия электрики. Исследования Гилберта, Герике. Опыт Милликена. Современные представления об электрическом токе.
реферат [378,3 K], добавлен 24.06.2008Эффект Шпольского. Методы количественного анализа Факторы, влияющие на точность спектрального анализа. Физические процессы, обусловленные двухквантовыми реакциями. Спектрофлуориметрическая установка для спектральных и кинетических измерений.
курсовая работа [403,2 K], добавлен 06.04.2007Способы представления гармонических колебаний. Сложение взаимно перпендикулярных колебаний. Аналитический, графический и геометрический способы представления гармонических колебаний. Амплитуда результирующего колебания. Понятие некогерентных колебаний.
презентация [4,1 M], добавлен 14.03.2016Принципы неклассической физики. Современные представления о материи, пространстве и времени. Основные идеи и принципы квантовой физики. Современные представления об элементарных частицах. Структура микромира. Фундаментальные физические взаимодействия.
реферат [52,2 K], добавлен 30.10.2007Понятие и содержание, классификация погрешностей по форме представления, причине появления и характеру проявления и способам измерения. Погрешность измерения и принцип неопределенности Гейзенберга, методика и подходы к ее оценке в современных условиях.
реферат [18,4 K], добавлен 09.01.2015Особенности жидкого состояния вещества. Изменения свойств веществ при изменении агрегатного состояния. Современные представления о структуре металлической жидкости. Влияние микронеоднородности металлических расплавов на их физико-химические свойства.
курсовая работа [419,9 K], добавлен 17.12.2011Общие закономерности, которыми обладают колебательные процессы в системах различной физической природы. Место колебательных процессов в науке и технике. Понятие бифуркации, ее типы. Бифуркация типа вил. Появление в физических системах предельных циклов.
реферат [299,1 K], добавлен 17.09.2009Квантово-механическая система: теории представлений волновой функции (амплитудой вероятности). Обозначения Дирака: вектор состояния в n-мерном гильбертовом пространстве. Преобразование операторов от одного представления к другому, эрмитовы матрицы.
реферат [150,1 K], добавлен 31.03.2011Представления о нанообъектах в физике, химии. Примеры областей существования метастабильного однокомпонентного пара. Потеря монотонности и непрерывности поверхностей фазовых равновесий и спинодальных условий. Эмпирические поверхности скоростей нуклеации.
дипломная работа [440,7 K], добавлен 23.02.2012Математические модели оптимизационных задач электроснабжения. Обзор способов повышения коэффициента мощности и качества электроэнергии. Выбор оптимальных параметров установки продольно-поперечной компенсации. Принцип работы тиристорного компенсатора.
дипломная работа [986,2 K], добавлен 30.07.2015Изучение спектров пропускания резонансных нейтронов проб урана различного обогащения. Устройство и принцип работы времяпролетного спектрометра на основе ускорителя электронов. Контроль изотопного состава урана путем нейтронного спектрального анализа.
дипломная работа [1,8 M], добавлен 16.07.2015Виды отображений в физике. Относительные скорости инерциальных систем. Эффекты, связанные с постоянством скорости света в инерциальных системах. Закон "преломления" луча. Эффекты при вращательном движении. Применение модифицированного преобразования.
реферат [181,9 K], добавлен 15.12.2009Строение и свойства ионосферы, модели; представления о природе шумового фона и образовании ионосферного альфвеновского резонатора. Расчет коэффициента отражения волн, представление данных в виде спектрограмм. Результаты наблюдений резонансных структур.
дипломная работа [9,0 M], добавлен 30.04.2011Структуризация теплоэнергетической системы в рамках ее модельного представления. Теория подобия в теплопередаче. Анализ пространственно-энергетического состояния децентрализованной системы отопления. Расчет коэффициента эффективности работы конвектора.
дипломная работа [2,8 M], добавлен 15.02.2017Характеристика приближенных методов определения коэффициента трения скольжения, особенности его расчета для различных материалов. Значение и расчет силы трения по закону Кулона. Устройство и принцип действия установки для определения коэффициента трения.
лабораторная работа [18,0 K], добавлен 12.01.2010Определение теплоты сгорания топлива, объемов продуктов сгорания. Определение коэффициента теплоотдачи в теплообменнике. Уравнение теплового баланса для контактного теплообменника. Подбор и расчет газогорелочных устройств в системах теплогазоснабжения.
курсовая работа [243,8 K], добавлен 07.04.2015Расчет мощности и выбор типа двигателя постоянного тока. Вычисление катодного дросселя, подбор типа преобразователя и элементов регуляторов тока и скорости. Разработка принципиальной схемы управления электроприводом подъемной тележки и её описание.
курсовая работа [225,3 K], добавлен 04.08.2011Развитие представления о пространстве и времени. Парадигма научной фантастики. Принцип относительности и законы сохранения. Абсолютность скорости света. Парадокс замкнутых мировых линий. Замедление хода времени в зависимости от скорости движения.
реферат [21,5 K], добавлен 10.05.2009