Основы биометрии
Описание этапов проведения теоретических и экспериментальных исследований в биометрии. Анализ порядка проведения поисковых опытов. Определение необходимого объема выборки. Рекомендации по планированию, проведению эксперимента и обработке данных.
Рубрика | Биология и естествознание |
Вид | курс лекций |
Язык | русский |
Дата добавления | 29.09.2017 |
Размер файла | 200,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
n= 8(СV /)2 (13а), n = 0,16CV2 (13б).
Это условие особенно важно соблюдать, в случае если различие между сравниваемыми выборками составляет больше семи процентов (7, nn).
Поскольку среднеквадратическое отклонение () при использовании метода альтернативного варьирования зависит от средней величины (М), то необходимое количество измерений связано с данным параметром, который может изменяться от 0 до 100% (рис 3).
Рис. 3. Зависимость минимального количества измерений, необходимых для получения достоверности различия двух сравниваемых выборок, от показателя расхождения средних величин сравниваемых выборок (М) при различной вероятности реализуемого события (М) (метод альтернативного варьирования при уровне надежности 0,95).
5.3 Формулы приближенной оценки статистических показателей
Исключение грубых ошибок
Одним из критериев исключения промахов основан на правиле трех сигм. Вероятность того, что ошибка измерения по абсолютной величине выйдет за пределы трех сигм, довольно мала. Поэтому величину 3 условно можно считать предельной границей ошибок измерений. Рассчитывают величину 3 и сравнивают ее с разностью между резко отклоняющейся вариантой и М для данного ряда. Если Хмакс.- М или М- Хмин больше 3, то такой результат считают грубой ошибкой и его исключают из выборки.
Х-xi 3 (14).
Определение величины среднеквадратического отклонения
Приближенное значение величины среднеквадратического отклонения удобно определять при помощи данной формулы [7]:
(xmax- xmin) h (15),
где:
- среднеквадратическое отклонение, xmax и xmin - минимальное и максимальное значение выборки, h - табличный коэффициент определяется из таблицы 7.
Таблица 7. Зависимость коэффициента - h от количества измерений - n.
n |
215 |
615 |
1649 |
50200 |
|
h |
2 |
3 |
4 |
5 |
Определение минимального количества измерений, необходимое для приближенной оценки основных статистических показателей
1. Для количественного метода обычно используются малые выборки (n30) вследствие низкого коэффициента вариации. Таким образом, основные статистические параметры можно выразить следующим образом:
а) среднее значение выборки 0,5(xmax+xmin);
б) приближенная величина среднеквадратического отклонения определяется из ф(15) и таблицы (7) для n=41, если x - разность между максимальным и минимальным значениями данной выборки xxmax-xmin:
;
в) коэффициент вариации - Cv =100из ф(5), следовательно:
Cv 50х;
г) Уровень значимости оценки (относительная ошибка выборки - ) для уровня надежности Р= 95% , соответственно для n=41 из таблицы (8) определения критерия Стьюдента - t.
Cv.
Таблица 8. Значения t-критерия Стьюдента
t(n) |
Количество измерений - n |
||||||
3 |
7 |
10 |
20 |
30 |
100 |
||
3,18 |
2,36 |
2,23 |
2,09 |
2,04 |
1,98 |
||
tn |
1,84 |
0,89 |
0,71 |
0,47 |
0,371 |
0,20 |
|
t5 |
0,64 |
0,47 |
0,45 |
0,42 |
0,41 |
0,4 |
|
t10 |
0,32 |
0,24 |
0,22 |
0,21 |
0,2 |
0,2 |
д) Минимальное количество измерений, необходимое для получения достоверного результата в одной выборке - n0 и в двух сравниваемых выборках - n, при относительном показателе расхождения средних величин сравниваемых выборок - = 10%:
n0 n = 100·.
2. Для качественного метода применимы большие выборки (n30), из таблицы (9):
, где xxmax-xmin ; b) Cv 25х,
где 0,5(xmax+xmin);
c) 0,5Cv ; d) n0 ; e) n0 ; f) n при = 10%.
Следует отметить, что более предпочтительно использовать количественный статистический анализ в сопоставлении с качественным [13]. В случае если качественную оценку биообъекта можно разбить более чем на две группы и количественно оценить их средние показатели, то это дает возможность использования количественных методов статистического анализа. Например, применение количественного метода статистической обработки для оценки жизнеспособности эмбрионов млекопитающих дает возможность снизить количество измерений более чем в десять раз, по сравнению с качественным методом, за счет уменьшения величины ошибки среднеквадратического отклонения при условии получения достоверного результата (табл. 9).
Табл. 9. Способы оценки технологии криоконсервации эмбрионов крупного рогатого скота при помощи различных методов статистического анализа.
Качественный |
Количественный |
|||||||
N |
Показатели биообъекта |
Сохранность Сn=k/n, % |
Жизнеспособность , % |
Выживаемость Wn+1=Sn+1/Sn, % |
||||
Mm для n=10 |
Mm для n=10 |
Mm для n=10 |
||||||
1 |
Свежеполученного |
1 |
1000 |
4 |
901,7 |
_ |
_ |
|
2 |
Деконсервированного |
178 |
909,5 |
5 |
88,51,8 |
6 |
98,31,5 |
|
3 |
Культивированного |
400 |
8012,7 |
5 |
861,8 |
7 |
96,61,6 |
- количество измерений, необходимое для получения достоверного среднего значения; n- количество эмбрионов в данном опыте, k- количество эмбрионов, пригодных к пересадке, M - средняя величина показателя; m - ошибка средней величины, Si- жизнеспособность эмбрионов различного качества отличного 955, хорошего 855, удовлетворительного 705.
Следующим этапом моделирования является создание схемы проведения исследования. Осуществление этого наиболее удобно в виде таблицы отражающей связь целевой функции и задающих ее параметров. Далее в ходе проведения поисковых опытов и основного эксперимента осуществляется заполнение данной таблицы, что дает возможность установить характер связи между функцией и ее аргументом на основании чего построить математическую зависимость. Установив в ходе поискового опыта основные статистические величины изучаемых явлений, такие как среднее арифметическое и среднеквадратическое отклонение, можно приступать к моделированию эксперимента.
Полученные формулы можно систематизировать в виде таблицы следующим образом:
Таблица 10. Способы приближенной оценки основных статистических показателей
Статистический анализ |
nmin |
X |
Cv |
n0 (n,=5) |
n, =10 |
||||
Количественный |
41 |
||||||||
Полуколичественный |
105 |
||||||||
Качественный |
205 |
nmin - минимальное количество измерений, необходимое для приближенной оценки основных статистических показателей, для качественного метода (альтернативного варьирования) n - общее количество измерений, n1 - количество измерений с заданным признаком.
Убедившись в возможности реализации необходимого количества измерений в данном планируемом эксперименте, в ходе выполнения 1ч3 этапов построения его модели, можно приступать к проведению основных опытов. Моделирование основного эксперимента в ходе проведения поисковых опытов позволяет исследователю получить при завершении работы достоверный научный результат.
Вопросы для самоконтроля.
1 Для какой цели производится оценка минимального количества измерений для одной выборки?
2 В чем заключается основное отличие объема выборок полученных при качественном и количественом методах проведения статистического анализа?
3 Какова необходимость оценки минимального количества измерений для двух сравниваемых выборок?
4 Напишите формулы приблизительной и точной оценки величины среднего арифметического и среднего квадратического отклонения.
5 Обоснуйте необходимость проведения 1ч3 этапов моделирования эксперимента.
Лекция 6. Проведение эксперимента
План лекции:
1 Соблюдение условий равноточности измерений
2 Вычисление средней взвешенной величины и ее ошибки
3 Сравнение средних значений для определения существенности различия между двумя вариационными рядами
4 Определение нормированного отклонения
6.1 Соблюдение условий равноточности измерений
При разработке рабочей гипотезы устанавливают факторы, определяющие развитие явления. Иначе говоря, устанавливают независимые переменные (аргументы аj, bj), определяющие изменение зависимой переменной функции С ф(1). Исследователь, наблюдая в опыте за развитием явления при воздействии факторов, получает материал или данные исследования.
В опытах измеряют или отмечают величины и качественные показатели, характеризующие как факторы (аргументы аj, bj), так и показатели развития явления (целевую функцию С).
Изучение суммарного влияния многих количественно неопределенных факторов, сочетающихся в произвольных и непонятных для исследователя соотношениях, часто приводит к неясным закономерностям и ошибочным выводам. В таких случаях следует все факторы, обуславливающие явления, разделить на основные аj, bj , оказывающие наибольшее влияние на развитие явления, и дополнительные dj, влияющие на развитие явления второстепенно. Тогда в опыте измеряют или отмечают лишь величины и свойства, характеризующие основные факторы [14].
Чтобы устранить или, по крайней мере, уменьшить ошибку, появляющуюся вследствие деления основных факторов на аj - поддающиеся изменениям в ходе эксперимента и bj - не поддающиеся, надо при постановке опытов стремиться нейтрализовать вариацию bj факторов. То есть создать такие условия, при которых действия bj факторов было бы возможно более неизменно и незначительно, а величины и свойства, характеризующие эти факторы, приближались бы к постоянным. При этом исследователь должен стремиться сделать переменными величинами лишь aj факторы. Таким образом, общим принципом исследования является постоянство всех остальных факторов при изменении избранных aj. Тестом на соблюдение выше перечисленных условий является критерий равноточности измерений.
Измерения, дающие дисперсии одинаковой величины, называются равноточными. Равноточность измерений серии опытов позволяет обобщить обработку результатов экспериментов и уменьшает суммарные ошибки исследования. Практически добиться равноточности измерений можно только в тех случаях, когда измерения будет проводить достаточно опытный человек одним и тем же прибором в одинаковых условиях.
Условием равноточности опытов является критерий Фишера F, который определяется из таблиц (см. приложение, табл. 3.).
(16),
где: 1 и 2 - среднеквадратические отклонения разных серий опытов, 1 2.
В случае если вычисленное значение критерия Фишера окажется меньше или равным табличному (FFТ), то результаты считаются равноточными. В некоторых случаях неравноточность приводит к несравнимым результатам, к ошибочным выводам и заключениям, поэтому надо всегда добиваться равноточности измерений исследуемых величин. Для избежания получения искажения объективной информации также необходимо исключить грубые ошибки, которые возникают при проведении измерений.
Обобщение результатов эксперимента, полученных в различных опытах, проводят при помощи вычисления средневзвешенной величины и ее ошибки.
6.2 Вычисление средней взвешенной величины и ее ошибки
Если каждое значение варьирующего признака представлено в вариационном ряду не одним, а несколькими наблюдениями, и при этом условие равноточности опытов соблюдено, то формула для вычисления средней арифметической заменяется взвешенной средней. При объединении групповых средних их весами будут объемы групп ni, по которым эти средние вычислены. Общую (взвешенную) среднюю арифметическую и ее ошибку нескольких однородных групп определяют по формуле:
(3б), (6б),
где: - число независимых выборочных групп.
Выражения для вычисления средней взвешенной позволяют использовать литературные данные (при условии выполнения выше изложенных условий), что существенно может облегчить обеспечение требуемой достоверности результатов. В случае, если исследователь наблюдает расхождение двух величин целевых функций С ф(1), полученных при измерении изучаемых факторов аi, то достоверность данного расхождения можно подтвердить при помощи критерия Стьюдента.
6.2 Сравнение средних значений для определения существенности Различия между двумя вариационными рядами
Для выяснения вопроса о случайном или неслучайном расхождении значений некоторого параметра проводят две серии экспериментов и для каждой из них подсчитывают средние значения М1 и М2. Если между ними есть различие, то можно допустить два равновероятных объяснения. Первое - предположив, что обнаруженная разность обуславливается случайным варьированием средних величин исследуемой выборки около некоторой общей, хотя и неизвестной нам в точности генеральной средней. Тогда найденные средние должны считаться принадлежащими к одной и той же качественно однородной совокупности. Второе - рассматриваемые две средние величины принадлежат к двум качественно отличным друг от друга статистическим совокупностям. Оба эти предположения одинаково законны и применимы ко всякой паре сравниваемых величин М.
Для оценки существенности различий между двумя средними существует следующая формула:
(17),
которая справедлива для больших выборок (n>30) или для равновеликих вариационных рядов (n1n2) малых выборок.
Для определения существенности различий необходимо обращаться к таблице Стьюдента (см. прилож. табл. 7). По найденному значению td и числу степеней свободы k=n1+n2 2 в таблице 7 находим соответствующее значение вероятности Р.
Как уже отмечалось, в биологических экспериментах принято, чтобы показатель надежности был не менее 95% (Р0,95 или Р?0,05 ). Если полученное различие меньше, к примеру, 80...90%, то необходимо высказываться с меньшей категоричностью. Можно указать, что разность может иметь место, но в данной серии экспериментов она не доказана, и необходимо поставить дополнительные опыты.
Зачастую перед исследователем встает задача установить величину отклонения от средней величины конкретного текущего значения (говоря иными словами, степень выраженности, “индивидуальности” данного значения) с последующим сопоставлением ее с другой величиной расхождения из другой выборки, которая, возможно, имеет иную размерность. Данное сравнение можно производить при помощи нормированного отклонения (критерия Стьюдента).
6.3 Определение нормированного отклонения
Многие наблюдаемые явления подчиняются приблизительно нормальному закону распределения. По этой причине основная часть классической статистической теории предполагает нормальность рассматриваемой случайной величины. Важным теоретическим результатом относительно выборочных распределений является центральная предельная теорема. Вот одно из важных применений этой теоремы: если мы получаем случайную выборку объема n из генеральной совокупности с конечной дисперсией, то независимо от распределения нашей случайной величины Х распределение выборочного среднего М при больших n будет приблизительно нормальным [12].
Один из самых простых способов определения нормальности распределения выборки представляет собой вычисление коэффициентов асимметрии Аs и эксцесса Ех (см. приложение, табл. 1.). Соблюдения условия нормальности распределения выборки позволяет использовать как все представленные в данной работе формулы, так и установление величины нормированного отклонения.
Отклонение той или иной варианты от средней арифметической, отнесенной к величине среднего квадратического отклонения, называют нормированным отклонением:
(18).
Этот показатель позволяет "измерять" отклонение отдельных вариант от среднего уровня и сравнивать их для разных признаков. Иными словами, он характеризует индивидуальность признака и позволяет установить сопряженность связей между аргументами и величиной целевой функции. Так же оценку нахождения и развития любой как физической так и биологической системы можно произвести при помощи нормируемого отклонения (критерия Стьюдента - t). При t=1 состояние системы находится в оптимуме - opt, t=+1+2 - supopt состояние, t=-1-2 - subopt состояние, t=+2+3 -suppat состояние, t=-2-3 - subpat состояние.
Например, проведем сравнительный анализ существующих технологий криоконсервации биообъекта. Полагаем, что центральная теорема статистики утверждающая, что всякое распределение стремится к нормальному при повышении количества измерений, может служить методологическим постулатом целесообразности выбора приоритетности развития изучаемого явления. Различные направления исследований являются теми факторами, которые расширяют диапазон и приводят генеральное распределение к нормальному. Только та система будет развиваться, рост которой сбалансирован противоположно дополняющими началами. Односторонность развития приводит к обратным явлениям: деградации и распаду на отдельные составляющие гармоники общего распределения системы. Условия равновесия развития будут выполняться только тогда, когда система соответствует нормальному закону распределения составляющих её гармоник. И как следствие, приоритетность развития каждой из них должна соответствовать весу её плотности вероятности распределения в общей генеральной совокупности (рис. 4).
Величина вероятности распределения каждой из гармоник P(t), в нашем представлении, является прямым аналогом приоритетности направления изучаемого явления для любой из составляющих генеральной совокупности, t - количественный показатель степени отклонения конкретной гармоники от условно оптимального состояния целостной генеральной совокупности. Отрицательные гармоники (t = -1, -2) - показатели субоптимальности режимов, а положительные - супероптимальности. Представленные на графике численные значения не обязательно должны быть целыми величинами, они могут принимать любые значения. Чем ближе к нулевому (равновесному) состоянию расположена гармоника, тем она ближе к оптимуму и, следовательно, большим приоритетом должна обладать.
Рис.4. Стандартизованная форма нормальной кривой генерального распределения, включающего спектр отдельных составляющих его гармоник. P(t) - функция плотности вероятности распределения изучаемого явления t - нормируемое отклонение (критерий Стьюдента) 0, 1, 2 - отдельные составляющие гармоники, характеризующие направления исследования.
Адекватная оценка изучаемого явления требует проведения полного и всестороннего анализа с учётом всех его качеств и характеристик. Проведение объективного анализа возможно при наличии обобщающего фактора, который позволяет не только уравновесить, но и сгладить противоречия.
Ускорение процессов развития организма и создание новых видов растений и животных, которые не существуют в живой природе, волнуют не одно поколение ученых и способствуют созданию новых отраслей биологической науки. Выбор приоритетных направлений, способствующих скорейшей реализации поставленной задачи, затруднен установлением критериев оценки значимости их дальнейшего развития, что предопределено как объективными, так и субъективными причинами. Исследователь на различных этапах своей деятельности сталкивается с наличием не только противоположных мнений, но даже направлений работы, которые, в свою очередь, могут, как исключать, так и дополнять друг друга. Ошибка выбора приоритета развития как раз и заключается в выделении какой-либо из особенностей, отрицая остальные и, забывая принцип соотношения Бора о том, что каждая новая теория должна включать в себя элемент старой как предельный случай новой. Даже противоположные направления зачастую имеют общее, объединяющее начало не только при выборе объекта исследования или методологии, а и при постановке задачи в целом. Важно отыскать это начало и попытаться оттолкнуться от него.
Создание алгоритма объективной оценки изучаемого явления с учетом всего спектра составляющих его качеств позволяет получить максимальный эффект при его дальнейшей реализации.
Выполнение эксперимента (см. структурную схему проведения биологического исследования) сопряжено с проведением измерений и их статистической обработкой, начиная от поисковых опытов и кончая выполнением всего эксперимента в целом. По окончанию статистической обработки эксперимента можно приступать к обобщению экспериментальных данных.
Вопросы для самоконтроля.
1 При каких условиях осуществляется равноточность измерения?
2 Назовите критерий оценки равноточности измерения.
3 Какова необходимость вычисления средней взвешенной величины и ее ошибки?
4 Как производится сравнение средних значений для определения существенности различия между двумя вариационными рядами?
5 Перечислите основные функции нормированного отклонения.
Лекция 7. Обработка экспериментальных данных
План лекции:
1 Нахождение функциональных связей
2 Проведение ковариационного анализа
3 Провидение эксперимента при поиске оптимальных условий
Вторым этапом исследования является обобщение экспериментальных данных. Наблюдения обобщают не только по окончанию опыта, но и в ходе его выполнения. Внимательный и добросовестный исследователь всегда стремится еще в процессе опытов установить закономерности, возможные отклонения и их причины, новые факторы, связи, взаимодействия.
Сопоставляя все материалы исследования, экспериментатор ищет раскрытия связей, взаимодействия, функциональные зависимости факторов. Установив их, он выделяет главные связи, зависимости, взаимодействия и устанавливает общие закономерности явлений. Эти закономерности должны отражать процессы развития явлений объективного мира. Закон есть внутренняя существенная связь явлений, обуславливающая их необходимое закономерное развитие, не зависящее от воли людей. Он характеризуется всеобщностью, относительной устойчивостью и повторяемостью, то есть этот закон действует всегда и всюду, где есть соответствующие условия [15].
Таким образом, экспериментальные данные обобщают в такой последовательности: находят функциональные связи, устанавливают основные закономерности, раскрывают физическую сущность закономерностей, математически выражают их, а затем теоретически обобщают и развивают. К обобщению следует привлекать и материалы других исследований, из которых по каким-либо причинам не сделаны должные выводы.
7.1 Нахождение функциональных связей
Функциональные связи легче найти, если данные опытов представить таблицами и графиками.
Представление экспериментальных данных в виде таблиц
В таблице вначале выделяют по физическому смыслу аргумент (независимую переменную аi), затем функцию (зависимую переменную С). Желательна следующая форма таблицы: номер и краткое, точное название; в первом столбце располагают значение аргумента, а в остальных - значения функций. Иногда целесообразно несколько столбцов объединять в один раздел с общей заголовочной частью и подзаголовками в каждом столбце. Аргумент располагают строго логично по основному существенному признаку (например, по величине, в возрастающем или убывающем порядке). Все столбцы должны иметь краткие, ясные заголовки с указанием размерности помещаемых величин.
Графическое представление экспериментальных данных
Современную статистическую науку невозможно представить без применения графиков. Они стали средством научного обобщения. Выразительность, доходчивость, лаконичность, универсальность, обозримость графических изображений сделали их незаменимыми в исследовательской работе и в международных сравнениях и сопоставления социально-экономических явлений.
Значение графического метода в анализе и обобщении данных велико. Графическое изображение, прежде всего, позволяет осуществить контроль достоверности статистических показателей, так как представленные на графике, они более ярко показывают имеющиеся неточности, связанные либо с наличием ошибок наблюдения, либо с сущностью изучаемого явления. С помощью графического изображения возможно изучение закономерностей развития явления, установление существующих взаимосвязей. Простое сопоставление данных не всегда дает возможность уловить наличие причинных зависимостей, в то же время их графическое изображение способствует выявлению причинных связей, в особенности, в случаях установления первоначальных гипотез, подлежащих затем дальнейшей разработке. Графики также широко используются для изучения структуры влияний, их изменения во времени и размещения в пространстве. В них более выразительно проявляются сравниваемые характеристики и отчетливо видны основные тенденции развития и взаимосвязи, присущие изучаемому явлению или процессу.
Таким образом, графики дают возможность наблюдать закономерности изменения функций как на плоскости, так и в пространстве, тем самым наглядно показывают закон изменения С=f (аi). Обычно на абсциссе откладывают значение аргументов, по ординате - значение функций. Общие правила для выбора масштаба: кривые по возможности располагают наклонно к осям координат (около 450); результирующую, или основную, кривую вычерчивают на всем листе, начало отсчета не обязательно размещать в пределах листа. Желательно, чтобы наименьшее деление масштаба графика соответствовало абсолютной ошибке измерений. Тогда ошибка отсчета по графику не будет превышать ошибки измерений.
Общий вывод для исследователя таков - в ходе исследования необходимо пользоваться таблицами и построенными по ним графиками; в тексте отчетов по исследованию нужно помещать преимущественно графики, перенося значительную часть табличного материала в приложения.
7.2 Проведение ковариационного анализа
Предыдущие главы были посвящены методам изучения закономерностей в варьировании отдельных признаков и свойств в пределах одной совокупности, и только при сравнении двух распределений учитывали средние и ошибки двух выборок. Однако в последнем случае характеристики сравниваемых совокупностей были получены для каждой из них независимо от причин, обуславливающих то или иное значение каждого наблюдения. В практике биологических исследований часто возникает необходимость изучить характер связи между двумя (или более) варьирующими признаками.
Ковариационный анализ направлен на установление сопряженности вариационных связей и объединяет в себе ряд относительно самостоятельных методов: дисперсионный, корреляционный и регрессионный анализы.
1) Дисперсионный анализ:
Р.Фишер в 1925 году предложил метод комплексной оценки сравниваемых средних, получивший название дисперсионного анализа. Этот метод основан на разложении общей дисперсии статистического комплекса на составляющие ее компоненты (отсюда и название метода), сравнивая которые друг с другом посредством F-критерия, можно определить, какую долю общей вариации учитываемого (результативного Сi) признака обуславливает действие на него как регулируемых аi , так и не регулируемых в опыте факторов bi, di.
Ценность этого метода заключается в том, что он позволяет выявить суммарное действие факторов, действие каждого регулируемого в опыте фактора в отдельности и действие различных сочетаний факторов друг с другом на результативный признак.
Достоверность влияния аi фактора устанавливается таким образом:
(16а),
где: аi - дисперсия аi фактора, а d - дисперсия неучитываемых факторов.
Если FFst, то наличие связи считается установленным. Достоверность различия между двумя факторами а1 и а2 устанавливается аналогичным образом, используя критерий Фишера Fst (см. приложение табл. 3).
(16б).
После того как достоверно установлено действие регулируемого фактора аi, можно измерить силу его влияния на результативный признак (С) (метод Плохинского).
(19),
где: - сила влияния а-го фактора на величину целевой функции.
=r2, где: r2 - коэффициент детерминации, а r - корреляция.
2) Корреляционный анализ:
При изучении живых организмов редко приходится встречаться с так называемой функциональной зависимостью (r=1), при которой каждому значению одной переменной - аргументу соответствует тоже одно, вполне определенное значение другой переменной - функции.
Растения, животные и микроорганизмы в процессе развития постоянно взаимодействуют с факторами внешней среды, изменяясь под влиянием разнообразных условий существования. Поэтому у них связь между признаками проявляется в виде так называемой корреляционной зависимости, или корреляции. Эта форма связи характерна тем, что каждому значению одного признака соответствует не одно, а несколько значений другого признака, то есть его распределение.
Задача исследования корреляционной связи - определить характер и измерить тесноту сопряженности между признаками, из которых один является факториальным аi , а второй результативным С.
Простейшим способом представления коэффициента корреляции является аналитическое выражение его с использованием критериев Стьюдента.
(20).
Если r<0,5, то корреляция считается слабой и, наоборот, если r>0,6, то сильной.
3) Регрессионный анализ:
Зависимость между переменными величинами аi и С может быть описана разными способами. В частности, любую форму связи можно выразить уравнением общего вида С=f(аi), где С рассматривают в качестве зависимой переменной, или функции от другой - независимой переменной величины аi, называемой аргументом. Соответствие между аргументом и функцией может быть задано таблицей, формулой, графиком и т.д. Изменение функции, в зависимости от изменений одного или нескольких аргументов, называется регрессией. Для выражения регрессии служат корреляционные уравнения, или уравнения регрессии, эмпирические или теоретические вычисленные ряды регрессии, их графики, называемые линиями регрессии, а также коэффициенты линейной и нелинейной регрессии.
Различных форм и видов корреляционных связей много. Задача сводится к тому, чтобы в каждом конкретном случае выявить форму связи и выразить ее соответствующим корреляционным уравнением, что позволяет предвидеть возможность изменения одного признака С на основании известных изменений другого а, связанного с первым корреляционно.
Общая форма уравнения регрессии выглядит таким образом:
(21).
Обработка экспериментальных данных при помощи ковариационного анализа является достаточно трудоемкой операцией и без применения вычислительной техники зачастую не реализуемая. В настоящее время существует достаточно большое количество прикладных программ, позволяющих обрабатывать экспериментальные данные с выражением функциональных зависимостей в виде формул.
Применение регрессионного анализа дает возможность экспериментатору использовать методы проведения активного эксперимента, то есть применять методы организации совокупности опытов с различными условиями для получения наиболее достоверной информации о свойствах исследуемого объекта при наличии случайных неконтролируемых возмущений. Величины, определяющие условия данного опыта, обычно называют факторами (напр., температура, концентрация), а их совокупность - факторным пространством. Набор значений факторов характеризует некоторую точку факторного пространства, а совокупность всех опытов составляет так называемый факторный эксперимент. Расположение точек в факторном пространстве определяет план эксперимента, который задаёт число и условия проведения опытов с регистрацией их результатов.
Планирование эксперимента используют для изучения и математического описания процессов и явлений посредством построения математических моделей (в форме так называемых уравнений регрессии) - соотношений, связывающих с помощью ряда параметров значения факторов и результаты эксперимента, называемых откликами. Основное требование, предъявляемое к планам факторного эксперимента, в отличие от пассивного эксперимента, - минимизация числа опытов, при которой получают достоверные оценки вычисляемых параметров при соблюдении приемлемой точности математических моделей в заданной области факторного пространства. В этом случае задача обработки результатов факторного эксперимента заключается в определении численных значений указанных параметров.
7.3 Провидение эксперимента при поиске оптимальных условий
Поиск оптимальных условий является одной из наиболее распространенных научно-технических задач. Они возникают в тот момент, когда установлена возможность проведения процесса и необходимо найти наилучшие (оптимальные в некотором смысле) условия его реализации.
Формализация позволяет использовать преимущества, содержащиеся в применении развитого математического аппарата. Их не мало. Легкость и четкость формулировки основных результатов. Вывод всех следствий, которые представляют интерес. Однозначность и определенность суждений. Количественные оценки. Кроме того, возможность применения аппарата планирования эксперимента со всеми присущими ему известными преимуществами, в том числе и с возможностью минимизации числа опытов, оценки неопределенности в результатах, сопоставимости и преемственности работ и т.д.
Но когда экспериментатор делает попытку познакомиться с планированием эксперимента, он часто сталкивается с серьезными трудностями. Больше того, иногда он просто не верно применяет методы планирования или выбирает не самый оптимальный для данной ситуации путь исследования, или допускает еще какие-нибудь досадные ошибки. При этом снижается эффективность его работы и появляется опасность дискредитации важного и полезного направления.
Поиск оптимальных условий, построение интерполяционных формул, выбор существенных факторов, оценка и уточнение констант теоретических моделей (например, кинетических), выбор наиболее приемлемых из некоторого множества гипотез о механизме явлений, исследование диаграмм состав-свойство - вот примеры задач, при решении которых применяется планирование эксперимента. Можно сказать, что там, где есть эксперимент, имеет место и наука о его проведении - планирование эксперимента.
Планирование экстремального эксперимента - это метод выбора количества и условий проведения опытов, минимально необходимых для отыскания оптимальных условий, т.е. для решения поставленной задачи. Путь к вершине довольно извилист. Он становится еще более трудоемким при возрастании числа независимых переменных. Наиболее короткий путь к вершине - направление градиента функции отклика. Градиент непрерывной однозначной функции есть вектор:
(23),
где: - обозначение градиента, - частная производная функции по i - му фактору, i, j, k - единичные векторы в направлении координатных осей.
Следовательно, составляющие градиента суть - частные производные функции отклика, оценками которых являются коэффициенты регрессии. Изменяя независимые переменные пропорционально величинам коэффициентов регрессии, происходит движение в направлении градиента функции отклика по самому крутому пути. Поэтому процедура движения к почти стационарной области называется крутым восхождением.
Таким образом, крутое восхождение - это движение в направлении градиента функции отклика. Градиент задается частными производными, а частные производные функции отклика оцениваются коэффициентами регрессии. В крутом восхождении независимые переменные изменяют пропорционально величинам коэффициентов регрессии и с учетом их знаков. Составляющие градиента однозначно получаются умножением коэффициентов регрессии на интервалы варьирования по каждому фактору. Серия опытов в направлении градиента рассчитывается последовательным прибавлением к основному уровню факторов величин, пропорциональных составляющим градиента.
Реализацию мысленных опытов для адекватной модели начинают с опыта, условия которого выходят за область эксперимента хотя бы по одному из факторов. Для неадекватной модели один-два опыта выполняют в области эксперимента. Возможно проведение сразу всех мысленных опытов. Более экономная процедура состоит в проведении двух-трех опытов, оценке результатов и принятии решений о прекращении или дальнейшем проведении экспериментов (последовательный поиск). При движении по градиенту возникают различные ситуации, определяющие принятие дальнейших решений.
Вопросы для самоконтроля.
1 Перечислите последовательность обобщения полученных экспериментальных данных.
2 Каким образом устанавливаются функциональные связи?
3 Какова необходимость проведения дисперсионного анализа?
4 Какова необходимость проведения корреляционного анализа?
5 Какова необходимость проведения регрессионного анализа?
6 Как производится поиск оптимальных условий проведения эксперимента?
Лекция 8. Построение математических моделей
План лекции:
1 Способы обобщения результатов, полученных в ходе проведения исследования.
2 Выражение опытных закономерностей в виде формул
3 Установление информационной ценности математической модели
4 Проверка адекватности описания математической моделью экспериментальных данных
8.1 Способы обобщения результатов, полученных в ходе проведения исследования
Для универсального оперирования полученной информацией необходимо обобщать экспериментально полученные данные до уровня математического абстрагирования. Обобщение результатов эксперимента, полученных в различных опытах, проводят при помощи вычисления величин: М - среднее арифметическое, - среднеквадратическое отклонение, Сv - коэффициент вариации, которые удобно выражать через моменты h-го распределения - , а степень их достоверности через величину ошибки репрезентативности - (см приложение, табл.1.). Необходимым условием правомерности использования этих параметров является нормальность распределения изучаемых выборок, критериями, определения которых служат: коэффициент асимметрии распределения - As и коэффициент эксцесса - Ех. Для избежания получения искажения объективной информации также необходимо исключить грубые ошибки, которые возникают при проведении измерений. Численным показателем достоверности текущего значения - хi, а также достоверности конкретной выборки - tp, является критерий Стьюдента - tst(p,n).
В случае, если исследователь наблюдает расхождение двух величин целевых функций С, полученных при измерении изучаемых факторов аi, то достоверность данного расхождения можно подтвердить при помощи критерия Стьюдента - td. Общим принципом чистоты проведения исследования является постоянство всех остальных факторов при изменении избранных aj. Тестом на соблюдение выше приведенного условия является критерий равноточности измерений. Равноточность измерений серии опытов позволяет обобщить результаты различных экспериментов и уменьшить суммарные ошибки исследования. Показателем равноточности опытов является критерий Фишера - F.
Далее экспериментальные данные обобщают в такой последовательности: находят функциональные связи изучаемых явлений, устанавливают основные закономерности, математически выражают, раскрывают их физическую сущность с целью последующего теоретического развития.
Вывод эмпирических формул проводится на основе экспериментально полученной функциональной зависимости, объясняемой в общем, виде. Подбор типа эмпирической формулы для определения ее параметров используется на основе регрессионного анализа. Построение регрессионной зависимости осуществляется при помощи использования специальных прикладных программ, разработанных на ЭВМ. Полученное эмпирическое выражение можно представить в полуаналитическом или чисто аналитическом виде. Иногда сама структура эмпирической формы указывают на пути превращения в аналитическую формулу. Под аналитическими уравнениями следует понимать такие, в которых все основные члены имеют размерность и логично вытекают из законов физики.
Наличие аналитического выражения зависимости целевой функции от ее аргументов, позволяет использовать его как математическую модель. Очевидно, что исследование считается законченным, если достигнута его цель. Если реализация цели заключена в нахождении максимальной или минимальной величины целевой функции, то построение математической модели, отражающей природу взаимосвязи между целевой функцией С и ее аргументами аi, вi и di, является наиболее приемлемым способом нахождения оптимальных значений изучаемых факторов аi, Смак= F(аiопт, вi). Математические модели строятся на основе полученных эмпирических и рациональных формул, а поэтому их удобно разделять на описательные и объяснительные.
Математические модели являются мощным инструментом, как описания так и анализа полученных данных. Ценность модели определяется степенью адекватности описания изучаемых явления и возможностью их объяснения. Математическое абстрагирование полученных результатов способствует разрешению проблемы не повторяемости экспериментальных данных при изменяющихся условиях проведения опытов и служит отправным моментом проведения дальнейших исследований.
Наиболее ярким примером значимости математического моделирования в решении прикладных задач являться работа П. Мейзура [16]. Благодаря данной модели впервые удалось получить жизнеспособное потомство от деконсервированных эмбрионов млекопитающих после неудачно проведенных эмпирических поисков на протяжении трех десятилетий.
Повышение эффективности исследовательской работы связано с моделированием проведения эксперимента от постановки задачи на исследования до математического обобщения полученного результата. Предложенная структурная схема моделирования эксперимента, позволяет получать достоверный научный результат при минимальных затратах времени и средств.
Выражение опытных закономерностей в виде формул
1) Вывод эмпирических формул:
Для вывода эмпирических формул необходимо иметь экспериментально полученную функциональную зависимость, объясняемую в общем виде. Основной метод построения эмпирических формул: подбор типа формулы и нахождение коэффициентов к ней. Подбор типа формулы главное, что определяет результативность и точность эмпирической формулы. Следует учесть также, что кривая изменения функции часто может быть представлена несколькими типами уравнений. В этих случаях надо выбирать такой тип формулы, который в наибольшей мере соответствовал бы природе явлений и мог бы быть улучшен превращением формулы в полуэмпирическую или полурациональную.
Подбор типа эмпирической формулы для определения ее параметров используется на основе регрессионного анализа. Параметры формулы надо вычислять с достаточной степенью точности, особенно, если они относятся к показателям степени. Не надо забывать, что многие математические выражения закономерности, будучи вначале эмпирическими, впоследствии были рационализированы и что иногда сама структура эмпирической формы указывает на пути превращения ее в формулу рациональную.
2) Получение рациональных формул:
Под рациональными формулами следует понимать такие, в которых все основные члены имеют размеренность и строго логично вытекают из законов физики. Рациональные формулы не только представляют собой закономерность развития явления, но и объясняют его (хотя бы и в общей форме), показывая факторы и связи между ними. Это важнейший тип формул, так как их всеобщность дает возможность теоретически исследовать все стороны явления.
Для построения рациональной формулы необходимо знать физические основы явления. Не следует увлекаться непродуманными математическими обобщениями. Надо всегда помнить как о необходимости в связи формул с реальными физическими процессами, так и о возможной ограниченности их приложения. Для выведения рациональной формулы вначале следует установить, какой закон или законы физики применимы для объяснения явления. Затем следует решить вопрос о том, какой трансформации или дополнений требуют известные уже выражения законов в связи с особенностями развития явления. Далее решают, как лучше в общей и грубой схеме математически представить найденные зависимости. Наконец, эту схему уточняют, “отшлифовывают” и проверяют на ряде примеров.
Развитие явления обычно может быть представлено дифференциальными уравнениями. При преобразовании первоначальных математических схем в дифференциальные уравнения следует стремиться к простым и ясным выражениям; это предлагает соответствующий выбор системы отсчета (координат), решения вопроса о порядках уравнения и о том, могут ли быть коэффициенты уравнений постоянными величинами.
Не всегда исследователю удается обогатить науку открытием новых рациональных формул. В ряде случаев бывает полезно представить конкретную экспериментальную кривую, описывая ее чисто математически и преимущественно безразмерными величинами. Такие формулы называются эмпирическими. Они не имеют характера всеобщности, а показывают развитие явления только для условий, в которых проводились опыты. Наличие аналитического выражения зависимости целевой функции от ее аргументов, позволяют использовать его как математическую модель.
Очевидно, что исследование считается законченным, если реализована его цель. Поскольку реализация цели заключена в нахождении максимальной или минимальной величины целевой функции, то построение математической модели, отражающей природу взаимосвязи между целевой функцией С и ее аргументами аi , вi и di, является наиболее приемлемым способом: С мак = F (а iопт, вi ).
Математические модели строятся на основе полученных эмпирических и рациональных формул, а поэтому их удобно разделять на описательные и объяснительные. В англоязычной литературе - выделяют модели феноменологические и механистические, критериями состоятельности которых являются информационная ценность и адекватность описания изучаемых явлений [15].
8.2 Установление информационной ценности математической модели
Для проверки информационной ценности модели формулируется нуль-гипотеза Н0: , где -, общее рассеивание результатов измерений по отношению к общему среднему по всему эксперименту. - рассеивание средних экспериментальных значений выходов от предсказываемых моделью значений . Эта величина характеризует неадекватность описания модели эксперимента.
Если
(24),
то модель (имеющая ) описывает результаты эксперимента лучше, чем простейшая модель. Если Fu < Fтабл , то такая модель, несмотря на сложный вид и на ее построение, не имеет информационной ценности.
8.3 Проверка адекватности описания математической моделью экспериментальных данных
Для проверки адекватности модели формируется нуль-гипотеза Н0:
. Если она по критерию Фишера (см. приложение, табл. 3) Fа:
(24а),
будет признана правдоподобной (F а<Fтабл обычно при a=0,05), то анализируемая модель адекватно описывает экспериментальные результаты, поскольку , и предсказываемые моделью результаты будут по точности не хуже экспериментальных.
Существуют и другие способы проверки полученных математических моделей. Выверенные модели позволяют получить объективную информацию с тем же уровнем надежности с которым они протестированы. Однако не следует забывать, что хотя аналитическое представление и сам анализ полученных результатов в ходе исследования является самым универсальным способом, но полученные выводы верны с той степенью надежности и при тех условиях, при которых они были получены. Дальнейшее обобщение полученных модельных результатов необходимо проводить с большой осторожностью.
Далеко не перед каждым исследователем предстает необходимость проводить работу в такой последовательности и объеме, как изложено выше, а именно, от постановки задачи до получения результатов математического моделирования. Однако большая часть проблем, затронутых в данной работе, так или иначе, станут актуальными при проведении любого, даже самого простого эксперимента. Многолетний опыт работы в области биотехнологии, где особенно требуется применение комплексных методов исследования и его обобщение, позволил создать выше приведенный алгоритм проведения работы.
Вопросы для самоконтроля.
1 Перечислите основные способы обобщения результатов, полученных в ходе проведения исследования.
2 Какова необходимость получения математических моделей?
3 Охарактеризуйте процедуру получения эмпирических формул.
4 В чем заключено основное отличие эмпирических формул от рациональных?
5 Как производится установление информационной ценности математической модели?
6 Как производится проверка адекватности описания математической моделью экспериментальных данных
Список условных обозначений
М - среднее арифметическое
W - вероятность события
- среднее квадратическое отклонение
Сv - коэффициент вариации
m - cредняя квадратическая ошибка среднего арифметического
- доверительный интервал
- доверительный интервал для случайных погрешностей
- доверительный интервал для систематических погрешностей
n - объем выборки
Р - доверительная вероятность
р - уровень значимости оценок
б - относительный показатель расхождения средних величин сравниваемых выборок
n0 - минимальное количество измерений, обеспечивающее достоверный научный результат для одной выборки
n - минимальное количество измерений, обеспечивающее достоверный научный результат при сравнении двух выборок
t, tp - критерий Стьюдента
td - критерий достоверности различия двух выборок
F - критерий Фишера
As - коэффициент ассиметрии ряда распределения
Ех - коэффициент эксцесса распределения
r - коэффициент корреляции
R - коэффициент регресии
С - целевая функция, числено отражающая поставленную цель
аj, вj, dj - параметры, определяющие развитие изучаемого явления:
аj - поддающиеся изменениям в ходе эксперимента.
вj - неподдающиеся изменениям в ходе эксперимента.
dj - неопределяемые в ходе эксперимента изменения.
k - число степеней свобод.
Литература
1. Адлер Ю.П., Маркова Е.В., Грановский Е.В. Планирование эксперимента при поиске оптимальных условий. М.: Наука, 1976.- 279 с.
2. Адлер Ю.П., Ратнер А.И., Лещинская Г.Ф. Об активно-пассивном эксперименте. - Научные труды Гиредмета, 27. М., «Металлургия», 1969, с. 16.
...Подобные документы
Биологическая статистика и биометрия - разделы математической статистики для обработки результатов биологических экспериментов. Вклад в развитие биометрии ученых-статистиков. Классические труды генетика-теоретика - Р. Фишера как веха в истории биометрии.
реферат [25,6 K], добавлен 03.03.2016Единство эмпирического и теоретического познания, наглядно-чувственных эмпирических и абстрактных теоретических элементов. Технические средства для естественнонаучных экспериментальных исследований, изучение природных закономерностей. Факты и их описание.
контрольная работа [18,7 K], добавлен 10.04.2009Определение терминов "опыт" и "эксперимент", их основные различия. Особенности проведения эксперимента в разделе "Растения". Планирование работы по подготовке опытов к урокам биологии. Опыты по изучению прорастания семян. Опыты по изучению дыхания семян.
дипломная работа [478,7 K], добавлен 23.01.2018История возникновения и основные понятия биологической статистики. Задачи биостатистики: количественное описание биологических явлений; доказательство неоднородности биологических явлений; сжатие информации. Этапы исследований. Расчет объема выборки.
лекция [452,2 K], добавлен 12.09.2019Исследование имеющейся информации о видовом составе флоры Калмыкии. Анализ адаптации к среде Джузгуна безлистного путем проведения полевых исследований, определение проходящих с ним изменений. Виды растений, нуждающиеся в охране, разработка рекомендаций.
курсовая работа [65,1 K], добавлен 02.06.2014Важнейшие методы флористических и фаунистических исследований, этапы и принципы их проведения. Общие закономерности изменения видового разнообразия по важнейшим градиентам среды. Понятие эндемизм, центры систематического разнообразия и описание царств.
курсовая работа [1,4 M], добавлен 17.11.2016Принятие решения о научном исследовании. Формулирование гипотезы, выбор методологии. Составление программы и плана исследования. Обработка результатов эксперимента. Подтверждение или опровержение гипотезы. Составление модели явления, ее верификация.
реферат [225,5 K], добавлен 10.01.2014Характеристика основных аэрополлютантов. Изучение патогенетических механизмов действия выхлопных газов дизеля на ткани глаз крыс в условиях эксперимента. Анализ кристаллографической картины биоптата тканей глаз. Изменения в глазной ткани животных.
статья [1,7 M], добавлен 01.09.2013Порядок отбора проб и методы проведения исследований. Определение жизнеспособности яиц или личинок различных гельминтов по внешнему виду: аскарида человеческая, власоглав, кривоголовка, угрица кишечная. Оценка и интерпретация полученных результатов.
контрольная работа [26,4 K], добавлен 06.04.2019Анализ и природно-климатические особенности Кольского полуострова, знакомство с разнообразием растительного мира. Гербарий как коллекция специально собранных и засушенных растений. Характеристика методики проведения геоботанических исследований.
отчет по практике [74,3 K], добавлен 05.11.2012Наиболее вероятные микроклиматические условия проведения спелеологических исследований по Ф. Тромбу. Условия пребывания под землей. Температура воздуха, атмосферное давление и относительная влажность воздуха в пещерах, анализ их целебного воздействия.
реферат [104,2 K], добавлен 07.12.2012Вирусы как первая форма жизни на Земле и возбудители болезней. Предыстория их открытия. Схема проведения биологического эксперимента. Строение вируса и бактериофага. Виды вирусных заболеваний человека. Жизненный цикл вируса иммунодефицита человека.
презентация [690,1 K], добавлен 27.02.2011Определение иммунной системы как защитного механизма, поддерживающего постоянство внутренней среды. Способы консервирования зеленых кормов. Характеристика возбудителя туберкулеза. Принципы проведения диспансеризации. Развитие микрофлоры на парной шкуре.
контрольная работа [23,4 K], добавлен 04.03.2012Изучение теоретических основ биохимических методов исследований, строения и свойств химических соединений, входящих в состав живых организмов, метаболизма и его регуляции. Квалификационные требования к выпускнику-биохимику, профессиональная деятельность.
учебное пособие [32,0 K], добавлен 19.07.2009Методы и способы биотехнических мероприятий для кабанов, оценка возможности их проведения на территории ГПЗЗ "Желундинский", а также рекомендации по повышению их эффективности. Анализ эффективности и целесообразности провидимых биотехнических мероприятий.
дипломная работа [95,4 K], добавлен 30.10.2009Распространение потенциала действия, скорость его проведения. Миелинизированные нервы и сальтаторная проводимость, скорость проведения в миелинизированных волокнах, распределение каналов. Каналы в демиелинизированных аксонах, строение, блок проводимости.
реферат [13,6 K], добавлен 26.10.2009Особенности проведения биохимических исследований в спорте, объекты, основные показатели и задачи контроля. Направленность биохимических сдвигов в организме после выполнения стандартных и максимальных нагрузок в зависимости от уровня тренированности.
реферат [127,4 K], добавлен 06.09.2009Создание тематического гербария "Злаки". Этапы оформления результатов исследований в лесу. Коллекция листьев, поврежденных насекомыми. Наблюдения за обитателями водоема. Подготовка проведения экскурсии на тему "Особенности строения придорожных растений".
отчет по практике [77,4 K], добавлен 13.06.2010Методики исследований грибов, водорослей, лишайников, высших растений, беспозвоночных и позвоночных животных. Правила сбора растений и животных, сушки растений, умерщвления и фиксирования животных. Практические навыки проведения экскурсий в природе.
отчет по практике [90,6 K], добавлен 04.06.2014Анализ биохимического состава и метаболических процессов нервной ткани. Молекулярные основы возбуждения и проведения по аксону, синаптической передачи. Метаболизм углеводов, белков и липидов, обеспечивающих выполнение основных функций нервной ткани.
курсовая работа [448,5 K], добавлен 12.11.2014