Основы математической статистики

Определение сущности методов математической статистики в аналитической химии. Характеристика элементов математической статистики, используемых при обработке результатов измерений. Расчет дисперсии и среднего арифметического для выборки из результатов.

Рубрика Математика
Вид реферат
Язык русский
Дата добавления 16.03.2015
Размер файла 238,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Содержание

Введение

1. Задачи математической статистики

2. Методы математической статистики в аналитической химии

3. Элементы математической статистики, используемые при обработке результатов измерений

3.1 Обработка результатов методом математической статистики

3.2 Результат анализа как случайная величина

3.3 Оценивание генеральных параметров (свертывание цифровой информации)

3.4 Распределения случайных величин

3.5 Проверка выполнения нормального закона распределения

3.6 Корреляционный анализ. Коэффициент корреляции

3.7 Регрессионный анализ. Градуировка

Заключение

Список литературы

Введение

Целью реферата является изложение методов математической статистики в применении к задачам, связанным с анализом вещества.

В конце XIX и начале XX века на базе теории вероятностей началось создание современной математической статистики в связи с запросами биологии и экономики. За последние десятилетия математическая статистика как метод исследования стала интенсивно применяться в таких областях науки и техники, как агробиология, медицина, машиностроение и приборостроение, химическая промышленность, металлургия и др. Особенно интенсивное развитие статистических методов исследования наблюдается в последние годы. Совсем недавно на основе теории вероятностей создалась совершенно новая дисциплина--теория информации, первоначальной задачей которой было изучение вопросов, связанных с передачей сигналов в радиотехнике. На базе теории информации стала развиваться кибернетика--наука об управлении. Совершенно неожиданно теория информации нашла применение в оптике. Весьма перспективным представляется сейчас применение идей теории информации при документации научных и технических материалов. В связи с интенсивным развитием ядерной физики появилась новая область применения теории вероятностей -- статистика счета ядерных частиц.

Одной из новых областей применения математической статистики являются исследования, связанные с анализом вещества. Необходимость применения статистических методов при анализе вещества обусловливается рядом факторов. Здесь надо прежде всего указать на то, что внедрение в производство новых сложных по своему составу сплавов, материалов и непрерывное ускорение процесса производства заставили широко применять новые физические методы анализа, основанные на протекании мало изученных процессов, не поддающихся строгому контролю и точному регулированию. Наличие множества новых аналитических методов наряду со старыми классическими методами анализа остро ставит вопрос об отыскании разумных критериев для сравнения результатов анализа, полученных разными методами.

Развитие и внедрение новых аналитических методов происходит значительно быстрее, чем их стандартизация. Это неизбежно приводит к тому, что в каждой, даже небольшой, аналитической лаборатории приходится постоянно сталкиваться со сложными метрологическими проблемами, рациональное решение которых невозможно без применения методов современной математической статистики. Уже сейчас стало ясно, что аналитик должен так же хорошо владеть методами современной математической статистики, как геодезист владеет методом наименьших квадратов.

Каждая новая область применения математической статистики требует своего особого методического подхода. Опыт, полученный при статистических исследованиях в одной области, нельзя механически переносить на соседние, даже, казалось бы, близкие области. В частности, например, математическая теория ошибок, разработанная, исходя из задач метрологии и геодезии, не может быть без существенного видоизменения перенесена в область аналитической химии. Поэтому наряду с руководствами общего характера по математической статистике появилась необходимость в специализированных руководствах, рассчитанных на работников данной узкой области. Большой опыт в издании специализированных руководств накопился за рубежом, где вместе с выпуском значительного количества пособий общего характера, посвященных применению математической статистики в исследовательских работах, появился ряд специальных руководств по применению статистических методов исследования в химии явлений.

Это определение математической статистики носит весьма общий характер, обусловливаемый тем, что математическая статистика находит применение в самых разнообразных областях науки и техники. Применение математической статистики в какойлибо одной научной дисциплине всегда связано с преимущественным использованием определенных ее аспектов. В лабораторной работе и, в частности, при анализе вещества математическая статистика используется преимущественно для свертывания (сокращения) и анализа экспериментального материала методами, основанными на теории вероятностей. Объясняется это тем, что в исследовательских работах приходится иметь дело с действием и взаимодействием большого числа факторов, трудно поддающихся учету, поэтому постановка одной серии экспериментов обычно не дает возможности обнаружить действующие здесь физические закономерности. Эти закономерности могут быть выявлены только при сравнении результатов исследований, выполненных над различными объектами в различных условиях и разных лабораториях. Такое сравнение становится возможным только в том случае, если результаты опытов с помощью математической статистики представляются в компактной форме, удобной для хранения, передачи и дальнейшей обработки.

1. Задачи математической статистики

Свертка (сокращение) информации, в частности, заключается, например, в том, что с помощью аппарата математической статистики всю информацию о точности аналитического метода можно представить в виде функции (закона) распределения ошибок этого метода, характеризующегося параметрами распределений: дисперсией или средним квадратичным отклонением и математическим ожиданием).

В аналитической работе часто приходится ограничиваться сравнительно небольшим числом определений. Это небольшое количество наблюденных величин можно рассматривать как случайную выборку из не которого гипотетического бесконечного множества--генеральной совокупности, которая является математической моделью реально наблюдаемых величин. Задача свертывания информации с математической точки зрения сводится в этом случае к тому, что по выборке определяют некоторые величины (выборочную дисперсию и среднее арифметическое значение случайной величины), которые являются оценкой неизвестных параметров (соответственно дисперсии и математического ожидания) функции распределения этой генеральной совокупности. При оценке (определении) параметров генеральной совокупности по выборке, естественно, вносится известный элемент неопределенности, который можно учесть методами математической статистики. Среди экспериментаторов распространено совершенно неправильное мнение о том, что математическая статистика применима только к большому цифровому материалу. Современная математическая статистика дает возможность оценивать параметры генеральных совокупностей и устанавливать для них доверительные пределы даже по весьма малым выборкам,-- в некоторых случаях всего по двум измерениям. Но при этом, естественно, что чем меньше экспериментальный материал, тем менее точно может быть произведена оценка параметров генеральной совокупности по их выборочным значениям. Таким образом, математическая статистика, с одной стороны, дает возможность компактным образом представить результаты эксперимента, а с другой стороны, позволяет количественно оценить тот элемент сомнения, который сопутствует каждому эксперименту при малом числе опытов.

2. Методы математической статистики в аналитической химии

Рассмотрены вопросы, связанные со статистической обработкой результатов экспериментов, выполняемых при разработке методик количественного химического анализа, а также с обеспечением единства измерений химического состава вещества. Предложены алгоритмы для определения метрологических характеристик методик анализа и оценки качества работы аналитической лаборатории (оперативный контроль, включая карты Шухарта и кумулятивных сумм, и статистический контроль). Все используемые приемы широко иллюстрированы примерами, заимствованными из аналитической практики.

Решение первой задачи - свертка информации - заключается в том, чтобы с помощью аппарата математической статистики всю информацию о точности измерений представить в виде функции (закона) распределения случайных величин, которая связывает конкретное значение случайной величины с вероятностью ее появления. Основными параметрами закона распределения являются математическое ожидание м и дисперсия у2.

Закон распределения случайной величины является понятием математическим, основанным на том, что число (n) измерений случайной величины Х стремится к бесконечности (n > ?). Если n >?, совокупность измерений называется генеральной, и ее параметры м и у2 также являются генеральными .В экспериментальной работе обычно проводят ограниченное число измерений случайной величины Х. Это небольшое число измерений рассматривают как случайную выборку, характеризующую абстрактно существующую генеральную совокупность, которая является математической моделью реально существующей совокупности - выборочной совокупности или выборки. Задача свертывания информации с математической точки зрения сводится к тому, что с помощью выборочной совокупности определяются выборочные параметры (выборочное среднее x и выборочная дисперсия S2), которые являются оценками неизвестных генеральных параметров. При этом, естественно, чем меньше число n измерений в выборочной совокупности, тем менее надежно будут определены генеральные параметры по выборочным.

Поэтому вторая задача математической статистики состоит в оценке той неопределенности, которую мы вносим в результат исследований вследствие ограниченности числа измерений, используемых при определении x и S2.Существует целая серия статистических критериев, которые позволяют нам сделать объективные выводы, несмотря на ограниченное число экспериментальных данных. Отметим, что эффективность статистического анализа существенно повышается, если исследователь уже на стадии планирования эксперимента четко представляет, какие гипотезы он собирается проверять с помощью этих опытных данных, и какие критерии будет использовать для их проверки.

Анализ вещества - процесс многофакторный и много этапный, и на каждом этапе вносятся погрешности в результат анализа. Чтобы независимо определить их, требуется использовать специальное планирование эксперимента.

3. Элементы математической статистики, используемые при обработке результатов измерений

3.1 Обработка результатов методом математической статистики

Цель всех аналитических исследований - нахождение результата, наиболее близкого к истинному содержанию в пробе.

Общую погрешность метода можно оценить только с привлечением методов математической статистики. Эти методы исходят из идеализированного представления о бесконечно большом числе измерений. Исследователь же имеет дело с небольшим числом измерений (n<20), они называются выборочной совокупностью или выборкой. При оценке результатов анализа часто пользуются средним арифметическим значением. Прежде чем рассчитать среднее арифметическое значение результатов, они должны быть оценены на предмет выявления промахов, т. е. грубых отклонений. Нельзя без предварительной оценки отбросить кажущиеся неподходящими значения. Промахи или грубые отклонения устанавливаются по "размаху варьирования". Размах варьирования - это разница между двумя крайними значениями - максимальным (хmax) и минимальным (хmin). Далее вычисляют Q критерий, который определяется отношением:

,

где х1 - подозрительно выделяющееся значение;

х2 - значение, ближайшее по величине к подозрительному.

Вычисленную величину Q сопоставляют с табличным значением (таблицы обычно приведены в учебниках). Наличие грубого промаха доказано, если Q>Qтабл при данном числе определений n и выбранной доверительной вероятности P.

Доверительная вероятность (Р) - это соответствие экспериментального результата истинной величине и обычно принимается равной 95% или 90%.

При систематической обработке данных рассчитывают следующие основные характеристики выборочной совокупности.

1. Среднее арифметическое для выборки из n результатов

2. Дисперсию, характеризующую рассеяние результатов относительно среднего

3. Стандартное отклонение

4. Относительное стандартное отклонение

Дисперсия, стандартное отклонение и относительное стандартное отклонение - характеризуют воспроизводимость результатов химического анализа, то есть отражают случайные ошибки измерений.

5. Доверительный интервал.

Для ограниченного числа измерений истинное значение определяемой величины находится в пределах определенного интервала от среднего арифметического , т.е. в пределах . Этот интервал называют доверительным. Обычно при обработке данных химического анализа его определяют для заданной доверительной вероятности (при отсутствии систематических погрешностей в этом интервале с соответствующей вероятностью находится истинное значение хист). Этот интервал можно рассчитать, пользуясь выражением

где tP,f - коэффициент распределения Стьюдента (эта величина берется из справочных таблиц); s - стандартное отклонение измеряемой величины, рассчитанное для выборочной совокупности из n данных, а f = n-1. Доверительную вероятность Р обычно принимают равной 0,95, хотя в зависимости от характера решаемой задачи ее можно полагать равной 0,90, 0,99 или какой-либо другой величине. Если известно истинное значение хист, то доверительный интервал () характеризует как воспроизводимость результатов химического анализа, так и их правильность.

3.2 Результат анализа как случайная величина

Сложность процесса химического анализа приводит к тому, что его результат зависит не только от контролируемых, но и целого ряда неконтролируемых факторов, т. е. он является случайной величиной. По определению [36], случайной считается величина Х, которая в каждом испытании может принять одно и только одно возможное значение, заранее неизвестное и зависящее от случайных причин, которые не могут быть учтены. Однако это не значит, что значения Х изменяются произвольно, не подчиняясь ни каким законам. Опыт показывает, что частота появления тех или иных значений случайной величины в значительной степени предсказуема. Поэтому, если имеются данные многократных испытаний, то можно получить закон распределения случайной величины Х (в виде формулы, графика или таблицы), который связывает возможные значения Х с вероятностью их появления и характеризуется определенными параметрами, чаще математическим ожиданием м и дисперсией у2. Одна из задач математической статистики состоит в нахождении их значений по ограниченному числу измерений (свертка информации).

Случайные величины бывают дискретными и не прерывными. Дискретной называют случайную величину, которая принимает отдельные, изолированные значения с определенными вероятностями. Число возможных значений дискретной случайной величины может быть ограниченным и бесконечным. Примером бесконечной дискретной случайной величины в аналитической химии является результат подсчета числа квантов в спектральных методах анализа или числа структурных единиц при минералогическом анализе. Случайная величина считается непрерывной, если она может принимать все значения из некоторого конечного или бесконечного промежутка. Например, результаты гравиметрического анализа ограничены, если они выражены в процентах (0 ч 100%), и не ограничены, если выражены в единицах массы. Отметим, что непрерывность случайных величин является математической абстракцией т. к. на практике всегда имеем дело с выборкой округленных результатов измерений.

3.3 Оценивание генеральных параметров (свертывание цифровой информации)

Математическое ожидание. Оценками математического ожидания м обычно служит среднее арифметическое х, а иногда среднее геометрическое хг, медиана (срединное значение) х ~ или мода. Если провели n измерений случайной величины Х: х1, х2, х3,…хi …хn, то их среднее арифметическое или выборочное среднее можно найти по формуле:

Измерениу выдается в виде логарифма искомой величины, например, в атомном спектральном анализе, то корректной оценкой математического ожидания является среднее геометрическое хг:

хг =

Значение хг всегда немного меньше х , найденного по этой жевыборке. Если случайная погрешность измерения не столь велика(менее 20%), различие между хг и х несущественно, поэтому на практике обычно для характеристики м пользуются средним арифметическим.

Чтобы найти медиану, результаты измерений располагают вряд (ранжированный ряд) в порядке возрастания их значений:x1 ? x2 ? x3 ?…? xn. Если n - нечетное число, то медиана х равна среднему члену ряда. Если n - четное число, то значение х равно полусумме двух средних членов ряда. Мода - наиболее часто встречающееся значение случайной величины при большой серии измерений.

При определении серы в пробе каменного угля получили следующие содержания (%): 2,12; 2,13; 2,15; 2,00; 2,15.

Оценить среднее арифметическое x и медиану х.

Решение. Среднее арифметическое вычисляем по формуле (1.1):x = = 2,11%.

Для нахождения медианы располагаем результаты в ряд: 2,00;2,12; 2,13; 2,15; 2,15. Поскольку n = 5, то х = x3 = 2,13%.

Генеральная дисперсия. Оценкой генеральной дисперсии у2служит выборочная дисперсия, которую рассчитывают по формуле:

S2=

где x - среднее значение, найденное из х1, х2,…,хi,…,хn измерений;

n - число членов в выборке.

Относительное стандартное отклонение или коэффициент вариации в частях составляет V = 0,076/3,38 = 0,022 или в процентах V = (0,076/3,38)ЃE100% = 2,2%.

3.4 Распределения случайных величин

Нормальное распределение случайной величины

Наиболее распространенным в практике измерений является нормальный закон распределения, или закон распределения Гаусса. Этот закон является основой классической теории погрешностей измерений и современной статистической обработки результатов эксперимента. Кроме того, это предельный закон для многих других законов распределения.

Любая случайная величина имеет функцию распределения зависимость плотности вероятности от значения случайной величины. Для нормального распределения (распределения Гаусса) функция распределения имеет следующий вид: математический статистика дисперсия арифметический

матожидание (генеральное среднее) стандартное отклонение

Для проведения статистических расчетов часто необходимо располагать информацией о виде функции распределения.

Центральная предельная теорема Чебышева: Если случайная величина подвержена воздействию бесконечного числа бесконечно малых случайных факторов, то она имеет нормальное распределение. Как правило, для аналитических измерений условие теоремы выполняется, поэтому для результатов химического анализа обычно постулируется нормальное распределение.

Нарушения нормального закона распределения:

1) Нарушаются условия теоремы (выделяется более весомая группа факторов). Например: анализ высокочистых веществ неравномерное распределение примесей.2) Произвольное объединение нескольких выборок (даже если каждая из них подчинялась распределению Гаусса):

3) Косвенные измерения. Линейная комбинация нормально распределенных случайных величин также будет подчиняться нормальному распределению. А нелинейная комбинация (например, произведение двух величин) не сохранит нормального распределения. Однако, чем меньше погрешность, тем меньше отличие от нормального распределения, поэтому даже для нелинейных преобразований в некоторых случаях можно принять нормальное распределение.

4) Результат измерения является дискретной величиной (например, некоторые радиоактивационные методы анализа, ряд биохимических и рентгеноспектральных методов так называемые счетные методы). В этом случае результат измерения подчиняется распределению Пуассона. Однако при больших распределение Пуассона переходит в нормальное распределение. (Примечание: формально любой результат измерения является дискретным потому, что шкала прибора имеет дискретный набор делений, и результат округляется до ближайшего деления. Однако если измеряемый сигнал много больше цены деления, то результат подчиняется нормальному распределению).

Что делать, если результат не подчиняется нормальному распределению?

1) Возможно, нормальное распределение выполняется приблизительно и можно применять критерии для нормального распределения.

2) Если известен закон распределения (например, распределение Пуассона), то можно пользоваться критериями этого распределения. (Например, для сравнения двух нормально распределенных случайных величин используется критерий Стьюдента . Дисперсия рассчитывается нелинейным преобразованием, и подчиняется распределению (х и квадрат распределение или распределение Фишера). Для сравнения двух дисперсий используется критерий Фишера.

3) Если распределение неизвестно, то на этот случай существуют непараметрические критерии. Например, сравнение двух средних на основе расчета числа возможных перестановок внутри объединенной выборки.

3.5 Проверка выполнения нормального закона распределения

Известно, что результаты химического анализа, как правило, подчиняются нормальному распределению. Исходя из этого выбираются критерии для проверки статистических гипотез. Однако, если распределение отличается от нормального, то критерии для нормального распределения (такие, как критерий Стьюдента) применять нельзя.

Поэтому вид распределения нужно предварительно проверять. Существуют статистические критерии подчинения нормальному закону распределения.

1) Грубые критерии. Эти критерии определяют, есть ли резко выпадающие данные (грубые ошибки, промахи, выбросы). Эти критерии не рассматривают всей совокупности данных, а только крайние значение. Примером может служить Qкритерий. Тестовая статистика Qкритерия вычисляется по формуле:

где x? "подозрительное" значение (вероятный промах) это максимальное или минимальное значение выборки, xближайшее ближайшее к подозрительному значение, xмин и xмакс максимальное и минимальное значения выборки (эта формула верна для числа измерений n = 3..7. При n = 8..10 в знаменателе должна стоять разница между подозрительным значением и ближайшем к максимальному (или минимальному)). Значение Q сравнивают с табличным значением, и если табличное значение критерия меньше тестовой статистики, то подозрительный результат является промахом и исключается из дальнейшего рассмотрения. При этом обычно доверительную вероятность берут равной 0.90, а не 0.95. В данном случае это является некоторым "ужесточением" требований: лучше выбросить значение, не являющееся промахом, чем оставить промах в выборке. Как правило, на промах проверяют минимальное и максимальное значение выборки.

Q критерий работает для выборок, содержащих 3 10 значений, при больших объемах выборки он становится нечувствителен к промахам.

2) Критерии, которые определяют, подчиняется ли вся совокупность нормальному распределению. Для применения этих критериев обычно требуется большой набор данных (чем больше, тем лучше, как правило, не меньше 30 единичных измерений).

Один из наиболее простых критериев этого типа критерий Пирсена. Проверка гипотезы о нормальном распределении случайной величины осуществляется по следующей схеме:

Дана выборка из n значений: x1, x2 ... xn, причем n > 30

Значения упорядочиваются по возрастанию, и вся выборка разбивается на m интервалов, m > 5, (обычно берут ), причем в каждый интервал должно попадать не менее 5 значений:

Строится гистограмма, площадь прямоугольника над отрезком должна быть пропорциональна числу точек, попавшему в отрезок (Ni):

Нужно выяснить, случайно ли отличие от нормального распределения, другими словами, случайно ли различие между экспериментальной кривой и теоретической кривой. Теоретическая кривая строится по формуле:

причем в качестве и берутся соответственно значения среднего и стандартного отклонения S, вычисленные для тестируемой выборки.

Нужно охарактеризовать различие между площадью экспериментальной гистограммы и площадью под теоретической кривой. Интеграл от функции Гаусса не выражается в элементарных функциях, но существуют таблицы интегралов для функции:

Для того, чтобы теоретическую кривую привести к такому виду, нужно произвести замену переменных:

Аналогично преобразовываются координаты отрезков:

Строится таблица:

отрезок

исходные границы

преобразованные границы

интеграл от функции гаусса

левая

правая

левая

правая

(вычисляется по таблице)

1

a1

b1

I1

2

a1

a2

b1

b2

I2

m

am1

bm1

Im

Поскольку интеграл Ii равен доле точек (сумма этих интегралов должна быть равна 1), то его нужно умножить на число точек:

Вычисляется тестовая статистика:

Тестовая статистика сравнивается с табличным значением . Если тестовая статистика больше табличного значения, гипотеза о нормальном распределении отбрасывается, если меньше данные подчиняются нормальному распределениюак проверить, выполняется ли нормальный закон распределения,. В таких случаях вместо полного перечисления значений случайной величины и соответствующих вероятностей используют числовые характеристики распределения, наиболее употребительными из которых являются математическое ожидание и дисперсия

При изучении совместного распределения нескольких случайных величин пользуются коэффициентами корреляции и методами корреляционного анализа.

3.6 Корреляционный анализ. Коэффициент корреляции

Корреляция (от лат. correlatio «соотношение, взаимосвязь») или корреляционная зависимость -- это статистическая взаимосвязь двух или нескольких случайных величин (либо величин, которые можно с некоторой допустимой степенью точности считать таковыми). При этом изменения значений одной или нескольких из этих величин сопутствуют систематическому изменению значений другой или других величин.[1]

Математической мерой корреляции двух случайных величин служит корреляционное отношение [2] либо коэффициент корреляции (или )[1]. В случае если изменение одной случайной величины не ведёт к закономерному изменению другой случайной величины, но приводит к изменению другой статистической характеристики данной случайной величины, то подобная связь не считается корреляционной, хотя и является статистической[3].

Способы представления корреляционной связи:

график (диаграмма рассеяния)

коэффициент корреляции

Методы определения коэффициента корреляции и формулы

метод квадратов (метод Пирсона)

ранговый метод (метод Спирмена)

Рассмотрим на применение метода квадратов

Задание: вычислить коэффициент корреляции, определить направление и силу связи между количеством кальция в воде и жесткостью воды, если известны следующие данные (табл.). Оценить достоверность связи. Сделать вывод.

Жесткость воды

(в градусах)

Количество кальция в воде

(в мг/л)

4

8

11

27

34

37

28

56

77

191

241

262

Обоснование выбора метода. Для решения задачи выбран метод квадратов (Пирсона), т.к. каждый из признаков (жесткость воды и количество кальция) имеет числовое выражение; нет открытых вариант.

Решение.

Последовательность расчетов изложена в тексте, результаты представлены в таблице. Построив ряды из парных сопоставляемых признаков, обозначить их через х (жесткость воды в градусах) и через у (количество кальция в воде в мг/л).

Жесткость воды (в градусах)

Количество кальция в воде (в мг/л)

dх

dу

dх х dу

dx2

dy2

4

8

11

27

34

37

28

56

77

191

241

262

16

12

9

+7

+14

+16

114

86

66

+48

+98

+120

1824

1032

594

336

1372

1920

256

144

81

49

196

256

12996

7396

4356

2304

9604

14400

Мх=У х / n

Му=У у / n

У dх x dу=7078

У dх2=982

У dy2=51056

Мх=120/6=20

Мy=852/6=142

Определить средние величины Mx ряду вариант "х" и Му в ряду вариант "у" по формулам:

Мх = Ух/n (графа 1) и

Му = Уу/n (графа 2)

Найти отклонение (dх и dу) каждой варианты от величины вычисленной средней в ряду "x" и в ряду "у"

dх = х -- Мх (графа 3) и dy = у -- Му (графа4).

Найти произведение отклонений dx х dy и суммировать их: У dх х dу (графа 5)

Каждое отклонение dx и dу возвести в квадрат и суммировать их значения по ряду "х" и по ряду "у": У dx2 = 982 (графа 6) и У dy2 = 51056 (графа 7).

Определить произведение У dx2 х У dy2 и из этого произведения извлечь квадратный корень

Полученные величины У (dx x dy) и v(Уdx2 x Уdy2) подставляем в формулу расчета коэффициента корреляции:

Определить достоверность коэффициента корреляции:

1й способ. Найти ошибку коэффициента корреляции (mrxy) и критерий t по формулам:

Критерий t = 14,1, что соответствует вероятности безошибочного прогноза р > 99,9%.

2й способ. Достоверность коэффициента корреляции оценивается по таблице "Стандартные коэффициенты корреляции" (см. приложение 1). При числе степеней свободы (n -- 2)=6 2=4, наш расчетный коэффициент корреляции r = + 0,99 больше табличного (rтабл = + 0,917 при р = 99%).

Чем больше кальция в воде, тем она более жесткая (связь прямая, сильная и достоверная: rху = + 0,99, р > 99,9%).

3.7 Регрессионный анализ. Градуировка

Проведение количественного анализа, как правило, включает в себя построение градуировки, т.е. находждение градуировочной функции экспериментальным путем. Для этого измеряется аналитический сигнал для серии образцов сравнения, в результате получается массив данных: {xi,yi}, где x содержание определяемого компонента, y аналитический сигнал. На http://bono-esse.ru/blizzard/img/f9st.pngплоскости каждое измерение можно представить точкой:

Градуировочная функция y = f(x) определяется методами регрессионного анализа. Прямо через точки проводить ломаную и считать ее градуировочной функцией нельзя, т.к. и змеряемый сигнал содержит погрешность.

Т.о. необходимо:

1) доопределить функцию (между точками)

2) минимизировать погрешность и

3) выбрать вид зависимости.

Вид функции зависимости выбирается исходя из внешней информации (расположения точек на плоскости) и из общих соображений относительно физических и химических законов, связывающих аналитический сигнал с содержанием определяемого компонента (например, построение градуировки в спектрофотометрии опирается на закон БугераЛамбертаБера). Наиболее часто используется линейная зависимость.

Обозначим k число параметров градуировочной функции, n число измерений. Мы получаем систему уравнений:

Рассмотрим различные варианты соотношений n и k:

1) n < k данных недостаточно. Необходимо провести больше измерений или упростить модель уменьшить число параметров.

2) n = k у системы единственное точное решение. Однако в этом случае нельзя оценить погрешность измерения

3) n > k система уравнений несовместна и не имеет точного решения. Существует бесконечное множество приближенных решений, возникает задача аппроксимации.

На практике наиболее распространен 3й случай. Рассмотрим его более подробно на примере линейного регрессионного анализа (т.е. градуировочная зависимость имеет линейный вид y = ax + b, определяется двумя параметрами a и b, k = 2).

Необходимо найти a и b такие, чтобы погрешность была минимальной.

Один из наиболее распространенных методов нахождения параметров линейной зависимости метод наименьших квадратов, МНК

Предпосылки МНК:

1) Погрешность аргумента (x) пренебрежимо мала по сравнению с погрешностью y

2) Погрешность y постоянна (не зависит от x) постулат равноточности (в условиях реального эксперимента погрешность обычно растет с ростомy)

3) Данные подчиняются нормальному закону распределения

4) Данные независимы, коэффициент корреляции r(yi,yj) = 0

5) Отклонение градуировочной функции от экспериментальных данных минимально. В рамках метода наименьших квадратов минимизируется величина , где Yi величина аналитического сигнала, рассчитанная по уравнению Y = ax + b, yi экспериментальная величина аналитического сигнала

С учетом всех предпосылок получаются следующие выражения для a и b:

В таких случаях вместо полного перечисления значений случайной величины и соответствующих вероятностей используют числовые характеристики распределения, наиболее употребительными из которых являются математическое ожидание и дисперсия.

Теория вероятностей ( изучает закономерности, возникающие в случайных экспериментах, раскрывает объективные закономерности, присущие массовым явлениям. Ее методы не дают возможности предсказать исход отдельного случайного явления, но позволяют предсказать средний суммарный результат массы однородных случайных явлений.

Одна из важнейших задач любой науки - найти закономерности в водовороте «случайных» явлений окружающей нас жизни. Учебное пособие предназначено для студентов, аспирантов, специализирующихся в области аналитической химии, и работников аналитических лабораторий. Теория вероятности широко применяется при изучении случайных величин и процессов в различных областях естествознания.

Заключение

Вероятностные идеи стимулируют в наши дни развитие всего комплекса знаний, начиная от наук о не живой природе и кончая науками об обществе. Прогресс современного естествознания неотделим от использования и развития вероятностных идей и методов. В наше время трудно назвать какую-либо область исследований, где бы не применялись вероятностные методы.

Список литературы

1. Вентцель Е.С. Теория вероятностей: Учебник для вузов. М.: Высшая школа, 2006 г.;

2. Гмурман В.Е. Теория вероятностей и математическая статистика. Учеб. пособие для вузов. М: Высшая школа, 1998 г.;

3. Гнеденко Б.В. Очерк по теории вероятностей. М.: Эдиториал УРСС, 2009 г.;

4. Майстров Л.Е. Развитие теории вероятностей. М.: Наука, 1980 г.;

5. Майстров Л.Е. Теория вероятностей. Исторический очерк. М.: Наука, 1967 г.

6. Соболев Е.В. Организация радиотехнического обеспечения полётов (часть 1). Санкт-Петербург, 2008 г.;

7. http://verojatnost.pavlovkashkola.edusite.ru/p8aa1.html

8. http://shpora.net/index.cgi?act=view&id=4966

Размещено на Allbest.ru

...

Подобные документы

  • Основные этапы обработки данных натуральных наблюдений методом математической статистики. Оценка полученных результатов, их использование при принятии управленческих решений в области охраны природы и природопользования. Проверка статистических гипотез.

    практическая работа [132,1 K], добавлен 24.05.2013

  • Теория вероятности, понятие вероятности события и её классификация. Понятие комбинаторики и её основные правила. Теоремы умножения вероятностей. Понятие и виды случайных величин. Задачи математической статистики. Расчёт коэффициента корреляции.

    шпаргалка [945,2 K], добавлен 18.06.2012

  • Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.

    курсовая работа [215,1 K], добавлен 13.12.2014

  • Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.

    лекция [387,7 K], добавлен 12.12.2011

  • Что такое абсолютные и относительные величины. Применение абсолютной и относительной величины в статистике. Прикладные варианты использования методов математической статистики в различных случаях решения задач. Опыт построения статистических таблиц.

    контрольная работа [39,6 K], добавлен 12.12.2009

  • Ознакомление с механизмом проверки гипотезы для случая единственной выборки, двух и нескольких независимых выборок. Проверка совпадений карт, выбор фильмов разных жанров. Обоснование результатов, полученных после проверки статистических гипотез.

    курсовая работа [726,2 K], добавлен 26.02.2015

  • Определение вероятности наступления определенного события по законам теории вероятности. Вычисление математического ожидания, дисперсии и среднего квадратичного отклонения. Нахождение выборочного уравнения регрессии по данным корреляционной таблицы.

    контрольная работа [212,0 K], добавлен 01.05.2010

  • Оценки параметров распределения, наиболее важные распределения, применяемые в математической статистике: нормальное распределение, распределения Пирсона, Стьюдента, Фишера. Факторное пространство, формулирование цели эксперимента и выбор откликов.

    реферат [105,5 K], добавлен 01.01.2011

  • Основные понятия комбинаторики. Определение теории вероятности. Понятие математического ожидания и дисперсии. Основные элементы математической статистики. Условная вероятность как вероятность одного события при условии, что другое событие уже произошло.

    реферат [144,6 K], добавлен 25.11.2013

  • Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.

    контрольная работа [62,6 K], добавлен 20.02.2011

  • Обработка результатов информации по транспортным и технологическим машинам методом математической статистики. Определение интегральной функции нормального распределения, функции закона Вейбула. Определение величины сдвига к началу распределения параметра.

    контрольная работа [488,5 K], добавлен 05.03.2017

  • Исторические аспекты развития статистики, ее предмет. Понятие статистической методологии. Организация государственной и международной статистики. Программа и формы статистического наблюдения. Формы вариационного ряда. Средняя арифметическая и ее свойства.

    шпаргалка [37,9 K], добавлен 12.12.2010

  • Теоретические основы юридической статистики, числовые характеристики. Построение гистограммы выборки. Оценка среднего значения, дисперсии и эксцесса. Выборочное уравнение регрессии по данным корреляционных таблиц. Интервальная оценка распределения.

    курсовая работа [1,1 M], добавлен 16.11.2013

  • Предмет, метод и история возникновения статистики. Построение таблиц, понятие абсолютных и относительных величин и правила действия с ними. Сущность вариации, свойства дисперсии и расчет индексов. Особенности корреляционно-регрессионного анализа.

    курс лекций [302,0 K], добавлен 14.07.2011

  • Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.

    задача [409,0 K], добавлен 17.10.2012

  • История возникновения и развития математической логики как раздела математики, изучающего математические обозначения и формальные системы. Применение математической логики в технике и криптографии. Взаимосвязь программирования и математической логики.

    контрольная работа [50,4 K], добавлен 10.10.2014

  • Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.

    курсовая работа [216,2 K], добавлен 28.09.2011

  • Сущность предела функции, ее производной и дифференциала. Основные теоремы о пределах и методы их математического вычисления. Производная, ее физический и геометрический смысл. Связь непрерывности и дифференцируемости, основные правила дифференцирования.

    презентация [128,4 K], добавлен 24.06.2012

  • Исследование зависимости потребления бензина в городе от количества автомобилей с помощью методов математической статистики. Построение диаграммы рассеивания и определение коэффициента корреляции. График уравнения линейной регрессии зависимости.

    курсовая работа [593,2 K], добавлен 28.06.2009

  • Обработка данных измерений величин и представление результатов с нужной степенью вероятности. Определение среднего арифметического и вычисление среднего значения измеренных величин. Выявление грубых ошибок. Коэффициенты корреляции. Косвенные измерения.

    реферат [116,2 K], добавлен 16.02.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.