Основные положения математической теории ошибок применительно к обработке результатов физического эксперимента

Результат эксперимента как случайная величина. Свертывание цифровой информации: математическое ожидание, распределение Стьюдента, ошибка косвенных измерений. Статистические гипотезы, уровень значимости. Методы исключения выбросов (грубых ошибок).

Рубрика Математика
Вид методичка
Язык русский
Дата добавления 11.09.2015
Размер файла 340,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Введение

С первых дней обучения в вузе будущие физики и инженеры обычно приступают к занятиям в физической лаборатории, основная задача которых - научить правильно измерять различные физические величины.

В программу работы лаборатории включаются как простейшие измерения длины, объема, удельного веса, так и более сложные опыты по измерению различных электрических и оптических величин, молекулярного веса, вязкости и т.п.

Как правило, перед началом лабораторных занятий студентам преподают элементы теории ошибок, на основе которой они должны после получения результата измерения оценить его погрешность. Приходится с сожалением отметить, что в большинстве случаев вопрос об ошибках измерений преподносится в примитивной форме, а иногда делаются даже неверные рекомендации и правила оценки погрешностей.

И хотя существует строгая математическая теория ошибок, великолепно изложенная в ряде классических и современных руководств, наряду с ней бытует другая «теория ошибок», попавшая в большинство руководств к лабораторным занятиям по физике и даже в некоторые справочники. цифровой математический величина косвенный

Правила вычисления и оценки погрешностей с позиции этих двух теорий существенно различны, и, к несчастью, студенты иногда обучаются именно такой «теории ошибок». В результате такого положения некоторые специалисты, порой очень эрудированные в своей области, не всегда умеют грамотно оценить погрешности результатов измерений.

В данном учебно-методическом пособии делается попытка изложить основные положения математической теории ошибок применительно к обработке результатов физического эксперимента.

1. Термины и определения

Физическая величина - одно из свойств физического объекта (физической системы, явления или процесса), общее в качественном отношении для многих физических объектов, но в количественном отношении индивидуальное для каждого из них.

Значение физической величины - выражение размера физической величины в виде некоторого числа принятых для нее единиц, абсолютных или относительных.

Измерение величины - совокупность операций по применению технического средства, хранящего единицу физической величины, обеспечивающих нахождение соотношения (в явном или неявном виде) измеряемой величины с ее единицей и получение значения этой величины. Таким образом, значение величины - это результат ее измерения. Измерения делятся на прямые и косвенные. Прямое измерение - это измерение, при котором искомое значение физической величины получают непосредственно. Например, измерение длины с помощью линейки, температуры с помощью термометра, времени секундомером и т. д. Косвенное измерение - это определение искомого значения физической величины на основании результатов измерения других физических величин, функционально связанных с искомой величиной.

Опыт показывает, что ни одно измерение, как бы тщательно оно не проводилось, не может быть свободно от ошибок. Учитывая это, в научном эксперименте слово ошибка имеет другой смысл, чем в бытовом. В последнем случае слово ошибка означает то, что выполнено неправильно. Ошибка в научных измерениях означает неизбежную погрешность, которая сопутствует всем измерениям, и ее нельзя отнести к промахам экспериментатора. В связи с этим при характеристике качества измерений термин ошибка запрещен в отечественной метрологии, позволительно пользоваться только термином погрешность.

Погрешность результата измерения - отклонение результата измерения от истинного (действительного) значения измеряемой величины.

При этом под истинным значением понимается значение величины, которое идеальным образом характеризует в качественном и количественном отношении соответствующую физическую величину. В практике измерений обычно пользуются действительным значением, понимая под этим значение физической величины, полученное экспериментальным путём и настолько близкое к истинному значению, что в поставленной измерительной задаче может быть использовано вместо него. Истинное значение - это полезная идеализация, подобно материальной точке при выводе физических закономерностей, оно выражает цель измерений. Если методика измерений не в полной мере учитывает свойства реального объекта, то имеем не одно, а множество истинных значений, отвечающих определению данной величины.

Погрешности делят на случайные и систематические, кроме того, есть заведомо неверные результаты - выбросы (промахи или грубые ошибки), которые возникают вследствие нарушения основных условий измерений или в результате недосмотра экспериментатора.

Промах - результат эксперимента, резко отличающийся от других результатов.

Случайная погрешность - составляющая погрешности результата измерения, изменяющаяся случайным образом (по знаку и значению) при повторных измерениях, проведенных с одинаковой тщательностью, одной и той же физической величины.

Систематическая погрешность - разность между результатом измерения и истинным (или в его отсутствие - принятым опорным) значением.

Принятое опорное значение - значение, которое служит в качестве согласованного для сравнения и получено как:

а) теоретическое или установленное значение, базирующееся на научных принципах;

б) приписанное или аттестованное значение, базирующееся на экспериментальных работах какой-либо национальной или международной организации;

в) согласованное или аттестованное значение, базирующееся на совместных экспериментальных работах под руководством научной или инженерной группы;

г) математическое ожидание (общее среднее значение) заданной совокупности результатов измерений в условиях отсутствия необходимых эталонов, обеспечивающих воспроизведение, хранение и передачу соответствующих значений измеряемых величин истинных или действительных значений измеряемых величин.

Принятое опорное значение - это общий термин для обозначения того, с чем сравнивают результаты данного эксперимента при оценке правильности (или точности) измерения.

2. Результат эксперимента как случайная величина

Сложность процесса измерений физических величин приводит к тому, что его результат зависит не только от контролируемых, но и целого ряда неконтролируемых факторов, т. е. он является случайной величиной. По определению, случайной считается величина x, которая в каждом испытании может принять одно и только одно возможное значение, заранее неизвестное и зависящее от случайных причин, которые не могут быть учтены. Однако это не значит, что значения x изменяются произвольно, не подчиняясь никаким законам. Опыт показывает, что частота появления тех или иных значений случайной величины в значительной степени предсказуема. Поэтому, если имеются данные многократных испытаний, то можно получить закон распределения случайной величины x (в виде формулы, графика или таблицы), который связывает возможные значения x с вероятностью их появления и характеризуется определенными параметрами, чаще математическим ожиданием м и дисперсией у2. Одна из задач математической статистики состоит в нахождении их значений по ограниченному числу измерений (свертка информации).

Случайные величины бывают дискретными и непрерывными. Дискретной называют случайную величину, которая принимает отдельные, изолированные значения с определенными вероятностями. Число возможных значений дискретной случайной величины может быть ограниченным и бесконечным. Случайная величина считается непрерывной, если она может принимать все значения из некоторого конечного или бесконечною промежутка. Отметим, что непрерывность случайных величин является математической абстракцией, т. к. на практике всегда имеем дело с выборкой округленных результатов измерений.

3. Свертывание цифровой информации

Математическое ожидание

Оценками математического ожидания м обычно служит среднее арифметическое x, а иногда медиана (срединное значение). Если провели n измерений случайной величины х: х1, x2 ,х3,...,xi,...,xn, то их среднее арифметическое или выборочное среднее можно найти по формуле:

(1)

Чтобы найти медиану, результаты измерений располагают в ранжированный ряд в порядке возрастания их значений: х123?…?хn. Если n - нечетное число, то медиана равна среднему члену ряда. Если n - четное число, то значение равно полусумме двух средних членов ряда.

Медиана в отличие от среднего арифметического нечувствительна к резко выделяющимся измерениям, поэтому при низком качестве измерений и малом числе n она является лучшей оценкой математического ожидания.

Задача 1. При определении коэффициента жесткости пружины статическим методом получили следующие значения (Н/м): 11,21; 11,47; 11,59; 12,26; 11,32. Оценить среднее арифметическое и медиану .

Решение. Среднее арифметическое находим по формуле (1):

.

Для нахождения медианы располагаем результаты в ряд: 11,21; 11,32; 11,47; 11,59; 12,26. Поскольку n=5, то = 11,47 Н/м.

Оценка генеральной дисперсии

Оценкой генеральной дисперсии у2 служит выборочная дисперсия, которую рассчитывают по формуле:

(2)

где - среднее значение, найденное из х1, x23,...,xi,...,xn измерений, n - число членов в выборке.

Величину f=n-1 называют числом степеней свободы выборочной характеристики и определяют как число измерений, используемое для расчета данной характеристики, за вычетом числа связей, которые наложили на выборку при вычислении этой характеристики. Значение f указывает на надежность определения генерального параметра по данной выборке. При вычислении дисперсии S2 по формуле (2) наложили одну связь на используемую выборку, когда рассчитывали по формуле (1). Если известно математическое ожидание данной совокупности измерений, то дисперсию S2 вычисляют по формуле:

(3)

При использовании формулы (3) на выборку не наложили ни одной связи, поэтому f = n.

Положительное значение корня квадратного из дисперсии называют стандартным отклонением: .

Относительное стандартное отклонение (коэффициент вариации V) равно:

в частях (4)

или в процентах . (4а)

Задача 2. Для данных задачи 1 рассчитать дисперсию, стандартное отклонение и коэффициент вариации.

Решение. Рассчитаем дисперсию результатов по формуле (2):

=0,17.

Стандартное отклонение .

Относительное стандартное отклонение или коэффициент вариации в частях составляет V=0,41/11,57=0,035 или в процентах V=(0,41/11,57)100%=3,5%.

Нормальное распределение случайной величины

Наиболее распространенным в практике измерений является нормальный закон распределения или закон распределения Гаусса. Этот закон является основой классической теории погрешностей измерений и современной статистической обработки результатов эксперимента. Кроме того, это предельный закон для многих других законов распределения.

Функция плотности вероятностей нормального закона распределения определяется формулой:

(5)

где х изменяется от -? до +?, м - математическое ожидание, у2 - генеральная дисперсия.

Функция ц(х) представляет симметричную куполообразную кривую, центр которой соответствует значению м (рис. 1). Мерой рассеяния результатов вокруг м является величина у. Чем больше у, тем более пологий вид имеет кривая ц(х).

Табулировать выражение (5) относительно х не представляется возможным, т. к. параметры у и м зависят от абсолютных значений измеренной случайной величины, поэтому в практической работе обычно пользуются нормированным нормальным законом распределения случайных величин, где вместо переменной х используется переменная u:

(6)

Рисунок 1. График дифференциальной кривой нормального закона распределения

В этом случае независимо от конкретного значения случайной величины математическое ожидание u=0, а у(u)=1. Функция плотности вероятностей имеет вид:

(7)

Для кривой ц(u) центр симметрии совпадает с началом координат, а на ось абсцисс наносится величина u - отклонение от среднего, выраженное в долях у (рис.2). Функция ц(u) табулируется. Если выражение (7) проинтегрировать в пределах от -? до +?, то получим площадь, заключенную между кривой ц(u) и осью абсцисс, равную 1, т. е. определим вероятность события, когда случайная величина х может принимать значения от -? до +?. Если проинтегрировать в пределах от -u до +u, то получим часть площади, заключенную между участком кривой от -? до +? и осью абсцисс, которая определяет вероятность Р события, когда случайная величина х принимает значения в пределах -uу ? x ? uу. Вероятность б=1-Р (незаштрихованные области на рис. 2) определяет событие, когда случайная величина х может принимать значения x<-uу и x>uу.

Рисунок 2. График дифференциальной кривой нормированного нормального закона распределения

Пользуясь табулированными значениями функции (7) можно подсчитать, что в области ±у (u=1) лежит 68,2 % всех результатов измерения, т. е. около 16 % результатов измерений отклоняются от среднего менее чем -у, и около 16 % - более чем у. Вероятность появления значений хi за пределами ±2у и ±3у равна соответственно 5 % и 0,3 %.

Распределение Стьюдента

Нормальный закон распределения случайных величин показывает, что вероятность появления малых отклонений от среднего значительно больше вероятности появления больших отклонений. Например, вероятность появлений погрешностей, превышающих по величине 2у, равна примерно 0,05, т. е. в среднем из 20 результатов эксперимента только один будет иметь большее отклонение. Поэтому естественно ожидать, что если исследователь выполнил небольшое число измерений одной величины, то среди них результатов с большими отклонениями от среднего не будет. Если по этой выборке оценить дисперсию S2, то ее значение будет меньше соответствующей ей генеральной дисперсии. В силу этих обстоятельств классическая теория ошибок, основанная на нормальном законе распределения, не применима для обработки малого числа измерений. Статистика малых выборок стала возможна с появлением распределения Стьюдента (t-распределение).

Если обработке подвергается небольшое число измерений, то вместо генеральной дисперсии у2 вынуждены пользоваться выборочной дисперсией S2, близость значения которой к генеральной у2 зависит от числа степеней свободы f по которой рассчитывали S2. В этом случае переменную u заменяют на новую переменную t, не содержащую неизвестной величины у.

Функция ц(t) плотности вероятностей t-распределения симметрична относительно м, т. е. максимумы t-распределения и нормального распределения соответствуют одному значению абсциссы. Однако в отличие от нормального распределения высота и ширина кривой ц(t) зависит не только от S, но и от f, по которым рассчитывали S: при одном и том же значении S с уменьшением f кривая ц(t) выполаживается. При f>? t-распределение совпадает с нормальным распределением. Практически уже при f > 20 можно считать, что распределение Стьюдента хорошо аппроксимируется распределением Гаусса.

В табл. 1 Приложения табулированы значения t в зависимости от числа степеней свободы f (левая вертикальная колонка), по которым рассчитывали S, и различных уровней значимости (верхний горизонтальный ряд).

Закон сложения случайных ошибок

Пусть наша измеряемая величина z является суммой (или разностью) двух величин x и y, результаты измерений которых независимы. Тогда можно доказать, если , , -дисперсии величин x, y и z, а z=x ± y, то или

(8)

Если z является суммой не двух, а большого числа слагаемых, то закон сложения ошибок будет таким же, т. е.: средняя квадратичная ошибка суммы (или разности) двух (или нескольких) независимых величин равна корню квадратному из суммы дисперсий отдельных слагаемых.

Это чрезвычайно важное обстоятельство, и необходимо твердо помнить, что для нахождения суммарной ошибки нужно складывать не сами ошибки, а их квадраты.

Из закона сложения ошибок следует два чрезвычайно важных вывода. Первый из них относится к роли каждой из ошибок в общей ошибке результата. Он выражается в том, что значение отдельных ошибок очень быстро падает по мере их уменьшения. Поясним сказанное примером: пусть x и y два слагаемых, определенных со средними квадратичными ошибками Sx и Sу, причем известно, что Sy в два раза меньше, чем Sx. Тогда ошибка суммы (z = x + y) будет

=+(= (9)

Откуда Sz?1.1Sx.

Иначе говоря, если одна из ошибок в два раза меньше другой, то общая ошибка возросла за счет этой меньшей ошибки всего на 10%, что обычно играет очень малую роль. Это означает, что если мы хотим повысить точность измерений величины z, то нам нужно в первую очередь стремиться уменьшить ту ошибку измерения, которая больше, т. е. ошибку измерения величины x. Если мы оставим точность измерения x неизменной, то как бы мы ни повышали точность измерения слагаемого y, нам не удастся уменьшить ошибку конечного результата измерений величины z более чем на 10%.

Этот вывод всегда нужно иметь в виду, и при повышении точности измерений в первую очередь уменьшать ошибку, имеющую наибольшую величину. Конечно, если слагаемых много, а не два, как в нашем примере, то и малые ошибки могут внести заметный вклад в суммарную ошибку.

Следующий вывод, вытекающий из закона сложения ошибок, относится к определению погрешности среднего арифметического. Мы уже говорили, что среднее арифметическое из ряда измерений отягчено меньшей ошибкой, чем результат каждого отдельного измерения. Сейчас этот вывод может быть записан в количественной форме. Пусть x1,x2,x3,…,xn - результаты отдельных измерений, причем каждое из них характеризуется одной и той же дисперсией S2. Образуем величину y равную

(10)

Дисперсии этой величины в соответствии с (8) определяются как

(11)

Но у по определению -- это среднее арифметическое из всех величин хi, и мы можем написать

(12)

Средняя квадратичная погрешность среднего арифметического равна средней квадратичной погрешности отдельного результата, деленной на корень квадратный из числа измерений.

Это фундаментальный закон возрастания точности при росте числа наблюдении. Из него следует, что, желая повысить точность измерений в 2 раза, мы должны сделать вместо одного четыре измерения, чтобы повысить точность в 3 раза, нужно увеличить число измерений в 9 раз, и, наконец, увеличение числа наблюдений в 100 раз приведет к десятикратному увеличению точности измерений. Разумеется, это рассуждение относится лишь к измерениям, при которых точность результата полностью определяется случайной ошибкой. В этих условиях, выбрав n достаточно большим, мы можем существенно уменьшить ошибку результата. Такой метод повышения точности сейчас широко используется, в особенности при измерении слабых электрических сигналов.

Ошибки косвенных измерений

В большинстве случаев измеряется не непосредственно интересующая нас величина, а другая, зависящая от нее тем или иным образом. Например, для измерения площади прямоугольника мы измеряем длину двух его сторон а и b, а площадь вычисляем, пользуясь соотношением Sb.

При измерении температуры с помощью ртутного термометра мы измеряем удлинение столбика ртути, которое связанно с изменением температуры и законом объемного расширения тел соотношением

(13)

Здесь t1 и t2 - начальная и конечная температура; u0 - объем шарика ртути; г2 - объемный коэффициент теплового расширении ртути; г1 - коэффициент теплового расширенна стекла; h1 и h2 - начальная и конечная высота столбика ртути; r -- диаметр капилляра термометра.

При таких измерениях, которые называются косвенным (в отличие от прямых, при которых нужная величина измеряется непосредственно), необходимо также уметь вычислять ошибку измерений.

Здесь могут быть два основных случая:

1) интересующая нас величина зависит от одной измеряемой величины;

2) интересующая нас величина зависит от нескольких измеряемых величин.

Общие правила вычисления ошибок для обоих случаев могут быть выведены только с помощью дифференциального исчисления.

Если у = f(x), то в тех случаях, когда ошибки малы по сравнению с измеряемой величиной, мы можем с достаточной точностью написать

(14)

Если мы хотим найти величину относительной ошибки, то из (14) легко получаем

(15)

Этот способ вычисления относится и к случайным и к систематическим ошибкам.

Пользуясь обозначениями дифференциального исчисления, можно ошибку функции y от переменных x1,x2,…,xn представить и виде

= (16)

Формула (16) сохраняет свой вид, если вместо ошибки у, мы возьмем среднеквадратичные ошибки. В общем виде:

(17)

Может возникнуть вопрос, как правильнее вычислять среднеарифметическое значение и погрешность результата в случае косвенных измерений? Если у = f(х) и измерения дают нам ряд значений хi, то можно поступить двояким образом:

1) вычислить и, подставив это значение в уравнение y=f(х), получить .

2) для каждого из значений хi вычислить yi=f(xi), а затем определить у по соотношению .

Соответственно двумя способами можно определять и ошибку величины у, либо, определив, ошибку величины воспользоваться соотношением

либо, вычислив ряд значений yi определить ошибку величины y обычным путем, например

.

Можно показать, что если ошибки измерений малы по сравнению с измеряемой величиной (именно это предположение положено в основу всех наших формул), то оба способа дают практически тождественные результаты, и поэтому безразлично, какими из них пользоваться. Здесь следует руководствоваться практическими удобствами расчета.

Распределение Фишера

Отношение двух выборочных дисперсий F=, принадлежащих различным совокупностям, подчиняется распределению Фишера или F-распределению. Функция ц(F) плотности вероятностей определяется сложным выражением, зависящим от значений F и числа степеней свободы f1 и f2, по которым подсчитывали выборочные дисперсии. Величина F изменяется в пределах 0 ? F ? ?. Кривая плотности вероятностей асимметрична, поэтому F(, но асимметрия уменьшается с увеличением значений f1 и f2.

В табл. 2 Приложения даны значения F() для различных уровней значимости =1-Р. Таблица составлена так, что в верхнем горизонтальном ряду отложены значения f1 для большей выборочной дисперсии, стоящей в числителе отношения, а в левой вертикальной колонке - значения f2 для меньшей выборочной дисперсии, стоящей в знаменателе отношения.

4. Статистические гипотезы. Уровень значимости

Доверительная вероятность

Экспериментатор при обработке результатов измерений выдвигает ту или иную гипотезу. Например, сравниваются два средних результата x1 и x2, которые характеризуют математические ожидания м1 и м2. Всякий раз, когда исследователь сталкивается с подобной ситуацией, он выдвигает нуль-гипотезу, т. е. гипотезу о том, что различие между х1 и х2 незначимо (µ1=µ2). Таких гипотез можно выдвинуть много. Решение их (принятие или опровержение) осуществляется с использованием тех или иных критериев. Вместе с тем, мы имеем случайные величины, которые, вообще говоря, могут принимать значения от -? до +?, поэтому при принятии гипотез полагаем, что с практической точки зрения появлением событий малой вероятности можно пренебречь. Если графически представить кривую плотности вероятностей (рис. 1), то вероятностью а появления события, когда случайная величина x примет значение х1< и х1>хь пренебрегаем. Вероятность б, которую принимаем за основу в статистической оценке гипотезы, называется уровнем значимости. Отрезки по оси абсцисс функции ц(х), определяющие вероятность б (заштрихованные участки рис. 1), называются критической областью функции распределения. Вероятность Р=1- определяет событие, когда случайная величина x примет значение i<хь, называется доверительной вероятностью, коэффициентом доверия или статистической надежностью.

Односторонние и двусторонние статистические критерии

Для принятия или опровержения нуль-гипотезы используются статистические критерии. В зависимости от ее характера применяют односторонние или двусторонние статистические критерии. Использование различных типов статистических критериев зависит от вида критической области закона распределения случайной величины. Если критическая область, в которую можно ожидать попадания случайной величины, целиком расположена в одной части графика функции плотности вероятностей распределения, то для оценки гипотезы используется односторонний статистический критерий. Аналогичное имеет место, если случайная величина может попасть в другую критическую область, но это не интересует исследователя.

Например, сравниваются две дисперсии и , одна из которых характеризует разброс результатов измерений, полученных с помощью старой изношенной аппаратуры, а другая разброс результатов, полученных с помощью нового совершенного прибора. Следовательно, не может быть меньше , поэтому выдвигаем нуль-гипотезу = и ее альтернативу >. В этом случае следует пользоваться односторонним статистическим критерием.

Таким образом, односторонний критерий используется тогда, когда у исследователя имеются веские основания для утверждения того, что независимо от конкретного значения случайной величины х попадание ее в противоположную область функции ц(х) либо невозможно, либо не имеет практического значения. Если у экспериментатора заранее нет основания для подобного утверждения, то критическую область следует рассматривать состоящей из двух частей и нужно пользоваться двусторонним критерием.

Выбор уровня значимости

Уровень значимости по определению совпадает с вероятностью отвергнуть проверяемую гипотезу, когда она в действительности верна, т. е. случайная величина может попасть в критическую область функции распределения, а мы принимаем, что не может. Если возьмем = 0,05, то в среднем в 5 случаях из 100 в действительности верную гипотезу примем за ложную (ошибки 1-го рода). Если =0,01, то в среднем из 100 случаев только в одном верную гипотезу примем за ложную.

На первый взгляд кажется, что следует брать уровень значимости как можно меньшим, но использование малых значений приведет к тому, что ложные гипотезы будем принимать за истинные (ошибки 2-го рода). При выборе гипотезы следует учитывать те потери, штрафы, которые несет исследователь за ошибки 1-го или 2-го рода. В условиях проведения рядовых (рутинных) измерений проверку гипотез осуществляют, используя следующие значения б:

принимают нуль-гипотезу, используя =0,05 или более высокое его значение;

отвергают нуль-гипотезу, используя =0,01 или более низкое его значение;

если проверяемая гипотеза может быть принята с уровнем значимости , меньшим 0,05, но большим 0,01, то следует взять гипотезу под сомнение.

В последнем случае целесообразно провести повторный эксперимент для получения дополнительных данных и вновь проверить гипотезу. Если такая возможность отсутствует, то на усмотрение исследователя гипотезу можно принять или опровергнуть. Здесь можно руководствоваться правилом: принимаем нуль-гипотезу, если разность между рассчитанным значением критерия и табличным для =0,05 меньше, чем для табличного при =0,01; в противном случае - опровергаем.

Значащие цифры при проведении расчетов и представлении результатов

Под значащими цифрами числа понимают последовательность цифр без учета места запятой, а для чисел меньших единицы - без учета нуля перед запятой и всех последующих за ним нулей. Например, установленное содержание золота в сплаве 92,8±0.3%. Результат записан с тремя значащими цифрами, а погрешность - с одной. Если результат представлен в виде 92,85±0,03%, то говорим: результат записан с 4 значащими цифрами, погрешность - с одной.

Рассмотрим еще один пример: 0,002307; 0,02307; 0,2307; 2,307; 23,07; 2307; 23 070 и 23 700. Первые 6 чисел записаны с четырьмя значащими цифрами, т. е. нули, стоящие перед запятой и после нее, являются незначащими; нули, стоящие между ненулевыми цифрами, являются значащими. Нули, стоящие в конце записи числа, могут быть как значащими, так и незначащими, т. е. сказать, сколько значащих в последних двух числах, невозможно - это определяется погрешностью измерения. Лучший способ избежать двусмысленности - использовать степенную форму записи. При этом руководствоваться следующими правилами:

заключительные нули значимы, только если они находятся после десятичной запятой;

везде, где это возможно, следует представлять результат в виде величины, содержащей необходимое число значащих цифр, умноженной на степень десяти.

В этом случае, если 7-е и 8-е число записать в виде 2,307104 и 2,307105, то они будут содержать по четыре значащих цифры; если в виде 2,3070104 и 2,30700105, то значащих цифр в 7-м числе - 5, а в 8-м - 6.

Для величин, полученных в результате расчетов, существует несколько практических правил определения числа значащих цифр.

1. При сложении и вычитании чисел, имеющих разное число значащих цифр, результат имеет не больше значащих цифр после десятичной запятой, чем наименьшее число таких цифр среди всех исходных значений.

Погрешность результатов эксперимента рекомендуется записывать с одной значащей цифрой, редко с двумя, но не более. Две цифры записывают в том случае, если первая из них 1 или 2. Например, при расчете получили значение, равное 0,14. Округление до одной значащей цифры (=0,1) снижает погрешность измерений на 40 %, поэтому правильнее будет сохранить две значащие цифры. Этот же аргумент, вероятно, можно распространить и на погрешность, у которой первая значащая цифра 2, но уже определенно нецелесообразно, если первая значащая цифра 3 и более.

После расчета погрешности результата измерения необходимо определить, какие цифры в установленном результате являются значащими. В этом случае рекомендуется пользоваться таким правилом: последняя значащая цифра в результате должна быть того же порядка, что и погрешность. Например, результаты измерения 8,64 или 1,12, установленные с погрешностью 0,3 и 0,16 соответственно, должны быть записаны: 8,6±0,3 и 1,12±0,16. Если результат измерения 236,72 установлен с погрешностью 30, то его следует записать: 240±30.

Следует помнить, что все промежуточные результаты расчетов должны содержать на одну значащую цифру больше, чем это оправдано погрешностью конечного результата измерения. Такой подход снизит влияние округления на конечный результат измерения. В конце расчета окончательный ответ следует округлить так, чтобы избавиться от этой добавочной цифры.

Возникает вопрос: как представить конечный результат измерения? Погрешность любой измеряемой величины имеет ту же размерность, что и сама измеряемая величина, поэтому целесообразно единицы измерения указывать не после результата, а после погрешности измерения, как это указано выше.

Если измеряемое число настолько велико или мало, что оно имеет несколько нулей, то его лучше писать в таком виде: (3,62+0,05)10-5. Такую запись проще прочесть и понять, чем записи 3,6210-5±510-7 или 0,0000362±0,0000005.

Теперь рассмотрим правило округления цифр. Если нужно числа 12,83; 0,36; 237,45; 0,55 округлить до десятых долей, то выполнение этой операции для первых двух чисел не вызывает затруднений: 12,8 и 0,4. Два последующие можно округлить до 237,4 или 237,5 и до 0,5 или 0,6. В таких случаях целесообразно пользоваться одним из двух правил:

округлять до ближайшего четного числа, рассматривая нуль как четное число: в нашем случае получим 237,4 и 0,6;

округлять всегда в сторону большего значения, предполагая, что чаще всего после последней цифры числа стоят какие-то другие цифры, которые делают число, начинающееся с цифры 5, больше половины числа 10: для нашего примера получим 237,5 и 0,6.

Методы исключения выбросов (грубых ошибок)

При проведении любого эксперимента нередко встречаются измерения, резко отличающиеся от остальных. Естественно, что в таких случаях возникают подозрения о грубых ошибках, допущенных исследователем при получении этого результата. Единственным надежным методом выявления выбросов является детальный анализ условий эксперимента. Если установили, что были нарушены стандартные условия измерения, то сомнительный результат следует отбросить независимо от его величины.

Если в процессе проведения эксперимента замечен резкий выброс результата измерения без видимых на это причин, то этот сомнительный результат допустимо исключить, но заменить тремя новыми, подряд проведенными измерениями.

Практически далеко не всегда удается воспользоваться приведенными выше рекомендациями для исключения выбросов, поэтому для их обнаружения приходится обращаться к статистическим критериям, которые являются, конечно, условными, т. к. базируются на нормальном законе распределения случайных величин, допускающем изменение значений х от -? до +?.

Метод исключения выбросов при неизвестном у

Пусть имеется п измерений х1, х2, х3,...,xi,,...,хn и среди них значение хi вызывает сомнение, т. к. оно существенно отличается от остальных значений. Выдвигается нуль-гипотеза, которая заключается в том, что сомнительное значение хi принадлежит данной совокупности, т. е. не является выбросом. Для принятия или отклонения ее можно воспользоваться r-критерием, значение которого рассчитывается по формуле:

(18)

где и S - соответственно среднее значение и стандартное отклонение, подсчитанное по всем п измерениям, включая и сомнительный результат.

Полученное значение ri подчиняется r - распределению с числом степеней свободы ѓ=п-2; его сопоставляют с табличным значением rтах(тin) (табл. 3a Приложения). Если рассчитанное значение ri <rтах(тin)(0,05, ѓ=п-2), то принимают нуль-гипотезу: результата хi принадлежит данной совокупности. При ri>rтах(тin)(0,01, ѓ=п-2) нуль-гипотезу отвергают, т. е. считают сомнительный результат выбросом и исключают его из совокупности измерений.

С помощью r-критерия можно оценивать однородность результатов измерений, т.е. их принадлежность к одной генеральной совокупности. Для этого по формуле (18) рассчитывают два значения ri соответственно для максимального и минимального измерений данной выборки. Полученные значения ri сравнивают с табличным значением r -критерия (табл.3 Приложения).

Если для обоих результатов r1<r(0,05, ѓ=п-2), то выборка однородна. Если r1>r(0,01, ѓ=п-2), то этот результат не принадлежит данной совокупности, но это еще не дает право классифицировать его как выброс. Чтобы считать его выбросом, нужно рассчитанное значение ri сравнить с табличным критерием rтах(тin) (табл. 3a приложения), который является более «жестким» по сравнению c r -критерием (табл.3 Приложения).

Задача 3. Для значений коэффициента жесткости пружины задачи 1 определить является ли предпоследний результат выбросом.

Решение. По всем результатам определим среднее арифметическое и стандартное отклонение (см. задачи 1 и 2) S=0,41. Рассчитаем значение

.

И сравнивая его с табличным принять нуль-гипотезу нельзя, но нет веских оснований для ее отбрасывания. Для этого сопоставляем с табличным значением для уровня значимости =0,01: <. Получить дополнительный экспериментальный материал не представляется возможным, поэтому делаем вывод, опираясь на имеющиеся данные. Для этого оцениваем различие между и двумя табличными значениями:

,

Расчетное значение =1,882 ближе по величине к табличному значению =1,869 поэтому нуль-гипотезу принимают, т.е. результат xi =12,26 не содержит грубой ошибки.

Можно дать следующие рекомендации для выявления выбросов.

1. Если среди п измерений имеются два результата, из которых один вызывает сомнение в силу того, что он значительно больше остальных, а другой - из-за того, что он значительно меньше, то следует по всем п результатам рассчитать х и S и сначала проверить гипотезу о том, можно ли отбросить как грубое то измерение, которое больше отличается от среднего. Если окажется, что это измерение не является выбросом, то принимают нуль-гипотезу: оба сомнительных результата принадлежат одной совокупности. Если окажется, что максимально отклоняющееся измерение является выбросом (r1 >rтах (тin) (а,ѓ)), то его отбрасывают, по оставшимся (n-1) результатам подсчитывают и S и проверяют гипотезу о наличии грубой ошибки во втором сомнительном результате.

2. Если среди измерений имеются два результата, которые вызывают сомнение, потому что они значительно меньше (или больше) остальных, то сначала произвольно отбрасывают худший из сомнительных результатов. По оставшимся (п-1) измерениям подсчитывают и S и проверяют гипотезу о наличии грубой погрешности в лучшем из сомнительных результатов. Если окажется, что это измерение можно классифицировать как выброс, то, естественно, нужно отбросить оба сомнительных измерения. Если окажется, что второе измерение не содержит грубой ошибки, то проверяют гипотезу о наличии промаха в худшем из сомнительных результатов. При этом и S рассчитывают по всей серии из п измерений.

Сравнение двух дисперсий

В любой экспериментальной работе, нередко требуется сравнить точность результатов измерений. В частности, нужно сравнить воспроизводимость двух методик определение физической величины. Решение подобных задач сводится к сравнению дисперсий.

Имеем две серии измерений (две выборки): х1, х2,..., хi,…, хn1 и y1, y2,…, yi,…, yn2. По результатам измерений рассчитаны выборочные дисперсии при числе степеней свободы ѓ1=п1 -1 и при числе степеней свободы ѓ2=п2--1. Значение больше значения . Величина служит оценкой генеральной дисперсии, а - генеральной дисперсии . Нужно сравнить генеральные дисперсии по известным выборочным. Несмотря на то, что > выдвигается нуль-гипотеза, которая состоит в том, что генеральные дисперсии равны:==у2. Выборочные дисперсии и , характеризующие одну и ту же генеральную дисперсию у2, называются однородными. Следовательно, нужно проверить однородность выборочных дисперсий и .

Принятие или опровержение выдвинутой нуль-гипотезы проводят с помощью F-критерия. Для этого находят отношение F=/ при соблюдении условия, что в числитель обязательно ставится большая по величине выборочная дисперсия. При проверке гипотезы о равенстве=следует различать два случая.

1-й случай. Заранее известно, что не может быть меньше , поэтому проверяют справедливость одного из двух положений: или .В этих условиях рассчитанное значение F сравнивают с табличным с использованием одностороннего F-критерия (табл. 2 Приложения). Обычно таблицы для критерия F составлены для односторонней функции ц(F), поэтому для принятия нуль-гипотезы находят табличное значение при уровне значимости =0,05 и числе степеней свободы для большей дисперсии f1, которое откладывается по горизонтали, и меньшей дисперсии, которое откладывается по вертикали. Если справедливо неравенство F<F(0,05,f1,f2), принимают нуль-гипотезу: выборочные дисперсии и однородны, т. е. они характеризуют одну генеральную дисперсию. Это позволяет усреднить выборочные дисперсии. При усреднении больший статистический вес придается той дисперсии, которая определена более надежно, т. е. рассчитана по большему числу измерений, поэтому усредненная дисперсия рассчитывается по формуле

(19)

Дисперсия S2 характеризуется числом степеней свободы f=f1+f2.

Если F>F(0,05,f1,f2), то принять нуль-гипотезу нельзя, но и недостаточно оснований для ее отбрасывания. Чтобы принять решение, необходимо значение F сравнить с табличным F(0,01,ѓ1, ѓ2). Если F > F (0,01, ѓ1, ѓ2), нуль-гипотезу отбрасывают: дисперсии и неоднородны.

2-й случай. Сравнивают дисперсии и , когда из условий постановки эксперимента нельзя сказать, какая генеральная дисперсия больше, т. е. справедливым может быть любое из трех положений: или или . В этом случае для проверки нуль-гипотезы следует пользоваться двусторонним критерием F: критическая область в функции плотности вероятностей ц(F) состоит из двух частей, т. е. б = 2б1 где б1 и б - уровень значимости соответственно для одностороннего и двустороннего F-критерия. Чтобы найти значение двустороннего F-критерия для уровня значимости б=0,05 по таблицам, составленным для одностороннего F-критерия, следует использовать б1= 0,025. Если нужно найти значение двустороннего F-критерия для б = 0,01, то в таблицах одностороннего критерия следует пользоваться б1 = 0,005, В остальном нуль-гипотезу проверяют по тем же правилам, что и в первом случае.

Задача 4. Определяли жесткость пружины двумя различными методами и получили следующие значения, (Н\м):

Статический метод (=5) 11,21; 11,47; 11,59; 12,26; 11,32.

Динамический метод (=3) 12,79; 13,66; 12,65. Можно ли считать равными оценки случайных погрешностей результатов эксперимента?

Решение. В этом случае для принятия решения следует использовать двухсторонний F-критерий, т.к. заранее не известно, каково должно быть соотношение между генеральными дисперсиями. При расчете выборочных дисперсий получили значения =0,17 ( и Их отношение F=/=1,76<F(0,025;2;4)=10,65 существенно меньше табличного значения F(0,025;2;4) для уровня значимости =0,025 и числа степеней свободы для выборки с большей дисперсией и для выборки с меньшей дисперсией. Следовательно, результаты можно считать равноточными.

Оценка доверительного интервал среднего результата

Измерив несколько раз какую-либо величину и получив средний результат , нужно рассчитать доверительный интервал для этого результата. Доверительный интервал () указывает, в каких пределах при выбранной доверительной вероятности Р должно лежат истинное значение результата измерения:

? µ ? + ?.

Величина доверительного интервала среднего результата рассчитывается с использованием t-критерия, функция плотности вероятностей которого симметрична, поэтому левая 1 и правая 2 доверительные границы результата измерения равны:

, (20)

где S - стандартное отклонение, характеризующее воспроизводимость результатов измерения; n - число результатов, по которым рассчитывали; t(б,ѓ) - табличное значение t-критерия для уровня значимости б =1 и числа степеней свободы ѓ, по которым рассчитывали величину S (табл. 1 Приложения).

При расчете доверительного интервала среднего результата обычно используют уровень значимости б, равный 0,05 (т. е. доверительную вероятность Р = 0,95). При нахождении значения t(б,ѓ) следует учитывать, что таблицы критерия Стьюдента составлены обычно для двусторонней критической области. Если доверительный интервал используют как меру отклонения среднего результата от действительного значения, то, естественно, интересны левая и правая доверительные границы, поэтому табличное значение t(б,ѓ) находят для б = 0,05. Если исследователя интересует только одна доверительная граница, например, правая, то для расчета используют значение б, соответствующее односторонней границе, которое в два раза меньше двусторонней. В этой ситуации при определении одностороннего критерия t для уровня значимости б = 0,05, если пользуются таблицами двустороннего t-критерия, значение t(б,ѓ) находят для уровня значимости б = 0,1 (табл. 1 Приложения).

Задача 5. Для данных задачи 1 вычислить доверительный интервал среднего значения при б = 0,05.

Решение. Находим среднее значение и стандартное отклонение (см. задачи 1 и 2)

S=0,41 H/м.

Считаем доверительный интервал

Тогда 11,06 Н/мН/м.

Сравнение двух средних результатов

В экспериментальной работе часто возникает ситуация, когда требуется сравнить между собой два результата измерения.

Пусть в разных условиях получены две выборки: х1, х2, x3,..., xn1 (проведено n1 измерений), y1, y2, y3...,уn2 (проведено измерений), и требуется сравнить их средние результаты . Для каждой выборки рассчитывают дисперсии и . Значения можно сравнить с помощью t-критерия, если у исследователя есть основания полагать, что имеем дело с нормально распределенными наблюдениями.

...

Подобные документы

  • Проведение проверки гипотезы о нормальности закона распределения вероятности результатов измерения случайной величины по критерию согласия Пирсона. Определение ошибок в массивах данных: расчет периферийных значений, проверка серии на равнорассеянность.

    контрольная работа [1,8 M], добавлен 28.11.2011

  • Оценки параметров распределения, наиболее важные распределения, применяемые в математической статистике: нормальное распределение, распределения Пирсона, Стьюдента, Фишера. Факторное пространство, формулирование цели эксперимента и выбор откликов.

    реферат [105,5 K], добавлен 01.01.2011

  • Непрерывная случайная величина и функция распределения. Математическое ожидание непрерывной случайной величины. Среднее квадратичное отклонение. Кривая распределения для непрерывной случайной величины. Понятие однофакторного дисперсионного анализа.

    контрольная работа [165,5 K], добавлен 03.01.2012

  • Задачи математической статистики. Распределение случайной величины на основе опытных данных. Эмпирическая функция распределения. Статистические оценки параметров распределения. Нормальный закон распределения случайной величины, проверка гипотезы.

    курсовая работа [57,0 K], добавлен 13.10.2009

  • Обработка данных измерений величин и представление результатов с нужной степенью вероятности. Определение среднего арифметического и вычисление среднего значения измеренных величин. Выявление грубых ошибок. Коэффициенты корреляции. Косвенные измерения.

    реферат [116,2 K], добавлен 16.02.2016

  • Анализ и обработка статистического материала выборок Х1, Х2, Х3. Вычисление статистической дисперсии и стандарта случайной величины. Определение линейной корреляционной зависимости нормального распределения двух случайных величин, матрицы вероятностей.

    контрольная работа [232,5 K], добавлен 25.10.2009

  • Математическое ожидание случайной величины. Свойства математического ожидания, дисперсия случайной величины, их суммы. Функция от случайных величин, ее математическое ожидание. Коэффициент корреляции, виды сходимости последовательности случайных величин.

    лекция [285,3 K], добавлен 17.12.2010

  • Измерения физических величин, их классификация и оценка истинного значения; обработка результатов. Понятие доверительного интервала: распределение Гаусса и Стьюдента. Понятие случайной величины и вероятностного распределения; методы расчета погрешностей.

    методичка [459,2 K], добавлен 18.12.2014

  • Понятие, виды и методы планирования экспериментальных исследований. Предварительная обработка экспериментальных данных, компьютерные методы статистической обработки и анализ результатов пассивного эксперимента, оценка погрешностей результатов наблюдений.

    книга [3,1 M], добавлен 13.04.2009

  • Описание случайных ошибок методами теории вероятностей. Непрерывные случайные величины. Числовые характеристики случайных величин. Нормальный закон распределения. Понятие функции случайной величины. Центральная предельная теорема. Закон больших чисел.

    реферат [146,5 K], добавлен 19.08.2015

  • Методы планирования многофакторных экспериментов и преимущества их использования. Математическое планирование эксперимента и его основные направления. Пример применения метода дробного факторного эксперимента. Расчет коэффициентов уравнения регрессии.

    курсовая работа [26,7 K], добавлен 13.05.2014

  • Случайная выборка объема как совокупность независимых случайных величин. Математическая модель в одинаковых условиях независимых измерений. Определение длины интервала по формуле Стерджесса. Плотность относительных частот, критерий согласия Пирсона.

    контрольная работа [90,4 K], добавлен 17.10.2009

  • Рассмотрение в теории вероятностей связи между средним арифметическим и математическим ожиданием. Основные формулы математического ожидания дискретного распределения, целочисленной величины, абсолютно непрерывного распределения и случайного вектора.

    презентация [55,9 K], добавлен 01.11.2013

  • Критерий Пирсона, формулировка альтернативной гипотезы о распределении случайной величины. Нахождение теоретических частот и критического значения. Отбрасывание аномальных результатов измерений при помощи распределения. Односторонний критерий Фишера.

    лекция [290,6 K], добавлен 30.07.2013

  • Понятие непрерывной случайной величины, её значения на числовых промежутках. Определение закона распределения, его функции. Плотность распределения числовых характеристик вероятности. Математическое ожидание, дисперсия и среднеквадратичное отклонение.

    лекция [575,9 K], добавлен 17.08.2015

  • Сущность метрологии как науки об измерениях, предмет и методы ее изучения. Разновидности измерений, их отличительные признаки и особенности реализации. Обработка результатов прямых, косвенных и совместных измерений. Погрешности и пути их минимизации.

    курсовая работа [319,2 K], добавлен 12.04.2010

  • Понятие корреляционного момента двух случайных величин. Математическое ожидание произведения независимых случайных величин Х и У. Степень тесноты линейной зависимости между ними. Абсолютное значение коэффициента корреляции, его расчет и показатель.

    презентация [92,4 K], добавлен 01.11.2013

  • Освоение основных приемов статистической обработки результатов многократных измерений. Протокол результатов измерений. Проверка гипотезы о виде распределения методом линеаризации. Особенности объединения результатов разных серий измерений в общий массив.

    методичка [179,5 K], добавлен 17.05.2012

  • Числовые характеристики случайной функции: математическое ожидание, дисперсия, квадрат разности, корреляционная функция. Расчет среднего выборочного и несмещенной выборочной дисперсии, проверка гипотезы о нормальном распределении по критерию согласия.

    контрольная работа [666,1 K], добавлен 02.06.2010

  • Задача на определение вероятности попадания при одном выстреле первым орудием, при условии, что для второго орудия эта вероятность равна 0,75. Интегральная формула Лапласа. Решение задачи на определение математического ожидания случайной величины.

    контрольная работа [34,2 K], добавлен 12.01.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.