Показатели вариации
Источники вариации, непрерывное, дискретное и атрибутивное варьирование. Характеристики вариационных рядов, их вычисление через моменты. Понятие асимметрии и эксцесса. Коэффициент вариации, среднее линейное и квадратичное отклонение, способы вычисления.
Рубрика | Математика |
Вид | реферат |
Язык | русский |
Дата добавления | 29.03.2018 |
Размер файла | 153,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Показатели вариации
План
1. Вариация как явление и ее источники
2. Типы варьирования
3. Характеристики вариационных рядов и их вычисление
4. Асимметрия, эксцесс, коэффициент вариации
1. Вариация как явление и ее источники
Ряд распределения характеризуется несколькими параметрами. Одним из них являются рассмотренные выше средние значения. Они характеризуют то значение вариационного ряда, относительно которого в определенном смысле располагаются все другие численные значения, присущие данному ряду распределения случайной величины.
В то же время существуют другие важные характеристики рядов случайных величин. В их числе одной из основных является размах (диапазон) случайных величин от минимальной до максимальной. Эта величина характеризует вариабельность, или изменчивость, ряда распределения. Приведем пример (таблица 1).
Таблица 1 - Ряды распределения числа деревьев ели по диаметру на высоте 1,3 м и их средние значения
№ классов |
Средние значения классов (ступени толщины), см (xi) |
Число деревьев (численность) и их средние арифметические значения по вариантам опыта |
||||||
Ряд 1 |
Ряд 2 |
Ряд 3 |
||||||
ni |
xi ni |
ni |
xi ni |
ni |
xi ni |
|||
1 |
8 |
2 |
16 |
- |
- |
- |
- |
|
2 |
12 |
3 |
36 |
- |
- |
- |
- |
|
3 |
16 |
13 |
208 |
10 |
160 |
- |
- |
|
4 |
20 |
13 |
260 |
20 |
400 |
7 |
140 |
|
5 |
24 |
23 |
552 |
21 |
504 |
25 |
600 |
|
6 |
28 |
32 |
896 |
25 |
700 |
33 |
924 |
|
7 |
32 |
40 |
1280 |
35 |
1128 |
65 |
2080 |
|
8 |
36 |
24 |
864 |
38 |
1368 |
42 |
1512 |
|
9 |
40 |
19 |
760 |
30 |
1200 |
22 |
880 |
|
10 |
44 |
12 |
528 |
16 |
704 |
6 |
264 |
|
11 |
48 |
7 |
336 |
4 |
192 |
- |
- |
|
12 |
52 |
5 |
260 |
1 |
52 |
- |
- |
|
13 |
56 |
4 |
224 |
- |
- |
- |
- |
|
14 |
60 |
3 |
180 |
- |
- |
- |
- |
|
Итого, ? ni |
- |
200 |
6400 |
200 |
6400 |
200 |
6400 |
|
Среднее значение, |
- |
32,0 |
- |
32,0 |
- |
32,0 |
В таблице 1 приведены 3 ряда распределения числа стволов ели по диаметру. Их количество одинаково - по 200 деревьев. Средние арифметические всех рядов тоже равны - по 32 см. Но ряды существенно отличаются. Средние показатели это выявить не могут. Так, среднеквадратическое значение этих рядов равно соответственно 37,5 см; 37,3 см; 36,6 см, т.е. практически одинаковы, т.к. разница в 0,4 см в древостоях с диаметрами такого размера при проведении замеров с помощью мерной вилки в производственных условиях лежит в пределах точности измерений.
В то же время даже наглядно видно, что ряды существенно отличаются между собой. Первый ряд имеет наибольший размах распределения, а третий - наименьший. В первом ряду крайние варианты отклоняются от средней на 6 классов в нижнюю сторону и на 8 в верхнюю, а всего ряд имеет 15 классов, или ступеней, толщины. В третьем случае соответствующие величины равны 3 и 3, а размах ряда соответствует 7 классам. Второй ряд распределения занимает промежуточное положение между 1 и 3 рядами.
Чтобы дать более полную характеристику рядов распределения случайной величины, введена характеристика их вариации, или изменчивости, которая характеризует степень рассеяния случайной величины относительно среднего значения. Для выражения вариации используют специальные величины: коэффициент вариации, среднее квадратическое отклонение, дисперсию и другие, которые рассматриваются ниже.
Возникает естественный вопрос - каковы же причины вариации. Основная причина состоит в том, что по своей природе любые биологические объекты, даже принадлежащие к однородной совокупности, отличаются друг от друга. Деревья одного вида, одного возраста, растущие в одинаковых условиях роста имеют разную высоту и толщину, что вызвано как генетическими свойствами каждой особи, так и некоторыми особенностями их территориального размещения: в тени более крупных деревьев, на микроповышении или микропонижении и т.п. Подобные примеры можно привести для любых биологических объектов: люди даже одной расы и национальности отличаются по росту, животные одного вида имеют разный вес и т.д. Основная причина этому, как уже было отмечено, - наличие биологического (в первую очередь генетического) разнообразия.
Изменчивость происходит и из-за ошибок измерений. Добиться абсолютной точности измерений очень трудно (и дорого), а часто и не нужно. Практику устраивает некоторый уровень точности, его-то и выдерживают. Например, при перечетах деревьев их измеряют по ступеням толщины. Точность измерений может повышаться, если это потребуется в отдельных случаях. Так, в условиях рынка повышаются требования к точности оценки объема древесины, особенно для ее наиболее ценной части. При проведении измерений помимо допустимых придержек в измерениях возможны и ошибки, особенно при массовых замерах. Хотя ошибки измерений и являются одной из причин варьирования, но эта причина не столь значима как естественная биологическая изменчивость.
2. Типы варьирования
Получаемые в результате наблюдений значения наблюдаемого признака называют вариантами. Варианты в биологических объектах обнаруживают разнообразие (или варьирование) изучаемого свойства. Например, деревья отличаются друг от друга по диаметру, высоте, объему, санитарному состоянию. Причины этого показаны выше.
В зависимости от характера изучаемого признака различают варьирование непрерывное, прерывистое (дискретное) и атрибутивное. Непрерывное и дискретное варьирование присуще количественным признакам, а атрибутивное - качественным.
При непрерывном варьировании отдельные значения признака выражают мерой протяженности, объема и т.д. Отдельные варранты могут иметь любое, но изменяющееся в определенных пределах значения меры. Толщина деревьев в древостое, например, от самого тонкого до самого толстого может принимать самые различные значения меры протяженности. Только в зависимости от цели исследования (измерения) выражают ее в классах толщины: в несколько сантиметров, в целых сантиметрах, в десятых или сотых долях сантиметра.
При дискретном варьировании отдельные значения признака выражают отвлеченными числами, чаще всего целыми. Например, число всходов сосны на учетной площадке обладает дискретным варьированием, т.к. они, равно как и число семян в навеске, выражаются целыми числами.
При атрибутивном варьировании значения признака выражают в качественных показателях. Это может быть степень окраски, консистенции, поврежденность или устойчивость, а также форма, вид и т.д. Количественно эти признаки выражают в абсолютных числах, долях единицы, процентах, баллах и т.д. Например, различают цвет коры на деревьях, форму кроны деревьев (шаровидная, пирамидальная и т.д.), густота раствора, степень повреждения деревьев вредителями: сильная, слабая и др.
Частным случаем атрибутивного варьирования является альтернативное, при котором значения признака рассматривают в альтернативной форме, т.е. противопоставляя здоровые больным, сильные - слабым, окрашенные - неокрашенным, присутствующие - отсутствующим и т.д. В альтернативной форме можно представить и количественные признаки, противопоставляя, например, высокие деревья в древостое низким, господствующие деревья - угнетенным, здоровые - сухим или усыхающим.
вариация ряд линейный квадратичный
3. Характеристики вариационных рядов и их вычисление
Основными показателями вариационного ряда кроме среднего значения являются абсолютное и относительное значение его пределов, выражаемое величиной дисперсии и коэффициента вариации.
Одним из показателей амплитуды вариации служат так называемые лимиты (от лат. Limes - предел, граница), т.е. значения минимальной и максимальной вариант выборочной совокупности. Этот показатель (Lim) указывает фактические границы вариабельности признака. Поэтому его обычно приводят наряду с другими биометрическими показателями в сводных статистических таблицах. Значение лимитов заключается в их конкретности.
Величина вариации может быть оценена и по разности между максимальной и минимальной вариантами совокупности. Этот показатель получил название размаха вариации. Например, пределы первого распределения (n1), которое только что рассматривалось (таблица 5.1, вариант 1), равны: min=8 и max=60 единицам, откуда размах этого ряда равен 608=52. Второй ряд (n2) имеет пределы вариации от 16 до 52 единиц, его размах равен 5216=36 единиц. Наиболее низким этот показатель оказывается в третьем ряду (n3), размах которого равен 24 единицам: 4420=24.
Рассмотренные показатели вариации вполне объективны и просты. Но в силу присущих им недостатков они мало пригодны для измерения вариабельности признаков. Дело в том, что эти показатели неустойчивы: они зависят от многих случайных причин и при повторных выборках могут резко менять свое значение. Главный же недостаток указанных показателей заключается в том, что они не отражают существенные черты варьирования.
Из сказанного следует, что лимиты и пределы вариации, хотя и дают определенное, конкретное представление о величине изменчивости признаков, не могут служить основным мерилом вариабельности биологических величин. Поэтому здесь применяют другие показатели, описываемые ниже.
Среднее линейное отклонение
Для измерения вариации можно использовать центральный момент первого порядка как одну из характеристик вариационного ряда, представляющую сумму отклонений вариант от средней арифметической, отнесенную к общему числу вариант данной совокупности.
?= (1)
Этот показатель, называемый средним линейным отклонением, может иметь значение только при условии, что отклонения вариант от средней арифметической берутся без учета знаков, так как в противном случае ?(.
Используем этот показатель для характеристики взятого нами примера.
В таблице 2 показано вычисление ? для третьего ряда распределения (n3), имеющего наименьший размах. Полученное значение (?=1,36) необходимо сравнить с другим подобным показателем, иначе его трудно оценить. Вычислим ? для первого ряда (n1), имеющего наибольший размах вариации. Ход вычисления показан в таблице 5.3. Вспомним, что среднее значение для наших рядов равно 32 см.
Таблица 2 - Вычисление линейного отклонения для ряда распределения числа стволов по диаметру в сосновом древостое - третий вариант
Ступени толщины (варианты) (хi) |
Число деревьев (частоты), (ni) |
xini |
- |
ni(хi-) |
Вычисления |
|
20 |
7 |
140 |
12 |
84 |
||
24 |
25 |
600 |
8 |
200 |
||
28 |
33 |
924 |
4 |
132 |
||
32 |
65 |
2080 |
0 |
0 |
||
36 |
42 |
1512 |
4 |
168 |
||
40 |
22 |
980 |
8 |
176 |
||
44 |
6 |
264 |
12 |
72 |
||
Сумма |
200 |
6400 |
- |
822 |
Таблица 3 - Вычисление линейного отклонения для ряда распределения числа стволов по диаметру в сосновом древостое - первый вариант
Ступени толщины (варианты) (хi) |
Число деревьев (частоты), (ni) |
xini |
- |
ni(хi-) |
Вычисления |
|
8 |
2 |
16 |
24 |
48 |
||
12 |
3 |
36 |
20 |
60 |
||
16 |
13 |
208 |
16 |
208 |
||
20 |
13 |
260 |
12 |
156 |
||
24 |
23 |
552 |
8 |
184 |
||
28 |
32 |
896 |
4 |
128 |
||
32 |
40 |
1280 |
0 |
0 |
||
36 |
24 |
864 |
4 |
96 |
||
40 |
19 |
760 |
8 |
152 |
||
44 |
12 |
528 |
12 |
144 |
||
48 |
7 |
336 |
16 |
112 |
||
52 |
5 |
260 |
20 |
100 |
||
56 |
4 |
224 |
24 |
96 |
||
60 |
3 |
180 |
28 |
84 |
||
Сумма |
200 |
6400 |
- |
1252 |
Сравнивая первый результат (4,11) со вторым (6,26), видим, что ряд, у которого больше амплитуда изменчивости, имеет и больший показатель вариации, выражающийся величиной линейного отклонения. При меньшем размахе вариационного ряда и показатель вариации оказывается меньше. В то же время описанный показатель имеет существенные недостатки. Так, для ряда №3 от средней арифметической отклоняются три класса, а в первом ряду уже восемь. Следовательно, амплитуда изменчивости первого ряда в 2,66 раза больше, чем третьего. Если среднее отклонение для третьего ряда равно 4,11, то для первой совокупности оно должно быть в 2,66 раза больше, т.е. 4,11 • 2,66 = 10,9. На самом же деле этот показатель равен 6,26. Разница составляет 10,9 - 6,26 = 4,64, или 74,1 %, т.е. она довольно велика. Следовательно, среднее линейное отклонение не может быть достаточно точным показателем вариации, не говоря уже о том, что этот показатель теряет всякий смысл, если брать не модули отклонений, а учитывать знаки отклонений вариант от средней арифметической, так как сумма отклонений будет близка к нулю.
Среднее квадратическое отклонение
Чтобы преодолеть недостатки линейного отклонения, принято отклонения вариант от средней арифметической возводить в квадрат и сумму квадратов отклонений относить к общему числу наблюдений, т.е. к объему выборки. Полученный таким образом показатель служит центральным моментом второго порядка, он характеризует дисперсию или рассеяние вариант около средней арифметической. Этот показатель, называемый дисперсией, или вариансой, обозначается греческой буквой у2 (сигма малая в квадрате) В литературе Западной Европы и в ряде отечественных публикаций дисперсию принято обозначать латинской буквой s2, а буквой у обозначают среднее квадратическое отклонение теоретических распределений. В отдельных случаях в дальнейшем, когда мы заимствовали некоторые формулы у других авторов, сохранена и их символика, т.е. использована буква S2=у2. и выражается следующей формулой:
(2)
Для непрерывной случайной величины, заданной аналитически, дисперсию находят по формуле:
(3)
При возведении отклонений вариант от средней арифметической в квадрат их сумма не превращается в нуль, так как и положительные и отрицательные отклонения получают один и то же положительный знак. Кроме того, большие отклонения от средней, будучи возведены в квадрат, получают и больший «удельный вес», оказывая большее влияние на величину показателя вариации.
Однако, возводя отклонения вариант от средней арифметической в квадрат, мы, таким образом, искусственно увеличиваем и самый показатель вариации. Чтобы преодолеть это, вместо дисперсии берут корень квадратный из указанного отношения:
(4)
Полученный таким образом показатель называется средним квадратическим отклонением. Иногда его называют основным отклонением, или просто (для краткости) сигмой. Знаки «плюс» и «минус» (+, -), поставленные перед радикалом, указывают на то, что данный показатель в равной мере характеризует отклонения вариант от средней арифметической как в сторону больших (+), так и в сторону меньших (-) значений. В дальнейшем в целях экономии эти знаки опущены, т.к. подразумевается, что они стоят впереди этого показателя.
Среднее квадратическое отклонение, как и средняя арифметическая, относится к величинам именованным и выражается в тех же величинах, что и признак. Выборка, в которой рассеяние вариант около средней арифметической больше, характеризуется и большей величиной среднего квадратического отклонения и, наоборот, при меньшей вариабельности признака среднее квадратическое отклонение оказывается меньшим.
В лесном хозяйстве чаще всего используют у вместо у 2. Преимущество среднего квадратического отклонения против дисперсии объясняется практическим удобством: в случае использования у мы имеем меру рассеяния, выраженную в тех же величинах, что и среднее значение.
По сравнению со средним линейным отклонением среднее квадратическое отклонение более точно характеризует вариабельность признаков. Для подтверждения приведенного утверждения вычислим величину у для 1 и 3 ряда распределения числа стволов по диаметру, которые показаны в таблице 5.1, и сравним ее с линейным отклонением. Техника этого вычисления показана в таблице 5.4.
На основе данных таблицы 5.4 выполним вычисления по формуле (2)
у1 = (см); у2 = (см).
Таблица 4 - Вычисление среднеквадратического отклонения для ряда распределения числа стволов по диаметру. Среднее значение () равно 32,0 см
Ступени (классы) толщины, xi |
Вычисления по вариантам |
||||||||
Ряд №1 |
Ряд №3 |
||||||||
ni |
xi- |
(xi-)2 |
ni(xi-)2 |
ni |
xi- |
(xi-)2 |
ni(xi-)2 |
||
8 |
2 |
-24 |
576 |
1152 |
- |
- |
- |
- |
|
12 |
3 |
-20 |
400 |
1200 |
- |
- |
- |
- |
|
16 |
13 |
-16 |
256 |
3328 |
- |
- |
- |
- |
|
20 |
13 |
-12 |
144 |
1872 |
7 |
-12 |
144 |
1008 |
|
24 |
23 |
-8 |
64 |
1472 |
25 |
-8 |
64 |
1600 |
|
28 |
32 |
-4 |
16 |
512 |
33 |
-4 |
16 |
528 |
|
32 |
40 |
0 |
0 |
0 |
65 |
0 |
0 |
0 |
|
36 |
24 |
4 |
16 |
384 |
42 |
4 |
16 |
832 |
|
40 |
19 |
8 |
64 |
1216 |
22 |
8 |
64 |
1408 |
|
44 |
12 |
12 |
144 |
1728 |
6 |
12 |
144 |
864 |
|
48 |
7 |
16 |
256 |
1782 |
- |
- |
- |
- |
|
52 |
5 |
20 |
400 |
2000 |
- |
- |
- |
- |
|
56 |
4 |
24 |
576 |
2880 |
- |
- |
- |
- |
|
60 |
3 |
28 |
784 |
2352 |
- |
- |
- |
- |
|
Итого |
200 |
- |
- |
21878 |
200 |
- |
- |
6240 |
Сравнивая между собой у1 и у2, видим, что они более адекватно отражают вариацию рядов, чем Д1 и Д2.
Из теоретической статистики известно, что вариация генеральной совокупности больше вариации выборки, взятой из данной генеральной совокупности, в среднем в раз. Для упрощения символов обозначим ?ni = N. На этом основании в формулу (5.4) следует внести поправку, взяв в качестве множителя подкоренного выражения величину . В результате формула (5.4) преобразуется следующим образом:
(5)
Величина называется числом степеней свободы. Она показывает, что в ограниченной совокупности (а любая выборка всегда имеет ограниченный объем) все варианты свободы принимать любые значения, кроме одной, значение которой определяется разностью между суммой всех остальных вариант и объемом выборки. В таких случаях говорят, что одна варианта не имеет степени свободы. Так, если равна а, , то одна из вариант равна .
Например, если четыре каких-то значения варьируют неограниченно, то их число степеней свободы 4-0=4. Когда же вариация этих значений ограничена каким-нибудь объемом, например величиной, равной 100, то три варианты (n1, n2, n3) могут принимать любые значения, скажем, 27, 16, 15, или 59, 3, 37, то четвертая варианта (n4) будет иметь только одно значение, а именно
n4=100-(27+16+15) = 100-58 = 42, или 100-(59+3+37)=100- 99=1,
т.е. она не имеет степени свободы. В этом случае остается только три степени свободы: 41=3.
В любой эмпирической совокупности всегда имеется один член, не имеющий свободы вариации. Поэтому число степеней свободы для любой выборки равно (N1). В больших совокупностях разница между N и (N1) неощутима, т.е. она заметно не сказывается на величине вариации и среднего квадратического отклонения. На выборках же малого объема эта разница сказывается на величине указанных показателей. Поэтому при вычислении среднего квадратического отклонения на малых выборках рекомендуется пользоваться формулой (5.5).
Способы вычисления среднеквадратического отклонения
Способов вычисления среднеквадратического отклонения вариационного ряда как и других его показателей (статистик) есть несколько. В настоящее время для вычисления статистик разработаны компьютерные программы. Они сразу дают искомый результат, но исследователь, работающий с вариационным рядом, должен понимать суть изучаемого явления. Поэтому необходимо знать алгоритм проводимых вычислений, что мы сейчас и рассмотрим.
Одним из наиболее простых способов является, так называемый, прямой или длинный. Его рационально использовать для небольшого числа наблюдений, не сгруппированных в вариационный ряд. Работа выполняется следующим образом. После того как вычислена средняя арифметическая, нужно определить отклонение от нее каждой варианты, т.е. найти значения и т.д. Затем каждое отклонение возводится в квадрат и, если варианта повторяются, квадраты отклонений умножаются на соответствующие частоты, и результаты суммируются. Полученная сумма делится на общее число наблюдений без единицы , и из частного извлекается квадратный корень.
Возьмем для примера небольшую совокупность и вычислим для нее среднее квадратическое отклонение. Например, учитывая естественное возобновление на 10 учетных площадках, мы насчитали следующее число сеянцев: 91, 82, 76, 65, 54, 102, 94, 78, 88, 96. Их сумма (?ni) равна 750. Средняя арифметическая этих значений составит 750/10 = 75 сеянцев. Вычисление у для данного ряда показано в таблице 5.5.
Таблица 5 - Вычисление среднего квадратического отклонения для количества сеянцев на учетных площадках. Среднее значение равно 75 шт
№ п/п |
xi |
xi- |
(xi-)2 |
Вычисления |
|
1 |
91 |
-16 |
256 |
шт. |
|
2 |
82 |
-7 |
49 |
||
3 |
76 |
+1 |
1 |
||
4 |
65 |
-10 |
100 |
||
5 |
54 |
-21 |
421 |
||
6 |
102 |
+27 |
729 |
||
7 |
94 |
+19 |
361 |
||
8 |
78 |
+3 |
9 |
||
9 |
88 |
+13 |
169 |
||
10 |
96 |
+21 |
421 |
||
Итого |
750 |
- |
2516 |
При вычислениях на компьютере абсолютная величина чисел не имеет значения. При расчетах вручную очень крупные или очень мелкие величины удобнее увеличивать или уменьшать на 1-3 или более порядков, а итог соответственно корректировать.
При наличии больших совокупностей вычисление статистических показателей вариационного ряда чаще всего осуществляют с помощью вспомогательных величин, которые именуют моментами.
Понятие о моментах распределения
Моментом называют среднее отклонение классовых вариантов от средней величины или от любого числа.
Моменты называют начальными, ели они вычислялись от условного начала, и центральными, если вычислялись от средней ряда . Начальные моменты обозначают буквой m с индексами, указывающими на порядок момента или на степень отклонений: mо - нулевой, m1 - первый, m2 - второй, m3 - третий и m4 - четвертый - начальные моменты. Это означает соответственно: среднее отклонение нулевой, первой степени, средний квадрат, средний куб отклонений и т.д. Причем mо=1, так как все отклонения в нулевой степени равны единице, и, следовательно, сумма произведений их на частоты равна общему числу частот.
Центральные моменты обозначают буквой с теми же индексами: и т.д. - соответственно нулевой, первый, второй, третий и четвертый центральные моменты. Причем, , что легко проверить, пользуясь данным понятием моментов.
Вычисление начальных моментов
Для вычисления моментов есть несколько способов. Обычно в практике применяют способ произведений и способ сумм. При проведении расчетов на компьютерах можно разрабатывать алгоритм по любому из названных способов. Более просто программируется способ произведений. Поэтому мы рекомендуем использовать именно этот способ.
Способ произведений. Техника и расчеты начальных моментов по способу произведений видны из таблице 5.6, где мы продолжаем рассматривать ряд распределения 120 деревьев сосны, показанный в таблицах 3.1 и 4.1.
В 1-м столбце таблицы вписаны классовые варианты исследуемого признака xi, а во 2-м - соответствующие им частоты пi. Эти два столбца цифр представляют собой исследуемый вариационный ряд. В 3-м столбце вписывают условные отклонения классовых вариант от условной средней М. В исследуемом ряду распределения М принято равным 32 см. Эти отклонения находят по формуле:
(6)
где k - величина интервала. В рассматриваемом ряду k=4 см.
Для центрального класса условное отклонение равно нулю, так как значение варианта Х и условного начала М здесь одинаковы. Начиная расчет отклонений от центрального класса, получим для классов, находящихся в стороне значений вариант меньших М ряд чисел со знаком минус (1, 2, 3, 4 и т.д.), а для классов, находящихся в стороне значений вариант, которые больше М со знаком плюс (+1, +2, +3, +4 и т.д.).
В столбцы 4-7 вписывают произведения найденных отклонений в первой, второй, третьей и четвертой степенях на частоты. Эти произведения рекомендуется находить последовательно по строкам, умножая в каждой из них число предыдущего столбца на одно и то же число т.е., на отклонение хk. Благодаря этому создаются условия для проверки чисел, помещенных в столбцах 47.
Таблица 6 - Вычисление начальных моментов по способу произведений для ряда распределения диаметров стволов сосны
Ступени толщины (классы) xi |
Число деревьев (частоты) пi |
Отклонение от условной средней (М'=32 см) хk |
пiхk |
хk+1 |
(хk+1)4 |
п(хk+1)4 |
|||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
|
8 |
1 |
-6 |
-6 |
36 |
36 |
-216 |
-216 |
1296 |
1296 |
-5 |
625 |
625 |
|
12 |
3 |
-5 |
-15 |
25 |
75 |
-125 |
-375 |
625 |
1875 |
-4 |
256 |
768 |
|
16 |
8 |
-4 |
-32 |
16 |
128 |
-64 |
-512 |
256 |
2048 |
-3 |
81 |
648 |
|
20 |
14 |
-3 |
-42 |
9 |
126 |
-27 |
-378 |
81 |
1134 |
-2 |
16 |
224 |
|
24 |
20 |
-2 |
-40 |
4 |
80 |
-8 |
-160 |
16 |
320 |
-1 |
1 |
20 |
|
28 |
27 |
-1 |
-27 |
1 |
27 |
-1 |
-27 |
1 |
27 |
0 |
0 |
0 |
|
32=М' |
17 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
1 |
17 |
|
36 |
12 |
1 |
12 |
1 |
12 |
1 |
12 |
1 |
12 |
2 |
16 |
192 |
|
40 |
9 |
2 |
18 |
4 |
36 |
8 |
72 |
16 |
144 |
3 |
81 |
729 |
|
44 |
5 |
3 |
15 |
9 |
45 |
27 |
135 |
81 |
405 |
4 |
256 |
1280 |
|
48 |
3 |
4 |
12 |
16 |
48 |
64 |
192 |
256 |
768 |
5 |
625 |
1875 |
|
52 |
1 |
5 |
5 |
25 |
25 |
125 |
125 |
625 |
625 |
6 |
1296 |
1296 |
|
Итого |
120 |
- |
?-100 |
- |
638 |
- |
?-1132 |
- |
8654 |
- |
- |
7674 |
Используя результаты вычислений, показанных в таблице 6, проведем расчеты моментов.
m1 = = 100/120 = 0,833;
m2 == 638/120 = 5,317;
m3 == 1132/120 = 9,433;
m4 == 8654/120 = 72,117.
Моменты обычно вычисляют с точностью до 0,001. Учитывая, что при их нахождении может быть допущена ошибка, обычно проводят проверку счета по формуле:
m4'=m0+m1+6m2+4m3+m4, (7)
где m4' - четвертый начальный момент, который вычислен, если начальное значение (M') сдвинуто на один разряд ниже. В нашем примере этот сдвиг сделал начальным значением величину xi = 28 (см. таблицу 5.6). Напомним, что
m0 = 1,
m4'=,
m4' = 1-3,332+31,908-37,732+72,117=63,961.
Из приведенных вычислений видно, что m4', вычисленный по данным таблицы 5.6 и по формуле (5.7) практически одинаковы: разницу в 0,011 или 0,17 % можно отнести за счет округлений при расчете моментов.
Вычислив начальные моменты, приступаем к нахождению центральных моментов.
Начальные моменты как таковые не представляют самостоятельного интереса в силу условности выбора начального значения (M'). Их в основном используют для вычисления центральных моментов. Это бывает делать гораздо удобнее, чем вычислять центральные моменты непосредственно через среднее значение () и среднее квадратическое отклонение (у) по формуле:
Mk = , (8)
где Mk - центральный момент порядка k; k - 1, 2, 3, 4,…
Символы xi, , ni, N=?ni описаны выше.
Вычисления центральных моментов через начальные выполняют по формуле:
Mk = , (9)
где , т.е. - это число сочетаний с k по j;
k!; j!; (k-j)! - факториалы приведенных величин, т.е. k! = 1•2•3•…•k.
Используя (5.9) получаем формулы для вычисления центральных моментов:
(10)
(11)
(12)
Для проверки центральных моментов ряда распределения применяют формулы:
(13)
(14)
Приведем теперь вычисления центральных моментов для нашего распределения 120 деревьев сосны, используя вычисленные выше начальные моменты.
Получаем следующие результаты:
м0=1; м 1=0;
м 2 = 5,317-(-0,833)2 = 5,317-0,694 = 4,623;
м 3 = -9,433-3(-0,833)•5,317+2•(-0,833)3 = -9,433+13,287-1,156 = 2,698;
м4 = 72,117-4•(-0,833)•(-9,433)+6•(-0,833)2•5,317-3•(-0,833)4 = 72,117 - 31,431+ + 22,136 - 1,444 = 61,378.
Проверка (формулы (13), (14)):
м 3 = -9,433-3•4,623•(-0,833)-(0,833)3 = -9,433+11,553+0,578 = 2,698;
м 4 = 72,117-4•2,698•(-0,833)-6•4,623•(-0,833)2-(-0,833)4 = 72,117+8,990-19,248-- 0,481 = 61,378.
Проверка показала, что центральные моменты вычислены правильно.
Моменты можно вычислять также по способу сумм. В прежние времена, когда вычисления проводили вручную, этот способ считали предпочтительным из-за меньшего количества вычислений. При расчетах на компьютере используют в основном способ произведений. Это вызвано более простым алгоритмом расчетов по способу произведений против способа сумм. Последний способ требует много сложных логических условных переходов, что реализовать на компьютере труднее, чем организовать простой счет даже больших чисел.
Хотя способ сумм не рекомендуется для современных вычислений, но его традиционно описывают в пособиях по биометрии. Здесь тоже описан этот способ в том виде как он приведен в учебнике советского ученого-таксатора Н.Н. Свалова (1925-2002), который есть в списке литературы. Технику вычислений покажем на примере ряда распределения высот сосны (таблица 7).
Вычисление начальных моментов по способу сумм начинается с вписывания в качестве исходных данных классовых вариантов и соответствующих им численностей (частот). Следующие за частотами столбцы нумеруют, они предназначаются для суммирования частот в определенной последовательности, которая изложена ниже. Последние два столбца таблицы не нумеруют - в них помещают вычисленные значения, необходимые для проверки верности проведенных вычислений.
Таблица 7 - Вычисление начальных моментов по способу сумм для ряда распределения высот сосны
Х |
ni |
(1) |
(2) ni+1= =ni-1+ni |
(3) |
(4) |
(5) |
(хk+1) |
ni (хk+1)2 (из табл. прил. 2) |
||
b |
20 |
1 |
1 |
1 |
1 |
1 |
1 |
-6 |
1296 |
|
21 |
2 |
3 |
4 |
5 |
6 |
7 |
-5 |
1250 |
||
22 |
2 |
5 |
9 |
14 |
20 |
27 |
-4 |
512 |
||
23 |
3 |
8 |
17 |
31 |
51 |
- |
-3 |
243 |
||
24 |
4 |
12 |
29 |
- |
- |
- |
-2 |
64 |
||
25 |
2 |
14 |
43 |
- |
- |
- |
-1 |
2 |
||
26 |
13 |
27 k2 |
- |
- |
- |
- |
0 |
0 |
||
условн. средняя |
М=27 |
14 k1 |
- |
- |
- |
- |
- |
+1 |
14 |
|
б |
28 |
25 |
53 k3 |
- |
- |
- |
- |
+2 |
400 |
|
29 |
18 |
28 |
38 |
- |
- |
- |
+3 |
1458 |
||
30 |
10 |
10 |
10 |
10 |
- |
- |
+4 |
2560 |
||
? |
94 |
?a91б |
48 б |
10 б |
- |
- |
- |
7789 |
||
?b70b |
103 b |
111 b |
78 |
35 |
||||||
S= б+b |
s1 161 |
s2 151 |
s3 121 |
s4 78 |
s5 35 |
|||||
d= б-b |
d1- 21 |
d255 |
d3101 |
d478 |
d5-35 |
Проверка суммировании (сумм a и b) приведена в таблице 8.
Таблица 8 - Проверка суммирования а и b
а1=38+53=91 |
b1=43+27=70 |
b2=60+43=103 |
mо = 1,000 4m1 = 0,892 6m2 = 29,550 4m3 = 38,936 m4 = 90,457 |
|
а2=10+38=48 |
b3=51+60=111 |
b4=27+51=78 |
||
82,963 |
Проверка
N=k1+k2+k3= 27+14+53=94
Начальные моменты:
m1=21:94=0,223
m2 = (161+2•151)/94=463/94=4,925
m3 = [21+6(-55)+6] (-101)/94=-915/94=-9,734
m4 = 161+14•151+36•121+24•78)/94=8503/94=90,457
Затем против частоты, соответствующей условной средней М, проводим черту через все нумерованные столбцы таблицы, разделяя последнюю на две части - верхнюю и нижнюю. В столбцах 2, 3, 4, 5 добавляют сверху и снизу от проведенной общей черты дополнительные черточки в возрастающем количестве 1, 2, 3, 4 и т.д. Таким образом, получается фигура из черточек в виде треугольника.
Составление таблицы состоит в следующем. Численности первого и последнего класса (в нашем ряду 1 и 11-го) вписывают в те же строки, т.е. первого и последнего классов, во все столбцы незанятые чертой. Каждое последующее число столбца (1), …, (5) получают как сумму двух чисел, одно из которых стоит рядом с образуемым числом слева, а другой - над ним (в верхней части таблицы) или под ним (в нижней части таблицы). Строки, занятые черточками, не заполняют. Внизу каждого столбца выписывают суммы верхней и нижней частей таблицы.
Одну из этих вспомогательных сумм, находящуюся в стороне вариант, значения которых больше условной средней М' обозначают буквой б, а другую сумму - буквой b. Алгебраические суммы этих вспомогательных сумм обозначают буквой s, а разности их буквой d (в столбцах 1, 2, 3, 4, 5 будем иметь соответственно s1, s2, s3, s4, s5 и d1, d2, d3, d4, d5).
Правильность суммирования в 1-м столбце проверяют, сложив наибольшие числа верхней и нижней частей этого столбца с частотой, стоящей против начального значения. Сумма этих трех чисел должна равняться объему ряда. В примере расчета, приведенном в таблице 5.7, имеем 27+14+53=94.
Проверка суммирования во 2-м и следующем столбцах состоит в сложении последнего наибольшего числа верхней или нижней части проверяемого столбца с последним числом предыдущего столбца, расположенным строкой выше (при проверке нижней суммы) или строкой ниже (при проверке верхней суммы).
Проверка сумм б и b приведена в таблице 8.
Начальные моменты вычисляют по формулам:
, (15)
, (16)
(17)
Вычисление начальных моментов приведено в той же таблице 5.7.
Вычисление центральных моментов. Формулы для вычислений те же, что приведены ранее, когда моменты нашли по способу произведений (5.10-5.14).
.
.
Проверка:
4 Асимметрия, эксцесс, коэффициент вариации
Центральные моменты используют для вычисления главных статистических показателей ряда распределения: среднего значения (), среднего квадратического отклонения (у), коэффициента вариации (х), показателей асимметрии (б) и эксцесса (Е).
Асимметрию и эксцесс находят через основные моменты. Последние определяют по формулам:
rh = , (18)
где rh - основной момент с показателем h;
мh - центральный момент с показателем h;
уh - основное отклонение в степени h.
Из формулы (5.18) следует, что основной момент равен отношению центрального момента того или иного порядка к основному отклонению в соответствующей степени. Для распределения 120 деревьев сосны по диаметру, мы определили m0=1; m1=0; m2=4,623; m3=2,698; m4=61,378, а у=1,830. Тогда, проведя вычисления по формуле (5.18), учитывая значения м0 , м1, вытекающие из формул (9)-(12), получим:
r0 = =;
r1==;
r2==;
r3==;
r4==.
Третий основной момент (r3) представляет собой хаарктеристику скошенности (косости) ряда распределения и именуется асимметрией, которая обозначается б= r3.
Четвертый основной момент служит для нахождения крутости ряда распределения, который называется эксцессом и обозначается Е=r4-3. Для нашего примера б=0,440, Е=2,473.
Среднеквадратическое отклонение, как и средние величины ряда, является именованной величиной, выражающейся в величинах измерения ряда. Для решения многих теоретических и практических вопросов лесной биометрии нужны относительные величины, характеризующие общие особенности размаха ряда распределения. Таким показателем является коэффициент вариации, который в литературе по лесному хозяйству называют еще показателем изменчивости таксационных признаков лесных насаждений.
Коэффициент вариации представляет собой показатель изменчивости изучаемого признака, выраженный в относительных единицах, обычно в процентах. Он определяется по формуле
, (19)
где х - коэффициент вариации; у - среднеквадратическое отклонение; - среднее значение.
Так как коэффициент вариации не зависит от принятых единиц измерения (при делении у на единицы измерения взаимно уничтожаются), то он применяется при сравнительной оценке варьирования различных признаков. В лесном хозяйстве это могут быть диаметр дерева, его высота, объем, прирост и т.д.
Значение коэффициента вариации используют для вычисления точности исследования (Р) по формуле
, (20)
где N - объем выборки.
Для примера вычислим х и Р по данным таблиц 5 и 6.
Для измеренного количества сеянцев (таблица 5.5) у=1,83 шт., N=10, среднее значение () = 75.
Коэффициент вариации сеянцев на площадках равен
.
Тогда точность исследования составит (формула (20))
.
Для замеренных 120 диаметров сосны (таблица 5.6) значения х и Р следующие: =28,7 см (см. главу 4, таблица 4.1); у = С=8,83, где С - величина ступени толщины (4 см); N=120 шт.
Тогда
;
.
Полученные величины варьирования диаметров соответствуют данным, приводимым в исследованиях по лесной таксации. Точность в 2,8% достаточная при проведении измерений в практике лесного хозяйства и низкая для научных исследований, где требуется точность в 1,5-2%.
Из формулы (5.20) можно определить необходимое количество наблюдений (N) при заданной точности (Р).
Если , то ;
; .
Для наших 120 деревьев, где х = 30,8%, необходимое число наблюдений при разной точности составит
Для Р = 10% деревьев;
Для Р = 5% деревьев;
Для Р = 2% деревьев;
Для Р = 1,5% деревьев;
Для Р = 1% деревьев.
Следовательно, чтобы изучить наш древостой с приемлемой точностью, необходимо измерить 240-420 стволов, в среднем 300-350.
Обобщая изложенное в настоящей главе, приведем формулы для определения статистических показателей ряда распределения через моменты:
Средняя арифметическая
(21)
Среднее квадратическое отклонение:
а) в единицах интервала (дисперсия)
(22)
б) в единицах измерения
(23)
Коэффициент вариации
(24)
Показатель асимметрии
(25)
Показатель эксцесса
(26)
Показатель точности исследования
(27)
В приведенных формулах условные обозначения (, М', m1, м2, у, r3, r4, V, б, Е, С, Р,) показаны выше.
Размещено на Allbest.ru
...Подобные документы
Среднее значение показателя (среднее арифметическое). Показатели вариации - размах вариации, среднее линейное отклонение, среднее квадратическое отклонение, дисперсия, коэффициент вариации. Максимальное и минимальное значение статистического показателя.
контрольная работа [159,7 K], добавлен 14.11.2008Построение интервальных вариационных рядов по показателям. Вычисление средней арифметической, моды и медианы, относительных и абсолютных показателей вариации. Определение количественных характеристик распределений, построение эмпирической функции.
курсовая работа [179,8 K], добавлен 11.01.2012Решение задач линейного программирования, построение графиков линий по точкам. Среднее время ожидания в очереди и исправленное среднее квадратичное отклонение для выборки. Корреляционный анализ связи между числом посетителей и выручкой магазина.
контрольная работа [609,0 K], добавлен 13.11.2011Область определения функции. Точки пересечения графика функции с осями координат. Экстремумы, промежутки возрастания и убывания. Корни полученного квадратного уравнения. Среднее квадратическое отклонение. Коэффициент вариации, максимальное значение ряда.
контрольная работа [91,0 K], добавлен 08.01.2011Вариация признаков в совокупности. Типы рядов распределения: атрибутивные и вариационные. Классификация по характеру вариации. Основные характеристики и графическое изображение вариационного ряда. Показатели центра распределения и колеблемости признака.
курсовая работа [110,0 K], добавлен 23.07.2009Математическое ожидание дискретной случайной величины, его свойства и определение. Дисперсия и формула для ее вычисления. Среднее квадратическое отклонение. Ковариация и коэффициент корреляции. Коррелированные и некоррелированные случайные величины.
курсовая работа [133,7 K], добавлен 05.06.2011Среднее арифметическое (математическое ожидание). Дисперсия и среднеквадратическое отклонение случайной величины. Третий центральный момент и коэффициент асимметрии. Законы распределения. Построение гистограммы. Критерий Пирсона. Доверительный интервал.
курсовая работа [327,1 K], добавлен 29.03.2013Измерение прочности металла контрольных образцов, снятых с дисков турбин авиадвигателя. Основные статистические характеристики распределения данных. Значимость отклонения от нуля коэффициентов асимметрии и эксцесса с заданным уровнем значимости.
контрольная работа [219,0 K], добавлен 17.12.2012Непрерывная случайная величина и функция распределения. Математическое ожидание непрерывной случайной величины. Среднее квадратичное отклонение. Кривая распределения для непрерывной случайной величины. Понятие однофакторного дисперсионного анализа.
контрольная работа [165,5 K], добавлен 03.01.2012Операция объединения множеств. Перестановки без повторений, правило произведения. Вероятности извлечения предмета из урны. Вероятность наивероятнейшего числа попаданий в десятку. Математическое ожидание, дисперсия и среднее квадратичное отклонение.
контрольная работа [165,5 K], добавлен 23.09.2011Исследование методики математической обработки многократно усеченной информации. Особенности графического изображения опытной информации. Определение среднего значения показателя надежности, абсолютной характеристики рассеивания и коэффициента вариации.
курсовая работа [116,1 K], добавлен 16.01.2014Понятие функционала и оператора. Задачи, приводящие к экстремуму функционала, и необходимые условия его минимума. Связь между вариационной и краевой задачами. Функционалы, зависящие от нескольких функций. Вариационные задачи с подвижными границами.
курсовая работа [313,3 K], добавлен 23.05.2010Предмет, метод и история возникновения статистики. Построение таблиц, понятие абсолютных и относительных величин и правила действия с ними. Сущность вариации, свойства дисперсии и расчет индексов. Особенности корреляционно-регрессионного анализа.
курс лекций [302,0 K], добавлен 14.07.2011Построение и графическое изображение вариационных рядов. Дискретный вариационный ряд распределения урожайности зерновых, сельскохозяйственных предприятий по качеству почв. Показатели центра распределения. Показатели формы и колеблемости признака.
лабораторная работа [208,0 K], добавлен 15.05.2014Порядок и принципы построения вариационного ряда. Расчет числовых характеристик статистического ряда. Построение полигона и гистограммы относительных частот, функции распределения. Вычисление асимметрии и эксцесса. Построение доверительных интервалов.
контрольная работа [108,5 K], добавлен 03.10.2010Непрерывное начисление сложных процентов. Общий метод приближённого вычисления эффективной процентной ставки, его применение для ссуды, платежи по которой совершаются через одинаковые промежутки времени. Сравнение методов простых и сложных процентов.
курсовая работа [1,1 M], добавлен 19.02.2014Система линейных уравнений. Векторная алгебра, линейные операции для векторов, векторное (линейное) пространство. Случайные события и величины, плотность распределения вероятности, математическое ожидание, дисперсия, среднее квадратическое отклонение.
методичка [232,1 K], добавлен 18.05.2010Определение вероятности наступления определенного события по законам теории вероятности. Вычисление математического ожидания, дисперсии и среднего квадратичного отклонения. Нахождение выборочного уравнения регрессии по данным корреляционной таблицы.
контрольная работа [212,0 K], добавлен 01.05.2010Понятия и термины вариационного исчисления. Понятие функционала, его первой вариации. Задачи, приводящие к экстремуму функционала, условия его минимума. Прямые методы вариационного исчисления. Практическое применение метода Ритца для решения задач.
курсовая работа [1,3 M], добавлен 08.04.2015Определение периметра треугольника, наименьшего и наибольшего значений функции. Вычисление средней температуры. Проведение вычислений логарифмов. Нахождение угла между прямой и плоскостью. Вычисление объема конуса. Коэффициент теплового расширения.
контрольная работа [15,5 K], добавлен 27.12.2013