Другие распределения. Система кривых Пирсона и Джонсона

Основные непрерывные распределения, которые используют в лесном деле. Типы преобразований, плотность распределения кривых семейства Джонсона. Распределение типа А или Грама-Шарлье. Аппроксимация экспериментального ряда числа стволов в антропогенных лесах.

Рубрика Математика
Вид реферат
Язык русский
Дата добавления 29.03.2018
Размер файла 508,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ДРУГИЕ РАСПРЕДЕЛЕНИЯ. СИСТЕМА КРИВЫХ ПИРСОНА И ДЖОНСОНА

Содержание

1. Распределение типа А или Грама-Шарлье

2. Другие распределения

3. Система кривых Джонсона

4. Система кривых Пирсона

1. Распределение типа А или Грама-Шарлье

Система кривых распределения далеко не исчерпывается нормальным и биномиальным распределениями. Видов распределений много, и некоторые, наиболее часто встречающиеся, мы здесь рассмотрим.

Еще в XIX веке немецкими лесоводами и таксаторами (Вейзе и др.), а затем и в России (А.В. Тюрин (1882-1979) и др.) было доказано, что распределение числа деревьев в древостое по таксационным показателям соответствует закону нормального распределения. Но более глубокие исследования, проведенные во второй половине XX века, показали, что это не совсем так. Реальная кривая похожа на кривую нормального распределения, но чаще всего бывает скошенной вправо или влево, более плоской или более остроконечной. Оказалось, что кривой Гаусса-Лапласа соответствуют, да и то не всегда, древостои естественного происхождения, растущие без вмешательства человека и имеющие возраст, близкий к спелому (для сосны это 80 лет и старше). В большинстве случаев кривая, которой хорошо моделируются распределения деревьев в лесах Беларуси, лишь близка к нормальному распределению. Называется она кривой обобщенного нормального распределения или кривая типа А. Ее еще называют кривой Грама-Шарлье, иногда просто кривой Шарлье.

В том случае, когда статистики распределения б и Е или один из них оказались значимыми, или когда при интервальной оценке параметров б и Е интервал перекрывает нуль, выравнивающие частоты бывает целесообразно рассчитать именно по уравнению обобщенного нормального распределения. Это распределение является разложением в ряд уравнения кривой нормального распределения. Оно учитывает имеющиеся асимметрию и эксцесс. Выравнивание по этому уравнению, как показали многочисленные исследования, дает лучшую аппроксимацию экспериментального ряда числа стволов по диаметру и высоте в антропогенных лесах, чем нормальное распределение. Последнему отдают предпочтение лишь в тех случаях, когда б <t0,05 и Е<t0,05. Исходят при этом из положения, что при недоказанном отклонении распределения от нормального, надежнее считать это распределение следующим модели нормального распределения, а найденные показатели б и Е относить за счет случайного состава выборочной совокупности. распределение лесной антропогенный джонсон

Теоретические частоты кривой типа А вычисляют по формуле

(8.1)

где - значения функции нормальной кривой при , , , , - 3, 4, 5, 6-я производные функции ѓ(x); r3 (асимметрия), r4 (r4-3 - эксцесс), r5, r6… - основные моменты; N - общая численность вариант ряда; - основное отклонение в единицах интервала, .

Из формулы 8.1 мы видим, что распределение Грамма-Шарлье описывается бесконечным рядом, использующим функцию нормального распределения и ее производные. В практике достаточно ограничиться тремя первыми членами разложения. Увеличение числа членов обычно не улучшает (может и ухудшить) аппроксимацию эмпирического распределения. Применение распределения Грамма-Шарлье требует знания четырех параметров: , ,, Е. Вспомним, что для вычисления кривой нормального распределения достаточно двух параметров (, ), а биномиального и пуассоновского - одного, .

При выборе в качестве аппроксимирующей кривой уравнения типа А следует помнить, что близость этой кривой к нормальному распределению накладывает достаточно жесткие ограничения на величины и Е. Они не должны быть слишком велики, например, не должна превышать величины 0,5 - 0,7, а Е - 0,6 - 0,8.

Приведем пример расчета кривой типа А. Для этого возьмем ряд распределения числа стволов по диаметру на высоте 1,3 м в сосновом насаждении класса бонитета в возрасте 50 лет, где проведены рубка ухода и древостой имеет полноту 0,7. Пользуясь формулами, приведенными выше, предварительно сделаем расчеты необходимых параметров кривой (таблица 8.1).

Для вычисления частот кривой типа А требуется знать , у, б, E.

Таблица 8.1 - Вычисление показателей для определения статистик ряда распределения числа стволов по диаметру в древостое сосны I класса бонитета в возрасте 50 лет

Ступени толщины xi

Число стволов ni

xk

xkni

x2kni

x3kni

x4kni

xk+1

(xk+1)4ni

xini

xi-x

(xi-x)2

(xi-x2)ni

8

2

-4

-8

32

-128

512

-3

162

16

-17

289

578

12

10

-3

-30

90

-270

810

-2

160

120

-13

169

1690

16

22

-2

-44

88

-176

352

-1

22

352

-9

81

1782

20

43

-1

-43

43

-43

143

0

0

860

-5

25

1075

24(Mґ)

39

0

0

0

0

0

1

39

936

-1

1

39

28

32

1

32

32

32

32

2

512

896

3

9

288

32

24

2

48

96

192

384

3

1944

768

7

49

1176

36

18

3

54

162

486

1458

4

4608

648

11

121

2178

40

9

4

36

144

576

2304

5

5625

360

15

215

2025

44

1

5

5

25

125

625

6

1296

44

19

136

361

Итого (У)

200

-

50

712

794

6520

-

14368

5000

-

-

1192

.

.

Проверка:

71,84 = 32,6+15,88+21,36+2;

71,84 = 71,84.

м 2 = m2 - m12 = 3,56 - 0,0625 = 3,4975.

м 3 = m3 - 3m2m1 + 2m13 = 3,97 - 33,560,25 + 20,015625 =3,97 - 2,67 + 0,03125 = 1,33125.

м 4 = m4 - 4m3m1 + 6m2m12 - 3m14 =32,6 - 40,253,97 + 63,560,0625 - 60,00390625 =32,6 - 3,97 + 1,335 - 0,0234372 = 29,941563.

Проверка: м 3 = m3 - 3 м 2m1 - m13 = 3,97 - 33,49750,25 - 0,015625 =3,97 - 2,623125 - 0,015625 = 1,33125.

м 4 = m4 - 4 м 3m1 - 6 м 2m12 - m14 =32,6 - 41,331250,25 + 63,49750,0625 - 40,00390625 =32,6 - 1,33125 - 1,3115625 - 0,015625 = 29,9415.

= м ґ + 4m1 = 24 + 40,25 = 25.

у = ;

E = r4 - 3 = - 0,55.

Проведя вышеприведенные вычисления, получили =25,0; =7,48; =1,87; =0,20; Е = -0,55; m1=0,25. Значения и Е показывают на значительные отличия ряда распределения от нормального, т. к. требования к «нормальности» =Е=0 (во всяком случае <0.05; Е<0,05), недопустимы для использования кривой типа А. Схема вычисления выравнивающих частот с использованием кривой типа А показана в таблице 8.2.

Таблица 8.2 - Вычисление частот распределения типа А (Грамма-Шарлье) для ряда распределения числа стволов по диаметру в древостое сосны в возрасте 50 лет

Параметры для вычисления

=25,0; =1,8701; =7,4086; = 0,203; Е = -0,55; m1=0,25

Ступени толщины,

Число стволов

округление

1

2

3

4

5

6

7

8

9

10

11

12

13

8

2

-4

-4,25

-2,27253

0,0302

+0,14582

-0,3971

-0,00493

-0,00091

0,02336

2,4

2

12

10

-3

-3,25

-1,73782

0,0881

+0,00316

-0,52857

-0,00011

-0,0121

0,07588

8,1

8

16

22

-2

-2,25

-1,20311

0,1935

+0,36143

-0,69435

+0,01223

-0,01591

0,18982

20,3

20

20

43

-1

-1,25

-0,66839

0,3192

-0,54445

0,16653

+0,01842

+0,00382

0,34124

36,5

36

24=m1

39

0

-0,25

-0,13368

0,3955

-0,15799

1,14360

+0,00534

+0,02621

0,42705

45,6

46

28

32

1

0,75

0,40104

0,3681

+0,41905

0,75870

+0,01418

+0,01739

0,37131

39,7

40

32

24

2

1,75

0,93575

0,2577

0,51175

-0,38329

+0,01297

-0,00785

0,26282

28,1

28

36

18

3

2,75

1,47046

0,1355

0,16670

-0,71696

-0,00564

-0,01643

0,11343

12,1

12

40

9

4

3,75

2,00518

0,0539

+0,00485

0,26498

+0,00016

+0,00607

0,06013

6,4

6

44

1

5

4,75

2,53990

0,0157

-0,13900

0,09370

+0,00470

+0,00245

0,02255

2,4

2

ИТОГО (У)

200

-

-

+0,035

0,06

-

-

-

201,6

200

В 1-й столбец таблицы 8.2. вписаны классовые варианты X, в 3-й - их условные значения , выраженные в долях интервала, =(X-M')/k; во 2-м столбце записаны частоты ряда; в 4-м столбце - разности между условными значениями вариант и первым начальным моментом ряда, т. е. значения , в 5-м - значения аргумента x, т. е. частное от разностей () на основное отклонение не именованное у. В 6, 7 и 8-м столбцах записывают значения функции f(ф) и ее производных. Величину этих функций берут из специальных таблиц, приведенных в приложении Г.

Значение дается для положительных значений x. При отрицательных значениях х знак, указанный в таблицах, нужно изменить на обратный. Для f(x) и знаки остаются без изменения, т.е. теми же, что и в таблицах, независимо от знака при х.

В 9-й столбец записывают значения , в 10-й - значения (Е/24) . Данные 11-го столбца представляют алгебраическую сумму цифр 6, 9 и 10-го столбцов. В 12-м столбце помещены выровненные частоты, полученные путем умножения данных 11-го столбца на (без округления), а 13-м столбце - округленные величины теоретических частот с округлением. Графически выравнивание распределения числа стволов по диаметру из нашего примера показано на рисунке 8.1.

Д

Рисунок 8.1 Распределение числа стволов сосны по диаметру, выровненное с помощью кривой типа А

Правильность расчетов теоретических частот ряда проверяют сравнением общей их суммы с суммой фактических частот. Видно, что экспериментальная кривая согласуется с моделью (8.1), т.к. N в обоих случаях равно 200.

Распределение Грама-Шарлье широко применяется в лесоводственных исследованиях. Наиболее часто его используют, изучая древостои, где имеется значительное антропогенное воздействие, особенно рубки промежуточного пользования. В этом случае нарушаются требования предельной теоремы Ляпунова о том, чтобы воздействие каждого фактора было относительно мало и примерно соотносимо с другими.

Рубки промежуточного пользования могут существенно изменить характер распределения деревьев в древостое. В то же время при их правильном проведении в чистых насаждениях сохраняется одновершинность кривой и ее соответствия обобщенному нормальному распределению, т.е. распределение из нормального трансформируется в тот его вид, который описывается кривой типа А. Это основная причина того, что названную кривую широко применяли для описания реальных распределений многие ученые-лесоводы: А.Патацкас, К.Е. Никитин (1908-1987), Н.Н. Свалов (1918-1995), Л.Н. Толкачев (1938-2008). Кривая типа А взята за модель распределения В.Ф. Багинским при описании строения древостоев Беларуси, на основе которого составлены действующие товарные таблицы для насаждений сосны, ели, дуба, березы, осины и ольхи черной.

2. Другие распределения

В лесных исследованиях используется ряд других распределений. Поскольку настоящее учебное пособие предназначено также для магистрантов и аспирантов, то целесообразно привести описание этих распределений. Для студентов-лесоводов при изучении основного курса биометрии можно ограничиться распределением Грама-Шерлье, но в ряде случаев, особенно при выполнении НИИРС нужно обращаться к другим видам распределений.

Сводку распределений, которые находят применение в лесном хозяйстве, сделали К.Е. Никитин и А.З. Швиденко в капитальном труде «Методы и техника обработки лесоводственной информации», которая приведена в списке литературы. Поскольку книга вышла более 30 лет назад и уже стала библиографической редкостью, приведем здесь материалы о других распределениях в том виде как они изложены в упомянутой монографии.

Сводка основных распределений, используемых в лесном хозяйстве, приведена в таблице 8.3.

Опишем основные из приведенных распределений.

Логнормальное распределение. Логнормальное распределение формируется в условиях, подобных тем, где применяется кривая типа А. Величина х распределена логнормально, если логарифмы её значений U = , n, имеют нормальное распределение. Теоретически это распределение можно рассматривать как распределение величины, полученной умножением примерно одинаковых случайных величин при большом их числе, и в этом смысле оно является некоторым аналогом нормального закона.

Это распределение случайной величины хi зависит от двух параметров (среднего и дисперсии логарифмов значений с. в. Х), хотя можно ввести один или два параметра, ограничивающие размах распределения с одной или двух сторон.

Таблица 8.3 - Основные непрерывные распределения, используемые в лесном деле

Формула

Распределение

Плотности распределения

Среднее значение

Дисперсия

8.0

Нормальное

у2

8.1

Грамма-Шарлье

(«обобщенное нормальное»)

,

,,- плотность нормального распределения и её 3 и 4-я производные

у2

8.6

Логарифмически-

нормальное

,

где - дисперсия lnx; - среднее ,

8.11

Показательное

(экспоненциальное)

при 0 при < 0

8.12

Вейбулла

8.13

Равномерное

(прямоугольное)

(b - a)-1 при a?x?b

0 при х < . x > b

8.14

Гамма-распределение

(III тип Пирсона)

; х ? 0

> 0, b > 0

8.15

Бета-распределение

(I тип Пирсона)

Кривая распределения имеет правостороннюю асимметрию, которая возрастает с увеличением у? (рисунок 8.2.), поэтому хорошо аппроксимирует распределения с положительной косостью.

Рисунок 8.2 Кривые логнормального распределения с различными параметрами уu

Если для величин хi известно среднее и дисперсия ух2, то параметры логнормального распределения можно вычислить непосредственно по формулам

, (8.7)

, (8.8)

а плотность логнормального распределения величины х

, (8.9)

Уравнение задано на интервале [0, ? ]. Если кривая распределения ограничена слева точкой х1, то имеем трехпараметрическое логнормальное распределение.

, (8.10)

которое заменой х' = х - х1 приводится к (8.6.).

Имеются многочисленные примеры использования логнормального распределения как модели при свертке лесоводственной информации.

Пример. Вычислим выравнивающие частоты для ряда распределения числа стволов по диаметру в древостое ели (таблица 8.4) по уравнению логнормального распределения (8.6). Среднее значение и дисперсия этого ряда соответственно равны = 18,36 (см), = 5,85 (см). Если бы эти показатели были неизвестны, то в таблице 8.4. следовало бы добавить 3 колонки для отклонений от х0 и вычисления первых двух моментов. По (8.7) и (8.8) находим , . Дальнейшая схема вычислений полностью соответствует схеме таблицы 8.4.

Таблица 8.4 - Схема вычисления выравнивающих частот с применением логнормального распределения для диаметров древостоя ели (таблицы 8.2 - 8.3)

xi

ni

, где

Ф/z

nФ/z

8

11

10

2,3026

-0,559

-1,80

0,036

20

20

12

18

14

2,6391

-0,223

-0,72

0,236

132

112

16

181

18

2,8904

+0,029

+0,09

0,536

209

167

20

124

22

3,0910

0,229

0,74

0,770

430

130

24

67

26

3,2581

0,396

1,27

0,898

501

72

28

31

30

3,4012

0,539

1,73

0,958

535

34

32

17

34

3,5264

0,665

2,14

0,984

549

15

36

5

38

3,6376

0,776

2,49

0,994

555

5

40

3

42

3,7377

0,876

2,82

0,998

557

2

44

1

46

3,8286

0,967

3,11

1,000

558

1

У

558

-

-

-

-

-

-

558

Сравнение эмпирических и вычисленных частот свидетельствует о хорошем соответствии принятой модели ряду распределений.

Логнормальное распределение использовано для выравнивания рядов распределения диаметров литовскими учеными-лесоводами: В. В. Антанайтисом, А. А. Кулешисом, Ю. Ф. Можейкой и др.

Распределение Вейбулла. Распределение Вейбулла (формула (8.12), таблица 8.5) обычно применяют как модель распределения времени ожидания, например, времени работы системы, состоящей из совокупности последовательно соединенных элементов, т.е. распределение времени работы до выхода из строя первого элемента. Его можно рассматривать как обобщение показательного распределения, если интенсивность отказов меняется во времени. Параметр б характеризует скорость выхода системы из строя. Это распределение хорошо описывает время выхода из строя отремонтированного оборудования, срок работы машин, тракторов и т.д.; его можно использовать как модели распределения крайних (экстремальных) значений или распределения биометрических характеристик деревьев, в частности диаметра. Более подробное описание этого распределения здесь опускаем. Оно приведено в книге К.Е. Никитина и А.З. Швиденко, имеющейся в предложенном списке литературы.

Гамма- и бета- распределения. Гамма- и бета- распределения принадлежат к числу основных моделей, используемых при изучении распределений. Оба они связаны с одним из наиболее общих распределений - распределением Маркова, из которого можно получить практически все встречаемые в приложениях распределения как предельные стохастические кривые. Условия, при которых формируются гамма- и бета - распределения, весьма широки в зависимости от величины входящих в них параметров. Как правило, они могут описывать любую практическую ситуацию из приведенных в настоящем параграфе, а ряд рассмотренных распределений может быть получен как частные случаи гамма- и бета- распределений.

Рисунок 8.3 Кривые гамма-распределения:

1-б=5; b=3; 2-б=b=1 3-б=1; b=3

Гамма- распределение (формула (8.14), таблица 8.3) - одна из основных статистических моделей для представления распределений случайной величины, ограниченных с одной стороны. Это распределение хорошо описывает время, необходимое для появления ровно b независимых событий, если они происходят с равной интенсивностью б. Форма и масштаб кривых распределения зависят от величины и соотношения параметров б и b: b- параметр формы, б - параметр масштаба. Если b ? 1, то плотность гама- распределения убывающая кривая (рисунок 8.3.), если b > 1, то распределение представлено одновершинной кривой с максимумом в точке (b -1) / б.

Обычно в лесном хозяйстве интервал значения случайной величины ограничен с обоих концов. Плотность гамма-распределения для случая, когда величина задана на интервале [х, ?], выражается формулой

, , б>0, b >0 (8.16)

Переход к распределению в формуле (8.15.) обеспечивается заменой x' = x - x1. При аппроксимации гамма-рапределением вероятности для очень больших значений случайной величины невелики, ими пренебрегают как и в случае нормального распределения.

Для практического вычисления параметров б и b используют метод моментов, дающий приближенные, но, как правило, вполне приемлемые результаты. Среднее значение Г-распределения , а дисперсия у2 = b/б2. Вычислив на основании выборки значения и и приравняв их соответствующим соотношением параметров, находим выборочные оценки и

, (8.17)

(8.18)

При использовании гамма-распределения приходится вычислять значения Г-функци, называемой иначе интегралом Эйлера первого рода.

Г-функция - обобщенное понятие факториала для какого-либо положительного числа с, в том числе и для дробного

, с > 0. (8.19)

Для с целого положительного Г (с +1) = с! =1 · 2 · 3 … с.

Так как Г - функция имеет один минимум (в точке 1,4616 … со значением Г (1,4616 …) = 0,8856 …), а с увеличением с значения Г (с) резко возрастают, то обычно пользуются lg Г (с). Обычно в таблицах приводят значения lg Г (с) для с от 1 до 2. Для других значений lg Г (с) находят с использованием соотношения Г (с + 1) = с Г (с), откуда при с >2

lg Г (с) = lg (с - 1) + lg (с - 2) + … + lg (с - ) + lg Г (с - ) (8.20)

а при 0 < с < 1

lg Г (с) = lg Г (с + 1) - lg с. (8.21)

Многие известные распределения являются частными случаями гамма-распределения. Если b = 1, то получаем эспоненциальное распределение: при б = Ѕ и b кратном 1/2 имеем - квадрат-распределение, а при b целом положительном - распределение Эрланга, широко используемое в теории массового обслуживания.

Для примера аппроксимируем при помощи гамма-распределения ряд распределения диаметра (из таблицы 8.4.). Следует иметь в виду, что, выбирая подходящим образом начало кривой и ее масштаб, можно значительно упростить вычисления. Поскольку для гамма-распреления в форме (8.16) начало кривой находится в точке х1 (в нашем примере х1 = 6 см), Перенесем начало координат в эту точку и произведем замену хi' = (xi - x) / c, чтобы можно было пользоваться статистиками, вычисленными для ряда в «рабочих единицах».

Для нашего примера имеем = 3,0896, у2 = м2 = 2,1385. Тогда по (8.17) и (8.18) = 3,0896 / 2,135 = 1,4448; = 1,4448 · 3,0896 = 4,4637, и уравнение (8.14) приобретает вид

, (8.22)

а выравнивающие частоты , (8.23)

где n - количество наблюдений.

Заметим, что при вычислениях непосредственно для исходного ряда (а не для рабочего) среднее = 18,36 см, = 34,216 (см2) и параметр формы b практически не меняется, а в формуле (8.23) ni необходимо умножить на величину с. Подставив (8.23) в (8.22) и прологарифмировав, получаем

lg (x) = lg 558 + 4,4637 lg 1,4448 - lg Г (4,4637) + 3,4637 lg x - 1,4448 x lg e = 2,4157 + 3,4637 lg x - 0,6275 x,

где логарифм Г-функции вычислен по (8.20) с использованием таблиц lgГ (с), которые на отрезке от х=1 до х=2 приведены в приложении Д. Для больших величин х эти значения опущены. На отрезке от х=1 до х=50 они имеются в книге А.К. Митропольского, приведенной в списке литературы.

lgГ (4,4637) = lg 3,4637 + lg 2,4637 + lg 1,4637 + lg (1,4637) =

= 0,5395 + 0,3916 + 0,1654 + 1,9472 = 1,0438

Схема вычисления выравнивающих частот по кривой Г-распределения приведена в таблице 8.5. Контролем вычислений служит совпадение сумм колонок 2 и 8; небольшие расхождения объясняются погрешностями округлений в процессе расчета.

Таблица 8.5 - Схема вычисления выравнивающих частот по кривой гамма-распределения

0,6275

lg

3,4637 lg

lg

1

2

3

4

5

6

7

8

8

11

0,5

-0,3138

-0,3010

-1,0426

1,061

11,7

12

118

1,5

-0,9412

+0,1761

0,6099

2,084

121,4

16

181

2,5

-1,5688

0,3979

1,3783

2,225

168,0

20

124

3,5

-2,1962

0,5441

1,8845

2,104

127,1

24

67

4,5

-2,8238

0,6532

2,2625

1,854

71,5

28

31

5,5

-3,4512

0,7404

2,5644

1,529

33,8

32

17

6,5

-4,0788

0,8129

2,8157

1,153

14,2

36

5

7,5

-4,7062

0,8751

3,0309

0,740

5,5

40

3

8,5

-5,3338

0,9294

3,2192

0,301

2,0

44

1

9,5

-5,9612

0,9777

3,3865

1,841

0,7

?

558

555,9

Бета-распределение (формула (8.15) в таблице 8.3) часто называют основным распределением для величин, ограниченных с двух сторон. Это удобная модель для многочисленных приложений, поскольку кривая бета-распределения может принимать самую различную форму в зависимости от величины параметров (рисунок 8.4). Кроме того, посредством бета-распределения можно вычислять другие важные распределения.

Если б > b > 1 или b > б > 1, то распределение одновершинное с максимумом в точке х = (б - 1) / (б + b - 2) с левосторонней асимметрией в первом и правосторонней во втором случае; если б < 1, b < 1, то распределение имеет U-образную, а при б ? 1, b < 1 i-образную форму. При б < 1, b ? 1 кривая распределения убывающая.

Рисунок 8.4 Кривые бета-распределения

1-б=1,5, b=5; 2-б=5, b=1,5; 3-б=b=2; 4-б=1, b=2;

5-б=0,2, b=2; 6-б=b=1; 7-б =b=2; 8-б=b=0,5

Если б = b, то распределение симметрично. В качестве примеров случайной величины, подчиняющихся бета-распределению, можно привести выработку бригады, цеха и др. за определенный срок (смену, сутки), распределение большинства биометрических признаков деревьев и древостоев и др.

Название бета-распределения следует из того, что выражение из (8.15) в таблице 8.3, имеющие вид

(8.24)

при б > 0, b > 0 называют в-функцией или интегралом Эйлера II рода. Так как В-функция выражается через Г-функцию, то её обычно вычисляют по таблице значений Г-функции.

Формула плотности задает бета-распределение на интервале (0,1). В конкретных задачах интервал обычно ограничен некоторыми значениями [х1, х2]. Тогда плотность задается формулой.

(8.25)

Заменив в (8.25) х' = (х - х1) /(х2 - х1), получим плотность бета-распределения на [0, 1], т.е. формулу (8.24).

Частными случаями бета-распределения являются равномерное (б = b = 1), треугольное (б = 2, b = 1) и параболическое (б = b = 2). В задачах свертки информации эти частные случаи находят применение для приближенного представления более сложных распределений.

Соотношения между параметрами бета-распределения и моментами, в частности средним и дисперсией, можно использовать для аппроксимации бета-распределения:

, (8.26)

, (8.27)

где - выборочное среднее; - выборочная дисперсия.

Пример. Вычислим выравнивающие частоты по кривой бета-распределения ряда распределения второго коэффициента формы q2 (таблица 8.6). Напомним, что q2=d0.5/d1.3, где d0.5 - диаметр ствола на 0,5 высоты дерева, d1.3 - диаметр ствола на высоте 1,3 м. Коэффициент q2 широко применяется для оценки полнодревесности деревьев.

Если имеем х1 = 0,54, х2 = 0,78 (начало и конец ряда), среднее и дисперсия (в рабочих единицах) = 0,6596, . Замена х' = (х - 0,54) / (0,78 - 0,54) дает х1' = 0, х2' = 1, ' = 0,4983, величина разряда с = 0,02/0,24 = 0,08333, дисперсия (0,08333)2 •3,7712 = 0,02619. Значения б и b находим из (8.26) и (8.27)

,

Для перехода к выравнивающим частотам значения f (x) из (8.25) следует умножить на величину n/c, т. е.

, (8.28)

Прологарифмировав 8.28 и вычислив коэффициенты, получим

,

ln ni = 3,6459 + 3,2582 lg x'i+3,2873 lg (1 - x'i).

Схема вычисления ni по последнему выражению приведена в таблице 8.6

В колонках 4 и 7 записаны одинаковые числа, только в обратном порядке (в колонке 4 сверху вниз, в колонке 7 снизу вверх. Поэтому при вычислениях значения колонки 7 могут быть получены по данным колонки 4. Контролем правильности вычислений служит близкое значение сумм колонок 2 и 10.

Таблица 8.6 - Схема вычисления выравнивающих частот распределения числа деревьев по коэффициенту формы q2 по кривой бета-распределения

хi

(q2)

ni

лет

xi'

lgxi'

3,2582 lgxi'

1-xi'

lg(1-xi')

3,2873 lg(1-xi')

lg

0,55

1

0,0417

-1,3799

-4,4960

0,9583

-0,0185

-0,0608

1,089

0,1

0,57

3

0,1250

-0,9031

-2,9425

0,8750

-0,0580

-0,1907

0,513

3,3

0,59

12

0,2080

-0,6813

-2,2198

0,7917

-0,1014

-0,3333

1,093

12,4

0,61

23

0,2917

-0,5351

-1,7435

0,7083

-0,1498

-0,4924

1,410

25,7

0,63

38

0,3750

-0,4260

-1,3880

0,6250

-0,2041

-0,6709

1,587

38,6

0,65

49

0,4583

-0,3388

-1,1039

0,5417

-0,2662

-0,8751

1,667

46,5

0,67

51

0,5417

-0,2662

-0,8673

0,4583

-0,3388

-1,1137

1,665

46,2

0,69

36

0,6250

-0,2041

-0,6650

0,3750

-0,4260

-1,4004

1,581

38,1

0,71

21

0,7083

-0,1498

-0,4881

0,2917

-0,5651

-1,7590

1,399

25,0

0,73

14

0,7919

-0,1014

-0,3304

0,2083

-0,6813

-2,2396

1,076

11,9

0,75

2

0,8750

-0,0580

-0,1889

0,1250

-0,9031

-2,9087

0,489

3,1

0,77

1

0,9583

-0,0189

-0,0603

0,0417

-1,3799

-4,4960

0,090

0,1

?

251

251

Описанная в-функция является основной моделью, которую применяют проф. О.А. Атрощенко и его ученики для решения большого ряда прикладных задач: материально-денежная оценка лесосек, описание строения древостоев и т. д.

3. Семейство кривых распределения Джонсона

В лесоводственной литературе упомянутое семейство кривых впервые описали К.Е. Никитин и А.З. Швиденко. Приведем здесь его в изложении названных авторов.

Джонсон предложил для аппроксимации эмпирических распределений семейство кривых, полученных преобразованием исходного распределения с плотностью f(x) к нормировано нормально распределенной величине z. Это семейство включает три типа кривых, представляющих распределение неограниченных случайных величин (тип SU), ограниченных с одной стороны (SL) и ограниченных с двух сторон (SВ). В общем виде семейство кривых Джонсона требует знания параметра положения о, параметра масштаба л и двух параметров формы - г и д. В таблице 8.9 приведены формулы преобразований к кривым Джонсона и соответствующие плотности распределения. Для простоты записи формулы приведены для нормированных значений величины Х путем замены у = (х - о) /л.

Для выбора конкретной кривой необходимо установить, к какому типу принадлежит эмпирическое распределение. Для этой цели на основании ряда распределения вычисляют выборочные значения в1 и в2 и по графику (рисунок 8.5) устанавливают тип распределения.

Таблица 8.9 - Типы преобразований и плотность распределения кривых семейства Джонсона

Тип кривой

Преобразование/

Плотность

распределения

SL

z = г +д ln у

8.29

SВ

z = г + д ln[у/ (1 - у)]

8.30

SU

Z = г + д arcsh y =

= г + д ln(у + )

8.31

SL

8.50

SВ

8.51

SU

8.52

Выборочные распределения, для которых в1 и в2 лежат вблизи и на линии ЅL, относятся к этому типу; лежащие ниже линии ЅL - к типу ЅU, а выше, исключая критическую область, - к типу SB .Затем по выборке оценивают параметры данного типа распределения и вычисляют выравнивающие частоты.

Рисунок 8.5 График для выбора типа кривых Джонсона

Вычисление оценок параметров о, л, г и д через моменты очень сложно. Поэтому обычно для аппроксимации кривыми Джонсона используют метод приравнивания теоретических (выравнивающих) и выборочных квантилей. Тип ЅL. Кривая распределения ограничена слева точкой о , а значения х ? о. Можно показать, что этот тип распределения зависит только от трех параметров д, о и г* = г - д ln л, поэтому, положив д = 1/у и г* = /у, получаем трехпараметрическое логнормальное уравнение, приведенное выше (8.10), т.е. тип SL имеет такую же форму распределения как на рисунке 8.2. Аппроксимация этого распределения возможна методом, рассмотренном в таблице 8.4.

В практике использование типа SL может встретиться два случая величина о = х1 известна; величина о не известна. В большинстве задач по аппроксимации величин в лесном хозяйстве, особенно для свертки информации, начало кривой распределения, т.е. величина о, как правило, может быть установлена. Так, в качестве о можно использовать нижнюю границу первого класса ряда распределения. Если значение о известно, то, вычислив значения

, (8.32)

, (8.33)

находят два неизвестных параметра формулы (8. 50):

, (8.34)

. (8.35)

Если значение о не известно, то из (8.29) заменой г* = г - д ln (x - о) находят

Z = г* + д ln (x-о). (8.36)

Так как по выборке необходимо оценить параметры г*, д и о, составляют три уравнения, приравнивающих три выборочных квантиля трем соответствующим квантилям нормированной нормально распределенной величины Z.

Za = г* + д ln ( xa - о), (8.37)

где za и xa - соответственно теоретические и выборочные квантили.

Целесообразно выбирать два симметричных квантиля - это упрощает расчеты, в противном случае приходится решать нелинейное уравнение. Вполне приемлемо брать a = 0,05; 0,5 и 0,95. Выбор других близких квантилей мало меняет результаты. Тогда, поскольку для нормированного нормального распределения z0,05 = - 1,645, z0,5 = 0 и z0,95 = 1,645, решением системы трех уравнений (8.37) находят:

, (8.38)

, (8.39)

, (8.40)

где х0,05, х0,5, х0,95 - квантили выборочного распределения.

В качестве І и ІІІ квантилей можно взять и другие произвольные симметричные квантили ха и х1-а.

Поскольку техника вычисления выравнивающих частот по уравнению типа SL по сути одинакова для обоих описанных выше случаев, рассмотрим ее на примере аппроксимации при неизвестном о.

В качестве примера вычислим выравнивающие частоты для ряда распределения диаметра стволов в 110-летнем древостое (таблица 8.10). Имеем в1 = 1,0300 и в2 = 4,3262, т.е. распределение принадлежит к типу SL семейства кривых Джонсона. Для определения параметров г* и о выберем квантили соответствующие вероятностям 0,05; 0,5; 0,95. По нашим данным они соответственно равны 10,57; 17,31 и 29,74. По (8.38) - (8.40) получаем сразу:

;

.

Теоретические частоты по вычисленным выборочным оценкам определяют по формуле (8.36) с использованием в качестве квантилей границ классов эмпирического распределения, т.е.для вычисленных квантилей

. (8.41)

Напомним, что z по условию нормированная нормально распределенная случайная величина. По таблицам Ф (z) (приложение Б) находят накопленную вероятность соответствующую верхним границам классов ряда распределения, откуда умножением на общее количество наблюдений N = 558 переходят к выравнивающим (накопленным) частотам. Вычисление проводят по схеме таблицы 8.10. В колонках 10, 11 таблицы 8.10 приведены частоты, вычисленные по значениям параметров, оцененных на основании квантилей а = 0,01; 0,5 и 0,99 (колонка 10) и а = 0,1; 0,5 и 0,9 (колонка 11). В целом расхождения между теоретическими и эмпирическими частотами относительно невелики. Правда, следует учесть, что для рядов с большими значениями частот в крайних классах линейная интерполяция при расчете квантилей и ха и х1-а может давать заметные погрешности, особенно при малом а (этим объясняется частота 31 в колонке 10 таблицы 8.10). В таких случаях лучшие результаты можно получить построением для нахождения квантилей графика накопленных частот или (что, конечно, лучше) вычислением квантилей для не сгруппированных данных.

Таблица 8.10 - Вычисление выравнивающих частот для типа SL семейства кривых Джонсона

xi

ni

xp

Ln(xp-

zp

Ф(z)

У

для квантилей

б=0,01

1-=0,99

б=0,1

1-=0,9

1

2

3

4

5

6

7

8

9

10

11

-

-

6

1,227

3,299

-3,930

0,001

0,6

0,6

1

1

8

11

10

2,003

5,384

-1,845

0,032

17,9

17,3

31

20

12

118

14

2,435

6,544

-0,685

0,246

137,3

120,0

122

114

16

181

18

2,735

7,352

0,123

0,548

305,8

168,5

166

164

20

124

22

2,956

7,972

0,743

0,771

430,2

124,4

121

127

24

67

36

3,153

8,476

1,247

0,894

498,9

68,7

67

72

28

31

30

3,311

8,900

1,671

0,953

531,8

32,9

32

35

32

17

34

3,447

9,266

2,037

0,979

546,3

14,5

14

15

36

5

38

3,567

9,588

3,359

0,991

553,0

6,7

6

6

40

3

42

3,674

9,876

2,647

0,996

555,8

2,8

2

3

44

1

46

3,771

10,136

2,907

1,0

558,0

1,2

1

1

У

558

558

558

558

Тип SВ. Этот тип (формулы (8.30), (8.51)) представляет случайные величины, ограниченные с двух сторон значениями о?х1 и х2 = о + л = (х1 + л), т.е. параметр о - здесь начало кривой, а л - размах распределения, или расстояние между крайними значениями. Кривая типа SВ может принимать различную форму (рисунок 8.6).

При аппроксимации кривыми типа SВ возможны три случая: известны оба крайних значения; одно из них; ни одного. Если оба крайних значения известны, то остается оценить г и д. Как и для типа SL, оценки находят приравниванием теоретических и выборочных квантилей. Выбирают два симметричных квантиля zа и z1-а, например, 0,05 и 0,95 или 0,1 и 0,9. Оценки г и д получают из системы уравнений

, (8.42)

где z' и x' - соответственно квантили zа и z1-а, ха и х1-а.

Рисунок 8.6 Кривые распределения Джонсона типа SB при е=0, л=1

1-д=1,5, г=-2; 2-д=0,5, г=-1;

3-д=0,5, г=2; 4-д=1, г=2; 5-д=г=1; 6-д=2, г=0

Отсюда

; (8.43)

. (8.44)

Если известно одно крайнее значение о, то для оценки трех параметров составляют систему типа (8.42) из трех уравнений, в третьем из которых обычно в качестве соответствующих квантилей используют медиану. Тогда оценки д, г и л находят решением системы (8.42) с добавлением третьего уравнения для определения

(8.45)

Техника аппроксимации типом SВ такая же, как и типом SL: 1) находят выборочные значения квантилей для некоторых выбранных заранее вероятностей (один квантиль - медиана, два других - симметричные); 2) по формулам (8.43) - (8.45) находят выборочные значения (или по формулам (8.43) и (8.44), если о известно); 3) с использованием (8.42) вычисляют квантили zр, соответствующие квантилям хр - граница классов аппроксимируемого ряда распределения; 4) по таблице нормированного нормального распределения (приложение А) вычисляют значения накопленных вероятностей, от которых переходят к теоретическим частотам и .

Пример. В первых двух колонках таблицы 8.11 приведен ряд распределения высоты (в сантиметрах) жизнеспособного 3-летнего самосева ели. В качестве жизнеспособного учтем самосев высотой от 0,5 см. Аппроксимируем этот ряд при помощи кривых семейства кривых Джонсона.

Определим для ряда моменты. Если в качестве начального значения взять х0 = 4, то начальные моменты m1 = -0,7442, m2 = 6,2053, m3 =-0,8768, m4 = 69,3000; Центральные м2 = 5,6515, м3 = 12,1529, м4 = 86,3899; Основные r3 = 0,9045, r4 = 2,7048. Отсюда в1 = 0,8181, в2 = 2,7048, т.е. по графику рисунке 8.6 имеем тип SВ. Примем, что начало кривой о = 0,5. Для вычисления , и используем квантили б = 0,05; 0,5 и 0,95. Имеем:

;

;

Подставив значения квантилей хб и х1-б и использовав табличные значения zб и z 1-б находим:

;

.

Дальнейшие вычисления идут по схеме таблицы 8.11.

Таблица 8.11 - Вычисление выравнивающих частот для типа SВ кривых Джонсона (на примере ряда распределения высоты самосева ели)

xi

ni

Xp=

xi+

Ln(4)

Ф(6)

Уni=n(1)

Для квантилей

б=0,01

1-б =0,99

б=0,1

1-б =0,9

-

0

0,5

-

-

0,000

0

0

0

0

1

310

1,5


Подобные документы

  • Система кривых Пирсона. Применение ортогональных полиномов Чебышева при нахождении кривых распределения вероятностей. Примеры нахождения кривых распределения вероятностей и программное обеспечение.

    дипломная работа [230,5 K], добавлен 13.03.2003

  • Определение, доказательство свойств и построение графика функции распределения. Вероятность попадания непрерывной случайной величины в заданный интервал. Понятие о теореме Ляпунова. Плотность распределения "хи квадрат", Стьюдента, F Фишера—Снедекора.

    курсовая работа [994,4 K], добавлен 02.10.2011

  • Основные понятия математической статистики, интервальные оценки. Метод моментов и метод максимального правдоподобия. Проверка статистических гипотез о виде закона распределения при помощи критерия Пирсона. Свойства оценок, непрерывные распределения.

    курсовая работа [549,1 K], добавлен 07.08.2013

  • Вариация признаков в совокупности. Типы рядов распределения: атрибутивные и вариационные. Классификация по характеру вариации. Основные характеристики и графическое изображение вариационного ряда. Показатели центра распределения и колеблемости признака.

    курсовая работа [110,0 K], добавлен 23.07.2009

  • Оценки параметров распределения, наиболее важные распределения, применяемые в математической статистике: нормальное распределение, распределения Пирсона, Стьюдента, Фишера. Факторное пространство, формулирование цели эксперимента и выбор откликов.

    реферат [105,5 K], добавлен 01.01.2011

  • Понятие и виды статистических рядов распределения, основные формы их представления. Расчет и анализ показателей, характеризующих центральную тенденцию, вариацию, структуру и форму ряда распределения. Проведение сглаживания эмпирического распределения.

    курсовая работа [698,3 K], добавлен 07.06.2011

  • Двумерная функция распределения вероятностей случайных величин. Понятие условной функции распределения и плотности распределения вероятностей. Корреляция двух случайных величин. Система произвольного числа величин, условная плотность распределения.

    реферат [325,3 K], добавлен 23.01.2011

  • Пространства элементарных событий. Совместные и несовместные события. Функция распределения системы случайных величин. Функции распределения и плотности распределения отдельных составляющих системы случайных величин. Условные плотности распределения.

    задача [45,4 K], добавлен 15.06.2012

  • Построение полигона относительных частот, эмпирической функции распределения, кумулянты и гистограммы. Расчет точечных оценок неизвестных числовых характеристик. Проверка гипотезы о виде распределения для простого и сгруппированного ряда распределения.

    курсовая работа [216,2 K], добавлен 28.09.2011

  • Функция распределения непрерывной случайной величины. Математическое ожидание непрерывной случайной величины, плотность распределения вероятностей системы. Ковариация. Коэффициент корреляции.

    лабораторная работа [52,3 K], добавлен 19.08.2002

  • Расчет параметров экспериментального распределения. Вычисление среднего арифметического значения и среднего квадратического отклонения. Определение вида закона распределения случайной величины. Оценка различий эмпирического и теоретического распределений.

    курсовая работа [147,0 K], добавлен 10.04.2011

  • Рекурсивное, тригонометрическое определение и свойства многочленов Чебышёва. Сущность теоремы Е.И. Золотарёва-А.Н. Коркина. Применение ортогональных полиномов Чебышева при нахождении кривых распределения вероятностей. Обобщение метода Грамма-Шарлье.

    курсовая работа [1,1 M], добавлен 11.01.2011

  • Плотность распределения непрерывной случайной величины. Характеристика особенностей равномерного и нормального распределения. Вероятность попадания случайной величины в интервал. Свойства функции распределения. Общее понятие о регрессионном анализе.

    контрольная работа [318,9 K], добавлен 26.04.2013

  • Построение гистограммы и полигона по данным измерений. Статистический ряд распределения температур. Проверка нормальности распределения по критерию Пирсона. Определение погрешности средства измерений. Отсев аномальных значений. Интервальная оценка.

    курсовая работа [150,5 K], добавлен 25.02.2012

  • Определение вероятность срабатывания устройств при аварии. Расчет математического ожидания, дисперсии и функции распределения по заданному ряду распределения. Построение интервального статистического ряда распределения значений статистических данных.

    контрольная работа [148,8 K], добавлен 12.02.2012

  • Расчет моментов ряда, построение функции распределения и плотности функции распределения, ее аппроксимация теоретическими зависимостями. Определение стационарности ряда. Вычисление куммулятивной частоты превышения уровня. Прогноз превышения уровня.

    практическая работа [137,2 K], добавлен 11.02.2010

  • Вероятность совместного выполнения двух неравенств в системе двух случайных величин. Свойства функции распределения. Определение плотности вероятности системы через производную от соответствующей функции распределения. Условия закона распределения.

    презентация [57,9 K], добавлен 01.11.2013

  • Закон и свойства нормального распределения случайной величины. На основе критерия согласия Пирсона построение гистограммы, статистической функции и теоретической кривой и определение согласованности теоретического и статистического распределения.

    курсовая работа [894,5 K], добавлен 30.10.2013

  • Проверка гипотезы о законе распределения. Определение значения вероятности по классам распределения случайных величин нефтеносных залежей. Расчет распределения эффективных мощностей месторождения, которое подчиняется нормальному закону распределения.

    презентация [187,0 K], добавлен 15.04.2019

  • Функция распределения вероятностей двух случайных величин. Функция и плотность распределения вероятностей случайного вектора. Многомерное нормальное распределение. Коэффициент корреляции. Распределение вероятностей функции одной случайной величины.

    реферат [241,8 K], добавлен 03.12.2007

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.