Статистичний аналіз вибірок

Статистичний аналіз двох вибірок, які показують відхилення в часі вихідних параметрів від заданих значень двох ідентичних систем керування технологічними процесами. Розрахунок математичного сподівання такого відхилення. Генеральні дисперсії вибірок.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык украинский
Дата добавления 27.09.2017
Размер файла 507,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

ЗАВДАННЯ

Розглянемо вибіркову сукупність Х

X

0,733

-0,288

0,942

-0,568

-1,334

-2,127

0,034

-1,473

0,079

0,768

0,402

1,810

0,772

-0,109

1,278

1,297

1,026

-0,813

-0,528

0,665

0,226

1,378

1,250

1,045

-0,515

-1,433

2,990

0,071

0,110

0,084

1,216

0,584

-0,199

0,031

-0,566

-1,345

-0,574

0,524

0,899

-0,880

0,843

-1,045

0,394

-1,202

2,923

-3,001

-0,491

1,266

-0,521

-0,579

Відсортуємо цю таблицю за зростанням за допомогою Excel. В результаті отримаємо наступну таблицю:

статистичний аналіз вибірка керування технологічний

X

3-3,001

-2,127

-1,473

-1,433

-1,345

-1,334

-1,202

-1,045

-0,88

-0,813

-0,579

-0,574

-0,568

-0,566

-0,528

-0,521

-0,515

-0,491

-0,288

-0,199

-0,109

0,031

0,034

0,071

0,079

0,084

0,11

0,226

0,394

0,402

0,524

0,584

0,665

0,722

0,733

0,768

0,843

0,899

0,942

1,026

1,045

1,216

1,25

1,266

1,278

1,297

1,378

1,81

2,923

2,99

Тепер будемо реалізовувати поставлені завдання уже з отриманою таблицею.

Розглянемо вибіркову сукупність Y

Y

-0,144

-0,254

0,193

-1,346

0,500

0,479

-1,114

-1,206

0,292

0,551

1,068

1,501

0,574

-0,451

0,359

0,074

0,191

-0,831

0,427

0,375

-0,432

0,192

-1,181

-0,518

0,326

0,008

1,041

-0,736

0,210

-1,658

1,410

-1,190

-0,509

-0,921

-0,287

-0,344

-0,513

0,418

-0,120

-0,851

-0,318

-0,886

-0,094

0,161

1,114

-0,158

-0,086

0,340

-0,656

0,234

Відсортуємо цю таблицю за зростанням за допомогою Excel. В результаті отримаємо наступну таблицю:

Y

-1,658

-1,346

-1,206

-1,19

-1,181

-1,114

-0,921

-0,886

-0,851

-0,831

-0,736

-0,656

-0,518

-0,513

-0,509

-0,451

-0,432

-0,344

-0,318

-0,287

-0,254

-0,158

-0,144

-0,12

-0,094

-0,086

0,008

0,074

0,161

0,191

0,192

0,193

0,21

0,234

0,292

0,326

0,34

0,359

0,375

0,418

0,427

0,479

0,5

0,551

0,574

1,041

1,068

1,114

1,41

1,501

Тепер будемо реалізовувати поставлені завдання уже з отриманою таблицею.

1. ПОБУДОВА ГІСТОГРАМ ЧАСТОТ

Гістограмою частот називають ступінчату фігуру, що складається із прямокутників, основами яких є часткові інтервали довжиною h, а висоти дорівнюють ni/h (густина частоти). Площа і-го часткового прямокутника дорівнює h(ni /h) = ni - сумі частот варіант і-го інтервалу; отже, площа гістограми частот дорівнює сумі всіх частот, тобто об'єму вибірки [1, c. 153].

1.1 Побудова гістограми частот вибірки X:

Для побудови гістограми необхідно використовувати частоту. Частота для кожної варіанти даної сукупності рівна 1.

Розіб'ємо дану сукупність на певні інтервали. Для цього спочатку знайдемо розмах варіації R.

R=Xmax-Xmin

R=2,99-(-3,001)= 5,991

Кількість часткових інтервалів визначимо за формулою Стреджеса:

N=6.644?7

Округлимо отримане значення. Отримаємо кількість інтервалів.

Крок буде рівним h

За початок відліку 1 інтервалу візьмемо Xпоч=-3,001

Тепер розбиваємо від початкового значення всі наступні інтервали с кроком який ми вже отримали h=0,86.

Інтервали:

-3,001

-2,141

-2,141

-1,281

-1,281

-0,421

-0,421

0,439

0,439

1,299

1,299

2,159

2,159

3,019

Тепер створимо нову сукупність. Кожний елемент якої буде рівний середньому значенню варіант відповідного інтервалу. А частота буде рівна сумі частот варіант, що входять в цей інтервал. В результаті отримаємо таку таблицю:

zi

-3,001

-1,542

-0,690

0,070

0,941

1,594

2,957

ni

1

5

12

12

16

2

2

В подальших розрахунках z будемо використовувати замість х і всі результати отримані від z будемо вважати, що отримали від х.

Отриману таблицю ми будемо використовувати у подальшому розв'язанні. Створимо таблицю, яка буде складатись з інтервалів частот і щільності частот.

Таблиця №1

Номер інтервалу

Інтервал

Частота (ni)

Щільність (ni/h)

1

-3,001..-2,141

1

1,163

2

-2,141..-1,281

5

5,814

3

-1,281..-0,421

12

13,954

4

-0,421..0,439

12

13,954

5

0,439..1,299

16

18,605

6

1,299..2,159

2

2,326

7

2,159..3,019

2

2,326

За даним розподілом вибірки X побудуємо гістограму частот:

Рис.1. Гістограма частот вибірки X

1.2 Побудова гістограми частот вибірки Y:

Для побудови гістограми необхідно використовувати частоту. Частота для кожної варіанти даної сукупності рівна 1.

Кількість часткових інтервалів визначимо за формулою Стреджеса:

N=6.644?7

Розіб'ємо дану сукупність на певні інтервали. Для цього спочатку знайдемо розмах варіації R.

R=ymax-ymin

R=1,501-(-1,658)=3,159.

Розіб'ємо цю сукупність на 7 інтервалів. Тоді крок h

За початок відліку 1 інтервалу візьмемо yпоч=-1,658

Тепер розбиваємо від початкового значення всі наступні інтервали з кроком який ми вже отримали h=0,45.

Інтервали:

-1,658

-1,207

-1,207

-0,755

-0,755

-0,304

-0,304

0,147

0,147

0,598

0,598

1,050

1,050

1,501

Тепер створимо нову сукупність. Кожний елемент якої буде рівний середньому значенню варіант відповідного інтервалу. А частота буде рівна сумі частот варіант, що входять в цей інтервал. В результаті отримаємо таку таблицю:

bi

-1,502

-1,0225

-0,49744

-0,11789

0,342471

1,041

1,27325

ni

2

8

9

9

17

1

4

В подальших розрахунках b будемо використовувати замість y і всі результати отримані від b будемо вважати, що отримали від y.

Отриману таблицю ми будемо використовувати у подальшому розв'язанні. Створимо таблицю, яка буде складатись з інтервалів частот і щільності частот.

Таблиця №2

Номер інтервалу

Інтервал

Частота (ni)

Щільність (ni/h)

1

-1,658..-1,207

2

4,432

2

-1,207..-0,755

8

17,728

3

-0,755..-0,304

9

19,944

4

-0,304..0,147

9

19,944

5

0,147..0,598

17

37,671

6

0,598..1,050

1

2,216

7

1,050..1.501

4

8,864

За даним розподілом вибірки Y побудуємо гістограму частот:

Рис.2. Гістограма частот вибірки Y.

Висновок: При виконанні завдання для кожної вибірки були побудовані гістограми частот. Площа кожного часткового і-го прямокутника, на гістограмі, - це сума частот варіант, що потрапили у даний інтервал. Площа кожної гістограми частот дорівнює сумі всіх частот, тобто об'єму відповідної вибірки.

2. ЗНАХОДЖЕННЯ ОЦІНОК МАТЕМАТИЧНИХ СПОДІВАНЬ І ДИСПЕРСІЙ ГЕНЕРАЛЬНИХ СУКУПНОСТЕЙ

Складемо функцію правдоподібності:[1, ст.170]

L = f (x1; И1, И2) • f (x2; И1, И2) … f (xn; И1, И2) (2.1)

За умовою задачі И1 = a(математичному сподіванню), И2 = Dв (вибірковій дисперсії).Для спрощення обчислень Dв замінимо на у2(виправлену вибіркову дисперсію). У даному випадку випадкові величини неперервні і розподілені за нормальним розподілом, густина якого визначається формулою(2.2) [2, ст.127]:

, (2.2)

де - математичне сподівання, - середнє квадратичне відхилення.

Отже

L = f (xi ; И1, И2) = f (xi ; a, у2) = (2.3)

Знайдемо максимум функції L. Для цього можна використати функцію ln(L), яка матиме такий же максимум. Тож знайдемо логарифмічну функцію правдоподібності:

ln(L) = У ln(f (xі ; a, у2)) = =

= = - nln() - =

(2.4)

Знайдемо першу похідну рівняння (2.4) по а:

=

= (Уxi - na) (2.5)

найдемо першу похідну рівняння (2.4) по у2:

(2.6)

Знайдемо критичні точки, для чого прирівняємо часткові похідні (2.5) та (2.6) до нуля і отримаємо систему рівнянь:

(2.7)

Розв'яжемо систему рівнянь (2.7) відносно a. Отримаємо:

(2.8)

Легко бачити, що при а = xв друга похідна від'ємна, отже ця точка є точкою максимуму і значить в якості оцінки найбільшої правдоподібності треба взяти середнє вибіркове: .

Розв'яжемо систему рівнянь (2.4) відносно у2. Отримаємо:

xi - a) = n , (2.9)

Підставимо в вираз замість а - середнє вибіркове (див. (2.8)).

(2.10)

Легко бачити, що при такому значенні вибіркової дисперсії друга похідна від'ємна, отже ця точка є точкою максимуму і значить в якості оцінки найбільшої правдоподібності треба взяти наступний вираз:

Dв* = (2.11)

Вибіркове середнє і вибіркову дисперсію доцільно обчислювати методом добутків, який дає зручний спосіб знаходження умовних моментів різного порядку з рівновіддаленими варіантами.

Обрахуємо вибіркові дисперсії для вибірок X та Y методом добутків. Для цього використаємо рівновіддалені частоти, які ми знайшли в пункті

Вибіркова сукупність Х:

Так як ми вже знайшли певні значення в першому пункті то використаємо їх для розв'язку цього завдання. Створимо таблицю, що необхідна для розв'язання поставлених завдання методом добутків.

Крок нам уже відомий, тому його шукати не будемо.

Вибираємо помилковий нуль. Візьмемо за нього варіанту, якій відповідає найбільша по модулю частота серед варіант, що знаходяться приблизно в середині відсортованого списку варіант. За таким принципом вибираємо 0,941.

C=-0,941

Тепер у таблиці, наведеній нижче. заповнюємо стовпець №3 за таким принципом: напроти варіанти, яка рівна умовному нулю, ставимо 0. Тепер в клітинки над 0 пишемо-1, -2, -3…, а під - 1, 2, 3… Дане випливає якщо для кожного окремого набору значень визначати за формулою:

(2.12)

Заповнюємо всі стовбці таблиці

Таблиця №3

xi

ni

ui

niui

niui2

ni(ui+1)2

-3,001

1

-4

-4

16

9

-1,542

5

-3

-15

45

20

-0,690

12

-2

-24

48

12

0,070

12

-1

-12

12

0

0,941

16

0

0

0

16

1,594

2

1

2

2

8

2,957

2

2

4

8

18

50

-49

131

83

Перевіримо, чи правильно ми виконали обчислення за формулою:

Після підстановки всіх значень ми отримали певний результат, а точніше 83. Він співпадає з елементом в нижньому рядку останнього стовпчика. Це означає, що обчислення виконані правильно.

Повернемось до головного завдання - знаходження середнього вибіркового і середньої дисперсії.

(2.13)

(2.14)

Для використання даних формул нам не відомими залишається та .

Обрахуємо їх значення за формулами:

(2.15)

(2.16)

Використаємо дані формули і знайдемо невідомі нам елементи

Підставимо отримані значення і знайдемо ,

Вибіркова сукупність Y:

Так як ми вже знайшли певні значення в пункті один використаємо їх для розв'язку цього завдання. Створимо таблицю, що необхідна для розв'язання поставлених завдання методом добутків.

Крок нам уже відомий, тому його шукати не будемо.

Вибираємо помилковий нуль. Беремо за нього варіанту, якій відповідає найбільша по модулю частота серед варіант, що знаходяться приблизно в середині відсортованого списку варіант. За таким принципом вибираємо 0,3424.

C=0,3424

Тепер у таблиці, наведеній нижче. заповнюємо стовпець №3 за таким принципом: напроти варіанти, яка рівна умовному нулю, ставимо 0. Тепер в клітинки над 0 пишемо-1, -2, -3…, а під - 1, 2, 3… Дане випливає якщо для кожного окремого набору значень визначати за формулою 2.12

Заповнюємо всі стовбці таблиці

Таблиця №4

yi

ni

ui

niui

niui2

ni(ui+1)2

-1,502

2

-4

-8

32

18

-1,0225

8

-3

-24

72

32

-0,4974

9

-2

-18

36

9

-0,1178

9

-1

-9

9

0

0,3424

17

0

0

0

17

1,041

1

1

1

1

4

1,2732

4

2

8

16

36

50

-50

166

116

Перевіримо, чи правильно ми виконали обчислення за формулою:

Після підстановки всіх значень ми отримали певний результат, а точніше 321. Він співпадає з елементом в нижньому рядку останнього стобчика. Це означає, що обчислення виконані правильно.

Повернемось до головного завдання - знаходження середнього вибіркового і середньої дисперсії.

Використаємо формули 2.15 та 2.16 і знайдемо невідомі нам елементи:

Підставимо отримані значення і знайдемо ,

3. ОЦІНКА НЕВІДОМИХ МАТЕМАТИЧНИХ СПОДІВАНЬ М[Х] І M[У] ГЕНЕРАЛЬНИХ СУКУПНОСТЕЙ Х І У ЗА ДОПОМОГОЮ ДОВІРЧОГО ІНТЕРВАЛУ З НАДІЙНІСТЮ 0,95

Інтервальною називають оцінку, яка визначається двома числами - кінцями інтервалу.

Нехай за даними вибірки знайдена статистична характеристика и*, яка служить оцінкою невідомого параметра и.

Будемо вважати и сталим числом. Оцінка и* тим точніше визначає параметр и, чим менше абсолютна величина різниці и - и*.. Іншими словами , якщо ? > 0 і ¦ и - и*.¦ < ?, то чим менше ?, тим оцінка точніша. Таким чином, додатне число ? характеризує точність оцінки.

Однак, статистичні методи не дозволяють категорично стверджувати, що оцінка и*. задовольняє нерівність ¦ и - и*.¦ < ?.

Можна лише говорити про імовірність y, з якою ця нерівність здійснюється.

Надійністю (довірчою ймовірністю) оцінки и за и*. називають імовірність y, з якою виконується нерівність ¦ и - и*.¦ < ?.

Зазвичай надійність оцінки задається наперед, причому в якості у беруть число, близьке до одиниці. Найчастіше задають надійність, що дорівнює 0,95; 0,99; 0,999.

Нехай імовірність того, що ¦ и - и*.¦ < ? дорівнює у:

Р(¦ и - и*.¦ < ?) = у.

Замінивши нерівність ¦ и - и*.¦ < ?, рівносильною їй подвійною нерівністю - ? < и - и*.< ?, або и*- ?< и< и*.+ ? , маємо Р[и*- ?< и< и*.+ ?]=у.

Це співвідношення слід розуміти так: ймовірність того, що інтервал (и*- ?, и*.+ ?) заключає в собі (покриває) невідомий параметр и , дорівнює у.

Довірчим називають інтервал (и*- ?, и*.+ ?), який покриває невідомий параметр із заданою надійністю у .

Інтервал (и*- ?, и*.+ ?), має випадкові кінці, які називають довірчими границями. В різних вибірках отримують різні значення и*, отже від вибірки до вибірки будуть змінюватися і кінці довірчого інтервалу, тобто довірчі границі самі є випадковими величинами .

Оскільки випадковою величиною є не параметр и, що оцінюється, а довірчий інтервал, то правильніше говорити не про імовірність попадання и в довірчий інтервал, а про імовірність того, що довірчий інтервал покриє и .

Наприклад, потрібно оцінити невідоме математичне сподівання а за допомогою довірчих інтервалів, якщо кількісна оцінка Х розподілена нормально, а середнє квадратичне відхилення невідоме.

За даними вибірки можна побудувати випадкову величину Т (її можливі значення будемо позначати через t ):

де Х - вибіркове середнє;

S - „виправлене" середнє квадратичне відхилення;

n - обсяг вибірки.

Ця величина має розподіл Стьюдента з k = n -1 ступенями вільності.

Густина розподілу Стьюдента:

де

Видно, що розподіл Стьюдента визначається параметром n - обсягом вибірки (або, що те ж саме, числом ступенів вільності k = n -1) і не залежить від невідомих параметрів а і . Ця особливість є значною перевагою цього розподілу.

Оскільки S(t,n) - парна функція від t, ймовірність виконання нерівності визначається так:

Замінивши нерівність у круглих дужках рівносильною подвійною нерівністю, отримаємо:

Отже, користуючись розподілом Стьюдента, ми знайшли довірчий інтервал , який покриває невідомий параметр з надійністю у. Тут випадкові величини Х і S замінені невипадковими величинами х i s, знайденими за вибіркою. Параметр tY знаходимо з таблиці, наведеної в додатку 2, за заданими n і у .

Ми маємо нормально розподілену кількісну ознаку генеральної сукупності. За вибіркою n=50 знайдені вибіркове середнє (з пункту 2):

для вибірки Х :

для вибірки Y :

і “виправлене ” середнє квадратичне відхилення :

(3.1)

для вибірки Х : 1,1191

для вибірки Y : 0,6943

Отже, ми можемо оцінити невідомі математичні сподівання за допомогою довірчого інтервалу з надійністю 0,95.

Розв'язання:

Знайдемо tY користуючись додатком №2:

Користуючись таблицею значень tY ( додаток 2 ) за n=50 і у=0,95 знаходимо tY =2,009.

Знайдемо довірчі інтервали для вибірки Х:

(3.2)

Підставляємо всі значення в формулу і отримуємо:

-0,2197 < a < 1,4161

Отже, з надійністю 0,95 невідомий параметр a знаходиться в довірчому інтервалі -0,2197 < a < 1,4161.

Знайдемо довірчі інтервали для вибірки Y:

(3.3)

Підставляємо всі значення в формулу

-0,3060 < a < 0.0884

Отже, з надійністю 0,95 невідомий параметр a знаходиться в довірчому інтервалі -0,3060 < a < 0.0884.

Висновок: Ми оцінили невідомі математичні сподівання М[Х] і M[У] генеральних сукупностей Х і У за допомогою довірчого інтервалу з надійністю 0,95. Для вибірки Х з надійністю 0,95 невідомий параметр a знаходиться в довірчому інтервалі -0,2197 < a < 1,4161. Для вибірки Y з надійністю 0,95 невідомий параметр a знаходиться в довірчому інтервалі -0,3060 < a < 0.0884.

4. ПЕРЕВІРКА ГІПОТЕЗИ ПРО РІВНІСТЬ ДИСПЕРСІЙ ГЕНЕРАЛЬНИХ СУКУПНОСТЕЙ ДЛЯ ВИБІРОК X ТА Y

Запропонуємо просту гіпотезу про рівність дисперсій генеральних сукупностей H0: D(X) = D(Y) при конкуруючій гіпотезі H1: D(X) ? D(Y). Перевіримо запропоновані гіпотези при рівні значущості б = 0,1.

Знайдемо значення критерію, що спостерігається за формулою

(4.1)

де s2б - більша виправлена дисперсія, s2м - менша виправлена дисперсія.

Ми маємо великі вибірки (n1 = n2 = 50 > 30). Отже за виправлені вибіркові дисперсії можна взяти вибіркові дисперсії, які ми знайшли в пункті 2.

Отже, маючи вибіркові дисперсії двох вибірок можна стверджувати

s2б ? Dв(X) =1,2524 (4.2)

s2м ? Dв(Y) =0,4821 (4.3)

Підставимо значення (4.2) та (4.3) в формулу (4.1), отримаємо

Fемп= 2,5978

За умовою задачі, конкуруюча гіпотеза має вигляд H1: D(X) ? D(Y), тому критична область - двостороння.

По таблиці Фішера-Снедекора, по рівню значущості, що в двічі менший за заданий, тобто при б/2 = 0,1/2 = 0,05, та кількістю степенів свободи k1 =49

k2 =49 знаходимо критичну точку Fкр(0,05; 49, 49) = 1,96

Так як спостережений критерій більший за критичний Fемп > Fкр

(1,66 < 2,5978), то немає підстави відхилити запропоновану гіпотезу, тобто нульова гіпотеза приймається.

Висновок: Результати показують, що вибіркові виправлені дисперсії двох вибірок відрізняються суттєво. Враховуючи, що вибіркові виправлені дисперсії є незміщеними оцінками генеральних дисперсій, то це ж стосується і генеральних дисперсій.

5. ПОБУДОВА НОРМАЛЬНИХ КРИВИХ ЗА ЕМПІРИЧНИМИ ДАНИМИ

Нормальна крива - це графік густини нормального розподілу (крива Гауса). Рівняння густини нормального розподілу:

(5.1)

де у - середнє квадратичне відхилення, а - математичне сподівання.

5.1 Знаходження вибіркової середньої та середнього квадратичного відхилення методом добутків

Вибіркові дисперсії вибірок Х та Y вже знайдені методом добутків раніше. За формулою знайдемо середні квадратичні відхилення вибірок.

(5.1.1)

Отримаємо:

уXв = 1,1078, уYв = 0,6873 (5.1.2)

Використаємо обраховані раніше умовні моменти першого порядку (див. (2.15) та (2.16)). Знаючи їх можна легко обчислити вибіркові середні за формулою:

(5.1.3)

Отримаємо: = 0,0982 = -0,1088 (5.1.4)

5.2 Знаходження вирівнюючих частот кожної вибірки

Вирівнюючими(теоретичними) на відміну від фактичних спостережених емпіричних частот називаються частоти , що знайдені теоретично( шляхом безпосередніх обчислень) [2, ст. 245].

Вирівнюючі частоти будемо обраховувати по зведеним до рівновіддалених варіантам, що вже пораховані в таблицях №11 і №12, за формулою

(5.2.1)

де n - обсяг вибірки, h - довжина інтервалу, ув - вибіркове середнє квадратичне, ц(ui) - функція Лапласа, її значення візьмемо з таблиці [2, ст.249],

ui визначається з формули:

(5.2.2)

де xi - середини інтервалів, - вибіркове середнє.

Обчислимо вирівнюючі частоти за формулою .

Вирівнюючі частоти вибірки Х обраховані в таблиці №5.

Вирівнюючі частоти вибірки Y обраховані в таблиці №6.

Таблиця №5

xi

ni

-3,001

1

-3,0992

-2,7973

0,0081

0,3128

-1,5424

5

-1,6406

-1,4808

0,1334

5,1522

-0,6901

12

-0,7883

-0,7115

0,3101

11,9768

0,0695

12

-0,0286

-0,0258

0,3989

15,4065

0,9411

16

0,8429

0,7608

0,2989

11,5443

1,594

2

1,4958

1,3501

0,1604

6,1950

2,9565

2

2,8583

2,5799

0,0147

0,5677

50

50

Таблиця №6

yi

ni

-1,502

2

-1,3931

-2,0268

0,0519

2,7037

-1,0225

8

-0,9136

-1,3292

0,1669

5,4787

-0,4974

9

-0,3886

-0,5653

0,341

11,1938

-0,1178

9

-0,0090

-0,0132

0,3989

13,0945

0,3424

17

0,4512

0,6565

0,323

10,6029

1,041

1

1,1498

1,6727

0,0989

4,2465

1,2732

4

1,3820

2,0106

0,0529

2,7365

50

50

5.3 Побудова полігонів частот і нормальних кривих

Полігон частот будуємо по емпіричним частотам: на координатній площині ставимо точки з координатами (xi, ni) (таблиця №3). Точки з'єднуємо прямими лініями.

Нормальну (теоретичну) криву будуємо по вирівнюючим частотам: на координатній площині будуємо точки з координатами (xi, ni?).

Аналогічні дії проводимо для вибірки Y, тільки значення беремо вже з таблиці №14.

На рис. №3 зображені полігон частот і нормальна крива за вибіркою Х.

На рис. №4 зображені полігон частот і нормальна крива за вибіркою Y.

Рис. 3. Нормальна крива і полігон частот для вибірки Х

Рис. 4. Нормальна крива і полігон частот для вибірки Y

Висновок: Порівнюючи графіки нормальної кривої і полігону частот можна зробити висновок, що побудована теоретична крива за даними вибірки X (мал. №3) і теоретична крива за даними вибірки Y (мал.№4) відображають дані спостережень досить точно.

6. ПЕРЕВІРКА ГІПОТЕЗИ ПРО НОРМАЛЬНИЙ РОЗПОДІЛ ГЕНЕРАЛЬНИХ СУКУПНОСТЕЙ X ТА Y, ВИКОРИСТОВУЮЧИ КРИТЕРІЙ ПОГОДЖЕНОСТІ ПІРСОНА

Критерієм погодженості називають критерій перевірки гіпотези про запропонований закон невідомого розподілу[1, ст.329].

Маючи теоретичні частоти, ми можемо перевірити гіпотези про нормальний розподіл генеральних сукупностей X та Y використовуючи критерій погодженості Пірсона.

Обчислимо ч2емп для вибірки X, для чого побудуємо розрахункову таблицю

Таблиця №7

1

0,3128

0,6871

0,4721

1,5093

1

3,1964

5

5,1522

-0,1522

0,0231

0,0044

25

4,8522

12

11,9768

0,0231

0,0005

4,461E-05

144

12,0231

12

15,4065

-3,4065

11,6047

0,7532

144

9,3466

16

11,5443

4,4556

19,8531

1,7197

256

22,1754

2

6,1950

-4,1950

17,5986

2,8407

4

0,6456

2

0,5677

1,4322

2,0513

3,6130

4

7,0453

50

51,1557

10,4406

60,2849

Обчислене значення критерію: .

Контрольна сума: .

Обчислення виконані правильно.

Тепер знайдемо ч2кр по таблиці розподілу критичних точок ч2 по рівню значущості б = 0,05 і числу степенів свободи k = 7-3 = 4

ч2кр = 9,5. Як бачимо ч2емп > ч2кр , отже у нас є підстави відхилити нульову гіпотезу, тобто розходження емпіричних і теоретичних частот відчутне.

Обчислимо ч2сп для вибірки Y, для чого побудуємо розрахункову таблицю

Таблиця №8

2

2,7037

-0,7037

0,4951

0,1831

4

1,4794

8

5,4787

2,5212

6,3566

1,1602

64

11,6814

9

11,1938

-2,1938

4,8130

0,4299

81

7,2361

9

13,0945

-4,0945

16,7652

1,2803

81

6,1857

17

10,6029

6,3970

40,9216

3,8594

289

27,2564

1

4,2465

-3,2465

10,5401

2,4820

1

0,2354

4

2,7365

1,2634

1,59636

0,5833

16

5,8468

50

50,0569

9,9785

59,9215

Отриманий результат: ч2смп = 9,9785

Контрольна сума: У(ni2 / ni') - n = 59,9215- 50 = 9,9215 2сп

Обчислення виконані правильно.

Тепер знайдемо ч2кр по таблиці розподілу критичних точок ч2 по рівню значущості б = 0,05 і числу степенів свободи k = 7-3 = 4

ч2кр = 9,5

Як бачимо ч2емп > ч2кр , отже у нас є підстави відхилити нульову гіпотезу, тобто розходження емпіричних і теоретичних частот відчутне.

Висновок: В результаті перевірки гіпотези про нормальний розподіл генеральних сукупностей X та Y за допомогою критерію погодженості Пірсона можна зробити висновок, що дані спостережень обох вибірок узгоджуються з гіпотезою про нормальний розподіл генеральних сукупностей.

7. ПЕРЕВІРИТИ ГІПОТЕЗУ ПРО РІВНІСТЬ НУЛЮ МАТЕМАТИЧНИХ СПОДІВАНЬ ГЕНЕРАЛЬНИХ СУКУПНОСТЕЙ Х І У

За умовою завдання на розрахунково-графічну роботу при якісній роботі досліджуваних систем відхилення вихідного параметра від заданого значення повинне дорівнювати нулю. Тому логічно припустити, що якщо система після дії випадкових факторів повертається у нормальний стан керування, то середнє значення відхилення повинне дорівнювати нулю, інакше матиме місце систематична похибка керування, яка не залежить від дії випадкових факторів, а визначається властивостями системи.

Таким чином, якщо генеральна сукупність розподілена нормально, причому генеральне середнє а невідоме, але є підстави вважати, що воно дорівнює нулю, тобто а = 0,необхідно перевірити гіпотезу пpo рівність нулю генерального середнього. Якщо ця гіпотеза буде прийнята, то будуть підстави для висновку, що система працює без систематичних похибок керування.

Оскільки дисперсія генеральної сукупності невідома, то в якості критерію перевірки нульової гіпотези приймемо випадкову величину:

де S - „виправлене" середнє квадратичне відхилення;

n - обсяг вибірки;

Х - середнє вибіркове.

Величина Т має розподіл Стьюдента з k = n -1 ступенями вільності.

Правило перевірки нульової гіпотези формулюється так.

Правило. Для того, щоб при заданому рівні значущості а перевірити нульову гіпотезу про рівність невідомої генеральної середньої а (нормальної сукупності з невідомою дисперсією) гіпотетичному значенню а = 0 при конкуруючій гіпотезі , потрібно обчислити спостережене значення критерію і за таблицею критичних точок розподілу Стьюдента (додаток 6), за заданим рівнем значущості а (розміщеним у верхньому рядку таблиці розподілу Стьюдента) і числом ступенів вільності k = n -1 знайти двосторонню критичну:

Якщо - немає підстав відхилити нульову гіпотезу.

Якщо - нульову гіпотезу відхиляють.

Ми маємо нормально розподілену кількісну ознаку генеральної сукупності. За вибіркою n=50 знайдені в попередньому розділі вибіркове середнє :

для вибірки Х:= 0,0982

для вибірки Y:= -0,1088

і “виправлене” середнє квадратичне відхилення:

для вибірки Х : 1,1191

для вибірки Y : 0,6943

Перевіримо гіпотезу про рівність нулю математичних сподівань генеральних сукупностей Х і У при рівні значущості б = 0,05.

Розв'язання:

Обчислимо спостережене значення критерію для вибірки Х:

Обчислимо спостережене значення критерію для вибірки Y:

За умовою, конкуруюча гіпотеза має вигляд , тому критична область двостороння.

За таблицею критичних точок розподілу Стьюдента (додаток 6) за заданим рівнем значущості а=0,1, розміщеному у верхньому рядку таблиці, і за числом ступенів вільності k=50-1=49 знаходимо критичну точку

Оскільки - немає підстав відхилити гіпотезу про рівність нулю математичних сподівань генеральних сукупностей Х і У.

Висновок: Ми перевірили гіпотезу про рівність нулю математичних сподівань генеральних сукупностей Х і У при рівні значущості б = 0,1.

Обчисливши спостережене значення критерію для обох вибірок, ми дійшли висновку, що немає підстав відхилити гіпотезу про рівність нулю математичних сподівань генеральних сукупностей Х і У, оскільки

8. ОЦІНКА ВІДХИЛЕННЯ ЕМПІРИЧНОГО РОЗПОДІЛУ ВІД НОРМАЛЬНОГО

Для оцінки відхилення емпіричного розподілу від нормального використовують різні характеристики. Зокрема, до них відносяться асиметрія і ексцес.

Асиметрія емпіричного розподілу визначається за формулою[1, cт.186]:

(8.1)

де m3 - центральний емпіричний момент третього порядку.

Ексцес емпіричного розподілу визначається за формулою

(8.2)

де m4 - центральний емпіричний момент четвертого порядку.

Моменти m3 і m4 обчислимо методом моментів за формулами:

(8.3)

(8.4)

де Мj - умовний момент k-го порядку, h - довжина інтервалу.

Умовні моменти будемо обчислювати за формулою:

(8.5)

Вибірка Х.

Скористаємось вже обрахованими раніше значеннями умовних варіант.

Отже нехай для вибірки Х: h = 0,8558, с = -0,0055. Тоді:

Таблиця №9

від

до

Yi

u

ni

niui2

niui2

niui3

niui4

ni(ui+1)4

-3

-2,1451

-2,5725

-3

1

-3

9

-27

81

16

-2,1451

-1,2892

-1,7172

-2

5

-10

20

-40

80

5

-1,2892

-0,4334

-0,8613

-1

12

-12

12

-12

12

0

-0,4334

0,4224

-0,0055

0

12

0

0

0

0

12

0,4224

1,2782

0,8503

1

15

15

15

15

15

240

1,2782

2,1341

1,7062

2

3

6

12

24

48

243

2,1341

2,99

2,5620

3

2

6

18

54

162

512

50

2

86

14

398

1028

Контрольна сума: Уniui4 +niui3 + 6Уniui2 + 4Уniui + n = 1028

де ni - сума частот і-го інтервалу, ui - умовні варіанти

Умовні моменти першого та другого порядків другої вибірки були знайдені раніше (розділ 2):

, .

Обрахуємо умовні моменти третього та четвертого порядків за формулою (8.5):

Знайдемо центральні емпіричні моменти третього та четвертого порядків за формулами (8.3) і (8.4):

=0,05

=4,2557

Знайдемо асиметрію і ексцес за формулами (8.1) і (8.2), вибіркові середні квадратичні знайдені раніше (розділ 2). Обраховуємо для вибірки X:

=0,03398

=-0,1753

Аналогічно працюємо і з вибіркою Y. Скористаємось вже обрахованими раніше значеннями умовних варіант та з таблиці №8. Отже для вибірки Y: h=0,4512

с=-0,0785

Таблиця №10

від

до

Yi

u

ni

niui2

niui2

niui3

niui4

ni(ui+1)4

-1,658

-1,2067

-1,4323

-3

2

-6

18

-54

162

32

-1,2067

-0,7554

-0,9810

-2

8

-16

32

-64

128

8

-0,7554

-0,3041

-0,5297

-1

9

-9

9

-9

9

0

-0,3041

0,1471

-0,0785

0

9

0

0

0

0

9

0,1471

0,59...


Подобные документы

  • Статистична оцінка динаміки абсолютних показників та структури прямих іноземних інвестицій в економіку України у 1995–2005 роках. Індексний аналіз та характеристики статистичних вибірок. Статистичні спостереження та характеристики статистичних вибірок.

    контрольная работа [2,1 M], добавлен 11.07.2010

  • Процес одержання висновків про генеральну сукупність на основі вивчення випадкових вибірок. Застосування методів статистичного виводу. Статистики та параметри. Точкове й інтервальне оцінювання параметрів генеральної сукупності. Приклади точкових оцінок.

    лекция [273,8 K], добавлен 09.10.2013

  • Розподіл регіонів за заготівлею ліквідної деревини, розрахунок середнього, модального та медіального значення, обчислення середнього, лінійного та квадратичного відхилення. Розрахунок ланцюгових і базисних показників, побудова відповідних графіків.

    контрольная работа [84,5 K], добавлен 26.02.2012

  • Порівняння двох дисперсій нормальних генеральних сукупностей, виправленої вибіркової дисперсії з гіпотетичною генеральною дисперсією нормальної сукупності, двох середніх нормальних генеральних сукупностей, дисперсії яких відомі (незалежні вибірки).

    реферат [87,1 K], добавлен 10.02.2011

  • Методи зведення і групування статистичних даних, розрахунок середньої кількості вантажних автомобілів для всієї сукупності. Аналіз показників варіації кількості вантажних автомобілів: розмах варіації, середнє квадратичне відхилення, загальна дисперсія.

    контрольная работа [457,5 K], добавлен 19.02.2010

  • Розрахунок інтервального ряду розподілу населення за обсягом виробництва цукрових буряків. Розрахунок статистичних показників: середня величина для всієї сукупності регіонів, мода, медіана, середнє лінійне та квадратичне відхилення, дисперсія, варіація.

    контрольная работа [145,1 K], добавлен 04.02.2011

  • Основні засоби як найважливіша частина національного багатства. Склад основних засобів, їх класифікація та види оцінки. Статистичний аналіз стану, використання, руху та динаміки основних засобів за допомогою абсолютних, відносних та середніх величин.

    курсовая работа [469,2 K], добавлен 16.10.2011

  • Нормативно-правове забезпечення статистичної звітності. Порядок складання її форм. Статистичний аналіз промислового виробництва на території Сумської області з використанням порівняльного, системного, монографічного та економіко-математичного методів.

    курсовая работа [274,6 K], добавлен 20.10.2011

  • Суть, значення, особливості та класифікація системи охорони здоров'я. Загальна характеристика та статистичний аналіз системи охорони здоров'я України. Прогнозування як важливий етап економічного дослідження тенденцій зміни кількості медичного персоналу.

    курсовая работа [640,3 K], добавлен 07.04.2015

  • Показники собівартості продукції тваринництва та методика їх визначення. Статистичний аналіз динаміки собівартості продукції тваринництва і факторів, що впливають на її рівень: структури витрат та впливу факторів на зміну собівартості продукції.

    курсовая работа [116,3 K], добавлен 02.04.2008

  • Абсолютні характеристики варіації, їх значення у дослідженні та способи обчислення. Середні величини як узагальнюючі показники. Середнє лінійне відхилення в статистичній практиці. Система вартісних показників обсягу продукції. Коливання окремих значень.

    контрольная работа [73,8 K], добавлен 26.01.2013

  • Загальне поняття статистичної дисперсії як базового інструмента для статистичної оцінки варіації розподілу, її розрахунок. Формулювання основного правила складання дисперсій. Вирішення деяких статичних задач з використанням рядів динаміки та дисперсії.

    контрольная работа [174,3 K], добавлен 03.06.2009

  • Предмет, завдання і система показників статистики ефективності виробництва зернових і зернобобових культур. Статистична оцінка варіації та аналіз форми розподілу. Статистичні методи вивчення взаємозв’язків у виробництві. Кореляційно-регресійний аналіз.

    курсовая работа [732,8 K], добавлен 19.11.2014

  • Питома вага населення віком старше 65 років у країнах – членах ЄС. Визначення дисперсії, середнєквадратичного відхилення та коефіцієнту варіації за даними Національного банку України про групування комерційних банків за розміром статутного капіталу.

    контрольная работа [104,3 K], добавлен 29.04.2010

  • Методологічні основи статистичного аналізу зовнішньої торгівлі. Інформаційне забезпечення і оцінка її збалансованості. Аналіз міжнародних торгових взаємовідносин і експортного потенціалу України. Торгово-економічна співпраця України з Німеччиною.

    курсовая работа [684,1 K], добавлен 02.11.2011

  • Методи статистичного аналізу стану діяльності сільськогосподарських підприємств. Визначення граничних помилок вибірки для середнього розміру площі посіву. Розрахунок динаміки середньомісячної номінальної заробітної плати, середнього абсолютного приросту.

    контрольная работа [115,0 K], добавлен 23.05.2014

  • Статистичний аналіз рівня та динаміки інвестиційної діяльності. Виявлення динаміки та тенденцій інвестиційної діяльності, аналіз взаємозв’язків та вивчення факторів впливу. Застосування методу аналітичних групувань, особливості дисперсійного аналізу.

    контрольная работа [89,2 K], добавлен 07.04.2010

  • Статистичне спостереження. Статистична оцінка продуктивності корів та чинників, що на неї впливають. Види статистичних групувань. Аналіз рядів розподілу. Кореляційний аналіз продуктивності корів. Особливості рангової, простої, множинної кореляції.

    курсовая работа [508,1 K], добавлен 14.04.2016

  • Обчислення розміру середніх залишків напівфабрикатів. Розмахування граничної похибки для середньої величини урожайності. Знаходження дисперсії, середнє квадратичного відхилення та коефіцієнту варіації. Обчислення середньої урожайності зернових з 1 га.

    задача [32,0 K], добавлен 02.02.2010

  • Порівняння середніх значень факторних та результативної ознак. Статевий склад населення в Україні та розподілення у вигляді векторних діаграм. Відносні показники інтенсивності та розрахунки середньої величини і середнього квадратичного відхилення.

    контрольная работа [429,6 K], добавлен 26.04.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.