Ідентифікація та моделювання об’єктів автоматизації

Варіаційний (статистичний) ряд вибірки. Арифметичне спостережених значень випадкової величини. Характеристики дискретного групованого розподілу. Середньоквадратичне відхилення розподілу. Перевірка статистичної гіпотези за критерієм згоди Пірсона.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык украинский
Дата добавления 27.05.2016
Размер файла 876,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ

АКАДЕМІЯ МУНІЦИПАЛЬНОГО УПРАВЛІННЯ

Кафедра автоматизованого управління технологічними процесами

Розрахунково-графічна робота

«Ідентифікація та моделювання об'єктів автоматизації»

Виконала:

студентка групи АІ-31

Перевірив:

Голдаєвич Є.Л.

Київ 201

Завдання №1

Дана вибірка експериментальних даних, об'єм якої n становить 2 (табл. 1.1). Результати експерименту згруповані в 10 інтервалів, довжина кожного з них становить 2.

Необхідно: перевірити експериментальні дані на відповідність нормальному закону розподілу за допомогою трьох критеріїв згоди:

? спрощеного критерію - методом моментів (через вибіркові значення асиметрії та ексцесу) на основі розрахунку статистичних характеристик;

? критерію Колмогорова;

? критерію Пірсона.

Проміжні результати розрахунків звести до табл. 1 і побудувати гістограму вибірки, а, також, полігон частот.

Табл. 1

x

nі

nіxі

піхі2

піхі3

піхі4

5032

2

5034

6

5036

5

5038

19

5040

87

5042

63

5044

15

5046

7

5048

4

5050

2

Сума

n=200

Розв'язок:

В нашій задачі ми величину Х розглянемо як неперервну випадкову величину, функція розподілу - невідома і описується формулою F(x)=P(X<x)

Емпірична функція розподілу - Fn(x)=l/n, де n - об'єм вибірки, аl - число значень Х у вибірці, менших за x.

1. Перевірка експериментальних даних методом моментів (через вибіркові значення асиметрії та ексцесу)

Для початку дамо означення відносної частоти події -- це відношення тих спроб, у яких відбулася подія, до всіх спроб у серії випробувань.

x1 , x2 … хп , хі, - елементи вибірки об'єму n зустрічається пі разів, а число пі - частота елементу хі , а відношення - відносна частота елементу хі

,a, n-об'єми вибірки

Варіаційний (статистичний) ряд вибірки для даної задачі- перший і другий стовбець таблиці.

Нехай Х - безперервна випадкова величина з невідомою густиною ймовірності р(х). Для оцінки р(х) за вибіркою (xl , x2 … хп), розіб'ємо область значень Х на l інтервалів (груп) довжини hі і=. Позначимо через і середини інтервалів, а через nі - число елементів вибірки, що потрапили у вказаний інтервал - і-у групу. Тоді р(і)~ - оцінка густини ймовірності в точці і. Побудуємо гістограму вибірки, яка буде апроксимувати графік невідомої функції р(х).

Результати проміжних розрахунків зведемо до таблиці 1.2 і побудуємо гістограму вибірки за вихідними експериментальними даними, що наведені в таблиці.

Табл. 1.2

l

x1

n1

nіxl

nіxl2

nіxl3

nіxl4

1

5032

2

0,01

10064

50642048

254830785536

1282308512817150

2

5034

6

0,03

30204

152046936

765404275824

3853045124498020

3

5036

5

0,02

25180

126806480

638597433280

3215976673998080

4

5038

19

0,09

95722

482247436

2429562582568

12240136290977600

5

5040

87

0,41

438480

2209939200

11138093568000

56135991582720000

6

5042

63

0,30

317646

1601571132

8075121647544

40714763346916800

7

5044

15

0,07

75660

381629040

1924936877760

9709381611421440

8

5046

7

0,03

35322

178234812

899372861352

4538235458382190

9

5048

4

0,02

20192

101929216

514538682368

2597391268593660

10

5050

2

0,01

10100

51005000

257575250000

1300755012500000

k=10

Сума

?

і

n=210

1

1058570

5336051300

26901059623410

135608241561610000

Визначимо:

-вибіркові початкові -перший центральний момент

-центральні- другий центральний момент

-моменти порядку v

(1.1a)

(1.1b)

При v=1 з (1.1a)

(1.1c)

і являє собою середнє арифметичне спостережених значень випадкової величини Х, що має назву «вибіркова середнє».

При v=2 з (1.1b)

(1.1)

що являє собою вибіркову дисперсію, а ?= - вибіркове середньоквадратичне відхилення.

Рис. 1.1. Гістограма вибірки

Потрібно знати не характеристики дискретного групованого розподілу Fn(x), а характеристики бv і мv істинного неперервного розподілуF(x).

При певних умовах наближені значення моментів бvі мv можна отримати додаючи деякі правки до моментів vі v, що носять назву поправок Шеппарда. Загальна формула для поправок Шеппарда має вигляд:

(1.2)

де, - число Бернуллі, що визначаються з рекурентного співвідношення

=1,

для m?2,де, - біномальні коефіцієнти ().

Для перших чотирьох початкових моментів з (1.2) маємо:

б1=1, (1.2a)

б2=2 - (1.2b)

б3=3 - (1.2c)

б4=4 - (1.2d)

Для центральних моментів маємо:

(1.3a)

(1.3b)

(1.3c)

(1.3d)

На основі центрального моменту третього порядку можна побудувати показник, що характеризує міру асиметричності розподілу:

= , (1.4)

у= - середньоквадратичне відхилення розподілу. називають коефіцієнтом асиметрії, якщо:

то асиметрія є правостороння (->0, де - мода розподілу, тобто значення ознаки з найбільшою частотою).

, асиметрія лівостороння і -<0. Коли =0, і тоді =.

Для характеристики гостровершинності або плосковершинності розподілу служить четвертий центральний момент. Ці властивості розподілуoписуються за допомогою ексцесу випадкової величини

. (1.5)

Для нормального розподілу ексцес дорівнює нулю; криві, більш гостро вершинні в порівнянні з нормальною, мають позитивний ексцес; криві більш плоско вершинні - мають негативний ексцес.

За значенням показників асиметрії і ексцесу емпіричного розподілу можна судити про близькість цього розподілу до нормального, знаючи дисперсії коефіцієнтів асиметрії і ексцесу . Для цього потрібно оцінити значущість відмінності |Аs| і |Ех| від нуля. Якщо:

s| ?3уas,|Ех|?5уex

=(1.6)

(1.6a)

Цей розподіл можна вважати нормальним.

Розрахуємо статистичні характеристики, використовуючи проміжні розрахунки з табл.1.2.

Визначимо вибіркове середнє згідно (1.1с):

(1.7a)

Центральний момент другого порядку , згідно (1.1d):

Згідно (1.3b) дисперсія :

(1.7b)

Згідно (1.3с) дорівнює:

Згідно (1.1b) центральний момент четвертого порядку дорівнює:

За (1.3d) знаходимо :

(1.8)

Знайдемо коефіцієнт асиметрії розподілу відповідно до (1.4):

(1.9)

Тобто асиметрія є правосторонньою.

Знайдемо величину ексцесу відповідно до (1.5):

(1.10)

крива розподілу є більш гостро вершинною в порівнянні з нормальною кривою.

З (1.6а) розраховуємо і :

3(1.11a)

5=1,63. (1.11b)

Підставляючи значення і з (1.90) - (1.11) в (1.6) знаходимо, що відмінність коефіцієнта асиметрії від нуля в рамках зазначеного критерію дуже велика, тобто нерівність для || , яка має вигляд ||=>> 0,501незадовольняється, відмінність коефіцієнта ексцесу, а саме || від нуля значна і задовольняється протилежна нерівність: || = >>1,63 ,що свідчить про те, що емпіричний розподіл не є нормальним.

ВИСНОВОК

Оскільки умови значущості статистичних характеристик критерію для заданої вибіркової сукупності не виконується, то даний критерій не відповідає нормальному розподілу.

ІІ. Перевірка статистичної гіпотези на відповідність експериментальних даних нормальному закону розподілу за критерієм Колмогорова.

Критерій л Колмогорова - Смирнова призначений для співставлення двох розподілів: емпіричного розподілу ознаки з теоретичним (рівномірним чи нормальним) або двох емпіричних розподілів. Критерій дозволяє знайти точку, у якій сума накопичених розходжень між двома розподілами є найбільшою, і оцінити достовірність цього розходження. Під час розрахункової процедури співставляються спочатку частоти за першим розрядом (рівнем), потім за сумою першого і другого розрядів, далі за сумою першого, другого та третього розрядів і т. д. Таким чином, кожен раз проводиться співставлення накопичених до даного розряду частот. Якщо розбіжності між двома розподілами суттєві, то в деякий момент різниця накопичених частот досягне критичного значення, і тоді можна визнати розбіжності достовірними. У формулу критерію л включається ця різниця. Чим більше емпіричне значення л, тим більш істотні розбіжності. Статистичні гіпотези при цьому будуються таким чином. Основна (Н0 ). Розбіжності між двома розподілами недостовірні (судячи з точки максимального накопиченого розходження між ними). Конкуруюча (Н1 ). Розбіжності між двома розподілами достовірні (судячи з точки максимального накопиченого розходження між ними). Попри досить просту розрахункову процедуру та універсальність зазначений критерій має декілька обмежень:

1. Критерій вимагає, щоб вибірка була достатньо великою. При спів- ставленні двох емпіричних розподілів необхідно, щоб n1,2 ? 50. Порівняння емпіричного розподілу з теоретичним іноді допускається при n ? 5

2. Розряди (рівні) повинні бути впорядковані за наростанням або спа- данням якої-небудь ознаки. Вони обов'язково повинні відображати будь-яку односпрямовану його зміну. Таким чином, не можна накопичувати частоти (частості) за розрядами, які відрізняються лише якісно і не являють собою шкали порядку.

3. Кількість розрядів ознаки повинна перевищувати 3 розряди.

Алгоритм застосування критерію Колмогорова виглядає таким чином:

1. Записуються варіаційні ряди емпіричної і контрольної (теоретичної) вибірок.

2. Обчислюються відносні частоти і для двох наявних вибірок.

3. Записуються модулі різниць d1=|| і шукається найбільший dmax.

4. Визначається емпіричне значення критерію лемп за допомогою формули лемп=dmax? . (1.12)

5. Визначається критичне значення критерію для заданого рівня значущості б , яке порівнюється з лемп>, то Н0 відхиляється на заданому рівні значущості б.

Рівень значущості а - це ймовірність того, що помилково буде відхилена висунута гіпотеза Н0. В статистиці користуються трьома рівнями а:

§ б= 0,1 (в 10 випадках зі 100 може бути відхилена правильна гіпотеза);

§ б= 0,05 (в 5 випадках зі 100 може бути відхилена правильна гіпотеза);

§ б = 0,01 (в 1 випадку зі 100 може бути відхилена правильна гіпотеза).

Для перевірки розподілу на предмет відповідності нормальному закону розподілу обчислюють середнє значення і середньоквадратичне відхилення у, а потім обчислюють відності теоретичні частоти за наступною формулою:

(1.13)

- абсолютна теоретична частота, ; -крок (ширина інтервалу даних ознаки, згрупованих в і-у групу з серединою в точці ), , ц(u)=.

Обчислимо значення контрольних величин = на підставі (1.13) і внесемо результати обчислень в розрахункову табл.1.3. Значення для і у беремо з (1.7a) - (1.7b): ; у=1,624; hі= h= 2; = 0,8058 .

Табл. 1.3

і

xі

uі

ці

fі теор

fі емп

| fі теор - fі емп |

1

5032

-5,42

0,00074

0,0006

0,01

0,0094

2

5034

-4,19

0,00935

0,00754

0,03

0,0225

3

5036

-2,96

0,06149

0,04955

0,02

0,0296

4

5038

-1,73

0,21114

0,17014

0,09

0,0801

5

5040

-0,5

0,37875

0,3052

0,41

0,1048

6

5042

0,73

0,35493

0,28601

0,3

0,0140

7

5044

1,96

0,17376

0,14002

0,07

0,0700

8

5046

3,2

0,04444

0,03581

0,03

0,0058

9

5048

4,43

0,00594

0,00478

0,02

0,0152

10

5050

5,66

0,00041

0,00033

0,01

0,0097

З табл. 1.3 видно, що dmax= 0,1048 при і = 5. Оскільки п = 210, то згідно (1.12)

лемп=0,1048? = 1,5187. (1.14)

Перевагою критерію Колмогорова є те, що для вибірок об'ємом n> 35критичні значення можна визначити не по таблицях, а розрахувати по асимптотичній формулі [5]:

(1.15)

де б - рівень значущості.

Для б = 0,1; 0,05; 0,01 з (1.15) маємо відповідно:

; ; ; (1.15a)

а , отже, порівнюючи (1.15) з (1.15а), знаходимо

; ; ; (1.15b)

Порівнюючи значення лемп з (1.14) зі значеннями з (1.15b) бачимо,

що задовольняється нерівність

лемп> (1.16)

для кожного з заданих рівнів значущості а . Це означає , що гіпотеза Н0 відхиляється.

Оскільки задовольняється нерівність (1.16) для заданої вибіркової сукупності, то гіпотезу слід відкинути.

ІІІ. Перевірка статистичної гіпотези за критерієм згоди Пірсона (критерій).

Значення критерію розраховують [1] за формулою:

де - спостережувана абсолютна частота і-тої групи; - теоретична частота попадання даних в і-й інтервал для вибраного розподілу; n - об'єм вибірки, k - число груп, на які розбито розподіл.

Для розподілу складені таблиці, де вказано критичне значення критерію згоди для вибраного рівня значущості б і ступенів свободи v . Число ступенів свободи v визначається як число груп в емпіричному ряді розподілу мінус число зв'язків. Число ступенів свободи v=k - r - 1, де r- число параметрів моделі розподілу, що використовуються для розрахунку теоретичних частот. Зокрема, при розрахунку параметрів моделі за інтервальним варіаційним рядом число ступенів свободи v беруть рівним k - 2 для біноміального і k - 3 - для нормального розподілу, оскільки в останньому випадку використовуються r = 2 параметри :і у.

Алгоритм застосування критерію виглядає наступним чином.

1. Записують частоти по kінтервалам.

2. Перевіряють рівність

вибірка дискретний критерій розподіл

3. Обчислюють значення

4. Знаходять

5.

6. Знаходять по таблиці критичних точок розподілу

7. Якщо , то приймається гіпотеза Н0 .

Розраховуємо значення , , і підставляємо їх в табл.1.4. Значення розраховуємо за допомогою (1.13) і значень з табл. 1.3.

За таблицею критичних точок розподілу [1] по рівнях значущості б = 0,01; 0,05; 0,1 і числу ступенів свободи v = k - 3 = 10 - 3 = 7знаходимо відповідні критичні точки (див. Додаток 1):

.

Порівнюючи ці значення зі значенням з табл. 1.4 бачимо, що задовольняється нерівність , а це означає, що приймається альтернатива до Н0 гіпотеза про несхожість заданого емпіричного розподілу з нормальним.

Табл. 1.4

і

xі

uі

ці

nі

(nі-)2

1

5032

-5,42

0,00074

0,1198

2

3,535

29,509

2

5034

-4,19

0,00935

1,5074

6

20,183

13,390

3

5036

-2,96

0,06149

9,9092

5

24,100

2,432

4

5038

-1,73

0,21114

34,027

19

225,811

6,636

5

5040

-0,50

0,37875

61,0396

87

673,942

11,041

6

5042

0,73

0,35493

57,2012

63

33,626

0,588

7

5044

1,96

0,17376

28,003

15

169,078

6,038

8

5046

3,20

0,04444

7,1616

7

0,026

0,004

9

5048

4,43

0,00594

0,9568

4

9,261

9,679

10

5050

5,66

0,00041

0,0828

2

3,676

44,392

Оскільки не задовольняється нерівність для заданої вибіркової сукупності, то гіпотезу слід відкинути.

Завдання №2

Визначити коефіцієнти зв'язку k1, xp вхідного X та вихідного Yсигналів фазово-часового дискримінатора, що є складовою системи автоматичного супроводу цілі по дальності, якщо відомо, що дискримінаційна характеристика пристрою апроксимується фінітною функцією y(x)кусково-лінійнійного типу:

де - значення розугодження керуючого сигналу, при якому вихідна напруга дискримінатора Y=0. Ідентифікацію параметрів лінійної математичної моделі статистичного об'єкта провести:

1) регресійним методом найменших квадратів;

2) з використанням центрованих даних.

Обраховану функціональну залежність зобразити на координатній площині (х,у).

Вихідні експериментальні дані:

Х= {1; 2; 3; 4; 5}; Y={1.25; 2.5; 2.75; 3.5; 4.25}.

Розв'язок :

X таY - є кінцеві множини експериментальних значень вхідних (факторних) величин

1. Математична модель функціонального зв'язку між вхідними і вихідними змінними задається у вигляді рівняння регресії

,

При регресійних методах ідентифікації в якості найбільш часто застосовуються степеневі поліноми:

. (2.4)

Задача ідентифікації полягає у знаходження таких оцінок невідомих параметрів аі, при яких задана рівнянням (2.4) аналітична залежність буде найкращим чином апроксимувати експериментальні дані.

В якості критерію близькості використовується мінімум квадратичної нев'язки J значень фактичних змінних уі і модельних уMі , що розраховані за рівнянням регресії (2.4):

(2.5)

де - експериментальне значення вихідної змінної, - відповідне модельне значення.

Для обрахунку коефіцієнтів регресії складають рівняння на знаходження екстремума по кожному параметру :

(2.6)

Сукупність співвідношень (2.5) утворює систему з т+1 рівняння відносно оцінок коефіцієнтів рівняння регресії (2.4). В нашому випадку, коли рівняння регресії має вигляд (2.2), критерій мінімуму середньоквадратичної похибки визначається функціоналом:

(2.7)

З (2.7) відповідно до (2.6) отримуємо систему нормальних рівнянь:

(2.8)

Для визначення коефіцієнтів системи (2.8) складаємо таблицю 2.1:

Табл. 2.1

1

1,25

1

1,25

2

2,5

4

5

3

2,75

9

8,25

4

3,5

16

14

5

4,25

25

21,25

звідки:

(2.9)

Розв'язуючи систему (2.9), знаходимо параметри моделі. З першого рівняння системи знаходимо

(2.10)

Підставляючи вираз (2.10) для в друге рівняння системи (2.9), маємо рівняння для знаходження :

15 (2,85 - 3) + 55 = 49,75 (2.11)

З (2.11) знаходимо :

10 = 7, або = 0,7. (2.12)

Отже, наша лінійна регресійна модель має вигляд:

. (2.13)

2)Центрованою називається випадкова величина х , математичне очікування якої M[x] дорівнює нулю. Випадкові величини центрують, віднімаючи від них математичне очікування або його незміщену оцінку.

Якщо в заданих статистичних спостереженнях нема систематичної похибки (змішення, тренду), то в цьому випадку задовольняється рівність , де і - вибіркові середні, а - коефіцієнт регресії.

Оцінка коефіцієнта регресії рівняння лінійної регресії знаходиться за формулами:

(2.14)

де ,(- коефіцієнт кореляції).

. (2.15)

Розрахуємо модель з використанням центрованих даних. Для цього обчислимо коефіцієнт кореляції між XіY через коваріацію цих двох вибірок, що є мірою їхньої лінійної залежності:

, (2.16)

де - вибіркові дисперсії вибірок XіY відповідно - див. (1.1d).

Обраховуємо середні вибіркові

Підставляючи знайдені значення статистичних характеристик в (2.14) знаходимо :

(2.17)

а з (2.15) з врахуванням (2.17) знаходимо, що , що співпадає з (2.13).

Обрахована лінійна регресійна модель і початкові емпіричні дані зображені на рис. 2.1.

Рис. 2.1. Регресійна модель і емпірична залежність

Завдання №3

Використовуючи критерії типу Граббса, перевірити наступну експериментальну вибірку даних (Х) на наявність аномальних членів:

=3,68; =5,08; =2,81; =4,43; =3,11; =2,95; =4,65; =3,43; =4,76; =8.22; =3,27; =3,26; =2,75; =3,78; =4,08; =2,48; =4,15;=4,51; =4,84.

Розв'язок :

Для статистичного аналізу даних на наявність викидів і ідентифікації викидів застосовують критерії Кохрена і Граббса.

Для перевірки спостережень на викид застосовують прості критерії Граббса. Критерії використовуються для перевірки на аномальність спостережень, що належать вибіркам з нормальної генеральної сукупності. Статистики критерію Граббса передбачають можливість перевірки на наявність у вибірці або одного аномального спостереження (найменшого або найбільшого), або двох (двох найменших у вибірці або двох найбільших).

Критерій Граббса перевірки на один викид.

Нехай , , … , - спостережувана вибірка, - побудований по ній варіаційний ряд. Гіпотеза Н0 , що перевіряється, полягає в тому, що усі , , … , належать одній генеральній сукупності. При перевірці на викид найбільшого вибіркового значення конкуруюча гіпотеза Н1 полягає в тому, що належать одному закону, а деякому іншому, істотно зрушеному вправо. При перевірці на викид статистика критерію Граббса має вигляд

, (3.1)

Де

, (3.2)

. (3.3)

При перевірці на викид найменшого вибіркового значення конкуруюча гіпотеза Н1 припускає, що належить деякому іншому закону, істотно зрушеному вліво. В даному випадку обчислювана статистика набирає вигляду

, (3.4)

Максимальне або мінімальне спостереження вважається викидом, якщо значення відповідної статистики перевищить критичне :

, (3.5)

де п - об'єм вибірки, б - рівень значущості, що задається.

Критичні значення можна взяти з таблиць, що наведені в стандарті ІSO5725-2: «Точність (правильність і прецизійність) методів і результатів вимірювань. Частина 2.». але в таблиці процентних точок , що наведена в стандарті ІSO5725-2 (табл.5), невірно вказані рівні значущості а. Тому слід користуватися скорегованою таблицею, наведеною в Додатку 2.

Побудуємо за спостережуваною вибіркою варіаційний ряд, тобто проведемо ранжирування експериментальної вибірки з порядку збільшення її членів:

=2,48; 2,75; =2,81;=2,95; 3,11; =3,26;3,27; =3,43; 3,68; =3,78; 4,08; =4,15;4,43; =4,49; 4,51; =4,65; 4,76; =4,84; 5,08; =8,22.

Перевіримо найменший =2,48 і найбільший =8,22 члени варіаційного ряду на викид, тобто на задоволення критерію Граббса (3.5). Для цього обрахуємо середнє вибіркове і середнє квадратичне відхилення s:

Підставив знайдені значення , s, а також і в (3.1), (3.4), знаходимо:

. (3.6)

Для рівнів значущості виберемо найбільш вживані значення:

б1 =0,01; б2=0,05; б3=0,1.

По таблиці з Додатку 2 знаходимо критичні значення для

б1 =0,01; б2=0,05; б3=0,1:

(0,01;20)=2,884; (0,05;20)=2,557;(0,1;20)=2,385 . (3.7)

Порівнюючи (3.6) з (3.7) робимо висновок, що для рівнів значущості

б1 =0,01 і б2=0,05 обидва члени варіаційного ряду - і не є викидами, в той час як для б3=0,1 нульова гіпотеза про належність до генеральної сукупності не справджується, тобто на цьому рівні значущості є викидом.

ВИСНОВОК

Для рівнів значущостіб1 =0,01 і б2=0,05б3=0,1перший член варіаційного ряду - =2,48 , що є найменшим членом емпіричної сукупності даних, не є викидом оскільки , тоді як) для =8,22критерій Граббсане виконується, тобто , що свідчить про те, що дана вибірка не належить до генеральної сукупності і найбільший член вибірки на вказаному рівні значущості можна вважати викидом.

Завдання №4

Провести ідентифікацію параметрів поліноміальної математичної регресії, яка задана рівнянням параболи другого ступеня вигляду Y=a0+a1X+a2X2що є аналітичним наближенням вибірки експериментальних даних, які наведені в табл.4.1, і оцінити значущість кожного зі знайдених коефіцієнтів, а, також, робото здатність заданої регресійної моделі за критерієм Фішера.

На координатній площині (Х,Y) нанести дані з табл.4.1 і побудувати графік знайденої параболи в діапазоні експериментальних значень Х.

X

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

Y

10

16

20

23

25

26

30

36

48

62

78

94

107

118

127

Розв'язок:

Регремсія -- форма зв'язку між випадковими величинами. В задачі апроксимація дослідних даних відбувається квадратичним поліномом.

. (4.1)

Ідентифікацію статистичного об'єкта проведемо регресійним методом найменших квадрантів. Критерій мінімума середньоквадратичної похибки в цьому випадку визначається функціоналом

, (4.2)

що повинен задовольняти рівнянням (2.6), які визначають умови знаходження екстремума для (4.2).

(4.3)

Після нескладних перетворень в (4.3), отримуємо систему нормальних рівнянь:

(4.4)

Подамо систему (4.4) в матричному вигляді: , де

- квадратна матриця 3х3;

-вектор-стовбець шуканих коефіцієнтів аі ( і = ) рівняння регресії (4.1);

-вектор-стовбецьвільних коефіцієнтів системи рівнянь (4.4).

Система лінійних рівнянь (4.4) відносно шуканих компонентів вектора може бути розв'язана будь-яким з трьох методів:

1. за допомогою правила Крамера;

2. методом оберненої матриці;

3. методом Гауса (метод виключення невідомих).

Перші два підходи можна застосувати тільки в тих випадках, коли матриця А є не виродженою, тобто коли її визначник - головний визначник Д системи - відмінний від нуля.

Табл. 4.2

1

1

1

1

10

10

10

2

4

8

16

16

32

64

3

9

27

81

20

60

180

4

16

64

256

26

92

368

5

25

125

625

25

125

625

6

36

216

1296

26

156

936

7

49

343

2401

30

210

1470

8

64

512

4096

36

288

2304

9

81

729

6561

48

432

3888

10

100

1000

10000

62

620

6200

11

121

1331

14641

78

858

9438

12

144

1728

20736

94

1128

13536

13

169

2197

28561

107

1391

18083

14

196

2744

38416

118

1652

23128

15

225

3375

50625

127

1905

28575

1240

14400

178312

820

8959

108805

Матриця А є не виродженою,розв'яжемо рівняння методом оберненої матриці. Застосуємо для вирішення цієї задачі апарат Mathcad.

Отриманий вектор стовбець коефіцієнтів регресії

Підставляючи знайдені значення в (4.1) знаходимо, що регресійна модель експериментальних даних, заданих таблицею 4.1 , має вигляд:

ум=15,07-1,65х+0,64х2. (4.8)

Для перевірки значущості отриманого рівняння регресії визначимо статистику Фішера - F-статистику, - тобто характеристику точності рівняння регресії, що є відношенням частини дисперсії залежної змінної, яка пояснена (обрахована)рівнянням регресії, до непоясненої (залишкової) частини дисперсії цієї ж змінної, яка обумовлена відсутністю інформації про всі точки генеральної сукупності:

, (4.9)

де - об'єм вибірки, - число незалежних параметрів при факторних змінних в рівнянні регресії (в нашому випадку це коефіцієнти при х і х2 ) . Залишкова дисперсія - це частина дисперсії залежної змінної у , яка не пояснена рівнянням регресії, її наявність є наслідком дії випадкової складової. У нашому випадку (4.8) т = 2, оскільки х2 можна вважати другою незалежною змінною.

Для вибраного рівня значущості б по розподілу Фішера визначається табличне значення , ймовірність перевищення якого у вибірці об'єму п , отриманої з генеральної сукупності без зв'язку між змінними, не перевищує рівня значущості б , і далі порівнюється з фактичним значеннямF - статистики (4.9) для регресійного рівняння (в нашому випадку це (4.8)).

Якщо виконується умова , то встановлений по вибірці функціональний зв'язок між змінними у і х є і в генеральній сукупності , тобто регресійна модель вважається працездатною.

Якщо ж виявляється, що рівняння , то існує реальна ймовірність того, що по вибірці встановлений не існуючий в реальності зв'язок між змінними.

Знайдемо значення F-статистики з (4.9) для нашого випадку, коли n = 15, т = 2; ; при для (4.8). Для цього складемо табл. 4.3.

Табл. 4.3

1

10

14,06

-40,61

-4,06

1649,17

16,48

2

16

14,33

-40,34

1,67

1627,32

2,79

3

20

15,88

-38,79

4,12

1504,66

16,97

4

23

18,71

-35,96

4,29

1293,12

18,40

5

25

22,82

-31,85

2,18

1014,42

4,75

6

26

28,21

-26,46

-2,21

700,13

4,88

7

30

34,88

-19,79

-4,88

391,64

23,81

8

36

42,83

-11,84

-6,83

140,19

46,65

9

48

52,06

-2,61

-4,06

6,81

16,48

10

62

62,57

7,9

-0,57

62,41

0,32

11

78

74,36

19,69

3,64

387,70

13,25

12

94

87,43

32,76

6,57

1073,22

43,16

13

107

101,78

47,11

5,22

2219,35

27,25

14

118

117,41

62,74

0,59

3936,31

0,35

15

127

134,32

79,65

-7,32

6344,12

53,58

820

22350,57

289,12

За таблицями значень критерію Фішера (Додаток 3) для п = 15, т = 2, б = 0,05 знаходимо, що

(4.10)

Підставляючи значення з табл.4.3 в (4.9), розраховуємо статистику Фішера F:

- модель є працездатною.

Взагалі вважається, що для отримання статистично значущих рівнянь регресії необхідно, щоб задовольнялась умова: .В нашому випадку це виконується, оскільки 15 6?2=12.

Після того, як виконана перевірка статистичної значущості регресійного рівняння в цілому корисно здійснити перевірку на статистичну значущість отриманих коефіцієнтів регресії. Ідеологія перевірки така ж, як і при перевірці рівняння в цілому, але як критерій використовується t-критерій Стьюдента. Перевіряється нульова гіпотеза Н0 : коефіцієнт аі є незначущим, тобто аі=0.

Будемо вважати, що модель (4.1) є двомірною, ввівши для цього нову лінійну факторну змінну х2 = х2. Для цього обраховуємо значення критерію Ст'юдента для коефіцієнтів ; розраховуємо за формулами:

; ,… (4.11)

де - статистична дисперсія і-ї факторної ознаки (незалежної змінної); Rі - коефіцієнт множинної кореляції, що виражається через інформаційну матрицю Фішера М: - залишкова дисперсія. Для нашого випадку можна вважати, що . Знайдемо і :

; . (4.12)

Підставляючи (4.12) в (4.11) , знаходимо:

;

; (4.13)

.

Отримані фактичні значення критерію Стьюдента порівнюються з табличними значеннями критичних точок tб, n-m-1, отриманими з розподілу Стьюдента. Якщо виявляється , що , то відповідний коефіцієнт статистично значущий і приймається альтернатива до Н0 гіпотеза, в протилежному випадку - ні. Для б = 0,05 і п-т-1=12 знаходимо табличне значення критерію Стьюдента:

. (4.14)

Порівнюючи (4.14) з (4.13), приходимо до висновку, що ( і = ), а отже всі коефіцієнти регресійної моделі статистично значущі і приймається альтернатива до Н0 гіпотеза.

Як експрес-метод оцінки значущості коефіцієнтів рівняння регресії можна застосовувати наступне правило: якщо фактичне значення критерію Стьюдента більше 3, то такий коефіцієнт, як правило, виявляється статистично значущим.

На рис. 4.1 відображено обраховану квадратичну регресійну модель і початкові емпіричні дані на координатній площині XОY.

ВИСНОВОК

Для регресійної моделі , що описується квадратичною функціональною залежністю типу yn= a0+ a1x + a2x2, методом найменших квадратів розраховані коефіцієнти профакторних змінних і за допомогою t-критерію Стьюдента доказана їхня значущість. Для перевірки значущості отриманого рівняння регресії розраховано статистику Фішера - F - статистику для рівняння значущості а = 0,05 і доказана працездатність запропонованої регресійної моделі.

Рис. 4.1. Регресійна модель і емпірична залежність

ВИКОРИСТАНА ЛІТЕРАТУРА

1. Секей Г. Парадоксы в теории вероятности и математической статистике / Г. Се- кей. - М. : Мир, 1990. - 235 с.

2. Сидоренко Е. В. Методы математической обработки в психологии / Е. В. Сидо- ренко. - СПб : Речь, 2000. - 350 с.

3. В.Н. Киричков. Идентификация объектов систем управления 4. технологическими процессами //К. «Вища школа», 1990, 263 с.

4. Д. Гроп. Методы идентификации систем // М. ''Мир'', 1979, 302с.

5. А. Уорсинг, Дж. Геффнер. Методы обработки экспериментальных данных

6. Н.Дрейпер, Г.Смит. Прикладной регрессионный анализ // М. Статистика,

1973.- 392с.

7. Крамер Г. Математические методы статистики/ Пер.с англ. под. ред. акад. Н.Колмогорова.- 2-е изд., стереотипное.- М.: Мир, 1975.- 648с.

8. Бахрушин В.Є. Методи аналізу даних. - Запоріжжя: КПУ, 2011. -268с.

9. Орлов А.И. Прикладная статистика. - М.: Экзамен, 2006. - 672 с.

10. Боровков А.А. Математическая статистика. Оценка параметров. Проверка гипотез. - М.: Наука, 1984. - 472 с.

11. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики.- 3-е изд.-М.: Наука, 1983.- 416с

ДОДАТОК 1

РОЗПОДІЛ

100б- відсоткове значення величини ч2 з vступенями свободи визначається таким чином, щоб для спостереженого значення ч2 ймовірність Р перевищити дорівнювала

(б; v) як функція від б і v

v\a

0,99

0,98

0,95

0,9

0,8

0,7

0,5

0,3

0,2

0,1

0,05

0,02

0,01

0,001

1

0,000

0,001

0,004

0,016

0,064

0,148

0,455

1,074

1,642

2,706

3,841

5,412

6,635

10,827

2

0,020

0,040

0,103

0,211

0,446

0,713

1,386

2,408

3,219

4,605

5,991

7,824

9,210

13,815

3

0,115

0,185

0,352

0,584

1,005

1,424

2,366

3,665

4,642

6,251

7,815

9,837

11,341

16,268

4

0,297

0,429

0,711

1,064

1,649

2,195

3,357

4,878

5,989

7,779

9,488

11,668

13,277

18,465

5

0,554

0,752

1,145

1,610

2,343

3,000

4,351

6,064

7,289

9,236

11,070

13,388

15,086

20,517

6

0,872

1,134

1,635

2,204

3,070

3,828

5,348

7,231

8,558

10,645

12,592

15,033

16,812

22,457

7

1,239

1,564

2,167

2,833

3,822

4,671

6,346

8,38

9,803

12,017

14,067

16,622

18,475

24,322

8

1,646

2,032

2,733

3,490

4,594

5,527

7,344

9,524

11,030

13,362

15,907

18,168

20,090

26,125

9

2,088

2,532

3,325

4,168

5,380

6,393

8,343

10,656

12,242

14,684

16,919

19,679

21,666

27,877

10

2,558

3,059

3,940

4,865

6,179

7,767

9,342

11,781

13,442

15,987

18,307

21,161

23,209

29,588

11

3,053

3,609

4,575

5,578

6,989

8,148

10,341

12,899

14,631

17,275

19,675

22,618

24,725

31,264

12

3,571

4,178

5,226

6,304

7,807

9,034

11,340

14,011

15,812

18,549

21,026

24,054

26,217

32,909

13

4,107

4,765

5,892

7,042

8,634

9,926

12,340

15,119

16,985

19,812

22,362

25,472

27,688

34,528

14

4,660

5,368

6,571

7,790

9,467

10,821

13,339

16,222

18,151

21,064

23,685

26,873

29,141

36,123

15

5,229

5,985

7,261

8,547

10,307

11,721

14,339

17,322

19,311

22,307

24,996

28,259

30,578

37,697

16

5,812

6,614

7,962

9,312

11,152

12,624

15,338

18,418

20,465

23,542

26,296

29,633

32,000

39,252

17

6,408

7,255

8,672

10,085

12,002

13,531

16,338

19,511

21,615

24,769

27,587

30,995

33,409

40,790

18

7,015

7,906

9,390

10,865

12,857

14,440

17,338

20,601

22,760

25,989

28,869

32,346

34,805

42,312

19

7,633

8,567

10,117

11,651

13,716

15,352

18,338

21,689

23,900

27,204

30,144

33,687

36,191

43,820

20

8,260

9,237

10,851

12,443

14,578

16,266

19,3337

22,775

25,038

28,412

31,410

35,020

37,566

45,315

21

8,897

9,915

11,591

13,240

15,445

17,182

20,337

23,858

26,171

29,615

32,671

36,343

38,932

46,797

22

9,542

10,600

12,338

14,041

16,314

18,101

21,337

24,939

27,301

30,813

33,924

37,659

40,289

48,268

23

10,196

11,293

13,091

14,848

17,187

19,021

22,337

26,018

28,429

32,007

35,172

38,968

41,638

49,728

24

10,856

11,992

13,848

15,659

18,062

19,943

23,337

27,096

29,553

33,193

36,415

40,270

42,980

51,179

25

11,524

12,697

14,611

16,473

18,940

20,867

24,337

28,172

30,675

34,382

37,652

41,566

44,314

52,620

26

12,198

13,409

15,379

17,292

19,820

21,792

25,336

29,246

31,795

35,563

38,885

42,856

45,642

54,052

27

12,879

14,125

16,151

18,114

20,703

22,719

26,336

30,319

32,912

36,741

40,113

44,140

46,963

55,476

28

13,565

14,847

16,928

18,959

21,588

23,649

27,336

31,391

34,027

37,916

41,337

45,419

48,278

5...


Подобные документы

  • Вивчення питання про достовірність відмінностей на основі перевірки за вибірковими характеристиками статистичної гіпотези. Огляд відомостей про закони розподілу дискретних, неперервних випадкових величин, які також можуть зустрітися в реальних випадках.

    контрольная работа [28,4 K], добавлен 27.11.2010

  • Статистичні ряди розподілу, їх елементи. Форми кривих розподілів, по яких може вирівнюватися варіаційний ряд. Розподіл Фішера і Стьюдента, показовий і нормальний розподіл. Використання показників рядів розподілу при дослідженні банківської системи.

    контрольная работа [911,7 K], добавлен 15.01.2011

  • Побудова статистичного ряду розподілу банків за обсягом вкладень у цінні папери. Розрахунок значень моди, медіани та середньої арифметичної. Визначення помилки вибірки середнього обсягу вкладень. Аналіз динамічного ряду за даними с заводу "Никифорів".

    контрольная работа [371,3 K], добавлен 14.02.2013

  • Теоретичні аспекти рядів розподілу, їх сутність. Варіаційні, дискретні та інтервальні ряди. Графічне зображення рядів розподілу, характеристики форм. Аналіз підприємств сумських рибхозів за вартістю проданого товару. Принципи побудови рядів розподілу.

    курсовая работа [481,6 K], добавлен 11.03.2012

  • Статистичний ряд розподілу та варіаційні ряди. Приклади побудови та графічного зображення рядів розподілу, полігон, гістограма, кумулята. Криві розподіли та їх види. Суть статистичного зведення, класифікація та агрегатування матеріалів спостереження.

    курсовая работа [238,3 K], добавлен 05.06.2010

  • Статистичний метод групування та особливості його використання. Середні величини (характеристики варіаційного ряду розподілу) та показники варіації. Модель кореляційно-регресійного аналізу. Динамічний ряд та його елементи, індекси, методи вирівнювання.

    курсовая работа [545,9 K], добавлен 04.01.2013

  • Побудова інтервального ряду розподілу за капіталом, за прибутковістю капіталу. Оцінка рівняння регресії. Середня зміна результативного показника. Гранична помилка вибірки та інтервал можливих значень середньої величини ознаки в генеральній сукупності.

    контрольная работа [361,9 K], добавлен 26.07.2015

  • Загальне поняття статистичної дисперсії як базового інструмента для статистичної оцінки варіації розподілу, її розрахунок. Формулювання основного правила складання дисперсій. Вирішення деяких статичних задач з використанням рядів динаміки та дисперсії.

    контрольная работа [174,3 K], добавлен 03.06.2009

  • Характеристика випадкових процесів. Математичне очікування, дисперсія, середньоквадратичне відхилення, коефіцієнт асиметрії. Числові статистичні характеристики закону розподілу. Перетворення випадкових процесів. Дослідження алгоритмів виявлення сигналів.

    курсовая работа [2,5 M], добавлен 01.10.2015

  • Абсолютні характеристики варіації, їх значення у дослідженні та способи обчислення. Середні величини як узагальнюючі показники. Середнє лінійне відхилення в статистичній практиці. Система вартісних показників обсягу продукції. Коливання окремих значень.

    контрольная работа [73,8 K], добавлен 26.01.2013

  • Порівняння двох дисперсій нормальних генеральних сукупностей, виправленої вибіркової дисперсії з гіпотетичною генеральною дисперсією нормальної сукупності, двох середніх нормальних генеральних сукупностей, дисперсії яких відомі (незалежні вибірки).

    реферат [87,1 K], добавлен 10.02.2011

  • Сутність, значення прибутку в господарській діяльності підприємств. Джерело формування загальної величини прибутку підприємства та види прибутку. Напрями підвищення прибутковості вітчизняних суб’єктів господарювання. Шляхи оптимізації розподілу прибутку.

    курсовая работа [1003,8 K], добавлен 16.12.2010

  • Поняття випадкової величини як одне з основних понять теорії ймовірностей, способи задавання розподілу ймовірностей. Характеристика ризику в ціноутворенні, проблема обліку, оцінка ризику в ціноутворенні на продукцію великовантажного автомобілебудування.

    реферат [116,2 K], добавлен 18.05.2010

  • Порівняння середніх значень факторних та результативної ознак. Статевий склад населення в Україні та розподілення у вигляді векторних діаграм. Відносні показники інтенсивності та розрахунки середньої величини і середнього квадратичного відхилення.

    контрольная работа [429,6 K], добавлен 26.04.2014

  • Побудова рядів розподілу для 30 засуджених за атрибутивною і варіаційною ознакою. Оформлення результатів викладання у формі статистичних таблиць та гістограми. Визначення середньої величини, моди і медіани. Аналіз змін в динаміці правового показника.

    контрольная работа [54,3 K], добавлен 22.12.2010

  • Розрахунок інтервального ряду розподілу населення за обсягом виробництва цукрових буряків. Розрахунок статистичних показників: середня величина для всієї сукупності регіонів, мода, медіана, середнє лінійне та квадратичне відхилення, дисперсія, варіація.

    контрольная работа [145,1 K], добавлен 04.02.2011

  • Розподіл регіонів за заготівлею ліквідної деревини, розрахунок середнього, модального та медіального значення, обчислення середнього, лінійного та квадратичного відхилення. Розрахунок ланцюгових і базисних показників, побудова відповідних графіків.

    контрольная работа [84,5 K], добавлен 26.02.2012

  • Предмет, завдання і система показників статистики ефективності виробництва зернових і зернобобових культур. Статистична оцінка варіації та аналіз форми розподілу. Статистичні методи вивчення взаємозв’язків у виробництві. Кореляційно-регресійний аналіз.

    курсовая работа [732,8 K], добавлен 19.11.2014

  • Статистичне спостереження. Статистична оцінка продуктивності корів та чинників, що на неї впливають. Види статистичних групувань. Аналіз рядів розподілу. Кореляційний аналіз продуктивності корів. Особливості рангової, простої, множинної кореляції.

    курсовая работа [508,1 K], добавлен 14.04.2016

  • Побудова інтервального ряду розподілу підприємств за обсягом виручки. Обчислення вибіркових характеристик розподілу. Визначення середньої частки вкладів населення в комерційних банках, середньорічної кількості безробітних та середньорічний темп приросту.

    контрольная работа [109,4 K], добавлен 17.01.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.