Парна регресія. Множинна лінійна регресія з урахуванням мультиколінеарності
Знаходження оцінок параметрів моделей за допомогою методу найменших квадратів. Перевірка адекватності отриманої моделі експериментальним даним за критерієм Фішера. Облік мультиколінеарних пар факторів із використанням t-статистики (критерію Стьюдента).
Рубрика | Программирование, компьютеры и кибернетика |
Вид | лабораторная работа |
Язык | украинский |
Дата добавления | 28.07.2017 |
Размер файла | 68,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru//
Размещено на http://www.allbest.ru//
Лабораторна робота №1
Парна регресія
1. За кореляційним полем вибираємо вигляди залежності.
За виглядом кореляційного поля (тому що з ростом x y, в основному, збільшується) припускаємо наявність залежності двох типів:
Прямолінійна
; (5.1 )
Експоненціальна
. (5.2 )
2. Використовуючи метод найменших квадратів (МНК), знайдемо оцінки параметрів моделей , , і .
Відомо, що для лінійної моделі оцінки параметрів рівняння визначаються за формулами 5.3 і 5.4:
(5.3 )
(5.4 )
де rxy - вибірковий парний коефіцієнт кореляції поміж x і y;
(5.5 )
Sy, Sx - вибіркові середні квадратичні відхилення; визначаються як корінь квадратний із вибіркових дисперсій і :
; (5.6)
, - вибіркові середні
;.(5.7)
Таблиця з розрахованими значеннями наведена нижче:
Тоді отримана лінійна модель набуває вигляду:
y = + Ч X
Для визначення оцінок і приведемо рівняння експоненціальної залежності до лінійного вигляду, прологарифмувавши його. Одержуємо . Здійснивши відповідні заміни й , одержимо лінійну залежність вигляду .
Розрахунки оцінок параметрів і проміжних величин зробимо за формулами (5. 3-5. 7) для лінійної моделі.
Тоді оцінка параметра і отримана експоненціальна модель приймає вигляд:
y = Ч e Чx.
3. Виберемо з двох отриманих залежностей найкращу. Критерієм оптимальності можна прийняти величину дисперсії залишків:
(5.8)
де - розрахункове значення , отримане для по моделі з визначеними оцінками параметрів.
Тоді дисперсія залишків складе:
для лінійної моделі ;
для експоненціальної моделі .
Тому що значення дисперсії залишків для лінійної моделі більше, ніж значення дисперсії залишків експоненціальної моделі, то перша модель гірше ніж друга наближає істинне значення y. Тому модель, що найбільше відбиває добре дану залежність, приймається отримана експоненціальна модель
y = Ч e Чx .
4. У даному випадку оцінки параметрів моделі можна перевірити на значущість відмінності від нуля за значущістю коефіцієнта кореляції r із використанням критерію Стьюдента.
Розрахункове значення критерію
(5.9)
2,2. tроз= .
Табличне значення знаходимо за таблицею t-розподілу для імовірності a= 0,05 і числа ступенів свободи k = n-2 = 20-2 = 18, 2,1.
Отже, коефіцієнт кореляції r, а значить і d, суттево відрізняється від нуля з надійністю Р = 1-a = 1-0,05 = 0,95.
Тому що розрахункове значення критерію Стьюдента більше за табличний, то параметр d суттєво відрізняється від нуля.
5. Адекватність отриманої моделі експериментальним даним перевіримо за критерієм Фішера. Розрахункове значення критерію визначається як відношення дисперсій:
(5.10 )
Fроз = .
Табличне значення знаходимо за таблицею F-розподілу для імовірності a = 0,05 і числа ступенів свободи k1 = m = 19 і k2 = n-m-1 = 20-2 = 18
Тому що розрахункове значення критерію Фішера більше табличного, обрану модель можна вважати адекватною.
6. Проведемо аналіз отриманої експоненціальної залежності.
Коефіцієнт еластичності для отриманої моделі буде дорівнювати:
.(5.11 )
Підставивши рівняння залежності в [5.11] одержимо:
.
Тоді при зміні x для вихідних даних в інтервалі Ј х Ј коефіцієнт еластичності буде змінюватися в межах Ј Kx Ј . Таким чином, збільшення значення фактора на 1% викликає ріст значення показника в середньому на %.
Значення коефіцієнта кореляції, наближене до 1, а також мале значення величини дисперсії залишків означають тісний взаємозв'язок між фактором і показником. Оцінка значущості відмінності від нуля параметра рівняння й адекватності моделі дозволяють зробити висновок, що модель можна використовувати з метою прогнозування величини показника.
Лабораторна робота №2
Множинна лінійна регресія з урахуванням мультиколінеарності
Регресійне рівняння (модель залежності) задовільно описує зміни залежної перемінної тоді, коли коефіцієнт множинної кореляції досить великий, а кореляція між факторами незначна. Мультиколінеарність факторів веде до обмеженості оцінок параметрів, тобто неможливості коректної інтерпретації результатів. Тому перед пошуком оцінок параметрів варто перевірити систему факторів на мультиколінеарність.
Один із методів перевірки факторів на мультиколінеарність - алгоритм Фарара-Глобера. Спочатку за допомогою c2 - статистики робиться перевірка всієї системи факторів на мультиколінеарність (із використанням кореляційної матриці). Якщо система факторів мультиколінеарна, то з використанням F-статистики перевіряється кожний фактор на мультиколінеарність. Далі за допомогою t-статистики перевіряються всі пари факторів на колінеарність. Серед мультиколінеарних пар виявляють мультиколінеарні фактори, що приводять до мультиколінеарності всю систему. Їх виключають із системи, якщо це не суперечить економічному змісту досліджуваної залежності. У іншому випадку переходять до іншої кількісної характеристики даного фактора.
Спочатку визначимо:
середні арифметичні значенняфакторів X, Y, Z і показника y;
вибіркові дисперсії факторів і показника (формула 1.6 із завдання 1);
вибіркові середні квадратичні відхилення показника і факторів .
F |
X |
Y |
Z |
||
Середнє |
|||||
S2 |
|||||
S |
парні коефіцієнти кореляції відповідно до формули 1.5 у завданні 1.
rFX |
rFY |
rFZ |
rXY |
rXZ |
rYZ |
|
Проведемо розрахунки відповідно до алгоритму Фаррара-Глобера для даної системи факторів (X, Y, Z).
1. Запишемо кореляційну матрицю системи факторів:
1 |
|||
1 |
|||
1 |
2. Знайдемо визначник матриці |R| = 0,0096 .
3. Визначимо розрахункове значення критерію c2 за формулою
,(5.12)
де n - об'єм вибірки;
m - число факторів у моделі.
Табличне значення c2 визначаємо, використовуючи таблицю критичних точок розподілу c2 у будь-якому підручнику (довіднику) з економетрії та математичної статистики.
У даному випадку:
розрахункове значення c2роз= ;
табличне (критичне) значення c2кр = c2(0,05; mЧ(m-1)/2) = 7,8.
Тому що c2расч і c2кр , то система факторів мультиколінеарна.
Далі визначаємо мультиколінеарні фактори.
2. Знаходимо матрицю С, зворотну кореляційній матриці R:
C = R -1 = |
|||
3. Розраховуємо F-статистики для факторів X, Y, Z за формулою:
,(5,13)
де сkk - елементи головної діагоналі матриці С.
Знаходимо табличне значення Fкр, використовуючи таблицю F-розподілу в будь-якому підручнику (довіднику) з економетрії та математичної статистики.
FX |
FY |
FZ |
Fкр = F(0,05; m; n-m-1) |
|
Якщо розрахункова F-статистика фактора більше критичного значення Fкр або дорівнює йому, то даний фактор мультиколінеарний.
У даному випадку:
фактор X - мультиколінеарний;
фактор Y - немультиколінеарний;
фактор Z - мультиколінеарний.
5. Визначимо мультиколінеарні пари факторів із використанням t-статистики (критерію Стьюдента).
Розрахункові значення t-статистик визначаються за формулою:
регресія мультиколінеарність парний
,(5.14)
де rkj - приватні коефіцієнти кореляції між парами факторів:
(5.15)
де сkj - елемент матриці С, що лежить у k-й рядку j-ом стовпці;
сkk і сjj - діагональні елементи матриці С.
У даному випадку:
r12 |
r13 |
r23 |
|
Табличне значення tкр визначається за таблицею t-розподілу в будь-якому підручнику (довіднику) з економетрії і математичній статистиці.
У даному випадку:
tXY |
tXZ |
tYZ |
tкр = t(0,05; n-m-1) |
|
Якщо розрахункове значення t-статистики пари факторів більше або дорівнює критичному, то дана пара факторів - мультиколінеарна.
У даному випадку:
пари факторів XY - немультиколінеарна;
пари факторів XZ - мультиколінеарна;
пари факторів YZ - немультиколінеарна.
З проведених розрахунків перевірки системи і факторів на мультиколінеарність очевидно, що фактор Z необхідно виключити з моделі для видалення властивості мультиколінеарності.
6.Визначимо оцінки параметрів моделі, використовуючи алгоритм стандартизованої моделі з b-коефіцієнтами.
Перепишемо кореляційну матрицю без коефіцієнта кореляції віддаленого фактора:
1 |
||
1 |
7. Знайдемо матрицю С, обернену кореляційної:
8. Обчислимо b-коефіцієнти:
(5.16 )
bX = ;
bY = . .
9. Знайдемо коефіцієнт детермінації і множинної кореляції за формулою:
(5.17 )
.
10. Для перевірки значущості відмінності від нуля b-коефіцієнтів за критерієм Стьюдента обчислимо розрахункові значення t-критерію за формулою
, (5.18)
де .(5.19)
Табличне значення tкр знаходимо, використовуючи таблицю t-розподілу в будь-якому підручнику (довіднику) з економетрії та математичної статистики.
У даному випадку:
tх |
ty |
tкр = t(0,05; n-m-1) |
||
Якщо розрахункове значення більше або дорівнює табличному, то b-коефіцієнт значущий, тобто вплив фактора на показник істотний.
У даному випадку:
bX - значущий;
bY - значущий.
Отже, стандартизована модель набуде вигляду:
tF = Ч tx + Ч ty.
11. Переходимо від стандартизованої моделі до нормалізованого вигляду:
(5.20)
а) визначимо оцінки параметрів a1, a2, …, am при xi за формулою:
(5.21 )
У даному випадку: a1 = ; a2 = ;
б) визначимо оцінку вільного члена а0 за формулою:
а0 = Fсеред - а1Xсеред- а2Yсеред а0 = . .
Таким чином, рівняння залежності набуде вигляду:
F = + Ч X + Ч Y ;
в) перевірка адекватності отриманої моделі (значущості відмінності від нуля D) здійснюється з використанням розрахункового значення критерію Фішера, за формулою:
Fp = ; Fкр = F(0.05; m; n-m-1) = 3,59.
Якщо розрахункове значення критерію Фішера більше або дорівнює табличному, то D - значуще, і отримана залежність адекватна експериментальним даним, її можна використовувати для прогнозування економічних показників.
Таким чином, одержали рівняння лінійної залежності показника F від факторів X і Y:
F = + Ч X + Ч Y
адекватне з рівнем надійності Р=0,95 вихідним (експериментальним) даним. Размещено на Allbest.ru
...Подобные документы
Характеристика середовища програмування Microsoft Visual C++ та бібліотеки класів MFC. Знаходження коефіцієнтів при невідомих за допомогою методу найменших квадратів. Створення програми для вирішення задачі обраним методом, її алгоритм та інтерфейс.
курсовая работа [434,8 K], добавлен 20.01.2014Загальні відомості про С++ Builder. Метод найменших квадратів. Побудова лінійної емпіричної формули. Робота з базою даних MSql засобами PHP. Розрив з’єднання з сервером. Екранування спец-символів. Знаходження функції за методом найменших квадратів.
курсовая работа [1,4 M], добавлен 11.12.2012Основні теоретичні відомості про метод знаходження значення функції у міжвузловій точці за допомогою інтерполяційної формули Бесселя та приклад його застосування. Розробка алгоритму за даним методом. Опис програми, лістинг та результати тестування.
курсовая работа [70,3 K], добавлен 03.12.2009Формалізація моделі виробничої діяльності підприємства. Рішення за допомогою Excel. Алгоритм розрахунку моделі. Побудова моделі рішення за допомогою "С++". Знаходження оптимальної програми функціонування підприємства. Розробка коду програми.
контрольная работа [720,1 K], добавлен 12.06.2015Засвоєння засобів аналізу трудомісткості обчислювальних алгоритмів. Побудова графа алгоритму з отриманої блок-схеми. Мінімізація графа, його подання у вигляді стохастичної матриці. Знаходження кількості звернень до файлів за допомогою Microsoft Excel.
лабораторная работа [681,5 K], добавлен 02.06.2011Визначення найкращого режиму роботи системи обробки повідомлень. Представлення моделі у вигляді системи масового обслуговування. Визначення структури моделі. Обмеження на зміну величин. Програмна реалізація імітаційної моделі. Оцінка адекватності.
курсовая работа [153,9 K], добавлен 29.01.2013Розробка іспитового стенда для лабораторії, визначення тривалості робіт, ресурсів на її виконання. Характеристика параметрів моделі до оптимізації. Очікувана тривалість робіт за проектом. Причини та критерії оптимізації моделі. Розрахунок бюджету проекту.
контрольная работа [1,1 M], добавлен 09.11.2015Разработка алгоритма и программы на языке С++ для генерации значений случайных величин, имеющих нормальный закон распределения. Проверка нулевой гипотезы об отсутствии статистически значимых различий между двумя выборками с помощью t-критерия Стьюдента.
лабораторная работа [763,5 K], добавлен 19.02.2014Найбільш розповсюджені середовища створення графічних зображень та 3D моделей. Основні інструменти векторних редакторів. Функції програм Adobe Photoshop и Корелдроу. Графічні моделі, характеристики й типи графічних файлів. Створення власних моделей.
дипломная работа [6,7 M], добавлен 25.06.2011Ортогонaлізування функцій. Порівняння дискретного та хвильового перетворення. Інтерполяційні поліноми Лагранжа і Ньютона. Метод найменших квадратів. Побудова кривої для заданих результатів вимірювань. Розв’язання задачі по Лапласу операційним методом.
курсовая работа [2,2 M], добавлен 10.04.2012Реалізація інтерполяції поліномами за методами найменших квадратів і Лагранжа в Matlab. Наближення даних сплайном нульового порядку. Диференціювання полінома. Геометричний зміст похідної. Чисельне інтегрування функцій. Розв’язування диференційних рівнянь.
контрольная работа [285,3 K], добавлен 01.06.2015Вибір методу проектування архітектури та моделі функціонування системи автоматизації обліку ресурсів в складських приміщеннях. Аналіз системних вимог та обґрунтування методу проектування інформаційної системи, постановка та алгоритм розв’язання задачі.
дипломная работа [3,5 M], добавлен 25.05.2017Розробка програми на мові програмування Асемблер для обчислення виразу. Розрахунок значень А, В, С у процедурах. Аналіз отриманих результатів за допомогою відлагоджувальника Turbo Debugger при різних заданих значеннях та перевірка їх правильності.
лабораторная работа [203,4 K], добавлен 09.01.2013Поняття рівнянь регресії та їх практична цінність. Створення програмного продукту на мові об'єктно-орієнтованого програмування з можливістю побудування за експериментальними даними таблиці графіки та обчислювання їх відхилення від експериментальних даних.
курсовая работа [2,5 M], добавлен 24.12.2011Загальні факти про комп’ютерні ігри. Розгляд основ розробки програмного (джерельного) коду, контенту (малюнки, моделі, музика) та ігрових механік гри "Три стакани". Правила використанням засобів WinAPI. Створення математичної моделі алгоритму програми.
курсовая работа [405,6 K], добавлен 09.06.2015Методи рішень диференційних рівнянь за допомогою мов програмування і їх графічні можливості. Аналіз динамічних та частотних властивостей електронної системи за допомогою чисельної моделі. Представлення цифрової моделі та блок-схеми алгоритму обчислень.
практическая работа [430,6 K], добавлен 27.05.2015Бібліотеки для дій з розрядно-логарифмічними діями. Перевірка оберненої матриці за допомогою одиничної у розрядно-логарифмічній формі. Код розрахунку оберненої матриці за методом Крамера. Алгоритми додавання, віднімання, множення, ділення чисел у РЛ.
курсовая работа [18,6 K], добавлен 17.10.2013Вибір емпіричної формули. Метод оберненої матриці. Розв’язування систем лінійних рівнянь на ПК. Вибір двох апроксимуючих функцій. Розрахунки у середовищі MS Excel для лінійної функції, для квадратичної функції та у середовищі MS Visual Studio (мовою С#).
курсовая работа [658,8 K], добавлен 18.08.2014Аналіз параметрів та характеристик аудіо та відео кодеків. Аналіз параметрів протоколів сигналізації медіатрафіку та мережного рівня медіа систем. Вербальні моделі взаємодії відкритих систем. Математичні моделі процесів інкапсуляції та передачі даних.
курсовая работа [573,9 K], добавлен 22.03.2015Дослідження динамічних рядів методом найменших квадратів та ковзаючого середнього. Опис логічної структури програми. Стандартні методи та елементи середовища програмування Borland Delphi 2007. Опис функцій складових частин програми і зв'язків між ними.
курсовая работа [135,3 K], добавлен 01.04.2016