Методи аналізу взаємозв’язків та проведення вибіркових спостережень
Оцінка щільності кореляційного зв’язку за даними аналітичного групування. Визначення параметрів однофакторної лінійної регресійної моделі. Перевірка суттєвості кореляційного зв’язку. Обчислення показників напряму і щільності парного кореляційного зв’язку.
Рубрика | Экономика и экономическая теория |
Вид | практическая работа |
Язык | украинский |
Дата добавления | 19.07.2017 |
Размер файла | 98,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.Allbest.ru/
Модуль 4. Методи аналізу взаємозв'язків та проведення вибіркових спостережень
Практичні заняття до теми 10: Статистичні методи вивчення взаємозв'язків явищ
Мета: Закріпити теоретичні знання та виробити практичні навички щодо оцінювання щільності кореляційного зв'язку за даними аналітичного групування; визначення параметрів однофакторної лінійної регресійної моделі, перевірки істотності зв'язку, обчислення показників напряму і щільності парного кореляційного зв'язку.
План заняття
1. Оцінювання щільності кореляційного зв'язку за даними аналітичного групування. Розрахунок кореляційного відношення
2. Регресійний аналіз взаємозв'язку. Оцінювання щільності та перевірка істотності кореляційного зв'язку на основі регресійних рівнянь. Перевірка суттєвості кореляційного зв'язку
Методичні рекомендації
Закономірності економічних та соціальних процесів характеризуються взаємозв'язками між статистичними показниками. Статистичні показники перебувають у певних відношеннях між собою, виступаючи в ролі незалежних або залежних ознак.
Суспільні явища, що впливають на інші явища, називають факторними, їх характеризують факторні ознаки (х). Явища, які змінюються під впливом факторних явищ, називаються результативними, їх характеризують результативні ознаки (у).
Між явищами може існувати функціональний, стохастичний або кореляційний зв'язок.
За наявності функціонального зв'язку між факторною та результативною ознаками існує функціональна залежність, тобто, певному значенню факторної ознаки х відповідає конкретне значення результативної ознаки y, яке може бути визначене за відповідною формулою.
Наявність стохастичного зв'язку означає, що певному значенню факторної ознаки х відповідає множина значень результативної ознаки y.
За кореляційного зв'язку між значеннями ознак немає суворої і точної відповідності в кожному окремому випадку, у кожній одиниці сукупності, а спостерігається лише відоме співвідношення, тобто, певному значенню факторної ознаки х відповідає середнє значення результативної ознаки y. Функціональні зв'язки виражаються тим чи іншим аналітичним рівнянням, кореляційні зв'язки можуть бути виражені за допомогою аналітичного рівняння лише приблизно.
Якщо залежність результативної ознаки від певної ознаки-фактора може бути виражена рівнянням прямої лінії, то зв'язок називається прямолінійним (лінійним), якщо ж залежність виражається рівнянням якої-небудь кривої (гіперболи, параболи та ін.), то зв'язок називається криволінійним.
Якщо досліджується залежність результативної ознаки тільки від однієї ознаки-фактора, то зв'язок називається однофакторним. Якщо при цьому зв'язок є функціональним, то це свідчить про те, що результативна ознака залежить тільки від певної ознаки. Якщо ж зв'язок є кореляційним, то включення в аналітичне рівняння тільки одного фактора свідчить про те, що від впливу інших факторів ми абстрагуємося, усуваємо їхню дію. Така кореляція називається парною, оскільки при цьому розглядаються тільки дві ознаки.
На відміну від функціональної залежності, кореляційний зв'язок є неповним, тому що залежність між функцією і аргументом у кожній ситуації перебуває під впливом ще й інших факторів. Кореляційна залежність проявляється тільки у масових явищах і може встановлюватися для пари показників (парна кореляція) або для декількох показників (множинна кореляція).
1. Оцінювання щільності кореляційного зв'язку за даними аналітичного групування. Розрахунок кореляційного відношення
Етапи аналізу
1. Теоретичне обґрунтування моделі аналітичного групування:
- вибір факторних ознак;
- визначення числа груп k ознаки-фактора xi;
- визначення меж інтервалів групування щодо xi.
Примітка. Групи мають бути достатньо численні й чисельність груп має бути приблизно однакова.
2. Оцінка лінії регресії:
- визначення частот (частостей) fj у групах;
- розрахунок у кожній групі за факторною ознакою середніх значень результативної ознаки .
3. Вимірювання тісноти зв'язку, що ґрунтується на правилі розкладання загальної дисперсії: загальна дисперсія розкладається на міжгрупову та середню з групових дисперсій і обчислюється за індивідуальними значеннями ознаки у.
Якщо результативна ознака у зовсім не зв'язана з хі , то групові середні не будуть змінюватися зі зміною xі, тобто дорівнюватимуть одна одній і дорівнюватимуть загальній середній , а міжгрупова дисперсія буде дорівнювати нулю.
Якщо результативна ознака у функціонально зв'язана з ознакою-фактором xi, то в кожній групі внутрішньогрупова дисперсія буде дорівнювати нулю, оскільки ознака хі у середині групи не варіює. Середня з групових дисперсій буде дорівнювати нулю також згідно з правилом складання дисперсій.
Загальна дисперсія характеризує варіацію ознаки y за рахунок впливу всіх причин (факторів), міжгрупова - за рахунок фактора х, покладеного в основу групування, а внутрішньогрупові - за рахунок інших факторів, не врахованих у групуванні.
Міжгрупова дисперсія обчислюється за формулою:
де: та - відповідно середнє j-ї групи та загальна середня варіюючої ознаки y; - частота j-ї групи.
Внутрішньогрупова дисперсія розраховується окремо для кожної j-ї групи:
,
де уj - значення ознаки окремих елементів j-ї групи сукупності.
Для всіх груп в цілому обчислюється середня з внутрішньогрупових дисперсій, зважених на частоті відповідної групи:
Взаємозв'язок між трьома дисперсіями дістав назву правила складання дисперсій, згідно з яким
Загальну дисперсію можна визначити і безпосередньо за формулою
Відношення міжгрупової дисперсії до загальної називається кореляційним відношенням зІ. Тіснота (щільність) кореляційного зв'язку вимірюється за допомогою кореляційного відношення, пов'язаного із емпіричним коефіцієнтом детермінації з:
- характеризує частку варіації ознаки у, яка пояснюється варіацією xi у групі. Якщо:
= 0, то = 0
Це можливо за умови, що всі групові середні однакові й кореляційного зв'язку між ознаками х і у не існує;
= 1, то =, а = 0
У цьому випадку кожному значенню факторної ознаки відповідає єдине значення результативної ознаки, тобто зв'язок між ознаками функціональний.
4. Перевірка суттєвості зв'язку, тобто перевірка істотності відхилень групових середніх, здійснюється за допомогою критеріїв математичної статистики. Вона ґрунтується на порівнянні фактичного значення з так званим критичним (де б - рівень значимості). є тим максимально можливим значенням кореляційного відношення, яке може виникнути випадково за відсутності кореляційного зв'язку.
Для перевірки істотності зв'язку використовують також функціонально пов'язаний із F-критерій (критерій Фішера).
Методика визначення F-критерія Фішера (F) застосовується для перевірки істотності зв'язку:
F = з2 / ( 1 - з2)? k2 / k1,
де k1 = m - 1; k2 = n - m,
n - кількість одиниць сукупності;
m - кількість груп за ознакою х.
Є таблиці критичних значень F-критерію (F1-б, де б - рівень істотності - див. додаток В).
Якщо з2 > з1-б2 і F > F1-б ( k1, k2), то зв'язок між результативною і факторною ознаками вважається істотним.
Якщо з2 < з1-б2 і F < F1-б ( k1, k2), то наявність зв'язку між результативною і факторною ознаками не доведено і зв'язок вважається неістотним.
2. Регресійний аналіз взаємозв'язку. Оцінювання щільності та перевірка істотності кореляційного зв'язку на основі регресійних рівнянь. Перевірка суттєвості кореляційного зв'язку
До основних завдань кореляційно - регресійного аналізу (КРА) належать:
· постановка завдання, встановлення наявності зв'язку між досліджуваними ознаками;
· вибір найістотніших факторів для аналізу;
· визначення характеру зв'язку, його напряму і форми, вибір математичного рівняння для вираження існуючих зв'язків;
· знаходження параметрів рівняння і показників тісноти зв'язку;
· статистична оцінка достовірності отриманих результатів.
Фактори, що включаються до рівняння регресії, мають справляти достатньо суттєвий вплив на результативну ознаку, тобто зв'язок результативної ознаки з кожною факторною ознакою має бути достатньо тісним. Для попередньої перевірки зазначеного вище доцільно використовувати такі методи, як порівняння паралельних рядів та аналітичне групування: просте та комбінаційне.
Однак фактори, що входять до рівняння регресії, не повинні перебувати між собою в лінійному функціональному або дуже тісному кореляційному зв'язку, оскільки тісно пов'язані між собою фактори дублюють один одного та перекручують результати КРА, що призводить до нестійкості коефіцієнтів рівняння регресії.
Для цього необхідно визначити щільність зв'язку кожного фактора з кожним з інших факторів-ознак за допомогою розрахунку парних лінійних коефіцієнтів кореляції, а потім виключити один чи кілька тісно пов'язаних з іншим (іншими) факторами.
Кореляційний аналіз - це метод, за допомогою якого можна отримати кількісне вираження взаємозв'язку соціально-економічних явищ у вигляді рівняння регресії (рівняння кореляційного зв'язку), тобто у вигляді тієї чи іншої функції, що приблизно виражає залежність середнього значення результативної ознаки від одного чи декількох ознак-факторів:
При цьому термін „кореляція” використовується для оцінки щільності зв'язку між ознаками, а термін „регресія” - для опису виду і параметрів функції зв'язку (регресійної моделі). За числом факторних ознак , які входять в регресійну модель, розрізняють однофакторні та багатофакторні моделі.
Залежно від вихідних даних теоретичною лінією регресії можуть бути різні типи кривих або пряма лінія. Особливе місце в обґрунтуванні форми зв'язку при проведенні кореляційного аналізу належить графікам, побудованим у системі прямокутних координат на основі емпіричних даних. Графічне зображення фактичних даних дає наочне уявлення про наявність і форму зв'язку між досліджуваними ознаками.
Зв'язки між двома чинниками аналітично можуть бути виражені у вигляді прямої, степеневої функції, гіперболи та ін.:
1. У вигляді лінійної функції (пряма лінія), якщо результативна ознака рівномірно зростає (зменшується) зі зростанням (зменшенням) факторної ознаки:
де yх - теоретичне значення результативної ознаки;
а0 і а1 - параметри рівняння прямої (рівняння регресії);
х - індивідуальні значення факторної ознаки.
Параметри рівняння прямої а0 та а1 визначаються шляхом розв'язання системи нормальних рівнянь, одержаних методом найменших квадратів, основною умовою якого є мінімізація суми квадратів відхилень емпіричних значень від теоретичних:
Система нормальних рівнянь для знаходження параметрів парної лінійної регресійної моделі має вигляд:
де у - індивідуальні значення результативної ознаки.
За незгрупованими даними:
У рівнянні прямої параметр а0 економічного змісту не має, це - початок відліку, або значення при а1 = 0. Параметр а1 є коефіцієнтом регресії, який показує середню зміну результативної ознаки при зміні факторної ознаки на одиницю.
Коефіцієнти регресії є величинами іменованими і мають одиниці вимірювання, що відповідають ознакам, зв'язок між якими вони характеризують. Якщо a1 > 0, то зв'язок прямий, якщо a1 < 0, то зв'язок обернений, якщо a1 = 0, то зв'язок відсутній.
2. У вигляді степеневої функції та у вигляді гіперболи якщо значення факторної ознаки знаходяться у порядку геометричної прогресії і відповідні значення результативної ознаки також мають геометричну прогресію:
Для визначення параметрів степеневої функції методом найменших квадратів необхідно привести її до лінійного вигляду шляхом логарифмування:
lg yx = lg а0 + а1 lg х
Одержане рівняння відрізняється від рівняння звичайної (лінійної) регресії тим, що замість y, x та а0 містить їх логарифми. Тому формули параметрів степеневої регресії можна отримати, якщо замінити у формулах розрахунку а0 та а1 рівняння прямої за не згрупованими даними y, x та а0 їх логарифмами. Параметр а1 у цьому випадку показує, на скільки відсотків змінюється в середньому у при зміні х на один відсоток.
3. У вигляді гіперболи, якщо результативна ознака зі зростанням (зменшенням) факторної ознаки зростає (зменшується) не нескінченно, а прямує до скінченої границі:
yx = а0 + а1
Для визначення параметрів рівняння гіперболи методом найменших квадратів, необхідно привести його до лінійного виду. Для цього треба здійснити заміну = х1.
Побудова множинних регресійних моделей - процес досить трудомісткий. Для вирішення цих завдань е різні методи, які описані в літературі та містяться у пакетах стандартних програм для ПЕОМ (АРМ-статистика).
При кореляційному зв'язку разом з досліджуваним фактором на результативну ознаку впливають і інші фактори, які не враховуються або не можуть бути враховані кількісно. При цьому дія їх може бути направлена як в сторону підвищення результативної ознаки, так і в сторону її зниження. Тому виникає необхідність визначення тісноти зв'язку між ознаками, у визначенні сили дії досліджуваного фактора на результативну ознаку та в оцінці адекватності моделі.
Для цього використовують такі характеристики:
* Лінійний коефіцієнт кореляції Пірсона (г) використовується тільки для вимірювання щільності зв'язку лінійної форми:
або
або ;
де
[-1] ? r ? [+1].(3.101)
Якщо | r | = 1, то між досліджуваними ознаками існує функціональний зв'язок.
Якщо r = 0, то зв'язок відсутній.
Якщо r наближується до - 1, то між досліджуваними факторами існує щільний обернений зв'язок.
Якщо r наближується до + 1, то між досліджуваними факторами існує щільний прямий зв'язок.
За шкалою Чеддока, якщо
1) r = 0,1 - 0,3 , то зв'язок слабкий;
2) r = 0,3 - 0,5 , то зв'язок помірний;
3) r = 0,5 - 0,7 , то зв'язок помітний;
4) r = 0,7 - 0,9 , то зв'язок високий;
5) r = 0,9 - 0,99 , то зв'язок надто високий.
Квадрат коефіцієнта кореляції називається коефіцієнтом детермінації r2. Він показує, яка частка загальної варіації результативної ознаки визначається досліджуваним фактором.
Теоретичне кореляційне відношення зr використовується для вимірювання щільності зв'язку між ознаками за будь-якої форми зв'язку, як лінійної, так і нелінійної:
зr =
де - дисперсія, визначена для теоретичних значень результативної ознаки, які отримані за рівнянням регресії;
- дисперсія, що визначена для емпіричних значень результативної ознаки.
=
=
Теоретичне кореляційне відношення змінюється від 0 до 1: чим ближче зr до 1, тим тісніший зв'язок між ознаками. Недолік цього показника - він не показує напрямок зв'язку.
Для оцінки адекватності регресійної моделі застосовують F-критерій Фішера (див. вище) або t-критерій Стьюдента.
t-критерій Стьюдента - після побудови регресійної моделі здійснюється перевірка відповідності знаків параметрів напрямові впливу чинників, а також дається оцінка значущості коефіцієнта кореляції за t-критерієм Стьюдента.
Для парної лінійної регресійної моделі розрахункові значення t-критерію обчислюють за формулою
де (п - 2) -- кількість ступенів вільності.
Розрахункові значення t-критерію Стьюдента порівнюють з критичними (табличними - див. додаток Б) для відповідного числа ступенів вільності: k = n - m (де n -- кількість спостережень; m -- число параметрів) та прийнятого рівня значущості б.
Якщо емпіричне значення t буде більшим за критичне, то лінійний коефіцієнт кореляції визнається значимим.
3. Побудова довірчого інтервалу коефіцієнта регресії. Стандартна похибка коефіцієнта регресії
Гранична похибка коефіцієнта регресії
,
де - імовірнісний коефіцієнт, знайдений за таблицями розподілу Стьюдента, для вибраного рівня істотності б і V = n - 2 ступенів вільності.
Межі довірчого інтервалу коефіцієнту регресії
а1 - ? а1 ? а1 + .
кореляційний однофакторний лінійний регресійний
Задачі для розв'язання
Завдання 1
Зазначте, які з наведених залежностей соціально-економічних явищ є функціональними, а які - стохастичними:
захворюваність населення регіону від екологічного стану довкілля;
попит на споживчі товари від наявності їх на ринку та цін;
урожайність зернових від якості ґрунту та кількості опадів за рік;
акціонерний капітал компанії від кількості проданих акцій та їх ринкової ціни;
плідність жінок від їх віку;
загальні витрати рекламних повідомлень від їх кількості та собівартості виготовлення одиниці рекламної продукції.
Задача 1
Оцінити щільність зв'язку між ознаками та перевірити його істотність за даними розподілу страхових полісів різних агентств за тривалістю закордонної поїздки страхувальника та вартістю медичного страхування. (Метод аналітичного групування).
Тривалість поїздки, днів, хj |
Кількість страхових полісів з вартістю, грн.. |
Середньоденна вартість одного полісу, |
|||||
55-65 |
65-75 |
75-85 |
85-95 |
Разом fj |
|||
До 8 |
5 |
30 |
85 |
120 |
240 |
||
8-15 |
65 |
50 |
25 |
20 |
160 |
||
15-30 |
75 |
20 |
5 |
- |
100 |
||
У цілому |
145 |
100 |
115 |
140 |
500 |
Задача 2
За даними звітів сільськогосподарських підприємств рівень рентабельності виробництва залежить від ступеня забезпеченості ресурсами.
Визначте міжгрупову дисперсію та кореляційне відношення, якщо загальна дисперсія рентабельності виробництва становить 116. Зробіть висновки щодо щільності зв'язку та перевірте його на істотність з імовірністю 0,95.
Коефіцієнт забезпеченості ресурсами |
Кількість підприємств |
Середній рівень рентабельності, % |
|
До 0,9 0,9-1,1 1,1 і більше |
31 45 24 |
10 16 35 |
|
В цілому |
100 |
18,7 |
Задача 3
За даними спостереження окупність витрат на радіоприлади залежить від строку освоєння їх виробництва (умовні дані наведено в таблиці). Виходячи із цих даних:
а) визначте функцію, яка описує залежність між окупністю витрат та строком освоєння виробництва приладів, обчисліть її параметри та поясніть їх зміст;
б) оцініть щільність зв'язку за допомогою коефіцієнта детермінації, дайте його інтерпретацію;
в) перевірте зв'язок на істотність з імовірністю 0,95.
Номер продукції |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
|
Строк освоєння, років |
5 |
4 |
7 |
10 |
1 |
2 |
8 |
12 |
3 |
6 |
|
Окупність витрат, грн./грн.. |
10,2 |
7,5 |
13,9 |
12,8 |
0,6 |
2,8 |
13,2 |
10,1 |
5,4 |
12,7 |
Задача 4
Провести КРА зв'язку між добовою вартістю туристичних путівок в одному з туристичних агентств та тривалістю відпочинку. Обчислити параметри лінійного рівняння регресії. Оцінити щільність зв'язку між ознаками та перевірити його істотність.
Номер путівки |
Тривалість відпочинку, х |
Добова вартість путівки, у |
ху |
х2 |
у2 |
||
1 |
5 |
78 |
|||||
2 |
14 |
55 |
|||||
3 |
7 |
95 |
|||||
4 |
18 |
30 |
|||||
5 |
14 |
53 |
|||||
6 |
20 |
26 |
|||||
7 |
7 |
85 |
|||||
8 |
15 |
50 |
|||||
Разом |
100 |
472 |
Задача 5
Дані про споживання картоплі в сім'ях робітників та службовців з різним рівнем середньодушового сукупного доходу наведено у таблиці:
Рівень середньодушового сукупного доходу |
Кількість сімей |
Споживання картоплі в середньому на члена сімї за рік, кг |
|
Низький |
10 |
64 70 79 84 82 69 76 78 75 73 |
|
Середній |
26 |
91 96 84 95 98 94 92 88 83 97 93 100 93 79 81 86 94 90 82 85 80 93 87 89 98 92 |
|
Високий |
14 |
99 106 108 103 104 107 102 105 98 112 109 110 100 107 |
Визначити групові дисперсії, середню з групових дисперсій, загальну та міжгрупову дисперсії, показати взаємозв'язок між дисперсіями, оцінити наявність зв'язку між факторною та результативною ознаками за емпіричним кореляційним відношенням. Зробити висновки.
Задача 6
За даними вибіркового обстеження заробітної плати працівників бюджетної сфери одержано показники, наведені у таблиці.
Галузь |
Середня заробітна плата, грн. |
Чисельність працівників |
Дисперсія заробітної плати |
|
Охорона здоров'я |
1200 |
80 |
4000 |
|
Освіта |
1800 |
120 |
16000 |
Визначити середню заробітну плату працівників по сукупності галузей; обчислити середню з групових (галузевих) дисперсій; визначити міжгрупову (міжгалузеву) дисперсію; загальну дисперсію, оцінити наявність зв'язку між факторною та результативною ознаками за емпіричним кореляційним відношенням. Зробити висновки.
Задача 7
За даними обстеження витрати часу жінок на домашню роботу такі:
Тип помешкання |
Чисельність жінок, тис. чол. |
Середні витрати часу на домашню роботу, год. |
Групова дисперсія витрат часу |
|
Індивідуальна квартира |
50 |
6,2 |
0,01 |
|
Приватний будинок |
40 |
7,0 |
0,04 |
Щоб проаналізувати, чи існує взаємозв'язок між типом помешкання та витратами часу на домашню роботу, визначте міжгрупову, середню з групових дисперсії витрат часу жінок на домашню роботу. Поясніть зміст кожної дисперсії та зробіть загальний висновок про щільність зв'язку між типом помешкання та витратами часу на домашню роботу.
Приклади розв'язання типових задач
Приклад 1
На основі даних, наведених у табл. встановити наявність кореляційного зв'язку, визначити лінію регресії за лінійною моделлю. Оцінити істотність і щільність зв'язку.
Залежність між факторною (х) та результативною (у) ознаками
х |
2 |
3,5 |
4, |
5,2 |
6,3 |
7,1 |
8,4 |
9,5 |
|
у |
26,4 |
26,9 |
27,3 |
27,7 |
28,1 |
28,4 |
29,1 |
29,4 |
Розв'язання:
Математично лінійний зв'язок у загальному вигляді записується рівнянням:
Y = a + bx,
де Y - результативна ознака,
а - параметр рівняння, який характеризує початковий рівень;
b - параметр рівняння, який характеризує середній абсолютний приріст;
х - факторна ознака.
Параметри рівняння регресії визначаються методом найменших квадратів, основна умова якого - мінімізація суми квадратів відхилень емпіричних значень (y) від теоретичних Y:
де у - емпіричні значення результативної ознаки;
Y - теоретичні значення результативної ознаки.
Математично доведено, що значення параметрів a та b, при яких мінімізується сума квадратів відхилень, визначаються із системи нормальних рівнянь:
Розв'язавши цю систему, знаходимо такі значення параметрів:
;
Для визначення параметрів лінійного рівняння складемо допоміжну таблицю.
Допоміжна таблиця для розрахунку параметрів лінійної моделі
і |
х |
у |
ху |
х2 |
|
1 |
2 |
26,4 |
52,8 |
4 |
|
2 |
3,5 |
26,9 |
94,15 |
12,25 |
|
3 |
4 |
27,3 |
109,2 |
16 |
|
4 |
5,2 |
27,7 |
144,04 |
27,04 |
|
5 |
6,3 |
28,1 |
177,03 |
39,69 |
|
6 |
7,1 |
28,4 |
201,64 |
50,41 |
|
7 |
8,4 |
29,1 |
244,44 |
70,56 |
|
8 |
9,5 |
29,4 |
279,3 |
90,25 |
|
Разом |
46 |
223,3 |
1302,6 |
310,2 |
Використовуючи дані наведеної таблиці, знаходимо параметри лінійного рівняння:
= 0,408
= 223,3 / 8 - 0,408 Ч 46 / 8 = 25,57.
Таким чином, лінія регресії має вигляд: у = 25,57 + 0,408 х.
Тобто, при зміні факторної ознаки х на одиницю результативна ознака у зросте на 0,408.
Для оцінки істотності та щільності лінійного зв'язку використовується лінійний коефіцієнт кореляції (Пірсона) r:
,
де - факторна дисперсія;
- загальна дисперсія.
- середнє значення факторної ознаки;
- середнє значення результативної ознаки;
n - кількість пар ознак.
Для обчислення коефіцієнта кореляції Пірсона складемо допоміжну таблицю.
Допоміжна таблиця для обчислення коефіцієнта кореляції Пірсона
і |
х |
у |
ху |
х2 |
у2 |
|
1 |
2 |
26,4 |
52,8 |
4 |
696,96 |
|
2 |
3,5 |
26,9 |
94,15 |
12,25 |
723,61 |
|
3 |
4 |
27,3 |
109,2 |
16 |
745,29 |
|
4 |
5,2 |
27,7 |
144,04 |
27,04 |
767,29 |
|
5 |
6,3 |
28,1 |
177,03 |
39,69 |
789,61 |
|
6 |
7,1 |
28,4 |
201,64 |
50,41 |
806,56 |
|
7 |
8,4 |
29,1 |
244,44 |
70,56 |
846,81 |
|
8 |
9,5 |
29,4 |
279,3 |
90,25 |
864,36 |
|
Разом |
46 |
223,3 |
1 302,6 |
310,2 |
6 240,49 |
Тоді:
= 310,2 / 8 - (46 / 8) 2 = 5,7125;
= 6 240,49 / 8 - (223,3 / 8) 2 = 0,9536
= = 0,997
Для n = 8, rкр = 0,71. Оскільки розраховане значення коефіцієнта кореляції Пірсона більше за його критичне значення, то зв'язок є істотним.
Коефіцієнт кореляції Пірсона набуває значень у межах , тому характеризує не лише щільність, а й напрямок зв'язку. Додатне значення свідчить про прямий зв'язок, а від'ємне - про обернений.
Відповідь: лінія регресії має вигляд: у = 25,57 + 0,408· х; лінійний коефіцієнт кореляції Пірсона r = 0,997 свідчить про щільний прямий зв'язок.
Приклад 2
Дані про споживання м'яса та м'ясопродуктів у домогосподарствах з різним рівнем середньодушового сукупного доходу наведено у таблиці:
Рівень середньодушового сукупного доходу |
Кількість сімей |
Споживання м'яса в середньому на члена сімї за рік, кг |
|
Низький |
6 |
48, 62, 40, 52, 50, 36 |
|
Середній |
10 |
91 96 84 95 98 94 92 89 98 92 |
|
Високий |
4 |
100 112 108 110 |
Встановити взаємозв'язок та оцінити його істотність і щільність за допомогою методу аналітичного групування.
Розв'язання:
Розрахуємо середні величини в кожній групі за формулою середньої арифметичної простої:
= (48 + 62 + 40 + 52 + 50 + 36) / 6 = 48;
= (91 + 96 + 84 + 95 + 98 + 94 + 92 + 89 + 98 + 92) / 10 = 84,6;
= (100 + 112 + 108 + 110) / 4 = 107,5.
Загальну середню для всієї сукупності обчислимо за формулою середньої арифметичної зваженої, де в якості окремих ознак беруться середні кожної групи, а частотами є обсяги відповідних груп:
= (48 Ч 6 + 84,6 Ч 10 + 107,5 Ч 4) / 20 = 78,2.
Визначаємо групові дисперсії за формулою:
Тоді: = (48 - 48)2 + (62 - 48)2 + (40 - 48)2 + (52 - 48)2 + (50 - 48)2 +
+ (36 - 48)2 / 6 ? 70,67;
= (91 - 84,6)2 + (96 - 84,6)2 + (84 - 84,6)2 + (95 - 84,6)2 + (98 - 84,6)2
+ (94 - 84,6)2 + (92 - 84,6)2 + (89 - 84,6)2 + (98 - 84,6)2 + (92 - 84,6)2 /
/ 10 = 85,58;
= (100 - 107,5)2 + (112 - 107,5)2 + (108 - 107,5)2 + (110 - 107,5)2 / 4 =
= 20,75.
Середню з групових дисперсій розрахуємо за формулою:
= (70,67 Ч 6 + 85,58 Ч 10 + 20,75 Ч 4) / 20 = 68,14.
Міжгрупову дисперсію обчислимо за формулою:
(48 - 78,2)2 Ч 6 + (84,6 - 78,2)2 Ч10 + (107,5 - 78,2)2 Ч 4 / 20 =
= 465,79
Використовуючи правило складання дисперсій , визначимо загальну дисперсію:
= 465,79 + 68,14 = 533,93.
Обчислимо кореляційне відношення:
= 465,79 / 533,93 = 0,872.
Критичне значення кореляційного відношення для обсягу сукупності 20 одиниць та трьох груп дорівнює 0,318.
Відповідь: Оскільки розраховане кореляційне відношення більше за його критичне значення, між рівнем середньодушового доходу та споживанням м'яса існує прямий щільний зв'язок.
Размещено на Allbest.ru
...Подобные документы
Основи аналізу простої лінійної та нелінійної кореляції, аналіз регресії і оцінка тісноти зв’язку. Аналіз урожайності зернових культур методом множинної кореляції. Особливості використання непараметричних методів визначення тісноти кореляційного зв’язку.
курсовая работа [318,6 K], добавлен 19.05.2011Класифікаційні групи занять та професій населення, обчислення його розподілу. Розрахунок чисельності громадян у відповідності з джерелами засобів їх існування. Проведення кореляційного дослідження зв'язку між економічно активним і зайнятим населенням.
курсовая работа [283,0 K], добавлен 05.11.2013Зв’язки суспільних явищ, види їх зв’язків. Загальні методи вивчення зв’язків. Метод аналітичних групувань, порівняння паралельних рядів. Кореляційний аналіз, коефіцієнт Фішера. Аналіз зв’язку між атрибутивними ознаками. Показник рангової кореляції.
курсовая работа [410,4 K], добавлен 20.10.2012Основи економічного аналізу продуктивності праці. Система статистичних показників рівня продуктивності праці у тваринництві. Застосування кореляційного методу в аналізі продуктивності. Визначення тенденції трудомісткості продукції тваринництва.
курсовая работа [128,3 K], добавлен 10.11.2010Економічні способи підходу до вивчення господарських процесів у їхньому становленню і розвитку. З'ясування і вимірювання взаємозв'язку між економічними показниками з метою підвищення соціально-економічної ефективності. Побудова аналітичних групувань.
контрольная работа [70,8 K], добавлен 13.11.2010Отримання вибіркових даних. Розрахунок похідних показників. Групування даних та розрахунок описової статистики і перевірка однорідності вибіркової сукупності. Поширення вибіркових результатів на генеральну сукупність. Оцінка достатності обсягу вибірки.
курсовая работа [695,3 K], добавлен 13.12.2010Аналіз діяльності підприємства методом ланцюгових підстановок. Сутність визначення рентабельність підприємства. Розрахунок загального індексу зміни узагальнюючого показника. Характеристика багатофакторного кореляційного аналізу. Аналіз валової продукції.
контрольная работа [876,0 K], добавлен 24.04.2015Групування статичних даних та обчислення статичних показників. Практичне застосування методики проведення статистичних групувань, вивчення залежності. Аналіз рядів динаміки, індексний і кореляційний аналіз. Визначення тенденції розвитку та прогнозування.
курсовая работа [39,0 K], добавлен 17.10.2009Розрахунок збільшення випуску продукції та приросту продуктивності праці. Аналіз відносних величин динаміки обсягу виробництва продукції. Особливості обчислення кореляційного відношення між процентом виконання норми виробітку і кваліфікацією робітників.
контрольная работа [162,1 K], добавлен 28.07.2016Зведення та групування статистичних даних за факторною ознакою, за результативною ознакою. Обчислення показників варіації, характеристик рядів динаміки. Статистичні методи вивчення взаємозв'язків між факторною та результативною ознаками.
курсовая работа [605,8 K], добавлен 21.06.2002Поняття та ознаки монопольного становища. Особливості конкуренції на ринку мобільного зв’язку. Способи припинення зловживання монопольним становищем на ринку. Напрямки вдосконалення державної конкурентної політики на ринку мобільного зв’язку в Україні.
курсовая работа [86,0 K], добавлен 11.07.2010Принципи групування регіонів за обсягом інвестицій на душу населення. Дослідження зв'язку темпів приростів валового регіонального продукту та обсягів фінансових капіталовкладень в розвиток області. Оцінка ефективності інвестиційної діяльності в регіонах.
реферат [1,3 M], добавлен 26.11.2010Форми та методи організації проведення аналітичної роботи на підприємстві. Використання в аналізі діалектичного методу. Вивчення і вимірювання причинних зв'язків. Деталізація обєктів аналізу. Їх систематизація. Узагальнення (синтез) - підсумок аналізу.
курсовая работа [76,7 K], добавлен 12.09.2007Групування як розділення сукупності статистичних показників на групи однорідні за якоюсь ознакою. Гістограма як графічне зображення залежності частоти попадання елементів вибірки від відповідного інтервалу угрупування. Використання критерію Фішера.
контрольная работа [172,4 K], добавлен 12.01.2010Формування собівартості продукції. Коротка характеристика "Елеко ЛТД". Виявлення взаємозв'язку прибутковості з основними фінансовими показниками діяльності підприємства та резервів її збільшення. Аналіз витрат та прибутку при виробництві продукції.
курсовая работа [189,1 K], добавлен 16.02.2011Методологічні основи соціально-економічного прогнозування. Методи, моделі прогнозування одновимірних і багатовимірних процесів. Побудова багатофакторної індексної моделі. Особливості моделювання взаємозв'язаних динамічних рядів. Методи експертних оцінок.
курс лекций [258,6 K], добавлен 25.01.2010Економічна сутність витрат підприємства на виробництво продукції. Аналіз взаємозв’язку витрат, обсягу діяльності та прибутку. Удосконалення організації та автоматизація аналізу витрат на виробництво на основі використання інформаційних технологій.
курсовая работа [222,8 K], добавлен 23.11.2014Побудова інтервального ряду розподілу підприємств за обсягом виручки. Обчислення вибіркових характеристик розподілу. Визначення середньої частки вкладів населення в комерційних банках, середньорічної кількості безробітних та середньорічний темп приросту.
контрольная работа [109,4 K], добавлен 17.01.2011Система економічних законів, їх суть і класифікація. Основні фактори суспільного виробництва: сутність і співвідношення. Виробничі ресурси, їх обмеженість. Економічні інтереси і потреби: діалектика взаємозв’язку. Еволюція грошей.
шпаргалка [22,9 K], добавлен 17.06.2007Економічна сутність кредиторської заборгованості підприємства, її роль і значення в сучасних умовах господарювання. Аналітичний пошук резервів ПАТ "Суха Балка" та оцінка їх взаємозв’язку з фінансово-економічними результатами діяльності організації.
курсовая работа [78,5 K], добавлен 09.06.2014