Коефіцієнт кореляції та детермінації

Побудова кореляційних моделей. Основні завдання кореляційного аналізу. Визначення коефіцієнта детермінації. Зв’язок між коефіцієнтом кореляції і регресії. Характеристика коефіцієнта залишкової детермінації. Вимірювання щільності криволінійного зв’язку.

Рубрика Математика
Вид реферат
Язык украинский
Дата добавления 11.11.2017
Размер файла 96,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Реферат

на тему: Коефіцієнт кореляції та детермінації

Побудова кореляційних моделей дає можливість вивчати залежність економічних показників, що не зв'язані між собою функціонально. Кореляційний зв'язок на відміну від функціонального проявляється лише взагалі та в середньому і тільки в масі спостережень.

Кореляційний аналіз вирішує два завдання:

1) визначення форми зв'язку, тобто встановлення математичної формули, яка описує даний зв'язок;

2) вимірювання щільності зв'язку.

У найпростішому випадку вивчається зв'язок між двома показниками, один з яких розглядається як незалежний показник - факторна ознака (х), а інший - як залежна величина, результативна ознака (у). Це є так звана “парна кореляція”. В загальному вигляді вона описується функцією у=ѓ(х).

Попередньо вид математичної функції встановлюється за допомогою якісного аналізу зв'язку між явищами та графічного його зображення у вигляді кореляційного поля.

Кореляційне поле - це сукупність точок у прямокутній системі координат, абсциса кожної з яких відповідає значенню факторної ознаки (х), а ордината - значенню результативної ознаки (у) певної одиниці спостереження. Кількість точок на графіку відповідає кількості одиниць спостереження. Напрямленість кореляційного поля вказує на наявність прямого, зворотного зв'язку між ознаками, або його відсутність, а також на форму лінії регресії (пряма лінія, парабола, гіпербола тощо).

Після того, як визначені невідомі параметри регресійної моделі спробуємо оцінити щільність зв'язку між залежною величиною у і незалежною х. Тобто спробуємо відповісти на запитання, наскільки значним є вплив змінної х на у. Чи є якийсь критерій, який дозволяє кількісно оцінити цей вплив? Найпростішим критерієм, який дає кількісну оцінку зв'язку між двома показниками є коефіцієнт кореляції (для прямолінійного зв'язку). Він розраховується за такою формулою:

кореляційний детермінація регресія криволінійний

Щільність зв'язку між ознаками вимірюється за допомогою коефіцієнта кореляції (для прямолінійного зв'язку) та індексу кореляції (для криволінійного зв'язку).

Коефіцієнт кореляції може бути обчислений також за формулою:

,

де - середній добуток ознак х та у;

- середнє значення ознаки відповідно х і у;

ух - середнє квадратичне відхилення ознаки х; уу - середнє квадратичне відхилення ознаки у.

; ,

Коефіцієнт кореляції на відміну від коефіцієнта коваріації є вже не абсолютною, а відносною мірою зв'язку між двома ознаками, тому він може набувати значення від -1 до +1. Чим ближче значення r до ±1, тим щільніший зв'язок. Знак “+” вказує на прямий, а знак “-“ - на зворотний зв'язок. При r=0 зв'язок відсутній.

Поряд з коефіцієнтом кореляції використовується ще один критерій, за допомогою якого також вимірюється щільність зв'язку між двома або більше показниками та перевіряється адекватність (відповідність) побудованої регресійної моделі реальній дійсності. Тобто дається відповідь на запитання, чи дійсно зміна значення у лінійно залежить саме від зміни значення х, а не відбувається під впливом різних випадкових факторів. Таким критерієм є коефіцієнт детермінації.

Щоб пояснити, що саме являє собою коефіцієнт детермінації та як він пов'язаний з коефіцієнтом кореляції, розглянемо питання про декомпозицію дисперсій.

У статистиці різницю прийнято називати загальним відхиленням. Різницю називають відхиленням, яке можна пояснити, виходячи з регресійної прямої. Різницю називають відхиленням, яке не можна пояснити, виходячи з регресійної прямої, або не пояснюваним відхиленням. Загальне відхилення розкладається на дві складові:

=+

Піднесемо ці різниці до квадрату і просумуємо для всіх одиниць спостереження. Одержимо:

- загальна сума квадратів

- сума квадратів, що пояснює регресію;

- сума квадратів помилок.

Справедливий такий вираз:

=+.

Поділивши цей вираз на п, отримаємо вираз для дисперсій:

+,

де - загальна дисперсія ознаки у;

- дисперсія, що пояснює регресію;

- дисперсія помилок.

Таким чином ми здійснили декомпозицію дисперсії, тобто розклали загальну дисперсію на дві частини: дисперсію, що пояснює регресію, та дисперсію помилок (або дисперсію випадкової величини). Запишемо це у такому вигляді:

.

Поділимо обидві частини на загальну дисперсію і отримаємо:

У цьому виразі перша частина - це частка дисперсії, що пояснюється регресією, а друга - частка помилок в загальній дисперсії.

Частина дисперсії, що пояснює регресію, називається коефіцієнтом детермінації і позначається r2. Коефіцієнт детермінації використовується як критерій адекватності моделі, бо є мірою пояснювальної сили незалежної змінної х.

Коефіцієнт детермінації визначається за формулою:

, або

Коефіцієнт детермінації завжди позитивний і перебуває в межах від нуля до одиниці. Він показує, яка частка коливань результативної ознаки y зумовлена коливанням факторної ознаки х.

Звичайно, нас цікавить, чи є зв'язок між коефіцієнтом кореляції та коефіцієнтом детермінації, і якщо є , то який? Перш ніж відповісти на це питання, розглянемо зв'язок між коефіцієнтом кореляції та нахилом регресійної лінії, тобто параметром а1. Нагадаємо формули для розрахунків коефіцієнта кореляції та нахилу:

;

.

Помножимо чисельник і знаменник виразу для обчислення коефіцієнта кореляції на .і зробимо деякі перетворення

.

З того, що обидва значення та додатні, випливає, що знак коефіцієнта кореляції завжди збігається із знаком параметра а1.

Крім того, випливає, що значення коефіцієнта кореляції пов'язане із значеннями коефіцієнта регресії а1 та середніх квадратичних відхилень.

Знаючи зв'язок між коефіцієнтом кореляції і коефіцієнтом регресії, розглянемо зв'язок між коефіцієнтом кореляції і коефіцієнтом детермінації. Нагадаємо формулу для розрахунку коефіцієнта детермінації:

Виконаємо прості перетворення з виразом чисельника:

.

Внесемо зміни до виразу коефіцієнта детермінації, враховуючи останні перетворення:

.

Оскільки , то .

Отже коефіцієнт детермінації дорівнює квадрату коефіцієнта кореляції. Тому коефіцієнт кореляції може розраховуватись за формулою:

,

де уy2 - загальна дисперсія ознаки y,

,

уyx2 - середній квадрат відхилення фактичних значень ознаки y від теоретичних значень yx,

.

Якщо коефіцієнт кореляції розраховується як корінь із коефіцієнта детермінації, то йому присвоюється той знак, який має коефіцієнт a1 , тобто коефіцієнт регресії в рівнянні прямолінійного зв'язку.

Величину 1-r2 називають коефіцієнтом залишкової детермінації. Вона характеризує частку варіації ознаки y за рахунок неврахованих факторів.

Індекс кореляції (R) використовується для вимірювання щільності криволінійного зв'язку і визначається аналогічно до коефіцієнта кореляції (r) за формулою:

.

Індекс кореляції приймає значенням від 0 до 1. Певного знака він не має, оскільки на різних відрізках кривої напрям зв'язку може змінюватись.

Індекс кореляції - умовна величина, розрахована лише по відношенню до певної кривої. ЇЇ значення може бути доведене до 1, якщо в якості кривої, що описує зв'язок, взяти параболу, в якій кількість параметрів доведена до кількості одиниць спостереження. Така крива пройде через всі точки графіка, всі відхилення фактичних значень результативної ознаки від теоретичних, розрахованих за рівнянням такої кривої, будуть дорівнювати 0, і тому величина індекса кореляції досягне 1. Однак, було б помилкою вважати, що це є ознакою того, що дана крива найкраще описує досліджувану залежність. Надто складні рівняння регресії як правило позбавлені реального економічного змісту, оскільки в них втрачається відмінність між нетиповим і суттєвим, а випадковість зводиться в ранг закономірності. Тому не доцільно надто ускладнювати рівняння кривої. Рівняння досліджуваного зв'язку має бути по можливості простим, щоб сутність зв'язку між змінними проявлялась досить чітко, а параметри рівняння піддавались певному економічному тлумаченню.

Приклад

Відомі дані про рівень електроозброєності та продуктивності праці робітників на 10 підприємствах галузі (табл.6.1, графи 1?3). Потрібно визначити показники щільності зв'язку між цими показниками.

Для обчислення коефіцієнта кореляції скористаємося формулою

Таблиця 1 Обчислення виконуємо в табл.6.1 (графи 7?10):

Номер заводу

Електро-озброєність праці, х кВт.год

Продук-тивність праці у, тис. грн.

ху

х2

ух

у - ух

( у - ух )2

1

2

3

4

5

6

7

8

9

10

1

2

3

6

4

3,61

-3

9

-0,61

0,3721

2

5

6

30

25

6,00

0

0

0

0

3

3

4

12

9

4,41

-2

4

-0,41

0,1681

4

7

6

42

49

7,59

0

0

-1,59

2,5281

5

2

4

8

4

3,61

-2

4

0,39

0,1521

6

6

8

48

36

6,80

2

4

1,20

1,4400

7

4

6

24

16

5,20

0

0

0,80

0,6400

8

9

9

81

81

9,19

3

9

-0,19

0,0361

9

8

9

72

64

8,38

3

9

0,62

0,3844

10

4

5

20

16

5,20

-1

1

-0,20

0,0400

Разом

50

60

343

304

60

0

40

-

5,7609

.

Коефіцієнту кореляції присвоюється знак, який має коефіцієнт a1 в рівнянні зв'язку, тобто „плюс” і отже його значення становить +0,925, що свідчить про щільний прямий зв'язок між ознаками.

Коефіцієнт детермінації r2=0,856. Він вказує на те, що 85,6% варіації рівня продуктивності праці на досліджуваних підприємствах зумовлено варіацією електроозброєності. Коефіцієнт залишкової детермінації (1-0,856) вказує на те, що 14,4% варіації рівня продуктивності праці пояснюється дією інших причин.

Размещено на Allbest.ru

...

Подобные документы

  • Поняття економетричної моделі та етапи її побудови. Сутність та характерні властивості коефіцієнта множинної кореляції. Оцінка значущості множинної регресії. Визначення довірчих інтервалів для функції регресії та її параметрів. Метод найменших квадратів.

    курсовая работа [214,6 K], добавлен 24.05.2013

  • Обчислення оцінок основних статистичних характеристик: середнього значення, середнього квадратичного відхилення результатів, дисперсії розсіювання результатів вимірювань, коефіцієнта асиметрії. Перевірка наявніості похибок за коефіцієнтом Стьюдента.

    контрольная работа [245,5 K], добавлен 25.02.2011

  • Основні поняття логлінійного аналізу - статистичного аналізу зв’язку таблиць спряженості за допомогою логлінійних моделей. Аналіз зв’язку категоризованих змінних. Канонічна кореляція при аналізі таблиць спряженості ознак. Побудова логарифмічної моделі.

    контрольная работа [87,4 K], добавлен 12.08.2010

  • Характеристика, поняття, сутність, положення і особливості методів математичної статистики (дисперсійний, кореляційний і регресійний аналіз) в дослідженнях для обробки експериментальних даних. Розрахунки для обчислення дисперсії, кореляції і регресії.

    реферат [140,6 K], добавлен 25.12.2010

  • Основні поняття математичної статистики. Оцінювання параметрів розподілів. Метод максимальної правдоподібності. Парадокси оцінок математичного сподівання та дисперсії, Байєса, методу найменших квадратів, кореляції, перевірки гіпотез та їх пояснення.

    дипломная работа [1,1 M], добавлен 12.08.2010

  • Визначення метричного простору. Границя функції у точці. Властивості границь дійсних функцій. Властивості компактних множин. Розв’язок системи лiнiйних рівнянь. Теорема про існування i єдність розв’язку диференціального рівняння. Нумерація формул.

    методичка [461,1 K], добавлен 25.04.2014

  • Знаходження коефіцієнтів для рівнянь нелінійного виду та аналіз рівняння регресії. Визначення параметрів емпіричної формули. Метод найменших квадратів. Параболічна інтерполяція, метод Лагранжа. Лінійна кореляція між випадковими фізичними величинами.

    курсовая работа [211,5 K], добавлен 25.04.2014

  • Розв'язання завдання графічним способом. Зображення розв'язку системи нерівностей, визначення досягнення максимуму та мінімуму функції. Розв'язання транспортної задачі методом потенціалів та симплекс-методом, формування оціночної матриці з елементів.

    задача [134,9 K], добавлен 31.05.2010

  • Поняття криволінійного інтеграла першого роду (по довжині дуги). Обчислення криволінійних інтегралів першого роду. Застосування криволінійного інтеграла першого роду. Фізичний зміст та поняття криволінійного інтеграла другого роду (по координатах).

    реферат [535,9 K], добавлен 10.03.2011

  • Загальні властивості диференціальних рівнянь Ріккаті. Прості випадки інтегрованості в квадратурах. Побудова загального розв’язку у випадку, коли відомий один частинний розв’язок. Структура загального розв’язку, коли відомо два або три частинних розв’язки.

    курсовая работа [134,0 K], добавлен 22.01.2013

  • Застосування методів математичного аналізу для знаходження центрів мас кривих, плоских фігур та поверхонь з використанням інтегральних числень функцій однієї та кількох змінних. Поняття визначеного, подвійного, криволінійного та поверхневого інтегралів.

    курсовая работа [515,3 K], добавлен 29.06.2011

  • Основні правила нанесення розмірів. Рекомендації з виконання креслень. Проведення паралельних і перпендикулярних ліній. Розподіл відрізка прямої на рівні частини. Побудова і розподіл кутів. Пошук центра окружності чи дуги і визначення їхніх радіусів.

    практическая работа [2,4 M], добавлен 03.03.2016

  • Означення і основні властивості інтеграла Стілтьєса, його зв’язок, особливості і відмінності від інших визначених інтегралів і загальні умови існування. Приклади застосування інтеграла для розв’язку різних класів задач. Узагальнення інтегралу Рімана.

    курсовая работа [370,2 K], добавлен 21.05.2009

  • Поняття математичного моделювання. Форми завдання моделей: інваріантна; алгоритмічна; графічна (схематична); аналітична. Метод ітерацій для розв’язку систем лінійних рівнянь, блок-схема. Інструкція до користування програмою, контрольні приклади.

    курсовая работа [128,6 K], добавлен 24.04.2011

  • Послідовність графічного розв'язання задачі лінійного програмування. Сумісна система лінійних нерівностей, умови невід'ємності, визначення півплощини з граничними прямими. Графічний метод для визначення оптимального плану задачі лінійного програмування.

    задача [320,6 K], добавлен 31.05.2010

  • Поняття статистичного зведення та його види. Основні завдання методології статистичних групувань. Класифікація в правовій статистиці. Правила до статистичних таблиць та статистичні ряди розподілу. Взаємозв`язок між факторною і результативною ознаками.

    курсовая работа [55,1 K], добавлен 05.02.2011

  • Визначення кількості сполучень при дослідженні ймовірностей. Закон розподілу випадкової величини. Функція розподілу, знаходження середнього квадратичного відхилення. Визначення щільності розподілу ймовірностей. Закон неперервної випадкової величини.

    контрольная работа [71,3 K], добавлен 13.03.2015

  • Поняття про алгебраїчний метод у геометрії. Побудова коренів квадратного рівняння та формул. Побудова деяких однорідних виразів циркулем і лінійкою. Ознака можливості побудови відрізка. Розв’язування задач на побудову. Поняття про однорідні функції.

    курсовая работа [920,5 K], добавлен 17.03.2011

  • Розв'язання задач з теорії множин та математичної логіки. Визначення основних характеристик графа г (Х,W). Розклад функцій дискретного аргументу в ряди по базисним функціям. Побудова та доведення діаграми Ейлера-Вена. Побудова матриці інцидентності графа.

    курсовая работа [988,5 K], добавлен 20.04.2012

  • Теоретичні і прикладні питання математичної фізики й функціонального аналізу. Узагальнена похідна в просторі Соболєва: визначення, гладкі функції; найпростіша теорема вкладення. Доказ існування і одиничності узагальненого рішення рівняння Лапласа.

    реферат [231,3 K], добавлен 28.01.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.