Корреляционный анализ

Определение сущности корреляционного анализа – совокупности математических методов обнаружения корреляционной зависимости между двумя случайными признаками. Ознакомление со шкалой Чеддока. Исследование функций биссериального коэффициента корреляции.

Рубрика Математика
Вид лекция
Язык русский
Дата добавления 08.10.2017
Размер файла 1,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

0,40

0,36

y20

0,51

0,36

-0,01

-0,05

0,41

0,44

0,28

0,45

0,23

y21

0,53

0,36

-0,13

-0,01

0,45

0,51

0,08

0,49

0,24

y22

0,43

0,29

-0,13

-0,04

0,36

0,41

0,06

0,40

0,16

y23

0,42

0,49

0,08

0,02

0,50

0,39

0,10

0,54

0,06

y24

0,86

0,64

-0,16

0,04

0,75

0,86

0,21

0,79

0,52

y25

0,32

0,14

-0,24

0,03

0,21

0,32

-0,03

0,20

0,34

y26

0,27

-0,03

-0,22

0,03

0,07

0,26

0,10

0,12

0,25

y27

0,04

0,11

-0,04

-0,11

0,09

0,09

-0,07

0,09

0,02

Приведем диаграммы коэффициентов корреляции для наиболее важных результативных показателей условий жизни на рис. 9.2 - рис.9.

Рис. 9.2. Диаграмма коэффициентов корреляции для переменной y2

Рис. 9.3. Диаграмма коэффициентов корреляции для переменной y10

Рис. 9.4 Диаграмма коэффициентов корреляции для переменной у13

10. Множественная корреляция

Для определения тесноты связи между откликом и несколькими факторами на практике используются следующие коэффициенты: конкордации, множественной корреляции и множественной детерминации.

Коэффициент конкордации - определяет тесноту связи между произвольным количеством признаков, которые могут быть качественными или количественными. Требуется, чтобы они были проранжированными.

Коэффициент конкордации вычисляется по следующей формуле:

(10.1)

где m - количество признаков;

n - общее количество наблюдений;

S - отклонение суммы квадратов рангов от средней квадратов рангов которое вычисляется по формуле:

(10.2)

где n - общее количество наблюдений;

si - сумма рангов всех признаков по i-ой строке.

Сила связи определяется по критерию Пирсона, вычисляемого по формуле:

(10.3)

Вычисление коэффициента конкордации продемонстрируем на примере определения тесноты связи между уставным капиталом, числом акций, выставленных на продажу, и уставным капиталом. Исходные данные и результаты предварительных расчётов представлены в таблице 10.1.

Таблица 10.1. Исходные данные примера 10.1

Устав.

кап. -х

Число

акций -у

Число работников - z

Ранг

х

Ранг

у

Ранг

z

Сумма

строк

Квадр.

сумм

1

29540

856

119

9

7

1

17

289

2

16050

930

125

1

9

2

12

144

3

41020

1563

132

10

10

3

23

529

4

23500

682

141

6

5

4

15

225

5

26250

616

150

7

3

5

15

225

6

17950

495

165

4

2

6

12

144

7

28130

815

178

8

6

7

21

441

8

17510

858

181

3

8

8

19

361

9

17000

467

201

2

1

9

12

144

10

22640

661

204

5

4

10

19

361

Итого

165

2863

Вычислим отклонение суммы квадратов рангов от среднего значения квадратов рангов:

S= 2863-1652/10=140.5.

По (10.1) вычислим коэффициент конкордации:

W=12·140.5/(32(103-10))=0.19.

По (10.2) вычислим значение критерия Пирсона:

ч2=12·140.5/(3·10·(10-1))=6.2

По статистической таблице [2] находим критическое значение критерия Пирсона для рекомендуемого уровня значимости б=0.05 и количества степеней свободы n-1=10-1=9: ч2крит=16.919. Ввиду того, что вычисленное значение критерия Пирсона не превышает критическое значение делаем заключение об отсутствии связи между откликом - уставным капиталом и двумя факторами: количеством акций, выставленных на продажу, и количеством работников на предприятиях.

Коэффициенты множественной детерминации и корреляции требуют наличия линейной зависимости между откликом и всеми факторами и нормальности всех переменных, используемых в вычислениях. К достоинствам этих коэффициентов относится наличие возможности оценки их существенности.

Эти показатели как правило используются для оценки качества уравнений регрессии в стандартных процедурах регрессионного анализа. Они также могут использоваться и для самостоятельных расчётов по определению силы связи между случайными переменными. Вычисления являются матричными и поэтому при проведении вычислений без применения компьютеров сложными.

Для вычисления коэффициента множественной детерминации требуется первоначально вычислить парные коэффициенты линейной корреляции между всеми переменными, т.е. откликом и всеми факторами и составить соответствующую матрицу. Коэффициент множественной детерминации - R2y,x1,x2,…xm делением определителя матрицы Д* на определитель матрицы Д.

По статистическим таблицам [11] находим критические значения коэффициентов множественной детерминации и корреляции для рекомендуемого уровня значимости б=0.05 и количества степеней свободы равного количеству наблюдений минус 1, и если вычисленные значения превышают критические, то корреляционная связь между откликом и факторами считается существенной.

Для простоты приведём пример вычисления коэффициентов детерминации и корреляции для результативного показателя у - добычи нефти и двух наиболее существенно влияющих на неё факторов: х1 - разведочного бурения и х2 - количества добывающих скважин.

Провести корреляционный анализ показателей нефтегазодобывающей отрасли России, приведённых в таблице 10.2, полученные по таблице 9.4. Для упрощения формул фактор х4 таблицы 9.4 переименован в фактор х2.

Таблица 10.2. Исходные данные

Показатель

Код

1996 г.

1977 г.

1998 г.

1999 г.

2000 г.

2001 г.

2002 г.

Добыча нефти

в млн. тонн

y

269,91

270,94

264,70

268,53

281,29

301,73

341,60

Разведочное бурение

в тыс. метрах

x1

1026,4

1006,7

789.0

824,9

1013,7

1145,1

1410,4

Кол. добывающих скважин

х2

106645

101224

97557

101937

109939

114883

113672

По данным таблицы 10.2 вычислены коэффициенты линейной корреляции между всеми переменными и результаты вычислений помещены в таблицу 10.3.

Таблица 10.3. Коэффициенты линейной корреляции для переменных

Коды

y

x1

x2

y

1

0,932

0,865

x1

0,932

1

0,831

x2

0,865

0,831

1

Коэффициент множественной детерминации вычисляется по формуле:

Коэффициент множественной корреляции вычисляется по формуле:

Проведём вычисления по формулам:

По шкале Чеддока коэффициент множественной корреляции попадает в диапазон значений от 0.5 до 0.7 и следовательно корреляционная связь между результативным показателем у - добычи нефти и двух влияющих на неё факторов: х1 - разведочного бурения и х4 - количества добывающих скважин должна быть отнесена к заметным.

Полезно бывает вычислить и частные коэффициенты корреляции, которые исключают влияние всех факторов кроме одного, по следующим формулам:

Естественно, что влияние фактора х1 на х2 без учёта влияния результативного показателя у такое же как влияние фактора х2 на х1 без учёта влияния результативного показателя у:

По формулам вычислим частные коэффициенты корреляции.

Частные коэффициенты линейной корреляции уменьшают значения коэффициентов линейной корреляции за счёт исключения совместного влияния переменных, что не противоречит здравому смыслу.

Размещено на Allbest.ru

...

Подобные документы

  • Установление корреляционных связей между признаками многомерной выборки. Статистические параметры регрессионного анализа линейных и нелинейных выборок. Нахождение функций регрессии и проверка гипотезы о значимости выборочного коэффициента корреляции.

    курсовая работа [304,0 K], добавлен 02.03.2017

  • Функциональные и корреляционные зависимости. Сущность корреляционной связи. Методы выявления наличия корреляционной связи между двумя признаками и измерение степени ее тесноты. Построение корреляционной таблицы. Уравнение регрессии и способы его расчета.

    контрольная работа [55,2 K], добавлен 23.07.2009

  • Показатели тесноты связи. Смысл коэффициентов регрессии и эластичности. Выявление наличия или отсутствия корреляционной связи между изучаемыми признаками. Расчет цепных абсолютных приростов, темпов роста абсолютного числа зарегистрированных преступлений.

    контрольная работа [1,5 M], добавлен 02.02.2014

  • Проведение аналитической группировки и дисперсионного анализа данных, с целью количественно определить тесноту связи. Определение степени корреляции между группировочными признаками и вариационной зависимости переменной, обусловленной регрессией.

    контрольная работа [140,5 K], добавлен 17.08.2014

  • Обработка одномерной и двумерной случайных выборок. Нахождение точечных оценок. Построение гистограммы функций распределения, корреляционной таблицы. Нахождение выборочного коэффициента корреляции. Построение поля рассеивания, корреляционные отношения.

    курсовая работа [1,3 M], добавлен 10.06.2013

  • Задачи которые решает корреляционный анализ. Определение формы связи - установление математической формы, в которой выражается связь. Измерение тесноты, т.е. меры связи между признаками с целью установления степени влияния данного фактора на результат.

    реферат [67,3 K], добавлен 09.11.2010

  • Понятие корреляционного момента двух случайных величин. Математическое ожидание произведения независимых случайных величин Х и У. Степень тесноты линейной зависимости между ними. Абсолютное значение коэффициента корреляции, его расчет и показатель.

    презентация [92,4 K], добавлен 01.11.2013

  • Исследование зависимости потребления бензина в городе от количества автомобилей с помощью методов математической статистики. Построение диаграммы рассеивания и определение коэффициента корреляции. График уравнения линейной регрессии зависимости.

    курсовая работа [593,2 K], добавлен 28.06.2009

  • Значение математической статистики для анализа закономерностей массовых явлений. Основные теоретические выкладки корреляционного анализа. Применение его инструментария в контексте металлургической промышленности в среде программного средства Statistica 6.

    реферат [261,4 K], добавлен 03.08.2014

  • Понятие комплекса случайных величин, закона их распределения и вероятностной зависимости. Числовые характеристики случайных величин: математическое ожидание, момент, дисперсия и корреляционный момент. Показатель интенсивности связи между переменными.

    курсовая работа [2,4 M], добавлен 07.02.2011

  • Исследование влияния техногенного воздействия на структуру порового пространства, фильтрационно-емкостные свойства нефтенасыщенных коллекторов. Построение диаграммы рассеивания, гистограммы частот, корреляционной таблицы. Метод доверительных интервалов.

    курсовая работа [992,6 K], добавлен 06.04.2014

  • Определение зависимости между танцем и математикой на примере изучения белорусских народных танцев. Анализ математических составляющих танца. Ознакомление с особенностями использования геометрических фигур в постановке национальных белорусских танцев.

    контрольная работа [994,7 K], добавлен 15.09.2019

  • Определение наличия зависимости показателя Заработная плата от Возраста и Стажа с использованием корреляционной матрицы. Нормальность распределения остатков по: гистограмме остатков, числовым характеристикам асимметрии и эксцессу, критерию Пирсона.

    курсовая работа [1,1 M], добавлен 05.12.2013

  • Анализ исследований в области лечения диабета. Использование классификаторов машинного обучения для анализа данных, определение зависимостей и корреляции между переменными, значимых параметров, а также подготовка данных для анализа. Разработка модели.

    дипломная работа [256,0 K], добавлен 29.06.2017

  • Вероятность и ее общее определение. Теоремы сложения и умножения вероятностей. Дискретные случайные величины и их числовые характеристики. Закон больших чисел. Статистическое распределение выборки. Элементы корреляционного и регрессионного анализа.

    курс лекций [759,3 K], добавлен 13.06.2015

  • Предпосылки корреляционного анализа - математико-статистического метода выявления взаимозависимости компонентов многомерной случайной величины и оценки их связи. Точечные оценки параметров двумерного распределения. Аппроксимация уравнений регрессии.

    контрольная работа [648,3 K], добавлен 03.04.2011

  • Система линейных неравенств, определяющих треугольник. Доказательство базиса четырехмерного пространства и определение координат вектора. Исследование функций на периодичность, монотонность и экстремум. Площади фигуры, ограниченной графиками функций.

    контрольная работа [174,5 K], добавлен 26.01.2010

  • Механизм и основные этапы нахождения необходимых параметров методом наименьших квадратов. Графическое сравнение линейной и квадратичной зависимостей. Проверка гипотезы о значимости выборочного коэффициента корреляции при заданном уровне значимости.

    курсовая работа [782,6 K], добавлен 19.05.2014

  • Cтатистический анализ зависимости давления. Построение диаграммы рассеивания и корреляционной таблицы. Вычисление параметров для уравнений линейной и параболической регрессии, выборочных параметров. Проверка гипотезы о нормальном распределении признака.

    курсовая работа [613,3 K], добавлен 24.10.2012

  • Сущность и содержание корреляционного и регрессивного анализа, элементарные и индексные методы обработки расчетных данных. Диагностика объема производства и реализации продукции, материальных ресурсов, себестоимости продукции, финансовых результатов.

    курсовая работа [1,1 M], добавлен 10.06.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.