Корреляционная связь
Формы проявления взаимосвязей. Метод ранговой корреляции (Спирмена rs), область применения. Способы субъективного измерения: ранжирование, парное сравнение и последовательное сравнение, непосредственная оценка. Индивидуальные иерархии признаков.
Рубрика | Математика |
Вид | реферат |
Язык | русский |
Дата добавления | 27.05.2014 |
Размер файла | 67,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
План
ранговый корреляция спирмен ранжирование
Введение
1. Правила выполнения ранжирования
2. Метод ранговой корреляции (Спирмена rs). Область применения
3. Ограничения метода, его достоинства и недостатки
4. Графическое представление метода ранговой корреляции
5. Алгоритм расчета коэффициента ранговой корреляции
Заключение
Список литературы
Введение
Исследуя природу, общество, экономику, психологию необходимо считаться с взаимосвязью наблюдаемых процессов и явлений. При этом полнота описания, так или иначе, определяется количественными характеристиками причинно-следственных связей между ними.
Формы проявления взаимосвязей весьма разнообразны. В качестве двух самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи. В первом случае величине факторного признака строго соответствует одно или несколько значений функции. Функциональная связь достаточно часто проявляется в физике, химии. В экономике примером такой зависимости может служить прямо пропорциональная зависимость между производительностью труда и увеличением производства продукции.
Корреляционная связь (которую так же называют неполной, или статистической) проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятных значений независимой переменной. Объяснение тому - сложность взаимосвязей между анализируемыми факторами, на взаимодействие которых влияют неучтённые случайные величины. Поэтому связь между признаками проявляется лишь в среднем, в массе случаев. При корреляционной связи каждому значению аргумента соответствуют случайно распределённые в некотором интервале значения функции.
Например, некоторое увеличение аргумента повлечёт за собой лишь среднее увеличение (или уменьшение) функции, тогда как конкретные значения у отдельных единиц наблюдения будут отличаться от среднего значения. Такие зависимости встречаются повсеместно. Например, в сельском хозяйстве это может быть связь между урожайностью и количеством внесённых удобрений. Очевидно, что удобрения участвуют в формировании урожая. Но для каждого конкретного поля одно и тоже количество внесённых удобрений, вызовет разный прирост урожайности. Так как во взаимодействии находится ещё целый ряд факторов (погода, состояние почвы и другие факторы), которые и формируют конечный результат. Однако в среднем такая связь наблюдается - увеличение массы внесённых удобрений, ведёт к росту урожайности.
1. Правила выполнения ранжирования данных
К наиболее часто встречаемым методам субъективного измерения относят ранжирование, парное сравнение, непосредственную оценку и последовательное сравнение.
Ранжирование - наиболее простой метод измерения в порядковой шкале. Однако, если объектов сравнения больше 15, то построение ранжировки представляет для человека достаточно сложную задачу.
Парное сравнение - это такое измерение в порядковой шкале; в результате получается множество матриц, которые требуют дальнейшей обработки для полного упорядочивания.
Непосредственная оценка - это приписывание объектам числовых значений в шкале интервалов или отношений. Измерение является достаточно точным при наличии полной информации у субъекта управления или экспертов. Однако это встречается редко и в таком случае пользуются балльной оценкой, когда измерение производится с точностью до определенного отрезка числовой оси.
Последовательное сравнение представляет собой комплексную процедуру измерения, включающую ранжирование и непосредственную оценку. Это самый трудоемкий тип оценок.
Рассмотрим правила ранжирования данных в простых случаях.
Ранжирование данных может производиться по возрастанию или убыванию выделенного признака. Для этого в исходных данных производится упорядочение данных по выделенному признаку в порядке возрастания или убывания. В случае, когда рассматриваются данные качественного признака, то в этом случае предварительно, качественному признаку приписывается некий балл (ранг) и, после этой процедуры производят ранжирование исходных данных по качественному признаку. Например, такая процедура проводится при расчёте коэффициента корреляции рангов Спирмэна.
2. Метод ранговой корреляции (Спирмена rs). Область применения
Метод ранговой корреляции Спирмена позволяет определить силу и направление корреляционной связи между двумя признаками или двумя иерархиями признаков.
Для подсчета ранговой корреляции необходимо располагать двумя рядами значений, которые могут быть проранжированы. Такими рядами могут быть:
Два признака, измеренные в одной и той же группе переменных (наиболее часто в этом качестве выступает группа людей, которых принято тогда именовать испытуемыми или респондентами. Естественно, под переменными подразумеваются не сами люди, а данные ими ответы на те или иные вопросы).
Б) две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков (скажем, по ответам на пункты анкеты или теста).
В) Две групповые иерархии признаков (например, соответствие каких-либо выборов, сделанных одной группой людей выборам другой группы).
Г) Индивидуальная и групповая иерархии признаков (например, сопоставление индивидуальной иерархии жизненных ценностей сотрудника усредненному мнению группы на этот же счет; сопоставление последовательности товаров, которые приобрели бы (в среднем) жители города А и города Б при условии получения премии, на которую заранее не рассчитывали).
Методика расчета коэффициента корреляции рангов Спирмэна.
Теснота связи, как между количественными, так и между качественными признаками, при условии, что значения этих признаков могут быть проранжированы по степени убывания или возрастания, оценивается коэффициентом корреляции рангов Спирмэна:
,
где разность между величинами рангов признака-фактора и результативного признака; число наблюдаемых единиц (объём выборочной совокупности).
Коэффициент корреляции рангов Спирмэна изменяется в пределах от -1 до +1.
Ранговый коэффициент обычно исчисляется на основе небольшого объёма исходной информации, поэтому необходимо выполнить проверку его существенности (значимости). Приводится таблица предельных значений коэффициента корреляции рангов Спирмэна при условии верности нулевой гипотезы об отсутствии корреляционной связи при заданном уровне значимости и определённом объёме выборочной совокупности (выборочных данные).
Если полученное значение по модулю превышает критическую величину при данном уровне значимости, то нулевая гипотеза может быть отвергнута, то есть, величина не является результатом случайных совпадений рангов.
То есть, если
,
то нулевая гипотеза отвергается при данном уровне значимости и числе степеней свободы , количество наблюдений. Это условие можно записать следующим образом:
.
Прямая трактовка коэффициента корреляции рангов Спирмэна состоит в том, что если , то связь между изучаемыми признаками отсутствует. Если величина положительная правильная дробь, то есть, , то между изучаемыми признаками имеется прямая связь. Если величина отрицательная правильная дробь, то есть, , то между изучаемыми признаками имеется обратная связь.
Пример 1
Пусть в процессе системного анализа нам пришлось учитывать некоторую величину U, измерение которой возможно лишь по порядковой шкале (Ord). Например, нам приходится учитывать 10 целей функционирования системы и требуется выяснить их относительную значимость, удельные веса.
Если имеется группа лиц, компетентность которых в данной области не вызывает сомнений, то можно опросить каждого из экспертов, предложив им расположить цели по важности или “проранжировать” их. В простейшем случае можно не разрешать повторять ранги, хотя это не обязательно -- повторение рангов всегда можно учесть.
Результаты экспертной оценки в нашем примере представим таблицей рангов целей:
Таблица 1
Эксперты |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
Сумма |
|
A |
3 |
5 |
1 |
8 |
7 |
10 |
9 |
2 |
4 |
6 |
55 |
|
B |
5 |
1 |
2 |
6 |
8 |
9 |
10 |
3 |
4 |
7 |
55 |
|
Сумма рангов |
8 |
6 |
3 |
14 |
15 |
19 |
19 |
5 |
8 |
13 |
||
Суммарный ранг |
4.5 |
3 |
1 |
7 |
8 |
9.5 |
9.5 |
2 |
4.5 |
6 |
55 |
Итак, для каждой из целей Ti мы можем найти сумму рангов, определенных экспертами, и затем суммарный или результирующий ранг цели Ri. Если суммы рангов совпадают -- назначается среднее значение. Метод ранговой корреляции позволяет ответить на вопрос -- насколько коррелированы, неслучайны ранжировки каждого из двух экспертов, а значит -- насколько можно доверять результирующим рангам? Как обычно, выдвигается основная гипотеза -- об отсутствии связи между ранжировками и устанавливается вероятность справедливости этой гипотезы. Для этого можно использовать два подхода: определение коэффициентов ранговой корреляции Спирмэна или Кендэлла.
Более простым в реализации является первый -- вычисляется значение коэффициента Спирмэна
Rs=1-
где di определяются разностями рангов первой и второй ранжировок по n объектов в каждой.
В нашем примере сумма квадратов разностей рангов составляет 30, а коэффициент корреляции Спирмэна около 0.8, что дает значение вероятности гипотезы о полной независимости двух ранжировок всего лишь 0.004.
При необходимости можно воспользоваться услугами группы из m экспертов, установить результирующие ранги целей, но тогда возникнет вопрос о согласованности мнений этих экспертов или конкордации.
Пусть у нас имеются ранжировки 4 экспертов по отношению к 6 факторам, которые определяют эффективность некоторой системы.
Таблица 2
Факторы --> Эксперты |
1 |
2 |
3 |
4 |
5 |
6 |
Сумма |
|
A |
5 |
4 |
1 |
6 |
3 |
2 |
21 |
|
B |
2 |
3 |
1 |
5 |
6 |
4 |
21 |
|
C |
4 |
1 |
6 |
3 |
2 |
5 |
21 |
|
D |
4 |
3 |
2 |
3 |
2 |
5 |
21 |
|
Сумма рангов Сум. ранг |
15 4 |
11 2 |
10 1 |
19 6 |
12 3 |
17 5 |
84 |
|
Отклонение суммы от среднего |
+1 1 |
-3 9 |
-4 16 |
+5 25 |
-2 4 |
+3 9 |
0 64 |
Заметим, что полная сумма рангов составляет 84, что дает в среднем по 14 на фактор.
Для общего случая n факторов и m экспертов среднее значение суммы рангов для любого фактора определится выражением
D=
Теперь можно оценить степень согласованности мнений экспертов по отношению к шести факторам. Для каждого из факторов наблюдается отклонение суммы рангов, указанных экспертами, от среднего значения такой суммы. Поскольку сумма этих отклонений всегда равна нулю, для их усреднения разумно использовать квадраты значений.
В нашем случае сумма таких квадратов составит S= 64, а в общем случае эта сумма будет наибольшей только при полном совпадении мнений всех экспертов по отношению ко всем факторам:
Smax=
М. Кэндэллом предложен показатель согласованности или коэффициент конкордации, определяемый как
В нашем примере значение коэффициента конкордации составляет около 0.229, что при четырех экспертах и шести факторах достаточно, чтобы с вероятностью не более 0.05 считать мнения экспертов несогласованными. Дело в том, что как раз случайность ранжировок, их некоррелированность просчитывается достаточно просто. Так для нашего примера указанная вероятность соответствует сумме квадратов отклонений S= 143.3 , что намного больше 64.
В заключение вопроса об особенностях метода экспертных оценок в системном анализе отметим еще два обстоятельства.
В первом примере мы получили результирующие ранги 10 целей функционирования некоторой системы. Как воспользоваться этой результируюзей ранжировкой? Как перейти от ранговой (Ord) шкалы целей к шкале весовых коэффициентов -- в диапазоне от 0 до 1?
Здесь обычно используются элементарные приемы нормирования. Если цель 3 имеет ранг 1, цель 8 имеет ранг 2 и т. д., а сумма рангов составляет 55, то весовой коэффициент для цели 3 будет наибольшим и сумма весов всех 10 целей составит 1.
Вес цели придется определять как
(11-1) / 55 для 3 цели;
(11-2) / 55 для 8 цели и т. д.
При использовании групповой экспертной оценки можно не только выяснять мнение экспертов о показателях, необходимых для системного анализа. Очень часто в подобных ситуациях используют так называемый метод Дельфы (от легенды о дельфийском оракуле).
Опрос экспертов проводят в несколько этапов, как правило -- анонимно. После очередного этапа от эксперта требуется не просто ранжировка, но и ее обоснование. Эти обоснования сообщаются всем экспертам перед очередным этапом без указания авторов обоснований.
Имеющийся опыт свидетельствует о возможностях существенно повысить представительность, обоснованность и, главное, достоверность суждений экспертов. В качестве “побочного эффекта” можно составить мнение о профессиональности каждого эксперта.
Пример 2 (случай не повторяющихся рангов)
Для примера рассмотрим зависимость между успеваемостью студентов ВУЗа по естественным и гуманитарным наукам.
Таблица 3
Студенты |
Ранги успеваемости по наукам |
||
естественные, |
гуманитарным, |
||
Иванов А. |
5 |
7 |
|
Петров В. |
4 |
4 |
|
Семёнова И. |
8 |
1 |
|
Комков А. |
2 |
10 |
|
Шулейкин Е. |
10 |
2 |
|
Краснов П. |
1 |
3 |
|
Белкин С. |
9 |
6 |
|
Кандыба Н. |
3 |
8 |
|
Марченко А. |
7 |
9 |
|
Якупов Ф. |
6 |
5 |
В таблице 5 дана оценка успеваемости каждого студента в группе. То есть, каждому студенту приписан ранг от 1 до 10. Ранжируем исходные данные по признаку успеваемость студента по естественным дисциплинам
Таблица 4. Расчёты
Студенты |
Ранги успеваемости по наукам |
||||
естественные, |
гуманитарные, |
||||
Краснов П. |
1 |
9 |
-8 |
64 |
|
Комков А. |
2 |
10 |
-8 |
64 |
|
Кандыба Н. |
3 |
8 |
-5 |
25 |
|
Петров В. |
4 |
5 |
-1 |
1 |
|
Иванов А. |
5 |
4 |
1 |
1 |
|
Якупов Ф. |
6 |
7 |
-1 |
1 |
|
Марченко А. |
7 |
6 |
1 |
1 |
|
Семёнова И. |
8 |
1 |
7 |
49 |
|
Белкин С. |
9 |
2 |
7 |
49 |
|
Шулейкин Е. |
10 |
3 |
7 |
49 |
|
Итого: |
55 |
55 |
304 |
Вычисляем коэффициент корреляции рангов Спирмэна по формуле:
В нашем случае имеем . Тогда,
.
Таким образом, между способностями студентов к естественным и гуманитарным наукам имеется обратная, весьма существенная, связь.
Табличные значения коэффициента корреляции рангов Спирмэна при уровне значимости , числе наблюдений и числе степеней свободы , есть: , при уровне значимости и числе наблюдений и числе степеней свободы , есть: .
Так как, расчётное значение коэффициента корреляции рангов Спирмэна равно и, следовательно,
,
то можно заключить, что сделанный нами вывод о существовании обратной и весьма существенной связи между способностями студентов к естественным и гуманитарным наукам, гарантирован с доверительной вероятностью больше 0,98 , но меньшей 0,99 . То есть, получили статистически значимый результат.
3. Ограничения метода, его достоинства и недостатки
Ограничения метода ранговой корреляции. По каждой переменной должно быть представлено не менее 5 наблюдений. Верхняя граница выборки - меньше или равна 40. Коэффициент ранговой корреляции Спирмена rs при большом количестве одинаковых рангов по одной или обеим сопоставляемым переменным дает огрубленные значения. В идеале оба коррелируемых ряда должны представлять собой две последовательности несовпадающих значений. В случае несоблюдения такого условия вносится поправка на одинаковые ранги (будет дано ниже). Помимо этих ограничений, следует так же помнить об ограничениях корреляционного метода вообще - невозможность обнаружения причинной связи между явлениями.
4. Графическое представление метода ранговой корреляции
На рисунке (А) показана жесткая связь с коэффициентом корреляции, равным +1. Увеличению признака ( А) сопутствует увеличение признака В на ту же величину. Рисунок ( Б) - нет взаимосвязи между изменениями А и В. При увеличении А, В может меняться как в сторону увеличения, так и в сторону уменьшения. Рисунок (В) - пример сильной корреляции с коэффициентом -1. Увеличение признака А сопровождается пропорциональным уменьшением признака В.
5. Алгоритм расчета коэффициента ранговой корреляции
1) Рассчитать коэффициент ранговой корреляции rs при отсутствии одинаковых рангов - по формуле а; при наличии - по формуле б:
Формула а:
rs = 1 - 6 d2 / N(N2 - 1)
Формула б:
rs = 1 - 6 (d2 + Тa + Тb) / N(N2 - 1)
Где: d2 - квадратов разностей между рангами;
Тa и Тb - поправки на одинаковые ранги;
N - количество признаков, участвовавших в ранжировании.
2) Определить по специальной таблице критические значения rs для данного N. Если rs превышает критическое значение или, по крайней мере, равен ему, - корреляция достоверно отличается от нуля.
Образец таблицы для внесения данных:
Наименование признака |
Ранги переменной А (по порядку) |
Ранги переменной В (по порядку) |
Разница между значениями двух предыдущих столбцов №2 и №3 |
Квадрат значений предыдущего столбца №4 |
|
Заключение
По направлению связи бывают прямыми, когда зависимая переменная растёт с увеличением факторного признака, и обратными, когда рост факторного признака сопровождается уменьшением функции.
Относительно своей аналитической формы связи бывают линейными и нелинейными. В первом случае между признаками в среднем проявляются линейные соотношения. Нелинейная взаимосвязь выражается нелинейной функцией, а переменные связаны между собой в среднем не линейно.
Существует ещё одна достаточно важная характеристика связей с точки зрения взаимодействующих факторов. Если характеризуется связь двух признаков, то её принято называть парной регрессией. Если изучаются более чем две переменные - множественной регрессией.
По силе различают слабые и сильные связи. Эта формальная характеристика выражается конкретными величинами и интерпретируется в соответствии с общепринятыми критериями силы связи для конкретных показателей.
Список литературы
1. В.М. Гусаров, Теория статистики, Москва, ЮНИТИ, 2004. 463 стр.
2. М.Р. Ефимова и другие, Практикум по общей теории статистики, издательство: Финансы и статистика - Москва, 1999. 280 стр.
3. Под редакцией Ю.Н. Иванова, Экономическая статистика, издательство: Москва ИНФРА - М, 2002. 480 стр.
4. Под редакцией Г.В. Ионина. Статистика (курс лекций) Новосибирск: издательство Москва ИНФРА - М, 2003. 310 стр.
Размещено на Allbest.ru
...Подобные документы
Сортировка размера пенсии по возрастанию прожиточного минимума. Параметры уравнений парных регрессий. Значения параметров логарифмической регрессии. Оценка гетероскедастичности линейного уравнения с помощью проведения теста ранговой корреляции Спирмена.
контрольная работа [178,0 K], добавлен 23.11.2013Функциональные и корреляционные зависимости. Сущность корреляционной связи. Методы выявления наличия корреляционной связи между двумя признаками и измерение степени ее тесноты. Построение корреляционной таблицы. Уравнение регрессии и способы его расчета.
контрольная работа [55,2 K], добавлен 23.07.2009Методы последовательного поиска: деление отрезка пополам, золотого сечения, Фибоначчи. Механизмы аппроксимации, условия и особенности их применения. Методы с использованием информации о производной функции: средней точки, Ньютона, секущих, кубической.
курсовая работа [361,5 K], добавлен 10.06.2014Рассмотрение особенностей сравнения рядов. Характеристика признаков сходимости Даламбера. Критерий Коши как ряд утверждений в математическом анализе. Анализ геометрической интерпретации интегрального признака. Способы определения сумы числового ряда.
контрольная работа [214,6 K], добавлен 01.03.2013Определение условий сходимости положительного ряда и описание свойств гармонических рядов Дирихле. Изучение теорем сравнения рядов и описание схемы Куммера для вывода из нее признаков сравнения ряда. Вывод признаков сравнения Даламбера, Раабе и Бертрана.
курсовая работа [263,6 K], добавлен 14.06.2015Методика и основные этапы расчета параметров линейного уравнения парной регрессии с помощью программы Excel. Анализ качества построенной модели, с использованием коэффициента парной корреляции, коэффициента детерминации и средней ошибки аппроксимации.
лабораторная работа [22,3 K], добавлен 15.04.2014Непрерывное начисление сложных процентов. Общий метод приближённого вычисления эффективной процентной ставки, его применение для ссуды, платежи по которой совершаются через одинаковые промежутки времени. Сравнение методов простых и сложных процентов.
курсовая работа [1,1 M], добавлен 19.02.2014Механизм и основные этапы нахождения необходимых параметров методом наименьших квадратов. Графическое сравнение линейной и квадратичной зависимостей. Проверка гипотезы о значимости выборочного коэффициента корреляции при заданном уровне значимости.
курсовая работа [782,6 K], добавлен 19.05.2014Понятие вероятности события. Петербургский парадокс. Выявление наличия взаимосвязи между признаками в регрессионном анализе. Сравнение коэффициентов корреляции и регрессии. Нахождение тренда с прогнозами в Excel. Методы математического программирования.
контрольная работа [455,5 K], добавлен 12.02.2014Общие характеристики алгоритмов стандартов шифрования РФ и США. Особенности архитектурных принципов. Сравнение раундов шифрования. Эквивалентность прямого и обратного преобразований. Выработка ключевых элементов. Характеристики стойкости алгоритмов.
курсовая работа [311,4 K], добавлен 25.12.2014Метод Гаусса - последовательное исключение переменных из системы уравнений. Определение понятия расширенной матрицы. Метод Крамера, расчет определителя системы. Метод обратной матрицы. Расчет алгебраических дополнений для элементов полученной матрицы.
презентация [184,4 K], добавлен 21.09.2013Предел числовой последовательности. Сравнение бесконечно малых величин. Второй замечательный предел. Теорема Коши о сходимости числовой последовательности. Использование бинома Ньютона. Замена сомножителей на эквивалентные им более простые величины.
контрольная работа [152,1 K], добавлен 11.08.2009Понятия теории графов, их связность и задача о кратчайшей цепи. Программная реализация метода Дейкстры, его сравнение с методом простого перебора. Описание логики программного модуля. Примеры работы программы нахождения кратчайшей цепи в связном графе.
курсовая работа [330,2 K], добавлен 25.11.2011Классификация методов кластеризации и их характеристика. Метод горной кластеризации в Matlab. Возможная область применения кластеризации в различных предметных областях. Математическое описание метода. Пример использования метода на реальных данных.
реферат [187,0 K], добавлен 28.10.2010Общее понятие вектора и векторного пространства, их свойства и дополнительные структуры. Графический метод в решении задачи линейного программирования, его особенности и область применения. Примеры решения экономических задач графическим способом.
курсовая работа [1,2 M], добавлен 14.11.2010Проведение аналитической группировки и дисперсионного анализа данных, с целью количественно определить тесноту связи. Определение степени корреляции между группировочными признаками и вариационной зависимости переменной, обусловленной регрессией.
контрольная работа [140,5 K], добавлен 17.08.2014Изучение методов одномерной оптимизации и сравнение эффективности их применения для конкретных целевых функций. Нахождение минимума функции 1/|x-3|3 методами перебора, поразрядного поиска, дихотомии, золотого сечения, средней точки, хорд и Ньютона.
курсовая работа [761,8 K], добавлен 25.12.2015Понятие и отличительные особенности численных методов решения, условия и возможности их применения. Оптимизация функции одной переменной, используемые методы и закономерности их комбинации, сравнение эффективности. Сущность и разновидности интерполяции.
реферат [273,3 K], добавлен 29.06.2015Понятия множеств и их элементов, подмножеств и принадлежности. Способы задания множеств, парадокс Рассела. Количество элементов или мощность. Сравнение множеств, их объединение, пересечение, разность и дополнение. Аксиоматическая теория множеств.
курсовая работа [1,5 M], добавлен 07.02.2011Решение краевой задачи. Методы конечно-разностных, центрально-разностных отношений и метод прогонки. Приближенное решение линейного дифференциального уравнения второго порядка с помощью методов Галеркина, Ритца и коллокации, сравнение результов.
курсовая работа [596,2 K], добавлен 27.04.2011