Анализ парной связи
Теоретическое обоснование связи между признаками с выделением признака-результата и признака-фактора. Построение графиков корреляционного поля и эмпирической линии регрессии. Расчёт эмпирического дисперсионного и эмпирического корреляционного отношений.
Рубрика | Экономика и экономическая теория |
Вид | лабораторная работа |
Язык | русский |
Дата добавления | 17.12.2014 |
Размер файла | 524,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Лабораторная работа №1. «Анализ парной связи»
Цель: проанализировать направление, форму, тесноту связи между 2-мя признаками.
Задача: с помощью статистических методов провести анализ направления, формы, степени тесноты связи между двумя признаками, используя эмпирически регрессионный и аналитически регрессионный методы построить линейную парную регрессию.
Для данной лабораторной работы мы решили исследовать изменение стоимости 50 ноутбуков в зависимости от частоты процессора. Проанализируем направление, форму тесноту связи между признаком-фактором-частотой процессора и признаком-результатом - ценой ноутбука.
1.
1. Теоретическое обоснование связи между признаками с выделением признака-результата и признака-фактора
Выдвинем гипотезу, что цена ноутбука находится в прямой зависимости от частоты процессора ноутбука. В данном случае - признак-фактор-частота процессора, признак-результат-цена ноутбука.
Цена, руб. |
Объем памяти, Гб |
Диагональ |
Цвет ноутбука |
Страна производитель |
Частота процессора, Ггц |
|
9 850 |
320 |
15,6 |
Красный |
США |
1,3 |
|
9 900 |
320 |
15,6 |
Черный |
США |
1,3 |
|
10 260 |
320 |
15,6 |
Черный |
США |
1,3 |
|
10 330 |
320 |
15,6 |
Черный |
Китай |
1,33 |
|
11 010 |
320 |
15,6 |
Черный |
Китай |
1,5 |
|
11 010 |
320 |
15,6 |
Черный |
Япония |
1,6 |
|
11 130 |
500 |
15,6 |
Голубой |
США |
1,6 |
|
11 860 |
320 |
15,6 |
Белый |
Китай |
1,6 |
|
13 940 |
500 |
15,6 |
Серый |
США |
1,7 |
|
15 600 |
320 |
13,3 |
Белый |
США |
1,7 |
|
15 820 |
320 |
11,6 |
Розовый |
Япония |
1,7 |
|
16 000 |
500 |
15,6 |
Красный |
США |
1,7 |
|
16 800 |
500 |
13,3 |
Серебристый |
США |
1,8 |
|
17 180 |
500 |
15,6 |
Белый |
Япония |
1,8 |
|
18 660 |
320 |
14 |
Коричневый |
Китай |
1,8 |
|
18 960 |
500 |
15,6 |
Красный |
Япония |
1,8 |
|
19 120 |
640 |
15,6 |
Белый |
Япония |
1,8 |
|
19 880 |
500 |
14 |
Розовый |
Япония |
1,9 |
|
20 100 |
500 |
17,3 |
Серый |
США |
1,9 |
|
20 230 |
500 |
14 |
Голубой |
Япония |
2 |
|
21 300 |
500 |
17,3 |
Розовый |
США |
2 |
|
21 600 |
500 |
15,6 |
Черный |
Япония |
2 |
|
22 280 |
320 |
13,3 |
Красный |
Китай |
2 |
|
23 360 |
500 |
15,6 |
Голубой |
Китай |
2 |
|
23 400 |
750 |
15,6 |
Красный |
Китай |
2,1 |
|
24 290 |
500 |
13,3 |
Розовый |
Китай |
2,2 |
|
25 400 |
320 |
17,3 |
Голубой |
США |
2,2 |
|
26 300 |
500 |
15,6 |
Розовый |
США |
2,3 |
|
27 130 |
500 |
13,3 |
Серый |
США |
2,3 |
|
30 200 |
640 |
16,4 |
Черный |
Япония |
2,3 |
|
30 340 |
750 |
17,3 |
Черный |
Китай |
2,3 |
|
30 590 |
128 |
11,6 |
Серебристый |
США |
2,3 |
|
31 160 |
128 |
15,6 |
Черный |
Китай |
2,4 |
|
32 440 |
500 |
14 |
Серый |
США |
2,5 |
|
32 580 |
500 |
14 |
Розовый |
Япония |
2,5 |
|
33 280 |
500 |
13,3 |
Красный |
США |
2,5 |
|
33 290 |
750 |
14 |
Белый |
Китай |
2,5 |
|
35 000 |
750 |
14 |
Белый |
Япония |
2,5 |
|
35 050 |
1000 |
18,4 |
Коричневый |
Китай |
2,6 |
|
38 000 |
128 |
11,6 |
Серый |
Китай |
2,7 |
|
41 520 |
500 |
13,3 |
Серебристый |
США |
2,7 |
|
44 170 |
500 |
15,6 |
Серебристый |
США |
2,8 |
|
44 600 |
500 |
14 |
Черный |
США |
2,8 |
|
48 420 |
240 |
13,3 |
Серебристый |
Китай |
2,8 |
|
61 230 |
1000 |
17,3 |
Белый |
США |
2,8 |
|
61 470 |
500 |
15,6 |
Серебристый |
США |
2,9 |
|
61 570 |
1500 |
17,3 |
Черный |
Китай |
2,9 |
|
65 200 |
1000 |
17,3 |
Серый |
США |
2,9 |
|
77 370 |
256 |
15,4 |
Серебристый |
США |
2,9 |
|
141 100 |
768 |
15,4 |
Серебристый |
США |
3 |
Где
х ср. |
х2 ср |
x ср. в кв. |
у ср. |
x ср*y ср |
x*y ср. |
|
2 |
4,892778 |
4 |
30 426 |
65615,85 |
74439,22 |
2. Аналитическая равнонаполненная группировку
Частота процессора, Ггц |
Количество элементов в группе |
Средняя частота процессора х ср. |
Средняя цена, у ср. |
|
[1,3-1,8) |
12 |
1,5 |
12225 |
|
[1,8-2,1) |
12 |
1,9 |
19955 |
|
[2,1-2,6) |
14 |
2,35 |
29671 |
|
[2,6-3) |
12 |
2,8 |
59975 |
|
Итого |
50 |
Проанализировав данные таблицы с информацией о ноутбуках магазина «Эльдорадо», мы видим зависимость между признаком - фактором - частотой процессора и признаком-результатом-ценой ноутбука. При увеличении частоты процессора средняя цена ноутбука возрастает.
3. Построение графиков: корреляционного поля и эмпирической линии регрессии
Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем целом по совокупности наблюдений. При изучении зависимости между двумя признаками графический метод подбора вида уравнения регрессии достаточно нагляден. Он основан на корреляционном поле. Функция регрессии описывает тенденцию, таким образом, можно сделать вывод, что с увеличением частоты процессора увеличивается цена ноутбука.
4. Запись эмпирической функции регрессии аналитически
Аналитический метод выбора типа уравнения регрессии основан на изучении материальной природы связи изучаемых признаков. Данная линия эмпирической регрессии (представленная на графике «Линия эмпирической регрессии») - кусочно - линейная функция. Запишем эмпирическую линию регрессии аналитически.
у=Размещено на http://www.allbest.ru/
b= |
a= |
||
12225=a+b*1,5 |
19325 |
-16762,5 |
|
19955=a+b*1,9 |
21591,11 |
-21068,1111 |
|
29671=a+b*2,35 |
67342,22 |
-128583,222 |
5. Расчёт показателей тесноты связи на эмпирическом уровне
- эмпирического дисперсионного отношения и эмпирического корреляционного отношения;
Частота процессора, Ггц |
Количество элементов в группе |
Средняя частота процессора х ср. |
Средняя цена, у ср. |
|
[1,3-1,8) |
12 |
1,5 |
12225 |
|
[1,8-2,1) |
12 |
1,9 |
19955 |
|
[2,1-2,6) |
14 |
2,35 |
29671 |
|
[2,6-3) |
12 |
2,8 |
59975 |
|
Итого |
50 |
Рассчитаем эмпирическое дисперсионное отношение и эмпирическое корреляционное отношение.
1)Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, которая обусловлена влиянием признака-фактора, положенного в основание группировки.
анализ парный связь
= 162811456
2)Внутригрупповая дисперсия характеризует случайную вариацию, т.е. часть вариации, которая обусловлена влиянием неучтённых факторов и не зависящую от признака-фактора, положенного в основание группировки.
= 185353265,5
3)Общая дисперсия измеряет вариацию признака по всей совокупности в целом под влиянием всех факторов, обуславливающих эту вариацию.
= 348164721,5
30425
Эмпирическое дисперсионное отношение (Межгрупповая дисперсия/Общая дисперсия) характеризует долю межгрупповой дисперсии в общей дисперсии и показывает насколько вариация признака в совокупности обусловлена фактором группировки.
Эмпирическое корреляционное отношение (vЭмпирическое дисперсионное отношение) оценивает тесноту связи между изучаемым и группировочным признаками. Чем ближе к единице, тем теснее связь.
Таким образом, эмпирическое дисперсионное отношение показывает, что дисперсия стоимости ноутбука в интернет - магазине «Эльдорадо» ? на 46,8% объясняется различиями в частоте работы процессора, и на 53,2% -- другими факторами. Эмпирическое корреляционное отношение свидетельствует о существенном влиянии на стоимость ноутбуков ?68,4 % на частоты работы процессора.
6. Построение линейной парной регрессии
Построить график линейной регрессии на корреляционном поле. Интерпретировать параметры регрессии.
Простая регрессия представляет собой регрессию между двумя переменными: x и y, т.е. модель вида y=f(x),где y-зависимая переменная - признак - результат, y-независимая переменная (признак-фактор).
x*y ср. |
x ср*y ср. |
х кв. ср |
x ср.в кв. |
х ср. |
у ср. |
|
74439,218 |
65 616 |
4,892778 |
4 |
2,1566 |
30425,6 |
b= ( x*y ср. - х ср.* у ср. )/ х2 ср- x ср. в кв.
a= у ср. - b* х ср.
b |
a |
|
9883,0 |
9 112 |
График линейной регрессии изображён на данном рисунке.
y т=9112 +9883*x
Если уравнение регрессии проходит через все точки корреляционного поля, что возможно только при функциональной связи, когда все точки лежат на линии регрессии y т=f(x),то фактические значения результирующего признака совпадают с теоретическими y= y т, т.е. они полностью обусловлены влиянием признака-фактора. В практических исследованиях ,как правило, имеет место некоторое рассеивание точек относительно линии регрессии. Оно обусловлено влиянием прочих не учитываемых факторов в уравнении регрессии.
Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем целом по совокупности наблюдений.
Линейная регрессия находит широкое применение в эконометрике ввиду чёткой экономической интерпретации её параметров. Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Формально a -значение y при x =0. Если признак-фактор x не может иметь нулевого значения, то вышеуказанная трактовка свободного члена a не имеет смысла, т.е. параметр a может не иметь экономического содержания.
Значение параметра b > 0,следовательно, при увеличении признака - фактора х на единицу, значение признака - результата увеличивается на 9883 единиц.
7. Проведение дисперсионного анализа по данным аналитической группировки
- определение теоретических объяснённой и остаточной дисперсии результативного признака и проверка теоремы разложения дисперсии (только для одной пары признаков);
Теоретически объяснённая дисперсия - 23623051,31
,
Теоретически остаточная дисперсия - 353250133,2
,
По теореме разложения дисперсии: Теоретически общая дисперсия= теоретически объяснённая дисперсия + теоретически остаточная дисперсия
Общая дисперсия
TSS= = 376873184,6
Смысл правила сложения дисперсии заключается в том, что общая дисперсия, которая возникает под влиянием всех факторов, равняется сумме дисперсий, которые возникают под влиянием всех прочих факторов, и дисперсии, возникающей за счёт фактора группировки. Влияние прочих не учитываемых факторов в уравнении регрессии означает отклонение фактических данных от теоретических. Это отклонение лежит в основе остаточной дисперсии.
8. Оценка тесноты связи при помощи коэффициента корреляции
Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции r (x,y), который можно рассчитать по следующим формулам:
r (x,y)=, ,
Линейный коэффициент корреляции находится в пределах:
-1?r (x,y)?+1
Чем ближе абсолютное значение r (x,y) к единице, тем сильнее линейная связь между факторами (при r (x,y) = + (-)1 имеем строгую функциональную зависимость).
x*y ср. |
x ср*y ср. |
х кв. ср |
x ср.в кв. |
х ср. |
у ср. |
|
74439,218 |
65 616 |
4,892778 |
4 |
2,1566 |
30425,6 |
Коэффициент корреляции
Таким образом, по данным коэффициента корреляции мы видим как признак - фактор - частота процессора влияет на цену ноутбука, связь между признаком-фактором и признаком-результатом тесная (0,7-0,9)
9. Выполнить прогноз значения результирующего признака, если предполагаемое значение факторного признака равно одной четвёртой и трём четвёртым среднего значения факторного признака, используя эмпирическую и аналитическую регрессию
Прогноз значений
Уравнение вида y т=a +b*x позволяет по заданным значениям фактора x находить теоретические значения результативного признака, подставляя в него фактические значения фактора x.
при х1=1/4 х
y=9883,0??*1/4 x+9112
y=2470,75 x+9112
х |
у |
|
1 |
11582,75 |
|
2 |
14053,5 |
|
3 |
16524,25 |
|
4 |
18995 |
|
5 |
21465,75 |
Значение параметра b > 0,следовательно, при увеличении признака - фактора х на единицу, значение признака - результата увеличивается на 2470,75 единиц.
при х2=3/4х
y=9883,0??*3/4 x+9112
y=7412,25 x+9112
х |
у |
|
1 |
16524,25 |
|
2 |
23936,5 |
|
3 |
31348,75 |
|
4 |
38761 |
|
5 |
46173,25 |
Значение параметра b > 0,следовательно, при увеличении признака - фактора х на единицу, значение признака - результата увеличивается на 7412,25 единиц.
Размещено на Allbest.ru
...Подобные документы
Анализ, расчет и построение исходных динамических рядов признака-функции и признака-фактора. Расчет показателей вариации динамических рядов. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции.
курсовая работа [92,7 K], добавлен 24.09.2014Формирование массива случайных чисел. Построение интервального ряда распределения. Определение тесноты связи между типом населения и средним размером вклада, путем исчисления эмпирического корреляционного отношения. Географическая структура экспорта.
задача [138,1 K], добавлен 05.12.2009Исследование типа регрессии между случайными переменными. Построение эмпирического уравнения регрессии. Расчет выборочных средних, дисперсий и среднеквадратического отклонения. Определение показателя тесноты связи как линейного коэффициента корреляции.
контрольная работа [513,5 K], добавлен 02.05.2015Построение корреляционного поля и предложение гипотезы о связи между денежными доходами и потребительскими расходами, выдвижение предположения о наличии выбросов. Оценка статистической надежности и значимости вычисленного коэффициента корреляции.
контрольная работа [3,0 M], добавлен 15.11.2012Расчет средних уровней производительности труда и показателей вариации. Понятие моды и медианы признака, построение полигона и оценка характера асимметрии. Методика выравнивания ряда динамики по прямой линии. Индивидуальные и агрегатные индексы объема.
контрольная работа [682,4 K], добавлен 24.09.2012Показатели среднего, виды средних величин и связи между ними. Пример статистического обследования из области экономики и его основные атрибуты. Построение однопараметрической модели регрессии, оценка ее адекватности. Изменение статистического признака.
контрольная работа [105,9 K], добавлен 25.02.2011Построение корреляционного поля между ценой акции и доходностью капитала. Гипотеза о тесноте и виде зависимости между доходностью и ценой. Расчет коэффициента детерминации. Оценка статистической значимости уравнения регрессии с помощью F-критерия Фишера.
контрольная работа [274,3 K], добавлен 25.09.2013Эффективность оборотных средств. Оценка тесноты связи между факторным и результативным показателями на основе корреляционного анализа. Проверка значимости коэффициента корреляции. Оценка значимости уравнения линейной регрессии. Формы связи показателей.
курсовая работа [143,2 K], добавлен 15.03.2015Диаграмма рассеивания и подтверждение гипотезы о линейной зависимости, криволинейной связи по заданным статистическим данным с помощью пакета "Excel". Построение корреляционного поля, матрицы, определение параметров линейной связи. Модель Кобба-Дугласа.
контрольная работа [153,8 K], добавлен 26.06.2009Построение циклограмм движения бригад по участкам и графиков потребности в рабочих на период строительства волоконно-оптической линии связи. Формирование финансового результата работы объекта. Расчет экономической эффективности инвестиционного проекта.
курсовая работа [102,8 K], добавлен 12.10.2014Построение диаграммы рассеивания (корреляционного поля). Группировка данных и построение корреляционной таблицы. Оценка числовых характеристик для негруппированных и группированных данных. Выборочное значение статистики. Параметры линейной регрессии.
контрольная работа [150,5 K], добавлен 14.12.2010Эконометрическое моделирование динамики экспорта и импорта РФ: построение регрессии, дисперсионный анализ для линейной регрессии, эластичность показательной регрессии, изучение качества линейной регрессии, колеблемость признака. Доверительные интервалы.
курсовая работа [367,5 K], добавлен 21.08.2008Назначение рангового коэффициента корреляции, определение силы и направления корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков. Графическое представление метода ранговой корреляции, расчет эмпирического значения rs.
презентация [46,5 K], добавлен 12.11.2010Крупнейшие месторождения меди, развитие промышленности и прогноз формирования мирового рынка металла до 2013 года. Применение регрессионно-корреляционного и тренд-анализа для расчета экономических характеристик меди. Статистическая оценка тесноты связи.
курсовая работа [1,9 M], добавлен 08.05.2011Определение эмпирического корреляционного отношения. Вычисление общего индекса цен, физического объема товарооборота и товарооборота. Анализ динамики производства. Базисные и среднегодовые показатели абсолютного прироста и темпов прироста производства.
контрольная работа [133,8 K], добавлен 18.03.2015Определение среднего недовеса и прироста реализации товара. Расчет дисперсии, эмпирического коэффициента детерминации и корреляционного отношения. Анализ вкладов в базисном и отчетном периодах. Расчет валовой добавленной стоимости по сферам деятельности.
контрольная работа [59,8 K], добавлен 02.03.2011Теоретическое обоснование связи между показателями. Определение методологии исследования вариационного ряда. Проверка статистической значимости. Показатели среднедушевых доходов населения и числа собственных легковых автомобилей и их взаимосвязь.
дипломная работа [166,7 K], добавлен 30.06.2009Порядок определения межгрупповой и общей дисперсии по заданным группам, коэффициента детерминации, эмпирического корреляционного отношения. Определение индекса снижения себестоимости продукции. Расчет средней хронологической ряда динамики и прироста.
задача [50,2 K], добавлен 31.05.2010Выявление корреляционной связи между факторным и результативным признаками, направления связи и ее тесноты. Расчёт дисперсии, ошибки выборки, индексов среднего товарооборота на душу населения переменного, постоянного состава, структурных сдвигов.
курсовая работа [166,7 K], добавлен 15.01.2014Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.
лекция [38,1 K], добавлен 13.02.2011