Анализ парной связи

Теоретическое обоснование связи между признаками с выделением признака-результата и признака-фактора. Построение графиков корреляционного поля и эмпирической линии регрессии. Расчёт эмпирического дисперсионного и эмпирического корреляционного отношений.

Рубрика Экономика и экономическая теория
Вид лабораторная работа
Язык русский
Дата добавления 17.12.2014
Размер файла 524,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Лабораторная работа №1. «Анализ парной связи»

Цель: проанализировать направление, форму, тесноту связи между 2-мя признаками.

Задача: с помощью статистических методов провести анализ направления, формы, степени тесноты связи между двумя признаками, используя эмпирически регрессионный и аналитически регрессионный методы построить линейную парную регрессию.

Для данной лабораторной работы мы решили исследовать изменение стоимости 50 ноутбуков в зависимости от частоты процессора. Проанализируем направление, форму тесноту связи между признаком-фактором-частотой процессора и признаком-результатом - ценой ноутбука.

1.

1. Теоретическое обоснование связи между признаками с выделением признака-результата и признака-фактора

Выдвинем гипотезу, что цена ноутбука находится в прямой зависимости от частоты процессора ноутбука. В данном случае - признак-фактор-частота процессора, признак-результат-цена ноутбука.

Цена, руб.

Объем памяти, Гб

Диагональ

Цвет ноутбука

Страна производитель

Частота процессора, Ггц

9 850

320

15,6

Красный

США

1,3

9 900

320

15,6

Черный

США

1,3

10 260

320

15,6

Черный

США

1,3

10 330

320

15,6

Черный

Китай

1,33

11 010

320

15,6

Черный

Китай

1,5

11 010

320

15,6

Черный

Япония

1,6

11 130

500

15,6

Голубой

США

1,6

11 860

320

15,6

Белый

Китай

1,6

13 940

500

15,6

Серый

США

1,7

15 600

320

13,3

Белый

США

1,7

15 820

320

11,6

Розовый

Япония

1,7

16 000

500

15,6

Красный

США

1,7

16 800

500

13,3

Серебристый

США

1,8

17 180

500

15,6

Белый

Япония

1,8

18 660

320

14

Коричневый

Китай

1,8

18 960

500

15,6

Красный

Япония

1,8

19 120

640

15,6

Белый

Япония

1,8

19 880

500

14

Розовый

Япония

1,9

20 100

500

17,3

Серый

США

1,9

20 230

500

14

Голубой

Япония

2

21 300

500

17,3

Розовый

США

2

21 600

500

15,6

Черный

Япония

2

22 280

320

13,3

Красный

Китай

2

23 360

500

15,6

Голубой

Китай

2

23 400

750

15,6

Красный

Китай

2,1

24 290

500

13,3

Розовый

Китай

2,2

25 400

320

17,3

Голубой

США

2,2

26 300

500

15,6

Розовый

США

2,3

27 130

500

13,3

Серый

США

2,3

30 200

640

16,4

Черный

Япония

2,3

30 340

750

17,3

Черный

Китай

2,3

30 590

128

11,6

Серебристый

США

2,3

31 160

128

15,6

Черный

Китай

2,4

32 440

500

14

Серый

США

2,5

32 580

500

14

Розовый

Япония

2,5

33 280

500

13,3

Красный

США

2,5

33 290

750

14

Белый

Китай

2,5

35 000

750

14

Белый

Япония

2,5

35 050

1000

18,4

Коричневый

Китай

2,6

38 000

128

11,6

Серый

Китай

2,7

41 520

500

13,3

Серебристый

США

2,7

44 170

500

15,6

Серебристый

США

2,8

44 600

500

14

Черный

США

2,8

48 420

240

13,3

Серебристый

Китай

2,8

61 230

1000

17,3

Белый

США

2,8

61 470

500

15,6

Серебристый

США

2,9

61 570

1500

17,3

Черный

Китай

2,9

65 200

1000

17,3

Серый

США

2,9

77 370

256

15,4

Серебристый

США

2,9

141 100

768

15,4

Серебристый

США

3

Где

х ср.

х2 ср

x ср. в кв.

у ср.

x ср*y ср

x*y ср.

2

4,892778

4

30 426

65615,85

74439,22

2. Аналитическая равнонаполненная группировку

Частота процессора, Ггц

Количество элементов в группе

Средняя частота процессора х ср.

Средняя цена, у ср.

[1,3-1,8)

12

1,5

12225

[1,8-2,1)

12

1,9

19955

[2,1-2,6)

14

2,35

29671

[2,6-3)

12

2,8

59975

Итого

50

Проанализировав данные таблицы с информацией о ноутбуках магазина «Эльдорадо», мы видим зависимость между признаком - фактором - частотой процессора и признаком-результатом-ценой ноутбука. При увеличении частоты процессора средняя цена ноутбука возрастает.

3. Построение графиков: корреляционного поля и эмпирической линии регрессии

Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем целом по совокупности наблюдений. При изучении зависимости между двумя признаками графический метод подбора вида уравнения регрессии достаточно нагляден. Он основан на корреляционном поле. Функция регрессии описывает тенденцию, таким образом, можно сделать вывод, что с увеличением частоты процессора увеличивается цена ноутбука.

4. Запись эмпирической функции регрессии аналитически

Аналитический метод выбора типа уравнения регрессии основан на изучении материальной природы связи изучаемых признаков. Данная линия эмпирической регрессии (представленная на графике «Линия эмпирической регрессии») - кусочно - линейная функция. Запишем эмпирическую линию регрессии аналитически.

у=Размещено на http://www.allbest.ru/

b=

a=

12225=a+b*1,5

19325

-16762,5

19955=a+b*1,9

21591,11

-21068,1111

29671=a+b*2,35

67342,22

-128583,222

5. Расчёт показателей тесноты связи на эмпирическом уровне

- эмпирического дисперсионного отношения и эмпирического корреляционного отношения;

Частота процессора, Ггц

Количество элементов в группе

Средняя частота процессора х ср.

Средняя цена, у ср.

[1,3-1,8)

12

1,5

12225

[1,8-2,1)

12

1,9

19955

[2,1-2,6)

14

2,35

29671

[2,6-3)

12

2,8

59975

Итого

50

Рассчитаем эмпирическое дисперсионное отношение и эмпирическое корреляционное отношение.

1)Межгрупповая дисперсия характеризует систематическую вариацию результативного признака, которая обусловлена влиянием признака-фактора, положенного в основание группировки.

анализ парный связь

= 162811456

2)Внутригрупповая дисперсия характеризует случайную вариацию, т.е. часть вариации, которая обусловлена влиянием неучтённых факторов и не зависящую от признака-фактора, положенного в основание группировки.

= 185353265,5

3)Общая дисперсия измеряет вариацию признака по всей совокупности в целом под влиянием всех факторов, обуславливающих эту вариацию.

= 348164721,5

30425

Эмпирическое дисперсионное отношение (Межгрупповая дисперсия/Общая дисперсия) характеризует долю межгрупповой дисперсии в общей дисперсии и показывает насколько вариация признака в совокупности обусловлена фактором группировки.

Эмпирическое корреляционное отношение (vЭмпирическое дисперсионное отношение) оценивает тесноту связи между изучаемым и группировочным признаками. Чем ближе к единице, тем теснее связь.

Таким образом, эмпирическое дисперсионное отношение показывает, что дисперсия стоимости ноутбука в интернет - магазине «Эльдорадо» ? на 46,8% объясняется различиями в частоте работы процессора, и на 53,2% -- другими факторами. Эмпирическое корреляционное отношение свидетельствует о существенном влиянии на стоимость ноутбуков ?68,4 % на частоты работы процессора.

6. Построение линейной парной регрессии

Построить график линейной регрессии на корреляционном поле. Интерпретировать параметры регрессии.

Простая регрессия представляет собой регрессию между двумя переменными: x и y, т.е. модель вида y=f(x),где y-зависимая переменная - признак - результат, y-независимая переменная (признак-фактор).

x*y ср.

x ср*y ср.

х кв. ср

x ср.в кв.

х ср.

у ср.

74439,218

65 616

4,892778

4

2,1566

30425,6

b= ( x*y ср. - х ср.* у ср. )/ х2 ср- x ср. в кв.

a= у ср. - b* х ср.

b

a

9883,0

9 112

График линейной регрессии изображён на данном рисунке.

y т=9112 +9883*x

Если уравнение регрессии проходит через все точки корреляционного поля, что возможно только при функциональной связи, когда все точки лежат на линии регрессии y т=f(x),то фактические значения результирующего признака совпадают с теоретическими y= y т, т.е. они полностью обусловлены влиянием признака-фактора. В практических исследованиях ,как правило, имеет место некоторое рассеивание точек относительно линии регрессии. Оно обусловлено влиянием прочих не учитываемых факторов в уравнении регрессии.

Уравнение простой регрессии характеризует связь между двумя переменными, которая проявляется как некоторая закономерность лишь в среднем целом по совокупности наблюдений.

Линейная регрессия находит широкое применение в эконометрике ввиду чёткой экономической интерпретации её параметров. Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Формально a -значение y при x =0. Если признак-фактор x не может иметь нулевого значения, то вышеуказанная трактовка свободного члена a не имеет смысла, т.е. параметр a может не иметь экономического содержания.

Значение параметра b > 0,следовательно, при увеличении признака - фактора х на единицу, значение признака - результата увеличивается на 9883 единиц.

7. Проведение дисперсионного анализа по данным аналитической группировки

- определение теоретических объяснённой и остаточной дисперсии результативного признака и проверка теоремы разложения дисперсии (только для одной пары признаков);

Теоретически объяснённая дисперсия - 23623051,31

,

Теоретически остаточная дисперсия - 353250133,2

,

По теореме разложения дисперсии: Теоретически общая дисперсия= теоретически объяснённая дисперсия + теоретически остаточная дисперсия

Общая дисперсия

TSS= = 376873184,6

Смысл правила сложения дисперсии заключается в том, что общая дисперсия, которая возникает под влиянием всех факторов, равняется сумме дисперсий, которые возникают под влиянием всех прочих факторов, и дисперсии, возникающей за счёт фактора группировки. Влияние прочих не учитываемых факторов в уравнении регрессии означает отклонение фактических данных от теоретических. Это отклонение лежит в основе остаточной дисперсии.

8. Оценка тесноты связи при помощи коэффициента корреляции

Уравнение регрессии всегда дополняется показателем тесноты связи. При использовании линейной регрессии в качестве такого показателя выступает линейный коэффициент корреляции r (x,y), который можно рассчитать по следующим формулам:

r (x,y)=, ,

Линейный коэффициент корреляции находится в пределах:

-1?r (x,y)?+1

Чем ближе абсолютное значение r (x,y) к единице, тем сильнее линейная связь между факторами (при r (x,y) = + (-)1 имеем строгую функциональную зависимость).

x*y ср.

x ср*y ср.

х кв. ср

x ср.в кв.

х ср.

у ср.

74439,218

65 616

4,892778

4

2,1566

30425,6

Коэффициент корреляции

Таким образом, по данным коэффициента корреляции мы видим как признак - фактор - частота процессора влияет на цену ноутбука, связь между признаком-фактором и признаком-результатом тесная (0,7-0,9)

9. Выполнить прогноз значения результирующего признака, если предполагаемое значение факторного признака равно одной четвёртой и трём четвёртым среднего значения факторного признака, используя эмпирическую и аналитическую регрессию

Прогноз значений

Уравнение вида y т=a +b*x позволяет по заданным значениям фактора x находить теоретические значения результативного признака, подставляя в него фактические значения фактора x.

при х1=1/4 х

y=9883,0??*1/4 x+9112

y=2470,75 x+9112

х

у

1

11582,75

2

14053,5

3

16524,25

4

18995

5

21465,75

Значение параметра b > 0,следовательно, при увеличении признака - фактора х на единицу, значение признака - результата увеличивается на 2470,75 единиц.

при х2=3/4х

y=9883,0??*3/4 x+9112

y=7412,25 x+9112

х

у

1

16524,25

2

23936,5

3

31348,75

4

38761

5

46173,25

Значение параметра b > 0,следовательно, при увеличении признака - фактора х на единицу, значение признака - результата увеличивается на 7412,25 единиц.

Размещено на Allbest.ru

...

Подобные документы

  • Анализ, расчет и построение исходных динамических рядов признака-функции и признака-фактора. Расчет показателей вариации динамических рядов. Количественное измерение тесноты связи признака-функции и признаков-факторов методом парной корреляции.

    курсовая работа [92,7 K], добавлен 24.09.2014

  • Формирование массива случайных чисел. Построение интервального ряда распределения. Определение тесноты связи между типом населения и средним размером вклада, путем исчисления эмпирического корреляционного отношения. Географическая структура экспорта.

    задача [138,1 K], добавлен 05.12.2009

  • Исследование типа регрессии между случайными переменными. Построение эмпирического уравнения регрессии. Расчет выборочных средних, дисперсий и среднеквадратического отклонения. Определение показателя тесноты связи как линейного коэффициента корреляции.

    контрольная работа [513,5 K], добавлен 02.05.2015

  • Построение корреляционного поля и предложение гипотезы о связи между денежными доходами и потребительскими расходами, выдвижение предположения о наличии выбросов. Оценка статистической надежности и значимости вычисленного коэффициента корреляции.

    контрольная работа [3,0 M], добавлен 15.11.2012

  • Расчет средних уровней производительности труда и показателей вариации. Понятие моды и медианы признака, построение полигона и оценка характера асимметрии. Методика выравнивания ряда динамики по прямой линии. Индивидуальные и агрегатные индексы объема.

    контрольная работа [682,4 K], добавлен 24.09.2012

  • Показатели среднего, виды средних величин и связи между ними. Пример статистического обследования из области экономики и его основные атрибуты. Построение однопараметрической модели регрессии, оценка ее адекватности. Изменение статистического признака.

    контрольная работа [105,9 K], добавлен 25.02.2011

  • Построение корреляционного поля между ценой акции и доходностью капитала. Гипотеза о тесноте и виде зависимости между доходностью и ценой. Расчет коэффициента детерминации. Оценка статистической значимости уравнения регрессии с помощью F-критерия Фишера.

    контрольная работа [274,3 K], добавлен 25.09.2013

  • Эффективность оборотных средств. Оценка тесноты связи между факторным и результативным показателями на основе корреляционного анализа. Проверка значимости коэффициента корреляции. Оценка значимости уравнения линейной регрессии. Формы связи показателей.

    курсовая работа [143,2 K], добавлен 15.03.2015

  • Диаграмма рассеивания и подтверждение гипотезы о линейной зависимости, криволинейной связи по заданным статистическим данным с помощью пакета "Excel". Построение корреляционного поля, матрицы, определение параметров линейной связи. Модель Кобба-Дугласа.

    контрольная работа [153,8 K], добавлен 26.06.2009

  • Построение циклограмм движения бригад по участкам и графиков потребности в рабочих на период строительства волоконно-оптической линии связи. Формирование финансового результата работы объекта. Расчет экономической эффективности инвестиционного проекта.

    курсовая работа [102,8 K], добавлен 12.10.2014

  • Построение диаграммы рассеивания (корреляционного поля). Группировка данных и построение корреляционной таблицы. Оценка числовых характеристик для негруппированных и группированных данных. Выборочное значение статистики. Параметры линейной регрессии.

    контрольная работа [150,5 K], добавлен 14.12.2010

  • Эконометрическое моделирование динамики экспорта и импорта РФ: построение регрессии, дисперсионный анализ для линейной регрессии, эластичность показательной регрессии, изучение качества линейной регрессии, колеблемость признака. Доверительные интервалы.

    курсовая работа [367,5 K], добавлен 21.08.2008

  • Назначение рангового коэффициента корреляции, определение силы и направления корреляционной связи между двумя признаками или двумя профилями (иерархиями) признаков. Графическое представление метода ранговой корреляции, расчет эмпирического значения rs.

    презентация [46,5 K], добавлен 12.11.2010

  • Крупнейшие месторождения меди, развитие промышленности и прогноз формирования мирового рынка металла до 2013 года. Применение регрессионно-корреляционного и тренд-анализа для расчета экономических характеристик меди. Статистическая оценка тесноты связи.

    курсовая работа [1,9 M], добавлен 08.05.2011

  • Определение эмпирического корреляционного отношения. Вычисление общего индекса цен, физического объема товарооборота и товарооборота. Анализ динамики производства. Базисные и среднегодовые показатели абсолютного прироста и темпов прироста производства.

    контрольная работа [133,8 K], добавлен 18.03.2015

  • Определение среднего недовеса и прироста реализации товара. Расчет дисперсии, эмпирического коэффициента детерминации и корреляционного отношения. Анализ вкладов в базисном и отчетном периодах. Расчет валовой добавленной стоимости по сферам деятельности.

    контрольная работа [59,8 K], добавлен 02.03.2011

  • Теоретическое обоснование связи между показателями. Определение методологии исследования вариационного ряда. Проверка статистической значимости. Показатели среднедушевых доходов населения и числа собственных легковых автомобилей и их взаимосвязь.

    дипломная работа [166,7 K], добавлен 30.06.2009

  • Порядок определения межгрупповой и общей дисперсии по заданным группам, коэффициента детерминации, эмпирического корреляционного отношения. Определение индекса снижения себестоимости продукции. Расчет средней хронологической ряда динамики и прироста.

    задача [50,2 K], добавлен 31.05.2010

  • Выявление корреляционной связи между факторным и результативным признаками, направления связи и ее тесноты. Расчёт дисперсии, ошибки выборки, индексов среднего товарооборота на душу населения переменного, постоянного состава, структурных сдвигов.

    курсовая работа [166,7 K], добавлен 15.01.2014

  • Этапы корреляционно-регрессионного анализа, построение корреляционной модели и определение функции, отражающей механизм связи между факторным и результативным признаками. Измерение тесноты корреляционной связи, расчет индекса корреляции и дисперсии.

    лекция [38,1 K], добавлен 13.02.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.