Первичный эконометрический анализ. Основные свойства выборки

Определение основных статистических характеристик. Особенности разбиения выборок на классы однородности. Проверка гипотезы согласия выборочных данных с нормальным распределением на основе критерия Пирсона. Расчет парных коэффициентов корреляции.

Рубрика Экономико-математическое моделирование
Вид лабораторная работа
Язык русский
Дата добавления 15.05.2016
Размер файла 84,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство образования и науки Российской Федерации

Новосибирский государственный технический университет

Кафедра теории рынка

Лабораторная работа №1

Тема: Первичный эконометрический анализ. Основные свойства выборки

Вариант № 5

Выполнили: студенты 2 курса

Гр. ФБЭ-21

Басманова Валерия

Хмельницкая Мария

Проверил: к.т.н. Фаддеенков А.В.

Новосибирск

2014

Цель работы:

1. По имеющимся результатам наблюдений для каждого показателя определить основные статистические характеристики (среднее, медиану, дисперсию, среднеквадратическое отклонение, коэффициенты асимметрии и эксцесса, коэффициент вариации, используя стандартные функции Excel - СРЗНАЧ(), МЕДИАНА(), ДИСП(), СТАНДОТКЛОН(), СКОС() и ЭКСЦЕСС() соответственно), сделать предварительные выводы о свойствах выборки.

2. Провести разбиение выборок на классы однородности, построить кумулятивные линии эмпирического распределения и гистограммы. Проанализировать полученные графики.

3. Сформулировать и проверить гипотезу согласии выборочных данных с нормальным распределением на основе критерия ч2-Пирсона. Сделать выводы. 4. Нанести исходные данные на координатную плоскость и сделать обоснованное предварительное заключение о наличии (отсутствии) связи между всеми парами факторов, а также о ее характере (положительная или отрицательная) и форме (линейная или нелинейная).

5. Рассчитать парные коэффициенты корреляции для каждой пары показателей. Построить корреляционную матрицу. Используя t-критерий Стьюдента, проверить значимость полученных коэффициентов корреляции. Сделать выводы о тесноте связи между факторами.

6. Для каждой пары показателей вычислить частный коэффициент корреляции и проверить его на значимость. Для значимых коэффициентов построить 95% доверительные интервалы. Сделать выводы.

7. Вычислить все возможные множественные коэффициенты корреляции. Сделать выводы.

8. По результатам работы сделать общие выводы и сформулировать рекомендации для Робинзона.

Ход работы

Имеется ограниченный ряд наблюдений случайной величины :

X1

X2

X3

0

0

20

0

1

20

5

2

20

14

2

21

19

2

22

21

3

23

28

4

25

30

4

25

37

4

26

37

5

26

39

5

27

39

5

27

40

5

28

44

5

30

47

6

30

48

7

30

50

7

31

50

7

31

57

7

31

57

7

31

60

7

31

61

7

32

61

8

33

64

8

33

64

8

34

68

8

34

69

9

34

70

9

34

71

9

35

72

9

35

74

9

36

74

9

36

76

10

36

77

11

36

79

11

37

81

12

37

81

12

37

85

12

37

86

13

38

87

13

38

88

13

39

90

14

39

92

14

39

97

14

39

97

14

39

99

16

39

100

16

40

100

18

40

100

19

40

100

21

40

где 1 количество выпитого Робинзоном пива (в процентах от объема фляги),

2 количество убитых уток (в штуках),

3 средняя температура воздуха в день охоты (в градусах Цельсия).

Определяем основные статистические характеристики

СРЕДНЕЕ ЗНАЧЕНИЕ -- статистический обобщенный показатель какой-либо величины.

Среднее значение вычисляем по формуле i

??1

??2

??3

61,7

8,82

32,42

Среднее значение для X1 говорит о том, что в среднем Робинзон выпивает 62% пива от объема фляги. Среднее значение для X2 говорит о том, что в среднем в день он убивает 8 уток. А среднее значение температуры (X3) колеблется около С.

МЕДИАНА -- это то значение выборки, которое находится в середине вариационного ряда.

Медиану вычисляем по формуле

пирсон корреляция выборка статистический

где: -- искомая медиана

-- нижняя граница интервала, который содержит медиану

-- величина интервала

-- сумма частот или число членов ряда

- сумма накопленных частот интервалов, предшествующих медианному

-- частота медианного интервала

Ме1

Ме2

Ме3

787,2

23,05

36,74

ВЫБОРОЧНАЯ ДИСПЕРСИЯ - дисперсия эмпирического распределения.

Выборочная дисперсия S2==

S12

S22

S32

787,15

23,05

36,74

Выборочные среднеквадратические отклонения

S1

S2

S3

28,06

4,80

6,06

КОЭФФИЦИЕНТ АССИМЕТРИИ-- величина, характеризующая асимметрию распределения данной случайной величины.

Коэффициент асимметрии вычисляется по формуле:

, ,

1

2

3

-0,16

0,03

-0,30

Исходя из полученных значений асимметрии, первая и третья выборки X1 и X3 имеют левую асимметрию, а выборка X2 - правую.

КОЭФФИЦИЕНТ ЭКСЦЕССА (коэффициент островершинности) -- мера остроты пика распределения случайной величины.

Коэффициент эксцесса вычисляется как:

,

-0,52

-0,17

-0,65

Графики данных выборок расположены ниже графика нормального распределения, т.к. коэффициенты эксцесса - отрицательные.

КОЭФФИЦИЕНТ ВАРИАЦИИ - это безразмерная величина, которая указывает величину вариации(среднеквадратического отклонения) на единицу среднего значения.

V1

V2

V3

0,455

0,544

0,187

Наиболее стабильный показатель - это температура, V3 стабильнее V2 в 2,9 раз, а V1 в 2,4 раза.

2) Расчет критерия 2- Пирсона

По правилу Штюргеса количество классов определяются k=1+3,32 lg n=1+3,32 lg 50=6

По выборке Х1:

b= В (наблюдаемая абсолютная частота)

0; 16,667) B= 4

16,667; 33,334) B=4

33,334; 50,001) B=8

50,001; 66,668) B=9

66,668; 83,355) B=12

83,355; 100] B=13

класса

Границы

интервала

Наблюдаемая

частота, Bi

Теоретическая

частота, Ei

(Bi - Ei )^2 / Ei

1

0; 16,667)

4

2

2

2

16,667; 33,334)

4

5

0,2

3

33,334; 50,001)

8

9

0,1

4

50,001; 66,668)

9

12

0,75

5

66,668; 83,355)

12

11

0,09

6

83,355; 100]

13

7

5

2расч.=8,14

2крит.=7,81

2расч.> 2крит. гипотеза о том, что наблюдаемые частоты распределены нормально, отвергается. А значит, существует связь приближенная к линейной.

По выборке Х2:

b= B

0; 3,5) 5

3,5; 7) 10

7; 10,5) 18

10,5; 14) 8

14; 17,5) 6

17,5; 21 3

класса

Границы

интервала

Наблюдаемая

частота, Bi

Теоретическая

частота, Ei

(Bi - Ei )^2 / Ei

1

0; 3,5)

5

5,03

0,02

2

3,5; 7)

10

10,92

0,08

3

7; 10,5)

18

14,23

1

4

10,5; 14)

8

11,15

0,89

5

14; 17,5)

6

5,25

0,12

6

17,5; 21

3

1,48

1,56

2расч.=3,67

2крит.= 7,81

2расч.< 2крит. гипотеза о том, что наблюдаемые частоты распределены нормально, не отвергается. Значит, отсутствует линейная связь.

По выборке Х3:

b= B

20; 23,33) 6

23,33; 26,66) 4

26,66; 29,99) 3

29,99; 33,32) 11

33,32; 36,35) 10

36,35; 40 16

класса

Границы

интервала

Наблюдаемая

частота, Bi

Теоретическая

частота, Ei

(Bi - Ei )^2 / Ei

1

20; 23,33)

6

2,33

5,78

2

23,33; 26,66)

4

5,2

0,28

3

26,66; 29,99)

3

8,66

3,7

4

29,99; 33,32)

11

10,74

0,006

5

33,32; 36,35)

10

9,92

0,0006

6

36,35; 40

16

6,85

12,22

2расч.=21,9866

2крит.=7,81

2расч.> 2крит. гипотеза о том, что наблюдаемые частоты распределены нормально, отвергается. А значит, существует связь приближенная к линейной.

5. Находим парные коэффициенты корреляции для каждой пары по формуле:

1-2

1-3

2-3

0,932

0,972

0,915

Мы можем сделать вывод, т.к. все , то зависимость у каждой пары положительная.

Теперь строим корреляционную матрицу, используя парные коэффициенты корреляции:

R=

Используя t-критерий Стьюдента, проверим значимость коэффициентов корреляции:

1-2

1-3

2-3

17,856

28,416

15,691

При ?=0,95 и число степеней свободы (N-2)=48

tтабл=2,0106

т.к. t12, t13, t23 tтабл , то гипотеза отвергается. Следовательно, эти коэффициенты корреляции существенно отличаются от нуля. И с вероятностью 0,95 можно считать, что факт наличия линейной зависимости между показателями является доказанным.

6. Вычислим для каждой пары частный коэффициент корреляции по формуле:

12*3

13*2

23*1

0.452

0.821

0.107

Мы можем сделать вывод, что зависимость 1 и 2, исключая влияние 3 признака, наиболее приближена к линейной, так же как и зависимость между 1 и 3, исключая 2 признак. А зависимость между 2 и 3, исключая 1 признак, наиболее отдалена от линейной зависимости.

Проверим значимость частных коэффициентов корреляции по формуле:

P=1

12*3

13*2

23*1

3.474

9.858

0.738

При ?=0,95 и число степеней свободы (N-р-2)=47

tтабл=2,0117

т.к. t12*3, t13*2tтабл , то гипотеза отвергается, а значит, что зависимость наиболее существенная и приближена к линейной. t23*1 tтабл, значит гипотеза не отвергается.

Для значимых признаков 12*3 и 13*2 построим доверительные интервалы:

Z12

Z13

1,673

2,127

Затем найдем границы доверительных интервалов (Zmin ; Zmax)

Zmin 12

Zmax 12

1,4321

1,9139

Zmin 13

Zmax 13

1,8861

2,3679

Подставив в первоначальную функцию получим:

1-2: rmin=0.892 rmax=0.957

1-3: rmin=0.955 rmax=0.983

Мы можем сделать выводы, что наиболее значимая зависимость, и приближена к линейной - это между пивом и утками и между пивом и температурой. А зависимость между утками и температурой является ложной, то есть имеет место ложная корреляция.

7. Вычислим множественные коэффициенты корреляции:

1*23

2*13

3*12

0.953

0.933

0.973

Вывод: При более подробном исследовании по критерию ч2-Пирсона не отвергнутой осталась лишь гипотеза о нормальности распределения Х2. Таким образом, с 95% уровнем доверительной вероятности можем утверждать, что выборка Х2, соответствующая количеству убитых Робинзоном уток, распределена по нормальному закону.

По предварительным выводам температура на острове Робинзона в среднем составляет 32?С, идя на охоту он в среднем убивает 8 уток и выпивает 61% фляги пива(3/5 от всей фляги).

Гистограммы показывают, что температура чаще всего 31,66-38,33 ?С, он убивает 8-9 уток и выпивает 75-91,67% содержимого фляги. Таким образом, получается, что средние значения и наибольшие частоты практически совпадают в выборках температуры и убитых уток, чего нельзя сказать о последней.

По итогам проверки гипотез, можем утверждать, что лишь выборка Х2, соответствующая количеству убитых Робинзоном уток, распределена по нормальному закону.

Вычислив парные коэффициенты корреляции, и, проверив их на значимость, все гипотезы отвергаются. И с вероятностью 0,95 можно считать, что факт наличия линейной зависимости между показателями является доказанным.

По итогам вычисления частных коэффициентов, можно сделать выводы, что зависимость между пивом и утками, исключая влияние температуры, и между пивом и температурой, исключая влияние уток, наиболее существенная и приближена к линейной. А зависимость между утками и температурой является ложной, то есть имеет место ложная корреляция.

Размещено на Allbest.ru

...

Подобные документы

  • Построение вариационного (статистического) ряда, гистограммы и эмпирической функции распределения. Определение выборочных оценок числовых характеристик случайной величины. Расчет матрицы парных коэффициентов корреляции и создание модели парной регрессии.

    контрольная работа [2,0 M], добавлен 05.04.2014

  • Проверка гипотезы о нормальности распределения дневных логарифмических доходностей, рассчитанных по котировкам акций. Принятие в расчет достаточного объема выборок данных. Расчет характеристик временных рядов. Оценка статистического критерия Фроцини.

    курсовая работа [307,0 K], добавлен 29.08.2015

  • Параметры автомобиля, которые влияют на стоимость. Обозначение границ выборки. Использование множественной регрессии. Построение с помощью эконометрического программного пакета Eviews симметричной матрицы парных коэффициентов корреляции между факторами.

    контрольная работа [348,7 K], добавлен 13.05.2015

  • Расчет стоимости оборудования с использованием методов корреляционного моделирования. Метод парной и множественной корреляции. Построение матрицы парных коэффициентов корреляции. Проверка оставшихся факторных признаков на свойство мультиколлинеарности.

    задача [83,2 K], добавлен 20.01.2010

  • Эконометрическое моделирование стоимости квартир в московской области. Матрица парных коэффициентов корреляции. Расчет параметров линейной парной регрессии. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.

    контрольная работа [298,2 K], добавлен 19.01.2011

  • Особенности метода проверки гипотезы о законе распределения по критерию согласия хи-квадрат Пирсона. Свойства базовой псевдослучайной последовательности. Методы оценки закона распределения и вероятностных характеристик случайной последовательности.

    лабораторная работа [234,7 K], добавлен 28.02.2010

  • Основные характеристики распределения экономических величин. Сущность, особенности и метод вычисления коэффициента корреляции Пирсона. Расчет статистических характеристик величин с помощью MINITAB. Расчет основных статистических показателей в пакете.

    методичка [411,0 K], добавлен 15.12.2008

  • Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.

    лабораторная работа [890,1 K], добавлен 06.12.2014

  • Корреляционный и регрессионный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчет и сравнение частных и парных коэффициентов корреляции. Построение регрессионной модели и её интерпретация, мультиколлинеарность.

    курсовая работа [314,1 K], добавлен 21.01.2011

  • Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.

    контрольная работа [681,9 K], добавлен 03.08.2010

  • Построение и анализ классической многофакторной линейной эконометрической модели. Вид линейной двухфакторной модели, её оценка в матричной форме и проверка адекватности по критерию Фишера. Расчет коэффициентов множественной детерминации и корреляции.

    контрольная работа [131,9 K], добавлен 01.06.2010

  • Методика нахождения основных числовых характеристик с помощью эконометрического анализа. Вычисление среднего значения, дисперсии. Построение корреляционного поля (диаграммы рассеивания), расчет общего разброса данных. Нахождение значения критерия Фишера.

    контрольная работа [38,2 K], добавлен 16.07.2009

  • Построение и анализ однофакторной и многофакторной эконометрической модели. Вычисление парных и частичных коэффициентов корреляции. Проверка адекватности модели по критерию Фишера. Исследование наличия мультиколлениарности по алгоритму Феррара-Глобера.

    контрольная работа [172,4 K], добавлен 28.05.2010

  • Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.

    лабораторная работа [30,9 K], добавлен 05.12.2010

  • Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.

    контрольная работа [141,3 K], добавлен 05.05.2010

  • Построение линейной модели зависимости цены товара в торговых точках. Расчет матрицы парных коэффициентов корреляции, оценка статистической значимости коэффициентов корреляции, параметров регрессионной модели, доверительного интервала для наблюдений.

    лабораторная работа [214,2 K], добавлен 17.10.2009

  • Использование пакета программ статистической обработки данных Statistica. Значение парных коэффициентов корреляции. Выборка, среднее стандартное отклонение. Дисперсионный анализ и регрессионная сумма. Значение критерия Фишера, статистика Дарбина-Уотсона.

    контрольная работа [1,7 M], добавлен 23.05.2012

  • Основные методы обработки данных, представленные выборкой. Графические представления данных. Расчет с помощью ЭВМ основных характеристик выборки. Статистические гипотезы, используемые в экономике. Парная линейная, нелинейная и полиноминальная регрессия.

    лабораторная работа [92,8 K], добавлен 01.03.2010

  • Регрессионный анализ. Экспериментальные, средние и расчетные значения выходной переменной. Проверка однородности дисперсий. Оценка значимости коэффициентов модели. Табличные значения критерия Стьюдента для заданных уровней значимости и степеней свободы.

    лабораторная работа [2,9 M], добавлен 28.12.2012

  • Освоение методики организации и проведения выборочного наблюдения; статистических методов и методов компьютерной обработки информации; методов оценки параметров генеральной совокупности на основе выборочных данных. Проверка статистических гипотез.

    лабораторная работа [258,1 K], добавлен 13.05.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.