Первичный эконометрический анализ. Основные свойства выборки
Определение основных статистических характеристик. Особенности разбиения выборок на классы однородности. Проверка гипотезы согласия выборочных данных с нормальным распределением на основе критерия Пирсона. Расчет парных коэффициентов корреляции.
Рубрика | Экономико-математическое моделирование |
Вид | лабораторная работа |
Язык | русский |
Дата добавления | 15.05.2016 |
Размер файла | 84,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Министерство образования и науки Российской Федерации
Новосибирский государственный технический университет
Кафедра теории рынка
Лабораторная работа №1
Тема: Первичный эконометрический анализ. Основные свойства выборки
Вариант № 5
Выполнили: студенты 2 курса
Гр. ФБЭ-21
Басманова Валерия
Хмельницкая Мария
Проверил: к.т.н. Фаддеенков А.В.
Новосибирск
2014
Цель работы:
1. По имеющимся результатам наблюдений для каждого показателя определить основные статистические характеристики (среднее, медиану, дисперсию, среднеквадратическое отклонение, коэффициенты асимметрии и эксцесса, коэффициент вариации, используя стандартные функции Excel - СРЗНАЧ(), МЕДИАНА(), ДИСП(), СТАНДОТКЛОН(), СКОС() и ЭКСЦЕСС() соответственно), сделать предварительные выводы о свойствах выборки.
2. Провести разбиение выборок на классы однородности, построить кумулятивные линии эмпирического распределения и гистограммы. Проанализировать полученные графики.
3. Сформулировать и проверить гипотезу согласии выборочных данных с нормальным распределением на основе критерия ч2-Пирсона. Сделать выводы. 4. Нанести исходные данные на координатную плоскость и сделать обоснованное предварительное заключение о наличии (отсутствии) связи между всеми парами факторов, а также о ее характере (положительная или отрицательная) и форме (линейная или нелинейная).
5. Рассчитать парные коэффициенты корреляции для каждой пары показателей. Построить корреляционную матрицу. Используя t-критерий Стьюдента, проверить значимость полученных коэффициентов корреляции. Сделать выводы о тесноте связи между факторами.
6. Для каждой пары показателей вычислить частный коэффициент корреляции и проверить его на значимость. Для значимых коэффициентов построить 95% доверительные интервалы. Сделать выводы.
7. Вычислить все возможные множественные коэффициенты корреляции. Сделать выводы.
8. По результатам работы сделать общие выводы и сформулировать рекомендации для Робинзона.
Ход работы
Имеется ограниченный ряд наблюдений случайной величины :
X1 |
X2 |
X3 |
|
0 |
0 |
20 |
|
0 |
1 |
20 |
|
5 |
2 |
20 |
|
14 |
2 |
21 |
|
19 |
2 |
22 |
|
21 |
3 |
23 |
|
28 |
4 |
25 |
|
30 |
4 |
25 |
|
37 |
4 |
26 |
|
37 |
5 |
26 |
|
39 |
5 |
27 |
|
39 |
5 |
27 |
|
40 |
5 |
28 |
|
44 |
5 |
30 |
|
47 |
6 |
30 |
|
48 |
7 |
30 |
|
50 |
7 |
31 |
|
50 |
7 |
31 |
|
57 |
7 |
31 |
|
57 |
7 |
31 |
|
60 |
7 |
31 |
|
61 |
7 |
32 |
|
61 |
8 |
33 |
|
64 |
8 |
33 |
|
64 |
8 |
34 |
|
68 |
8 |
34 |
|
69 |
9 |
34 |
|
70 |
9 |
34 |
|
71 |
9 |
35 |
|
72 |
9 |
35 |
|
74 |
9 |
36 |
|
74 |
9 |
36 |
|
76 |
10 |
36 |
|
77 |
11 |
36 |
|
79 |
11 |
37 |
|
81 |
12 |
37 |
|
81 |
12 |
37 |
|
85 |
12 |
37 |
|
86 |
13 |
38 |
|
87 |
13 |
38 |
|
88 |
13 |
39 |
|
90 |
14 |
39 |
|
92 |
14 |
39 |
|
97 |
14 |
39 |
|
97 |
14 |
39 |
|
99 |
16 |
39 |
|
100 |
16 |
40 |
|
100 |
18 |
40 |
|
100 |
19 |
40 |
|
100 |
21 |
40 |
где 1 количество выпитого Робинзоном пива (в процентах от объема фляги),
2 количество убитых уток (в штуках),
3 средняя температура воздуха в день охоты (в градусах Цельсия).
Определяем основные статистические характеристики
СРЕДНЕЕ ЗНАЧЕНИЕ -- статистический обобщенный показатель какой-либо величины.
Среднее значение вычисляем по формуле i
??1 |
??2 |
??3 |
|
61,7 |
8,82 |
32,42 |
Среднее значение для X1 говорит о том, что в среднем Робинзон выпивает 62% пива от объема фляги. Среднее значение для X2 говорит о том, что в среднем в день он убивает 8 уток. А среднее значение температуры (X3) колеблется около С.
МЕДИАНА -- это то значение выборки, которое находится в середине вариационного ряда.
Медиану вычисляем по формуле
пирсон корреляция выборка статистический
где: -- искомая медиана
-- нижняя граница интервала, который содержит медиану
-- величина интервала
-- сумма частот или число членов ряда
- сумма накопленных частот интервалов, предшествующих медианному
-- частота медианного интервала
Ме1 |
Ме2 |
Ме3 |
|
787,2 |
23,05 |
36,74 |
ВЫБОРОЧНАЯ ДИСПЕРСИЯ - дисперсия эмпирического распределения.
Выборочная дисперсия S2==
S12 |
S22 |
S32 |
|
787,15 |
23,05 |
36,74 |
Выборочные среднеквадратические отклонения
S1 |
S2 |
S3 |
|
28,06 |
4,80 |
6,06 |
КОЭФФИЦИЕНТ АССИМЕТРИИ-- величина, характеризующая асимметрию распределения данной случайной величины.
Коэффициент асимметрии вычисляется по формуле:
, ,
1 |
2 |
3 |
|
-0,16 |
0,03 |
-0,30 |
Исходя из полученных значений асимметрии, первая и третья выборки X1 и X3 имеют левую асимметрию, а выборка X2 - правую.
КОЭФФИЦИЕНТ ЭКСЦЕССА (коэффициент островершинности) -- мера остроты пика распределения случайной величины.
Коэффициент эксцесса вычисляется как:
,
-0,52 |
-0,17 |
-0,65 |
Графики данных выборок расположены ниже графика нормального распределения, т.к. коэффициенты эксцесса - отрицательные.
КОЭФФИЦИЕНТ ВАРИАЦИИ - это безразмерная величина, которая указывает величину вариации(среднеквадратического отклонения) на единицу среднего значения.
V1 |
V2 |
V3 |
|
0,455 |
0,544 |
0,187 |
Наиболее стабильный показатель - это температура, V3 стабильнее V2 в 2,9 раз, а V1 в 2,4 раза.
2) Расчет критерия 2- Пирсона
По правилу Штюргеса количество классов определяются k=1+3,32 lg n=1+3,32 lg 50=6
По выборке Х1:
b= В (наблюдаемая абсолютная частота)
0; 16,667) B= 4
16,667; 33,334) B=4
33,334; 50,001) B=8
50,001; 66,668) B=9
66,668; 83,355) B=12
83,355; 100] B=13
№ класса |
Границы интервала |
Наблюдаемая частота, Bi |
Теоретическая частота, Ei |
(Bi - Ei )^2 / Ei |
|
1 |
0; 16,667) |
4 |
2 |
2 |
|
2 |
16,667; 33,334) |
4 |
5 |
0,2 |
|
3 |
33,334; 50,001) |
8 |
9 |
0,1 |
|
4 |
50,001; 66,668) |
9 |
12 |
0,75 |
|
5 |
66,668; 83,355) |
12 |
11 |
0,09 |
|
6 |
83,355; 100] |
13 |
7 |
5 |
2расч.=8,14
2крит.=7,81
2расч.> 2крит. гипотеза о том, что наблюдаемые частоты распределены нормально, отвергается. А значит, существует связь приближенная к линейной.
По выборке Х2:
b= B
0; 3,5) 5
3,5; 7) 10
7; 10,5) 18
10,5; 14) 8
14; 17,5) 6
17,5; 21 3
№ класса |
Границы интервала |
Наблюдаемая частота, Bi |
Теоретическая частота, Ei |
(Bi - Ei )^2 / Ei |
|
1 |
0; 3,5) |
5 |
5,03 |
0,02 |
|
2 |
3,5; 7) |
10 |
10,92 |
0,08 |
|
3 |
7; 10,5) |
18 |
14,23 |
1 |
|
4 |
10,5; 14) |
8 |
11,15 |
0,89 |
|
5 |
14; 17,5) |
6 |
5,25 |
0,12 |
|
6 |
17,5; 21 |
3 |
1,48 |
1,56 |
2расч.=3,67
2крит.= 7,81
2расч.< 2крит. гипотеза о том, что наблюдаемые частоты распределены нормально, не отвергается. Значит, отсутствует линейная связь.
По выборке Х3:
b= B
20; 23,33) 6
23,33; 26,66) 4
26,66; 29,99) 3
29,99; 33,32) 11
33,32; 36,35) 10
36,35; 40 16
№ класса |
Границы интервала |
Наблюдаемая частота, Bi |
Теоретическая частота, Ei |
(Bi - Ei )^2 / Ei |
|
1 |
20; 23,33) |
6 |
2,33 |
5,78 |
|
2 |
23,33; 26,66) |
4 |
5,2 |
0,28 |
|
3 |
26,66; 29,99) |
3 |
8,66 |
3,7 |
|
4 |
29,99; 33,32) |
11 |
10,74 |
0,006 |
|
5 |
33,32; 36,35) |
10 |
9,92 |
0,0006 |
|
6 |
36,35; 40 |
16 |
6,85 |
12,22 |
2расч.=21,9866
2крит.=7,81
2расч.> 2крит. гипотеза о том, что наблюдаемые частоты распределены нормально, отвергается. А значит, существует связь приближенная к линейной.
5. Находим парные коэффициенты корреляции для каждой пары по формуле:
1-2 |
1-3 |
2-3 |
|
0,932 |
0,972 |
0,915 |
Мы можем сделать вывод, т.к. все , то зависимость у каждой пары положительная.
Теперь строим корреляционную матрицу, используя парные коэффициенты корреляции:
R=
Используя t-критерий Стьюдента, проверим значимость коэффициентов корреляции:
1-2 |
1-3 |
2-3 |
|
17,856 |
28,416 |
15,691 |
При ?=0,95 и число степеней свободы (N-2)=48
tтабл=2,0106
т.к. t12, t13, t23 tтабл , то гипотеза отвергается. Следовательно, эти коэффициенты корреляции существенно отличаются от нуля. И с вероятностью 0,95 можно считать, что факт наличия линейной зависимости между показателями является доказанным.
6. Вычислим для каждой пары частный коэффициент корреляции по формуле:
12*3 |
13*2 |
23*1 |
|
0.452 |
0.821 |
0.107 |
Мы можем сделать вывод, что зависимость 1 и 2, исключая влияние 3 признака, наиболее приближена к линейной, так же как и зависимость между 1 и 3, исключая 2 признак. А зависимость между 2 и 3, исключая 1 признак, наиболее отдалена от линейной зависимости.
Проверим значимость частных коэффициентов корреляции по формуле:
P=1
12*3 |
13*2 |
23*1 |
|
3.474 |
9.858 |
0.738 |
При ?=0,95 и число степеней свободы (N-р-2)=47
tтабл=2,0117
т.к. t12*3, t13*2tтабл , то гипотеза отвергается, а значит, что зависимость наиболее существенная и приближена к линейной. t23*1 tтабл, значит гипотеза не отвергается.
Для значимых признаков 12*3 и 13*2 построим доверительные интервалы:
Z12 |
Z13 |
|
1,673 |
2,127 |
Затем найдем границы доверительных интервалов (Zmin ; Zmax)
Zmin 12 |
Zmax 12 |
|
1,4321 |
1,9139 |
Zmin 13 |
Zmax 13 |
|
1,8861 |
2,3679 |
Подставив в первоначальную функцию получим:
1-2: rmin=0.892 rmax=0.957
1-3: rmin=0.955 rmax=0.983
Мы можем сделать выводы, что наиболее значимая зависимость, и приближена к линейной - это между пивом и утками и между пивом и температурой. А зависимость между утками и температурой является ложной, то есть имеет место ложная корреляция.
7. Вычислим множественные коэффициенты корреляции:
1*23 |
2*13 |
3*12 |
|
0.953 |
0.933 |
0.973 |
Вывод: При более подробном исследовании по критерию ч2-Пирсона не отвергнутой осталась лишь гипотеза о нормальности распределения Х2. Таким образом, с 95% уровнем доверительной вероятности можем утверждать, что выборка Х2, соответствующая количеству убитых Робинзоном уток, распределена по нормальному закону.
По предварительным выводам температура на острове Робинзона в среднем составляет 32?С, идя на охоту он в среднем убивает 8 уток и выпивает 61% фляги пива(3/5 от всей фляги).
Гистограммы показывают, что температура чаще всего 31,66-38,33 ?С, он убивает 8-9 уток и выпивает 75-91,67% содержимого фляги. Таким образом, получается, что средние значения и наибольшие частоты практически совпадают в выборках температуры и убитых уток, чего нельзя сказать о последней.
По итогам проверки гипотез, можем утверждать, что лишь выборка Х2, соответствующая количеству убитых Робинзоном уток, распределена по нормальному закону.
Вычислив парные коэффициенты корреляции, и, проверив их на значимость, все гипотезы отвергаются. И с вероятностью 0,95 можно считать, что факт наличия линейной зависимости между показателями является доказанным.
По итогам вычисления частных коэффициентов, можно сделать выводы, что зависимость между пивом и утками, исключая влияние температуры, и между пивом и температурой, исключая влияние уток, наиболее существенная и приближена к линейной. А зависимость между утками и температурой является ложной, то есть имеет место ложная корреляция.
Размещено на Allbest.ru
...Подобные документы
Построение вариационного (статистического) ряда, гистограммы и эмпирической функции распределения. Определение выборочных оценок числовых характеристик случайной величины. Расчет матрицы парных коэффициентов корреляции и создание модели парной регрессии.
контрольная работа [2,0 M], добавлен 05.04.2014Проверка гипотезы о нормальности распределения дневных логарифмических доходностей, рассчитанных по котировкам акций. Принятие в расчет достаточного объема выборок данных. Расчет характеристик временных рядов. Оценка статистического критерия Фроцини.
курсовая работа [307,0 K], добавлен 29.08.2015Параметры автомобиля, которые влияют на стоимость. Обозначение границ выборки. Использование множественной регрессии. Построение с помощью эконометрического программного пакета Eviews симметричной матрицы парных коэффициентов корреляции между факторами.
контрольная работа [348,7 K], добавлен 13.05.2015- Использование корреляционно-регрессионного анализа для обработки экономических статистических данных
Расчет стоимости оборудования с использованием методов корреляционного моделирования. Метод парной и множественной корреляции. Построение матрицы парных коэффициентов корреляции. Проверка оставшихся факторных признаков на свойство мультиколлинеарности.
задача [83,2 K], добавлен 20.01.2010 Эконометрическое моделирование стоимости квартир в московской области. Матрица парных коэффициентов корреляции. Расчет параметров линейной парной регрессии. Исследование динамики экономического показателя на основе анализа одномерного временного ряда.
контрольная работа [298,2 K], добавлен 19.01.2011Особенности метода проверки гипотезы о законе распределения по критерию согласия хи-квадрат Пирсона. Свойства базовой псевдослучайной последовательности. Методы оценки закона распределения и вероятностных характеристик случайной последовательности.
лабораторная работа [234,7 K], добавлен 28.02.2010Основные характеристики распределения экономических величин. Сущность, особенности и метод вычисления коэффициента корреляции Пирсона. Расчет статистических характеристик величин с помощью MINITAB. Расчет основных статистических показателей в пакете.
методичка [411,0 K], добавлен 15.12.2008Определение парных коэффициентов корреляции и на их основе факторов, оказывающих наибольшее влияние на результативный показатель. Анализ множественных коэффициентов корреляции и детерминации. Оценка качества модели на основе t-статистики Стьюдента.
лабораторная работа [890,1 K], добавлен 06.12.2014Корреляционный и регрессионный анализ экономических показателей. Построение матрицы парных коэффициентов корреляции. Расчет и сравнение частных и парных коэффициентов корреляции. Построение регрессионной модели и её интерпретация, мультиколлинеарность.
курсовая работа [314,1 K], добавлен 21.01.2011Построение поля корреляции и формулировка гипотезы о линейной форме связи. Расчет уравнений различных регрессий. Расчет коэффициентов эластичности, корреляции, детерминации и F-критерия Фишера. Расчет прогнозного значения результата и его ошибки.
контрольная работа [681,9 K], добавлен 03.08.2010Построение и анализ классической многофакторной линейной эконометрической модели. Вид линейной двухфакторной модели, её оценка в матричной форме и проверка адекватности по критерию Фишера. Расчет коэффициентов множественной детерминации и корреляции.
контрольная работа [131,9 K], добавлен 01.06.2010Методика нахождения основных числовых характеристик с помощью эконометрического анализа. Вычисление среднего значения, дисперсии. Построение корреляционного поля (диаграммы рассеивания), расчет общего разброса данных. Нахождение значения критерия Фишера.
контрольная работа [38,2 K], добавлен 16.07.2009Построение и анализ однофакторной и многофакторной эконометрической модели. Вычисление парных и частичных коэффициентов корреляции. Проверка адекватности модели по критерию Фишера. Исследование наличия мультиколлениарности по алгоритму Феррара-Глобера.
контрольная работа [172,4 K], добавлен 28.05.2010Расчет матрицы парных коэффициентов корреляции и статистической значимости коэффициентов регрессии. Оценка статистической значимости параметров регрессионной модели с помощью t-критерия. Уравнение множественной регрессии со статистически факторами.
лабораторная работа [30,9 K], добавлен 05.12.2010Построение линейного уравнения парной регрессии, расчет линейного коэффициента парной корреляции и средней ошибки аппроксимации. Определение коэффициентов корреляции и эластичности, индекса корреляции, суть применения критерия Фишера в эконометрике.
контрольная работа [141,3 K], добавлен 05.05.2010Построение линейной модели зависимости цены товара в торговых точках. Расчет матрицы парных коэффициентов корреляции, оценка статистической значимости коэффициентов корреляции, параметров регрессионной модели, доверительного интервала для наблюдений.
лабораторная работа [214,2 K], добавлен 17.10.2009Использование пакета программ статистической обработки данных Statistica. Значение парных коэффициентов корреляции. Выборка, среднее стандартное отклонение. Дисперсионный анализ и регрессионная сумма. Значение критерия Фишера, статистика Дарбина-Уотсона.
контрольная работа [1,7 M], добавлен 23.05.2012Основные методы обработки данных, представленные выборкой. Графические представления данных. Расчет с помощью ЭВМ основных характеристик выборки. Статистические гипотезы, используемые в экономике. Парная линейная, нелинейная и полиноминальная регрессия.
лабораторная работа [92,8 K], добавлен 01.03.2010Регрессионный анализ. Экспериментальные, средние и расчетные значения выходной переменной. Проверка однородности дисперсий. Оценка значимости коэффициентов модели. Табличные значения критерия Стьюдента для заданных уровней значимости и степеней свободы.
лабораторная работа [2,9 M], добавлен 28.12.2012Освоение методики организации и проведения выборочного наблюдения; статистических методов и методов компьютерной обработки информации; методов оценки параметров генеральной совокупности на основе выборочных данных. Проверка статистических гипотез.
лабораторная работа [258,1 K], добавлен 13.05.2010