Общая теория статистики
Статистика как самостоятельная общественная наука. Изучение методов статистических исследований, применяемых в области экономики, менеджмента. Способы проведения корреляционного и регрессионного анализа. Определение средних величин и показателей вариации.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 22.02.2019 |
Размер файла | 1,0 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
ФАКУЛЬТЕТ «ЭКОНОМИКА И УПРАВЛЕНИЕ»
КАФЕДРА «ЭКОНОМИКА И ФИНАНСЫ»
КУРСОВАЯ РАБОТА
по дисциплине: «Общая теория статистики»
Автор работы
Федорова Л.Н.
Специальность: 38.03.01 Экономика.
Группа: 16ЭЭ3
Руководитель работы
В.Н. Деркаченко
Пенза 2017
Введение
Статистика - самостоятельная общественная наука, которая, как и любая другая наука, имеет свои методы исследования.
Для принятия наиболее оптимальных решений в области своей деятельности таким специалистам, как экономисты и менеджеры, необходимо овладеть методами статистических исследований, ведь в дальнейшем знания и умения пользоваться методами статистических исследований помогут более эффективно изучать тенденции рыночной конъюнктуры товаров и услуг.
Статистика играет огромную роль в области экономики, а статистическая информация является важнейшей составной частью глобальной информационной системы государства.
Можно сказать, что статистика обеспечивает анализ количественной стороны, а также служит основой для принятия соответствующих управленческих решений.
Развитие экономики характеризуется еще и тем, насколько эффективно используются ресурсы, имеющиеся в государстве, и прежде всего рабочая сила. Поддержание занятости - одно из важнейших цель экономической политики. статистика экономика менеджмент корреляционный
Основными задачами данной курсовой работы являются: - проведение корреляционного анализа;
- определение средних величин и показателей вариации;
- проведение регрессионного анализа.
Целью данной курсовой работы является решение задач по каждому из разделов.
Мой номер классного журнала - 21.
1. Средние величины и показатели вариации
Средние величины относятся к обобщающим статистическим показателям, которые дают сводную (итоговую) характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака. Для выяснения сущности средней величины необходимо рассмотреть особенности формирования значений признаков тех явлений, по данным которых исчисляют среднюю величину[2].
В статистике используют различные виды средних величин, которые делятся на два больших класса:
1) степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадратическая, средняя кубическая);
2) структурные средние (мода, медиана).
Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения. Поэтому их именуют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.
Самый распространенный вид средней - средняя арифметическая. Средней арифметической называется такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. [2].
(1.1)
Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную.
= (1.2)
Также известны другие средние, их можно определить по общей формуле:
(1.3), где k - степень, определяющая различные средние.
Средняя гармоническая взвешенная находится по формуле:
гм= (1.4)
Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой - больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр. [1].
Ме = Xн + i ) (1.5),
где Хн - нижняя граница интервала;
i - ширина интервала;
n - объем выборки (число наблюдений);
- накопленная частота интервала, предшествующего медианному;
mме - частота медианного интервала;
Также существует такой показатель как мода, который находится как:
М0 = хн + i (1.6),
где Хн - нижняя граница интервала, содержащего моду;
i - ширина интервала;
m2 - частота модального интервала;
m1- частота интервала, предшествующего модальному;
m3 - частота интервала, следующего за модальным.
Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности, формально имеем:
R = Xmax - Xmin (1,7)
Простое среднее линейное отклонение:
= (1.8)
Взвешенное среднее линейное отклонение:
вз = (1.9)
Среднеквадратическое отклонение:
у = (1.10).
Средняя дисперсия :
уІ = (1.11).
Взвешенная дисперсия:
уІвз = (1.12).
Среднее квадратическое отклонение:
) = (1.13)
Взвешенное среднее квадратическое отклонение:
= (1.14)
Коэффициент вариации - наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% для распределений, близких к нормальному.
V = 100% (1.15)
Задача 1.1. По статистическим данным: 3; 5; 2; 4; 7; 3; 8; 3; 10 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение увеличить на свой номер классного журнала. Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.
Решение:
Увеличим значения на 21 и получим следующие данные:
24; 26; 23; 25; 28; 24; 29; 24; 31.
Определим среднее значение по формуле 1.1
= = 26
Мода = 24, так как это часто встречающее значение.
Чтобы определить медиану, необходимо расставить ряд в порядке возрастания.
Получим: 23; 24; 24; 24; 25; 26; 28; 29;31.
Количество значений нечетное, поэтому медианой будет являться число 25, т. к. оно занимает центральное положение в ряду.
Далее, определим среднюю дисперсию:
уІ(sІ) = =
Теперь вычислим среднеквадратическое отклонение:
у = = 2,24
Наконец, найдем коэффициент вариации:
V = = 8,6 %
Задача 1.2. По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 42%, стоимость основных фондов увеличилась на 31%. Определить изменение фондоотдачи.
Решение:
Фондоотдача = * 100% = *100% = 108%
Фондоотдача = 108%-100% = 8%
Таким образом, при увеличении дохода от реализации продукции в отчетном периоде по сравнению с базисным 42% на и увеличении стоимости основных средств на 31%, то фондоотдача изменится на 8%.
Задача 1. 3. Объем оборота (У) и число работников (m) приведены в таблице 1.1. Определить среднее значение, моду и медиану.
Таблица 1.1 - Исходные данные
У |
80-100 |
100-120 |
120-140 |
140-160 |
160-180 |
180-200 |
|
m |
6 |
17 |
25 |
28 |
14 |
10 |
Решение:
Таблица 1.2
У |
m |
Середина интервала |
Накопленная частота |
|
80-100 |
6 |
90 |
6 |
|
100-120 |
17 |
110 |
23 |
|
120-140 |
25 |
130 |
48 |
|
140-160 |
28 |
150 |
76 |
|
160-180 |
14 |
170 |
90 |
|
180-200 |
10 |
190 |
100 |
|
Итого |
100 |
Найдем среднюю простую:
x?= 141,4
Для определения моды и медианы, необходимо найти медийный интервал.
Медианным интервалом будет интервал 140-160, так как накопленная частота на этом промежутке превысит значение
50. (76 >50).
Найдем медиану:
140+20 =141,43
Вычисляем моду:
М0 = хн + i = 140 + 20[] =143,53
Задача 1.4. По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 1.3). Каждое значение Хi увеличить на свой номер классного журнала.
Таблица 1.3. Исходные данные по объему оборота предприятий
Хi |
mгi |
mчi |
moi |
|
22,0-22,2 |
3 |
3 |
||
22,2-22,4 |
4 |
4 |
||
22,4-22,6 |
17 |
17 |
||
22,6-22,8 |
11 |
15 |
26 |
|
22,8-23,0 |
13 |
6 |
19 |
|
23,0-23,2 |
18 |
5 |
23 |
|
23,2-23,4 |
6 |
6 |
||
23,4-23,6 |
2 |
2 |
||
50 |
50 |
100 |
Результаты, например, общая дисперсия равна 97830 руб. и коэффициент детерминации, целое число в %.
Решение:
Чтобы определить общую дисперсию, необходимо знать значение общей средней:
При расчете общей дисперсии необходимо использовать вид взвешенной, т.к. имеется частота:
= = 0,09 или 90 000 руб.
Для вычисления внутригрупповой дисперсии по группам необходимо рассчитать среднее значение:
= = 23
Внутригрупповая дисперсия определяется по формуле:
или 556 000 руб.
Межгрупповая дисперсия вычисляется следующим образом:
или 344 000 руб.
Теперь необходимо рассчитать коэффициент детерминации:
- связь умеренная, т.к. находится в интервале 30% - 50%.
Таким образом,
Задача 1. 5. Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 1.4).
Таблица 1.4 - Исходные данные
1 группа |
Хi |
1 |
2 |
8 |
|
mi |
30 |
15 |
5 |
||
2 группа |
Хi |
1 |
6 |
||
mi |
10 |
15 |
|||
3 группа |
Хi |
3 |
8 |
||
mi |
20 |
5 |
Решение:
В первую очередь, необходимо определить среднее значение для 3-х групп, и используя получившиеся результаты, рассчитать для них взвешенные дисперсии.
Для нахождения средней внутригрупповой дисперсии необходимо просуммировать получившиеся взвешенные и поделить их на 3:
Теперь необходимо рассчитать общее среднее значение и общую дисперсию:
Ответ:
2. Корреляционный анализ
Корреляционный анализ -- это метод, применяющийся с целью проверки гипотезы о статистической значимости двух и более переменных, если исследователь их может измерять, но не изменять[3].
Корреляционный анализ предполагает определение зависимости между изучаемыми признаками, в связи, с чем задачи корреляционного анализа можно дополнить следующими:
1) выявление факторов, оказывающих наибольшее влияние на результативный признак;
2) выявление неизученных ранее причин связей;
3) построение корреляционной модели с ее параметрическим анализом;
4) исследование значимости параметров связи и их интервальная оценка.
На величину показателей влияет несколько факторов, поэтому для оценки тесноты связи между показателем и факторами используются множественный корреляционный анализ. [3].
Корреляционный момент определяется:
(2.1),
где n - объем выборки, число наблюдений;
Xi , Yi - i-тое значение фактора и показателя;
X?, - средние значения фактора и показателя.
Корреляционный момент имеет размерность, то переходят к безразмерному коэффициенту корреляции:
rxy = (2.2),
где - среднеквадратические отклонения фактора и показателя.
Для расчета коэффициента корреляции также используется следующая зависимость:
rxy = (2.3),
где - среднее значения произведения фактора на показатель.
Коэффициент корреляции изменяется в пределах: -1 r +1
Значимость коэффициента корреляции базируется на проверке статистических гипотез, выдвигается нулевая гипотеза о том, что коэффициент корреляции равен нулю и контр гипотеза, что он не равен нулю: H0: r=0; H1: r 0.
После этого определяется расчетное значение критерия Стьюдента по формуле:
t = (2.4).
Далее находится табличное значение критерия Стьюдента. Входом в табличное значение является уровень значимости и степень свободы . На практике, чаще всего, принимают за 0; 0,5; = n2. Если расчетное значение критерия Стьюдента больше табличного, то нулевая гипотеза отвергается и, следовательно, коэффициент корреляции значим. Если же, табличное значение критерия Стьюдента больше расчетного значения критерия, то нулевая гипотеза подтверждается, а, следовательно, коэффициент корреляции не значим. [3].
Также для расчетов в этом разделе используется коэффициент ранговой корреляции Спирмена:
(2.5)
Корреляционный момент:
Кху = (2.6)
Задача 2. 1. Определить коэффициент корреляции между У и Х. Х: 3,5; 4,6; 5,8; 4,2; 5,2;
УХ: 28,35; 43,24; 65,54; 28,98; 50,44.
Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Результаты:
1) коэффициент корреляции;
2) расчетное и табличное значения критерия Стьюдента и вывод.
Решение:
Таблица 2.1
У |
29,1 |
30,4 |
32,3 |
27,9 |
30,7 |
150,4 |
|
Х |
24,5 |
25,6 |
26,8 |
25,2 |
26,2 |
128,3 |
|
ХУ |
712,95 |
778,24 |
865,64 |
703,08 |
804,34 |
3864,25 |
|
(Хi-Х?)І |
1,3456 |
0,0036 |
1,2996 |
0,2116 |
0,2916 |
3,152 |
|
(Уi-У?)І |
0,9604 |
0,1024 |
4,9284 |
4,7524 |
0,3844 |
11,128 |
Вычислим средние значения:
X?=
У?=
Перед расчетом коэффициента корреляции необходимо вычислить среднее квадратическое отклонение для показателей x и y:
= 0,6304
Коэффициент корреляции определяется по формуле:\
В соответствии с данными задачи, расчет выглядит следующим образом:
Вывод: связь между показателем и фактором сильная, т.к. её значение находится в интервале 0,6-0,8. Значимость коэффициента корреляции проверяется по критерию Стьюдента. Вначале вычисляется расчетное значение критерия по формуле:
Табличное значение критерия Стьюдента:
Вывод: расчетное значение меньше табличного, то коэффициент корреляции не значимый, необходимо увеличить объем выборки.
Ответ: = ; ; коэффициент не значим.
Задача 2.2. Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.
Таблица 2.2 Исходные данные
х |
у |
|
39 |
38 |
|
43 |
41 |
|
34 |
32 |
|
41 |
39 |
|
36 |
35 |
|
35 |
31 |
Решение:
Таблица 2.3
x |
y |
x2 |
y2 |
x * y |
|
39 |
38 |
1521 |
1444 |
1482 |
|
43 |
41 |
1849 |
1681 |
1763 |
|
34 |
32 |
1156 |
1024 |
1088 |
|
41 |
39 |
1681 |
1521 |
1599 |
|
36 |
35 |
1296 |
1225 |
1260 |
|
35 |
31 |
1225 |
961 |
1085 |
|
228 |
216 |
8728 |
7856 |
8277 |
Для наших данных система уравнений имеет вид
6a + 228*b = 216
228*a + 8728*b = 8277
Домножим уравнение (1) на -38, получим систему, которую можно решить методом алгебраического сложения.
-228а - 8664*b = -8208
228*а + 8728*b = 8277
64*b = 69
b =1.0781
Теперь найдем коэффициент «а» из уравнения 1:
6*а + 228*1,0781 = 216
6*а = - 29813
а = -4,9688
Получаем эмпирические коэффициенты регрессии: b = 1.0781, a = -4.9688
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 1.0781 x -4.9688
Параметры уравнения регрессии
Выборочные дисперсии:
Среднеквадратическое отклонение:
Коэффициент корреляции:
Значимость коэффициента корреляции:
По таблице Стьюдента с уровнем значимости б=0.05 и степенями свободы k=4 находим tкрит:
tкрит (n-m-1;б/2) = (4;0.025) = 2.776
Поскольку |tнабл| > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим
Задача 2.3.
В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе.
Решение:
Таблица 2.4
Теория вероятности |
Статистика |
|
86 |
72 |
|
111 |
106 |
|
63 |
57 |
|
68 |
84 |
|
105 |
93 |
|
79 |
101 |
|
71 |
61 |
Матрица рангов.
Таблица 2.5
ранг (Rтв), dx |
ранг (Rс), dy |
(dx - dy)2 |
|
5 |
3 |
4 |
|
7 |
7 |
0 |
|
1 |
1 |
0 |
|
2 |
4 |
4 |
|
6 |
5 |
1 |
|
4 |
6 |
4 |
|
3 |
2 |
1 |
|
28 |
28 |
14 |
Проверка правильности составления матрицы на основе исчисления контрольной суммы:
Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.
По формуле вычислим коэффициент ранговой корреляции Спирмена.
Связь между признаком Y и фактором X сильная и прямая
3. Регрессионный анализ
Регрессионный анализ - это метод установления аналитического выражения стохастической зависимости между исследуемыми признаками. Уравнение регрессии показывает, как в среднем изменяется у при изменении любого из xi.
В ходе регрессионного анализа решаются две основные задачи:
- построение уравнения регрессии, т.е. нахождение вида зависимости между результатным показателем и независимыми факторами x1, x2, …, xn.
- оценка значимости полученного уравнения, т.е. определение того, насколько выбранные факторные признаки объясняют вариацию признака у.
Применяется регрессионный анализ главным образом для планирования, а также для разработки нормативной базы[6].
В отличие от корреляционного анализа, который только отвечает на вопрос, существует ли связь между анализируемыми признаками, регрессионный анализ дает и ее формализованное выражение. Кроме того, если корреляционный анализ изучает любую взаимосвязь факторов, то регрессионный - одностороннюю зависимость, т.е. связь, показывающую, каким образом изменение факторных признаков влияет на признак результативный.
Формулы и модели регрессионного анализа:
1) линейная модель
y= a0+a1x (3.1)
2) нахождение коэффициента а1 модели:
а1 = (3.2)
3) нахождение коэффициента a0 модели:
a0 = а1 (3.3)
4) стандартная ошибка :
Sy= (3.4)
5) коэффициент детерминации:
R 2 = 1- (3.5)
6) критерий Стьюдента для коэффициентов:
(3.6)
7) случайные отклонения a1 и a0
; (3.7)
8) критерий Фишера :
(3.8)
9) стандартное отклонение
(3.9)
10) стандартная ошибка:
(3.10)
Задача 3.1. Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.
Характеристики модели: 1) модель (коэффициенты до 4-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;
5) вывод о значимости коэффициентов модели;
6) доверительные интервалы коэффициентов модели (до 4-х знаков).
Решение: Для расчета параметров регрессии построим расчетную таблицу (табл. 3.1)
Таблица 3.1
y |
y2 |
1/х |
у/х |
1/x2 |
х |
||
42 |
1764 |
1 |
42 |
1 |
1 |
||
37 |
1369 |
0,5 |
18,5 |
0,25 |
2 |
||
36 |
1296 |
0,333 |
12 |
0,11 |
3 |
||
35 |
1225 |
0,25 |
8,75 |
0,625 |
4 |
||
34 |
1156 |
0,2 |
6,8 |
0,04 |
5 |
||
33,5 |
1122,25 |
0,167 |
5,583 |
0,028 |
6 |
||
32 |
1024 |
0,143 |
4,571 |
0,0204 |
7 |
||
32,5 |
1056,25 |
0,125 |
4,0625 |
0,016 |
8 |
||
31 |
961 |
0,111 |
3,44 |
0,0123 |
9 |
||
29 |
841 |
0,1 |
2,9 |
0,01 |
10 |
||
342 |
11814,5 |
2,929 |
108,4965 |
2,1117 |
55 |
||
Среднее значение |
34,2 |
1181,45 |
0,293 |
10,84965 |
0,21117 |
5,5 |
Можно вычислить коэффициент a0 и коэффициент а1, для модели, которую необходимо поcтроить:
а1 = = = 6,6154
а0 = а1 = 34,2 - 6,6154 0,293 = 32,2617
Формально а0 показывает прогнозируемый уровень у, но только в том случае, если х0 находится близко с выборочными значениями.
Но если х0 находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.
По имеющимся данным можно построить модель. Она будет иметь следующий вид:
= 32,2617 +
Определим каждое значение .
Таблица 3.2 - Расчет показателей индекса детерминации, стандартной ошибки
y |
Х |
y? |
(y-yЇ)І |
(y-y^)І |
|||
42 |
1 |
38,8771 |
60,84 |
9,75250441 |
20,25 |
||
37 |
2 |
35,5694 |
7,84 |
2,04661636 |
12,25 |
||
36 |
3 |
34,4668 |
3,24 |
2,35070224 |
6,25 |
||
35 |
4 |
33,91555 |
0,64 |
1,1760318 |
2,25 |
||
34 |
5 |
33,58478 |
0,04 |
0,1724076 |
0,25 |
||
33,5 |
6 |
33,36427 |
0,49 |
0,0184226 |
0,25 |
||
32 |
7 |
33,2068 |
4,84 |
1,456366 |
2,25 |
||
32,5 |
8 |
33,088625 |
2,89 |
0,346479 |
6,25 |
||
31 |
9 |
32,99674 |
10,24 |
3,9869706 |
12,25 |
||
29 |
10 |
32,92324 |
27,04 |
15,391812 |
20,25 |
||
342 |
55 |
341,9933 |
118,1 |
36,69831 |
82,5 |
||
Ср. знач. |
34,2 |
5,5 |
34,19933 |
11,81 |
8,25 |
По данной таблице определим коэффициент детерминации:
R2 = 1- = 1- = 0,69
Можно вычислить индекс детерминации (R), он равен:
R = = 0,83. В нашем примере связь между признаком Y и фактором X весьма высокая и прямая.
По данной таблице рассчитаем стандартную ошибку модели, а также расчетное значение критерия Фишера:
Стандартная ошибка :
Sy= = = 12,9748
Критерий Фишера (F):
= = 17,81
Найдем табличное значение коэффициента Фишера. Оно будет равно 5,32 при значимости б=0,05 и критерием f = 8 . Уравнение регрессии с вероятностью 0,95 статистически значимое, так как F Fтаб.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается нулевая гипотеза Н0 о случайной природе показателей, т.е. о незначимом их отличии от нуля.
Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля, для генеральной совокупности используют статистические методы проверки гипотез.
В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.
Проверим гипотезу H0 о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H1 не равно) на уровне значимости б=0.05.
H0: b = 0, то есть между переменными x и y отсутствует линейная взаимосвязь в генеральной совокупности;
H1: b ? 0, то есть между переменными x и y есть линейная взаимосвязь в генеральной совокупности. В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.
Вычислим стандартные отклонения величин параметров модели:
0,125
Далее определим случайные отклонения a0 и а1:
4,7698
32,848
Далее определим критерий Стьюдента для коэффициентов:
0,20139
6,76374
Фактические значения t - статистики для параметров , превышают табличные:
6,76 ?= 2,306; =0,201 < 2,306
Рассчитаем доверительные интервалы для параметров регрессии a0 и а1. Определим предельную ошибку для каждого показателя:
= 2,306·4,7698 = 10,9991
= 2,306·32,848 = 75,7475
Доверительные интервалы:
Таким образом, доверительный интервал для а0:
32,2614-10,9991? a0?32,2614+10,9991
21,2623? a0?43,2305
6,6154 - 75,7475? a1?6,6154 + 75,7475
-69,1321 а182,3629
Таким образом, на основе анализа верхних и нижних границ доверительных интервалов можно сделать вывод, что параметры и с вероятностью 95% будут находиться в указанных границах интервалов.
Задача 3.2. Построить полулогарифмическую модель вида: y=a0+a1lnx по данным: Определить характеристики модели.
Характеристики модели:
1) модель (коэффициенты до 2-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.
Решение:
Таблица 3.3
х |
у |
||||
1 |
31 |
0 |
0 |
0 |
|
2 |
34,4 |
0,69 |
0,48 |
23,736 |
|
3 |
36,4 |
1,10 |
1,21 |
40,04 |
|
4 |
37,5 |
1,39 |
1,93 |
52,125 |
|
5 |
39,6 |
1,61 |
2,59 |
63,756 |
|
6 |
40,1 |
1,79 |
3,20 |
71,779 |
|
21 |
219 |
6,58 |
9,41 |
251,436 |
Определим а0 и а1 для построения модели:
а1 = = = 5,14
а0 = = = 30,8631
Далее, найдя коэффициенты, можем построить модель: = 30,8631 + 5,14lnx
Для расчета индекса детерминации, а также для других показателей, построим еще одну таблицу, с промежуточными вычислениями.
Таблица 3.4 - Расчет индекса детерминации
Y |
X |
y? |
(y-yЇ)І |
(y-y^)І |
||
31 |
1 |
30,8631 |
30,25 |
0,0187 |
||
34,4 |
2 |
34,4097 |
4,41 |
0,0001 |
||
36,4 |
3 |
36,5171 |
0,01 |
0,0137 |
||
37,5 |
4 |
38,0077 |
1 |
0,2578 |
||
39,6 |
5 |
39,1385 |
9,61 |
0,212 |
||
40,1 |
6 |
40,0631 |
12,96 |
0,0013 |
||
219 |
21 |
219,0685 |
58,24 |
0,5036 |
||
Ср.знач. |
36,5 |
3,5 |
По найденным значениям определим индекс детерминации:
0,99
Получается, что связь между признаком Y и фактором X высокая и прямая.
Определим стандартную ошибку:
0,1259 (3.1.9)
Проведем оценку значимости уравнения регрессии с помощью F-критерия Фишера:
По таблице Фишера определим критическое значение F-критерия при уровне значимости б=0,05 и числе степеней свободы k1 = 1, k2 = n - 2 = 6 - 2 = 4. Fкр=7,71.
Так как наблюдаемое значение критерия больше табличного F = 396 ? Fкр = 7,71 следовательно, с вероятностью 0,95 уравнение регрессии считается статистически значимым.
Задача 3.3. Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.5.
Таблица 3.5. Динамика коэффициента рождаемости в Пензенской области
Год |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
|
Коэффициент рождаемости |
7,5 |
7,5 |
8,0 |
8,4 |
8,6 |
8,4 |
|
Год |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
|
Коэффициент рождаемости |
8,6 |
9,7 |
10,2 |
10,3 |
10,2 |
10,1 |
|
Год |
2012 |
2013 |
2014 |
2015 |
2016 |
||
Коэффициент рождаемости |
10,8 |
10,6 |
10,8 |
10,7 |
10,2 |
Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г.
Решение:
1) Построим линейную модель У(t) = а0 + аit, параметры которой:
;
Таблица 3.6 - Промежуточные расчеты.
Год (t) |
У |
t - t? |
(t-tЇ)І |
y-y? |
(t-t?)(y-y?) |
ур |
y-y? |
(y-y^)І |
(y-yЇ)І |
||
1 |
7,5 |
-8 |
64 |
-1,947 |
15,576 |
7,692 |
-0,192 |
0,03694 |
2,56 |
3,791 |
|
2 |
7,5 |
-7 |
49 |
-1,947 |
13,629 |
7,912 |
-0,412 |
0,16933 |
5,49 |
3,791 |
|
3 |
8 |
-6 |
36 |
-1,447 |
8,6824 |
8,131 |
-0,131 |
0,01713 |
1,64 |
2,094 |
|
4 |
8,4 |
-5 |
25 |
-1,047 |
5,2353 |
8,350 |
0,050 |
0,00248 |
0,59 |
1,096 |
|
5 |
8,6 |
-4 |
16 |
-0,847 |
3,3882 |
8,570 |
0,030 |
0,00092 |
0,35 |
0,718 |
|
6 |
8,4 |
-3 |
9 |
-1,047 |
3,1412 |
8,789 |
-0,389 |
0,15132 |
4,63 |
1,096 |
|
7 |
8,6 |
-2 |
4 |
-0,847 |
1,6941 |
9,008 |
-0,408 |
0,16671 |
4,75 |
0,718 |
|
8 |
9,7 |
-1 |
1 |
0,2529 |
-0,253 |
9,228 |
0,472 |
0,22307 |
4,87 |
0,064 |
|
9 |
10,2 |
0 |
0 |
0,7529 |
0 |
9,447 |
0,753 |
0,56686 |
7,38 |
0,567 |
|
10 |
10,3 |
1 |
1 |
0,8529 |
0,8529 |
9,666 |
0,634 |
0,40145 |
6,15 |
0,728 |
|
11 |
10,2 |
2 |
4 |
0,7529 |
1,5059 |
9,886 |
0,314 |
0,09872 |
3,08 |
0,567 |
|
12 |
10,1 |
3 |
9 |
0,6529 |
1,9588 |
10,105 |
-0,005 |
0,00003 |
0,05 |
0,426 |
|
13 |
10,8 |
4 |
16 |
1,3529 |
5,4118 |
10,325 |
0,476 |
0,22610 |
4,40 |
1,83 |
|
14 |
10,6 |
5 |
25 |
1,1529 |
5,7647 |
10,544 |
0,056 |
0,00315 |
0,53 |
1,329 |
|
15 |
10,8 |
6 |
36 |
1,3529 |
8,1176 |
10,763 |
0,037 |
0,00135 |
0,34 |
1,83 |
|
16 |
10,7 |
7 |
49 |
1,2529 |
8,7706 |
10,983 |
-0,283 |
0,07986 |
2,64 |
1,57 |
|
17 |
10,2 |
8 |
64 |
0,7529 |
6,0235 |
11,202 |
-1,002 |
1,00400 |
9,82 |
0,567 |
|
153 |
160,6 |
0 |
408 |
0 |
89,5 |
160,6 |
0 |
3,14943 |
59,281 |
22,78 |
|
9 |
9,4471 |
0,219 , соответственно =9,4471-0,219·9 = 7,476
Отсюда уравнение линейного тренда принимает окончательный вид: y?t=0,219t +7,476
Положительное значение коэффициента при t указывает на то, что имеется тенденция роста, причем величина роста ежегодно составляет в среднем 0,219 единиц. Определим коэффициент детерминации:
0,8617
- т.е. в 86,17 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 13.83% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Определим стандартную ошибку:
0,4582 (3.1.9)
Оценим значимость модели с помощью критерия Фишера:
93,46.
Табличное значение критерия со степенями свободы k1=1 и k2=15, Fтабл = 4,54. Поскольку F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
Определим ошибку аппроксимации:
100% = 3,492%.
В среднем, расчетные значения отклоняются от фактических на 3,49%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Спрогнозируем коэффициент рождаемости в 2017:
y?2017=0,219·18+7,476 = 11,4.
Задача 3.4. Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.
Таблица 3.7. Курс рубля к доллару
Месяц и год |
январь 2017 |
февраль |
март |
апрель |
май |
июнь |
июль |
август 2017 |
|
Цена одного доллара |
59,6 |
58,5 |
58,0 |
56,4 |
57,0 |
57,9 |
59,7 |
59,6 |
Решение:
1) Построим уравнение линейного тренда курса доллара, которое имеет вид: , где и найдем из системы нормальных уравнений. (МНК) :
Таблица 3.8 - промежуточные расчеты
T |
Цена (y) |
t-t? |
y-y? |
(t-t?)( y-y?) |
(t-tЇ)І |
y? |
y-y? |
(y-y^)І |
(y-y?)І |
||
1 |
59,6 |
-3,5 |
1,2625 |
-4,41875 |
12,25 |
58,075 |
1,525 |
2,325625 |
2,5587 |
1,5939 |
|
2 |
58,5 |
-2,5 |
0,1625 |
-0,40625 |
6,25 |
58,15 |
0,35 |
0,1225 |
0,59829 |
0,0264 |
|
3 |
58 |
-1,5 |
-0,3375 |
0,50625 |
2,25 |
58,225 |
-0,225 |
0,050625 |
0,38793 |
0,1139 |
|
4 |
56,4 |
-0,5 |
-1,9375 |
0,96875 |
0,25 |
58,3 |
-1,9 |
3,61 |
3,36879 |
3,7539 |
|
5 |
57 |
0,5 |
-1,3375 |
-0,66875 |
0,25 |
58,375 |
-1,375 |
1,890625 |
2,41228 |
1,7889 |
|
6 |
57,9 |
1,5 |
-0,4375 |
-0,65625 |
2,25 |
58,45 |
-0,55 |
0,3025 |
0,94991 |
0,1914 |
|
7 |
59,7 |
2,5 |
1,3625 |
3,40625 |
6,25 |
58,525 |
1,175 |
1,380625 |
1,96817 |
1,8564 |
|
8 |
59,6 |
3,5 |
1,2625 |
4,41875 |
12,25 |
58,6 |
1 |
1 |
1,67785 |
1,5939 |
|
36 |
466,7 |
0 |
0 |
3,15 |
42 |
466,7 |
0 |
10,6825 |
13,92196 |
10,91875 |
|
Сред. знач 4,5 |
58,3375 |
58,3375 |
0,075. тогда : a0= 58,3375 - 4,5?0,075 = 58
Таким образом, линейная модель будет выглядеть как:
Определим коэффициент детерминации:
0,0216.
Определим стандартную ошибку: 1,3343.
Определим значимость модели используя критерий Фишера:
0,1325.
Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5,99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).
Вычислим ошибку аппроксимации:
1,74
- в среднем, расчетные значения отклоняются от фактических на 1,74%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Осуществим прогноз на декабрь 2017 года:=12·0,075+58=58,9
Построим регрессионную модель вида: lnу = ао + а1t. Все промежуточные расчеты приведем в таблице 3.2.2. Для удобства расчета проведем замену: lny=У
Таблица 3.9 - Промежуточные расчеты для модели lnу = ао + а1t
t |
Цена (y) |
У |
tІ |
tУ |
|||||||
1 |
59,6 |
4,0877 |
1 |
4,0877 |
4,061592 |
0,02611 |
0,02165 |
0,0006817 |
0,000468723 |
0,6387455 |
|
2 |
58,5 |
4,069 |
4 |
8,138 |
4,062865 |
0,00613 |
0,00295 |
0,00003758 |
0,0000087025 |
0,15065127 |
|
3 |
58 |
4,0604 |
9 |
12,1812 |
4,064139 |
-0,00374 |
-0,00565 |
0,00001399 |
0,0000319225 |
0,09210915 |
|
4 |
56,4 |
4,0325 |
16 |
16,13 |
4,065413 |
-0,03291 |
-0,03355 |
0,00108307 |
0,001125603 |
0,81611903 |
|
5 |
57 |
4,0431 |
25 |
20,2155 |
4,066687 |
-0,02359 |
-0,02295 |
0,000556488 |
0,000526703 |
0,58346318 |
|
6 |
57,9 |
4,0587 |
36 |
24,3522 |
4,067961 |
-0,00926 |
-0,00735 |
0,0000857 |
0,00005402 |
0,22815187 |
|
7 |
59,7 |
4,0893 |
49 |
28,6251 |
4,069235 |
0,02007 |
0,02325 |
0,000402805 |
0,000540563 |
0,49079305 |
|
8 |
59,6 |
4,0877 |
64 |
32,7016 |
4,070508 |
0,01719 |
0,02165 |
0,000295496 |
0,000468723 |
0,42052988 |
|
?36 |
466,7 |
32,5284 |
204 |
146,4313 |
32,5284 |
0 |
0 |
0,003156901 |
0,00322496 |
3,42056294 |
|
Ср. знач 4,5 |
58,3375 |
4,06605 |
25,5 |
18,3039 |
4,06605 |
0,00127;
a0 = 4,06605 - 4,5?0,00127 = 4,0603.
Таким образом, модель будет иметь вид:
lny = 0,00127t + 4,0603
Определим коэффициент детерминации:
0,0211.
Определим стандартную ошибку:
0,0299.
Определим значимость модели, используя критерий Фишера:
0,1293.
Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5.99. Поскольку фактическое значение F < Fтабл, то коэффициент детерминации статистически не значим (найденная оценка уравнения регрессии статистически не надежна).
Вычислим ошибку аппроксимации:
0,4276
Осуществим прогноз на декабрь: 58,9
Построим регрессионную модель вида: у =1/(ао + а1t). Все промежуточные расчеты приведем в таблице 3.2.3. Для удобства расчета проведем замену : 1/у = У
Таблица 3.10 - Промежуточные расчеты для модели у = 1/(ао + а1t)
t |
Цена (y) |
У |
tІ |
tУ |
y-y? |
(y-y^)І |
||||
... |
Подобные документы
Предмет статистики. Метод статистики. Расчёт показателей вариации. Ряды динамики. Выборочное наблюдение. Для общеэкономических специальностей, статистика является основой для разработки и совершенствования методов экономического анализа.
курсовая работа [134,4 K], добавлен 21.10.2004Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.
контрольная работа [80,0 K], добавлен 05.06.2012Предмет и метод статистики. Группировка и ряд распределения. Абсолютные, относительные, средние величины, показатели вариации. Выборочное наблюдение, ряды динамики. Основы корреляционного и регрессионного анализа. Статистика населения и рынка труда.
методичка [2,2 M], добавлен 16.02.2011Статистика занятости и безработицы. Определение численности и состава занятых лиц. Выборочное наблюдение, сводка и группировка, ряд распределения. Характеристика статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки.
курсовая работа [180,5 K], добавлен 10.08.2009Статистика как общественная наука, изучающая количественную сторону массовых общественных явлений с целью выявления их особенностей и закономерностей развития. Понятия, предмет, задачи, система статистических показателей. Организация статистики в России.
реферат [16,8 K], добавлен 04.06.2010Сущность и разновидности средних величин в статистике. Определение и особенности однородной статистической совокупности. Расчет показателей математической статистики. Что такое мода и медиана. Основные показатели вариации и их значение в статистике.
реферат [162,6 K], добавлен 04.06.2010Определение термина "статистика" и история ее возникновения. Взаимосвязь статистики с другими науками. Виды статистических исследований. Предназначение корреляционно-регрессионного анализа и выборочного метода. Методика анализа сезонных колебаний.
реферат [33,1 K], добавлен 10.01.2015Сущность статистического изучения браков. Система статистических показателей, используемых в изучении браков в Амурской области. Анализ браков с помощью расчета средних величин и показателей вариации. Корреляционно–регрессионный анализ структуры браков.
курсовая работа [895,1 K], добавлен 20.03.2015Целостная система научных дисциплин: общая теория статистики, социально-экономическая статистика, математическая статистика и теория вероятности, международная и отраслевая статистика. Формы, виды, способы наблюдения. Процесс статистического исследования.
эссе [18,7 K], добавлен 17.10.2014Статистика денежного обращения, инфляции и цен. Построение сводки и ряда распределения. Характеристика используемых статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки. Корреляционный анализ количественных признаков.
контрольная работа [564,1 K], добавлен 13.09.2012Понятие статистики как науки, предмет и методы ее изучения, основные цели и задачи. Категории статистики и ее показатели, способы представления результатов. Сущность и классификация относительных и средних величин. Понятие ряда динамики и его анализ.
реферат [192,6 K], добавлен 15.05.2009Организация статистики и источники статистических данных. Наблюдение по способу регистрации данных. Выявление и изучение связи и взаимозависимости между явлениями. Система статистических показателей. Определение средних и относительных величин.
контрольная работа [53,6 K], добавлен 27.01.2011Абсолютные и относительные статистические величины. Понятие и принципы применения средних величин и показателей вариации. Правила применения средней арифметической и гармонической взвешенных. Коэффициенты вариации. Определение дисперсии методом моментов.
учебное пособие [276,4 K], добавлен 23.11.2010Виды и применение абсолютных и относительных статистических величин. Сущность средней в статистике, виды и формы средних величин. Формулы и техника расчетов средней арифметической, средней гармонической, структурной средней. Расчет показателей вариации.
лекция [985,6 K], добавлен 13.02.2011История развития статистики в России. Деятельность видных ученых в развитии статистики как науки. Основные задачи статистики. Общая теория статистики, экономическая статистика, социальная статистика. Отраслевая статистика.
реферат [23,9 K], добавлен 12.12.2006Основные категории и понятия теории статистики. Ряды динамики и их применение в анализе социально-экономических явлений. Сводка и группировка статистических данных. Общая характеристика системы национальных счетов. Статистика рынка товаров и услуг.
курс лекций [68,4 K], добавлен 08.08.2009Понятие статистического изучения рождаемости населения. Анализ рождаемости в Амурской области за 1999-2008 годы. Система показателей рождаемости. Показатели рождаемости для условного и реального поколения. Расчет средних величин и показателей вариации.
курсовая работа [240,1 K], добавлен 26.11.2009Социально-экономическая статистика как общественная наука. Ее сущность и основные методы, применяемые в ней. Проблемы интеграции отечественной статистики в международную статистику. Задачи социально-экономической статистики в условиях рыночной экономики.
лекция [17,4 K], добавлен 14.03.2010Определение сущности оплаты труда, ее показателей и методики расчетов. Описание индексного метода статистики и его роли в изучении заработной платы. Изучение техники проведения группировки. Определение показателей вариации ряда распределения и др.
контрольная работа [41,7 K], добавлен 27.01.2011Статистический анализ производства и себестоимости. Использование формул средних величин в решении задач, вычисление дисперсии, среднего квадратичного отклонения, коэффициента вариации, предельной ошибки выборки. Практическое применение индексного метода.
контрольная работа [59,3 K], добавлен 26.06.2009