Главная Коллекция "Revolution" Экономико-математическое моделирование Общая теория статистики

Общая теория статистики

Характеристика средних величин и показателей вариации. Сущность корреляционного анализа. Алгоритм регрессионного анализа. Методика оценки средних величин, динамики показателей, изменения их под влиянием тех или иных факторов. Измерение величины влияния.

Рубрика	Экономико-математическое моделирование
Вид	курсовая работа
Язык	русский
Дата добавления	22.02.2019
Размер файла	483,1 K

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Общая теория статистики

Введение

Современная экономическая система является динамично развивающейся, подверженной изменениям в результате влияния различных факторов. Оценить влияние тех или иных элементов на динамику отельных экономических показателей позволяет статистика с ее обширным инструментарием.

В данной работе поставлены следующие задачи: изучить методику оценки средних величин, динамики показателей, изменения их под влиянием тех или иных факторов, измерения величины этого влияния.

Для достижения поставленных задач в данной работе используются показатели вариации, а также методы корреляционного и регрессионного анализа.

Работа включает в себя три раздела:

1. Средние величины и показатели вариации

2. Корреляционный анализ

3. Регрессионный анализ

1. Средние величины и показатели вариации

Средняя величина - это обобщающая характеристика варьирующего признака единиц качественно однородной совокупности.

Средние величины используются в планировании, анализе выполнения планов, расчетах экономической эффективности общественного производства и т.д. Сравнивая изменение средних уровней во времени, статистика тем самым характеризует важнейшие закономерности развития явлений.

Существуют разные виды средних величин. Среднее хронологическое :

Она используется для моментных статистических рядов. Это когда на конкретную дату с различными интервалами показаны значения случайной величины.

Из средних велечин чаще всего используется среднее арифмитическое. Оно бывает двух видов. Среднее арифметическое простое: где x_i - i-тое значение случайной велечины, n -число, вариант. Среднее арифметическое взвешенное:

= ,

где m_i - частота.

Бывают другие средние, их можно определить по общей формуле:

где k - степень, определяющая различные средние.

Средняя гармоническая используется тогда, когда неизвестна частота (m_i), а известен, к примеру, объем реализации. Она высчитывается по формуле:

_гм= ,

где Vi - i-тый объем реализации.

Модой называют то значение признака, которое наиболее часто встречается в данной совокупности.

Для интервальных вариационных рядов мода определяется по формуле:

М₀ = х_н+ i ,

где

Х_н- нижняя граница интервала, содержащего моду;

i- ширина интервала;

m2 - частота модального интервала;

m1- частота интервала, предшествующего модальному;

m3 - частота интервала, следующего за модальным.

Медианой называют значение признака, приходящееся на середину ранжированной совокупности. Она определяется по формуле:

М_е = X_н + i ) ,

где

Х_н- нижняя граница интервала;

i - ширина интервала;

n - объем выборки (число наблюдений)

- накопленная частота интервала, предшествующего медианному;

m_ме- частота медианного интервала;

Изменение значений признака в пределах изучаемой совокупности называется вариацией.

Для характеристики величины колебания признака в статистике вычисляют следующие показатели вариации:

· размах вариации;

· среднее линейное отклонение;

· средний квадрат отклонения (дисперсия);

· среднее квадратическое отклонение;

· коэффициент вариации.

Абсолютные и относительные показатели вариации, характеризующие изменчивость значений признака, позволяют оценить степень однородности совокупности, типичности и устойчивости средней.

Размах вариации (R) - наиболее простой измеритель вариации и представляет собой разность между наибольшим и наименьшим значениями признака

R = x_max- x_min,,

где

x_max- наибольшее значение признака;

x_min-наименьшее значение признака.

Простое среднее линейное отклонение:

= ,

где - среднее значение показателя.

Взвешенное среднее линейное отклонение:

_вз =

Среднеквадратическое отклонение:

у = (1.2),

где - дисперсия.

Средний квадрат отклонения, или дисперсия - представляет собой среднюю арифметическую из квадратов отклонений вариант от общей средней.

Бывает нескольких видов: простой, взвешенной и выборочной.

Средняя дисперсия :

уІ(sІ) = .

Она так же может быть рассчитана как:

уІ(sІ) =

Взвешенная дисперсия:

уІ_вз =

Она используется, когда данные представлены в виде интервального ряда и вместо x_i берется среднее значение интервала и соответственно частота i- ого интервала (m_i).

Также, можно выделить среднее квадратическое отклонение:

) =

Взвешенное среднеквадратическое отклонение:

Коэффициент вариации является относительным показателем вариации, выражается в %. Он представляет собой отношение среднего квардратического отклонения к средней величине признака:

V = 100%

Он показывает, какую долю среднего значения этой величины составляет её средний разброс. Исчисляется в процентах. Вычисляется только для количественных данных. В отличие от среднего квадратического или стандартного отклонения измеряет не абсолютную, а относительную меру разброса значений признака в статистической совокупности. По мнению автора рассматриваемого коэффициента К. Пирсона -- коэффициент вариации эффективнее абсолютного показателя вариации [1]. Чем больше коэффициент вариации, тем менее однородна совокупность и тем менее типична средняя величина, тем менее она характеризует изучаемое явление.

Задача 1

По статистическим данным: 18; 20; 17; 19; 22; 18; 23; 18; 25 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение увеличили на свой номер классного журнала. Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.

Решение

Среднее значение определим по формуле средней арифметической простой:

=(18+ 20+ 17+ 19+ 22+ 18+ 23+ 18+ 25)/9=20

Мода - это наиболее часто встречающийся признак в данной совокупности. Число 18 встречается 3 раза. Остальные значения встречаются 1 раз. Мо=18.

Медиана находится посередине ранжированного ряда. Запишем числа в порядке возрастания и определим число, которое находится посередине.

17; 18; 18; 18; 19; 20; 22; 23; 25

Ме=19.

Для несгруппированных данных дисперсия рассчитывается по формуле:

=((18-20)²+ (20-20)²+ (17-20)²+ (19-20)²+ (22-20)²+ +(18-20)²+ (23-20)²+ (18-20)²+ (25-20)²)/9=60/9=6,7

среднеквадратическое отклонение

Среднее квадратическое отклонение показывает, на сколько в среднем отклоняются индивидуальные значения признака от среднего значения. Значит, индивидуальные значения отклоняются от среднего значения в среднем на ± 2,59.

Коэффициент вариации

Коэффициент вариации показывает относительное отклонение индивидуальных значений от среднего значения.

Коэффициент вариации менее 33%, значит, группа однородная, средняя величина надежна и типична для данных единиц совокупности.

Задача 2

По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 36%, стоимость основных фондов увеличилась на 25%. Определить изменение фондоотдачи. Значения дохода и стоимости основных фондов увеличили на свой номер классного журнала.

Решение

Фондоотдача = доход от реализации продукции предприятия / стоимость основных фондов

Индекс изменения дохода от реализации продукции предприятия равен 1,36. Индекс изменения стоимости основных фондов равен 1,25.

Индекс изменения фондоотдачи=1,36/1,25=1,088

Фондоотдача увеличилась на 8,8%.

Задача 3

Объем оборота (У) и число работников (m) приведены в таблице 1. Определить среднее значение, моду и медиану.

Таблица 1 - Исходные данные

У	80-100	100-120	120-140	140-160	160-180	180-200
m	6	17	25	28	14	10

Решение

Составим вспомогательную таблицу.

Таблица 1.1- Расчетные значения

У	m	у_ц	у_ц m	Кумулята (сумма накопленных частот) S
80-100	6	90	540	6
100-120	17	110	1870	23
120-140	25	130	3250	48
140-160	28	150	4200	76
160-180	14	170	2380	90
180-200	10	190	1900	100
Сумма	100		14140

Центр интервалов рассчитывается по формуле:

у_ц=,

где

у_нг - нижняя граница интервала,

у_вг - верхняя граница интервала.

Определим среднее значение.

14140/100=141,40

Мода - это варианта, наиболее часто встречающаяся в ряду.

В интервальном ряду моду вычисляют по формуле:

Модальный интервал равен 140-160, так как он имеет наибольшую частоту.

Определим медиану. Медиана - это значение варианты признака, находящейся в середине упорядоченного ряда.

Значит, медианный интервал равен 140-160.

Задача 4

По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., m_г - число государственных предприятий; m_ч - частных; m_{о -}общее число (таблица 2). Каждое значение Х_iувеличили на свой номер классного журнала.

Таблица 2 - Исходные данные по объему оборота предприятий

Х_i	m_гi	m_чi	m_oi
16,0-16,2		3	3
16,2-16,4		4	4
16,4-16,6		17	17
16,6-16,8	11	15	26
16,8-17,0	13	6	19
17,0-17,2	18	5	23
17,2-17,4	6		6
17,4-17,6	2		2
	50	50	100

Решение

Составим таблицу.

Таблица 2.2 - Расчетные значения

Х_i	Х_i	m_гi	Х_im_гi		m_чi	Х_im_чi		m_oi	Х_i m_oi
16,0-16,2	16,1				3	48,3	0,836	3	48,3	1,5294
16,2-16,4	16,3				4	65,2	0,43	4	65,2	1,0568
16,4-16,6	16,5				17	280,5	0,279	17	280,5	1,6761
16,6-16,8	16,7	11	183,7	0,99	15	250,5	0,078	26	434,2	0,3379
16,8-17,0	16,9	13	219,7	0,13	6	101,4	0,444	19	321,1	0,1405
17,0-17,2	17,1	18	307,8	0,18	5	85,5	1,114	23	393,3	1,8813
17,2-17,4	17,3	6	103,8	0,54				6	103,8	1,4172
17,4-17,6	17,5	2	35	0,5				2	35	0,9412
Сумма		50	850	2,34	50	831,4	3,181	100	1681,4	8,98

Определим средние значения по группам по формуле средней арифметической взвешенной.

850/50=17

831,4/50=16,628

Среднее значение в целом:

1681,4/100=16,814

Рассчитаем дисперсии внутри групп:

Частная дисперсия в первой группе:

=2,34/50=0,0468

Частная дисперсия во второй группе:

=3,181/50=0,0636

Средняя внутригрупповая дисперсия:

(0,0468*50+0,0636*50)/100=0,0552

Межгрупповая дисперсия

((17-16,814)²*50+(16,628-16,814)²*50)/100=0,0346

Общая дисперсия:

=0,0552+0,0346=0,0898

Тот же результат получаем и по формуле

8,98/100=0,0898

Коэффициент детерминации:

=0,0346/0,0898=0,385 (38,5%)

Задача 5

Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).

Решение

Определим средние значения по группам по формуле средней арифметической взвешенной.

(1*30+2*15+8*5)/(30+15+5)=100/50=2

(1*10+6*15)/(10+15)=100/25=4

(3*20+8*5)/(20+5)=100/25=4

Среднее значение в целом:

=(2*50+4*25+4*25)/(50+25+25)=300/100=3

Рассчитаем дисперсии внутри групп:

Частная дисперсия в первой группе:

Частная дисперсия во второй группе:

Частная дисперсия в третьей группе:

Расчеты приведем в следующих таблицах.

Таблица 3.1 - Расчетная таблица по первой группе

Х_i	m_i	Х_im_i
1	30	30	30
2	15	30	0
8	5	40	180
Сумма	50	100	210

Таблица 3.2 - Расчетная таблица по второй группе

Х_i	m_i	Х_im_i
1	10	10	90
6	15	90	60
Сумма	25	100	150

Таблица 3.3 - Расчетная таблица по третьей группе

Хi	mi	Хimi
3	20	60	20
8	5	40	80
Сумма	25	100	100

Рассчитаем общую дисперсию по правилу сложения дисперсий.

Таблица 3.4 - Определение дисперсий по совокупности данных

№ группы	частота в группе f	Среднее значение внутри группы,	*f	Дисперсия внутри группы	f
1	50	2	100	4,2	210	50
2	25	4	100	6	150	25
3	25	4	100	4	100	25
Сумма	100		300		460	100

Средняя из частных дисперсий:

460/100=4,6

Межгрупповая дисперсия

100/100=1

Общая дисперсия:

=4,6+1=5,6

2. Корреляционный анализ

В социально- экономических исследованиях используют вероятностные (статистические) связи. Для оценки тесноты связи между показателем и фактором или между двумя факторами, используют корреляционный момент или коэффициент корреляции. [2]

Корреляция может быть положительной и отрицательной (возможна также ситуация отсутствия статистической взаимосвязи -- например, для независимых случайных величин). Отрицательная корреляция -- корреляция, при которой увеличение одной переменной связано с уменьшением другой переменной, при этом коэффициент корреляции отрицателен. Положительная корреляция -- корреляция, при которой увеличение одной переменной связано с увеличением другой переменной, при этом коэффициент корреляции положителен.[3]

Задача 1

Определить коэффициент корреляции между У и Х.

Х: 3,5; 4,6; 5,8; 4,2; 5,2;

УХ:28,35; 43,24; 65,54; 28,98; 50,44.

Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Вначале определить У, а затем У и Х увеличить на свой номер классного журнала.

Результаты:

1) коэффициент корреляции;

2) расчетное и табличное значения критерия Стьюдента и вывод.

Решение

Определим У. У=УХ/Х

Составим вспомогательную таблицу.

Таблица 4 - Расчетные значения для определения коэффициента корреляции

№	Х	У	x_i y_i	x_i²	y_i²
1	18,5	23,1	427,35	342,25	533,61
2	19,6	24,4	478,24	384,16	595,36
3	20,8	26,3	547,04	432,64	691,69
4	19,2	21,9	420,48	368,64	479,61
5	20,2	24,7	498,94	408,04	610,09
?	98,3	120,4	2372,05	1935,73	2910,36

Коэффициент корреляции:

=0,842

Имеется сильная линейная связь между y и x. Связь положительная, то есть с ростом х растет у.

Проверка существенности отличия коэффициента парной корреляции от нуля (его значимости) проводится по схеме:

если

то гипотеза о существенном отличии коэффициента парной корреляции от нуля принимается, в противном случае - отвергается.

- квантиль распределения Стьюдента, - требуемый уровень значимости, (n-2) - число степеней свободы.

уровень значимости 0,05%

В нашей задаче 5-2=3, t_табл= 3,18.

Для получаем расчетное значение:

Коэффициент корреляции существенно отличается от нуля, его можно считать значимым.

Задача 2

Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.

Исходные данные:

х 18 22 13 20 15 14

у 17 20 11 18 14 10

Это нулевой вариант. Каждое значение х и у увеличить на свой номер классного журнала.

Результаты:

1.Коэффициент корреляции.

2.Расчетное и табличное значения критерия Стьюдента, вывод о значимости. ВСЕ РЕЗУЛЬТАТЫ до 2-х знаков после запятой.

Решение

У и Х увеличим на свой номер классного журнала.

Х	33	37	28	35	30	29
У	32	35	26	33	29	25

Составим вспомогательную таблицу.

Таблица 5 - Расчетные значения для определения коэффициента корреляции

№	Х	У	x_i y_i	x_i²	y_i²
1	33	32	1056	1089	1024
2	37	35	1295	1369	1225
3	28	26	728	784	676
4	35	33	1155	1225	1089
5	30	29	870	900	841
6	29	25	725	841	625
?	192	180	5829	6208	5480

Коэффициент корреляции:

==0,964

Сильная положительная линейная связь между y и x: с ростом х растет у.

если ,

- квантиль распределения Стьюдента, - требуемый уровень значимости, (n-2) - число степеней свободы.

уровень значимости 0,05%

В нашей задаче 6-2=4, t_табл= 2,78.

Для получаем расчетное значение:

Коэффициент корреляции существенно отличается от нуля, его можно считать значимым.

Задача 3

В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистике по сто балльной системе:

Теория вероятностей: 65 90 42 47 84 58 50

Статистика: 51 85 36 63 72 80 40.

Определить коэффициент ранговой корреляции Спирмена и его значимость. Это нулевой вариант. Каждое значение (балл) увеличить на свой номер классного журнала. Расчеты и результат до двух знаков.

Результаты:

1.Коэффициент ранговой корреляции.

2.Расчетное и табличное значения критерия Стьюдента при уровне значимости равным 0,05 и выводы.

Решение

У и Х увеличим на свой номер классного журнала.

Теория вероятностей	80	105	57	62	99	73	65
Статистика	66	100	51	78	87	95	55

Составим вспомогательную таблицу.

Таблица 6 - Расчетные значения для определения коэффициента ранговой корреляции Спирмена

№	Теория вероятностей х	Статистика у
1	80	66	5	3	4
2	105	100	7	7	0
3	57	51	1	1	0
4	62	78	2	4	4
5	99	87	6	5	1
6	73	95	4	6	4
7	65	55	3	2	1
?			28	28	14

Коэффициент Спирмена:

а по формуле - значение t-статистики:

При = 0,05 и n -2= 7-2=5, t_крит=2,57

Так как t<t_крит, коэффициент несущественно отличается от нуля, является незначимым.

Поэтому на уровне значимости 0,05 можно считать, что связь между х и у незначимая.

3. Регрессионный анализ

Регрессиомнный анализ -- статистический метод исследования влияния одной или нескольких независимых переменных X₁, X₂,…,Xp на зависимую переменную Y. Независимые переменные иначе называют регрессорами или предикторами, а зависимые переменные -- критериальными. Терминология зависимых и независимых переменных отражает лишь математическую зависимость переменных, а не причинно-следственные отношения.[7]

Основными целями регрессионного анализа является:

- Определение степени детерминированности вариации критериальной (зависимой) переменной предикторами (независимыми переменными)

- Предсказание значения зависимой переменной с помощью независимой(-ых)

- Определение вклада отдельных независимых переменных в вариацию зависимой

Регрессионный анализ нельзя использовать для определения наличия связи между переменными, поскольку наличие такой связи и есть предпосылка для применения анализа

Задача 1

Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.

Каждое значение (у) увеличить на свой номер классного журнала.

Исходные данные:

Характеристики модели: 1) модель (коэффициенты до 4-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;

5) вывод о значимости коэффициентов модели;

6) доверительные интервалы коэффициентов модели (до 4-х знаков).

Решение

Имеем данные

Х	1	2	3	4	5	6	7	8	9	10
У	36	31	30	29	28	27,5	26	26,5	25	23

Найдем оценки коэффициентов обратной (гиперболической) модели

Введем новую переменную . Тогда гиперболическая модель приводится к линейной:

12,2

24,6266

Гиперболическое уравнение регрессии имеет вид:

y = 12,2/ t + 24,6266.

Таблица 7 - Оценка коэффициентов гиперболической модели

х	y			y_i	y_i
1	36	1	1	36	36,827	0,6833	74,418	0,5
2	31	0,5	0,25	15,5	30,727	0,0747	6,3837	0,0429
3	30	0,33333	0,11111	10	28,693	1,7076	0,2433	0,0016
4	29	0,25	0,0625	7,25	27,677	1,7514	0,2739	0,0018
5	28	0,2	0,04	5,6	27,067	0,8712	1,2846	0,0086
6	27,5	0,16667	0,02778	4,5833	26,66	0,7057	2,3718	0,0159
7	26	0,14286	0,02041	3,7143	26,369	0,1365	3,3509	0,0225
8	26,5	0,125	0,01563	3,3125	26,152	0,1214	4,1959	0,0282
9	25	0,11111	0,01235	2,7778	25,982	0,9646	4,9188	0,033
10	23	0,1	0,01	2,3	25,847	8,1031	5,5385	0,0372
55	282	2,929	1,5498	91,0379	282	15,1195	102,9798	0,6919

Рис.1. Обратная модель связи себестоимости единицы продукции со стоимостью основных фондов

индекс детерминации вычисляется по формуле

102,9798/(102,9798+15,1195)=0,87

Построенное уравнение на 87% объясняет вариацию результативного признака.

Для проверки статистической надежности результатов регрессионного анализаиспользуется статистика Фишера:

F= (102,9798/1)/( 15,1195/8)= 54,49

к₁ =1, к₂ = 10-1-1=8, на уровне значимости 0,05 табличное значение F_т = 5,32. Для зависимости y от x выполняется неравенство F_т < F, признается статистическая значимость уравнения регрессии. Уравнение можно рекомендовать для практического использования.

Оценим стандартную ошибку регрессии.

=15,1195/8=1,8899- остаточная дисперсия уравнения регрессии.

стандартная ошибка регрессии

Стандартные ошибки параметров регрессии рассчитываются по формулам:

=1,6528

=0,6506.

Уровень надежности 95%

2,306

t-статистики рассчитываются по формулам:

t_a =a/COa,

t_a =12,2/1,6528=7,38

t_b=b/COb,

t_b=24,6266/0,6506=37,85

С вероятностью 0,95 оценим статистическую значимость параметров уравнения регрессии с помощью t-критерия Стьюдента.

Значение t-статистики для параметра а по модулю больше табличного значения 2,306. Поэтому гипотеза H₀ о равенстве нулю коэффициента a отвергается, a значимо, и его нужно включать в модель.

Выборочное значение t-статистики для коэффициента b по модулю также существенно превышает табличное значение 2,306. Поэтому гипотеза H₀ о равенстве нулю коэффициента b отвергается, b значимо, и его нужно включать в модель.

Построение доверительных интервалов. Доверительные интервалы - это границы, в которые с большой вероятностью попадают неизвестные параметры. Построим интервалы, в которые неизвестные параметры будут попадать с вероятностью в 95%

-*?a? +*

12,2-2,306*1,6528?a?12,2+2,306*1,6528

8,3886?a?16,0114

С вероятностью 0,95 истинное значение параметра a находится в интервале [8,3886; 16,0114]. Любая гипотеза на равенство значению, лежащему внутри интервала, не будет отвергаться, и наоборот - гипотеза о значении, лежащем вне интервала, будет всегда отвергаться.

-*?b? +*

24,6266-2,306*0,6506?b? 24,6266+2,306*0,6506

23,1263?b? 26,1269

С вероятностью 0,95 истинное значение параметра b находится в интервале [23,1263; 26,1269]. Любая гипотеза на равенство значению, лежащему внутри интервала, не будет отвергаться, и наоборот - гипотеза о значении, лежащем вне интервала, будет всегда отвергаться.

Задача 2

Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:

Определить характеристики модели.

Каждое значение (у) увеличить на свой номер классного журнала.

Характеристики модели: 1) модель (коэффициенты до 2-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.

Решение

Имеем данные

Х	1	2	3	4	5	6
У	25	28,4	30,4	31,5	33,6	34,1

Найдем оценки коэффициентов полулогарифмической модели

Введем новую переменную . Тогда логарифмическая модель приводится к линейной:

5,1289

24,876

Логарифмическое уравнение регрессии имеет вид:

y = 24,876+ 5,1289 ln х.

Таблица 8 - Оценка коэффициентов логарифмической модели

х	y			y_i	y_i
1	25	0	0	0	24,876	0,01538	31,6294
2	28,4	0,69315	0,48045	19,68538	28,431	0,00097	4,28042
3	30,4	1,09861	1,20695	33,397814	30,511	0,01225	0,00011
4	31,5	1,38629	1,92181	43,668272	31,986	0,23636	2,20869
5	33,6	1,60944	2,59029	54,077114	33,131	0,22029	6,9203
6	34,1	1,79176	3,2104	61,098998	34,066	0,00117	12,7146
21	183	6,5793	9,4099	211,9276	183	0,4864	57,7535

индекс детерминации вычисляется по формуле

57,7535/(57,7535+0,4864)=0,99

Построенное уравнение на 99% объясняет вариацию результативного признака.

Для проверки статистической надежности результатов регрессионного анализаиспользуется статистика Фишера:

F= (57,7535/1)/( 0,4864/4)= 474,95

к₁ =1, к₂ = 6-1-1=4, на уровне значимости 0,05 табличное значение F_т = 7,71. Для зависимости y от x выполняется неравенство F_т < F, признается статистическая значимость уравнения регрессии. Уравнение можно рекомендовать для практического использования.

Оценим стандартную ошибку регрессии.

=0,4864/4=0,1216- остаточная дисперсия уравнения регрессии.

стандартная ошибка регрессии

Рис.2. Полулогарифмическая модель

Задача 3

Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1.

Таблица 3.1 - Динамика коэффициента рождаемости в Пензенской области

Год	2000	2001	2002	2003	2004	2005
Коэффициент рождаемости	7,5	7,5	8,0	8,4	8,6	8,4
Год	2006	2007	2008	2009	2010	2011
Коэффициент рождаемости	8,6	9,7	10,2	10,3	10,2	10,1
Год	2012	2013	2014	2015	2016
Коэффициент рождаемости	10,8	10,6	10,8	10,7	10,2

Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г. В электронную таблицу вместо года ставить 1,2,…

Решение

Найдем точечные оценки параметров линейной регрессионной модели

Y = at + b +

Таблица 9 - Оценка параметров линейной модели

t	y	y t	t²		\|(y_i- )/y_i\|
1	7,5	7,5	1	7,692	0,0256	0,03694	3,079529
2	7,5	15	4	7,912	0,0549	0,16941	2,357634
3	8	24	9	8,131	0,0164	0,01716	1,732011
4	8,4	33,6	16	8,35	0,0059	0,00246	1,202661
5	8,6	43	25	8,57	0,0035	0,00091	0,769583
6	8,4	50,4	36	8,789	0,0463	0,15148	0,432778
7	8,6	60,2	49	9,009	0,0475	0,16695	0,192246
8	9,7	77,6	64	9,228	0,0487	0,22278	0,047987
9	10,2	91,8	81	9,447	0,0738	0,56641	1,16E-07
10	10,3	103	100	9,667	0,0615	0,40094	0,048286
11	10,2	112,2	121	9,886	0,0308	0,09847	0,192845
12	10,1	121,2	144	10,11	0,0006	3,1E-05	0,433676
13	10,8	140,4	169	10,33	0,044	0,22563	0,770781
14	10,6	148,4	196	10,54	0,0052	0,00309	1,204158
15	10,8	162	225	10,76	0,0034	0,00131	1,733807
16	10,7	171,2	256	10,98	0,0265	0,0802	2,35973
17	10,2	173,4	289	11,2	0,0983	1,00521	3,081925
153	160,6	1534,9	1785	160,6	0,5927	3,1494	19,6396

=7,4728,=0,2194.

Уравнение тренда (регрессии) будет иметь вид:

=0,2194t+7,4728

Рис. 3. Линейная модель

коэффициент детерминации вычисляется по формуле

19,6396/(19,6396+3,1494)=0,86

Построенное уравнение на 86% объясняет вариацию результативного признака.

Для проверки статистической надежности результатов регрессионного анализаиспользуется статистика Фишера:

F= (19,6396/1)/( 3,1494/15)= 93,54

к₁ =1, к₂ = 17-1-1=15, на уровне значимости 0,05 табличное значение F_т = 4,54. Для зависимости y от x выполняется неравенство F_т < F, признается статистическая значимость уравнения регрессии. Уравнение можно рекомендовать для практического использования.

Оценим стандартную ошибку регрессии.

=3,1494/15=0,21- остаточная дисперсия уравнения регрессии.

стандартная ошибка регрессии

Вычислим среднюю относительную ошибку аппроксимации для моделей. Допустимый предел не более 8-10%.

|(y_i- y_i)/y_i|

0,5927/17=3,5% -указывает на качественное уравнение регрессии.

Спрогнозируем коэффициент рождаемости в 2017г. t=18.

y₂₀₁₇=0,2194*18+7,4728=11,4

Задача 4

Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = а_о + а₁t; lnу = а_о + а₁t; у = 1/(а_о + а₁t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.

Таблица 3.2 - Курс рубля к доллару

Месяц и год

январь

2017

февраль

март

апрель

май

июнь

июль

август

2017

Цена одного доллара

59,6

58,5

58,0

56,4

57,0

57,9

59,7

59,6

Решение

Найдем точечные оценки параметров линейной регрессионной модели

Y = at + b +

Таблица 10 - Оценка параметров линейной модели

t	y	y t	t²		\|(y_i- )/y_i\|
1	59,6	59,6	1	58,075	0,02559	2,32563	0,06891
2	58,5	117	4	58,15	0,00598	0,1225	0,03516
3	58	174	9	58,225	0,00388	0,05063	0,01266
4	56,4	225,6	16	58,3	0,03369	3,61	0,00141
5	57	285	25	58,375	0,02412	1,89063	0,00141
6	57,9	347,4	36	58,45	0,0095	0,3025	0,01266
7	59,7	417,9	49	58,525	0,01968	1,38063	0,03516
8	59,6	476,8	64	58,6	0,01678	1	0,06891
36	466,7	2103,3	204	466,7	0,1392	10,6825	0,2363

=58,=0,075.

Уравнение тренда (регрессии) будет иметь вид:

0,075t+58

Рис. 4. Линейная модель

коэффициент детерминации вычисляется по формуле

0,2363/(0,2363+10,6825)= 0,0216

Построенное уравнение на 2,16% объясняет вариацию результативного признака.

Для проверки статистической надежности результатов регрессионного анализаиспользуется статистика Фишера:

F= (0,2363/1)/( 10,6825/6)= 0,13

к₁ =1, к₂ = 17-1-1=6, на уровне значимости 0,05 табличное значение F_т = 5,99. Для зависимости y от x выполняется неравенство F_т > F, признается статистическая незначимость уравнения регрессии. Уравнение нельзя рекомендовать для практического использования.

Оценим стандартную ошибку регрессии.

=10,6825/6=1,7804- остаточная дисперсия уравнения регрессии.

стандартная ошибка регрессии

Вычислим среднюю относительную ошибку аппроксимации для моделей. Допустимый предел не более 8-10%.

|(y_i- y_i)/y_i|

0,1392/8=1,74% -находится в допустимых пределах.

Построим нелинейную регрессионную модель вида: lnу = а_о + а₁t. Это показательная модель.

Найдем оценки коэффициентов показательной модели

Тогда линеаризованная модель имеет вид:

0,0013

4,0603

Таблица 11 - Оценка коэффициентов показательной модели

t	y	t²		t		\|(y_i- )/y_i\|
1	59,6	1	4,0877	4,0877	58,068	0,0257
2	58,5	4	4,069	8,1381	58,144	0,0061
3	58	9	4,0604	12,181	58,219	0,0038
4	56,4	16	4,0325	16,13	58,295	0,0336
5	57	25	4,0431	20,215	58,371	0,0241
6	57,9	36	4,0587	24,352	58,447	0,0094
7	59,7	49	4,0893	28,625	58,523	0,0197
8	59,6	64	4,0877	32,701	58,599	0,0168
36	466,7	204	32,5284	146,431	466,7	0,1392

Рис. 5. Показательная модель

0,1392/8=1,74%

Проверка статистической значимости показательной модели также проводитс...

курсовая работа "Общая теория статистики" скачать

Подобные документы

Средние величины и показатели вариации
Понятие о средних величинах как обобщении в экономике. Виды средних величин: арифметическая, гармоническая, геометрическая, квадратическая и кубическая. Показатели вариации. Методика и примеры решения типовых задач на нахождение средних величин.

курсовая работа [27,7 K], добавлен 31.05.2008
Абсолютные, относительные и средние величины
Абсолютные и относительные величины. Виды средних величин. Формы количественного выражения статистических показателей. Абсолютные размеры явлений и их признаков. Выбор единиц измерения величин. Индивидуальные, групповые и общие абсолютные величины.

презентация [135,5 K], добавлен 16.03.2014
Индексный метод в анализе эффективности внешнеэкономической деятельности
Проблема использования индексного анализа динамики средних цен в экономической практике; учет влияния фактора сменяемости изучаемых величин. Методологические принципы исчисления индексов стоимости, средних цен и физического объема внешней торговли.

контрольная работа [1,6 M], добавлен 18.08.2013
Исследование свойств случайных величин, планирование многофакторного эксперимента, получение модельных данных и проведение дисперсионного анализа с целью проверки влияния факторов на показатели качества строительной продукции
Изучение показателей качества конструкционного газобетона как случайных величин. Проведение модульного эксперимента и дисперсионного анализа с целью определения достоверности влияния факторов на поведение выбранных показателей качества данной продукции.

курсовая работа [342,3 K], добавлен 08.05.2012
Исследование свойств случайных величин, планирование эксперимента и анализ данных
Получение функции отклика показателя качества Y2 и формирование выборки объемом 15 и более 60. Зависимость выбранного Y от одного из факторов Х. Дисперсионный анализ и планирование эксперимента. Проведение корреляционного и регрессионного анализа.

курсовая работа [827,2 K], добавлен 19.06.2012
Выполнение корреляционного и регрессионного анализа
Связь между случайными переменными и оценка её тесноты как основная задача корреляционного анализа. Регрессионный анализ, расчет параметров уравнения линейной парной регрессии. Оценка статистической надежности результатов регрессионного моделирования.

контрольная работа [50,4 K], добавлен 07.06.2011
Корреляционный анализ торговой деятельности магазина бытовой и компьютерной техники
Понятие корреляционно-регрессионного анализа как метода изучения по выборочным данным статистической зависимости ряда величин. Оценка математического ожидания, дисперсии, среднего квадратического отклонения и коэффициента корреляции случайных величин.

курсовая работа [413,0 K], добавлен 11.08.2012
Применение статистических методов для анализа добычи, производства и потребления меди
Линейный регрессионный анализ выработки и потребления меди на мировом рынке. Теория множественной корреляции. Разработка методологии исследования материалов: массовые статистические наблюдения, методы группировок, средних величин, графических изображений.

курсовая работа [1,2 M], добавлен 06.05.2014
Основы практического использования прикладного регрессионного анализа
Теоретические основы прикладного регрессионного анализа. Проверка предпосылок и предположений регрессионного анализа. Обнаружение выбросов в выборке. Рекомендации по устранению мультиколлинеарности. Пример практического применения регрессионного анализа.

курсовая работа [1,2 M], добавлен 04.02.2011
Сетевое планирование и управление. Основы регрессионного анализа
Понятие сетевого планирования, его особенности, назначение и сферы применения. Правила и этапы построения сетевых графиков, необходимые расчеты и решение типовых задач. Общая характеристика корреляционного и регрессивного анализа, их применение.

контрольная работа [142,3 K], добавлен 29.04.2009
Теория статистики
Предмет, метод, показатели статистики. Понятия и категории статистического наблюдения. Показатели вариации, абсолютные и относительные величины, графический и индексный методы. Взаимосвязь социально-экономических явлений. Сглаживание рядов динамики.

курс лекций [132,9 K], добавлен 23.02.2009
Анализ показателей ряда динамики
Решение задачи изучения изменения анализируемых показателей во времени при помощи построения и анализа рядов динамики. Элементы ряда динамики: уровни динамического ряда и период времени, за который они представлены. Понятие переменной и постоянной базы.

методичка [43,0 K], добавлен 15.11.2010
Особенности анализа динамики стоимостных показателей на железнодорожном транспорте
Анализ динамики изменения показателей объема грузоперевозок, структуры эксплуатационных расходов по элементам затрат, себестоимости работ, полученного дохода, прибыли и рентабельности производства по железнодорожной станции Калий в РБ за пять лет.

контрольная работа [33,6 K], добавлен 22.04.2016
Моделювання на ЕОМ випадкових величин і випадкових процесів
Принципи та алгоритми моделювання на ЕОМ типових випадкових величин та процесів. Моделювання випадкових величин із заданими ймовірнісними характеристиками та тих, що приймають дискретні значення. Моделювання гаусових випадкових величин методом сумації.

реферат [139,7 K], добавлен 19.02.2011
Статистические методы оценки социально-экономических показателей
Применение метода аналитической группировки при оценке показателей розничного товарооборота. Определение эмпирического корреляционного отношения, издержек обращения и товарооборота с помощью уравнения линейной регрессии метода математической статистики.

контрольная работа [316,4 K], добавлен 31.10.2009
Выполнение статистических расчетов с помощью ЭВМ в системе MINITAB и Exсel
Основные характеристики распределения экономических величин. Сущность, особенности и метод вычисления коэффициента корреляции Пирсона. Расчет статистических характеристик величин с помощью MINITAB. Расчет основных статистических показателей в пакете.

методичка [411,0 K], добавлен 15.12.2008
Статистические методы определения экономических показателей
Особенности группировки экономических данных. Методика определения средних показателей, мод, медиан, средней арифметической, индексов товарооборота, цен и объема реализации, абсолютных приростов, темпов роста и прироста. Анализ цен реализации товара.

контрольная работа [51,1 K], добавлен 03.05.2010
Корреляционный анализ
Задачи и этапы проведения корреляционного анализа, экономическая интерпретация его результатов. Критерии качественной и количественной однородности исходных данных: среднеквадратическое отклонение и коэффициент вариации. Показатели оценки уравнения связи.

контрольная работа [76,9 K], добавлен 12.11.2013
Экономико-статистическое моделирование производительности труда
Сущность корреляционно-регрессионного анализа и его использование в сельскохозяйственном производстве. Этапы проведения корреляционно-регрессионного анализа. Области его применения. Анализ объекта и разработка числовой экономико-математической модели.

курсовая работа [151,0 K], добавлен 27.03.2009
Виды выборок. Регрессионная модель и функция регрессии
Метод статистического исследования. Генеральная совокупность и выборка. Приведение статистики темпа инфляции за 10 лет. Выборочное обследование торговых предприятий, оценка величины запаса (в днях оборота). Этапы корреляционно-регрессионного анализа.

контрольная работа [170,0 K], добавлен 20.01.2014

Другие документы, подобные "Общая теория статистики"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.