Главная Коллекция "Revolution" Экономика и экономическая теория Общая теория статистики

Общая теория статистики

Статистика как самостоятельная общественная наука. Изучение методов статистических исследований, применяемых в области экономики, менеджмента. Способы проведения корреляционного и регрессионного анализа. Определение средних величин и показателей вариации.

Рубрика	Экономика и экономическая теория
Вид	курсовая работа
Язык	русский
Дата добавления	22.02.2019
Размер файла	1,0 M

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ПЕНЗЕНСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ

ФАКУЛЬТЕТ «ЭКОНОМИКА И УПРАВЛЕНИЕ»

КАФЕДРА «ЭКОНОМИКА И ФИНАНСЫ»

КУРСОВАЯ РАБОТА

по дисциплине: «Общая теория статистики»

Автор работы

Федорова Л.Н.

Специальность: 38.03.01 Экономика.

Группа: 16ЭЭ3

Руководитель работы

В.Н. Деркаченко

Пенза 2017

Введение

Статистика - самостоятельная общественная наука, которая, как и любая другая наука, имеет свои методы исследования.

Для принятия наиболее оптимальных решений в области своей деятельности таким специалистам, как экономисты и менеджеры, необходимо овладеть методами статистических исследований, ведь в дальнейшем знания и умения пользоваться методами статистических исследований помогут более эффективно изучать тенденции рыночной конъюнктуры товаров и услуг.

Статистика играет огромную роль в области экономики, а статистическая информация является важнейшей составной частью глобальной информационной системы государства.

Можно сказать, что статистика обеспечивает анализ количественной стороны, а также служит основой для принятия соответствующих управленческих решений.

Развитие экономики характеризуется еще и тем, насколько эффективно используются ресурсы, имеющиеся в государстве, и прежде всего рабочая сила. Поддержание занятости - одно из важнейших цель экономической политики. статистика экономика менеджмент корреляционный

Основными задачами данной курсовой работы являются: - проведение корреляционного анализа;

- определение средних величин и показателей вариации;

- проведение регрессионного анализа.

Целью данной курсовой работы является решение задач по каждому из разделов.

Мой номер классного журнала - 21.

1. Средние величины и показатели вариации

Средние величины относятся к обобщающим статистическим показателям, которые дают сводную (итоговую) характеристику массовых общественных явлений, так как строятся на основе большого количества индивидуальных значений варьирующего признака. Для выяснения сущности средней величины необходимо рассмотреть особенности формирования значений признаков тех явлений, по данным которых исчисляют среднюю величину[2].

В статистике используют различные виды средних величин, которые делятся на два больших класса:

1) степенные средние (средняя гармоническая, средняя геометрическая, средняя арифметическая, средняя квадратическая, средняя кубическая);

2) структурные средние (мода, медиана).

Для вычисления степенных средних необходимо использовать все имеющиеся значения признака. Мода и медиана определяются лишь структурой распределения. Поэтому их именуют структурными, позиционными средними. Медиану и моду часто используют как среднюю характеристику в тех совокупностях, где расчет средней степенной невозможен или нецелесообразен.

Самый распространенный вид средней - средняя арифметическая. Средней арифметической называется такое значение признака, которое имела бы каждая единица совокупности, если бы общий итог всех значений признака был распределен равномерно между всеми единицами совокупности. [2].

(1.1)

Наряду с простой средней арифметической изучают среднюю арифметическую взвешенную.

= (1.2)

Также известны другие средние, их можно определить по общей формуле:

(1.3), где k - степень, определяющая различные средние.

Средняя гармоническая взвешенная находится по формуле:

_гм= (1.4)

Медианой называется вариант, расположенный в центре ранжированного ряда. Медиана делит ряд на две равные части таким образом, что по обе стороны от нее находится одинаковое количество единиц совокупности. При этом у одной половины единиц совокупности значение варьирующего признака меньше медианы, у другой - больше ее. Медиана используется при изучении элемента, значение которого больше или равно или одновременно меньше или равно половине элементов ряда распределения. Медиана дает общее представление о том, где сосредоточены значения признака, иными словами, где находится их центр. [1].

М_е = X_н + i ) (1.5),

где Х_н- нижняя граница интервала;

i - ширина интервала;

n - объем выборки (число наблюдений);

- накопленная частота интервала, предшествующего медианному;

m_ме- частота медианного интервала;

Также существует такой показатель как мода, который находится как:

М₀ = х_н+ i(1.6),

где Х_н- нижняя граница интервала, содержащего моду;

i- ширина интервала;

m2 - частота модального интервала;

m1- частота интервала, предшествующего модальному;

m3 - частота интервала, следующего за модальным.

Размах вариации (R) представляет собой разность между максимальным и минимальным значениями признака в изучаемой совокупности, формально имеем:

R = X_max - X_min(1,7)

Простое среднее линейное отклонение:

= (1.8)

Взвешенное среднее линейное отклонение:

_вз = (1.9)

Среднеквадратическое отклонение:

у = (1.10).

Средняя дисперсия :

уІ = (1.11).

Взвешенная дисперсия:

уІ_вз = (1.12).

Среднее квадратическое отклонение:

) = (1.13)

Взвешенное среднее квадратическое отклонение:

= (1.14)

Коэффициент вариации - наиболее часто применяемый показатель относительной колеблемости, характеризующий однородность совокупности. Совокупность считается однородной, если коэффициент вариации не превышает 33% для распределений, близких к нормальному.

V = 100% (1.15)

Задача 1.1. По статистическим данным: 3; 5; 2; 4; 7; 3; 8; 3; 10 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение увеличить на свой номер классного журнала. Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.

Решение:

Увеличим значения на 21 и получим следующие данные:

24; 26; 23; 25; 28; 24; 29; 24; 31.

Определим среднее значение по формуле 1.1

= = 26

Мода = 24, так как это часто встречающее значение.

Чтобы определить медиану, необходимо расставить ряд в порядке возрастания.

Получим: 23; 24; 24; 24; 25; 26; 28; 29;31.

Количество значений нечетное, поэтому медианой будет являться число 25, т. к. оно занимает центральное положение в ряду.

Далее, определим среднюю дисперсию:

уІ(sІ) = =

Теперь вычислим среднеквадратическое отклонение:

у = = 2,24

Наконец, найдем коэффициент вариации:

V = = 8,6 %

Задача 1.2. По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 42%, стоимость основных фондов увеличилась на 31%. Определить изменение фондоотдачи.

Решение:

Фондоотдача = * 100% = *100% = 108%

Фондоотдача = 108%-100% = 8%

Таким образом, при увеличении дохода от реализации продукции в отчетном периоде по сравнению с базисным 42% на и увеличении стоимости основных средств на 31%, то фондоотдача изменится на 8%.

Задача 1. 3. Объем оборота (У) и число работников (m) приведены в таблице 1.1. Определить среднее значение, моду и медиану.

Таблица 1.1 - Исходные данные

У	80-100	100-120	120-140	140-160	160-180	180-200
m	6	17	25	28	14	10

Решение:

Таблица 1.2

У	m	Середина интервала	Накопленная частота
80-100	6	90	6
100-120	17	110	23
120-140	25	130	48
140-160	28	150	76
160-180	14	170	90
180-200	10	190	100
Итого	100

Найдем среднюю простую:

x?= 141,4

Для определения моды и медианы, необходимо найти медийный интервал.

Медианным интервалом будет интервал 140-160, так как накопленная частота на этом промежутке превысит значение

50. (76 >50).

Найдем медиану:

140+20 =141,43

Вычисляем моду:

М₀ = х_н+ i = 140 + 20[] =143,53

Задача 1.4. По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., m_г - число государственных предприятий; m_ч - частных; m_{о -}общее число (таблица 1.3). Каждое значение Х_iувеличить на свой номер классного журнала.

Таблица 1.3. Исходные данные по объему оборота предприятий

Х_i	m_гi	m_чi	m_oi
22,0-22,2		3	3
22,2-22,4		4	4
22,4-22,6		17	17
22,6-22,8	11	15	26
22,8-23,0	13	6	19
23,0-23,2	18	5	23
23,2-23,4	6		6
23,4-23,6	2		2
	50	50	100

Результаты, например, общая дисперсия равна 97830 руб. и коэффициент детерминации, целое число в %.

Решение:

Чтобы определить общую дисперсию, необходимо знать значение общей средней:

При расчете общей дисперсии необходимо использовать вид взвешенной, т.к. имеется частота:

= = 0,09 или 90 000 руб.

Для вычисления внутригрупповой дисперсии по группам необходимо рассчитать среднее значение:

= = 23

Внутригрупповая дисперсия определяется по формуле:

или 556 000 руб.

Межгрупповая дисперсия вычисляется следующим образом:

или 344 000 руб.

Теперь необходимо рассчитать коэффициент детерминации:

- связь умеренная, т.к. находится в интервале 30% - 50%.

Таким образом,

Задача 1. 5. Определить среднюю внутригрупповую, межгрупповую и общую дисперсии совокупности, состоящей из трех групп (таблица 1.4).

Таблица 1.4 - Исходные данные

1 группа	Х_i	1	2	8
	m_i	30	15	5
2 группа	Х_i	1	6
	m_i	10	15
3 группа	Х_i	3	8
	m_i	20	5

Решение:

В первую очередь, необходимо определить среднее значение для 3-х групп, и используя получившиеся результаты, рассчитать для них взвешенные дисперсии.

Для нахождения средней внутригрупповой дисперсии необходимо просуммировать получившиеся взвешенные и поделить их на 3:

Теперь необходимо рассчитать общее среднее значение и общую дисперсию:

Ответ:

2. Корреляционный анализ

Корреляционный анализ -- это метод, применяющийся с целью проверки гипотезы о статистической значимости двух и более переменных, если исследователь их может измерять, но не изменять[3].

Корреляционный анализ предполагает определение зависимости между изучаемыми признаками, в связи, с чем задачи корреляционного анализа можно дополнить следующими:

1) выявление факторов, оказывающих наибольшее влияние на результативный признак;

2) выявление неизученных ранее причин связей;

3) построение корреляционной модели с ее параметрическим анализом;

4) исследование значимости параметров связи и их интервальная оценка.

На величину показателей влияет несколько факторов, поэтому для оценки тесноты связи между показателем и факторами используются множественный корреляционный анализ. [3].

Корреляционный момент определяется:

(2.1),

где n - объем выборки, число наблюдений;

X_i , Y_i - i-тое значение фактора и показателя;

X?, - средние значения фактора и показателя.

Корреляционный момент имеет размерность, то переходят к безразмерному коэффициенту корреляции:

r_xy = (2.2),

где - среднеквадратические отклонения фактора и показателя.

Для расчета коэффициента корреляции также используется следующая зависимость:

r_xy = (2.3),

где - среднее значения произведения фактора на показатель.

Коэффициент корреляции изменяется в пределах: -1 r +1

Значимость коэффициента корреляции базируется на проверке статистических гипотез, выдвигается нулевая гипотеза о том, что коэффициент корреляции равен нулю и контр гипотеза, что он не равен нулю: H₀: r=0; H₁: r 0.

После этого определяется расчетное значение критерия Стьюдента по формуле:

t = (2.4).

Далее находится табличное значение критерия Стьюдента. Входом в табличное значение является уровень значимости и степень свободы . На практике, чаще всего, принимают за 0; 0,5; = n2. Если расчетное значение критерия Стьюдента больше табличного, то нулевая гипотеза отвергается и, следовательно, коэффициент корреляции значим. Если же, табличное значение критерия Стьюдента больше расчетного значения критерия, то нулевая гипотеза подтверждается, а, следовательно, коэффициент корреляции не значим. [3].

Также для расчетов в этом разделе используется коэффициент ранговой корреляции Спирмена:

(2.5)

Корреляционный момент:

К_ху= (2.6)

Задача 2. 1. Определить коэффициент корреляции между У и Х. Х: 3,5; 4,6; 5,8; 4,2; 5,2;

УХ: 28,35; 43,24; 65,54; 28,98; 50,44.

Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Результаты:

1) коэффициент корреляции;

2) расчетное и табличное значения критерия Стьюдента и вывод.

Решение:

Таблица 2.1

У	29,1	30,4	32,3	27,9	30,7	150,4
Х	24,5	25,6	26,8	25,2	26,2	128,3
ХУ	712,95	778,24	865,64	703,08	804,34	3864,25
(Хi-Х?)І	1,3456	0,0036	1,2996	0,2116	0,2916	3,152
(Уi-У?)І	0,9604	0,1024	4,9284	4,7524	0,3844	11,128

Вычислим средние значения:

X?=

У?=

Перед расчетом коэффициента корреляции необходимо вычислить среднее квадратическое отклонение для показателей x и y:

= 0,6304

Коэффициент корреляции определяется по формуле:\

В соответствии с данными задачи, расчет выглядит следующим образом:

Вывод: связь между показателем и фактором сильная, т.к. её значение находится в интервале 0,6-0,8. Значимость коэффициента корреляции проверяется по критерию Стьюдента. Вначале вычисляется расчетное значение критерия по формуле:

Табличное значение критерия Стьюдента:

Вывод: расчетное значение меньше табличного, то коэффициент корреляции не значимый, необходимо увеличить объем выборки.

Ответ: = ; ; коэффициент не значим.

Задача 2.2. Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.

Таблица 2.2 Исходные данные

х	у
39	38
43	41
34	32
41	39
36	35
35	31

Решение:

Таблица 2.3

x	y	x²	y²	x * y
39	38	1521	1444	1482
43	41	1849	1681	1763
34	32	1156	1024	1088
41	39	1681	1521	1599
36	35	1296	1225	1260
35	31	1225	961	1085
228	216	8728	7856	8277

Для наших данных система уравнений имеет вид

6a + 228*b = 216

228*a + 8728*b = 8277

Домножим уравнение (1) на -38, получим систему, которую можно решить методом алгебраического сложения.

-228а - 8664*b = -8208

228*а + 8728*b = 8277

64*b = 69

b =1.0781

Теперь найдем коэффициент «а» из уравнения 1:

6*а + 228*1,0781 = 216

6*а = - 29813

а = -4,9688

Получаем эмпирические коэффициенты регрессии: b = 1.0781, a = -4.9688

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 1.0781 x -4.9688

Параметры уравнения регрессии

Выборочные дисперсии:

Среднеквадратическое отклонение:

Коэффициент корреляции:

Значимость коэффициента корреляции:

По таблице Стьюдента с уровнем значимости б=0.05 и степенями свободы k=4 находим t_крит:

t_крит (n-m-1;б/2) = (4;0.025) = 2.776

Поскольку |t_набл| > t_крит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим

Задача 2.3.

В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе.

Решение:

Таблица 2.4

Теория вероятности	Статистика
86	72
111	106
63	57
68	84
105	93
79	101
71	61

Матрица рангов.

Таблица 2.5

ранг (R_тв), d_x	ранг (R_с), d_y	(d_x - d_y)²
5	3	4
7	7	0
1	1	0
2	4	4
6	5	1
4	6	4
3	2	1
28	28	14

Проверка правильности составления матрицы на основе исчисления контрольной суммы:

Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.

По формуле вычислим коэффициент ранговой корреляции Спирмена.

Связь между признаком Y и фактором X сильная и прямая

3. Регрессионный анализ

Регрессионный анализ - это метод установления аналитического выражения стохастической зависимости между исследуемыми признаками. Уравнение регрессии показывает, как в среднем изменяется у при изменении любого из x_i.

В ходе регрессионного анализа решаются две основные задачи:

- построение уравнения регрессии, т.е. нахождение вида зависимости между результатным показателем и независимыми факторами x₁, x₂, …, x_n.

- оценка значимости полученного уравнения, т.е. определение того, насколько выбранные факторные признаки объясняют вариацию признака у.

Применяется регрессионный анализ главным образом для планирования, а также для разработки нормативной базы[6].

В отличие от корреляционного анализа, который только отвечает на вопрос, существует ли связь между анализируемыми признаками, регрессионный анализ дает и ее формализованное выражение. Кроме того, если корреляционный анализ изучает любую взаимосвязь факторов, то регрессионный - одностороннюю зависимость, т.е. связь, показывающую, каким образом изменение факторных признаков влияет на признак результативный.

Формулы и модели регрессионного анализа:

1) линейная модель

y= a₀+a₁x (3.1)

2) нахождение коэффициента а₁ модели:

а₁ = (3.2)

3) нахождение коэффициента a₀модели:

a₀= а₁ (3.3)

4) стандартная ошибка :

S_y= (3.4)

5) коэффициент детерминации:

R² = 1- (3.5)

6) критерий Стьюдента для коэффициентов:

(3.6)

7) случайные отклонения a₁и a₀

; (3.7)

8) критерий Фишера :

(3.8)

9) стандартное отклонение

(3.9)

10) стандартная ошибка:

(3.10)

Задача 3.1. Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.

Характеристики модели: 1) модель (коэффициенты до 4-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;

5) вывод о значимости коэффициентов модели;

6) доверительные интервалы коэффициентов модели (до 4-х знаков).

Решение: Для расчета параметров регрессии построим расчетную таблицу (табл. 3.1)

Таблица 3.1

y	y²	1/х	у/х	1/x²	х
42	1764	1	42	1	1
37	1369	0,5	18,5	0,25	2
36	1296	0,333	12	0,11	3
35	1225	0,25	8,75	0,625	4
34	1156	0,2	6,8	0,04	5
33,5	1122,25	0,167	5,583	0,028	6
32	1024	0,143	4,571	0,0204	7
32,5	1056,25	0,125	4,0625	0,016	8
31	961	0,111	3,44	0,0123	9
29	841	0,1	2,9	0,01	10
342	11814,5	2,929	108,4965	2,1117	55
Среднее значение	34,2	1181,45	0,293	10,84965	0,21117	5,5

Можно вычислить коэффициент a₀ и коэффициент а₁, для модели, которую необходимо поcтроить:

а₁ = = = 6,6154

а₀ = а₁ = 34,2 - 6,6154 0,293 = 32,2617

Формально а₀ показывает прогнозируемый уровень у, но только в том случае, если х₀ находится близко с выборочными значениями.

Но если х₀ находится далеко от выборочных значений х, то буквальная интерпретация может привести к неверным результатам, и даже если линия регрессии довольно точно описывает значения наблюдаемой выборки, нет гарантий, что также будет при экстраполяции влево или вправо.

По имеющимся данным можно построить модель. Она будет иметь следующий вид:

= 32,2617 +

Определим каждое значение .

Таблица 3.2 - Расчет показателей индекса детерминации, стандартной ошибки

y	Х	y?	(y-yЇ)І	(y-y^)І
42	1	38,8771	60,84	9,75250441	20,25
37	2	35,5694	7,84	2,04661636	12,25
36	3	34,4668	3,24	2,35070224	6,25
35	4	33,91555	0,64	1,1760318	2,25
34	5	33,58478	0,04	0,1724076	0,25
33,5	6	33,36427	0,49	0,0184226	0,25
32	7	33,2068	4,84	1,456366	2,25
32,5	8	33,088625	2,89	0,346479	6,25
31	9	32,99674	10,24	3,9869706	12,25
29	10	32,92324	27,04	15,391812	20,25
342	55	341,9933	118,1	36,69831	82,5
Ср. знач.	34,2	5,5	34,19933	11,81		8,25

По данной таблице определим коэффициент детерминации:

R² = 1- = 1- = 0,69

Можно вычислить индекс детерминации (R), он равен:

R = = 0,83. В нашем примере связь между признаком Y и фактором X весьма высокая и прямая.

По данной таблице рассчитаем стандартную ошибку модели, а также расчетное значение критерия Фишера:

Стандартная ошибка :

S_y= = = 12,9748

Критерий Фишера (F):

= = 17,81

Найдем табличное значение коэффициента Фишера. Оно будет равно 5,32 при значимости б=0,05 и критерием f = 8 . Уравнение регрессии с вероятностью 0,95 статистически значимое, так как F F_таб.

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается нулевая гипотеза Н₀ о случайной природе показателей, т.е. о незначимом их отличии от нуля.

Чтобы проверить, значимы ли параметры, т.е. значимо ли они отличаются от нуля, для генеральной совокупности используют статистические методы проверки гипотез.

В качестве основной (нулевой) гипотезы выдвигают гипотезу о незначимом отличии от нуля параметра или статистической характеристики в генеральной совокупности. Наряду с основной (проверяемой) гипотезой выдвигают альтернативную (конкурирующую) гипотезу о неравенстве нулю параметра или статистической характеристики в генеральной совокупности.

Проверим гипотезу H₀ о равенстве отдельных коэффициентов регрессии нулю (при альтернативе H₁ не равно) на уровне значимости б=0.05.

H0: b = 0, то есть между переменными x и y отсутствует линейная взаимосвязь в генеральной совокупности;

H1: b ? 0, то есть между переменными x и y есть линейная взаимосвязь в генеральной совокупности. В случае если основная гипотеза окажется неверной, мы принимаем альтернативную. Для проверки этой гипотезы используется t-критерий Стьюдента.

Вычислим стандартные отклонения величин параметров модели:

0,125

Далее определим случайные отклонения a₀ и а₁:

4,7698

32,848

Далее определим критерий Стьюдента для коэффициентов:

0,20139

6,76374

Фактические значения t - статистики для параметров , превышают табличные:

6,76 ?= 2,306; =0,201 < 2,306

Рассчитаем доверительные интервалы для параметров регрессии a₀ и а₁. Определим предельную ошибку для каждого показателя:

= 2,306·4,7698 = 10,9991

= 2,306·32,848 = 75,7475

Доверительные интервалы:

Таким образом, доверительный интервал для а₀:

32,2614-10,9991? a₀?32,2614+10,9991

21,2623? a₀?43,2305

6,6154 - 75,7475? a₁?6,6154 + 75,7475

-69,1321 а₁82,3629

Таким образом, на основе анализа верхних и нижних границ доверительных интервалов можно сделать вывод, что параметры и с вероятностью 95% будут находиться в указанных границах интервалов.

Задача 3.2. Построить полулогарифмическую модель вида: y=a0+a1lnx по данным: Определить характеристики модели.

Характеристики модели:

1) модель (коэффициенты до 2-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.

Решение:

Таблица 3.3

х	у
1	31	0	0	0
2	34,4	0,69	0,48	23,736
3	36,4	1,10	1,21	40,04
4	37,5	1,39	1,93	52,125
5	39,6	1,61	2,59	63,756
6	40,1	1,79	3,20	71,779
21	219	6,58	9,41	251,436

Определим а₀ и а₁ для построения модели:

а₁ = = = 5,14

а₀ = = = 30,8631

Далее, найдя коэффициенты, можем построить модель: = 30,8631 + 5,14lnx

Для расчета индекса детерминации, а также для других показателей, построим еще одну таблицу, с промежуточными вычислениями.

Таблица 3.4 - Расчет индекса детерминации

Y	X	y?	(y-yЇ)І	(y-y^)І
31	1	30,8631	30,25	0,0187
34,4	2	34,4097	4,41	0,0001
36,4	3	36,5171	0,01	0,0137
37,5	4	38,0077	1	0,2578
39,6	5	39,1385	9,61	0,212
40,1	6	40,0631	12,96	0,0013
219	21	219,0685	58,24	0,5036
Ср.знач.	36,5	3,5

По найденным значениям определим индекс детерминации:

0,99

Получается, что связь между признаком Y и фактором X высокая и прямая.

Определим стандартную ошибку:

0,1259 (3.1.9)

Проведем оценку значимости уравнения регрессии с помощью F-критерия Фишера:

По таблице Фишера определим критическое значение F-критерия при уровне значимости б=0,05 и числе степеней свободы k₁= 1, k₂= n - 2 = 6 - 2 = 4. F_кр=7,71.

Так как наблюдаемое значение критерия больше табличного F = 396 ? F_кр= 7,71 следовательно, с вероятностью 0,95 уравнение регрессии считается статистически значимым.

Задача 3.3. Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.5.

Таблица 3.5. Динамика коэффициента рождаемости в Пензенской области

Год	2000	2001	2002	2003	2004	2005
Коэффициент рождаемости	7,5	7,5	8,0	8,4	8,6	8,4
Год	2006	2007	2008	2009	2010	2011
Коэффициент рождаемости	8,6	9,7	10,2	10,3	10,2	10,1
Год	2012	2013	2014	2015	2016
Коэффициент рождаемости	10,8	10,6	10,8	10,7	10,2

Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г.

Решение:

1) Построим линейную модель У(t) = а₀+ а_it, параметры которой:

;

Таблица 3.6 - Промежуточные расчеты.

Год (t)	У	t - t?	(t-tЇ)І	y-y?	(t-t?)(y-y?)	ур	y-y?	(y-y^)І		(y-yЇ)І
1	7,5	-8	64	-1,947	15,576	7,692	-0,192	0,03694	2,56	3,791
2	7,5	-7	49	-1,947	13,629	7,912	-0,412	0,16933	5,49	3,791
3	8	-6	36	-1,447	8,6824	8,131	-0,131	0,01713	1,64	2,094
4	8,4	-5	25	-1,047	5,2353	8,350	0,050	0,00248	0,59	1,096
5	8,6	-4	16	-0,847	3,3882	8,570	0,030	0,00092	0,35	0,718
6	8,4	-3	9	-1,047	3,1412	8,789	-0,389	0,15132	4,63	1,096
7	8,6	-2	4	-0,847	1,6941	9,008	-0,408	0,16671	4,75	0,718
8	9,7	-1	1	0,2529	-0,253	9,228	0,472	0,22307	4,87	0,064
9	10,2	0	0	0,7529	0	9,447	0,753	0,56686	7,38	0,567
10	10,3	1	1	0,8529	0,8529	9,666	0,634	0,40145	6,15	0,728
11	10,2	2	4	0,7529	1,5059	9,886	0,314	0,09872	3,08	0,567
12	10,1	3	9	0,6529	1,9588	10,105	-0,005	0,00003	0,05	0,426
13	10,8	4	16	1,3529	5,4118	10,325	0,476	0,22610	4,40	1,83
14	10,6	5	25	1,1529	5,7647	10,544	0,056	0,00315	0,53	1,329
15	10,8	6	36	1,3529	8,1176	10,763	0,037	0,00135	0,34	1,83
16	10,7	7	49	1,2529	8,7706	10,983	-0,283	0,07986	2,64	1,57
17	10,2	8	64	0,7529	6,0235	11,202	-1,002	1,00400	9,82	0,567
153	160,6	0	408	0	89,5	160,6	0	3,14943	59,281	22,78
9	9,4471

0,219 , соответственно =9,4471-0,219·9 = 7,476

Отсюда уравнение линейного тренда принимает окончательный вид: y?_t=0,219t +7,476

Положительное значение коэффициента при t указывает на то, что имеется тенденция роста, причем величина роста ежегодно составляет в среднем 0,219 единиц. Определим коэффициент детерминации:

0,8617

- т.е. в 86,17 % случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 13.83% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

Определим стандартную ошибку:

0,4582 (3.1.9)

Оценим значимость модели с помощью критерия Фишера:

93,46.

Табличное значение критерия со степенями свободы k₁=1 и k₂=15, F_табл = 4,54. Поскольку F > F_табл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

Определим ошибку аппроксимации:

100% = 3,492%.

В среднем, расчетные значения отклоняются от фактических на 3,49%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Спрогнозируем коэффициент рождаемости в 2017:

y?₂₀₁₇=0,219·18+7,476 = 11,4.

Задача 3.4. Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = а_о + а₁t; lnу = а_о + а₁t; у = 1/(а_о + а₁t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.

Таблица 3.7. Курс рубля к доллару

Месяц и год

январь

2017

февраль

март

апрель

май

июнь

июль

август

2017

Цена одного доллара

59,6

58,5

58,0

56,4

57,0

57,9

59,7

59,6

Решение:

1) Построим уравнение линейного тренда курса доллара, которое имеет вид: , где и найдем из системы нормальных уравнений. (МНК) :

Таблица 3.8 - промежуточные расчеты

T	Цена (y)	t-t?	y-y?	(t-t?)( y-y?)	(t-tЇ)І	y?	y-y?	(y-y^)І		(y-y?)І
1	59,6	-3,5	1,2625	-4,41875	12,25	58,075	1,525	2,325625	2,5587	1,5939
2	58,5	-2,5	0,1625	-0,40625	6,25	58,15	0,35	0,1225	0,59829	0,0264
3	58	-1,5	-0,3375	0,50625	2,25	58,225	-0,225	0,050625	0,38793	0,1139
4	56,4	-0,5	-1,9375	0,96875	0,25	58,3	-1,9	3,61	3,36879	3,7539
5	57	0,5	-1,3375	-0,66875	0,25	58,375	-1,375	1,890625	2,41228	1,7889
6	57,9	1,5	-0,4375	-0,65625	2,25	58,45	-0,55	0,3025	0,94991	0,1914
7	59,7	2,5	1,3625	3,40625	6,25	58,525	1,175	1,380625	1,96817	1,8564
8	59,6	3,5	1,2625	4,41875	12,25	58,6	1	1	1,67785	1,5939
36	466,7	0	0	3,15	42	466,7	0	10,6825	13,92196	10,91875
Сред. знач 4,5	58,3375					58,3375

0,075. тогда : a₀= 58,3375 - 4,5?0,075 = 58

Таким образом, линейная модель будет выглядеть как:

Определим коэффициент детерминации:

0,0216.

Определим стандартную ошибку: 1,3343.

Определим значимость модели используя критерий Фишера:

0,1325.

Табличное значение критерия со степенями свободы k₁=1 и k₂=6, F_табл = 5,99. Поскольку фактическое значение F < F_табл, то коэффициент детерминации статистически не значим (Найденная оценка уравнения регрессии статистически не надежна).

Вычислим ошибку аппроксимации:

1,74

- в среднем, расчетные значения отклоняются от фактических на 1,74%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Осуществим прогноз на декабрь 2017 года:=12·0,075+58=58,9

Построим регрессионную модель вида: lnу = а_о + а₁t. Все промежуточные расчеты приведем в таблице 3.2.2. Для удобства расчета проведем замену: lny=У

Таблица 3.9 - Промежуточные расчеты для модели lnу = а_о + а₁t

t	Цена (y)	У	tІ	tУ
1	59,6	4,0877	1	4,0877	4,061592	0,02611	0,02165	0,0006817	0,000468723	0,6387455
2	58,5	4,069	4	8,138	4,062865	0,00613	0,00295	0,00003758	0,0000087025	0,15065127
3	58	4,0604	9	12,1812	4,064139	-0,00374	-0,00565	0,00001399	0,0000319225	0,09210915
4	56,4	4,0325	16	16,13	4,065413	-0,03291	-0,03355	0,00108307	0,001125603	0,81611903
5	57	4,0431	25	20,2155	4,066687	-0,02359	-0,02295	0,000556488	0,000526703	0,58346318
6	57,9	4,0587	36	24,3522	4,067961	-0,00926	-0,00735	0,0000857	0,00005402	0,22815187
7	59,7	4,0893	49	28,6251	4,069235	0,02007	0,02325	0,000402805	0,000540563	0,49079305
8	59,6	4,0877	64	32,7016	4,070508	0,01719	0,02165	0,000295496	0,000468723	0,42052988
?36	466,7	32,5284	204	146,4313	32,5284	0	0	0,003156901	0,00322496	3,42056294
Ср. знач 4,5	58,3375	4,06605	25,5	18,3039	4,06605

0,00127;

a₀= 4,06605 - 4,5?0,00127 = 4,0603.

Таким образом, модель будет иметь вид:

lny = 0,00127t + 4,0603

Определим коэффициент детерминации:

0,0211.

Определим стандартную ошибку:

0,0299.

Определим значимость модели, используя критерий Фишера:

0,1293.

Табличное значение критерия со степенями свободы k₁=1 и k₂=6, F_табл = 5.99. Поскольку фактическое значение F < F_табл, то коэффициент детерминации статистически не значим (найденная оценка уравнения регрессии статистически не надежна).

Вычислим ошибку аппроксимации:

0,4276

Осуществим прогноз на декабрь: 58,9

Построим регрессионную модель вида: у =1/(а_о + а₁t). Все промежуточные расчеты приведем в таблице 3.2.3. Для удобства расчета проведем замену : 1/у = У

Таблица 3.10 - Промежуточные расчеты для модели у = 1/(а_о + а₁t)

t	Цена (y)	У	tІ	tУ		y-y?	(y-y^)І
...

курсовая работа "Общая теория статистики" скачать

Подобные документы

Теория статистических методов
Предмет статистики. Метод статистики. Расчёт показателей вариации. Ряды динамики. Выборочное наблюдение. Для общеэкономических специальностей, статистика является основой для разработки и совершенствования методов экономического анализа.

курсовая работа [134,4 K], добавлен 21.10.2004
Расчет основных статистических величин
Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.

контрольная работа [80,0 K], добавлен 05.06.2012
Общая и социально-экономическая статистика
Предмет и метод статистики. Группировка и ряд распределения. Абсолютные, относительные, средние величины, показатели вариации. Выборочное наблюдение, ряды динамики. Основы корреляционного и регрессионного анализа. Статистика населения и рынка труда.

методичка [2,2 M], добавлен 16.02.2011
Статистика рынка труда России
Статистика занятости и безработицы. Определение численности и состава занятых лиц. Выборочное наблюдение, сводка и группировка, ряд распределения. Характеристика статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки.

курсовая работа [180,5 K], добавлен 10.08.2009
Предмет, метод и задачи статистики
Статистика как общественная наука, изучающая количественную сторону массовых общественных явлений с целью выявления их особенностей и закономерностей развития. Понятия, предмет, задачи, система статистических показателей. Организация статистики в России.

реферат [16,8 K], добавлен 04.06.2010
Средние величины и показатели вариации
Сущность и разновидности средних величин в статистике. Определение и особенности однородной статистической совокупности. Расчет показателей математической статистики. Что такое мода и медиана. Основные показатели вариации и их значение в статистике.

реферат [162,6 K], добавлен 04.06.2010
Статистические методы
Определение термина "статистика" и история ее возникновения. Взаимосвязь статистики с другими науками. Виды статистических исследований. Предназначение корреляционно-регрессионного анализа и выборочного метода. Методика анализа сезонных колебаний.

реферат [33,1 K], добавлен 10.01.2015
Статистика браков в Амурской области
Сущность статистического изучения браков. Система статистических показателей, используемых в изучении браков в Амурской области. Анализ браков с помощью расчета средних величин и показателей вариации. Корреляционно–регрессионный анализ структуры браков.

курсовая работа [895,1 K], добавлен 20.03.2015
Статистика как наука
Целостная система научных дисциплин: общая теория статистики, социально-экономическая статистика, математическая статистика и теория вероятности, международная и отраслевая статистика. Формы, виды, способы наблюдения. Процесс статистического исследования.

эссе [18,7 K], добавлен 17.10.2014
Статистическое исследование фактических данных
Статистика денежного обращения, инфляции и цен. Построение сводки и ряда распределения. Характеристика используемых статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки. Корреляционный анализ количественных признаков.

контрольная работа [564,1 K], добавлен 13.09.2012
Составление статистических сводок
Понятие статистики как науки, предмет и методы ее изучения, основные цели и задачи. Категории статистики и ее показатели, способы представления результатов. Сущность и классификация относительных и средних величин. Понятие ряда динамики и его анализ.

реферат [192,6 K], добавлен 15.05.2009
Количественные методы в экономике и управлении
Организация статистики и источники статистических данных. Наблюдение по способу регистрации данных. Выявление и изучение связи и взаимозависимости между явлениями. Система статистических показателей. Определение средних и относительных величин.

контрольная работа [53,6 K], добавлен 27.01.2011
Основные понятия статистики
Абсолютные и относительные статистические величины. Понятие и принципы применения средних величин и показателей вариации. Правила применения средней арифметической и гармонической взвешенных. Коэффициенты вариации. Определение дисперсии методом моментов.

учебное пособие [276,4 K], добавлен 23.11.2010
Абсолютные и относительные величины. Средние величины и показатели вариации
Виды и применение абсолютных и относительных статистических величин. Сущность средней в статистике, виды и формы средних величин. Формулы и техника расчетов средней арифметической, средней гармонической, структурной средней. Расчет показателей вариации.

лекция [985,6 K], добавлен 13.02.2011
Возникновение и развитие статистики в России
История развития статистики в России. Деятельность видных ученых в развитии статистики как науки. Основные задачи статистики. Общая теория статистики, экономическая статистика, социальная статистика. Отраслевая статистика.

реферат [23,9 K], добавлен 12.12.2006
Общая теория статистики
Основные категории и понятия теории статистики. Ряды динамики и их применение в анализе социально-экономических явлений. Сводка и группировка статистических данных. Общая характеристика системы национальных счетов. Статистика рынка товаров и услуг.

курс лекций [68,4 K], добавлен 08.08.2009
Статистика рождаемости в Амурской области
Понятие статистического изучения рождаемости населения. Анализ рождаемости в Амурской области за 1999-2008 годы. Система показателей рождаемости. Показатели рождаемости для условного и реального поколения. Расчет средних величин и показателей вариации.

курсовая работа [240,1 K], добавлен 26.11.2009
Предмет, методы и задачи социально-экономической статистики
Социально-экономическая статистика как общественная наука. Ее сущность и основные методы, применяемые в ней. Проблемы интеграции отечественной статистики в международную статистику. Задачи социально-экономической статистики в условиях рыночной экономики.

лекция [17,4 K], добавлен 14.03.2010
Экономико-статистический анализ оплаты труда
Определение сущности оплаты труда, ее показателей и методики расчетов. Описание индексного метода статистики и его роли в изучении заработной платы. Изучение техники проведения группировки. Определение показателей вариации ряда распределения и др.

контрольная работа [41,7 K], добавлен 27.01.2011
Общая теория статистики
Статистический анализ производства и себестоимости. Использование формул средних величин в решении задач, вычисление дисперсии, среднего квадратичного отклонения, коэффициента вариации, предельной ошибки выборки. Практическое применение индексного метода.

контрольная работа [59,3 K], добавлен 26.06.2009

Другие документы, подобные "Общая теория статистики"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.