Анализ эмпирического распределения. Проведение выборочного наблюдения

Графическое и табличное представление вариационного ряда распределения. Вычисление выборочных статистик для количества интервалов k=9. Сглаживание эмпирического распределения, проверка гипотезы о законе распределения. Проведение выборочного наблюдения.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 01.06.2014
Размер файла 1,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Санкт-Петербургский государственный политехнический университет

Курсовой проект

Анализ эмпирического распределения. Проведение выборочного наблюдения

Ивановой Екатерине Анатольевне

Исходные данные к проекту (работе): Методические рекомендации для выполнения курсовой работы по дисциплине «Статистика»

Содержание пояснительной записки (перечень подлежащих разработке вопросов): введение, основная часть, анализ эмпирического распределения, исходные данные ,графическое и табличное представление вариационного ряда распределения, вычисление выборочных статистик для количества интервалов k=9,сглаживание эмпирического распределения, проверка гипотезы о законе распределения, проведение выборочного наблюдения, получение выборок, графическое представление результатов выборочного наблюдения, заключение, список использованных источников.

Перечень графического материала (с указанием обязательных чертежей и плакатов): Таб.1 Статистическая совокупность (N=167), Таб.2 Ранжированный ряд распределения (N=167) Рис.3 Кумуляты распределения при k=8, k=9, k=10, k=12, k=14, Рис.4 Гистограммы распределений с наложенными на них кривыми нормального распределения с числом интервалов k=8, k=9, k=10, k=12, k=14, Таб.5 Показатели вариационного ряда, Рис.1.12 Графическое сравнение результатов сплошного и выборочного наблюдения вариационный ряд интервал эмпирический

В курсовом проекте проводится анализ статистического распределения, вычисляются основные выборочные статистики, распределение представляется графически и аналитически

Введение

Ряд распределения - это распределение единиц совокупности по значению того или иного признака.

Анализ ряда распределения включает:

- Табличное и графическое представление ряда распределения;

- Расчёт и анализ выборочных статистик;

- Характеристику формы распределения;

- Выбор теоретического распределения, которому соответствует изучаемое эмпирическое.

Одна из важнейших целей изучения рядов распределения состоит в том, чтобы выявить закономерность распределения и определить ее характер.

1. Основная часть

1.1. Анализ эмпирического распределения

Анализ распределений направлен на выявление закономерности изменения частот в зависимости от значений варьирующего признака и анализ различных характеристик изучаемого распределения. Прежде, чем приступить к вычислению специальных статистических показателей, необходимо из исходной совокупности исключить единицы, не подчиняющиеся общей закономерности распределения, так называемые выбросы. Выбросы - это значения признака, резко отличающиеся как в большую, так и в меньшую сторону, от значений признака у основной части единиц совокупности. Для удобства локализации и устранения выбросов необходимо ранжировать исходные данные.

1.1.1. Графическое и табличное представление вариационного ряда распределения

Вариационным называется ряд распределения, построенный по количественному признаку. Он может быть представлен в графическом и табличном виде. Табличное представление позволяет не только выявить ту или иную закономерность распределения, но и подробно охарактеризовать структуру изучаемой совокупности.

Объем статистической совокупности равен 167. Для дальнейшей работы вариационного ряда распределения необходимо ранжировать исходные данные.

Таблицы вариационных рядов строятся по принципам группировки.

Определим количество групп по «STURGES's»-формуле:

k = 1 + 3.322lgN, (1.1)

где k - число групп; N - объем совокупности.

Ранжированный ряд распределения представлен в таблице 2.1.

Таблица 1.2

Ранжированный ряд распределения (N=167)

№ п/п

Var1

№ п/п

Var1

№ п/п

Var1

№ п/п

Var1

№ п/п

Var1

№ п/п

Var1

1

162.9

31

244.5

61

271.7

91

293.8

121

323.9

151

351.6

2

176.9

32

244.8

62

272.8

92

294.4

122

325.9

152

354.0

3

188.9

33

246.0

63

273.2

93

294.6

123

326.0

153

355.0

4

191.9

34

247.8

64

274.1

94

295.4

124

326.1

154

367.7

5

192.1

35

248.8

65

277.0

95

296.1

125

328.4

155

368.2

6

198.3

36

249.8

66

277.0

96

298.0

126

328.6

156

371.1

7

200.6

37

250.2

67

277.4

97

298.5

127

329.6

157

377.9

8

200.6

38

250.8

68

277.6

98

298.6

128

331.6

158

379.1

9

203.9

39

251.1

69

278.3

99

299.3

129

331.6

159

380.6

10

203.9

40

251.2

70

279.3

100

299.3

130

333.7

160

389.0

11

209.8

41

251.8

71

280.3

101

302.7

131

334.6

161

393.6

12

215.1

42

253.7

72

280.7

102

302.9

132

336.7

162

410.0

13

215.5

43

256.1

73

282.0

103

303.9

133

336.8

163

412.7

14

216.6

44

257.7

74

283.8

104

307.2

134

337.0

164

414.5

15

218.3

45

258.4

75

284.1

105

307.9

135

337.5

165

415.9

16

230.3

46

260.1

76

284.9

106

309.6

136

338.8

166

424.0

17

233.3

47

260.6

77

285.1

107

310.4

137

339.1

167

437.9

18

234.4

48

260.9

78

286.0

108

311.4

138

339.9

19

235.0

49

262.5

79

286.5

109

312.5

139

340.1

20

236.5

50

262.7

80

286.6

110

312.7

140

342.4

21

236.7

51

264.6

81

286.7

111

312.8

141

343.5

22

237.3

52

265.2

82

286.8

112

313.3

142

344.6

23

237.9

53

265.3

83

287.2

113

314.7

143

345.6

24

238.3

54

265.3

84

287.4

114

315.2

144

347.6

25

239.2

55

267.1

85

287.9

115

316.3

145

347.7

26

241.9

56

268.1

86

288.1

116

318.1

146

348.5

27

242.3

57

268.6

87

289.5

117

320.3

147

349.8

28

243.9

58

270.5

88

290.3

118

320.7

148

350.0

29

243.9

59

270.6

89

292.0

119

320.9

149

350.9

30

244.0

60

271.5

90

293.7

120

323.7

150

351.1

С помощью программы получаем табличные представления вариационного ряда распределения, построенные с использованием разного числа интервалов k=8, k=9, k=10, k=12, k=14 (рис.1.1).

а) k=8

б) k=9

в) k=10

г) k=12

д) k=14

Рисунок 1.1. Число интервалов k=8, k=9, k=10, k=12, k=14

В таблицах первая графа (From…to…) содержит интервалы значений статистической совокупности.

Count - абсолютные частоты (fi), т.е. число единиц совокупности, обладающих указанным значением.

ComulativeCount - накопленные абсолютные частоты, получаемые последовательным суммированием частот по группам.

Percent - частости (относительные частоты wi, выражаются в процентах), рассчитываются:

wi- доля каждой группы в общем объеме совокупности.

ComulativePercent - накопленные частости - это результат последовательного суммирования относительных частот по группам, итоговая сумма, очевидно, равна 100%.

Табличное представление вариационного ряда позволяет получить подробную информацию о составе и структуре изучаемой совокупности, т.е. определить какое количество единиц изучаемой совокупности обладает тем или иным значением признака и какова доля этой группы единиц в общем объеме совокупности, а также выявить закономерность изменения частот.

С помощью программы, на основе таблиц, строятся графики, наглядно представляющие закономерность распределения анализируемой статистической совокупности. В нашем случае, на основе задания, строим полигон (рис. 1.2.), кумуляту (рис. 1.3.) и гистограмму (рис. 1.4) в относительных (wi) частотах.

а) k=8

б) k=9

в) k=10

г) k=12

д) k=14

Рисунок 1.2. Полигоны распределения при k=8, k=9, k=10, k=12, k=14

а) k=8

б) k=9

в) k=10

г) k=12

д) k=14

Рисунок 1.3. Кумуляты распределения при k=8, k=9, k=10, k=12, k=14

а) k=8

б) k=9

в) k=10

г) k=12

д) k=14

Рисунок 1.4. Гистограммы распределений с наложенными на них кривыми нормального распределения с числом интервалов k=8, k=9, k=10, k=12, k=14

На основе построенных графиков делаем вывод, что наиболее приемлемый вариант для данного вида статистики при k=9, так как кривая нормального распределения, обозначенная на гистограмме, захватывает все вершины.

1.1.2 Вычисление выборочных статистик для количества интервалов k=9

Статистический анализ вариационных рядов распределения предполагает расчет характеристик центра распределения, его структуры, оценку степени вариации и дифференциации изучаемого признака, изучение формы распределения.

В качестве показателей центральной тенденции распределения используются: среднее арифметическое значение, мода и медиана. Основными показателями вариации являются: размах вариации, дисперсия, среднее квадратическое отклонение, коэффициент вариации. Для характеристики структуры распределения используются следующие показатели: медиана, квартили, децили и прочие перцентили. Изучение формы распределения предполагает оценку асимметрии и эксцесса (куртозиса). Перечисленные показатели имеют самостоятельное аналитическое значение, поскольку отражают разные свойства изучаемой совокупности, а все вместе они позволяют получить комплексную характеристику эмпирического распределения.

С помощью программы получаем все перечисленные показатели (рис. 1.5).

Рисунок 1.5. Показатели вариационного ряда

Средние показатели

Средняя величина - это обобщающий показатель статистической совокупности, который погашает индивидуальные различия значений статистических величин, позволяя сравнивать разные совокупности между собой.

Средняя арифметическая ( в табл.Mean) относится к степенным средним.

В таблице рассчитана простая средняя величина 292,0964 по формуле:

Структурные средние применяются для изучения внутреннего строения рядов распределения значений признака. К структурным средним относятся Мода, Медиана, Квартили.

1) Мода (в табл.Mode) - наиболее часто повторяющееся значение признака. Определяется непосредственно по исходных данным (запись в таблице Multipleозначает, что распределение имеет не одну Моду).

2) Медиана (в табл. Median) - величина признака, которая делит упорядоченную последовательность его значений на две равные по численности части.

У нас N=167, нечетное число. Таким образом:

Me = x84= 287,40

3) Нижний (первый) квартиль (в табл.Lower)

Где floor - округление до ближайшего целого;

Ceiling - округление до ближайшего большего.

Таким образом, в нашем случае i=42, j=42.

Q1=(253,7+253,7)/2=253,7

4) Верхний (третий) квартиль (в табл.Upper)

i=126; j=125

Q3=(328,6+328,6)/2=328,6

Показатели вариации

Абсолютные:

R - размах вариации. Разность между максимальным и минимальным значениями X из имеющихся в изучаемой статистической совокупности:

у2- средний квадрат отклонений значений переменной от среднего арифметического значения (дисперсия - в таблице Variance).

у- среднее квадратическое отклонение (в табл. Std.Dev).

Относительные:

V - относительный показатель вариацииявляется наиболее распространенным показателем колеблемости, используемым для оценки типичности средних величин.

Рассчитывается по формуле:

В статистике совокупности, имеющие коэффициент вариации больше 30-35 %, принято считать неоднородными.

В нашем случае коэффициент вариации=18%, таким образом, совокупность является однородной.

As - коэффициент асимметрии оценивает симметричность эмпирического распределения относительно вертикальной оси симметрии, проходящей через среднюю арифметическую (в табл. Skewness). Значение коэффициента 0,224374 означает, что распределение имеет незначительную правостороннюю асимметрию.

Kurtosis - коэффициент эксцесса. Оценивает отклонения формы эмпирического распределения от идеального модального распределения. Значение коэффициента 0,017441.

1.1.3 Сглаживание эмпирического распределения. Проверка гипотезы о законе распределения

Процедура выравнивания, сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, определяемыми по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сопоставления эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретических распределении.

С помощью программы проводится расчет для нескольких типов сглаживания (нормальное, лог-нормальное и прямоугольное сглаживание представлены на рисунках 1.6, 1.7 и 1.8 соответственно).

Рисунок 1.6. Проверка гипотезы о нормальном распределении переменной Var1.

Рисунок 1.7. Проверка гипотезы о лог-нормальном распределении переменной Var1

Рисунок 1.8. Проверка гипотезы о прямоугольном распределении переменной Var1

а)

б)

в)

Рисунок 1.9. Гистограммы и расчетные кривые а) нормального распределения; б) лог-нормального распределения; в) прямоугольного распределения для переменной Var1.

В шапке таблиц и графиков находятся следующие показатели:

Chi-SquareTest - расчетное значение критерия Пирсона;

d.f.(adjusted) - уточненное значения числа степеней свободы:

Гдеk - число интервалов эмпирического распределения (вариационного ряда);

l- число параметров теоретического распределения, определяемых по опытным данным (например, в случае нормального распределения число оцениваемых по выборке параметров l=2, математическое ожидание и дисперсия).

Таблица 1.3

Результаты решения задачи сглаживания

Тип распределения

Число степеней свободы (r)

Расчетное значение критерия

Табличное значение критерия

(расчетное значение уровня значимости)

Нормальное

4

4,87120

9,488

0,30077

Логнормальное

4

7,00026

9,488

0,13587

прямоугольное

6

85,79042

12,59

0,00000

Принятие решения о справедливости гипотезы о законе распределения можно осуществить, ориентируясь на эмпирическое значение критерияч02 , либо на расчетное значение вероятности (расчетный уровень значимости) (P2б;r>ч02) . Первое сравнивается с табличным значением ч2б;r, второе - с принятым уровнем значимости (примем б=0,05).

Окончательные выводы по проверке гипотез о законе распределения:

1. Так как

ч02=4,8712020.05;4=9,488 и

P20.05;4 02)=0,30077<б=0.05,

то гипотеза о нормальном распределении переменной Var1 противоречит статистическим данным.

2. Так как

ч02=7,0002620.05;4=9,488 и

P20.05;4 02)=0,13587<б=0.05,

то гипотеза о лог-нормальном распределении переменной Var1 противоречит статистическим данным.

3. Так как

ч02=85,7904220.05;6=12,59 и P20.05;6 02)=0.0000<б=0.05,

то гипотеза о прямоугольном распределении переменной Var1 противоречит статистическим данным.

1.2 Проведение выборочного наблюдения

Предполагаем, что имеющиеся исходные данные представляют собой полностью определенную генеральную совокупность.

Задача: оценить генеральную среднюю и генеральную дисперсию по выборке.

1.2.1 Получение выборок

Реализуется одна выборка большого объема и пять малых выборок.

Определение объема большой выборки проводится по следующей формуле:

Где N=167 (объем генеральной совокупности);

t=1,96 - параметр нормального распределения (находится по таблицам интегральной функции нормального распределения в соответствии с заданным уровнем доверительной вероятности);

у= 52,62363 -среднее квадратическое отклонение в генеральной совокупности;

Д = 5% от генеральной средней - предельная ошибка выборки. Устанавливает точность результатов выборочного наблюдения;

Генеральная средняя = 292,0964

Таким образом n=120.

Объемы малых выборок n1=n2=n3=n4=n5=8.

С помощью процедуры формирования случайных выборок сформированы 6 выборок (Выборки 1, 2, 3, 4, 5 - малые; Выборка 6 - большая) - рис. 1.10.

Рисунок 1.10. Сформированные случайные выборки

На рисунке первый столбец - это генеральная совокупность.

Далее производится статистическая обработка результатов выборочного наблюдения.

При проведении статистической обработки задаются следующие параметры:

Генеральная средняя = 292,0964 (из первой части работы);

Уровень значимости критерия б=0,05;

Заданная доверительная вероятность P=0.95.

Результаты статистической обработки представлены на рисунке 1.11.

Рисунок 1.11. Результаты статистической обработки результатов выборочного наблюдения

В первом столбце таблицы результатов представлены значения переменных (выборок):

Mean - значения выборочных средних;

Std.Dv. - среднее квадратическое отклонение;

N - объем выборок;

Std.Err. - средняя ошибка выборки;

Confidence -95% - нижняя граница доверительного интервала при вероятности 95%;

Confidence +95% - верхняя граница доверительного интервала при вероятности 95%;

ReferenceConstant- значение генеральной средней из первой части работы;

t-value- расчетное значение t-критерия для проверки гипотезы о значении генеральной средней;

df - число степеней свободы (определяется как n-1);

p- расчетный уровень значимости t-критерия.

1.1.2. Графическое представление результатов выборочного наблюдения

Рисунок 1.12. Графическое сравнение результатов сплошного и выборочного наблюдения

График наглядно показывает, что доверительные интервалы, построенные по всем выборкам, накрывают генеральную среднюю.

Заключение

В работе выполнен анализ эмпирического наблюдения и проведение выборочного наблюдения.

Получены показатели вариационного ряда.

Коэффициент вариации не превысил 35%, следовательно, изучаемую совокупность признаем однородной. Величина коэффициента асимметрии указывает на небольшую правостороннюю асимметрию относительно вертикальной оси.

Список использованных источников

1. Общая теория статистики М.Р.Ефимова, Е.В.Петрова, В.Н.Румянцева. 2005.

2. Учебное пособие. Статистика. Методы анализа распределений. Выборочное наблюдение. Н.В. Куприенко, О.А. Пономарёва, Д.В. Тихонов. 132 с. - 2008.

3. 3.Теория статистики /Под ред. Р.А. Шмойловой - М.: Финансы и статистика, 2003. - 560с.

4. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики: Учебник. - М.: ИНФРА-М, 2002. - 416 с.

5. Статистика.: Учебник / Под ред. проф. И.И. Елисеевой - М.: ООО “ВИТРЭМ”, 2002. - 448с.

6. Экономическая статистика. 2-е изд., доп.: Учебник / Под ред. Ю.Н. Иванова. - М.: ИНФРА-М, 2002. - 480 с.

7. Куприенко Н.В., Пономарева О.А.

8. Статистика.. Методы анализа распределений. Выборочное наблюдение:Учебное пособие. - СПб.: Издательство СПбГПУ, 2002. - 128с.

9. Куприенко Н.В., Пономарева О.А. Методы статистического анализа динамики. Учебное пособие. - СПб.: Издательство СПбГТУ, 2001. - 111с.

Размещено на Allbest.ru

...

Подобные документы

  • Сущность статистического анализа и выборочного метода. Правила группировки данных выборочного наблюдения по величине объема инвестиций. Графическое представление вариационного ряда (гистограмма, кумулята, кривая Лоренца). Расчет асимметрии и эксцесса.

    курсовая работа [70,7 K], добавлен 26.10.2011

  • Табличное и графическое представление вариационного ряда. Определение среднестатистической численности населения в субъектах России. Характеристика форм распределения с расчетом коэффициентов асимметрии и эксцесса и применением критерия согласия Пирсона.

    курсовая работа [403,2 K], добавлен 17.11.2014

  • Проведение анализа страховой деятельности агентов в филиале ООО "Росгосстрах – Поволжье". Группировка статистических данных. Расчёт характеристик вариационного ряда. Показатели распределения и коэффициент вариации. Построение аналитической группировки.

    курсовая работа [253,3 K], добавлен 26.06.2009

  • Оформление результатов сводки и группировки материалов статистического наблюдения в виде рядов распределения (атрибутивных и вариационных). Расчет средних величин и показателей вариации, моды и меридианы. Графическое изображение статистических данных.

    контрольная работа [226,8 K], добавлен 31.07.2011

  • Цель выборочного наблюдения и формирование выборки. Особенности организации различных видов выборочного наблюдения. Ошибки выборочного отбора и методы их расчета. Применение выборочного метода для анализа предприятий топливно-энергетического комплекса.

    курсовая работа [71,7 K], добавлен 06.10.2014

  • Построение ряда распределения студентов по успеваемости, расчет локальных и накопительных частот. Проверка гипотезы о нормальном законе распределения студентов по успеваемости. Построение аналитической группировки. Расчет средней цены по трем рынкам.

    контрольная работа [55,1 K], добавлен 01.06.2010

  • Построение рядов распределения и секторной диаграммы. Графическое изображение дискретного ряда. Показатели центра распределения, к которым относятся мода, медиана, средняя арифметическая. Вычисление основных показателей вариации и формы распределения.

    контрольная работа [355,3 K], добавлен 22.12.2013

  • Понятие выборочного наблюдения. Определение объема и численности выборки. Практическое применение в статистическом анализе выборочного наблюдения. Формулы предельных ошибок выборочной доли и среднего показателя. Значения гарантийного коэффициента.

    курсовая работа [123,0 K], добавлен 11.02.2015

  • Построение таблицы и графиков ряда распределения. Показатели центра и структуры распределения. Характеристика формы распределения. Распределение показателей регионов России по показателям оборота малых предприятий. Ранжирование вариационного ряда.

    курсовая работа [344,1 K], добавлен 21.03.2014

  • Проведение уточнения величины валового внутреннего продукта региона с использованием распределения малых предприятий по объему выпуска продукции, полученной на основе десятипроцентного выборочного наблюдения. Средний размер произведенной продукции.

    задача [87,2 K], добавлен 00.00.0000

  • Интервальный ряд распределения банков по объему прибыли. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов. Расчет характеристик интервального ряда распределения. Вычисление средней арифметической.

    контрольная работа [150,6 K], добавлен 15.12.2010

  • Статистические гипотезы и методы их проверки. Закон распределения случайной величины. Математические ожидания экспоненциально распределенных выборок. Области отклонения гипотезы. Плотность нормального распределения. Плотность распределения Стьюдента.

    контрольная работа [850,5 K], добавлен 30.03.2011

  • Интервальный вариационный ряд распределения учащихся по оценкам по философии, кумулята. Гистограмма распределения учащихся. Межквартильное расстояние для не сгруппированных данных. Взвешенная дисперсия для дискретного вариационного ряда распределения.

    контрольная работа [214,6 K], добавлен 16.03.2014

  • Группировка организаций по степени износа основных фондов в виде интервалов. Расчет среднего значения, модального и медианного значения ряда. Форма распределения на основе показателей асимметрии и эксцесса. Определение степени однородности распределения.

    контрольная работа [341,6 K], добавлен 07.12.2016

  • Определение оптимального значения интервала в первом приближении. Медиана вариационного ряда. Понятие выборочного среднего. Эмпирическая (статистическая) функция распределения. Параметры для вычисления моды. Степень сродства к нормальному распределению.

    курсовая работа [169,7 K], добавлен 15.11.2014

  • Сводка, группировка данных статистического наблюдения, группировка с выделением регионов со значением показателя выше и ниже среднего. Вариационный анализ, структурные характеристики, характеристики и моделирование формы распределения вариационного ряда.

    курсовая работа [145,2 K], добавлен 11.03.2010

  • Виды и способы статистического наблюдения. Построение и анализ вариационных рядов распределения. Оценка параметров генеральной совокупности банков на основе выборочных данных. Расчет парного коэффициента корреляции и уравнения однофакторной регрессии.

    контрольная работа [712,1 K], добавлен 30.03.2014

  • Построение интервального вариационного ряда распределения стран Европы по объему импорта с Россией, выделение четырех групп стран с равными интервалами. Определение среднемесячных и среднегодовых остатков сырья, материалов, фурнитуры на складе ателье.

    контрольная работа [69,3 K], добавлен 16.11.2011

  • Трудовые ресурсы и их статистико-экономический анализ. Ряд распределения регионов по среднегодовой численности занятого населения. Индексный метод анализа. Проверка гипотезы о законе распределения регионов по среднегодовой численности занятого населения.

    курсовая работа [1,2 M], добавлен 08.05.2009

  • Рекламная деятельность как объект статистического изучения; система показателей. Использование метода выборочного наблюдения в исследовании эффективного распределения бюджета и оценке рекламной компании туристической фирмы; компьютерная обработка данных.

    курсовая работа [2,8 M], добавлен 27.03.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.