Анализ эмпирического распределения. Проведение выборочного наблюдения

Табличное и графическое представление вариационного ряда распределения. Формирование выборочных совокупностей и обработка результатов выборочных данных. Проверка статистических гипотез о значении генеральной средней и о равенстве двух выборочных средних.

Рубрика Экономика и экономическая теория
Вид лабораторная работа
Язык русский
Дата добавления 24.12.2016
Размер файла 1,6 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Федеральное государственное автономное образовательное

учреждение высшего образования

Санкт-Петербургский политехнический университет Петра Великого

Институт промышленного менеджмента, экономики и торговли

Высшая школа экономики и менеджмента недвижимости и технологий

Лабораторная работа №1

по дисциплине «Статистика»

на тему «Анализ эмпирического распределения»

Лабораторная работа №2

на тему «Проведение выборочного наблюдения»

Выполнил: студент группы 33702/3

Трегубов В.П.

Принял: доцент, к.э.н. Пономарева О.А.

Санкт- Петербург 2016

ЛАБОРАТОРНАЯ РАБОТА №1

АНАЛИЗ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ

ВВЕДЕНИЕ

В данной работе представлен комплексный анализ вариационного интервального ряда распределения.

Ряд распределения - это объединение отдельных единиц статистической совокупности в однородные группы по одному или нескольким признакам, привязанным к конкретным условиям места и времени. Признак, положенный в основу группировки, называется группировочным. Ряды распределения в зависимости от класса признака(-ов) могут быть вариационными, если строятся на основе количественного признака, либо атрибутивными.

Цель изучения рядов распределения заключается в выявлении закономерности явлений, в частности, закономерности распределения и определения характера закономерности. Как правило, закономерности наиболее отчетливо проявляются при большом объёме изучаемых совокупностей.

Цель данной работы - освоение практических навыков работы со статистическими совокупностями. В практические навыки следует включить ранжирование данных, расчет основных статистических характеристик, представление рядов распределения в виде таблиц и графиков, а также оценка соответствия эмпирического распределения тому или иному виду теоретического распределения и его выравнивание.

Исходные данные работы - показатели средних цен на вторичном рынке недвижимости в 2015 году. Данные получены из сборника Росстата Регионы России «Социально-экономические показатели». Объем исходной совокупности составляет 72 единицы (региона).

ТАБЛИЧНОЕ И ГРАФИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ВАРИАЦИОННОГО РЯДА РАСПРЕДЕЛЕНИЯ

После ранжирования исходных данных следует исключить выбросы.

Выбросы - это единицы совокупности, значения признака которых существенно отличается от основной массы значений признака в большую или меньшую сторону. Они не подчиняются закономерности, поэтому исключаются.

Ранжированные исходные данные представлены ниже:

Таблица 1 (Ранжированные исходные данные)

1

32237,67

21

43621,47

2

33180,29

22

43841,28

3

35604,24

23

44112,68

4

38240,52

24

44263,87

5

38566,81

25

44520,85

6

38792,76

26

44548,44

7

39631,98

27

44755,71

8

39745,08

28

44891,49

9

40366,45

29

45675,81

10

40909,34

30

45874,64

11

41618,35

31

46020,92

12

41830,05

32

47101,18

13

42045,83

33

47223,61

14

42209,37

34

47906,73

15

42393,8

35

48206,67

16

42501,46

36

48250,88

17

43039,38

37

48396,24

18

43197,31

38

48715,89

19

43392,38

39

49147,64

20

43497,12

40

49391,29

41

50119,6

61

61656,29

42

50277,19

62

62148,81

43

50799,28

63

62947,27

44

50845,99

64

63176,3

45

50856,6

65

63954,45

46

51647,55

66

64432,15

47

52510,97

67

66180,89

48

52840,85

68

66797,19

49

53797,99

69

76716,8

50

54476,64

70

79647,97

51

55367,32

71

81184,78

52

55643,41

72

82407,05

53

55737,33

54

55752,2

55

57360,97

56

59331,09

57

59482,62

58

59810,02

59

60384,87

60

61420,54

Чтобы выявить и исключить выбросы, на основании полученной совокупности строится график BoxPlot (рис. 1). На графике BoxPlot выбросы отмечены знаком «*». Именно эти единицы совокупности следует исключить из изучаемой совокупности.

Рис. 1 График BoxPlot (с выбросами)

Из графика отчетливо наблюдается один выброс, не подчиняющийся общей закономерности. Следовательно, данную единицу совокупности необходимо удалить из вариационного ряда распределения. После устранения выбросов график BoxPlot принимает следующий вид (рис. 2):

Рис. 2 График BoxPlot (без выбросов)

Вариационный ряд может быть представлен в виде таблицы и графиков. Табличный вид помогает установить некоторые закономерности, а для его построения требуется определить число групп в вариационном ряду. Благодаря таблице распределения можно определить количество единиц совокупности, обладающее тем или иным значением признака, а также оценить долю этой группы единиц в общем объеме совокупности.

Для определения числа групп используется формула Стерджеса:

Где К - число групп, N - число единиц совокупности

Однако формула Стерджеса не применима к данному вариационному ряду, так как предназначена для совокупностей объемом более 100 единиц. В таком случае определения числа групп осуществляется исходя из прошлых группировок, если имеются соответствующие данные, либо одновременным построением группировок с разным интервалом и выбором оптимальной группировки.

Величину интервала определяем по формуле:

,

где h-величина интервала, k-число групп, xmax иxmin - максимальное и минимальное значения признака

Определяем число групп равным пяти и считаем величину группировочного шага (интервала), исходя из которого строим таблицу (таблица 2).

=10 033,88

Таблица 2 (Таблица вариационного ряда)

Прежде, чем продолжить анализ полученного вариационного ряда, нужно проверить таблицу распределения на соответствие требованиям, а именно:

- отсутствие пустых и малонаполненных групп

- одновершинность распределения

Данная таблица соответствует требованиям, поэтому утверждается как окончательный вариант.

На основе таблицы распределения можно сделать заключения, итоги. Например, описанием второй строчки будет следующее:

В 32 регионах РФ, что составляет 44% от общего числа регионов России, средняя цена на вторичном рынке недвижимости в 2015 году варьировалась в пределах от 42 271,55 руб. до 52 305,43 руб. Таким образом, в 46 регионах России, что составляет 63% от общего числа регионов, средняя цена на вторичном рынке недвижимости в 2015 году не превышала 52 305,43 руб.

Графики позволяют более наглядно оценить закономерности, выявленные в изучаемой статистической совокупности.

Рис. 3 Полигон распределения регионов России по средним ценам на вторичном рынке недвижимости в 2015 году

табличный выборочный статистический вариационный

Полигон распределения (рис. 3) наглядно демонстрирует отношение частот (регионов), обозначенных на вертикальной оси, к значениям показателя (средней цены на вторичном рынке недвижимости за 2015 год), интервалы которых указаны на горизонтальной оси. Точками на полигоне обозначены середины соответствующих интервалов.

Рис. 4 Гистограмма распределения регионов России по средним ценам на вторичном рынке недвижимости в 2015 году

Гистограмма является альтернативным способом отображения зависимостей, которые можно представить в виде полигона распределения. В отличие от полигона, в гистограмме ширина каждой колонны иллюстрирует интервал, в который заключены определенные значения показателей. Высота столбцов равна количеству регионов.

Кроме того, полигон распределения и гистограмма графически подтверждают соответствие вариационного ряда требованиям: как видно на рисунках 3, 4, в вариационном ряде соблюдено условие одновершинности, а также отсутствуют нулевые группы.

Рис. 5 Кумулятараспределения регионов России по средним ценам на вторичном рынке недвижимости в 2015 году

ХАРАКТЕРИСТИКА ЦЕНТРАЛЬНОГО РАСПРЕДЕЛЕНИЯ

Различают несколько показателей центра распределения: мода, медиана, среднее значение - последний из которых является основным показателем центра распределения. Такие показатели характеризуют типичный, характерный для данной совокупности уровень признака.

В таблице ниже (таблица 3) представлены значения среднего значения и медианы.

Таблица 4 (Среднее значение и медиана)

Descriptive Statistics

Показатель

Значение средн. цен.(руб.)

Среднее значение

50821,95

Медиана

48323,56

Средние величины характеризуют совокупность в целом, но при этом рассчитываются на единицу совокупности. Они отражают типический (характерный) уровень признака совокупности в конкретных условиях места и времени. Рассчитывается среднее значение по формуле простой арифметической:

где n- объем совокупности, а xi - значение признака у i-ой единицы совокупности.

Таким образом, средняя цена на вторичном рынке недвижимости в РФ в 2015 году составила 50 821,95 руб.

Медиана - это показатель, делящий упорядоченный вариационный ряд на две равные части, то есть отражает значение признака вариационного ряда в его центре.

Исходя из значения медианы, можно сделать вывод, что в 50% регионов значение средней цены на вторичном рынке жилья в 2015 году не превышало 48 323,56 руб.

Мода - это значение признака, который встречается в совокупности чаще всего. Мода рассчитывается по формуле:

где - нижняя граница модального интервала, величина группового интервала, - частота модального интервала, и - частота интервала предшествующего и следующего за модальным.

= 47271,55

Наиболее частое значение средней цены на вторичном рынке недвижимости в 2015 году, встречающееся во всех регионах России, равно 47 271,55 руб.

ОЦЕНКА ВАРИАЦИИ ИЗУЧАЕМОГО ПРИЗНАКА

Под вариацией подразумеваются различия в значениях признака у единиц изучаемой совокупности.

Показатели вариации бывают:

· Абсолютные

o размах вариации

o среднее линейное отклонение

o дисперсия

o среднее квадратическое отклонение

· Относительные

o коэффициент осцилляции

o относительное линейное отклонение

o коэффициент вариации

В таблице 5 представлены абсолютные и относительные показатели вариации.

Таблица 5 Показатели вариации

Descriptive Statistics

Показатель

Значения

Минимальное значение признака

32237,67

Максимальное значение признака

82407,05

Размах вариации

50169,38

Дисперсия

117913379

Стандартное отклонение

10858,79

Коэф.вариации

21,4%

Размах вариации:

= 50 169,38

где и - максимальное и минимальное значения признака совокупности

Размах вариации, разность между максимальным и минимальным значениями совокупности, составляет 50 169,38 единиц.

Дисперсия:

= 117913379

где - индивидуальное значение признака, - среднее значение признака, - вес и частота

Дисперсия содержательно не интерпретируется, но является важнейшим показателем вариации. На её основе рассчитывается ряд статистических показателей, в том числе и важнейший показатель вариации - коэффициент вариации.

Среднее квадратическое отклонение или стандартное отклонение:

= 10 858,79

Благодаря стандартному отклонению можно сделать вывод, что в 2015 году средняя цена на рынке вторичной недвижимости в регионах России отличалось от среднего по стране на 10 858,79 руб.

Программа STATISTICA не рассчитывает один из самых важных показателей вариации - коэффициент вариации. Формула для расчёта коэффициента вариации следующая:

= 21,4%

где - среднее значение признака, - среднее квадратическое (стандартное) отклонение

Коэффициент вариации оценивает степень однородности изучаемой совокупности степень значимости различий. В данном случае совокупность можно признать однородной, а различия по регионам не существенными , т.к. коэффициент вариации меньше 33%.

ХАРАКТЕРИСТИКА СТРУКТУРЫ РАСПРЕДЕЛЕНИЯ

Показателями структуры распределения являются:

· медиана

· квартили которые делят совокупность на четыре части,

· децили (10 частей)

· прочие перцентили

Перцентили выражают рамки элементов не в количестве, а в процентах. Меньшее значение признака соответствует нулевому перцентилю, наибольшее - сотому. Перцентили разбивают ранжированный ряд на определенное число частей. Чем больше изучаемая совокупность, тем на большее количество групп разбивается ранжированный ряд.

Показатели структуры представлены ниже.

Таблица 6 (Показатели структуры)

DescriptiveStatistics

Variable

Средние цены, 2015 г.

Верхний квартиль

56 556,59

Нижний квартиль

43 294,85

Межквартильный размах

13 261,74

Медиана

48 323,56

Медиана как структурный показатель делит совокупность пополам:

В 2015 году средняя цена на вторичном рынке недвижимости в 50% регионов России не превышала 48 323,56 руб.

Квартили делят ряд на 4 равные части. Выделяют нижний (25% совокупности) и верхний (75% совокупности) квартили.

Нижний квартиль:

= 43 294,85

где - нижняя граница 1 квартильного интервала, h - величина группового интервала, - частота квартильного интервала, - частота интервала предшествующего квартильному, - сумма частот.

Верхний квартиль:

= 56 556,59

где - нижняя граница 3 квартильного интервала, h - величина группового интервала, - частота квартильного интервала, - частота интервала предшествующего квартильному, - сумма частот.

Межквартильный размах характеризует, насколько максимальное значение показателя превышает минимальное у 50% единиц совокупности, находящихся в центре распределения. Именно значения, входящие в межквартильный размах, часто являются ориентиром при выборе уровня цен конкретной организации по результатам цен конкурентов.

= 13 261,74

где - верхний квартиль, - нижний квартиль

Таким образом, на основе информации о величине квартилей, можно сделать следующий вывод:

В 50% регионов России, находящихся в пределах первого и третьего квартилей, средние цены на вторичном рынке недвижимости в 2015 году варьировались от 43 294,85 до 56 556,59 руб.

ХАРАКТЕРИСТИКА ФОРМЫ РАСПРЕДЕЛЕНИЯ

Форма распределения может быть охарактеризована по таким показателям, как асимметрия и эксцесс (куртозис). Соответственно существуют коэффициенты асимметрии и эксцесса и стандартные ошибки для этих коэффициентов. Коэффициент эксцесса оценивает крутизну распределения, т.е. степень выпада вершины распределения относительно кривой нормального распределения. Эксцесс имеет смысл оценивать только тогда, когда в эмпирическом распределении присутствует несущественная асимметрия.

Таблица 7 (Показатели формы распределения)

Descriptive Statistics

Показатель

Средние цены

Коэф. асимметрии

1,02

Стандартная ошибка коэф.асимметрии

0,283

Куртозис

0,996

Стандартная ошибка куртозиса

0,559

t-статасим

3,60

Коэффициент асимметрии оценивает, насколько распределение симметрично относительно центра.

= 1,02

где - центральный момент распределения 3 порядка и он равен , - стандартное отклонение 3 степени

Стандартизованная ошибка коэффициента асимметрии:

= 0,283

Данный ранжированный ряд имеет положительную (правостороннюю) асимметрию. Рассчитывая коэффициент асимметрии, нельзя ответить на вопрос, существенна она или нет. Чтобы определить существенность асимметрии, в практике используют такой показатель, как стандартизованный коэффициент асимметрии - это отношение оцениваемой характеристики к её стандартной ошибке (t-статистика):

= 3,6

T-статистика для коэффициента асимметрии рассчитывается для того, чтобы определить, существенная асимметрия или нет. Если значение t-статистики больше или равно 3, то можно говорить о существенной асимметрии, если меньше трех, то асимметрия несущественна.
В данном случае стандартизированный коэффициент асимметрии равен 3,6, что говорит о существенной асимметрии.

Коэффициент эксцесса (куртозиса):

= 0,996

где - центральный момент распределения 4 порядка и он равен, - стандартное отклонение 4 степени

Стандартизованная ошибка эксцесса (куртозиса):

= 0,559

Стандартизованный коэффициент куртозиса:

=1,78

Куртозис оценивается для того, чтобы определить, насколько вершина эмпирического распределения смещена «вверх» или «вниз». Если t-статистика для куртозиса больше или равна 3, то можно говорить о существенной асимметрии, если меньше 3, то асимметрия незначительна. В данном ранжированном ряду распределения наблюдается значительная асимметрия , ввиду чего эксцесс не оценивается.

Итог оценки формы распределения: распределение характеризуется значительной правосторонней (положительной) асимметрией, эксцесс ввиду наличия значительной асимметрии не оценивается.

СГЛАЖИВАНИЕ ЭМПИРИЧЕСКОГО РАСПРЕДЕЛЕНИЯ. ПРОВЕРКА ГИПОТЕЗЫ О ЗАКОНЕ РАСПРЕДЕЛЕНИЯ

Процедура выравнивания, сглаживания анализируемого распределения заключается в замене эмпирических частот теоретическими, определяемыми по формуле теоретического распределения, но с учетом фактических значений переменной. На основе сопоставления эмпирических и теоретических частот рассчитываются критерии согласия, которые используются для проверки гипотезы о соответствии исследуемого распределения тому или иному типу теоретических распределении. Выбор конкретного типа распределения осуществляется исходя из самых общих соображений, опирающихся на визуальный анализ построенных графиков распределения. В практическом анализе обязательной является проверка соответствия изучаемого распределения нормальному закону распределения. Необходимость этого связана с тем, что условием применения значительного числа статистических характеристик и оценок является наличие нормального распределения.

Существуют критерии, называемые критериями согласия. Они предназначены для проверки гипотезы о нормальном распределении, и в их основе лежит сопоставление эмпирических частот с теоретическими.

Наиболее часто используемым критерием является критерий Пирсона (х2) - хи квадрат.

где - фактическая частота, - теоретическая частота.

Теоретическая частота при выравнивании по закону нормального распределения рассчитывается:

где h - величина группового интервала, П, е - математические постоянные ( П=3.14, е=2.7), t - нормальное отклонение при этом

где - значение признака, - среднее значение признака, - среднее квадратическое (стандартное) отклонение

Таблица 8 (Variable:Средниецены, 2015, Distribution: Normal (Ishodnyedannye in Workbook1.stw) Chi-Square = 4,02737, df = 1 (adjusted) , p = 0,04477)

Представленные в таблице данные можно проанализировать следующим образом.

· p- уровень значимости критерия, в данном случае p = 0,04477. Характеризует вероятность ошибки.

· Также можно рассчитать по формуле p = 1 - 0, 95 = 0,05. Данный показатель объясняет, что уверенность в достоверности полученных данных равна 95%.

· df - число степеней свободы

df = k-r-1 = 5-2-1= 2

где k - число групп, r - число параметров теоретического распределения, определяемых по опытным данным (стандартное отклонение и среднее значение для нормального закона распределения) x2ф= 4,02737

· Определяется по уровню значимости критерия и числу степеней свободы. В данной таблице число степеней свободы равно 2, а теоретический уровень значимости - 0,05, тогда табличное значение х2= 5,991.

Так как, x2ф= 4,02737 < х2= 5,991, то гипотеза о нормальном распределении переменной Средн. Цены 2015 не противоречит статистическим данным.

ЗАКЛЮЧЕНИЕ

В 32 регионах, что составляет 44 процента от общего числа регионов России, средние цены на вторичном рынке недвижимости за 2015 год варьировались в пределах от 42 271,55 до 52 305,43 рублей. В дополнение, в 46 регионах России средние цены на вторичном рынке недвижимости за 2015 год не превышали 52 305,43 рублей.

Средняя цена на вторичном рынке недвижимости в РФ в 2015 году составила 50 821,95 руб, в то время как в 50% регионов значение средней цены на вторичном рынке жилья в 2015 году не превышало 48 323,56 руб.

Разность междумаксимальным и минимальным значениями средней цены на вторичном рынке недвижимости в РФ в 2015 году составляет 50 169,38 рублей, а средняя цена в регионах РФ отличалась от средней цены по стране на 10 858,79 рублей. Совокупность, состоящую из регионов России, можно назвать однородной, так как коэффициент вариации (V), равный 21,4%, меньше 33%.

В 50% регионов России, находящихся в пределах первого и третьего квартилей, средние цены на вторичном рынке недвижимости в 2015 году варьировались от 43 294,85 до 56 556,59 руб.

Данный ранжированный ряд имеет положительную (правостороннюю) асимметрию.

Данное распределение переменной Средн. Цены 2015 соответствует нормальному распределению.

ЛАБОРАТОРНАЯ РАБОТА №2

ПРОВЕДЕНИЕ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ

ВВЕДЕНИЕ

Целью лабораторной работы является освоение методики организации и проведения выборочного наблюдения, статистических методов и методов компьютерной обработки полученной информации, а также методов оценки параметров генеральной совокупности на основе выборочных данных.

Приступая к работе, необходимо дать определение выборочному наблюдению, перечислить его преимущества и области применения.

Выборочное наблюдение - это вид несплошного наблюдения, при котором обследуются не все единицы совокупности, а лишь определенным образом отобранная их часть. Вся совокупность единиц, из которой осуществляется отбор, называется генеральной, а единицы отобранные для непосредственного наблюдения, представляют собой выборочную совокупность, или просто выборку. Отбор из генеральной совокупности проводится так, чтобы на основе выборки можно было получить достаточно точное представление об основных параметрах совокупности в целом.

Выборочный метод имеет ряд преимуществ:

· экономия времени, финансовых, трудовых и материальных затрат

· повышается оперативность получения статистической информации

· иногда является единственно возможным способом наблюдения (в ряде случаев, когда сплошное наблюдение связано с уничтожением или порчей обследуемых единиц).

Преимущество выборочного метода наблюдения по сравнению с другими видами несплошного наблюдения заключается в том, что он позволяет с определенной вероятностью оценить параметры генеральной совокупности. Реализовать это преимущество можно с помощью принципа случайного отбора, который предполагает, что на включение единицы генеральной совокупности в выборку не может повлиять какой-либо иной фактор кроме случая. Случайность попадания единиц в выборочную совокупность обеспечивает репрезентативность выборки (то есть то, насколько она представительна в генеральной совокупности) и объективность выборочного наблюдения.

Далее целесообразно перечислить основные способы отбора единиц в выборочную совокупность:

· случайный отбор (реализуется с использованием жеребьевки или датчиков случайных чисел)

· механистический отбор (основан на предварительном упорядочении генеральной совокупности; рекомендуется периодически менять точку отсчета во избежание систематической ошибки оценки)

Также нам необходимо знать, какие бывают виды выборки: собственно случайная выборка (повторная, бесповторная), стратифицированная (непропорциональная, пропорциональная, оптимальная) выборка, серийная ( гнездовая) выборка, многоступенчатая, многофазная.

Данная лабораторная работа выполнена на основе данных о количестве зарегистрированных преступлениях в регионах России на 100 000 человек населения, предоставляемых Федеральной службой государственной статистики (Росстат) и публикуемых в их ежегодных сборниках.

РАСЧЁТ НЕОБХОДИМОГО ОБЪЁМА ВЫБОРОЧНОЙ СОВОКУПНОСТИ

Центральным вопросом теории выборки является ошибка выборки- это расхождение в значении параметров генеральной и выборочной совокупностей.

Величина ошибки выборочного признака происходит либо из-за ошибок регистрации или технических ошибок, связанных с недостаточной квалификацией наблюдателей, либо из-за ошибок репрезентативности.

Ошибкой репрезентативности является расхождение параметров выборочной совокупности с параметрами генеральной совокупности.

Ошибки репрезентативности бывают случайными и систематическими.
Систематические ошибки связаны с нарушением установленных правил отбора. Случайные ошибки объясняются недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности.

Как известно, величина ошибки обратно пропорциональна её объёму и прямо пропорциональна показателю вариации в исходной генеральной совокупности. Но увеличение объёма выборки снижает эффективность затрат на проведение выборочного наблюдения, поэтому нужно искать компромисс между допустимой величиной ошибки и объёмом выборки.

При анализе экономико-социальных статистических исследований часто используется метод бесповторного отбора единиц в выборочную совокупность.

Так, расчёт объема выборки при бесповторном отборе для собственно случайной выборки производится по формуле:

На практике объем выборки рассчитывается многократно, используя разные значения предельной ошибки выборки и находя компромисс между объёмом выборки и величиной ошибки, однако в данной работе было решено сформировать три выборки: условно большую выборку объёмом 50 единиц и две малых выборки объёмом 30 и 15 единиц.

ФОРМИРОВАНИЕ ВЫБОРОЧНЫХ СОВОКУПНОСТЕЙ И ОБРАБОТКА ВЫБОРОЧНЫХ ДАННЫХ

Для формирования выборок используются исходные неранжированные данные. В таблице 1 представлены средние цены на вторичном рынке недвижимости в РФ в 2015 году.

Таблица 1

1

32237,67

21

43621,47

2

33180,29

22

43841,28

3

35604,24

23

44112,68

4

38240,52

24

44263,87

5

38566,81

25

44520,85

6

38792,76

26

44548,44

7

39631,98

27

44755,71

8

39745,08

28

44891,49

9

40366,45

29

45675,81

10

40909,34

30

45874,64

11

41618,35

31

46020,92

12

41830,05

32

47101,18

13

42045,83

33

47223,61

14

42209,37

34

47906,73

15

42393,8

35

48206,67

16

42501,46

36

48250,88

17

43039,38

37

48396,24

18

43197,31

38

48715,89

19

43392,38

39

49147,64

20

43497,12

40

49391,29

41

50119,6

61

61656,29

42

50277,19

62

62148,81

43

50799,28

63

62947,27

44

50845,99

64

63176,3

45

50856,6

65

63954,45

46

51647,55

66

64432,15

47

52510,97

67

66180,89

48

52840,85

68

66797,19

49

53797,99

69

76716,8

50

54476,64

70

79647,97

51

55367,32

71

81184,78

52

55643,41

72

82407,05

53

55737,33

54

55752,2

55

57360,97

56

59331,09

57

59482,62

58

59810,02

59

60384,87

60

61420,54

На основе представленных исходных данных были сформированы 3 выборки путем бесповторного случайного отбора. Сформированные выборки представлены в таблице 2.

Таблица 2

В следующих разделах представлен анализ данных выборок.

РАСПРОСТРАНЕНИЕ РЕЗУЛЬТАТОВ ВЫБОРОЧНОГО НАБЛЮДЕНИЯ НА ГЕНЕРАЛЬНУЮ СОВОКУПНОСТЬ

После формирования выборок следует анализ выборочных данных. Для проведения анализа был выбран режим Testallmeansagainst, который используется для проверки гипотезы о генеральной средней по данным всех выборок при учёте одного и того же числа.

Данные, полученные путем использования выбранного режима, представлены в таблице 3.

Таблица 3

Данная таблица содержит следующие показатели:

Mean - значения выборочных средних.

Std. Dev. - значения среднего квадратического (стандартного) отклонения.

N - объем выборки.

Std.Err. - средняя ошибка выборки.

Confidence -95,000% - нижняя граница доверительного интервала при вероятности 95%.

Confidence +95,000% - верхняя граница доверительного интервала при вероятности 95%.

Reference - гипотетическое значение генеральной средней (в нашем примере это значение известно из первой работы).

t-value - расчетное значение t-критерия для проверки гипотезы о значении генеральной средней.

df - число степеней свободы.

p - расчетный уровень значимости t-критерия

В итоге, в данной таблице рассчитаны следующие показатели: среднее значение анализируемого показателя, стандартное отклонение и величина средней ошибки выборки, границы доверительного интервала.

На основе полученных данных о доверительном интервале можно сделать заключения. Взяв в расчет данные по выборке из 50 единиц, получаем следующий вывод: с вероятностью 95% можно утверждать, что средняя цена на вторичном рынке недвижимости в 2015 году была не ниже 49 022,24 и не выше 55 571,37 руб.

Из теории известно, что величина средней ошибки выборки тем меньше, чем больше объём выборки. Теория подтверждается в данной лабораторной работе: как следует из расчетов, минимальная величина средней ошибки выборки, равная 1629,482, соответствует самой большой выборке, где n=50.

По приведенным данным можно рассчитать, какой коэффициент доверия был использован при нахождении предельной ошибки и формировании доверительных интервалов. Как известно, доверительный интервал представляет собой следующее выражение:

Возьмем в качестве примера для расчета выборку из 15 единиц. Как следует из таблицы 3,

Отсюда следует, что

=2,144788

Аналогичным образом находим коэффициент доверия для двух других выборок.

Для выборки объемом 30 единиц

t = 2,045227

Для выборки объемом 50 единиц

t = 2,009571

Ниже проиллюстрировано графическое представление выборочного наблюдения (рисунок 1).

Рис. 1 Графическое сравнение средних значений сплошного и выборочных наблюдений

График наглядно показывает, что генеральная средняя находится в пределах доверительных интервалов, построенных по трем выборкам. Если бы любой из размахов (доверительных интервалов) не включал в себя генеральную среднюю, это означало бы получение ошибочного вывода на основе выборки.

ПРОВЕРКА СТАТИСТИЧЕСКИХ ГИПОТЕЗ О ЗНАЧЕНИИ ГЕНЕРАЛЬНОЙ СРЕДНЕЙ И О РАВЕНСТВЕ ДВУХ ВЫБОРОЧНЫХ СРЕДНИХ

В данном разделе проводится проверка простой гипотезы о значении генеральной средней. Гипотеза может быть сформулирована следующим образом:

Где- точное значение генеральной средней, взятое из первой лабораторной работы

Гипотеза проверяется с помощью t-критерия, который рассчитывается по формуле:

Расчетное значение t-критерия сравнивается с табличным и, если соблюдается неравенство tрасч ? tтабл , то гипотеза о значении генеральной средней принимается.

Рассмотрим оценку гипотезы на примере выборки объемом 50 ед.

Теоретическое значение критерия берется из таблиц распределения Стьюдента (для ? = 0,05 и df = 49):

Таким образом, получаем:

Отсюда можно сделать вывод, гипотеза о значении генеральной средней не отвергается, и различия в значениях между выборочной и генеральной совокупностью не существенны.

Следующая задача данного раздела - оценка существенности разности двух выборочных средних. Если разность между средними величинами статистически значима, то различие вызвано неслучайными факторами, или выборки не принадлежат одной генеральной совокупности. Иначе эта задача формулируется как проверка статистической гипотезы о равенстве двух средних:

Для проверки гипотезы возьмём две выборки с 50 и 15 единицами. Ниже, в таблице 4, приведены результаты расчёта t-критерия при условии неравных дисперсий с помощью процедуры t-test, independent, byvariables.

Таблица 4 (Результаты расчета t-критерия при условии неравных дисперсий)

Гипотеза принимается, если |tрасч| ? tтабл .

В данном примере (табличное значение критерия берется из таблиц распределения Стьюдента (для ? = 0,05 и df = 63)):

Таким образом, проверяемая гипотеза принимается, т.е. расхождение между средними величинами у этих двух выборок признается несущественным.

ЗАКЛЮЧЕНИЕ

В данной работе была проведена и освоена методика выборочного наблюдения. В частности, было проведено выборочное наблюдение значений средней цены на вторичном рынке недвижимости в регионах России в 2015 году.

СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

1. Куприенко Н.В. Статистика. Распределение и выборочное наблюдение в среде STATISTICA: учеб.пособие/ Н.В. Куприенко, О.А. Пономарева, Д.В. Тихонов.-СПб.: Изд-во Политехн. ун-та, 2011. -137с.

Размещено на Allbest.ur

...

Подобные документы

  • Проверка гипотезы о равенстве дисперсий двух генеральных совокупностей. Критерий Фишера-Снедекора. Сравнение выборочной средней с гипотетической генеральной средней нормально распределенной совокупности. Построение теоретического закона распределения.

    курсовая работа [96,2 K], добавлен 17.11.2014

  • Краткая характеристика Республики Калмыкия. Расчет основных характеристик вариационного ряда, моды, медианы, квартилей, децилей, перцентилей и статистических совокупностей. Распределение выборочных моментов и корреляционно-регрессионный анализ данных.

    курсовая работа [580,4 K], добавлен 15.03.2011

  • Результаты вычисления интервальных оценок для математического ожидания и дисперсии. Вычисление выборочных характеристик по заданной выборке. Результаты ранжирования выборочных данных и вычисление моды и медианы. Оценка функции плотности распределения.

    курсовая работа [215,7 K], добавлен 07.02.2016

  • Формирование информационной базы – начальной стадии экономико-статистического исследования. Расчеты средней и предельной ошибок выборки. Оценка распространения выборочных данных на генеральную совокупность. Построение вариационного возрастающего ряда.

    контрольная работа [79,1 K], добавлен 09.12.2009

  • Виды и способы статистического наблюдения. Построение и анализ вариационных рядов распределения. Оценка параметров генеральной совокупности банков на основе выборочных данных. Расчет парного коэффициента корреляции и уравнения однофакторной регрессии.

    контрольная работа [712,1 K], добавлен 30.03.2014

  • Характеристика используемых статистических показателей. Графическое представление распределения значений (гистограмма, куммулята). Оценка структурных средних (моды, медианы) на основе структурной группировки. Выравнивание ряда методом скользящей средней.

    контрольная работа [464,1 K], добавлен 29.10.2014

  • Сущность статистического анализа и выборочного метода. Правила группировки данных выборочного наблюдения по величине объема инвестиций. Графическое представление вариационного ряда (гистограмма, кумулята, кривая Лоренца). Расчет асимметрии и эксцесса.

    курсовая работа [70,7 K], добавлен 26.10.2011

  • Оформление результатов сводки и группировки материалов статистического наблюдения в виде рядов распределения (атрибутивных и вариационных). Расчет средних величин и показателей вариации, моды и меридианы. Графическое изображение статистических данных.

    контрольная работа [226,8 K], добавлен 31.07.2011

  • Статистическая обработка результатов и вычисление числовых характеристик выборочных наблюдений. Параметрическая оценка функции плотности распределения. Расчет аналитических показателей ряда динамики. Статистический анализ оборачиваемости денежной массы.

    курсовая работа [479,7 K], добавлен 16.01.2013

  • Табличное и графическое представление вариационного ряда. Определение среднестатистической численности населения в субъектах России. Характеристика форм распределения с расчетом коэффициентов асимметрии и эксцесса и применением критерия согласия Пирсона.

    курсовая работа [403,2 K], добавлен 17.11.2014

  • Понятие о выборочном наблюдении, его преимущества. Ошибки выборки и основные способы отбора. Распространение выборочных данных на генеральную совокупность. Определение необходимой численности выборки. Оценка существенности расхождения выборочных средних.

    контрольная работа [95,1 K], добавлен 22.12.2010

  • Сбор и регистрация исходных статистических данных. Расчет числовых характеристик экспериментальных данных. Проверка согласия опытного распределения с теоретическим нормальным. Построение и анализ контрольных карт средних арифметических и размахов.

    курсовая работа [244,9 K], добавлен 04.04.2014

  • Расчет числовых характеристик и обработка результатов выборочных наблюдений. Исчисление и анализ статистических показателей в экономике. Национальное богатство: элементы, оценка; баланс активов и пассивов; основные фонды, показатели оборотных средств.

    курсовая работа [1,8 M], добавлен 25.12.2012

  • Первичный анализ экспериментальных данных. Построение эмпирической плотности распределения случайной анализируемой величины и расчет ее характеристик. Определение вида закона распределения величины и расчёт его параметров при помощи метода моментов.

    курсовая работа [1,2 M], добавлен 23.05.2009

  • Проведение анализа страховой деятельности агентов в филиале ООО "Росгосстрах – Поволжье". Группировка статистических данных. Расчёт характеристик вариационного ряда. Показатели распределения и коэффициент вариации. Построение аналитической группировки.

    курсовая работа [253,3 K], добавлен 26.06.2009

  • Расчет выборочных параметров ряда. Построение диаграммы накопленных частот и гистограммы выборки. Линейная диаграмма исходного временного ряда. Его аналитическое выравнивание с помощью линейной функции, статистические показатели и прогнозирование.

    курсовая работа [1006,5 K], добавлен 22.01.2015

  • Общее понятие про гипотезы, их классификация. Выбор и основные принципы расчета критериев для проверки статистических гипотез. Проверка гипотезы о законе распределения генеральной совокупности с использованием функции Лапласа, критерия Фишера-Снедекора.

    курсовая работа [2,6 M], добавлен 01.04.2011

  • Сводка, группировка данных статистического наблюдения, группировка с выделением регионов со значением показателя выше и ниже среднего. Вариационный анализ, структурные характеристики, характеристики и моделирование формы распределения вариационного ряда.

    курсовая работа [145,2 K], добавлен 11.03.2010

  • Выборочное наблюдение как метод статистического исследования, его особенности. Случайный, механический, типический и серийный виды отбора при образовании выборочных совокупностей. Понятие и причины возникновения ошибки выборки, методы ее определения.

    реферат [21,1 K], добавлен 04.06.2010

  • Проведение статистической обработки данных по заданной выборке. Вычисление основных выборочных характеристик. Результаты вычисления интервальных оценок для математического ожидания и дисперсии. Статистический анализ оборачиваемости денежной массы.

    курсовая работа [2,4 M], добавлен 22.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.