Генеральная совокупность, выборка

Два основных подхода, применяемых в статистике: метод сплошных наблюдений (описательная статистика) и выборочный метод. Кумулятивная кривая, гистограмма и полигон для интервального ряда. Эмпирическая функция распределения, ее построение и расчет.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык русский
Дата добавления 04.04.2016
Размер файла 261,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

Введение

Задачи математической статистики состоят в том, чтобы на основании знания некоторых свойств подмножества элементов, взятых из некоторого множества, сделать какие-нибудь утверждения о свойствах этого множества, называемого генеральной совокупностью. В генеральной совокупности нас обычно интересует некоторый признак, который обусловлен случайностью и может иметь качественный или количественный характер.

1. Генеральная совокупность, выборка

Пусть требуется изучить совокупность однотипных объектов (людей, деталей, машин, заболеваний и пр.) относительно некоторого признака, количественного или качественного. Скажем, если объекты - это детали, то количественным признаком может быть контролируемый размер детали, а качественным - ее стандартность. В обоих случаях с деталью признак можем рассматривать как случайную величину X: в первом случае - непрерывную, во втором - как дискретную (условившись, что нестандартность детали означает (Х=0), а стандартность (Х=1)).

Все интересующее нас множество объектов (а также совокупность значений признака, присущего объектам) принято называть генеральной совокупностью. Так, при изучении роста призывников в армию в 1996 году мы вправе сказать: генеральная совокупность состоит из N чисел х1 , X2....,хN, где N - число всех призывников в России в 1996 году, X1 - рост конкретного призывника.

В статистике применяют два основных подхода: метод сплошных наблюдений (описательная статистика) и выборочный метод. Метод сплошных наблюдений предполагает измерение всех элементов генеральной совокупности. Он желателен, если мы изучаем успеваемость студентов в какой-то группе или на каком-то факультете, но едва ли оправдан из-за трудностей сбора и обработки данных в примере с ростом новобранцев всей страны. Если же мы хотим знать качество консервов через месяц, через год и через 3 года после их изготовления, то сплошное обследование консервов, очевидно, трижды провести не удастся, но, главное, оставит нас без консервов.

Выборочный метод основан на том, что из всей обследуемой совокупности, называемой генеральной, случайно отбирают часть элементов. Эту выбранную совокупность элементов называют выборкой и задают в виде х1, Х2....,хn, где n - число выбранных элементов (объем выборки), x1 - значение исследуемого признака у первого элемента, х2 - значение признака у второго элемента и т.д.

Как видим, отличие метода сплошных наблюдений от выборочного метода в том, что при первом методе принимаются во внимание все имеющиеся в наличии элементы (объекты, единицы) совокупности, а при втором - выводы о свойствах всей генеральной совокупности делаются на основе анализа взятой из нее случайным образом части -выборки. Это существенно экономит время, силы и средства.

В ряде случаев генеральную совокупность большого объема мыслят как бесконечную, понимая под ней не только массу уже имеющихся элементов, но и совокупность тех, какие появятся в будущем. Эта абстракция упрощает вычисления и позволяет сделать прогноз на будущее.

Случайный выбор элемента рассматривается как независимое наблюдение над случайной величиной X, распределенной так, как распределен признак в генеральной совокупности.

Те значения x1 , х2...,xn, какие признак Х принял в n наблюдениях, называются реализациями случайной величины X.

Они образуют конкретную выборку (х1 , x2,...,xn), на основании которой исследователь строит выводы о генеральной совокупности.

Выборочный метод широко применяется как в технике, так и в общественных и коммерческих исследованиях. В промышленности, торговле и обслуживании пользуются выборочным методом, чтобы повысить результативность работы предприятий. Опросы общественного мнения, финансовый контроль, контроль качества продукции - также сфера приложения этого метода.

Выборка называется представительной (репрезентативной), если она достаточно хорошо представляет пропорции генеральной совокупности. Репрезентативность выборки обычно достигается случайностью выбора, когда каждому элементу обеспечивается равная со всеми остальными элементами вероятность попасть в выборку.

Рассмотрим пример. Автомат производит валы. Множество всех валов, произведенных при определенных, остающихся неизменными производственных условию, образует генеральную совокупность. Если интересующим признаком является, например, диаметр, то этот признак имеет количественный характер

Рассмотрим другой пример. Поточная линия производит охотничьи патроны. Множество всех патронов, произведенных при некоторых остающихся неизменными условия, составляет генеральную совокупность. Если нас интересует способность патрона функционировать или отказывать, то это качественный признак.

Интересующий нас параметр некоторой генеральной совокупности может быть представлен в математической модели некоторой случайной величиной. В количественном случае Х есть сам признак, для качественного же признака, например типа «хороший-плохой», Х можно определить так

Под случайной выборкой объема n понимается выбор n объектов из генеральной совокупности, причем выбор отдельных объектов производится независимо один от другого. Результатом случайной выборки объема n является совокупность (x1,… , хn) значений признака.

Продолжим пример. Совокупность (0, 0, 0, 1, 0, 0, 0, 0, 0, 0) является выборкой объема 10 из партии патронов. Таким образом, здесь девять хороших и один плохой патрон.

Тот факт, что можно сделать много выборок объема n и получить различные совокупности значений признака, ведет к следующему абстрактному определению понятия выборки.

Пусть имеется генеральная совокупность, в которой признак Х имеет распределение F(x). Тогда n-мерный случайный вектор (X1, … Xn), в котором величины Xi независимы друг от друга и все имеют распределение F(x), называется математической выборкой объема n. Каждая реализация (x1,… , хn) случайного вектора (X1, … , Xn) есть выборка/

В случае, если это не вызывает недоразумений, прилагательное «математическая» опускается.

2. Гистограмма. Интервальный ряд. Функция распределения

При большом числе наблюдений над непрерывной случайной величиной Х прибегают к группировке данных: ось х разбивают на 10-15 интервалов I1, I2, …, Ik. Пусть mj - число наблюдений, попавших в интервале Ij (рис.1) .

Длины интервалов не обязательно одинаковы.

Рис.1.

По сгруппированным данным выборочное распределение выражают разными графиками, в первую очередь это:

1) кумулятивная кривая распределения (или график накопленной частоты) - аппроксимация эмпирической функции распределения F;

2) гистограмма;

3) полигон.

Строятся они так.

Кумулятивная кривая. Взяв на оси оХ точку aj - правый конец интервала Ij , j = 1,2,..., к - отложим в ней по оси ординат накопленную частоту (m1+m2+… mj)/n.

Построенные точки плоскости соединим последовательно прямолинейными отрезками. В точках aj разбиения кумулятивная кривая совпадает с эмпирической функцией распределения F(aj), а между этими точками меняется линейно.

Гистограмма. На каждом интервале ,Ij оси абсцисс строим прямоугольник с высотой hj = mj/n, обеспечивающей площадь прямоугольника, равную частоте mj/n (здесь Ij =aj-aj-1) - длина интервала Ij). Вся площадь под графиком гистограммы равна 1. Другой вариант гистограммы получим, если высоту hj берем равной mj а все длины Ij одинаковы.

Полигон. В середине каждого интервала Ji разбиения строим ординату, равную mj/n - частоте попадания наблюдений в этот интервал . Соединяем полученные точки прямолинейными отрезками.

Другой вариант полигона получим, соединяя отрезками середины верхних сторон прямоугольников, образующих гистограмму.

Гистограмма и полигон являются эмпирическими аналогами плотности вероятности. Если п увеличивать, а длины Ij интервалов уменьшать, то гистограмма и полигон неограниченно приближаются к кривой плотности вероятности случайной величины.

Пример. Построить три указанные кривые по сгруппированным данным, представленным в таблице 1 частот, n = 200.

Таблица 1

Интервальный ряд

N интервала

1

2

3

4

5

6

7

8

9

10

Границы интервала I,

100 105

105 110

110 115

115 120

120 125

125 130

130 135

135

140

140 145

145 150

Сумма

Число mj, наблюдений

7

11

15

24

49

41

26

17

7

3

200

Частота mj/n

0.035

0.055

0.075

0.120

0.245

0.205

0.13

0.085

0.035

0.015

1

На рисунках 2 и 3 представлены кумулятивная кривая, гистограмма и полигон для вышеприведенного интервального ряда.

Рис.2

Рис.3

Рассмотрим пример. Из текущей продукции автомата была сделана выборка в 350 валиков. Признаком Х является отклонение диаметра валика от номинального размера. Табл. 2 дает соответствующее статистическое распределение - интервальный ряд распределения.

Таблица 2

Интервальный рад (статистическое распределение отклонений от номинала 350 валиков из продукции автомата)

i

i , мм

mi

mi /n

1

от -0,230 до -0,210

3

0,009

2

от -0,210 до -0,190

8

0,023

3

от -0,190 до -0,170

19

0,054

4

от -0,170 до -0.150

37

0,106

5

от -0,150 до -0.130

53

0,151

6

от -0,130 до -0,110

60

0,171

7

от -0,110 до -0,090

64

0,183

8

от -0,090 до -0,070

49

0,140

9

от -0,070 до -0,050

31

0,088

10

от -0,050 до -0,030

17

0,049

11

от -0,030 до -0,010

7

0,020

12

от -0,010 до +0,010

2

0,006

Всего

350

1,000

На рис. 4 показана соответствующая гистограмма.

Рис 4. Гистограмма

Удобным способом получить представление о распределении X, приемлемом и при качественных признаках, является построение эмпирической функции распределения. Для данного действительного числа х подсчитывается число выборочных значений, меньше х. Обозначим это число через

генеральный совокупность выборка гистограмма

ческой функцией распределения выборки (x1,… , хn). Она является ступенчатой функцией.

Пусть при откармливании 10 животных зарегистрированы следующие прибавки в массе (в килограммах): 2,0; 2,8; 2,3; 3,4; 2,9; 2,8; 3,0; 3,2; 3,0; 2,8. На рис. 5. изображена соответствующая эмпирическая функция распределения.

Рис. 5. Эмпирическая функция распределения

Функция Fn{x) может рассматриваться как приближение истинного распределения F(x) генеральной совокупности. Примем обозначение

Для любых непрерывных функций распределения выполняется соотношение

Отсюда вытекает, что при n почти наверное Dn. сходятся к 0; другими словами, при n последовательность Fn(x) эмпирических функций распределения почти наверное равномерно сходится к функции распределения F (х) признака Х в генеральной совокупности.

Заключение

Пусть имеется выборка (x1, … , хn) -- так называемая таблица наблюденных значений - из генеральной совокупности с признаком Х. Пусть распределение Х неизвестно Для того чтобы получить первое представление об этом распределении в случав количественного признака, составляют так называемую гистограмму. Для этого производят разбиение действительной оси на конечное число граничащих друг с другом промежутков 1, … , k. Затем, подсчитывают число mi, выборочных значений, лежащих в интервале i (1 < i < k). Эти числа mi называются групповыми частотами. Над i рисуют прямоугольник высоты mi/n (относительные частоты попадания в интервалы). Возникающий таким образом ступенчатый график называется гистограммой выборки.

Литература

Вайнберг Дж., Шунекер Дж. Статистика. М., 1979.

Гмурман В.Е. Теория вероятностей и математическая статистика . М., 1988.

Колемаев В.А. и др. Теория вероятностей и математическая статистика. М., 1991.

Теория статистики / Под ред. Р.А.Шмойловой. М., 1996.

Хан Г., Шапиро С. Статистические модели в инженерных задачах. М., 1969.

Эренберг А. Анализ и интерпретация статистических данных. М., 1981.

Размещено на Allbest.ru

...

Подобные документы

  • Выборочное наблюдение как метод статистического исследования, его особенности. Случайный, механический, типический и серийный виды отбора при образовании выборочных совокупностей. Понятие и причины возникновения ошибки выборки, методы ее определения.

    реферат [21,1 K], добавлен 04.06.2010

  • Группировка статистических показателей, описывающих выборку. Этапы построения вариационного ряда, группировки данных. Определение частости и эмпирической плотности вероятностей. Построение полигона, гистограммы и эмпирической функции распределения.

    практическая работа [71,6 K], добавлен 27.06.2010

  • Структурная группировка предприятий по среднегодовой стоимости промышленно производственных основных фондов. Построение гистограммы распределения фирм. Кумулятивная кривая их распределения по среднегодовой стоимости производственных основных фондов.

    контрольная работа [176,6 K], добавлен 22.08.2014

  • Понятие и виды статистической группировки, производимой с целью установления статистических связей и закономерностей, выявления структуры изучаемой совокупности. Построение интервального ряда распределения предприятий по признаку "торговая площадь".

    дипломная работа [1,6 M], добавлен 14.02.2016

  • Получение выборки объема n-нормального распределения случайной величины. Нахождение числовых характеристик выборки. Группировка данных и вариационный ряд. Гистограмма частот. Эмпирическая функция распределения. Статистическое оценивание параметров.

    лабораторная работа [496,0 K], добавлен 31.03.2013

  • Интервальный ряд распределения банков по объему прибыли. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов. Расчет характеристик интервального ряда распределения. Вычисление средней арифметической.

    контрольная работа [150,6 K], добавлен 15.12.2010

  • Сущность несплошного наблюдения в математической статистике, предоставление формул определения его средней и предельной ошибок. Содержание и параметры механического, типического и серийного видов отбора элементов совокупности выборочного обследования.

    курсовая работа [507,7 K], добавлен 15.01.2011

  • Определение оптимального значения интервала в первом приближении. Медиана вариационного ряда. Понятие выборочного среднего. Эмпирическая (статистическая) функция распределения. Параметры для вычисления моды. Степень сродства к нормальному распределению.

    курсовая работа [169,7 K], добавлен 15.11.2014

  • Расчет размаха варьирования случайных величин. Определение целесообразного количества групп по формуле Стерджесса, построение группировки и интервального ряда. Зависимость величины точечной оценки от объема выборки. Построение доверительных интервалов.

    курсовая работа [365,5 K], добавлен 15.03.2011

  • Построение интервального ряда распределения по группировочному признаку. Характеристика отклонения распределения частот от симметричной формы, расчет показателей эксцесса и ассиметрии. Анализ показателей бухгалтерского баланса или отчёта о прибылях.

    контрольная работа [102,4 K], добавлен 19.10.2014

  • Статистика денежного обращения, инфляции и цен. Построение сводки и ряда распределения. Характеристика используемых статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки. Корреляционный анализ количественных признаков.

    контрольная работа [564,1 K], добавлен 13.09.2012

  • Построение дискретного ряда распределения по группировочному признаку. Выявление зависимости между экономическими показателями деятельности предприятий. Анализ показателей бухгалтерского баланса. Механическая выборка из генеральной совокупности.

    контрольная работа [79,1 K], добавлен 12.12.2010

  • Выборочный метод и его роль. Развитие современной теории выборочного наблюдения. Типология методов отбора. Способы практической реализации простой случайной выборки. Организация типической (стратифицированной) выборки. Объем выборки при квотном отборе.

    доклад [28,1 K], добавлен 03.09.2011

  • Сущность статистического анализа и выборочного метода. Правила группировки данных выборочного наблюдения по величине объема инвестиций. Графическое представление вариационного ряда (гистограмма, кумулята, кривая Лоренца). Расчет асимметрии и эксцесса.

    курсовая работа [70,7 K], добавлен 26.10.2011

  • Понятие и роль статистики в механизме управления современной экономикой. Сплошное и несплошное статистическое наблюдение, описание выборочного метода. Виды отбора при выборочном наблюдении, ошибки выборки. Производственные и финансовые показатели.

    курсовая работа [135,5 K], добавлен 17.03.2011

  • Формирование массива случайных чисел. Построение интервального ряда распределения. Определение тесноты связи между типом населения и средним размером вклада, путем исчисления эмпирического корреляционного отношения. Географическая структура экспорта.

    задача [138,1 K], добавлен 05.12.2009

  • Классификация признаков в статистике. Основные требования к организации сбора первичной информации об исследованиях социально-экономических явлений. Формы и виды статистических наблюдений. Методы контроля за соблюдением достоверности полученных сведений.

    презентация [226,3 K], добавлен 20.12.2014

  • Построение статистического ряда распределения организаций. Графическое определение значения моды и медианы. Теснота корреляционной связи с использованием коэффициента детерминации. Определение ошибки выборки среднесписочной численности работников.

    контрольная работа [82,0 K], добавлен 19.05.2009

  • Расчет среднего балла успеваемости по данным результатов сессии, определение показателя вариаций уровня знаний и структуры численности студентов по успеваемости. Построение интервального ряда распределения предприятий. Оценка коэффициентов корреляции.

    контрольная работа [76,0 K], добавлен 21.08.2009

  • Построение интервального вариационного ряда распределения стран Европы по объему импорта с Россией, выделение четырех групп стран с равными интервалами. Определение среднемесячных и среднегодовых остатков сырья, материалов, фурнитуры на складе ателье.

    контрольная работа [69,3 K], добавлен 16.11.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.