Выборочный метод

Особенность статистического распределения выборки. Исследование генеральной и выборочной совокупности. Графическое изображение вариационных рядов. Определение ранжирования и дискретной группировки. Характеристика эмпирической функции распределения.

Рубрика Экономика и экономическая теория
Вид лекция
Язык русский
Дата добавления 28.03.2020
Размер файла 59,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Выборочный метод

План лекции

1. Выборка

2. Статистическое распределение выборки

3. Графическое изображение вариационных рядов

4. Эмпирическая функция распределения

Список литературы

1. Выборка

Математическая статистика - это наука, занимающаяся разработкой методов сбора, регистрации и обработки результатов наблюдений (измерений) с целью познания закономерностей случайных массовых явлений.

Результаты измерений (наблюдений) называют статистическими данными.

Одним из основных способов сбора статистических данных является выборочный метод.

Во многих практических задачах, связанных с повторяющимися испытаниями, нельзя провести все возможные испытания, а можно проделать лишь доступную, выборочную их часть, а затем сделать обоснованный вывод. Например, условимся считать некоторый ноутбук стандартным, если продолжительность его работы составляет 5000 часов, в противном случае он считается нестандартным. Исследовать каждый ноутбук на продолжительность работы невозможно. Тогда как получить представление о качестве изготавливаемых ноутбуков? Для этого достаточно иметь сведения о качестве небольшого числа ноутбуков, отобранных случайно. Тогда по продолжительности работы отобранных приборов можно судить о качестве всей партии.

Совокупность всех возможных значений, или реализаций, исследуемых случайных величин называется генеральной совокупностью. Она может состоять из конечного или бесконечного множества значений, называемых элементами генеральной совокупности.

Выборочной совокупностью (или просто выборкой) называется совокупность элементов случайно отобранных из генеральной совокупности.

Объемом совокупности (генеральной или выборочной) называют число элементов этой совокупности.

Метод, основанный на том, что по данным обследования выборки, выделенной из генеральной совокупности, делается заключение о всей генеральной совокупности, называется выборочным методом.

Задача математической статистики состоит в исследовании свойств выборки и обобщении этих свойств на всю генеральную совокупность. Полученный при этом вывод называется статистическим.

Основное требование к выборке: она должна хорошо представлять генеральную совокупность, т.е. быть репрезентативной (представительной). Выборка будет репрезентативной, если её осуществлять случайным образом.

При составлении выборки можно поступать двумя способами: после того как объект отобран и над ним произведено наблюдение, он может быть возвращен либо не возвращен в генеральную совокупность. В соответствии со сказанным выборки подразделяются на повторные и бесповторные.

Повторной называют выборку, при которой отобранный элемент (перед отбором следующего) возвращается в генеральную совокупность.

Бесповторной называют выборку, при которой отобранный элемент в генеральную совокупность не возвращается.

На практике чаще используется бесповторная выборка.

Кроме того, различают следующие способы составления выборки: а) простой (случайный), б) механический, в) типический, г) серийный.

Так, если занумеровать все элементы генеральной совокупности и затем изготовить карточки с такими же номерами, тщательно перемешать их и отобрать пачку карточек, то элементы генеральной совокупности с номерами извлечённых карточек образуют простую (случайную) выборку. Здесь возможно повторная и бесповторная выборка.

Если элементы генеральной совокупности выбираются через определённый интервал, то такая выборка называется механической. Например, при анализе качества ноутбуков, сходящих с конвейера, отбирается каждый 25 ноутбук.

Предположим теперь, что генеральную совокупность разбили на несколько неперекрывающихся групп и из каждой группы отобраны в случайном порядке объекты. Это типический способ (районированная или стратифицированная выборка) составления выборки. Типическим отбором пользуются тогда, когда обследуемый признак заметно колеблется в различных типических частях генеральной совокупности. Например, при определении рейтинга кандидатов в президенты на выборах страну делят на округа и в каждом округе определяется рейтинг кандидатов в президенты.

Наконец, серийная (гнездовая или кластерная) выборка образуется следующим образом. Генеральная совокупность делится на неперекрывающиеся группы. После этого случайным образом отбираются некоторые группы. Полученная выборка будет серийной.

На практике часто применяется комбинированный отбор, при котором сочетаются указанные выше способы. Например, иногда разбивают генеральную совокупность на серии одинакового объема, затем простым случайным отбором выбирают несколько серий и, наконец, из каждой серии простым случайным отбором извлекают отдельные объекты.

Разумеется, если бы мы могли провести сплошное обследование всех элементов генеральной совокупности, то не нужно было бы применять никакие статистические методы, и саму математическую статистику можно было бы отнести к чисто теоретическим наукам. Однако такой полный контроль невозможен по следующим причинам. Во-первых, часто испытание сопровождается разрушением испытуемого объекта; в этом случае мы имеем выборку без повторения. Во-вторых, обычно необходимо исследовать весьма большое количество объектов, что просто невозможно физически, и т.д.

2. Статистическое распределение выборки

Как правило, результаты эксперимента или наблюдения дискретных случайных величин (первичные данные) сводятся в таблицу, в первой строке которой записывается номер i эксперимента, а во второй - соответствующий признак xi, называемый вариантой случайной величины. Таблицы такого вида называются статистическими рядами несгруппированных данных. Таблица может включать данные о нескольких признаках (несколько видов вариант), но часто ограничиваются данными об одном признаке.

Статистический ряд несгруппированных данных не позволяет проводить содержательный анализ. Учитывая, что нередко статистические исследования охватывают совокупность численностью десятки и сотни тысяч объектов, возникает необходимость упорядочения первичных данных. Для этого используются статистические методы ранжирования и группировки. Иногда этих приёмов обработки статистических данных достаточно для последующего анализа. Чаще приходится прибегать к более сложным методам, но и тогда предварительное упорядочение является обязательной операцией.

Ранжированием называется расположение элементов совокупности в порядке возрастания или убывания величины соответствующих им вариантов.

Статистический ряд, расположенный по возрастанию вариант, называется вариационным рядом.

Ранжированный перечень содержит список элементов совокупности упорядоченный по возрастанию. Каждому элементу (и соответствующему ему варианту) приписан ранг - номер занимаемого им места. Одинаковые варианты получают одинаковый ранг.

После ранжирования данных легко заметить, что некоторые варианты повторяются несколько раз. Если представить совокупность в виде таблицы , в которой записано сколько раз встречаются совокупности с одинаковой вариантой, она станет ещё более обозримой и удобной для анализа по сравнению с ранжированным рядом. Этот приём называется дискретной группировкой.

Дискретной группировкой называется распределение совокупности вариантов по группам, содержащим одинаковые варианты.

Число, показывающее сколько раз (как часто) некоторый вариант xi встречается в совокупности, называется частотой ni (абсолютной частотой) данного варианта. Сумма всех частот равняется количеству элементов совокупности (объему выборки), т.е.

.

Относительной частотой (частостью) некоторого варианта xi называется доля этого варианта в общем количестве данных, т.е. отношение частоты к объему выборки:

.

Для удобства относительную частоту часто выражают в процентах, умножая результат на 100.

Соответствие между вариантами и их частотами (относительными частотами) называется статистическим распределением выборки.

Одновременно с понятием частоты и относительной частоты в сгруппированных совокупностях применяются понятия накопленной частоты и относительной частоты.

Накопленной частотой некоторого варианта xi называется количество элементов ранжированной в порядке возрастания совокупности, имеющих значение признака меньше или равное данному:

. (3)

Накопленной относительной частотой некоторого варианта xi называется отношение накопленной частоты этого варианта к объему выборки:

.

В тех случаях, когда число различных вариантов в совокупности велико или вариация является непрерывной при обработке статистических данных используется интервальная группировка.

Интервальной группировкой называется распределение совокупности вариантов на группы вариантов, лежащих в определённых границах.

Статистическая таблица, получаемая в результате интервальной группировки, называется интервальным вариационным рядом.

Максимальное значение варианта для конкретного интервала называется верхней границей xi(max), а минимальное - нижней границей интервала xi(min). Величина интервала - разность между верхней и нижней границами интервала: статистический выборка вариационный ранжирование

Понятия частоты, относительной частоты, накопленной частоты и накопленной относительной частоты интервального вариационного ряда аналогичны соответствующим понятиям дискретного вариационного ряда, но относятся не к отдельному признаку. А ко всему интервалу.

Ещё одним способом группировки совокупности является комбинационная группировка - распределение совокупности на группы по сочетанию (комбинации) нескольких признаков.

3. Графическое изображение вариационных рядов

Для наглядности рассмотрения статистических данных ряды распределения представляются в графической форме. Наиболее широко используются следующие виды графического изображения вариационных рядов в прямоугольной системе координат: полигон, гистограмма, кумулятивная кривая.

Эти графики дают возможность представить характер варьирования значений признака, выявить состав изучаемой совокупности, её структуру и структурные сдвиги. При нанесении на единую координатную сетку, возможно сравнение нескольких вариационных рядов.

Полигоном (многоугольником) распределения называется графическое изображение вариационного ряда в прямоугольной системе координат, при котором величины признака (варианты) xi откладываются на оси абсцисс, а частоты (или относительные частоты) на оси ординат.

Таким образом, полигон частот представляет собой ломанную, отрезки которой соединяют точки M1(x1, n1), M2(x2, n2), …, Mk(xk, nk). Полигон относительных частот есть ломанная, отрезки которой соединяют точки M1(x1, щ1), M2(x2, щ 2), …, Mk(xk, щ k). Крайние точки М1 и М2, если они не лежат на оси абсцисс, обычно также соединяют со смежными точками M0(x0, 0), Mk+1(xk+1, 0).

Гистограммой вариационного ряда называется графическое изображение интервального вариационного ряда в виде прямоугольников, основания которых - отрезки оси абсцисс, соответствующие интервалам изменения признака, а высоты пропорциональны плотностям частот (или относительных частот) интервалов.

В случае непрерывных интервалов гистограмма частот строится следующим образом (см. Рисунок 1): на оси абсцисс наносится шкала для интервалов, на оси ординат - для плотностей частот интервалов . Из всех точек на оси абсцисс восстанавливаются перпендикуляры, на которых последовательно, начиная с первого, откладываются значения плотности частот интервалов.

Кумулятивная кривая (кумулята) это графическое изображение вариационного ряда, составленное по последовательно суммированным, т.е. накопленным частотам (или относительным частотам).

При построении кумулятивной кривой дискретного вариационного ряда на ось абсцисс наносят значения варианты, ординатами служат нарастающие итоги частот (или относительных частот). Ломаная линия, соединяющая вершины ординат образует кумулятивную кривую.

4. Эмпирическая функция распределения

Пусть известно статистическое распределение частот случайной величины X.

Эмпирической функцией распределения (или функцией распределения выборки) называется функция , определяющая для каждого значения x относительную частоту события X<x:

где nx - число вариант, меньших x; n - объем выборки.

Таким образом, для того чтобы найти, например, , надо число вариант, меньших x2, разделить на объем выборки: .

Из определения эмпирической функции следует, что обладает всеми свойствами функции распределения F(x), а именно:

1) значения функции принадлежат интервалу [0,1];

2) - неубывающая функция;

3) если а - наименьшая, а b - наибольшая варианта, то при и при .

Функцию распределения , в отличие от эмпирической функции, называют теоретической функцией распределения. Различие между эмпирической и теоретической функцией распределения состоит в том, что первая определяет относительную частоту события X<x, а вторая - вероятность того же события.

Построим эмпирическую функцию распределения. Из свойств функции и данных таблицы получаем:

График функции изображён на рисунке 2.

Список литературы

1. Вентцель, Е.С. Теория вероятностей [Текст] / Е.С. Вентцель. - М.: Высшая школа, 2006. - 575 с.

2. Гмурман, В.Е. Теория вероятностей и математическая статистика [Текст] / В.Е. Гмурман. - М.: Высшая школа, 2007. - 480 с.

3. Кремер, Н.Ш. Теория вероятностей и математическая статистика [Текст] / Н.Ш. Кремер - М: ЮНИТИ, 2002. - 543 с.

Размещено на Allbest.ru

...

Подобные документы

  • Оформление результатов сводки и группировки материалов статистического наблюдения в виде рядов распределения (атрибутивных и вариационных). Расчет средних величин и показателей вариации, моды и меридианы. Графическое изображение статистических данных.

    контрольная работа [226,8 K], добавлен 31.07.2011

  • Виды и способы статистического наблюдения. Построение и анализ вариационных рядов распределения. Оценка параметров генеральной совокупности банков на основе выборочных данных. Расчет парного коэффициента корреляции и уравнения однофакторной регрессии.

    контрольная работа [712,1 K], добавлен 30.03.2014

  • Анализ рядов распределения, их графическое изображение. Оценка дисперсии альтернативного признака. Расчет индивидуальных индексов цен по методикам Пааше и Лайпейреса. Исчисление предельной ошибки выборки для генеральной средней или генеральной доли.

    контрольная работа [87,0 K], добавлен 17.10.2010

  • Основные виды и способы статистического наблюдения. Правила формирования выборки. Построение и анализ вариационных рядов распределения. Отбор факторов в регрессионную модель. Проверка значимости коэффициентов регрессии и коэффициента корреляции.

    курсовая работа [1,4 M], добавлен 25.03.2012

  • Проведение статистического наблюдения за деятельностью предприятий. Стоимость основных производственных фондов. Статистический анализ генеральной совокупности. Описательные статистики выборочной совокупности. Распределение единиц выборочной совокупности.

    практическая работа [66,9 K], добавлен 31.01.2012

  • Понятие статистической совокупности и ее структура. Понятие генеральной и выборочной совокупности. Обеспечение репрезентативности выборочной совокупности. Вероятность наступления в выборочной совокупности какого-либо события. Закон больших чисел.

    презентация [76,5 K], добавлен 19.05.2012

  • Статистический ряд распределения фермерских хозяйств по удою от одной коровы. Определение ошибки выборки и границ для среднего удоя в генеральной совокупности. Связь между признаками методом аналитической группировки. Расчет межгрупповой дисперсии.

    контрольная работа [535,7 K], добавлен 14.11.2013

  • Понятие и основные виды выборочного наблюдения. Ошибки выборочного статистического наблюдения. Определение генеральной совокупности, проблема соотношения выборки и совокупности. Точечная и интервальная оценка параметров генеральной совокупности.

    контрольная работа [32,6 K], добавлен 02.12.2015

  • Сущность понятий выборки и выборочного наблюдения, основные виды и категории отбора. Определение объема и численности выборки. Практическое применение статистического анализа выборочного наблюдения. Расчет ошибок выборочной доли и выборочной средней.

    курсовая работа [132,8 K], добавлен 17.02.2015

  • Построение рядов распределения и секторной диаграммы. Графическое изображение дискретного ряда. Показатели центра распределения, к которым относятся мода, медиана, средняя арифметическая. Вычисление основных показателей вариации и формы распределения.

    контрольная работа [355,3 K], добавлен 22.12.2013

  • Статистические ряды распределения, их значение в статистике. Подразделение вариационных рядов на дискретные и интервальные, особенности их применения. Практическое задание: использование статистических рядов для оценки состояния предприятия и отрасли.

    контрольная работа [134,2 K], добавлен 17.11.2009

  • Группировка статистических показателей, описывающих выборку. Этапы построения вариационного ряда, группировки данных. Определение частости и эмпирической плотности вероятностей. Построение полигона, гистограммы и эмпирической функции распределения.

    практическая работа [71,6 K], добавлен 27.06.2010

  • Выборочный метод и его роль. Развитие современной теории выборочного наблюдения. Типология методов отбора. Способы практической реализации простой случайной выборки. Организация типической (стратифицированной) выборки. Объем выборки при квотном отборе.

    доклад [28,1 K], добавлен 03.09.2011

  • Проведение экспериментального статистического исследования социально-экономических явлений и процессов Смоленской области на основе заданных показателей. Построение статистических графиков, рядов распределения, вариационных рядов, их обобщение и оценка.

    курсовая работа [786,2 K], добавлен 15.03.2011

  • Абсолютные и относительные статистические показатели, методы прогнозирования. Закон распределения вероятностей дискретной случайной величины. Оценки параметров генеральной совокупности. Статистическое исследование социально-экономического потенциала.

    шпаргалка [1,8 M], добавлен 16.05.2012

  • Понятие о выборочном наблюдении. Ошибки репрезентативности, измерение ошибки выборки. Определение необходимой численности выборки. Применение выборочного метода вместо сплошного. Дисперсия в генеральной совокупности и сопоставление показателей.

    контрольная работа [39,8 K], добавлен 23.07.2009

  • Построение статистического ряда распределения организаций. Графическое определение значения моды и медианы. Теснота корреляционной связи с использованием коэффициента детерминации. Определение ошибки выборки среднесписочной численности работников.

    контрольная работа [82,0 K], добавлен 19.05.2009

  • Основные виды статистических группировок. Значения группировочного признака. Интервальный ряд распределения. Проведение статистического исследования и формула Стерджесса. Основные ряды распределения и группировки. Графические способы отображения.

    реферат [2,3 M], добавлен 19.12.2010

  • Понятие статистических рядов распределения и их виды: атрибутивные и вариационные. Графическое изображение статистических данных: расчет показателей вариации, моды и медианы. Анализ группы предприятий по признакам Товарооборот и Средние товарные запасы.

    курсовая работа [498,5 K], добавлен 09.01.2011

  • Проведение статистических наблюдений в биологии. Методы изучения массовых явлений. Графическое изображение рядов распределения. Показатели вариации признаков. Ошибки и надежность статистических показателей. Основные характеристики интервальных рядов.

    отчет по практике [199,4 K], добавлен 23.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.