Группировка статистических данных

Общее понятие группировки данных, ее цели и задачи. Функции группировки в статистическом анализе. Выбор группировочных признаков как важнейший вопрос теории группировок. Три правила для выбора группировочных признаков. Применение формулы Стэрджесса.

Рубрика Математика
Вид реферат
Язык русский
Дата добавления 13.09.2013
Размер файла 24,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

СОДЕРЖАНИЕ

Введение

1. Понятие группировки данных

2. Понятие группировочного признака и виды группировок

Заключение

Список использованной литературы

ВВЕДЕНИЕ

Одним из основных и наиболее распространенных методов обработки и анализа первичной статистической информации является группировка. Группировка - объединение единиц совокупности в некоторые группы, имеющие свои характерные особенности, общие черты и сходные размеры изучаемого признака.

Понятие статистической группировки в широком смысле слова охватывает целый комплекс статистических операций. Прежде всего, к ним относится объединение зарегистрированных при наблюдении единичных случаев в группы, сходные в том или ином отношении, поскольку целостную характеристику совокупности необходимо сочетать с характеристикой основных ее частей, классов и т.д. Затем проводится подсчет итогов по выделенным группам и всей совокупности в целом и, наконец, результаты группировки оформляются в виде статистических таблиц. При составлении плана статистического наблюдения определяется очередность обработки материалов, разрабатываются макеты сводных таблиц, указывается также, кто и в какие сроки осуществляет сводку, каким способом, куда поступают сводные данные и кто проводит их дальнейшую обработку.

Значение группировок состоит в том, что этот метод, во-первых, обеспечивает систематизацию и обобщение результатов наблюдения, а во-вторых, метод группировок является основой применения других методов статистического анализа основных сторон и характерных особенностей изучаемых явлений.

В процессе группировки происходит распределение единиц статистической совокупности по группам, однородным в каком-либо существенном отношении, и дается характеристика таких групп с помощью системы показателей в целях выделения типов явлений, изучения их структуры и взаимосвязей. Метод группировок выполняет некоторые функции, аналогичные функциям эксперимента в естественных науках: посредством группировки по отдельным признакам и комбинации самих признаков статистика имеет возможность выявить закономерности и взаимосвязи явлений в условиях, в известной мере ею определяемых. При использовании метода группировок появляется возможность проследить взаимоотношения различных факторов и определить силу их влияния на результативные показатели.

Целью данной работы является ознакомление с понятием группировки статистических данных, характеристика значения и важности группировки, а также определение и описание группировочных признаков.

1. Понятие группировки данных

Группировкой называется распределение единиц изучаемого объекта на однородные типичные группы по существенным для них признакам.

По сути, группировка лежит в основе всей дальнейшей работы с собранной информацией. На основе группировки рассчитываются сводные, обобщающие показатели по группам, правильно отражающие действительность, появляется возможность их сравнения, анализа причин различий между группами, изучения взаимосвязей между признаками. Поэтому статистическая группировка является основой научной сводки. Если рассчитать сводные показатели только в целом по совокупности, то невозможно уловить ее структуры, роли отдельных групп, их специфики.

Однородность данных является исходным условием их статистического описания и анализа. Например, группировка промышленных предприятий по формам собственности, группировка населения по размеру среднедушевого дохода, группировка коммерческих банков по сумме активов баланса и т.д.

Таким образом, значение группировки состоит в том, что этот метод обеспечивает обобщение данных, представление их в компактном, обозримом виде. Кроме того, группировка создает основу для последующей сводки и анализа данных.

Сводные показатели для отдельных групп являются типичными и устойчивыми, если, во-первых, группировка проведена правильно, во-вторых, группы имеют достаточную численность. Первое условие связано с тем, что деление на группы далеко не всегда очевидно. Выполнение второго условия необходимо, так как при достаточно большом числе единиц ( не менее 5 единиц в группе) в сводных показателях взаимопогашаются случайные характеристики и проявляются закономерные, типичные.

2. Понятие группировочного признака и виды группировок

Важнейшим вопросом теории группировок является выбор группировочных признаков.

Признаки единиц совокупности, положенные в основание группировки статистического материала, называются группировочными признаками.

От правильного выбора группировочного признака зависят во многом выводы, которые получают в результате статистической разработки первичных данных. Выбору группировочного признака должен предшествовать глубокий теоретический анализ изучаемого явления. Только после того, как определены сущность и характер изучаемого явления и четко сформулирована цель изучения, можно приступить к выбору группировочного признака.

В области экономических явлений выбор группировочных признаков в каждом конкретном случае должен быть основан экономической теорией. Выбор группировочных признаков требует всестороннего анализа с целью выявления в исследуемой совокупности того специфического качества, которое обособляет ее от окружающих явлений, определяет ее развитие. Затем устанавливается перечень признаков, которые соответствуют сущности явления в условиях поставленной задачи статистического исследования.

Можно сформулировать три основных правила для выбора группировочных признаков:

1) руководствуясь знанием сущности данного явления, законов его развития, в основание группировки необходимо положить наиболее существенные признаки, отвечающие задачам исследования;

2) следует исходить из тех конкретных исторических и территориальных условий, в которых протекает процесс развития изучаемого явления, так как с изменением конкретных условий могут меняться и группировочные признаки;

3) при изучении явлений, на которые воздействует несколько различных закономерностей, необходимо в основание группировки класть не один, а несколько признаков, взятых в комбинации, т.е. применять комбинационные группировки.

Для решения задачи группировки нужно установить правила отнесения каждой единицы к той или иной группе.

По сложности построения различают два типа группировок: простые и сложные (или комбинированные).

Группировка называется простой, если для ее построения используется один группировочный признак. Если группировка проводится по нескольким признакам, она называется сложной. Обычно такая группировка проводится как комбинационная, т.е. группы, выделенные по одному признаку, подразделяются на подгруппы по другому признаку. Таким образом, могут быть построены двух-, трехуровневые группировки. Они позволяют изучать очень разнообразные и сложные взаимосвязи. Но необходимо отметить и их существенный недостаток. Казалось бы, этот метод выделения групп должен быть лучше простой группировки - ведь трудно ожидать, что различия между группами можно уловить лишь на основе одного признака. Однако комбинация признаков приводит к дроблению совокупности в геометрической прогрессии: число групп будет равно произведению числа группировочных признаков (l) на число выделенных категорий по каждому из них (m):k=l • m. Данные становятся труднообозримыми, группы включают малое число единиц, групповые показатели становятся ненадежными, а полученные результаты очень трудно воспринимаются. Поэтому для изучения сложных взаимосвязей лучше такую группировку заменить несколькими простыми.

Также следует обратить внимание на определении интервалов группировочных признаков. Используются интервалы открытые и закрытые. В первом случае указываются верхняя и нижняя границы интервала. К примеру, группы предприятий по численности работников. Запись выглядит так: 200 - 600, 600 - 1000, 1000 - 2000. Такая запись предполагает, что единица, у которой значение признака совпадает с верхней границей интервала, относится к следующей группе, т.е. интервал читается как «от - до».

Иногда границы закрытых интервалов предполагают включение единиц с нижней и верхней границами. Например, группировка населения по возрасту, лет: 0 - 4, 5 - 9, 10 - 14, 15 - 19, 20 - 24, 25 - 29 и т.д. Интервал называется открытым если указана либо только верхняя, либо только нижняя граница: до 200 человек или 2000 человек и более.

Закрытые интервалы подразделяются на равные и неравные. Неравные интервалы могут определяться как равнонаполненные. При этом совокупность разделяется на группы равного объема с числом единиц в каждой g-й группе:

n = n : m,

где n - общее число единиц;

m - число групп.

Данные ранжируются, отсчитывается число единиц, составляющих первую группу n , затем - вторую n и т.д. Границы интервалов будут соответствовать фактическим значениям признака в каждой группе.

Бывает, что число групп заранее неизвестно и определяется опытным путем на основе перебора вариантов группировки, выявления такого варианта, который наилучшим образом позволяет увидеть различия между группами.

При определении числа групп следует обращать внимание на то, чтобы в одну группу не попало свыше половины всех единиц совокупности и в средних группах было больше единиц, чем в крайних.

Если группировочный признак неколичественный, или количественный дискретный с малым числом значений, то группировка данных производится путем подсчета числа единиц с данным значением признака.

Метод группировок тесно связан с представлением данных в виде групповых или комбинационных таблиц, которые строятся как по одному признаку (простые группировки), так и по нескольким (комбинированные ), а также с графическим представлением структуры совокупности ее частей и соотношений между ними.

По используемой информации различают первичные и вторичные группировки.

Первичные группировки производятся на основе исходных данных, полученных в результате статистических наблюдений.

Вторичные - результат объединения или расщепления первичной группировки.

При разработке первичной группировки существенное значение имеет выбор числа групп. Число групп зависит от типа признака, положенного в основу группировки, от объема совокупности, степени вариации признака.

При построении группировок по качественному признаку количество групп соответствует количеству уровней градации признака Переяслова И.Г., Колбачев Е.Б.,Указ.соч.,стр.35. При группировании по количественному признаку все множество значений признака делится на интервалы. При этом возможны два подхода: группировка с равными и неравными интервалами.

Для определения этих параметров в первом случае рекомендуется формула Стэрджесса:

т = 1 + 3,21 -lgN,

где N - количество наблюдений.

В этом случае величина интервала:

D=,

а границы интервалов:

х =x+(i-1)D

х = x+iD

где х - нижняя, а х - соответственно, верхняя граница.

Группировка с неравными интервалами порождает массу проблем при обработке данных, поэтому следует по мере возможности избегать таких группировок Переяслова И.Г., Колбачев Е.Б.,Указ.соч.,стр.36.

С помощью метода группировок решаются многие задачи. Однако, несмотря на разнообразие, все эти задачи можно свести к следующему: выделение социально-экономических типов, изучение структуры и структурных сдвигов в развитии социально-экономических явлений и процессов, выявление и характеристика взаимосвязи между явлениями и различными их признаками.

Исходя из решаемых задач, выделяют три вида группировок: типологические, структурные и аналитические.

Типологические - это группировки, позволяющие выделить социально-экономические типы явлений, путем разделения качественно разнородной совокупности на классы, однородные группы единиц в соответствии с правилами научной группировки. Этот вид группировок в значительной степени определяется представлениями экспертов о том, какие типы могут встретиться в изучаемой совокупности. Примером типологических группировок могут быть: предприятия и хозяйства - по формам собственности; население - по общественным группам (классам); школы - по типам (начальные, восьмилетние, средние) и т.д.

Чтобы пояснить особенность этой группировки, следует рассмотреть последовательность действий для ее проведения:

- называются те типы явлений, которые могут быть выделены;

- выбираются группировочные признаки, формирующие описание типов;

- устанавливаются границы интервалов;

- группировка оформляется в таблицу, выделенные группы (на основе комбинации группировочных признаков ) объединяются в намеченные типы, и определяется численность каждого из них.

Структурные группировки позволяют изучать внутреннее строение показателей, соотношения в нем отдельных частей и характеризуют структуру совокупности по какому-либо одному признаку. С их помощью изучают состав рабочих по профессиям, стажу работы, возрасту, выполнению норм выработки; состав предприятий по степени выполнения плана производства продукции, снижению ее себестоимости и т.д. Если для типологической группировки чаще используются открытые и неравные интервалы, то для структурной группировки более характерны закрытые равные интервалы.

Деление группировок на типологические и структурные достаточно условно. Если задать, например, границы среднедушевого дохода, соответствующие определенным типам благосостояния, то можно с полным правом назвать группировку типологической.

Аналитические (причинно-следственные) группировки используются для определения наличия, направления и формы связи между изучаемыми показателями и характеризуют взаимосвязь между двумя и более признаками, из которых один рассматривается как результат, другой - как фактор. Отсюда и деление взаимосвязанных признаков на факторные и результативные. Факторным называется признак, под воздействием которого изменяется другой, зависящий от него признак, называемый результативным. Взаимосвязь проявляется в том, что с изменением значения факторного признака систематически возрастает или убывает значение признака результативного. Так, например, себестоимость продукции зависит от уровня производительности труда: чем выше производительность труда, тем ниже в среднем себестоимость продукции.

Важное значение при группировке имеет правильное определение показателей, которыми будет характеризоваться каждая группа. Типичные группы или подгруппы явлений характеризуются рядом признаков, которые обусловливаются целевым назначением обрабатываемых материалов. В практике работы сложилась и применяется система группировок, позволяющая охватить многообразие явлений и процессов общественной жизни, дать им разностороннюю характеристику.

ЗАКЛЮЧЕНИЕ

Таким образом, можно сделать вывод, что статистическая группировка - это процесс образования однородных групп по ряду существенных признаков. Осуществляется группировка либо путем деления совокупности на отдельные части, которые характеризуются внутренней однородностью и отличаются рядом признаков, либо путем объединения отдельных единиц в группы по типовым признакам (например, группировка промышленных предприятий по форме собственности, группировка населения по размеру среднедушевого дохода, группировка коммерческих банков по сумме актива баланса и т.д.).

Признаки, по которым производится распределение единиц изучаемой совокупности на группы, называются группировочными признаками или основанием группировки. Если группировка получена по количественному признаку, она называется количественной, по качественному - атрибутивной или качественной.

На группировку в статистическом анализе возлагаются следующие функции:

1) выделение социально-экономических типов явлений;

2) изучение структуры и структурных сдвигов;

3) анализ взаимосвязей между явлениями.

В соответствии с этими функциями различают типологические, структурные и аналитические (факторные) группировки.

Огромное значение и роль группировок в статистическом исследовании вытекает из характера объекта статистики, его специфики. Явления общественной жизни, изучаемые статистикой, отличаются многообразием форм и стадий развития, они состоят из существенно различающихся частей, обладающих многими специфическими свойствами.

Изучая количественную сторону массовых общественных явлений в неразрывной связи с их количественными особенностями, статистика стремится показать совокупность явлений дифференциации в многообразии их типов, рассмотреть взаимосвязи и соотношения между последними. С помощью метода группировок решаются сложные задачи статистического анализа.

Необходимость группировки обусловливается, прежде всего, наличием качественных различий между изучаемыми явлениями, и первую задачу группировок можно сформулировать как задачу выделения в составе массового явления тех его частей, которые однородны по качеству и условиям развития, в которых действуют одни и те же закономерности влияния факторов.

СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ

группировка статистический данные

1. Елисеева И.И., Юзбашева М.М. Общая теория статистики: Учебник, 5-е издание, - М.: Финансы и статистика, 2004.

2. Ефимова М.Р и др. Общая теория статистики: Учебник - М.: Инфра-М, 2004.

3. Общая теория статистики: Учебник / Под ред. О.Э. Башиной, А.А. Спирина - 5-е изд., М.: Финансы и статистика, 2003.

4. Теория статистики: Учебное пособие (Под.ред. Г.Л.Громыко), М.: Аудит, 2005

5. Экономическая статистика: Учебник (Под ред. Ю. Н. Иванова), М.: Инфра, 2002.

Размещено на Allbest.ru

...

Подобные документы

  • Понятие о статистической сводке и группировке. Типологическая, аналитическая, структурная группировка. Понятие структурных сдвигов: сопоставление данных структурных группировок. Техника выполнения группировок: интервальные и дискретные вариационные ряды.

    контрольная работа [26,9 K], добавлен 23.07.2009

  • Методика проведения группировки объектов на основе алгоритма K-средних, используя рандомизацию исходных данных (объединенной центрированной матрицы наблюдений). Оценка требуемого числа итераций. Расчет расстояния от объектов до новых центров кластеров.

    практическая работа [195,6 K], добавлен 20.09.2011

  • Проведение аналитической группировки и дисперсионного анализа данных, с целью количественно определить тесноту связи. Определение степени корреляции между группировочными признаками и вариационной зависимости переменной, обусловленной регрессией.

    контрольная работа [140,5 K], добавлен 17.08.2014

  • Получение статистических данных для обобщенной характеристики состояния и развития явления. Виды, способы и организационные формы статистического наблюдения. Статистический формуляр, сводка и группировка данных. Статистические таблицы и графики.

    реферат [33,3 K], добавлен 12.11.2009

  • Поиск участков возрастания и убывания функций, классификация экстремума. Умножение матриц АВ–1С. Теория вероятности события и случайных величин. Построение интервальной группировки данных. Решение задачи линейного программирования, построение графика.

    контрольная работа [127,1 K], добавлен 11.11.2012

  • Функции эритроцитов в организме человека, учет изменения их количества в связи с возрастом в рамках теории вероятностей и математической статистики. Обработка исходных данных, построение диаграммы рассеивания, гистограммы признаков; проверка гипотез.

    курсовая работа [1,6 M], добавлен 18.02.2012

  • Применение в статистике конкретных методов в зависимости от заданий. Методы массовых наблюдений, группировок, обобщающих показателей, динамических рядов, индексный метод. Корреляционный и дисперсный анализ. Расчет средних статистических величин.

    контрольная работа [29,5 K], добавлен 21.09.2009

  • Определение математического ожидания и среднеквадратического отклонения с целью подбора закона распределения к выборке статистических данных об отказах элементов автомобиля. Нахождения числа событий в заданном интервале; расчет значения критерия Пирсона.

    контрольная работа [336,3 K], добавлен 01.04.2014

  • Математические методы систематизации и использования статистических данных для научных и практических выводов. Закон распределения дискретной случайной величины. Понятие генеральной совокупности. Задачи статистических наблюдений. Выборочное распределение.

    реферат [332,8 K], добавлен 10.12.2010

  • Применение формулы Грина к решению задач. Понятие ротора векторного поля. Вывод формулы Грина из формулы Стокса и ее доказательство. Определение непрерывно дифференцируемых функций. Применение формулы Грина для вычисления криволинейного интеграла.

    курсовая работа [2,9 M], добавлен 11.07.2012

  • Статистика – наука о массовых явлениях в природе и обществе; получение, обработка, анализ данных. Демографическая статистика, прогноз численности населения России. Методы обработки статистических данных: элементы логики, комбинаторики, теории вероятности.

    презентация [2,3 M], добавлен 19.12.2012

  • Табличный метод представления данных правовой статистики. Абсолютные и обобщающие показатели. Относительные величины, их основные виды и применение. Среднее геометрическое, мода и медиана. Метод выборочного наблюдения. Классификация рядов динамики.

    контрольная работа [756,5 K], добавлен 29.03.2013

  • Дифференциальное уравнение Бесселя и его интегралы. Рекуррентные формулы для данных функций. Применение теоремы Коши к интегралу Пуассона. Некоторые применения функций Бесселя. Задача на тепловое равновесие. Дифференциальное уравнение второго порядка.

    курсовая работа [4,3 M], добавлен 06.06.2013

  • Критерии выбросов в случае нормального распределения, их асимптотические свойства и эмпирическая мощность. Исследование распределения статистик по критериям Колмогорова и Смирнова. Реализация критериев определения выбросов в статистическом пакете R.

    курсовая работа [521,9 K], добавлен 10.01.2016

  • Метод группировок в статистике. Понятие об интервале, их выбор по количественным и атрибутивным признакам. Понятие о структурных средних. Мода и медиана. Распределение населения по уровню среднедушевого месячного дохода. Ошибки выборочного наблюдения.

    контрольная работа [281,9 K], добавлен 22.06.2013

  • Построение аналитической группировки с целью изучения зависимости между стажем работы рабочих, выработкой и качеством изготавливаемой продукции. Интервальный вариационный ряд распределения с равновеликими интервалами. Средняя выработка, мода и медиана.

    контрольная работа [911,4 K], добавлен 14.07.2009

  • Теоремы дифференциального исчисления, как основа для правила Лопиталя и формулы Тейлора. Правило Лопиталя и методы раскрытия всех типов неопределенностей. Вывод формулы Тейлора и ее применение для нахождения эквивалентных функций и вычисления пределов.

    курсовая работа [261,6 K], добавлен 05.09.2009

  • Математическая статистика как наука о математических методах систематизации статистических данных, ее показатели. Составление интегральных статистических распределений выборочной совокупности, построение гистограмм. Вычисление точечных оценок параметров.

    курсовая работа [241,3 K], добавлен 10.04.2011

  • Использование признаков Коши и Лейбница для исследования абсолютной и условной сходимости рядов. Применение теории вероятности для изучения закономерности случайных явлений. Основные действия над комплексными числами. Решение задач симплексным методом.

    контрольная работа [94,6 K], добавлен 04.02.2012

  • Ознакомление с механизмом проверки гипотезы для случая единственной выборки, двух и нескольких независимых выборок. Проверка совпадений карт, выбор фильмов разных жанров. Обоснование результатов, полученных после проверки статистических гипотез.

    курсовая работа [726,2 K], добавлен 26.02.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.