Бизнес-статистика ИБМТ
Изучение предмета статистической науки, сути статистической информации и наблюдения. Понятие вариации, виды дисперсии, выборки, рядов динамики, индивидуальных и общих индексов. Их использование в экономико-статистических расчетах. Финансовые индексы.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 15.01.2014 |
Размер файла | 156,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
- Содержание
- 1. Предмет статистической науки. Статистические закономерности и совокупности
- 2. Стадии экономико-статистического исследования
- 3. Методы, используемые при выполнении основных стадий экономико-статистического исследования
- 4. Понятие о статистической информации и статистическом наблюдении. Требования к статистическому наблюдению
- 5. Основные способы получения данных
- 6. Выявление и устранение ошибок статистических исследований
- 7. Задачи статистических группировок
- 8. Типологические, структурные и аналитические группировки
- 9. Группировочный признак. Образование групп и интервалов группировки
- 10. Основные элементы статистического графика. Гистограмма. Полигон. Полигон интегральных процентов
- 11. Организация числовых данных. Упорядоченный массив. Диаграмма «ствол и листья»
- 12. Представление категорийных данных в виде таблиц и диаграмм. Сводная таблица. Диаграмма Парето
- 13. Абсолютные величины, их основные виды
- 14. Характеристика и общие принципы построения относительных величин
- 15. Виды средних величин и методы их расчета
- 16. Структурные средние величины
- 17. Понятие вариации. Абсолютные и средние показатели вариации
- 18. Показатели относительного рассеивания
- 19. Виды дисперсии
- 20. Анализ данных с помощью блочных диаграмм. Базовые показатели
- 21. Дисперсия альтернативного (качественного признака)
- 22. Основная задача выборочного обследования
- 23. Ошибка выборки
- 24. Определение оптимальной численности выборки
- 25. Малая выборка
- 26. Распространение характеристик выборки на генеральную совокупность
- 27. Способы отбора единиц из генеральной совокупности
- 28. Понятие о статистических рядах динамики. Виды рядов динамики
- 29. Аналитические показатели ряда динамики и их взаимосвязь
- 30. Средние показатели в рядах динамики
- 31. Сглаживание рядов динамики. Скользящие средние
- 32. Экспоненциальное сглаживание в рядах динамики
- 33. Вычисление тренда с помощью метода аналитического выравнивания
- 34. Прогнозирование в рядах динамики
- 35. Компоненты классической мультипликативной модели рядов динамики
- 36. Изучение сезонных изменений
- 37. Понятие статистического индекса. Индивидуальные и общие индексы
- 38. Агрегатные индексы
- 39. Средние индексы
- 40. Применение индексов для изучения структурных сдвигов
- 41. Использование индексного метода для территориальных сравнений
- 42. Свойства индексов
- 43. Использование индексов в экономико-статистических расчетах. Индекс потребительских цен. Индекс цен производителей промышленной продукции
- 44. Финансовые индексы (Доу-Джонса, S&P 500, NASDAQ)
- 45. Понятие корреляционно-регрессионного анализа
- 46. Анализ связи парной корреляции. Вычисление параметров уравнения регрессии
- 47. Анализ связи парной корреляции. Оценка практической значимости синтезированной модели
- 48. Анализ связи парной корреляции. Шкала Чеддока. Показатель средней ошибки аппроксимации
- 49. Непараметрические методы оценки корреляционной связи показателей. Коэффициент ассоциации. Коэффициент контингенции
- 50. Непараметрические методы оценки корреляционной связи показателей. Коэффициент корреляции рангов. Коэффициент конкордации
1. Предмет статистической науки. Статистические закономерности и совокупности
Предмет статистического изучения - статистические совокупности.
Познание закономерностей возможно при изучении не отдельных явлений, а их совокупности. В каждом явлении необходимое - то, что присуще всем явлениям данного вида, проявляется в единстве со случайным, индивидуальным, присущим лишь этому конкретному явлению. Статистика рассматривает общую картину, но не игнорирует отдельные объекты.
Закономерности, в которых необходимость неразрывно связана в каждом отдельном явлении со случайностью и лишь во множестве явлений проявляет себя как закон, называются статистическими.
Статистическая совокупность состоит из единиц совокупности. Каждая единица совокупности представляет собой частный случай проявления изучаемой закономерности. Единица совокупности - это предел дробления объекта исследования, при котором сохраняются все свойства изучаемого процесса.
2. Стадии экономико-статистического исследования
Для изучения своего предмета статистика разрабатывает и применяет разнообразные методы, в зависимости от поставленных задач и характера исходной информации.
Все методы применяются на трех основных стадиях экономико-статистического исследования:
1. Сбор первичной статистической информации
2. Статистическая сводка и обработка первичной информации
3. Анализ статистической информации для принятия решений
3. Методы, используемые при выполнении основных стадий экономико-статистического исследования
Основные методы:
1. Методы массового наблюдения. Закон больших чисел.
Основное содержание этого закона: в сводных статистических характеристиках действие элементов случайности взаимопогашается, хотя они и могут проявляться в признаках отдельных единиц статистической совокупности.
2. Метод статистических группировок. Метод обобщающих статистических показателей.
3. Метод средних величин и показателей вариации.
Ряды динамики (временные ряды).
Индексный метод.
Корреляционно-регрессионный анализ.
Выборочный метод.
4. Понятие о статистической информации и статистическом наблюдении. Требования к статистическому наблюдению
Статистическая информация (статистические данные) - первичный статистический материал, формирующийся в процессе статистического наблюдения (СН), который затем подвергается систематизации, сводке, обработке, анализу и обобщению.
СН - это начальная стадия экономико-статистического исследования. Это научно организованная работа по сбору массовых первичных данных о явлениях и процессах во всех сферах бизнеса.
Требования к СН:
ь ценность,
ь полнота,
ь достоверность,
ь объективность,
ь сопоставимость
Зачем нужны данные:
ь Для обзора
ь Для изучения
ь Для оценки качества предоставляемых услуг или производственного процесса
ь Для выработки альтернативных решений
ь Для удовлетворения любопытства
Основные способы получения данных:
ь Изучение промышленных, правительственных, финансовых и др. источников.
Источники данных разделяются на первичные (если данные непосредственно используются для анализа) и вторичные (если некто собирает данные для последующей передачи).
ь Эксперимент
В нем все испытания проводятся под строгим контролем. Планирование эксперимента.
ь Опрос
Респонденты свободно отвечают на ряд вопросов. Затем ответы редактируются, шифруются, табулируются для дальнейшего анализа.
ь Наблюдение
Для явлений, обычно протекающих в естественных условиях.
5. Основные способы получения данных
Результатом опроса являются случайные величины. Эти данные изменяются от объекта к объекту, поскольку двух абсолютно одинаковых объектов не существует. Существуют два типа случайных переменных, значения которых образуют наборы данных: категорийные (качественные) и числовые.
Категорийные случайные величины возникают в результате категорических ответов на заданные вопросы («да» или «нет»). Категорийные переменные могут иметь не только два возможных значения.
Числовые случайные величины являются ответами на вопросы о каком-либо измерении, например, о росте опрашиваемого.
Существуют две разновидности числовых переменных: дискретные и непрерывные.
Дискретные случайные величины используются для ответа на вопрос, требующий подсчета.
Непрерывная случайная величина возникает как ответ на вопрос, требующий измерения.
Теоретически не существует двух людей, имеющих одинаковый рост, поскольку, чем точнее проводятся измерения, тем выше вероятность обнаружить различие между полученными величинами. Однако, большинство измерительных приборов не настолько совершенны, чтобы выявлять небольшие различия между измеренными величинами. Поэтому в большинстве случаев результаты эксперимента или опроса содержат взаимосвязанные наблюдения, даже если случайная величина на самом деле является непрерывной.
Шкалы измерений
Данные можно классифицировать по шкалам, или уровням измерений. Существует четыре общепризнанные шкалы измерений:
1. Номинальная;
2. Порядковая;
3. Интервальная;
4. Шкала отношений.
Номинальная и порядковая шкалы. Данные, представляющие собой значения категорийных переменных, измеряются либо по номинальной, либо по порядковой шкале.
Номинальная шкала классифицирует данные по разным неупорядоченным категориям. Номинальное шкалирование является слабейшей формой измерения, поскольку исследователи не дифференцируют результаты, принадлежащие одной и той же категории, и не устанавливают отношение порядка между категориями.
Порядковая шкала классифицирует данные по разным упорядоченным категориям.
Порядковая шкала представляет собой более точную форму измерений, поскольку между ответами, отнесенными к разным категориям, устанавливается отношение порядка. Несмотря на это, порядковое шкалирование, является разновидностью относительно менее точных измерений, поскольку данные, относящиеся к одной и той же категории по-прежнему не дифференцируются. При порядковых измерениях у исследователей нет разумных инструментов, позволяющих дать количественную оценку ответов. Известно лишь, какая категория «больше», «лучше» или «предпочтительнее», но неизвестно насколько.
Интервальные шкалы и шкалы отношений.
Интервальная шкала представляет собой порядковую шкалу, в которой разности между измерениями выражаются ненулевым числом.
Шкала отношений - это упорядоченная шкала, в которой разности между измерениями (высоты, веса, возраста или зарплаты) могут равняться нулю.
Значения числовых переменных, как правило, измеряются либо по интервальной шкале, либо по шкале отношений. Эти шкалы образуют высший уровень измерения. Они точнее, чем порядковая шкала, поскольку позволяют определить, не только какая из наблюдаемых величин больше другой, но и насколько.
6. Выявление и устранение ошибок статистических исследований
Детерминированная выборка состоит из элементов, включенных в нее без учета вероятности их появления.
Вероятностная выборка состоит из элементов, вероятность появления которых известна заранее.
Ошибки статистических исследований:
1. Ошибка, связанная с охватом исследования (систематическая ошибка выбора)
2. Ошибка, связанная с отсутствием ответа
3. Ошибка выборочного исследования (целесообразность, относительная дешевизна, эффективность - преимущества выборочного наблюдения).
4. Ошибка измерения
7. Задачи статистических группировок
статистика финансовый индекс выборка
Статистические группировки (СГ) - это процесс образования однородных групп на основе разделения статистической совокупности на части или объединение изучаемых единиц в частные совокупности по существенным для них признакам.
СГ - метод статистического исследования, позволяющий уловить переход количественных изменений в качественные, выявить закономерности их развития.
Результатом осуществления этого процесса является разделенный на группы объект наблюдения.
Виды группировок:
Типологические
Структурные
Аналитические
Главное - правильный выбор группировочного признака.
8. Типологические, структурные и аналитические группировки
Типологические группировки - для выделения из множества признаков, характеризующих изучаемые явления, основных типов в качественно однородные группы.
Структурные группировки - используются для изучения строения исследуемой совокупности (торговая сеть - по специализации; работники торговли - по возрасту, стажу работы, по образованию). По ним можно оценить качественные сдвиги или процесс концентрации.
Аналитические группировки - для изучения явления и связи между отдельными признаками явления. Так в коммерческой деятельности встречается много взаимосвязей между признаками, выступающими в роли причины или следствия явления.
Виды взаимосвязей в аналитической группировке:
1) Фактор - количественный признак, а результат - качественный признак (стаж работы и квалификация сотрудника; время договорных связей поставщик-торговля и качество товара)
2) Фактор (основа группировки) - качественный признак, а результат - количественный признак (квалификация сотрудников и производительность их труда)
3) Фактор и результат - качественные признаки (категория работников и их образование)
4) Фактор и результат - количественные признаки (производительность труда и заработная плата)
Комбинированные группировки - образование групп по двум и более признакам, взятым в определенном сочетании. При этом группировочные признаки принято располагать, начиная к атрибутивного (категорийного), в определенной последовательности, исходя из логики взаимосвязи показателей.
9. Группировочный признак. Образование групп и интервалов группировки
Вопрос выбора группировочного признака адекватен цели исследования и характеру исходной информации.
Все многообразие признаков, на основе которых могут производиться статистические группировки, можно соответствующим образом классифицировать:
1) по форме выражения признаки бывают атрибутивными (категорийными), не имеющими количественного значения (профессия, образование и т.д.) и количественными (числовыми), принимающими различные цифровые характеристики (число работников, величина дохода). При этом количественные признаки бывают дискретными (прерывными), значения их - только целые числа (число комнат в квартире) и непрерывными, значения их могут быть как целыми так и дробными (сумма издержек обращения).
2) по характеру изменчивости признаки бывают альтернативными, которыми одни единицы обладают, а другие - нет (поставленный товар м.б. качественным и некачественным) и имеющими множество количественных значений (величина фонда оплаты труда, прибыль).
3) по роли, которую играют признаки во взаимосвязи изучаемых явлений, они бывают факторными, т.е. воздействующими на другие признаки и результативными, т.е. испытывающими на себе влияние других.
В зависимости от сложившихся объективных условий и цели исследования признаки могут меняться ролями.
Вопрос распределения единиц совокупности по группам.
Вопросы количества групп и величины интервала взаимосвязаны между собой.
Чем больше число групп, тем меньше величина интервала и наоборот.
Количество групп зависит от того, какой признак служит основанием группировки.
Атрибутивные (категорийные) признаки предопределяют число групп.
Аналогично разделяется совокупность по дискретному признаку, изменяющемуся в малом диапазоне.
В зависимости от степени изменения признака, от характера распределения статистической совокупности бывают интервалы равные и неравные.
При равенстве интервалов используется формула американского ученого Стерджесса, с помощью которой определяется число групп n при известной численности совокупности N:
Зная размах изменений значений изучаемого признака во всей совокупности и намечаемое число групп, величина равного интервала, определяется по формуле:
, где n - число групп.
В экономической практике часто применяются неравные интервалы, прогрессивно возрастающие или убывающие.
При построении интервалов группировки нередко (при непрерывно изменяющемся признаке) одно и то же число служит верхней и нижней границами 2-х смежных групп.
Интервалы бывают: открытые и закрытые.
10. Основные элементы статистического графика. Гистограмма. Полигон. Полигон интегральных процентов.
Графики в статистике - условные изображения числовых величин и их соотношений в виде различных геометрических образов - точек, линий, плоских фигур и т.п.
Основные элементы статистического графика:
1. Поле графика - место, на котором он выполняется. 1*1,3 - правило «золотого сечения»
2. Графический образ - символические знаки, с помощью которых изображаются данные
3. Пространственные и масштабные ориентиры - координатная сетка или контурные линии. Масштаб графика - это мере перевода численной величины в графическую.
4. Экспликация графика - это пояснение его содержания (название, подписи шкал).
Гистограмма - это диаграмма, на которой изображены столбики, границы которых совпадают с границами групп.
При ее построении исследуемая случайная величина откладывается по горизонтальной оси Х, а количество элементов в соответствующих группах (их относительная частота или процентная доля), по оси вертикальной У.
Процентный полигон - график, построенный путем соединения средних точек, соответствующих процентной доле каждой группы.
Как и при построении гистограмм, величина исследуемой переменной откладывается вдоль по горизонтальной оси, по вертикальной оси - количество элементов в каждой группе, их относительная доля или процент.
Полигон накопленных (интегральных) % или кривая распределения является графическим изображением распределения суммарных процентов.
Диаграмма разброса - способ исследования двумерных числовых величин. Это точечная (в Excel) и корреляционная (в научной литературе) диаграмма. Полезны в разных областях деловой активности.
11. Организация числовых данных. Упорядоченный массив. Диаграмма «ствол и листья»
Чем больше анализируемых данных, тем труднее сконцентрировать внимание на их основных характеристиках. Для лучшего восприятия информации из набора данных, надо их правильно организовать.
Упорядоченный массив состоит из последовательных данных, расположенных по возрастанию.
Решаемые задачи: определение мах и мин значений; типичных величин; диапазона, которому принадлежит основная масса значений.
Диаграмма «ствол и листья» - это инструмент для организации набора данных и анализа их распределения. Данные в этой диаграмме распределены в соответствии с первыми цифрами, или стволами и замыкающими цифрами или листьями.
Например, число 10,9% состоит из ствола 10 и листа 9.
Первые два столбца - ствол, содержащий ведущие цифры чисел. Листья или замыкающие цифры, расположены справа.
12. Представление категорийных данных в виде таблиц и диаграмм. Сводная таблица. Диаграмма Парето
При анализе категорийных или качественных данных используются способы их представления в виде таблиц и графиков.
При работе с категорийными переменными данные вначале заносятся в сводную таблицу, а затем представляются в виде гистограмм, круговых диаграмм или диаграмм Парето.
По внешнему виду сводная таблица для категорийных данных напоминает распределение частот для числовых данных.
Диаграмма Парето - это особая разновидность вертикальной линейчатой диаграммы, в которой категории приводятся в порядке убывания их частот одновременно с полигоном накопленных частот. Особенно полезна, если количество исследуемых категорий велико.
Позволяет выделить наиболее важные категории из большого числа малозначимых групп.
Широкое распространение при анализе производственных процессов и контроле качества.
При анализе двух или двумерных категорийных переменных используют таблицы сопряженности признаков.
13. Абсолютные величины, их основные виды
Абсолютные величины - всегда числа именованные, имеющие определенную размерность, единицы измерения.
В зависимости от различных причин и целей анализа применяются следующие абсолютные величины:
а) натуральные - кг, м, л
в) денежные (стоимостные) - цены
с) трудовые единицы измерения- человеко-часы; человеко-дни.
а) соответствуют природным или потребительским свойствам предмета, товара и выражаются в физических мерах веса, длины и т.д. - килограммы, тонны, литры
Условно-натуральные единицы измерения получаются при приведении различных натуральных единиц к одной, принятой за основу, эталон.
14. Характеристика и общие принципы построения относительных величин
Относительные величины (ОВ) - это частное от деления двух статистических величин, характеризующее количественное соотношение между ними.
Относительные величины, получаемые при сопоставлении абсолютных показателей, называются ОВ первого порядка. При сопоставлении относительных стат. показателей получают ОВ высших (второго, третьего и т.д.) порядков.
Общие принципы построения ОВ:
ь Сравниваемые показатели должны быть связаны в реальной жизни объективно, независимо от нашего желания. Должно быть как можно большее соответствие по смыслу сравниваемых величин
ь Сравниваемые показатели могут различаться только одним атрибутом (или видом признака, или временем, или объектом)
ь Необходимо знать возможные границы существования относительного показателя
ОВ = показатель, отражающий то явление, которое изучается, т.е. сравниваемый/
показатель, с которым производится сравнение, принимаемый за основание или базу сравнения.
По своему познавательному значению ОВ делятся на виды:
1. Выполнения договорных обязательств
2. Структуры
3. Динамики
4. Сравнения
5. Координации
6. Интенсивности
1. ОВвдо= фактический уровень/уровень, предусмотренный договором
2. ОВстр характеризуют состав изучаемой совокупности. Это отношение части к целому или удельный вес части в целом
Сравнивая структуру одной и той же совокупности за разные периоды времени, можно проследить структурные изменения, происшедшие во времени.
ОВстр = величина изучаемой части совокупности/величина всей совокупности
3. ОВ динамики характеризуют изменение изучаемого явления во времени, выявляют направления развития, измеряют быстроту развития. Рассчитываются в виде темпов роста или других показателей динамики
4. ОВ сравнения характеризуют количественное соотношение одноименных показателей, относящихся к различным объектам статистического наблюдения
5. ОВ координации применяются для характеристики соотношения между отдельными частями статистической совокупности, т.е. по существу, они характеризуют структуру изучаемой совокупности, причем иногда более выразительно, чем ОВ структуры
6. ОВ интенсивности - показывают насколько широко распространено изучаемое явление в той или иной среде. Они характеризуют соотношение разноименных, но связанных между собой абсолютных величин. Они показывают сколько единиц одной совокупности приходится на единицу другой совокупности
15. Виды средних величин и методы их расчета
Средние величины - это обобщающие показатели, в которых находят выражение действие общих условий, закономерность изучаемого явления.
В большинстве случаев данные концентрируются вокруг некоей центральной точки. Таким образом, для описания любого набора данных, достаточно указать некое типичное значение. Эту величину называют средним значением.
Введем следующие понятия и обозначения:
ь Признак, по которому находится средняя, называется осредняемым признаком -
ь Величина усредняемого признака у каждой единица совокупности, называется индивидуальным его значение (или вариантами) - Х1, Х2, …, Хn.
ь Частота - это повторяемость индивидуальных значений признака - f
ь Частоты, выраженные относительными величинами, это частости - w
Для решения различных задач требуются различные виды средних.
Средняя арифметическая исчисляется, когда объём усредняемого признака образуется как сумма его значений из отдельных единиц изучаемой статистической совокупности.
Средняя арифметическая невзвешенная получается делением количества сводного признака на число показаний:
.
Если значение признака встречается несколько раз используют среднюю арифметическую взвешенную:
где xi - значения признака; fi - их частота.
Взвешенная средняя учитывает различное значение отдельных вариантов в пределах совокупности. Для интервальных рядов распределения (варианты признака представлены в виде интервалов) в каждом интервале определяется серединное значение, после чего взвешивание производится обычным порядком.
! Величина итогового показателя не должна изменяться при замене индивидуальных значений признака средней величиной.
Способность средних величин сохранять свойства статистических совокупностей называют определяющим свойством.
Средняя геометрическая применяется если при замене индивидуальных величин признака на среднюю надо сохранить неизменным произведение индивидуальных величин. Этот вид средней позволяет оценить степень изменения переменной с течением времени.
.
Этой средней удобно пользоваться, если уделяется внимание отношениям двух чисел. Например, при расчётах среднегодовых темпов роста.
Средняя гармоническая - это величина, обратная средней арифметической. Она используется если по условиям задачи необходимо, чтобы неизменной оставалась при определении сумма величин, обратных индивидуальным значениям признака.
.
Средняя квадратическая применяется если при замене индивидуальных величин признака на среднюю величину надо сохранить неизменной сумму квадратов исходных величин. Основное применение при измерении вариации признака в совокупности.
.
4< 4.25 < 4.5 < 4.75 - это свойство мажорантности средних. Чем больше показатель степени у Хi , тем больше и величина соответствующей средней
16. Структурные средние величины
Для характеристики структуры совокупности применяют структурные средние. К таким показателям относятся мода и медиана.
Мода - величина признака, которая встречается в изучаемом ряду, или в совокупности, чаще всего. Мода широко используется в коммерческой практике при изучении покупательского спроса, при регистрации цен и т.д. В дискретном ряду мода - это варианта с наибольшей частотой. В интервальном вариационном ряду модой считают центральный вариант так называемого модального интервала, т.е. того интервала, который имеет наибольшую частоту:
где xнmo - нижняя граница модального интервала;
imo - величина модального интервала;
fmo - частота, соответствующая модальному интервалу;
fmo-1, fmo+1 - частоты интервалов, предшествующих и следующих за модальным интервалом.
Медиана - это величина, которая делит численность упорядоченного вариационного ряда на две равные части. Для интервального ряда медиана находится по формуле:
где xнme - нижняя граница медианного интервала;
ime - величина медианного интервала;
f/2 - полусумма частот ряда;
Sme-1 - сумма накопленных частот, предшествующих медианному интервалу;
fme - частота медианного интервала.
Сумма абсолютных отклонений членов ряда от медианы есть величина наименьшая:
.
Это особое свойство медианы находит широкое применение в маркетинговой деятельности.
Если среднее арифметическое значение, мода и медиана совпадают, то такая группа данных симметрична.
Величины, находящиеся на одной, двух и трёх четвертях расстояния от начала ряда называются квартилями, на одной десятой - децилями, на одной сотой - процентилями.
Децилем называется структурная величина, которая делит распределение на 10 равных частей по 10% единиц или объемов в каждой части. Децилей девять, децильных групп - десять.
17. Понятие вариации. Абсолютные и средние показатели вариации
Различие (степень колебания) отдельных значений характеризуют показатели вариации.
Вариация - количественное изменение величины исследуемого признака в пределах однородной совокупности, которое обусловлено перекрещивающимся влиянием действия различных факторов.
Степень близости данных отдельных единиц хi к средней измеряется рядом абсолютных, средних и относительных показателей.
Абсолютные показатели вариации
Размах вариации R - это разность между наибольшим и наименьшим значением вариантов.
.
Размах позволяет измерить общий разброс данных. Его слабость в том, что он никак не учитывает, как именно распределены данные между минимальным и максимальным элементами.
Межквартильный размах (средний размах) - это разность между третьим и первым квартилями выборки.
, где Q1 = (n+1)/4 Q3 = 3(n+1)/4
Эта величина позволяет оценить разброс 50% элементов и не учитывать влияние экстремальных элементов.
Суммарные количественные характеристики, такие как медиана, первый и третий квартили, межквартильный размах, на которые не влияют выбросы, называются устойчивыми показателями.
Размах и межквартильный размах позволяют оценить общий и средний разброс значений, но они не учитывают как именно распределены данные. Дисперсия и стандартное (среднеквадратическое) отклонение лишены этого недостатка.
Средние показатели вариации
Среднее линейное отклонение определяется как средняя арифметическая из отклонений индивидуальных значений от средней, без учёта знака этих отклонений
.
Дисперсия 2 (средний квадрат отклонений) определяется по формуле:
,
Чем меньше дисперсия, тем лучше средняя арифметическая отражает собой всю представленную совокупность.
Среднее квадратическое отклонение может быть найдено таким образом:
.
Дисперсия и среднее квадратическое (стандартное) отклонение позволяют оценить степень колебания данных вокруг среднего значения.
Интерпретация понятий
Дисперсия и среднее квадратическое (стандартное) отклонение позволяют оценить разброс данных вокруг среднего значения, т.е. сколько элементов выборки меньше среднего, а сколько - больше. Дисперсия обладает ценными математическими свойствами. Однако ее величина представляет собой квадрат единицы измерения (квадратный %, квадратный доллар и т.д.). Поэтому естественной оценкой дисперсии является стандартное отклонение, которое выражается в обычных единицах измерения - %, доллары …
Стандартное отклонение позволяет оценить величину колебания значений вокруг среднего значения. Практически во всех ситуациях наблюдаемые величины лежат в интервале плюс-минус одно стандартное отклонение от среднего значения. Поэтому, зная среднее арифметическое и среднее квадратическое (стандартное) отклонение можно определить интервал, которому принадлежит основная масса данных.
Суммируем вышесказанное
ь Чем больший разброс имеют данные, тем больше их размах, межквартильный размах, дисперсия и стандартное отклонение
ь Чем более сконцентрированы данные, или однородны, тем меньше их размах, межквартильный размах, дисперсия и стандартное отклонение
ь Если все элементы выборки равны между собой (т.е. разброс отсутствует), межквартильный размах, дисперсия и стандартное отклонение равны нулю.
ь Ни одна из оценок изменчивости данных (размах, межквартильный размах, дисперсия и стандартное отклонение) не может быть отрицательной.
18. Показатели относительного рассеивания
Коэффициент осцилляции К0 отражает относительные колебания крайних значений признака вокруг средней:
.
Относительное линейное отклонение Kd характеризует долю усреднённого значения абсолютных отклонений от средней величины.
.
Коэффициент вариации определяют по формуле:
.
Коэффициент вариации измеряет рассеивание данных относительно среднего значения. Измеряется в %, а не в единицах измерения исходных данных.
Коэффициент вариации позволяет сравнить две выборки, элементы которых выражаются в разных единицах измерения.
Когда относительные показатели вариации не превышают 35%, то принято считать, что полученные средние (серединные) характеристики достаточно надежно характеризуют совокупность по варьирующему признаку, когда относительные показатели вариации больше 35% - то ненадежно. В этом случае варианты ряда распределения существенно отличаются от средних характеристик.
19. Виды дисперсии
Виды дисперсии - это показатель изменения признака в совокупности.
Определим три вида дисперсии:
общую дисперсию ,
межгрупповую дисперсию ,
среднюю внутригрупповых дисперсий .
Общая дисперсия характеризует вариацию признака, которая зависит от всех условий в данной совокупности.
где - общая средняя для всей изучаемой совокупности.
Межгрупповая дисперсия отражает вариацию изучаемого признака, которая возникает под влиянием признака фактора, положенного в основу группировки.
где - средняя по отдельным группам;
- средняя общая;
- численность отдельных групп.
Средняя внутригрупповых дисперсий характеризует случайную вариацию в каждой отдельной группе. Это вариация результативного признака, которая возникает под влиянием всех остальных факторов, кроме группировочного.
где - дисперсия в каждой группе.
Большую практическую значимость имеет правило сложения дисперсий:
.
Коэффициент детерминации 2 находят по формуле: .
Он характеризует долю вариации группировочного признака в общем объеме вариации или на сколько процентов уровень результативного признака определяется группировочным признаком.
Корень квадратный из коэффициента детерминации называется эмпирическим корреляционным отношением.
Это отношение характеризует тесноту связи между признаками, т.е. близость корреляционной (неполной) зависимости к функциональной (полной). Этот показатель изменяется от нуля до единицы. Точность его зависит от размеров совокупности: чем больше совокупность, тем он надежнее. Недостатки эмпирического корреляционного отношения: невозможность определить направление связи (прямая зависимость или обратная); невозможность определения формы связи.
20. Анализ данных с помощью блочных диаграмм. Базовые показатели
Стандартная ошибка - стандартное отклонение деленное на квадратный корень объема выборки.
Асимметричность характеризует отклонение от симметричности распределения и является функцией, зависящей от куба разностей между элементами выборки и средним значением.
Эксцесс - это мера относительной концентрации данных вокруг среднего значения по сравнению с хвостами распределения; зависит от разностей между элементами выборки и средним значением, возведенными в четвертую степень.
Основные характеристики позволяют описать свойства данных и перейти к более глубоким исследованиям. Довольно часто для анализа данных применяется подход, основанный на пятерке базовых показателей и построении блочной диаграммы.
Блочная диаграмма представляет собой удобное средство для изображения пяти базовых показателей:
21. Дисперсия альтернативного (качественного признака)
Альтернативные - это признаки, которыми обладают одни единицы совокупности и не обладают другие.
Наличие изучаемого признака обозначается 1, а его отсутствие 0.
Доля показателей, обладающих изучаемым признаком, обозначается - р, а доля значений, не обладающих признаком, обозначается q.
P + q = 1
Найдем их средние значения и дисперсию.
=
22. Основная задача выборочного обследования
Статистика не всегда имеет дело с данными сплошного наблюдения. Из всех видов несплошного наблюдения главным является выборочное наблюдение, т.к. только выборка позволяет распространить данные, полученные по части совокупности, на всю совокупность.
Под выборочным понимается метод статистического исследования, при котором обобщающие показатели изучаемой совокупности (генеральной совокупности) устанавливаются по некоторой её части (выборочной совокупности или просто выборке) на основе положений случайного отбора.
В проведении ряда исследований выборочный метод является единственно возможным, например, при контроле качества продукции (товара), если проверка производится с уничтожением или разложением на составные части обследуемых образцов.
Причины использования выборочного метода:
1) повышение точности данных
2) экономия материальных, трудовых, финансовых ресурсов и времени
3) без выборки не обойтись, когда наблюдение связано с порчей наблюдаемых объектов)
Далее будем использовать следующие понятия:
Генеральная совокупность - это подлежащая изучению статистическая совокупность, из которой производится отбор части единиц
Выборочная совокупность (выборка) - отобранная из генеральной совокупности некоторая часть единиц, подвергающаяся обследованию.
Суть выборочного метода:
получение характеристик изучаемой совокупности (генеральной) по обследованию некоторой ее части (выборке).
Выборочный метод использует два основных вида обобщающих показателей:
- относительную величину альтернативного (качественного) признака;
Она характеризует долю (удельный вес) единиц в статистической совокупности, которые отличаются от других единиц только наличием изучаемого признака.
- среднюю величину количественного признака.
Это обобщающая характеристика варьирующего признака, который имеет различные значения у отдельных единиц статистической совокупности
Определим следующие величины для генеральной совокупности:
- доля единиц с изучаемым признаком (генеральная доля) Р;
- средняя величина варьирующего признака (генеральная средняя)
для выборки:
- доля изучаемого признака (выборочная доля или частота) ;
- средняя величина в выборке (выборочная средняя).
Тогда основная задача выборочного обследования состоит в том, чтобы на основе характеристик и из выборки получить достоверные суждения о Р и в генеральной совокупности.
Их расхождения измеряются средней ошибкой выборки .
23. Ошибка выборки
Ошибка выборки - это объективно возникающие расхождения между характеристиками выборки и генеральной совокупности
В математической статистике доказывается, что среднее значение ошибки выборки определяется по формуле:
где - генеральная дисперсия; n - объем выборки.
Однако обычно неизвестно, наоборот, его как правило надо определить.
Поэтому используют соотношение
, где - дисперсия в выборочной совокупности.
Если n - велико, то стремится к 1.
Тогда (1)
где 2 - дисперсия в выборочной совокупности; n - объём выборки.
Формула (1) используется при повторном отборе.
При этом для показателя доли альтернативного признака w дисперсия в выборочной совокупности определяется по формуле:
, где w=m/n
m - доля единиц с изучаемым признаком; n - объем выборки.
Для бесповторного отбора:
(2)
где N - численность генеральной совокупности.
Повторный отбор - каждая попавшая в выборку единица после фиксации значения изучаемого признака, должна быть возвращена в генеральную совокупность, где ей опять предоставляется равная возможность попасть в выборку.
Возможные значения, в пределах которых может находиться доля единиц, обладающих изучаемым признаком, в генеральной совокупности определяется по формуле:
. (3)
Для средних значений в генеральной совокупности установлены следующие границы:
(4)
Формулы (3) и (4) гарантированы не с абсолютной достоверностью, а лишь с определённой степенью вероятности.
В математической статистике доказывается, что пределы значений характеристик генеральной совокупности (Р и ) отличаются от характеристик выборочной совокупности ( и ) на величину лишь с определенной вероятностью = 0,683. Т.е. в 317 случаях из 1000 значения могут выйти из этих пределов.
Эту вероятность можно увеличить, увеличив в t раз среднюю ошибку .
Здесь t - коэффициент доверия.
При t =2 доверительная вероятность = 0,954
При t =3 доверительная вероятность = 0,997 (т.е. выход в 3-х случаях из 1000)
Величина коэффициента доверия t зависит о доверительной вероятности и определяется по специальным таблицам, исчисленным применительно к случаю нормально распределенной совокупности (таблицы интегральной функции Лапласа).
Тогда:
При изучении доли альтернативного признака показатели соотносятся следующим образом:
, (5)
При изучении средней величины:
. (6)
Ошибки репрезентативности выборочного наблюдения это разновидность случайных ошибок. Они появляются как результат неполноты наблюдения. Если провести несколько выборочных наблюдений по одной совокупности, то полученные расхождения между показателями выборочной и генеральной совокупностей (т.е. ошибки выборки) будут различны как по знаку, так и по величине. Вот почему с помощью теорем математической статистики определяется средняя из возможных ошибок.
Смысл средней ошибки выборки: средняя ошибка выборки, по существу, это средняя квадратическая величина из отдельных ошибок, взвешенная по вероятности их возникновения.
Предельная ошибка выборки находится следующим образом:
= t . (7)
t- зависит от вероятности, с которой гарантируется величина предельной ошибки выборки.
Расчёт при бесповторном отборе может быть записан следующими алгоритмами:
- доля альтернативного признака (8)
- средняя величина количественного признака (9)
Если процент единиц, взятых в выборку небольшой (до 5 %) то и расчёт производится по формулам повторного отбора:
, (10)
. (11)
Однако в этом случае мы несколько преувеличиваем результаты выборки (т.е. немного повышается средняя ошибка выборки).
24. Определение оптимальной численности выборки
Размер ошибки выборки прежде всего зависит от численности выборочной совокупности n. При доведении N до n ошибка выборки =0. Однако это требует увеличения объемов исследований, дополнительных затрат труда и материальных средств.
Определение оптимальной численности выборки основывается на формуле предельной ошибки выборки. Необходимая численность выборки nх (для среднего значения) и n (для доли альтернативного признака) определяется как:
отсюда (12)
отсюда (13)
В случае бесповторного отбора величины (12) и (13) примут следующий вид:
(14)
(15)
25. Малая выборка
Под малой выборкой (МВ) понимается несплошное статистическое обследование, при котором выборочная совокупность образуется из сравнительно небольшого числа единиц генеральной совокупности.
К минимальному объему выборки прибегают, когда большая выборка невозможна, или экономически невыгодна (если проведение исследования связано с порчей или уничтожением обследуемых образцов).
Объем малой выборки обычно не превышает 30 единиц, но м.б. до 4-5 единиц.
Первые работы в области теории малой выборки были выполнены английским статистиком В. Госсетом в 1908г. (псевдоним Стьюдент) и продолжены в исследованиях Р. Фишера.
Величина ошибки МВ определяется по формулам, отличным от формул выборочного наблюдения со сравнительно большим объемом выборки (n > 100). Средняя ошибка малой выборки исчисляется по формуле:
где - дисперсия малой выборки. (16)
При МВ величина имеет существенной значение, поэтому вычисление дисперсии малой выборки проводится с учетом числа степеней свободы.
Число степеней свободы - это количество вариантов, которые могут принимать произвольные значения, не меняя величины средней.
При определении дисперсии число степеней свободы = n - 1,
Тогда дисперсия МВ находится по формуле:
(17)
Предельная ошибка малой выборки: мв = t мв.
При этом для МВ t зависит не только от заданной доверительной вероятности, но и от численности единиц выборки n.
Для отдельных значений t и n доверительная вероятность МВ определяется по таблицам Стьюдента, в которых даны распределения стандартизованных отклонений:
(18)
При увеличении n распределение Стьюдента приближается к нормальному и при
n = 20 оно уже мало отличается от нормального распределения.
26. Распространение характеристик выборки на генеральную совокупность
В зависимости от цели исследования применяются следующих два метода:
1) способ прямого пересчета показателей выборки для генеральной совокупности
2) посредством расчета поправочных коэффициентов.
1) При использовании способа прямого пересчета показатели выборочной доли или средней распространяются на генеральную совокупность с учетом ошибки выборки.
2) способ поправочных коэффициентов применяется, если целью выборочного метода является уточнение результатов сплошного учета:
Распространение выборочных данных на генеральную совокупность производится с учетом доверительных интервалов. Для этого соответствующие обобщающие показатели выборочной совокупности и корректируются величиной предельной ошибки выборки ?w и :
Для доли альтернативного признака:
Для средней величины количественного признака:
27. Способы отбора единиц из генеральной совокупности
Практика применения выборочного метода использует следующие методы отбора единиц из генеральной совокупности:
1. Индивидуальный отбор - в выборку отбираются отдельные единицы.
2. Групповой отбор - в выборку попадают качественно однородные группы или серии изучаемых единиц.
3. Комбинированный отбор - сочетание индивидуального и группового отбора.
Методы отбора определяются способами формирования выборочной совокупности:
а) собственно-случайная выборка
б) механическая выборка
в) типическая выборка
г) серийная выборка
д) моментная выборка
е) комбинированная выборка
Собственно-случайная выборка - случайный (непреднамеренный) отбор отдельных единиц из генеральной совокупности. Количество отобранных единиц определяется исходя из принятой доли выборки Кв.
Кв= n/N.
Принцип случайности попадания в выборку устраняет возникновение систематических (тенденциозных) ошибок выборки и обеспечивает ее репрезентативность (представительность).
Формирование этой выборки производится с помощью специальных фишек; таблицы случайных чисел.
Эта выборка м.б. осуществлена по схемам повторного и бесповторного отбора.
Для вычисления средней ошибки выборки используются формулы:
(19)
Механическая выборка - генеральная совокупность разбивается на равные интервалы (группы). Размер интервала в генеральной совокупности равен обратной величине доли выборки.
Из каждой группы в интервал выбирается одна единица. Для обеспечения репрезентативности выборки все единицы генеральной совокупности должны располагаться в определенном порядке. Если это упорядочение сделано по существенному признаку (который всецело определяет поведение изучаемого показателя), то в выборку идет единица из середины каждой группы.
Если упорядочение сделано по нейтральному признаку, то из каждой группы м.б. отобрана любая единица, но одинаковая.
Для вычисления средней ошибки выборки используются формулы:
Типическая выборка - часто применяется в статистике торговли. Генеральная совокупность делится на качественно однородные группы. Внутри групп отбираются единицы • в случайном порядке (или механическим способом отбора).
Применяется при изучении сложных статистических совокупностей. Она дает более точные результаты.
При определении ошибки типической выборки в качестве показателя вариации выступает средняя из внутригрупповых дисперсий.
Средняя из внутригрупповых дисперсий исчисляется:
- для доли альтернативного признака
(20)
- для средней величины количественного признака
(21)
Формирование типической выборки осуществляется пропорционально численности единиц, составляющих типические группы.
Определение средней ошибки типической выборки:
а) для доли альтернативного признака
Повторный отбор: . (22)
Бесповторный отбор: (23)
Здесь (24)
б) для средней величины количественного признака
Повторный отбор: . (25)
Бесповторный отбор: (26)
Серийная (гнездовая) выборка.
R - генеральная совокупность разбивается на серии. В случайном порядке отбираются целые гнезда (серии) - r -, в которых производится сплошное обследование.
Для определения средней ошибки серийной выборки используем формулы:
а) для доли альтернативного признака
, (27)
где - межсерийная дисперсия выборочной доли (28)
б) для средней величины количественного признака
, (29)
где - межсерийная дисперсия выборочной средней (30)
Здесь r - число серий в выборке. R - число серий в генеральной совокупности.
По сравнению с типической выборкой серийная дает более высокую ошибку представительности (репрезентативности), т.к. в серийной выборке обычно обследуется небольшое число серий. Для уменьшения ошибки надо увеличивать объем обследуемых серий.
Моментная выборка (моментные выборочные обследования) - для изучения процессов протекающих во времени.
Используется при анализе использования рабочего времени; при анализе времени загрузки оборудования.
Суть этого вида обследования: производится периодическая фиксация (в заранее установленные моменты времени) состояния изучаемой совокупности.
Выборка - сумма периодов, в которые делалась фиксация состояния изучаемых признаков.
Отбор в выборку моментных состояний единиц изучаемой совокупности осуществляется как правило механически. В силу необратимости времени способ отбора должно быть бесповторным. Но поскольку количество моментов времени достаточно большое, то для определения ошибки моментной выборки практически используется формула повторного отбора:
. (31)
...Подобные документы
Изучение с количественной стороны массовых явлении и их закономерностей (статистика). Понятия статистической совокупности, наблюдения, группировки, абсолютных и относительных величин, средней арифметической, отклонения, индексов, тренда рядов динамики.
шпаргалка [36,8 K], добавлен 15.12.2009Анализ сезонных колебаний объема выпуска продукции. Ряд и кумуляты распределения. Методы расчета степенных средних и дисперсии. Расчет индивидуальных индексов цен и физического объема по методу Паше, Ласпейреса. Выборочное наблюдение и виды выборки.
контрольная работа [358,3 K], добавлен 26.12.2010Способы анализа ряда динамики: приведение параллельных данных, смыкание рядов динамики, аналитическое выравнивание. Расчет средних цен на товар; определение дисперсии, среднего квадратического отклонения, коэффициента вариации, индивидуальных индексов.
контрольная работа [65,5 K], добавлен 12.04.2012Статистика производства продукции в сельском хозяйстве. Виды и формы наблюдения. Ряды статистических данных. Виды рядов распределения и их графическое изображение. Показатель вариации. Экономико-статистический анализ производства молока в Якутии.
курсовая работа [74,9 K], добавлен 15.12.2013Определение и классификация индексов, применение индексного метода в статистических исследованиях. Виды индексов количественных и качественных показателей, выбор базы и весов индексов. Индекс-дефлятор и методология расчёта индекса потребительских цен.
презентация [203,3 K], добавлен 27.04.2013Определение для вариационного ряда: средней арифметической, дисперсии, моды, медианы, относительных показателей вариации. Проведение смыкания рядов динамики c использованием коэффициента сопоставимости. Вычисление агрегатных индексов цен и стоимости.
контрольная работа [23,0 K], добавлен 29.01.2011Группировка единиц наблюдения статистической совокупности по факторному признаку. Расчет средних значений, моды и медианы, показателей вариации. Направление связи между факторной и результативной переменными. Определение вероятности ошибки выборки.
контрольная работа [634,5 K], добавлен 19.05.2014Предмет и метод статистической науки. Методология наблюдения, статистическая сводка, группировка, таблицы и графики, показатели и средние величины. Показатели вариации, выборочное наблюдение. Корреляционно-регрессионный анализ. Экономические индексы.
лекция [1,2 M], добавлен 02.01.2014Расчет средних величин и показателей вариации. Основные аналитические показатели ряда динамики. Расчет индексов выполнения плана по производительности труда. Выборочные наблюдения. Демография и статистика населения. Система национальных счетов.
курсовая работа [100,1 K], добавлен 10.04.2011Развитие статистической науки. Предмет статистики, задачи и методология. Структура статистической науки. Организация статистики в Российской Федерации. Общегосударственная и ведомственная статистика. Информационный фонд.
реферат [23,4 K], добавлен 09.10.2006Предмет и метод статистики. Сущность и основные аспекты статистического наблюдения. Ряды распределения. Статистические таблицы. Абсолютные величины. Показатели вариации. Понятие о статистических рядах динамики. Сопоставимость в рядах динамики.
шпаргалка [31,9 K], добавлен 26.01.2009Исследование направлений движения статистической информации. Сбор первичных данных в ходе статистического наблюдения. Сводка, группировка, обработка данных, осуществляемая органами государственной статистики. Использование статистической информации.
реферат [193,0 K], добавлен 26.05.2014Индивидуальные и общие индексы. Агрегатные индексы. Средневзвешенные индексы. Базисные и цепные индексы. Индекс инновационной способности экономики (GCI). Использование общих индексов в экономическом анализе.
курсовая работа [173,3 K], добавлен 03.01.2006Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.
контрольная работа [80,0 K], добавлен 05.06.2012Статистическое наблюдение. Понятие и содержание статистической сводки. Группировка – основа статистической сводки. Статистические ряды распределения. Осуществление конкретной аналитической группировки. Табличное представление статистических данных.
курсовая работа [172,8 K], добавлен 22.12.2010Сущность статистического изучения социально-экономических явлений. Группировка данных статистических наблюдений в анализе производства зерновых культур, изучение средних характеристик и показателей вариации. Использование рядов динамики и метода индекса.
курсовая работа [172,2 K], добавлен 13.03.2014Анализ рядов распределения, их графическое изображение. Оценка дисперсии альтернативного признака. Расчет индивидуальных индексов цен по методикам Пааше и Лайпейреса. Исчисление предельной ошибки выборки для генеральной средней или генеральной доли.
контрольная работа [87,0 K], добавлен 17.10.2010Понятие динамики в статистической методологии. Виды и методика расчета объема производства продукции и услуг предприятия. Анализ результатов статистических компьютерных расчетов анализа динамики объема производства продукции и услуг на предприятии.
курсовая работа [909,6 K], добавлен 03.05.2009Классификация ошибок наблюдения в зависимости от причин возникновения. Особенности ошибок регистрации и репрезентативности. Преимущества выборочного наблюдения перед сплошным. Допустимый уровень ошибки. Понятие ряда динамики в статистической науке.
контрольная работа [73,8 K], добавлен 22.06.2015Понятие о статистической информации. Статистическое наблюдение как стадия экономико-статистического исследования. Задачи и данные статистики при изучении доходов, расходов. Домашние хозяйства как источник информации. Доходная и расходная часть баланса.
контрольная работа [21,7 K], добавлен 06.12.2010