Общая теория статистики
Предмет, задачи и категории статистики. Группировка статистических материалов, ряды распределения статистические таблицы и графики. Абсолютные, относительные и средние величины в статистике. Предельная ошибка выборки. Корреляционно-регрессионный анализ.
Рубрика | Экономика и экономическая теория |
Вид | методичка |
Язык | русский |
Дата добавления | 25.10.2014 |
Размер файла | 341,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
? дисперсия теоретического ряда игреков;
? дисперсия эмпирического ряда игреков.
Дисперсия эмпирического ряда игреков характеризует вариацию результативного признака за счет всех факторов, включая и фактор х, т.е. измеряет общую вариацию у, а дисперсия теоретического ряда характеризует вариацию результативного признака за счет вариации только фактора х (при прочих равных условиях). Дисперсию поэтому называют факторной. Отношение второй дисперсии к первой называют теоретическим коэффициентом детерминации:
.
Он показывает, какую долю в общей дисперсии результативного признака занимает дисперсия, выражающая влияние вариации фактора х на вариацию у.
Дисперсию можно найти по правилу сложения дисперсии как:
, где
? остаточная дисперсия, отражающая влияние на вариацию результативного признака всех остальных факторов (кроме х), не учтенных в уравнении регрессии, т.е. остаточная дисперсия объясняет расхождения между эмпирическими и теоретическими значениями результативного признака.
С учетом остаточной дисперсии можно получить еще одну формулу теоретического корреляционного отношения:
.
В таком виде корреляционное отношение при криволинейной форме связи обычно называют индексом корреляции.
Корреляционное отношение варьирует от 0 до 1. При з < 0,3 говорят о малой зависимости между коррелируемыми признаками, при 0,3 < з < 0,6 - о средней, при 0,6 < з < 0,8 - о зависимости выше средней и при з > 0,8 - о сильной зависимости.
Математически нетрудно показать, что при линейной зависимости теоретическое корреляционное отношение тождественно линейному коэффициенту корреляции (слайд 1.7.19.):
, где .
При линейной зависимости и . Тогда
.
Отсюда
.
В таком виде линейный коэффициент корреляции выступает как стандартизованный коэффициент регрессии, который показывает, на сколько «сигм» изменится в среднем у при изменении х на одно «сигма».
Множественная корреляция.
В условиях действия множества факторов на результативный показатель (что чаще всего встречается при исследовании социально-экономических явлений) показатели парной корреляции оказываются условными и неточными. Более точные оценки дает многофакторный корреляционно-регрессионный анализ, который сводится к решению следующих задач:
? обоснованию взаимосвязи факторов, влияющих на исследуемый показатель;
? определению степени влияния каждого фактора на результативный признак путем построения уравнения множественной регрессии;
? количественной оценке тесноты связи между результативным признаком и факторами.
Математически задача сводится к нахождению функции, наилучшим образом описывающей связь факторных признаков с результативными:
.
Наиболее простыми для построения и анализа являются многофакторные линейные модели, которые содержат независимые переменные только первой степени (слайд 1.7.20.):
.
Методом наименьших квадратов получим систему нормальных уравнений:
.
Параметры уравнения множественной регрессии показывают степень влияния каждого фактора на анализируемый показатель при фиксированном (среднем) значении всех других факторов. С изменением факторного признака на единицу (при неизменном значении других факторов) результативный признак изменяется в среднем на величину параметра.
В многофакторном корреляционном анализе для характеристики тесноты связи между изучаемым показателем и влияющими на него факторами, используются парные, частные и множественные коэффициенты корреляции, множественный коэффициент детерминации.
Если существует множественная корреляция, но необходимо измерить тесноту связи только между двумя из рассматриваемых переменных (без учета их взаимодействия с другими переменными), используют парные коэффициенты корреляции. Методика их расчета и интерпретация результатов аналогична линейному коэффициенту корреляции в случае однофакторной связи.
Совокупный коэффициент детерминации (слайд 1.7.21.) характеризует долю вариации результативного признака, обусловленную изменением всех факторов, входящих в уравнение множественной регрессии.
При линейной форме связи совокупный коэффициент детерминации рассчитывают, используя парные коэффициенты корреляции:
.
Совокупный коэффициент множественной корреляции R - это квадратный корень из совокупного коэффициента детерминации. Он изменяется в пределах от 0 до1. Чем ближе R к единице, тем точнее уравнение множественной регрессии отражает реальную связь.
Совокупный коэффициент множественной корреляции зависит не только от корреляции результативного признака с факторными, но и от корреляции факторных признаков между собой. Наличие между двумя факторами достаточно тесной линейной связи (когда парный коэффициент корреляции между ними больше 0,8) называется коллинеарностью, а между несколькими факторами - мультиколлинеарностью. Если в уравнение регрессии включены мультиколлинеарные факторы, оно неадекватно отражает реальные экономические взаимосвязи. Именно отсутствие корреляционной связи между факторными признаками и наличие тесной связи между результативным и факторными признаками является условием включения этих факторных признаков в регрессионную модель.
Например, для случая двухфакторной корреляции совокупный коэффициент корреляции рассчитывается по формуле (слайд 1.7.21.):
.
Из формулы видно, что чем теснее связь результата с каждым фактором в отдельности, тем выше совокупный коэффициент корреляции, при условии, что составляющая этой формулы, содержащая - парный коэффициент корреляции между факторными признаками - мала.
Проблема отбора факторных признаков для включения в уравнение множественной регрессии и проблема мультиколлинеарности решаются на основе многомерных статистических методов анализа (например, с помощью пошаговой регрессии).
Для определения воздействия на результативный признак каждого фактора при элиминировании его взаимосвязи с остальными (что возможно, когда остальные факторы зафиксированы на постоянном уровне) применяют частные коэффициенты детерминации (слайд 1.7.22.):
, где
? частный коэффициент детерминации, характеризующий воздействие k-го фактора при элиминировании его взаимосвязи с остальными факторами;
? коэффициент множественной детерминации, отражающий влияние всех включенных в анализ факторов;
? коэффициент множественной детерминации, отражающий влияние всех факторов, кроме одного, воздействие которого отражает частный коэффициент детерминации;
k=1, …, n.
Частный коэффициент детерминации характеризует долю вариации результативного признака, обусловленную воздействием данного фактора, при элиминировании его взаимосвязи с остальными факторами, включенными в анализ. Количество факторов, влияние которых исключается, определяет порядок частных коэффициентов детерминации.
Квадратный корень из частного коэффициента детерминации - это частный коэффициент корреляции.
Для оценки сравнительной силы влияния факторов рассчитывают частные коэффициенты эластичности (слайд 1.7.22.):
, где
? среднее значение k-го факторного признака;
? среднее значение результативного признака;
? коэффициент регрессии при k-том факторном признаке.
Коэффициент эластичности показывает, на сколько процентов следует ожидать изменения результативного показателя при изменении фактора на 1% и неизменном значении других факторов.
Сумма частных коэффициентов эластичности позволяет оценить эластичность в целом при совокупном изменении факторов:
Вопросы для самоконтроля
1. В чем заключаются основные задачи изучения и измерения связи между явлениями?
2. Чем различаются функциональные и корреляционные связи?
3. Охарактеризуйте виды корреляционных связей.
4. Какие методы применяются статистикой для выявления наличия корреляционной связи между признаками?
5. Какие показатели являются мерой тесноты связи между количественными признаками?
6. Как рассчитываются ранговые коэффициенты корреляции?
7. Какие показатели являются мерой тесноты связи между атрибутивными признаками.
8. Множественная корреляция.
9. В чем состоит значение уравнения регрессии?
10. В каких случаях пользуются индексом корреляции? Какова его формула?
11. Свойства линейного коэффициента корреляции.
12. Какие задачи решает дисперсионный анализ? Критерий Фишера и методика его исчисления.
Тема 1.8 Индексный метод
Индексами в статистике называются обобщающие показатели сравнения двух совокупностей, состоящих из элементов, непосредственно не поддающихся суммированию. Например, цены разных видов продукции, объемы продукции разных видов в натуральном выражении, производительность труда, себестоимость единицы продукции и т.п.
Сферы применения индексов в статистике:
Первая сфера - непосредственно сравнение. Если элементы сравниваются во времени, индексы выступают как синтетические показатели динамики. Индексы, исчисляемые для пространственного сравнения (т.е. сравниваются уровни каких-либо показателей по районам, областям, странам и т.д.), называются территориальными. Сравнение фактических уровней с плановыми называют индексами выполнения плана.
Вторая сфера. Индексный метод применяется в статистике также для оценки роли отдельных факторов, образующих как сомножители сложное явление, в изменении этого явления. Например, стоимость произведенной продукции равняется произведению физического объема произведенной продукции на цену единицы продукции; валовой сбор равняется произведению урожайность на посевную площадь и т.д. В подобных системах (моделях) из двух сомножителей один является качественным показателем и характеризует интенсивный фактор развития явления (в нашем примере это цена, урожайность), а другой является объемным, количественным показателем, характеризующим экстенсивный фактор развития явления (количество продукции, посевная площадь). С помощью индексных систем можно измерить, какую роль в динамике сложного явления составляют интенсивный и экстенсивный факторы в отдельности. На этой же основе можно определить, в какой мере абсолютный прирост сложного явления обусловлен действием каждого из факторов.
Третья сфера. С помощью индексных систем производится анализ динамики средних показателей, изменение которых подвержено влиянию структурных сдвигов внутри совокупности. Для развития процесса во времени характерно изменение структур совокупностей, т.е. меняются удельные веса отдельных групп внутри совокупности, имеющих различные уровни изучаемых варьирующих признаков. В связи с этим структурные сдвиги оказывают влияние на динамику средних показателей. Измеряют это влияние путем построения системы индексов, связывающих вместе динамику общей средней (ее называют индексом переменного состава), с индексом среднего изменения групповых средних в неизменной структуре (индекс постоянного состава) и индексом структурных сдвигов.
Классификация индексов (слайд 1.8.1.).
1. По характеру изучаемых объектов индексы делятся на индексы объемных и индексы качественных показателей.
2. По степени охвата элементов совокупности, индексы делятся на индивидуальные, групповые (субъиндексы) и общие.
Индивидуальный индекс - это относительная величина, характеризующая изменение во времени отдельных элементов сложного явления. Например, индивидуальный индекс цен:
, где
р1 - цена определенного товара в текущем периоде;
р0 - цена этого товара в базисном периоде.
Общие индексы характеризуют изменение совокупности в целом. Если индексы охватывают не все элементы совокупности, а только какую-то часть, то они называются групповыми. Методология расчета общих и групповых индексов аналогична и составляет предмет индексной теории. Индивидуальные индексы имеют вспомогательное значение.
3. В зависимости от методологии расчета общие и групповые индексы делятся на агрегатные (суммарные) и средние из индивидуальных индексов. Если рассчитывается ряд последовательных индексов динамики, то различают цепную и базисную системы расчета индексов.
Агрегатные индексы (слайд 1.8.2.).
Как уже говорилось, агрегатные индексы характеризуют изменение сложного явления в целом.
В общем виде агрегатные индексы исчисляют по формулам:
?
индекс с весами текущего периода.
х - это индексируемая величина;
f - веса-соизмерители индексов.
?
индекс с весами базисного периода.
?
индекс совместного изменения обоих сомножителей.
В качестве сложного явления возьмем, например, стоимость произведенной продукции. Она равна физическому объему продукции, умноженному на цену единицы продукции. В формальном выражении это (слайд 1.8.3.):
.
Если анализируется изменение физического объема продукции (q), т.е. q - индексируемая величина, цены будут выступать в качестве весов-соизмерителей, то формула агрегатного индекса физического объема продукции будет иметь вид:
,
т.е. весы - цены фиксируются на уровне базисного года.
При анализе изменения цен, когда р (цена) - индексируемая величина, формула агрегатного индекса цен такая:
,
т.е. весы - объем продукции фиксируются на уровне отчетного периода.
Фиксирование весов при расчете индексов объемных величин на уровне базисного года, а при расчете индексов качественных величин на уровне отчетного года - общепринято для отечественной статистики.
Агрегатный индекс стоимости произведенной продукции рассчитывается по формуле:
.
Т.о. получается система агрегатных индексов:
.
Факторный анализ индексным методом (слайд 1.8.4.).
Прирост стоимости произведенной продукции в абсолютном выражении равен:
.
Он складывается из прироста за счет изменения объема выпуска продукции:
и прироста за счет изменения цен:
., т.е.
.
При расчете отдельно взятого индекса веса-соизмерители и в числителе, и в знаменателе относятся к одному и тому же периоду, одинаковы. Но, если рассчитан индексный ряд за несколько периодов, то веса в этом ряду могут быть постоянными, т.е. относиться у всех индексов к одному и тому же периоду, или переменными, т.е. изменяющимися от индекса к индексу. Т.к. индексы качественных показателей (цен, себестоимости и т.п.) исчисляются по весам отчетного периода, ряд таких индексов будет рядом с переменными весами (например, индекс цен 2008 г. по отношению к 2007 г. исчисляется по количествам 2008 г.; индекс цен 2007 г. по отношению к 2006 г. - по количествам 2007 г. и т.д.). А в индексах объемных показателей, которые соизмеряются по весам базисного периода, есть возможность для всего индексного ряда закрепить веса на уровне одной и той же базы. Т.о., образуется индексный ряд с постоянными весами.
Для индексов с постоянными весами действует правило, по которому произведение цепных индексов равно базисному.
Иногда прибегают к перемножению цепных индексов с переменными весами, чтобы получить базисный индекс. При этом результат содержит ошибку. Величина ошибки определяется расхождением двух разновзвешенных индексов (слайд 1.8.5.):
и .
Величина этой ошибки определяется равенством:
(показал профессор Л.С. Казинец)
Индекс производительности труда - строится двумя способами, в зависимости от того, как исчислена производительность труда.
Если производительность труда исчислена, как выработка продукции в единицу времени (w), то индивидуальный индекс производительности труда будет рассчитываться по формуле (слайд 1.8.6.):
,
где Т - суммарные затраты времени на производство продукции в объеме q.
Если выпускается разнородная продукция, необходимо объем выразить в стоимостном выражении, тогда формула индекса примет вид:
,
где р - сопоставимые цены.
Сводный индекс производительности труда, выраженный через выработку в единицу времени, определяется по формуле:
.
В других случаях производительность труда рассчитывается как затраты времени на производство единицы продукции (трудоемкость). Так как этот показатель находится в обратном отношении к показателю производительности труда, рассчитанной первым способом, индекс производительности труда через трудовые затраты определяется по формуле:
,
где t - затраты времени на единицу продукции.
Сводный индекс производительности труда, выраженный через затраты времени, рассчитывается по формуле:
.
Агрегатные индексы можно преобразовать в индексы средние из индивидуальных индексов (слайд 1.8.7.). Например, если в формуле индекса физического объема заменить q1 на , то получится средний арифметический индекс физического объема:
.
Если в формуле агрегатного индекса цен р0 заменить на , то получится средний гармонический индекс цен:
.
Расчет среднего арифметического индекса целесообразен, если в агрегатном индексе знаменатель является реальной величиной (например, в индексе объема производства). Расчет среднего гармонического индекса целесообразен, если числитель агрегатного индекса - реальная величина (как в индексе цен).
С помощью построения индексных систем, можно также проанализировать изменение сложно явления в среднем, т.е. сравнить среднюю величину показателя в настоящем периоде со средней величиной этого показателя в базисном периоде. Например, динамика (относительная) средних цен (слайд 1.8.8.):
-
с применением формулы средней арифметической.
Полученный индекс называется индексом переменного состава. Индекс цен переменного состава показывает изменение средней цены как за счет изменения цен на отдельные виды продукции, так и за счет изменения объемов выпуска продукции. Т.е. этот индекс отражает влияние двух факторов на динамику средних цен: изменения индексируемой величины (в данном примере цены) и изменения структуры совокупности (в нашем примере структуры производства продукции). Влияние каждого из этих факторов можно рассчитать, составив следующую систему индексов:
.
Первый сомножитель в этой системе представляет собой индекс цен в постоянной структуре и называется индексом постоянного (фиксированного) состава. Он отражает влияние на среднее изменение цен одного фактора - изменения цен на продукцию. Индекс постоянного состава может быть преобразован в агрегатный индекс качественной величины (в нашем примере цен):
.
Второй множитель в индексной системе называется индексом структурных сдвигов и измеряет влияние изменения структуры совокупности (в нашем примере производства продукции) на изменение среднего показателя (в примере цен).
С помощью рассмотренной индексной системы можно произвести факторный анализ абсолютного изменения среднего показателя, для нашего примера - средней цены (слайд 1.8.9.). В этом случае объектом факторного анализа является абсолютное изменение средней цены:
.
Влияние изменения цен на отдельные виды продукции на динамику средней цены определяется следующим образом:
,
а влияние структурных сдвигов на абсолютное изменение средней цены можно рассчитать по формуле:
.
Вопросы для самоконтроля
1. Что такое индексы? Чем они отличаются от относительных и средних величин?
2. Роль индексного метода анализа в экономико-статистических исследованиях.
3. Классификация индексов.
4. Методология расчета агрегатных индексов количественных и качественных показателей.
5. Какова взаимосвязь цепных и базисных индексов?
6. Покажите методологию расчета среднего арифметического и среднего гармонического индексов.
7. Факторный анализ индексным методом.
8. Анализ динамики средних величин индексным методом.
9. Индексы производительности труда и методы их расчета.
10. Территориальные индексы.
Тема 1.9 Выборочный метод
Выборочный метод заключается в том, что характеристика всей совокупности единиц дается по некоторой их части, отобранной в случайном порядке. Тем, что отбор единиц проводится в случайном порядке, обеспечивается репрезентативность (представительность) выборочной совокупности, т.е. ее свойство воспроизводить всю генеральную совокупность.
Выборочное наблюдение - наиболее распространенный вид несплошного наблюдения. Вся совокупность единиц называется генеральной и обозначается буквой N, численность выборки обозначается буквой n (слайд 1.9.1.).
При выборочном наблюдении имеют дело с двумя категориями обобщающих показателей: долей признака в совокупности и средней величиной признака. Доля дает характеристику совокупности по альтернативно варьирующему признаку. В виде альтернативной вариации можно выразить вариацию всех атрибутивных признаков (например, доля пенсионеров в общей численности населения города), а также и количественно варьирующих признаков (например, доля семей с двумя детьми в общем количестве семей).
Доля в генеральной совокупности обозначается буквой p, выборочная доля (доля альтернативного признака в выборочной совокупности) - буквой w и называется частостью. Выборочный метод в данном случае позволяет на основе измерения частости дать правильное представление о доле в генеральной совокупности.
При анализе средних величин, среднее значение варьирующего признака во всей совокупности называется генеральной средней , а среднее значение признака в выборке - выборочной средней . В данном случае на основе выборочной средней получают представление о генеральной средней.
Понятие об ошибке выборки.
Задача выборочного метода заключается не в том, чтобы добиться совпадения обобщающих показателей в выборочной совокупности с генеральными (т.к. это невозможно), а в том, чтобы, во-первых, максимально приблизить показатели выборочной совокупности к генеральным; во-вторых, знать возможные пределы отклонений этих показателей и условия, от которых зависит величина этих отклонений. Возможные пределы отклонений выборочных показателей от генеральных называются ошибкой выборки.
Необходимо различать ошибки выборки и ошибки регистрации, которые возникают при неправильном установлении фактов и при сплошном и при выборочном наблюдении.
Ошибки выборки могут быть тенденциозными (систематическими) и случайными. Тенденциозные ошибки возникают тогда, когда был нарушен принцип случайности при отборе единиц из генеральной совокупности.
Ошибки выборки при соблюдении принципа случайного отбора, носят случайный характер, т.е. имеют равную возможность в одинаковой степени преуменьшать или преувеличивать характеристики генеральной совокупности. Закономерности изменения случайных ошибок выборки теория вероятности формулирует в теоремах закона больших чисел, которые доказывают, что с увеличением численности выборки размеры случайных ошибок сокращаются.
Виды выборки (слайд 1.9.2.).
С целью обеспечения репрезентативности выборочной совокупности отбор единиц производят собственно-случайным способом или по определенной схеме или сочетают первый способ со вторым.
Математическая статистика вводит понятия повторного и бесповторного случайного отбора. Если выборка производится способом повторного отбора, то вероятность попадания единицы генеральной совокупности в выборку равна , и вероятность остается той же самой на протяжении всего процесса отбора. Если выборка производится бесповторным способом, т.е. выбранная единица не возвращается в множество выбираемых единиц, то вероятность попадания единицы в выборку меняется от для первой, до ? для последней. Выборочный метод применительно к социально-экономическим явлениям, как правило, имеет в виду бесповторный отбор.
Бесповторный отбор улучшает применение принципа случайного отбора. В него вносится известный порядок, при котором одна и та же единица совокупности не может дважды попасть в выборку. Поэтому бесповторный отбор дает меньшую ошибку выборки, чем повторный.
Собственно-случайный отбор обеспечивает лотерея, жеребьевка. Более надежен отбор по таблице случайных чисел.
На практике, как правило, применяется отбор не из всей совокупности, а из отдельных частей, на которые она предварительно разбивается. Такой способ, улучшающий принцип случайного отбора, называют районированным отбором.
Если генеральную совокупность разбивают на группы по признакам, влияющим на вариацию изучаемых показателей (т.е. выделяют типы), то такой районированный отбор называют типическим. Районированный отбор обеспечивает более равномерное распределение отобранных единиц, представительство всех частей генеральной совокупности, тем самым повышает репрезентативность выборки. Типический отбор, уменьшая вариацию признаков, снижает ошибку выборки.
Если на практике собственно случайный отбор применить сложно, используется отбор по какой-либо схеме (так называемая направленная выборка). Схема отбора принимается такой, чтобы отразить основные свойства и пропорции генеральной совокупности. Например, простой способ: по спискам единиц генеральной совокупности, составленным так, чтобы упорядочивание единиц не было связано с изучаемыми свойствами, проводится так называемый механический отбор единиц с шагом, равным . Начинают отбор, обычно, не с первой единицы, а отступив на пол шага, чтобы уменьшить возможность смещения выборки.
Чаще совмещают районированный отбор с механическим. При отсутствии списков единиц генеральной совокупности, схемы отбора могут быть самыми различными. Т.к. социально-экономические объекты имеют сложную структуру, то выборку часто трудно организовать. В таких случаях применяют многоступенчатую выборку. На каждой ступени используют разные единицы отбора: более крупные - на начальных ступенях, на последней ступени единица отбора совпадает с единицей наблюдения.
Еще один вид выборочного наблюдения - многофазная выборка. Такая выборка включает определенное количество фаз, каждая из которых отличается подробностью программы наблюдения. Например, 25% генеральной совокупности обследуется по краткой программе, каждая 4-я единица из этой выборки обследуется по более полной программе и т.д. Отличие многофазной выборки от многоступенчатой в том, что в каждой фазе сохраняется одна и та же единица отбора.
Иногда производят отбор не отдельных единиц совокупности, а целых серий. Выборка в этом случае называется серийной (гнездовой). Внутри отобранных серий, производится сплошное обследование всех единиц. Например, при 10%-ном выборочном обследовании качества продукции можно брать каждую десятую единицу продукции, а можно организовать выборку так, что через каждые 9 часов в течение десятого часа вся выработанная продукция будет подвергнута сплошному обследованию. В первом случае - это механический отбор единиц совокупности, а во втором - механический серийный отбор. Очевидно, что серийный отбор организовать легче.
Т.к. число серий меньше числа единиц наблюдений, то случайная ошибка выборочных характеристик в серийной выборке будет больше, чем при механическом отборе. С другой стороны, если внутрисерийная вариация поглощает большую часть общей вариации - эта ошибка может быть уменьшена.
В том случае, если и внутри серий производится выборочный отбор единиц наблюдения, выборка становится двухступенчатой, и случайная ошибка выборочных характеристик определяется как сумма ошибок на каждой ступени отбора.
Особым видом выборочного наблюдения является моментное наблюдение, суть которого в том, на определенные моменты времени фиксируется наличие отдельных элементов изучаемого явления.
От случайной выборки следует отличать квотный отбор, когда выборка конструируется из единиц определенных категорий (квот), которые должны быть представлены в заданных пропорциях. С помощью квотного отбора определяют, например, потребительские ориентации и предпочтения. Но средние величины или показатели структуры, определенные на основе квотной выборки будут нерепрезентативными.
Ошибка выборки.
Как уже говорилось выше, ошибка репрезентативности конкретной выборки - это разница между выборочной характеристикой и генеральной. Формулы средней ошибки выводят, исходя из предположения, что было проведено бесконечное число выборок равного объема из одной и той же генеральной совокупности. Каждая выборка будет иметь свою ошибку репрезентативности. Следовательно, можно построить ряд распределения выборок по величине ошибки репрезентативности. Анализ таких распределений показывает тенденцию к концентрации ошибок около центрального значения. Число выборок с той или иной величиной ошибки репрезентативности может быть симметрично или асимметрично относительно этого центрального значения. Свойства таких распределений используются для получения статистических заключений, установления вероятности той или иной величины ошибки репрезентативности.
Например, выборочное распределение средней величины будет нормальным или приближаться к нормальному по мере увеличения объема выборки, независимо от того, имеет или нет нормальное распределение генеральная совокупность.
По выборочному распределению может быть рассчитано среднее xквадратическое отклонение выборочных средних от генеральной средней, которое называется средней ошибкой выборочной средней (слайд 1.9.3.):
,
где ? число выборок с одинаковым значением выборочной средней.
Поскольку генеральная средняя неизвестна, кроме того, проводится на практике не множество выборок, а, как правило, одна, для расчета средней ошибки выборочной средней используют следующее соотношение:
,
где ? дисперсия признака х в генеральной совокупности. Следовательно, средняя ошибка выборки тем больше, чем больше варьирует признак в генеральной совокупности и тем меньше, чем больше объем выборки.
Т.о. утверждают, что отклонение выборочной средней от генеральной в среднем равно . Ошибка конкретной выборки может принимать различные значения, но ее отношение к средней ошибке практически не превышает , если объем выборки достаточно большой (т.е. n>100).
Отклонение ошибки конкретной выборки к средней квадратической ошибке называется нормированным отклонением и обозначается t (слайд 1.9.3.):
.
Распределение вероятностей значений нормированного отклонения выборочной средней от генеральной является нормальным. Ординаты на графике кривой нормального распределения соответствуют вероятностям при том или ином значении t. Пользуясь таблицами «значение интеграла вероятностей» (Лапласа?Гаусса) определяют по значениям t вероятность, или наоборот, на основе заданной вероятности устанавливают t.
Из формулы нормированного отклонения определяют ? (слайд 1.9.3.):
,
где ? ? доверительная ил предельная ошибка выборки.
Ошибка выборки для выборочной относительной величины (доли) определяется аналогично. Средняя ошибка выборочной доли равна (слайд 1.9.4.)
-
в числителе дисперсия альтернативного признака. Предельная ошибка:
.
Приведенные формулы применимы для повторной выборки. В случае бесповторной выборки, когда численность единиц генеральной совокупности сокращается в процессе выборки, в формуле добавляется множитель . Т.к. этот множитель всегда меньше 1, ошибка выборки при бесповторном отборе всегда меньше, чем при повторном. Т.к. при небольшом проценте выборки (например, 5%-ной, 2%-ной), указанный множитель близок к единице, в этом случае на практике используют формулы повторного отбора.
Нужно отметить, что ошибка выборки зависит главным образом от абсолютной численности выборки, и в меньшей степени - от ее относительной доли (процента выборки).
В приведенных формулах ошибки выборки и ? это дисперсии признаков в генеральной совокупности. Т.к. эти дисперсии при выборочном наблюдении рассчитать нельзя, на практике в формулах ошибки используют выборочные дисперсии. При этом имеют в виду, что соотношение между генеральной дисперсией и выборочной равно (слайд 1.9.5.):
,
т.е. выборочная дисперсия несколько меньше генеральной. Если n достаточно велико, то коэффициент близок к единице. Но когда n - небольшое число (в так называемой малой выборке, где n не превышает 20 единиц), эту поправку принимают во внимание.
Как уже говорилось выше, способ формирования выборочной совокупности (вид выборки) влияет на величину ошибки выборки, т.к. величина ошибки выборки, в частности, прямо пропорциональна величине дисперсии. А величина дисперсии зависит от вида выборки.
В серийной выборке дисперсия определяется, как колеблемость между сериями: (см. слайд 1.9.6.)
, где
? среднее значение признака в j-й серии,
? среднее значение в целом по выборке;
r - число отобранных серий.
Приведенная формула предполагает, что численность единиц в сериях одинаково. Если размер серий по количеству единиц не одинаково, то в числитель вводится вес - число единиц в j-той серии , а в знаменателе будет .
При районированной выборке (типической и т.д.), дисперсия рассчитывается как средняя из внутрирайонных дисперсий (слайд 1.9.7.):
, где
? выборочная дисперсия признака х в j-м районе;
, где
объем выборки в j-м районе;
m - численность районов.
Очевидно, что по правилу сложения дисперсий, величина меньше, чем величина общей дисперсии.
Если используется сочетание районированного отбора с отбором сериями, то дисперсия представляет собой среднюю из межсерийных дисперсий для каждого j-го района (1.9.8.):
, где
? межсерийная дисперсия в j-м районе;
, где
? средняя в i-той серии j-го района;
? средняя в j-том районе;
? число серий, отобранных в j-том районе;
m - число районов.
Аналогично приведенным формулам рассчитывается дисперсия выборочной относительной величины (доли) в зависимости от вида выборки. Например, при нерайонированной серийной выборке (слайд 1.9.9.):
, где
?? доля единиц определенной категории в j-той серии;
р - доля единиц этой категории в выборке.
При районированной серийной выборке (слайд 1.9.10.):
, где
? межсерийная дисперсия доли в j-том районе;
? доля признака в i-той серии j-го района;
? доля признака в j-том районе;
? число серий, отобранных в j-том районе;
m - число районов.
Чтобы выяснить, насколько целесообразно применение в данном случае типического отбора, можно воспользоваться корреляционным отношением з, а точнее его квадратом ? коэффициентом детерминации.
Согласно правилу сложения дисперсий, средняя из внутригрупповых дисперсий может быть представлена как (слайд 1.9.11.)
,
где , следовательно, применение типической выборки изменит предельную ошибку на .
Коэффициент детерминации используется и при корректировке величины t.
Если выборка формируется как многоступенчатая, ошибка складывается из ошибок отдельных ступеней. Поэтому практически не используется более 2-3 ступеней отбора.
Например, средняя ошибка выборки при 2-х ступенчатом отборе рассчитывается по формуле (слайд 1.9.12.):
, где
? дисперсия признака х по совокупности «крупных» единиц;
? дисперсия признака х в каждой из отобранных «крупных» единиц;
? число отобранных единиц наблюдения в i-той «крупной» единице;
m - число отобранных «крупных» единиц.
С помощью выборочного метода решаются три основные задачи:
? определение объема выборки, необходимого для получения требуемой точности результата с заданной вероятностью;
? определение возможного предела ошибки репрезентативности гарантированного с заданной вероятностью, и сравнение его с величиной допустимой погрешности;
? определение вероятности того, что ошибка выборки не пре6высит допустимой погрешности.
Решение этих задач зависит от того, какие величины заданы, а какие нужно найти.
Определение необходимого объема выборки
Объем выборки рассчитывается на стадии проектирования выборочного обследования. Т.к. (слайд 1.9.13.)
, то , где
? ? допустимая погрешность, задаваемая исследователем;
? генеральная дисперсия.
Т.к. неизвестна, используются какие-либо ее оценки (слайд 1.9.14.). Например, зная примерную величину средней, дисперсию находят из соотношения . Или, если известны и , то определяют среднее квадратическое отклонение в соответствии с правилом «трех сигм»; , т.к. в нормальном распределении в размахе вариации «укладывается» 6?(±3?). Если распределение заведомо асимметрично, то . Для относительной величины (доли) принимают максимальную величину дисперсии .
Если отбор бесповторный, то величину выборки корректируют, исходя из формулы предельной ошибки выборки для бесповторного отбора (слайд 1.9.15.):
Данная формула применяется при собственно-случайном и механическом отборе, если оценивается средняя величина. При оценке доли в формуле используется дисперсия доли признака (слайд 1.9.15.).
В случае районированного отбора в формулах применяется внутрирайонная дисперсия (внутригрупповая), а если отбор серийный - межсерийная дисперсия (межгрупповая).
Т.к. выборка должна быть такой, чтобы выборочные показатели по всем основным характеристикам были репрезентативны, численность выборки рассчитывают многократно, исходя из допустимых ошибок разных показателей. Из всех рассчитанных таким образом объемов выборки берут максимальное значение.
После проведения выборки рассчитывают возможные ошибки репрезентативности.
Затем делают заключение об удовлетворительности выборки, сопоставляя получившиеся пределы ошибок выборочных показателей с величинами допустимых погрешностей. Может получиться, что предел ошибки, рассчитанный с заданной вероятностью, окажется выше допустимого предела погрешности. В этих случаях определяют вероятность того, что ошибка выборки не превзойдет допускаемую погрешность, на основе формулы предела ошибки выборки:
, где
? дисперсия показателя, рассчитанная по данным выборочного наблюдения.
Выборочные средние и относительные величины распространяются на генеральную совокупность обязательно с учетом предела их возможной ошибки.
Малая выборка.
Малой называется выборка, численность которой не превышает 20 (30) единиц. При малой выборке расчет средней и предельной ошибок имеет особенности. Во-первых, при расчете дисперсии, необходимо учитывать коэффициент , на который необходимо умножить выборочную дисперсию, чтобы получить генеральную, и поэтому дисперсия в малой выборке рассчитывается по формуле:
.
Во-вторых, хотя предельная ошибка малой выборки рассчитывается по обычной формуле, величина t иначе связана с вероятностной оценкой, чем при обычной выборке.
При малой выборке действует особый закон распределения вероятности, который был выявлен английским ученым Стьюдентом. Им рассчитаны таблицы, в которых значение вероятности зависит не только от величины t, но и от численности выборки n. Значения вероятности в этих таблицах при n?30 существенно отличаются от соответствующих значений интеграла вероятностей Лапласа. При численности выборки 30<n<100 эти отличия незначительны. А при численности n>100 (безусловно большая выборка) эти значения совпадают.
Вопросы для самоконтроля
1. В чем преимущества выборочного метода в сравнении с другими видами статистического наблюдения?
2. Что такое генеральная и выборочная совокупности?
3. Что означает ошибка репрезентативности, какие факторы определяют ее величину.
4. Виды выборки.
5. Как оценить генеральную среднюю и генеральную долю по данным выборки?
6. Чем отличается предельная ошибка выборки от средней?
7. Как определить необходимую численность выборки?
8. Как зависит ошибка репрезентативности от вида выборки?
9. Какой принцип является основным при формировании выборочной совокупности?
10. Особенности определения ошибки при малой выборке.
Основная литература
1. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. - 5-е изд., перераб. и доп. - М.: Финансы и статистика, 2005. - 656 с.: ил.
2. Ефимова М.Р., Ганченко О.И., Петрова Е.В. Практикум по общей теории статистики: Учебное пособие. - 2-е изд., перераб. и доп. - М.: Финансы и статистика, 2002. - 336 с.: ил.
3. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики. - М.: ИНФРА-М, 1997.
4. Методологические положения по статистике. Вып. 1-4 / Росстат. М., 2000, 2003.
5. Организация государственной статистики в Российской Федерации / Госкомстат России. - М., 2004. - 429 с.
6. Статистика: Практикум / Краснояр. гос. ун-т; Сост. Дворяшина М.М., Непомнящая Н.В. Красноярск, 2000. 69 с.
7. Теория статистики: Учебник / Под ред. Р.А. Шмойловой. - М.: Финансы и статистика, 2005. - 656 с.
Дополнительная литература:
1. Адамов В.Е. Факторный индексный анализ. Методология и проблемы. - М.: Статистика, 1977.
2. Айвазян С., Мхитарян В. К концепции статистического образования экономистов // Вопросы статистики. - 1995. - №12. - С. 34 - 38.
3. Ален Р. Экономические индексы: Пер. с англ. - М.: Статистика, 1980.
4. Андерсон Т. Статистический анализ временных рядов: Пер. с англ. - М.: Мир. - 1976.
5. Афанасьев В.Н., Юзбашев М.М. Анализ временных рядов и прогнозирование. - М.: Финансы и статистика, 2001.
6. Бокун Н.Ч. Чернышова Н.М. Методы выборочных обследований. - Минск: Министерство статистики и анализа Республики Беларусь. НИИ статистики, 1997.
7. Вайну Я.Я.-Ф. Корреляция рядов динамики. - М.: Статистика, 1977.
8. Гинзбург А.И. Статистика. - СПб.: Питер, 2002. - 128 с.
9. Графические методы в статистике. - М.: Статистика, 1968.
10. Деев. Мухин П. Несплошное статистическое наблюдение: исторический опыт, практика, перспективы // Вопросы статистики. - 1996. - №3. - С. 21 - 27.
11. Елисеева И.И. Моя профессия - статистик. - М.: Финансы и статистика, 1992.
12. Елисеева И.И. Статистические методы измерения связей. - Изд-во Ленингр. Ун-та, 1982.
13. Елисеева И.И., Рукавишников В.О. Логика прикладного статистического анализа. - М.: Финансы и статистика, 1982.
14. Йейтс Ф. Выборочный метод в переписях и обследованиях. - М.: Статистика, 1965.
15. Казинец Л.С. Темпы роста и абсолютные приросты. - М.: Статистика, 1975.
16. Казинец Л.С. Теория индексов. - М.: Госстатиздат, 1963.
Ковалевский Г.В. Индексный метод в экономике. - М.: Финансы и статистика, 1989.
17. Кокрен У. Методы выборочного исследования: Пер. с англ./ Под ред. А.Г. Волкова. - М.: Статистика 1976.
18. Крастинь О.П. Разработка и интерпретация моделей корреляционных связей в экономике. - Рига: Зинатне, 1983.
19. Кривенкова Л.Н., Юзбашев М.М. Область существования показателей вариации и ее применение // Вестник статистики. - 1991. - №6. - С. 66 - 70.
20. Макарова Н.В., Трофимец В.Я. Статистика в Excel. - М.: Финансы и статистика, 2002.
21. Пасхавер И.С. Средние величины в статистике. - М.: Статистика, 1979.
22. Плошко Б.Г. Группировка и системы статистических показателей. - М.: Статистика, 1978.
23. Потребление и доходы населения в условиях реформирования социальной сферы / Сб. статей под ред. И.А. Тарасовой. - М.: ЦЭМИ РАН, 2006. - 179 с.
24. Практикум по социально-экономической статистике: метод. Указ. Решения типовых задач, задач для самоконтроля / Под ред. В.Н. Салина. - Изд-во Фин. Акад., 2002. - 141 с.
25. Практикум по теории статистики: Учеб. пособие./Под ред. Проф. Р.А. Шмойловой. - М.: Финансы и статистика, 1999. - 416 с.: ил.
26. Статистическое моделирование и прогнозирование: Учеб. пособие / Под ред. А.Г. Гранберга. - М.: Финансы и статистика, 1990.
27. Теория статистики: Учебник. / Под ред. проф. Громыко Г.Л. - М., Инфра-М, 2000.
28. Ферстер Э., Ренц Б. Методы корреляционного и регрессионного анализа. Руководство для экономистов: Пер. с нем. - М.: Финансы и статистика, 1983.
29. Фишер И. Построение индексов: Пер с англ. - М.: Изд-во ЦСУ СССР, 1928.
30. Фишер Р.А. Статистические методы для исследователей: Пер с англ. - М.: Госстатиздат, 1958.
31. Четыркин Е.М. Статистические методы прогнозирования. - 2-е изд. - М.: Финансы и статистика, 1983.
32. Юзбашев М.М., Манелля А.И. Статистический анализ тенденций и колеблемости. - М.: Финансы и статистика, 1983.
Статистические сборники:
1. Демографический ежегодник России;
2. Регионы России;
3. Россия в цифрах: Крат. стат. сб.;
4. Россия и страны мира;
5. Социальное положение и уровень жизни населения России;
6. Труд и занятость в России.
Журналы:
«Вестник статистики», «Вопросы статистики», «Социологические исследования», «Статистическое обозрение», «Экономические и социальные перемены: Мониторинг общественного мнения» (Информационный бюллетень ВЦИОМ), «Вопросы экономики», «Экономический альманах», «Экономическое обозрение»
Web-сайты:
Федеральная служба государственной статистики http://www.gks.ru/:
- основные показатели http://www.gks.ru/bgd/free/B01_19/Main.htm
- электронные версии публикаций Федеральной службы государственной статистики http://www.gks.ru/wps/portal/!ut/p/.cmd/cs/.ce/7_0_A/.s/7_0_3D4/_th/J_0_69/_s.7_0_A/7_0_3CK/_s.7_0_A/7_0_3D4
- методология http://www.gks.ru/metod/metod.html
Organisation for Economic Cooperation and Development (OECD) http://www.oecd.org/department/0,3355,en_2649_33715_1_1_1_1_1,00.html
Центральный Банк Российской Федерации http://www.cbr.ru/
- статистика внешнего сектора. Платежный баланс. http://www.cbr.ru/statistics/?Prtid=svs
www.bea.gov
www.statcan.ca
http://demoscope.ru
http://www.ecsocman.edu.ru
Программное обеспечение курса:
Microsoft Excel,
SPSS,
Statistica
Размещено на Allbest.ru
...Подобные документы
Предмет и метод статистики. Группировка и ряд распределения. Абсолютные, относительные, средние величины, показатели вариации. Выборочное наблюдение, ряды динамики. Основы корреляционного и регрессионного анализа. Статистика населения и рынка труда.
методичка [2,2 M], добавлен 16.02.2011Сводка и группировка материалов статистического наблюдения. Абсолютные, относительные и средние величины, показатели вариации. Ряды динамики, индексный анализ. Проведение корреляционно-регрессионного анализа таблиц о сборе урожая и внесении удобрений.
курсовая работа [667,1 K], добавлен 14.05.2013Статистическое наблюдение; классификация признаков явлений; сводка и группировка. Ряды распределения и их графическое изображение; уровневые и интегральные графики. Динамические ряды, статистические таблицы, абсолютные, относительные и средние величины.
учебное пособие [217,1 K], добавлен 23.12.2009Предмет и метод статистической науки. Методология наблюдения, статистическая сводка, группировка, таблицы и графики, показатели и средние величины. Показатели вариации, выборочное наблюдение. Корреляционно-регрессионный анализ. Экономические индексы.
лекция [1,2 M], добавлен 02.01.2014Предмет и метод статистики. Сущность и основные аспекты статистического наблюдения. Ряды распределения. Статистические таблицы. Абсолютные величины. Показатели вариации. Понятие о статистических рядах динамики. Сопоставимость в рядах динамики.
шпаргалка [31,9 K], добавлен 26.01.2009Предмет и задачи статистики, ее категории. Статистические ряды распределения и их элементы. Виды статистических таблиц и графиков. Основные свойства арифметической, геометрической и хронологической средней. Показатели вариации и классификация индексов.
шпаргалка [65,8 K], добавлен 26.12.2010Систематизация материалов статистического наблюдения. Понятие статистической сводки как сводной характеристики объекта исследования. Статистические группировки, их виды. Принципы выбора группированного признака. Статистические таблицы и ряд распределения.
реферат [196,8 K], добавлен 04.10.2016Понятие статистики, история ее развития. Организация статистики в Российской Федерации. Понятие о статистическом наблюдении. Виды экономических индексов. Виды статистических показателей. Абсолютные и относительные величины. Этапы построения группировки.
лекция [92,0 K], добавлен 20.10.2010Предмет и метод статистики, сводка и группировка, абсолютные и относительные величины. Определение показателей вариации и дисперсии. Понятие о выборочном наблюдении и его задачи. Классификация экономических индексов. Основы корреляционного анализа.
контрольная работа [80,0 K], добавлен 05.06.2012Основные категории и понятия теории статистики. Ряды динамики и их применение в анализе социально-экономических явлений. Сводка и группировка статистических данных. Общая характеристика системы национальных счетов. Статистика рынка товаров и услуг.
курс лекций [68,4 K], добавлен 08.08.2009Сводка и группировка. Абсолютные и относительные величины. Расчет соотношения потребленного и вывезенного сахара. Сущность и значение средних показателей. Исчисление средней из интервального ряда распределения по методу моментов. Показатели вариации.
контрольная работа [75,7 K], добавлен 20.09.2013Основные категории статистики. Группировка - основа научной обработки данных статистики. Содержание сводки и статистическая совокупность. Построение вариационного, ранжированного и дискретного рядов распределения. Группировка предприятий по числу рабочих.
контрольная работа [23,3 K], добавлен 17.03.2015Абсолютные и относительные статистические показатели, методы прогнозирования. Закон распределения вероятностей дискретной случайной величины. Оценки параметров генеральной совокупности. Статистическое исследование социально-экономического потенциала.
шпаргалка [1,8 M], добавлен 16.05.2012Средние величины и показатели вариации. Расчет индивидуальных индексов выполнения плана по каждому виду продукции и её себестоимости. Группировка статистических материалов. Выборочное обследование партии готовой продукции. Базисные темпы роста и прироста.
контрольная работа [25,3 K], добавлен 30.08.2013Предмет и метод статистики, понятие статистического наблюдения: сводка, группировка, абсолютные и относительные величины, ряды динамики, индексы. Корреляционный анализ зависимости урожайности сельскохозяйственных культур от внесения минеральных удобрений.
дипломная работа [798,3 K], добавлен 13.05.2013История возникновения и развития статистики. Предмет, основные понятия и категории статистики. Методы сбора, обобщения и анализа статистических данных. Экономическая статистика и ее отрасли. Современная организация статистики в Российской Федерации.
лекция [16,5 K], добавлен 02.05.2012Основные понятия статистики. Организация статистического наблюдения. Ряды распределения, табличный метод представления данных. Статистическая сводка и группировка. Объекты уголовно-правовой, гражданско-правовой и административно-правовой статистики.
реферат [24,7 K], добавлен 29.03.2013Краткая история зарождения и развития статистики как науки. Предмет изучения и характеристика основных задач статистики. Статистические методы сбора и обработки данных для получения достоверных оценок и результатов. Источники статистических данных.
лекция [23,7 K], добавлен 13.02.2011Предмет и метод статистики. Сводка и группировка статистических данных. Функции статистических показателей. Статистические ряды, вариация и дисперсия. Преимущества выборочного наблюдения. Методы анализа корреляционных связей, экономические индексы.
методичка [371,4 K], добавлен 15.01.2010Понятие статистики как научного направления, предмет и методы ее изучения. Методы организации государственной статистики в РФ и международной практике, требования к данным. Сущность и порядок реализации корреляционно-регрессивного анализа и связей.
учебное пособие [6,2 M], добавлен 07.02.2010