Общая теория статистики
Понятие о статистике, обобщающие статистические показатели и вариационные ряды распределения. Статистическое изучение структуры совокупности, понятие и способы выборочного наблюдения. Показатели ряда динамики и статистическое изучение взаимосвязей.
Рубрика | Экономика и экономическая теория |
Вид | учебное пособие |
Язык | русский |
Дата добавления | 04.11.2014 |
Размер файла | 1,4 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
3) интервальный ряд - это таблица, состоящая из двух столбцов (строк) - интервалов варьирующего признака Xi и числа единиц совокупности, попадающих в данный интервал (частот), или долей этого числа в общей численности совокупностей (частостей).
Построим ряд распределения внешнеторгового оборота (ВО) по таможенным постам России, для чего необходимо провести статистическое наблюдение, то есть собрать первичный статистический материал, который представляет собой величину ВО по таможенным постам.
Результаты наблюдения ВО по 35 таможенным постам региона за отчетный период представим в виде ранжированного по возрастанию величины ВО ряда распределения (таблица 11).
Таблица 11. Внешнеторговый оборот (ВО) по 35 таможенным постам, млн.долл.
№ поста |
ВО |
№ поста |
ВО |
№ поста |
ВО |
|
1 |
24,16 |
13 |
54,12 |
25 |
65,31 |
|
2 |
27,06 |
14 |
54,91 |
26 |
69,24 |
|
3 |
29,12 |
15 |
55,74 |
27 |
71,39 |
|
4 |
31,17 |
16 |
55,91 |
28 |
77,12 |
|
5 |
37,08 |
17 |
56,07 |
29 |
79,12 |
|
6 |
39,11 |
18 |
56,80 |
30 |
84,34 |
|
7 |
41,58 |
19 |
56,93 |
31 |
86,89 |
|
8 |
44,84 |
20 |
57,07 |
32 |
91,74 |
|
9 |
46,80 |
21 |
58,39 |
33 |
96,01 |
|
10 |
48,37 |
22 |
59,61 |
34 |
106,84 |
|
11 |
51,44 |
23 |
59,95 |
35 |
111,16 |
|
12 |
52,56 |
24 |
62,05 |
Итого |
2100,00 |
Определим средний размер ВО по формуле (10), приняв за X величину ВО, а за N - численность постов:
== 2100/35 = 60 (млн.долл.)
Дисперсию (о ней будет рассказано чуть позднее - на 4-м этапе анализа вариации в этой теме) определим по формуле (28):
= = 445,778 (млн.долл.2)
Построим интервальный ряд распределения ВО по таможенным постам, для чего необходимо выбрать оптимальное число групп (интервалов признака) и установить длину (размах) интервала. Поскольку при анализе ряда распределения сравнивают частоты в разных интервалах, необходимо, чтобы длина интервалов была постоянной. Оптимальное число групп выбирается так, чтобы достаточной мере отразилось разнообразие значений признака в совокупности и в то же время закономерность распределении, его форма не искажалась случайными колебаниями частот. Если групп будет слишком мало, не проявится закономерность вариации; если групп будет чрезмерно много, случайные скачки частот исказят форму распределения.
Чаще всего число групп в ряду распределения определяют по формуле Стерждесса (19) или (20):
(19)или ,(20)
где k - число групп (округляемое до ближайшего целого числа); N - численность совокупности.
Из формулы Стерджесса видно, что число групп - функция объема данных (N).
Зная число групп, рассчитывают длину (размах) интервала по формуле (21):
,(21)
где Xмax и Xmin -- максимальное и минимальное значения в совокупности.
В нашем примере про ВО по формуле Стерждесса (19) определим число групп:
k = 1 + 3,322lg35 = 1+ 3,322*1,544 = 6,129 ? 6.
Рассчитаем длину (размах) интервала по формуле (21):
h = (111,16 - 24,16)/6 = 87/6 = 14,5 (млн.долл.).
Теперь построим интервальный ряд с 6 группами с интервалом 14,5 млн.долл. (см. первые 3 столбца табл. 12).
Таблица 12. Интервальный ряд распределения ВО по таможенным постам, млн.долл.
Группы постов по величине ВО Xi |
Число постов fi |
Середина интервала Хi' |
Хi'fi |
Накопл. частота fi' |
| Хi' -| fi |
(Хi' -)2 fi |
(Хi' -)3 fi |
|
24,16 - 38,66 |
5 |
31,41 |
157,05 |
5 |
147,071 |
4326,001 |
-127246,23 |
|
38,66 - 53,16 |
7 |
45,91 |
321,37 |
12 |
104,400 |
1557,051 |
-23222,31 |
|
53,16 - 67,66 |
13 |
60,41 |
785,33 |
25 |
5,386 |
2,231 |
-0,92 |
|
67,66 - 82,16 |
4 |
74,91 |
299,64 |
29 |
56,343 |
793,629 |
11178,84 |
|
82,16 - 96,66 |
4 |
89,41 |
357,64 |
33 |
114,343 |
3268,572 |
93434,47 |
|
96,66 - 111,16 |
2 |
103,91 |
207,82 |
35 |
86,171 |
3712,758 |
159966,81 |
|
Итого |
35 |
2128,85 |
513,714 |
13660,243 |
114110,66 |
Существенную помощь в анализе ряда распределения и его свойств оказывает графическое изображение. Интервальный ряд изображается столбиковой диаграммой, в которой основания столбиков, расположенные по оси абсцисс, - это интервалы значений варьирующего признака, а высоты столбиков - частоты, соответствующие масштабу по оси ординат. Графическое изображение распределения таможенных постов в выборке по величине ВО приведено на рис. 4. Диаграмма такого типа называется гистограммой.
Рис. 4. Гистограмма распределения
Данные табл. 12 и рис. 4 показывают характерную для многих признаков форму распределения: чаще встречаются значения средних интервалов признака, реже - крайние (малые и большие) значения признака. Форма этого распределения близка к нормальному закону распределения, которое образуется, если на варьирующую переменную влияет большое число факторов, ни один из которых не имеет преобладающего значения.
Если имеется дискретный ряд распределения или используются середины интервалов (как в нашем примере про ВО - в таблице 12 в 4-м столбце рассчитаны середины интервалов как полусумма значений начала и конца интервала), то графическое изображение такого ряда называется полигоном (см. рис. 5), которое получается соединением прямыми точек с координатами Xi и fi.
3.2 Расчет структурных характеристик ряда распределения
При изучении вариации применяются такие характеристики ряда распределения, которые описывают количественно его структуру, строение. Такова, например, медиана - величина варьирующего признака, делящая совокупность на две равные части - со значением признака меньше медианы и со значением признака больше медианы. В нашем примере про ВО (табл. 11) медиана - это 18-й таможенный пост из 35 с величиной ВО 56,8 млн.долл. Из этого примера видно принципиальное различие между медианой и средней величиной: медиана не зависит от значений на краях ранжированного ряда. Даже если бы ВО 35-го таможенного поста был в 10 раз больше, величина медианы не изменилась бы. Поэтому медиану часто используют как более надежный показатель типичного значения признака, нежели средняя арифметическая, если ряд значений неоднороден, включает резкие отклонения от средней. В интервальном ряду распределения для нахождения медианы применяется формула:
,(22)
где Ме - медиана;
X0 - нижняя граница интервала, в котором находится медиана;
h - величина (размах) интервала;
- накопленная частота в интервале, предшествующем медианному;
fMe - частота в медианном интервале.
В табл. 12 медианным является среднее из 35 значений, т.е. 18-е от начала значение ВО. Как видно из столбца накопленных частот (6-й столбец), оно находится в третьем интервале. Тогда по формуле (22):
(млн.долл.).
Аналогично медиане вычисляются значения признака, делящие совокупность на 4 равные по численности части - квартили, которые обозначаются заглавной латинской буквой Q с подписным значком номера квартиля. Ясно, что Q2 совпадает с Ме. Для первого и третьего квартилей приводим формулы и расчет по данным табл. 12:
(млн.долл.)
(млн.долл.)
Так как Q2 = Ме = 59,30 млн.долл., видно, что различие между первым квартилем и медианой (-15,87) больше, чем между медианой и третьим квартилем (12,89). Этот факт свидетельствует о наличии некоторой несимметричности в средней области распределения, что заметно и на рис. 4.
Значения признака, делящие ряд на 5 равных частей, называются квинтилями, на 10 частей - децилями, на 100 частей - перцентилями. Эти характеристики применяются при необходимости подробного изучения структуры ряда распределения.
Безусловно, важное значение имеет такая величина признака, которая встречается в изучаемом ряду распределения чаще всего. Такую величину принято называть модой. В дискретном ряду мода определяется без вычисления как значение признака с наибольшей частотой. Обычно встречаются ряды с одним модальным значением признака. Если в ряду распределения встречаются 2 или несколько равных (и даже несколько различных, но больших чем соседние) значений признака, то он считается соответственно бимодальным или мультимодальным. Это свидетельствует о неоднородности совокупности, возможно, представляющей собой агрегат нескольких совокупностей с разными модами. В интервальном ряду распределения интервал с наибольшей частотой является модальным. Внутри этого интервала находят условное значение признака, вблизи которого плотность распределения (число единиц совокупности, приходящихся на единицу измерения варьирующего признака) достигает максимума. Это условное значение и считается точечной модой. Логично предположить, что такая точечная мода располагается ближе к той из границ интервала, за которой частота в соседнем интервале больше частоты в интервале за другой границей модального интервала. Отсюда получаем обычно применяемую формулу (23):
,(23)
где Мо - мода;
Х0 - нижнее значение модального интервала;
fMo - частота в модальном интервале;
fMo-1 - частота в предыдущем интервале;
fMo+1 - частота в следующем интервале за модальным;
h - величина интервала.
По данным табл. 12 рассчитаем точечную моду по формуле (23):
(млн.долл.).
К изучению структуры ряда распределения средняя арифметическая величина также имеет отношение, хотя основное значение этого обобщающего показателя другое. В интервальном ряду распределения ВО по таможенным постам средняя арифметическая рассчитывается как взвешенная по частоте середина интервалов X (расчет числителя - в 5-м столбце табл. 12) по формуле (11):
== 2128,85/35 = 60,82 (млн.долл.).
Различие между средней арифметической величиной (60,82), медианой (59,30) и модой (58,96) в нашем примере невелико. Чем ближе распределение по форме к нормальному закону, тем ближе значения медианы, моды и средней величины между собой.
3.3 Расчет показателей размера и интенсивности вариации
Простейшим показателем является размах вариации - абсолютная разность между максимальным и минимальным значениями признака из имеющихся в изучаемой совокупности значений (24):
.(24)
Поскольку величина размаха характеризует лишь максимальное различие значений признака, она не может измерять закономерную силу его вариации во всей совокупности. Предназначенный для данной цели показатель должен учитывать и обобщать все различия значений признака в совокупности без исключения. Число таких различий равно числу сочетаний по два из всех единиц совокупности (в нашем примере про ВО число сочетаний составит ). Однако нет необходимости рассматривать, вычислять и осреднять все отклонения. Проще использовать среднюю из отклонений отдельных значений признака от среднего арифметического значения признака, а таковых в нашем примере про ВО всего 35. Но среднее отклонение значений признака от средней арифметической величины согласно первому свойству последней равно нулю. Поэтому показателем силы вариации выступает не арифметическая средняя отклонений, а средний модуль отклонений, или среднее линейное отклонение (25):
.(25)
В нашем примере про ВО по данным табл. 12 среднее линейное отклонение вычисляется как взвешенное по частоте отклонение по модулю середин интервалов от средней арифметической величины (расчет числителя произведен в 7-м столбце табл. 12), т.е. по формуле (26):
(млн.долл.).(26)
Это означает, что в среднем величина ВО в изучаемой совокупности таможенных постов отклонялась от средней величины ВО в РФ на 14,678 млн.долл.
Простота расчета и интерпретации составляют положительные стороны показателя Л, однако математические свойства модулей «плохие»: их нельзя поставить в соответствие с каким-либо вероятностным законом, в том числе и с нормальным распределением, параметром которого является не средний модуль отклонений, а среднее квадратическое отклонение, обозначаемое малой греческой буквой сигма () или s и вычисляемое по формуле (27) - для ранжированного ряда и по формуле (28) - для интервального ряда:
; (27)
. (28)
В нашем примере про ВО по данным табл. 12 среднее квадратическое отклонение величины ВО по формуле (28) составило (расчет числителя произведен в 8-м столбце табл. 12):
(млн.долл.).
Среднее квадратическое отклонение по величине в реальных совокупностях всегда больше среднего модуля отклонений. Разница между ними тем больше, чем больше в изучаемой совокупности резких, выделяющихся отклонений, что служит индикатором «засоренности» совокупности неоднородными с основной массой элементами. Для нормального закона распределения отношение . В нашем примере про ВО: , т.е. в изучаемой совокупности наблюдаются некоторое число таможенных постов с отличающимися от основной массы величинами ВО.
Квадрат среднего квадратического отклонения представляет собой дисперсию отклонений, на использовании которой основаны практически все методы математической статистики, ее формула имеет вид (29) - для несгруппированных данных (простая дисперсия) и (30) - для сгруппированных (взвешенная дисперсия):
; (29)
.(30)
Еще одним показателем силы вариации, характеризующим ее не по всей совокупности, а лишь в ее центральной части, служит среднее квартильное расстояние (отклонение), т.е. средняя величина разности между квартилями, определяемая по формуле (31):
.(31)
В нашем примере про ВО по формуле (31): (млн.долл.).
Сила вариации в центральной части совокупности, как правило, меньше, чем в целом по всей совокупности. Соотношение между средним линейным отклонением и средним квартильным расстоянием служит для изучения структуры вариации: большое значение такого соотношения свидетельствует о наличии слабоварьирующего «ядра» и сильно рассеянного вокруг него окружения в изучаемой совокупности. Для нашего примера про ВО соотношение Л/q = 1,021, что говорит о совсем незначительном различии силы вариации в центральной части совокупности и на ее периферии.
Для оценки интенсивности вариации и для сравнения ее в разных совокупностях и тем более для разных признаков необходимы относительные показатели вариации, которые вычисляются как отношение абсолютных показателей силы вариации, рассмотренных ранее, к средней арифметической величине признака, то есть показатели (32) - (35):
относительный размах вариации: ;(32)
линейный коэффициент вариации: ;(33)
квадратический коэффициент вариации: ;(34)
относительное квартильное расстояние: .(35)
В нашем примере про ВО эти показатели составляют:
= 87/60,82 =1,43, или 143%; = 14,678/60,82 = 0,241, или 24,1%;
= 19,756/60,82 = 0,32, или 32%; d = 14,38/60,82 = 0,236, или 23,6%.
Оценка степени интенсивности вариации возможна только для каждого отдельного признака и совокупности определенного состава, она состоит в сравнении наблюдаемой вариации с некоторой обычной ее интенсивностью, принимаемой за норматив. Так, для совокупности таможенных постов вариация величины ВО может быть определена как слабая, если < 25%, умеренная при 25% < < 50% и сильная при > 50%.
Различная сила, интенсивность вариации обусловлены объективными причинами, поэтому нельзя говорить о каком-либо универсальном критерии вариации (например, 33%), так как для разных явлений и признаков этот критерий различен.
3.4 Расчет моментов распределения и показателей его формы
Для дальнейшего изучения характера вариации используются средние значения разных степеней отклонений отдельных величин признака от его средней арифметической величины. Эти показатели называются центральные моменты распределения порядка, соответствующего степени, в которую возводятся отклонения (табл. 13) или просто моментов (нецентральные моменты в таможенной статистике практически не используются).
Таблица 13. Центральные моменты
Порядок момента |
Формула |
||
по несгруппированным данным |
по сгруппированным данным |
||
Первый м1 |
|||
Второй м2 |
|||
Третий м3 |
|||
Четвертый м4 |
Величина третьего момента м3 зависит, как и его знак, от преобладания положительных кубов отклонений над отрицательными кубами либо наоборот. При нормальном и любом другом строго симметричном распределении сумма положительных кубов строго равна сумме отрицательных кубов, поэтому на основе третьего момента строится показатель, характеризующий степень асимметричности распределения - коэффициент асимметрии (36):
.(36)
В нашем примере про ВО показатель асимметрии по формуле (36) составил (расчет числителя произведен в 9-м столбце табл. 12):
= 0,423 > 0, т.е. асимметрия значительна.
Английский статистик К.Пирсон на основе разности между средней арифметической величиной и модой предложил другой показатель асимметрии (37):
.(37)
В нашем примере по данным табл. 12 показатель асимметрии по формуле (37) составил: = 0,09.
Показатель асимметрии Пирсона (37) зависит от степени асимметричности в средней части ряда распределения, а показатель асимметрии (36) - от крайних значений признака. Таким образом, в нашем примере про ВО в средней части распределения наблюдается меньшая асимметрия, чем по краям, что видно и по графику (рис. 5). Распределения с сильной правосторонней и левосторонней асимметрией показаны на рис. 6.
С помощью момента четвертого порядка характеризуется еще более сложное свойство рядов распределения - эксцесс (от англ. «излишество»). Показатель эксцесса рассчитывается по формуле (38):
.(38)
Чаще всего эксцесс интерпретируется как «крутизна» распределения, что не совсем верно. График распределения может выглядеть сколь угодно крутым в зависимости от силы вариации признака: чем слабее вариация, тем круче кривая распределения при данном масштабе. Не говоря уже о том, что, изменяя масштабы по осям абсцисс и ординат, любое распределение можно искусственно сделать «крутым» и «пологим». Чтобы показать, в чем состоит эксцесс распределения, и правильно его интерпретировать, нужно сравнить ряды с одинаковой силой вариации (одной и той же величиной у) и разными показателями эксцесса. Чтобы не смешать эксцесс с асимметрией, все сравниваемые ряды должны быть симметричными.
Наличие положительного эксцесса означает наличие слабоварьирующего «ядра» и сильно рассеянного вокруг него окружения в изучаемой совокупности. Отрицательный эксцесс означает отсутствие такого «ядра».
В нашем примере по формуле (38) эксцесс составил (расчет числителя произведен в 10-м столбце табл. 12): , т.е. величина ВО по таможенным постам варьирует сильнее, чем при нормальном распределении.
По значениям показателей асимметрии и эксцесса распределения можно судить о близости распределения к нормальному: показатели асимметрии и эксцесса не должны превышать своих двукратных средних квадратических отклонений, т.е. и . Эти средние квадратические отклонения вычисляются по формулам (39) и (40):
; (39)
.(40)
В нашем примере по формулам (39) и (40):
; .
Так как показатели асимметрии и эксцесса не превышают своих двукратных средних квадратических отклонений (As = |0,423| < 0,4*2; Ex = |-0,41| < 0,78*2), можно говорить о сходстве анализируемого распределения с нормальным.
3.5 Проверка соответствия ряда распределения нормальному
Под теоретической кривой распределения понимается графическое изображение ряда в виде непрерывной линии изменения частот в вариационном ряду, функционально связанного с изменением вариантов, другими словами, теоретическое распределение может быть выражено аналитически - формулой, которая связывает частоты и соответствующие значения признака. Такие алгебраические формулы носят название законов распределения. Большое познавательное значение имеет сопоставление фактических кривых распределения с теоретическими.
Как уже неоднократно отмечалось, часто пользуются типом распределения, которое называется нормальным. Формула функции плотности нормального распределения имеет следующий вид (41):
(41)
где X - значение изучаемого признака;
- средняя арифметическая ряда;
у - среднее квадратическое отклонение;
- нормированное отклонение;
р = 3,1415 - постоянное число (отношение длины окружности к ее диаметру);
e = 2,7182 - основание натурального логарифма.
Следовательно, кривая нормального распределения может быть построена по двум параметрам - средней арифметической и среднему квадратическому отклонению. Поэтому важно выяснить, как эти параметры влияют на вид нормальной кривой.
Если не меняется, а изменяется только у, то чем меньше у, тем более вытянута вверх кривая и наоборот, чем больше у, тем более плоской и растянутой вдоль оси абсцисс становится кривая нормального распределения (см. рис. 8).
Рис. 8. Влияние величины у на кривую нормального распределения
Если у остается неизменной, а изменяется, то кривые нормального распределения имеют одинаковую форму, но отличаются друг от друга положением максимальной ординаты (вершины) (см. рис. 9).
Рис. 9. Влияние величины на кривую нормального распределения
Итак, выделим особенности кривой нормального распределения:
1) кривая симметрична и имеет максимум в точке, соответствующей значению = Ме = Мо;
2) кривая асимптотически приближается к оси абсцисс, продолжаясь в обе стороны до бесконечности (чем больше отдельные значения X отклоняются от , тем реже они встречаются);
3) кривая имеет две точки перегиба на расстоянии ± у от ;
4) коэффициенты асимметрии и эксцесса равны нулю.
Гипотезы о распределениях заключаются в том, что выдвигается предположение о том, что распределение в изучаемой совокупности подчиняется какому-то определенному закону. Проверка гипотезы состоит в том, чтобы на основании сравнения фактических (эмпирических) частот с предполагаемыми (теоретическими) частотами сделать вывод о соответствии фактического распределения гипотетическому распределению.
Под гипотетическим распределением необязательно понимается нормальное распределение. Может быть выдвинута гипотеза о логнормальном, биномиальном распределениях, распределении Пуассона и пр. Причина частого обращения к нормальному распределению состоит в том, что, как уже было замечено ранее, в этом типе распределения выражается закономерность, возникающая при взаимодействии множества случайных причин, когда ни одна из не имеет преобладающего влияния.
В нашем примере про ВО близость значений средней арифметической величины (60,82), медианы (59,30) и моды (58,96) указывает на вероятное соответствие изучаемого распределения нормальному закону.
Проверка гипотезы о соответствии теоретическому распределению предполагает расчет теоретических частот этого распределения.
Для нормального распределения порядок расчета этих частот следующий:
1) по эмпирическим данным рассчитывают среднюю арифметическую ряда и среднее квадратическое отклонение у;
2) находят нормированное (выраженное в у) отклонение каждого эмпирического значения от средней арифметической:
;(42)
3) по формуле (41) или с помощью таблиц интеграла вероятностей Лапласа находят значение ц(t);
4) вычисляют теоретические частоты m по формуле:
,(43)
где N - объем совокупности, hi - длина (размах) i-го интервала.
Определим теоретические частоты нормального распределения в нашем примере про ВО по данным табл. 12, для чего построим вспомогательную таблицу 14. Средняя арифметическая величина и среднее квадратическое отклонение нами уже найдены ранее (); значения нормированных отклонений t рассчитаны в 5-м столбце таблицы 14, а значения плотностей ц(t) - в 8-м столбце (в 6-м и 7-м столбцах приведены промежуточные расчеты по формуле (41)); в последнем столбце - теоретические частоты нормального распределения.
Таблица 14. Расчет теоретических частот нормального распределения
i |
Xi |
fi |
Хi' |
ц(t) |
mi |
||||
1 |
24,16 - 38,66 |
5 |
31,41 |
-1,4889 |
-1,1084 |
0,3301 |
0,0067 |
3,383 |
|
2 |
38,66 - 53,16 |
7 |
45,91 |
-0,7549 |
-0,2850 |
0,7520 |
0,0152 |
7,707 |
|
3 |
53,16 - 67,66 |
13 |
60,41 |
-0,0210 |
-0,0002 |
0,9998 |
0,0202 |
10,246 |
|
4 |
67,66 - 82,16 |
4 |
74,91 |
0,7130 |
-0,2542 |
0,7756 |
0,0157 |
7,948 |
|
5 |
82,16 - 96,66 |
4 |
89,41 |
1,4470 |
-1,0468 |
0,3510 |
0,0071 |
3,598 |
|
6 |
96,66 - 111,16 |
2 |
103,91 |
2,1809 |
-2,3782 |
0,0927 |
0,0019 |
0,950 |
|
Итого |
35 |
33,832 |
Сравним на графике эмпирические f (ВО по таможенным постам) и теоретические m (нормальное распределение) частоты, полученные на основе данных табл. 14 (рис. 10). Близость этих частот очевидна, но объективная оценка их соответствия может быть получена только с помощью критериев согласия.
Рис. 10. Распределение ВО по таможенным постам (эмпирическое) и нормальное
Критерии согласия, опираясь на установленный закон распределения, дают возможность установить, когда расхождения между теоретическими и эмпирическими частотами следует признать несущественными (случайными), а когда - существенными (неслучайными). Таким образом, критерии согласия позволяют отвергнуть или подтвердить правильность выдвинутой гипотезы о характере распределения в эмпирическом ряду и дать ответ, можно ли принять для данного эмпирического распределения модель, выраженную некоторым теоретическим законом распределения.
Существует ряд критериев согласия, но чаще всего применяют критерии Пирсона ч2, Колмогорова и Романовского.
Критерий согласия Пирсона ч2 (хи-квадрат) - один из основных критериев согласия, рассчитываемый по формуле (44):
, (44)
где k - число интервалов;
fi - эмпирическая частота i-го интервала;
mi - теоретическая частота.
Для распределения ч2 составлены таблицы, где указано критическое значение критерия согласия ч2 для выбранного уровня значимости б и данного числа степеней свободы н (см. Приложение 3).
Уровень значимости б - это вероятность ошибочного отклонения выдвинутой гипотезы, т.е. вероятность (P) того, что будет отвергнута правильная гипотеза. В статистических исследованиях в зависимости от важности и ответственности решаемых задач пользуются следующими тремя уровнями значимости:
1) б = 0,10, тогда P = 0,90;
2) б = 0,05, тогда P = 0,95;
3) б = 0,01, тогда P = 0,99.
Число степеней свободы н определяется по формуле:
н = k - z - 1, (45)
где k - число интервалов;
z - число параметров, задающих теоретический закон распределения.
Для нормального распределения z = 2, так как нормальное распределение зависит от двух параметров - средней арифметической () и среднего квадратического отклонения (у).
Для оценки существенности расхождений расчетное значение ч2 сравнивают с табличным ч2табл. Расчетное значения критерия должно быть меньше табличного, т.е. ч2<ч2табл, в противном случае расхождения между теоретическим и эмпирическим распределением не случайны, а теоретическое распределение не может служить моделью для изучаемого эмпирического распределения.
Использование критерия ч2 рекомендуется для достаточно больших совокупностей (N>50), при этом частота каждой группы не должна быть менее 5, в противном случае повышается вероятность получения ошибочных выводов.
В нашем примере про ВО для расчета критерия ч2 построим вспомогательную таблицу 15.
статистический распределение наблюдение динамика
Таблица 15. Вспомогательные расчеты критериев согласия
i |
Xi |
fi |
mi |
fi' |
mi' |
|fi'- mi'| |
||
1 |
24,16 - 38,66 |
5 |
3,383 |
0,773 |
5 |
3,383 |
1,617 |
|
2 |
38,66 - 53,16 |
7 |
7,707 |
0,065 |
12 |
11,090 |
0,910 |
|
3 |
53,16 - 67,66 |
13 |
10,246 |
0,740 |
25 |
21,336 |
3,664 |
|
4 |
67,66 - 82,16 |
4 |
7,948 |
1,961 |
29 |
29,284 |
0,284 |
|
5 |
82,16 - 96,66 |
4 |
3,598 |
0,045 |
33 |
32,882 |
0,118 |
|
6 |
96,66 - 111,16 |
2 |
0,950 |
1,160 |
35 |
33,832 |
1,168 |
|
Итого |
35 |
33,832 |
4,744 |
Теперь по формуле (44): ч2 =4,744, что меньше табличного (Приложение 3) значения ч2табл=7,8147 при уровне значимости б = 0,05 и числе степеней свободы н=6-2-1=3, значит с вероятностью 0,95 можно говорить, что в основе эмпирического распределения величины ВО по таможенным постам лежит закон нормального распределения, т.е. выдвинутая гипотеза не отвергается, а расхождения объясняются случайными факторами.
Критерий Романовского КР основан на использовании критерия Пирсона ч2, т.е. уже найденных значений ч2 и числа степеней свободы н, рассчитывается по формуле (46):
.(46)
Он используется в том случае, когда отсутствует таблица значений ч2. Если КР < 3, то расхождения между теоретическим и эмпирическим распределением случайны, если КР > 3, то не случайны, и теоретическое распределение не может служить моделью для изучаемого эмпирического распределения.
В нашем примере про ВО по формуле (46): = 0,712 < 3, что подтверждает несущественность расхождений между эмпирическими и теоретическими частотами.
Критерий Колмогорова л основан на определении максимального расхождения между накопленными частотами эмпирического и теоретического распределений (D), рассчитывается по формуле (47):
.(47)
Рассчитав значение л, по таблице P(л) (см. Приложение 6) определяют вероятность, с которой можно утверждать, что отклонения эмпирических частот от теоретических случайны. Вероятность P(л) может изменяться от 0 до 1. При P(л) = 1 (т.е. при л < 0,3) происходит полное совпадение частот, при P(л) = 0 - полное расхождение.
В нашем примере про ВО в последних трех столбцах таблицы 15 приведены расчеты накопленных частот и разностей между ними, откуда видно, что в 3-ей группе наблюдается максимальное расхождение (разность) D = 3,664. Тогда по формуле (47): . По таблице Приложения 6 находим значение вероятности при л = 0,6: P = 0,86 (наиболее близкое значение к 0,619), т.е. с вероятностью, близкой к 0,86, можно говорить, что в основе эмпирического распределения величины ВО по таможенным постам лежит закон нормального распределения, а расхождения эмпирического и теоретического распределений носят случайный характер.
Итак, подтвердив правильность выдвинутой гипотезы с помощью известных критериев согласия, можно использовать результаты распределения для практической деятельности. Какое же практическое значение может иметь произведенная проверка гипотезы? Во-первых, соответствие нормальному закону позволяет прогнозировать, какое число таможенных постов (или их доля) попадет в тот или иной интервал значений величины ВО. Во-вторых, нормальное распределение возникает при действии на вариацию изучаемого показателя множества независимых факторов. Из чего следует, что нельзя существенно снизить вариацию величины ВО, воздействуя только на один-два управляемых фактора, скажем число работников таможенного поста или степень технической оснащенности.
3.6 Проверка соответствия ряда распределения закону Пуассона
Таможенная инспекция провела проверку после выпуска товаров. В результате получен следующий дискретный ряд распределения числа нарушений, выявленных в каждой проверке (табл. 16).
Таблица 16. Ряд распределения числа нарушений, выявленных таможенной инспекцией
Число нарушений |
0 |
1 |
2 |
3 |
|
Число проверок |
24 |
4 |
2 |
1 |
Проведем анализ этого ряда распределения. Сначала рассчитаем среднее число нарушений в выборке, а также его дисперсию, для чего построим вспомогательную таблицу 17.
Таблица 17. Ряд распределения числа нарушений, выявленных таможенной инспекцией
ЧислонарушенийX |
Числопроверокf |
Xf |
(Х -)2 f |
m |
f' |
m' |
|f'- m'| |
||
0 |
24 |
0 |
3,022 |
21,7 |
0,244 |
24 |
21,7 |
2,3 |
|
1 |
4 |
4 |
1,665 |
7,7 |
1,778 |
28 |
29,4 |
1,4 |
|
2 |
2 |
4 |
5,413 |
1,4 |
0,257 |
30 |
30,8 |
0,8 |
|
3 |
1 |
3 |
6,997 |
0,2 |
3,200 |
31 |
31 |
0 |
|
Итого |
31 |
11 |
17,097 |
31 |
5,479 |
Среднее число нарушений в выборке по формуле (11): = 11/31 = 0,355 (нарушений).
Дисперсию определим по формуле (28): = = 0,552 (нарушений2).
Построив график этого распределения (полигон) - рис. 11, видно, что данное распределение не похоже на нормальное.
Рис. 11. Кривая распределения числа нарушений, выявленных таможенной инспекцией
Из структурных характеристик ряда распределения можно определить только моду: Мо = 0, так как по данным табл. 17 такое число нарушений чаще всего встречается (f=24).
По формуле (24) определим размах вариации: H = 3 - 0 = 3, что характеризует вариацию в 3 нарушения.
По формуле (26) найдем среднее линейное отклонение:
.
Это означает, что в среднем число нарушений отклоняется от среднего их числа на 0,55.
Среднее квадратическое отклонение рассчитаем не по формуле (28), а как корень из дисперсии, которая уже была рассчитана нами выше: , тогда , т.е. в изучаемом распределении наблюдается некоторое число выделяющихся нарушений (с большим числом нарушений, выявленных в одной проверке).
Поскольку квартили на предыдущем этапе не определялись, на данном этапе расчет среднего квартильного расстояния пропускаем.
Теперь рассчитаем относительные показатели вариации:
– относительный размах вариации по формуле (32): = 3/0,355 = 8,45;
– линейный коэффициент вариации по формуле (33): = 0,550/0,355 = 1,55;
– квадратический коэффициент вариации по формуле (34): = 0,743/0,355 = 2,09.
Все расчеты на данном этапе свидетельствуют о значительных размере и интенсивности вариации нарушений, выявленных таможенной инспекцией.
Не имеет практического смысла расчет моментов распределения, так как видно из рис. 11, что в изучаемом распределении симметрия отсутствует вовсе, поэтому и расчет эксцесса также бесполезен.
Выдвинем гипотезу о соответствии изучаемого распределения распределению Пуассона, которое описывается формулой (48):
,(48)
где P(X) - вероятность того, что признак примет то или иное значение X;
e = 2,7182 - основание натурального логарифма;
X! - факториал числа X (т.е. произведение всех целых чисел от 1 до X включительно);
a = - средняя арифметическая ряда распределения.
Из формулы (48) видно, что единственным параметром распределения Пуассона является средняя арифметическая величина. Порядок определения теоретических частот этого распределения следующий:
1) рассчитать среднюю арифметическую ряда, т.е. = a;
2) рассчитать e-a;
3) для каждого значения X рассчитать теоретическую частоту по формуле (49):
4)
.(49)
Поскольку a == 0,355 найдем значение e - 0,355 =0,7012. Затем, подставив в формулу (49) значения X от 0 до 3, вычислим теоретические частоты:
m0 = (т.к. 0! = 1); m1 = ;
m2 = ; m3 = .
Полученные теоретические частоты занесем в 5-й столбец табл. 17 и построим график эмпирического и теоретического распределений (рис. 12), из которого видна близость эмпирического и теоретического распределений.
Рис. 12. Эмпирическая и теоретическая (распределение Пуассона) кривые распределения
Проверим выдвинутую гипотезу о соответствии изучаемого распределения закону Пуассона с помощью критериев согласия.
Рассчитаем значение критерия Пирсона ч2 по формуле (44) в 6-м столбце табл. 17: ч2 =5,479, что меньше табличного (Приложение 3) значения ч2табл=5,9915 при уровне значимости б = 0,05 и числе степеней свободы н=4-1-1=2, значит с вероятностью 0,95 можно говорить, что в основе эмпирического распределения лежит закон распределения Пуассона, т.е. выдвинутая гипотеза не отвергается, а расхождения объясняются случайными факторами.
Определим значение критерия Романовского по формуле (46):
= 1,74 < 3, что подтверждает несущественность расхождений между эмпирическими и теоретическими частотами.
Для расчета критерия Колмогорова в последних трех столбцах таблицы 17 приведены расчеты накопленных частот и разностей между ними, откуда видно, что в 1-ой группе наблюдается максимальное расхождение (разность) D = 2,3. Тогда по формуле (47): . По таблице Приложения 6 находим значение вероятности при л = 0,4: P = 0,9972 (наиболее близкое значение к 0,413), т.е. с вероятностью, близкой к единице, можно говорить, что в основе эмпирического распределения величины нарушений, выявленных таможенной инспекцией, лежит закон распределения Пуассона, а расхождения эмпирического и теоретического распределений носят случайный характер.
3.7. Контрольные задания
На основе условных ранжированных данных таблицы 18 провести анализ вариации величины налоговых сборов (тыс. руб.) с предприятий района, собранных налоговыми органами.
4. Статистическое изучение структуры совокупности
4.1 Абсолютные и относительные показатели изменения структуры
Развитие статистической совокупности проявляется не только в количественном росте или уменьшении элементов системы, но также и в изменении ее структуры. Структура - это строение совокупности, состоящее из отдельных элементов и связей между ними. Например, экспорт страны (совокупность) состоит из различных видов товаров (элементов), стоимость которых различается по видам и по странам. Кроме того, происходит постоянное изменение структуры экспорта в динамике. Соответственно возникает задача изучения структуры совокупностей и их динамики, для чего разработаны специальные методы, которые будут рассмотрены далее.
В теме 2 был рассмотрен индекс структуры, рассчитываемый по формуле (6), который характеризует долю отдельных элементов в итоге абсолютного признака совокупности. В теме 3 рассмотрена система показателей и методика анализа распределения совокупности по значениям какого-либо отдельного признака (вариационный ряд распределения). Здесь излагаются показатели, характеризующие изменение структуры в целом, т.е. «структурный сдвиг». Практическое применение этих показателей рассмотрим на двух примерах, представленных в таблицах 19 и 20 (первые 4 столбца, выделенные полужирным шрифтом, - исходные данные, а остальные - вспомогательные расчеты).
Таблица 19. Распределение населения России по величине среднедушевых денежных доходов (СДД)
№группы(j) |
СДД,руб./чел.в месяц |
Доли населения |
|d1-d0| |
(d1-d0)2 |
(d1+d0)2 |
|||||
2005 год(d0) |
2006 год(d1) |
|||||||||
1 |
до 1500 |
0,032 |
0,018 |
0,014 |
0,0010 |
0,0003 |
0,0002 |
0,0025 |
0,0784 |
|
2 |
1500-2500 |
0,088 |
0,058 |
0,030 |
0,0077 |
0,0034 |
0,0009 |
0,0213 |
0,0422 |
|
3 |
2500-3500 |
0,113 |
0,085 |
0,028 |
0,0128 |
0,0072 |
0,0008 |
0,0392 |
0,0200 |
|
4 |
3500-4500 |
0,114 |
0,094 |
0,020 |
0,0130 |
0,0088 |
0,0004 |
0,0433 |
0,0092 |
|
5 |
4500-6000 |
0,149 |
0,135 |
0,014 |
0,0222 |
0,0182 |
0,0002 |
0,0807 |
0,0024 |
|
6 |
6000-8000 |
0,149 |
0,149 |
0,000 |
0,0222 |
0,0222 |
0,0000 |
0,0888 |
0,0000 |
|
7 |
8000-12000 |
0,174 |
0,197 |
0,023 |
0,0303 |
0,0388 |
0,0005 |
0,1376 |
0,0038 |
|
8 |
более 12000 |
0,181 |
0,264 |
0,083 |
0,0328 |
0,0697 |
0,0069 |
0,1980 |
0,0348 |
|
Итого |
1,000 |
1,000 |
0,212 |
0,1420 |
0,1687 |
0,0099 |
0,6114 |
0,1909 |
Таблица 20. Распределение численности безработных России по уровню образования в 2006 г.
№ группы(j) |
Имеют образование |
Мужчины(d0) |
Женщины(d1) |
|d1-d0| |
|||
1 |
Высшее профессиональное |
0,087 |
0,130 |
0,043 |
0,0076 |
0,0169 |
|
2 |
Неполное высшее профессиональное |
0,019 |
0,023 |
0,004 |
0,0004 |
0,0005 |
|
3 |
Сpеднее профессиональное |
0,130 |
0,221 |
0,091 |
0,0169 |
0,0488 |
|
4 |
Начальное профессиональное |
0,200 |
0,149 |
0,051 |
0,0400 |
0,0222 |
|
5 |
Сpеднее (полное) общее |
0,398 |
0,338 |
0,060 |
0,1584 |
0,1142 |
|
6 |
Основное общее |
0,148 |
0,121 |
0,027 |
0,0219 |
0,0146 |
|
7 |
Начальное общее, не имеют образ-я |
0,018 |
0,018 |
0,000 |
0,0003 |
0,0003 |
|
Итого |
1,000 |
1,000 |
0,276 |
0,2455 |
0,2177 |
Обобщающим абсолютным показателем изменения структуры может служить сумма модулей абсолютных изменений долей, определяемая по формуле (50):
,(50)
где d1j - доля j-ой группы элементов в отчетном периоде; d0j - доля j-ой группы элементов в базисном периоде.
По данным таблицы 19 в 5-м столбце произведен расчет по формуле (50): =0,212, то есть суммарное изменение долей в распределении россиян по доходам составило 21,2%. Аналогично по той же формуле по данным таблицы 20: =0,276, то есть различие структуры безработных среди женщин и мужчин по уровню образованию составляет 27,6%.
Расчет среднего абсолютного изменения, приходящегося на одну долю (группу, элемент совокупности) не дает никакой дополнительной информации. Зато можно определить, насколько сильно произошедшее изменение структуры в сравнении с предельно возможной величиной суммы модулей, которая равна 2. Для этого используется показатель степени интенсивности абсолютного сдвига (или индекс Лузмора-Хэнби), который определяется по формуле (51):
.(51)
По данным таблицы 19 по формуле (51): =0,106, то есть интенсивность изменения долей в распределении россиян по доходам составила 10,6% от максимально возможного. Аналогично по той же формуле по данным таблицы 20: =0,138, то есть различие структуры безработных среди женщин и мужчин по уровню образованию составляет 13,8% от максимально возможного.
Обобщенная оценка степени структуризации явления в целом обычно выполняется по формуле уровня концентрации (или коэффициент Герфиндаля), который более чувствителен к изменению долей групп с наибольшим удельным весом в итоге, определяемый по формуле (52):
(52)
где - доля -го объекта в общем итоге изучаемого показателя; k - количество объектов.
По данным таблицы 19 в 6-м и 7-м столбцах произведен расчет коэффициента Герфиндаля по формуле (52): H2005=0,142 и H2006=0,1687, то есть уровень концентрации в распределении россиян по доходам увеличился в 2006 году по сравнению с 2005 годом. Аналогично по той же формуле по данным таблицы 20: Hмуж=0,2455 и Hжен=0,2177, то есть уровень концентрации в распределении безработных по уровню образованию среди мужчин выше, чем среди женщин (влияние уровня образования на статус безработного среди мужчин выше, чем среди женщин).
Обратная индексу Герфиндаля величина - это эффективное число групп в структуре, которое показывает количество групп без учета групп, имеющих ничтожно малые доли, определяется по формуле (53):
E = 1/H.(53)
По данным таблицы 19 эффективное число групп по формуле (53): E2005=1/0,142=7,0 и E2006=5,9, то есть эффективное число групп в распределении россиян по доходам уменьшилось с 7 в 2005 году до 6 в 2005 году, что свидетельствует о необходимости пересмотра интервалов распределения россиян по доходам в будущем году. Аналогично по той же формуле по данным таблицы 20: Eмуж=1/0,2455=4,07 и Eжен=1/0,2177=4,59, то эффективное число групп в распределении безработных по уровню образованию среди мужчин выше и среди женщин - 4 у мужчин и 5 у женщин.
Еще один вариант оценки степени структуризации явления в целом - индекс Грофмана (54), который представляет собой сумму модулей абсолютных изменений долей, приходящихся на одну эффективную группу:
.(54)
По данным таблицы 19 в по формуле (54): =0,212*0,142=0,030, то есть изменение долей, приходящихся на одну эффективную группу в распределении россиян по доходам незначительно (3,0%). Аналогично по той же формуле по данным таблицы 20: =0,2455*0,276=0,068, то есть различие структуры в расчете на одну эффектиную группу среди безработных женщин и мужчин по уровню образованию слабое (6,8%).
Для оценки изменений двух наибольших долей (доминантные доли) применяется индекс Липхарта (55):
.(55)
где d1m и d0m - доля m-ой группы элементов в отчетном периоде и базисном периодах; m - максимальная доля в совокупности.
По данным таблицы 19 по формуле (55): =0,5*(0,083+0,023)=0,053, то есть среднее изменение долей в двух доминантных группах распределения россиян по доходам составило 5,3%. Аналогично по той же формуле по данным таблицы 20: =0,5*(0,060+0,051)=0,056, то есть различие структуры в двух доминантных группах среди безработных женщин и мужчин по уровню образованию составляет 5,6%.
Рассмотренные показатели основаны на средней арифметической в различных вариантах, и из-за их линейности по отклонениям они одинаково учитывают большие и малые отклонения. Квадратические индексы позволяют сравнивать различные структуры, неразличимые с точки зрения суммы изменений.
Квадратический индекс структурных сдвигов Казинца (56):
.(56)
По данным таблицы 19 по формуле (56): ==0,035, то есть среднее измененение долей в группе в распределении россиян по доходам составило 3,5% (незначительно). Аналогично по той же формуле по данным таблицы 20: ==0,049, то есть различие в группах в структуре безработных среди женщин и мужчин по уровню образованию составляет 4,9% (несущественно).
Аналогичен индексу Казинца индекс наименьших квдратов (или индекс Галлахера), при расчете которого, в отличие от формулы (51), малые разности долей слабее влияют на индекс, чем большие, определяется по формуле (57):
.(57)
По данным таблицы 19 по формуле (57): ==0,070, то есть интенсивность изменения долей в распределении россиян по доходам составила 7,0%. Аналогично по той же формуле по данным таблицы 20: ==0,092, то есть различие структуры безработных среди женщин и мужчин по уровню образованию составляет 9,2%.
Незначительную модификацию индекса наименьших квадратов представляет индекс Монро (58):
.(58)
По данным таблицы 19 по формуле (58): ==0,093, то есть интенсивность изменения долей в распределении россиян по доходам по формуле Монро составила 9,3%. Аналогично по той же формуле по данным таблицы 20: ==0,117, то есть различие структуры безработных среди женщин и мужчин по уровню образованию по формуле Монро составляет 11,7%.
Интегральный коэффициент структурных сдвигов Гатева (59), который различает структуры с равными суммами квадратов отклонений (принимает более высокие значения, когда группы имеют примерно одинаковые доли):
.(59)
По данным таблицы 19 по формуле (59): ==0,179, то есть интенсивность изменения долей в распределении россиян по доходам по методике Гатева составила 17,9% (незначительно). Аналогично по той же формуле по данным таблицы 20: ==0,192, то есть различие структуры безработных среди женщин и мужчин по уровню образованию по методике Гатева составляет 19,2% (незначительно).
Индекс Рябцева, отличающийся от (59) только знаменателем, принимает обычно более низкие значения, рассчитывается по формуле (60):
.(60)
По данным таблицы 19 по формуле (60): ==0,127, то есть интенсивность изменения долей в распределении россиян по доходам по методике Рябцева составила 12,7% (незначительно). Аналогично по той же формуле по данным таблицы 20: ==0,137, то есть различие структуры безработных среди женщин и мужчин по уровню образованию по методике Рябцева составляет 13,7% (достаточно значительно).
Индекс структурных различий Салаи (61), особенноситью которого является то, что чем больше доля j-ой группы, тем большее значение будет принимать 2, что ведет к уменьшению вклада j-ой группы в общей сумме, тем самым увеличивая значимость изменения долей малых групп:
(61)
По данным таблицы 19 по формуле (61): ==0,154, то есть ...
Подобные документы
Предмет и метод статистики. Сущность и основные аспекты статистического наблюдения. Ряды распределения. Статистические таблицы. Абсолютные величины. Показатели вариации. Понятие о статистических рядах динамики. Сопоставимость в рядах динамики.
шпаргалка [31,9 K], добавлен 26.01.2009Характеристика предмета статистики как общественной науки, статистическое изучение массовых явлений. Понятие статистической совокупности, проведение анкетного опроса покупателей для изучения контингента. Статистические показатели коммерческих банков.
контрольная работа [24,9 K], добавлен 11.08.2015Абсолютные и относительные статистические показатели, методы прогнозирования. Закон распределения вероятностей дискретной случайной величины. Оценки параметров генеральной совокупности. Статистическое исследование социально-экономического потенциала.
шпаргалка [1,8 M], добавлен 16.05.2012Статистическое наблюдение; классификация признаков явлений; сводка и группировка. Ряды распределения и их графическое изображение; уровневые и интегральные графики. Динамические ряды, статистические таблицы, абсолютные, относительные и средние величины.
учебное пособие [217,1 K], добавлен 23.12.2009Классификация ошибок наблюдения в зависимости от причин возникновения. Особенности ошибок регистрации и репрезентативности. Преимущества выборочного наблюдения перед сплошным. Допустимый уровень ошибки. Понятие ряда динамики в статистической науке.
контрольная работа [73,8 K], добавлен 22.06.2015Статистическая методология и статистические показатели. Принципы организации статистики, его роль в плановой и рыночной экономике. Реформирование казахстанской статистики. Формы статистического наблюдения. Статистические отчетность, сводка и переписи.
курс лекций [475,4 K], добавлен 11.02.2010Статистическое наблюдение. Понятие и содержание статистической сводки. Группировка – основа статистической сводки. Статистические ряды распределения. Осуществление конкретной аналитической группировки. Табличное представление статистических данных.
курсовая работа [172,8 K], добавлен 22.12.2010Статистическое изучение рядов динамики, виды показателей. Расчет коэффициента смыкания. Цепной и базисный показатель. Средний уровень динамического ряда. Определение общей закономерности в развитии явления. Статистическое изучение сезонных колебаний.
лекция [325,3 K], добавлен 27.04.2013Статистическое изучение динамики показателей страхового рынка. Построение статистического ряда группировки страховых организаций по размеру денежных доходов, расчёт характеристик ряда распределения. Расчет ошибки выборки средней величины доходов.
курсовая работа [236,9 K], добавлен 03.01.2010Общая характеристика органов пенсионного обеспечения, организация работы органов Пенсионного фонда Российской Федерации. Статистические показатели и их расчет: средние величины, показатели вариации, ряды динамики, индексы, трендовый анализ, группировка.
курсовая работа [256,8 K], добавлен 15.06.2010Статистическое изучение состава и структуры оборотных средств, показатели эффективности их использования. Вычисление индивидуального, общего и факторного индексов. Анализ динамики производительности труда в целом по объединению, по предприятиям.
контрольная работа [38,2 K], добавлен 09.02.2009Исследование структуры совокупности организаций по признаку "среднегодовая стоимость материальных оборотных фондов". Характеристика ряда интервального ряда распределения: средней арифметической, среднеквадратического отклонения, коэффициента вариации.
курсовая работа [586,0 K], добавлен 07.05.2015Определение среднего значения показателя в совокупности. Вариационный анализ статистической совокупности по показателю. Проведение выборочного наблюдения и корреляционно-регрессионного анализа. Построение уравнения парной регрессии, ряды динамики.
курсовая работа [290,2 K], добавлен 29.11.2011Социально-экономическая сущность инвестиционного процесса. Показатели статистики инвестиций и методология их исчисления. Статистическое изучение финансовых инвестиций, инвестиций в нефинансовые активы. Определение экономической эффективности инвестиций.
курсовая работа [339,7 K], добавлен 10.08.2011Основные показатели миграции населения. Анализ социально-экономического положения России. Статистическое исследование структуры и динамики миграционных процессов в стране. Оценка факторов и прогнозирование уровня миграционной активности населения.
курсовая работа [294,9 K], добавлен 05.08.2011Цели и задачи экономической статистики и статистического наблюдения. Характеристика бюджетов домашних хозяйств и методов количественного измерения их доходов. Статистическое изучение расходов и доходов населения и потребления материальных благ и услуг.
курсовая работа [637,7 K], добавлен 27.03.2010Систематизация материалов статистического наблюдения. Понятие статистической сводки как сводной характеристики объекта исследования. Статистические группировки, их виды. Принципы выбора группированного признака. Статистические таблицы и ряд распределения.
реферат [196,8 K], добавлен 04.10.2016Ошибки статистического наблюдения. Способы контроля отчетных данных. Отрасль как объект изучения статистики. Определение относительной величины структуры, интенсивности; среднегодовой урожайности, себестоимости продукции; выработки деталей; фонда времени.
контрольная работа [48,8 K], добавлен 11.11.2010Анализ сути прибыли, ее роли в деятельности предприятия, а также порядка ее исчисления и анализа статистическими методами. Понятие рентабельности и статистическое изучение ее показателей. Применение выборочного и метода в финансово-экономических задачах.
курсовая работа [611,9 K], добавлен 12.12.2012Статистическое наблюдение, формы, виды статистического наблюдения и отчетности. Статистические показатели, характеризующие экономическую деятельность организаций. Классификация, группировка и номенклатура - их роль в статистическом исследовании.
шпаргалка [1,3 M], добавлен 31.05.2008