Основы статистики

Статистика как наука, изучающая закономерности изменений количественных сторон массовых социально-экономических явлений. Рассмотрение основных вопросов, касающихся основных положений общей теории статистики, сделан упор на практическое их применение.

Рубрика Экономика и экономическая теория
Вид книга
Язык русский
Дата добавления 08.09.2021
Размер файла 2,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Средняя величина правильно характеризует однородные по своему содержанию совокупности. Такая средняя будет типичной, так как она отражает то общее, что характерно для данной совокупности общественных явлений.

Если же совокупность в целом по составу неоднородна, то для получения типичных средних необходимо с помощью метода группировок расчленить такую совокупность на однородные группы и после этого исчислить средние величины для каждой группы отдельно.

В статистике применяется несколько видов средних величин, которые входят в две группы - степенные и структурные.

Степенные средние величины

Степенные средние в зависимости от представления исходных данных могут быть простыми и взвешенными.

Признак, по которому находится средняя, называется осредняемым признаком и обозначается . Величины осредняемого признака у каждой единицы совокупности называются индивидуальными его значениями или вариантами. Обозначаются как . Число повторений индивидуальных значений признака - это частоты или статистические веса, обозначаются .

Если варианты значений признака ( ) встречаются одинаковое число раз, расчеты проводятся по средней простой, если варианты повторяются неодинаковое число раз ( имеет разные частоты f), то расчеты проводятся по средней взвешенной.

Формула степенной простой в общем виде:

,

- индивидуальное значение признака -й единицы совокупности, - показатель степени средней величины, - число единиц совокупности

Формула степенной средней взвешенной в общем виде:

,

- частота повторения i-й варианты.

При k = -1- средняя гармоническая, k = 0 - средняя геометрическая,

k = 1 - средняя арифметическая, k = 2 - средняя квадратическая.

Правило мажорантности средних величин

Если рассчитать все виды средних для одних и тех же исходных данных, то значения их окажутся неодинаковыми. Действует, так называемое, правило мажорантности средних: с увеличением показателя степени m увеличивается и соответствующая средняя величина:

Выше было сказано, что рассмотренные виды степенных средних величин можно получить из формулы степенной средней.

При различных значениях показателя получаются различные средние.

Порядок возрастания этих средних определяет показатель степени k в формуле степенной средней, т.е. чем больше k, тем больше средняя:

Таблица 26

k

-1

0

1

2

Название средней

гармоническая

геометрическая

арифметическая

квадратическая

Средняя арифметическая

Cредняя арифметическая - наиболее распространенный вид средней. Она применяется в тех случаях, когда объем осредняемого признака по всей совокупности является суммой значений признаков отдельных ее единиц, например, фонд заработной платы - это сумма заработных плат отдельных рабочих и т. п. При исчислении средней арифметической сумма всех значений признаков делится на их число.

В зависимости от частоты повторения средняя арифметическая делится на два способа расчета:

1. средняя арифметическая простая, не учитывает повторяемость признака и применяется в двух случаях:

- если данные не сгруппированы,

- если данные сгруппированы, но частоты равны.

2. средняя арифметическая взвешенная, применяется в том случае, если частоты неравны.

Расчет средней арифметической взвешенной состоит в следующем:

1) находится произведение признака на частоту по группам,

2) эти произведения суммируются,

3) находится сумма частот,

4) сумма произведения делиться на сумму частот.

В интервальном ряду распределения расчет средней проводится следующим образом:

1) интервальный ряд превращается в дискретный, переходом от двух границ к центру интервала (исчисляется как арифметическая простая из крайних границ);

2) открытые интервалы закрываются по условной длине, равной длине соседнего интервала.

В остальном расчет осуществляется, как и в дискретном ряду.

Средняя арифметическая простая исчисляется путем деления суммы значений признака на число значений.

,

где - средняя арифметическая,

x - отдельные значения признака;

n - число значений признака.

Пример. По состоянию на 14 октября имеются следующие данные о расходе металла 8 рабочими (кг): 17,2; 19,0; 20,0; 17,0; 18,0; 19,8; 18,0; 18,6.

Для того чтобы определить средний расход металла на одного рабочего, необходимо общий расход металла разделить на число рабочих:

кг.

Если данные представлены в виде дискретного ряда распределения c неравными частотами значений признака, то расчет средней производится по формуле средней арифметической взвешенной:

,

х - значение признака; f - частота повторения соответствующего признака (веса). Пример

Таблица 27. Определить средние затраты времени на обработку детали по следующим данным:

Затраты времени (сек.) на обработку детали (х)

Число деталей (f)

46

250

48

400

50

150

Итого

800

сек.

Если данные представлены в виде интервального ряда распределения, то принцип расчета средней остается прежним, но предварительно вычисляется среднее значение признака для каждого интервала, представляющее полусумму нижнего и верхнего значений интервала:

,

.

- нижняя граница интервала,

- верхняя граница интервала.

Если есть интервалы с открытыми границами, то для первой группы величина интервала берется равной величине интервала последующей группы.

Cуществует и упрощенный способ расчета средней величины в интервальных рядах. Называется он «способ моментов». Данный способ основан на свойствах средних величин.

Согласно свойствам средней арифметической, если все частоты ряда уменьшить или увеличить в одинаковое количество раз, то средняя не изменится, если все варианты увеличить или уменьшить на одно и то же число или в одно и то же количество раз, то и средняя изменится на это же число или в это же количество раз.

Средняя способом моментов исчисляется так:

,

где - момент первого порядка.

Момент первого порядка определяется так:

,

А - постоянная величина, за которую принимается варианта (середина интервала) находящаяся в центре ряда.

i - величина интервала.

Таблица 28. Пример. Известны следующие данные о распределении рабочих предприятия по стажу работы (лет).

Стаж работы (x)

Число рабочих (f)

до 5

15

5 - 10

25

10 - 15

12

15 - 20

28

20 и более

20

Определить средний стаж работы одного рабочего.

Среднее значение признака из интервального ряда можно определить двумя способами:

1) по средней арифметической взвешенной:

2) способом моментов:

I способ расчета:

года.

II способ расчета:

Таблица 29. Для расчета вторым способом составим вспомогательную таблицу:

Стаж работы, лет

(x)

Число

рабочих, чел (f)

Cередина интервала

А = 12,5

А) / i = 12,5) / 5

до 5

15

(0+5)/2=2,5

-10

-2

-30

5 -10

25

(5+10)/2=7,5

-5

-1

-25

10 - 15

12

(10+15)/2=12,5

0

0

0

15 - 20

28

(15+20)/2=17,5

+5

+1

+28

20 и более

20

(20+25)/2=22,5

+10

+2

+40

Итого

100

-

-

-

13

Подставив данные таблицы в формулы, получим:

,

года.

Оба способа расчета дали одинаковый результат.

Средняя гармоническая

Средняя гармоническая - это величина, обратная средней арифметической. Применяется, если заданы объемы явлений (объемы признаков), но не известны частоты.

По способу расчета средняя гармоническая бывает:

1) Простая. Применяется, когда объемы признака (n) равны.

.

2) Взвешенная. Примняется, когда известны индивидуальные значения признака (х), но не заданы веса (f), которые входят сомножителем в известный объемный показатель (М = х f).

.

В практической работе часто возникает задача выбора формы средней величины между средней арифметической взвешенной и средней гармонической взвешенной. Для этого необходимо составить исходную схему расчета показателя:

.

.

.

.

.

.

Если в условии задачи известен знаменатель исходной схемы, а неизвестен числитель, то применяется средняя арифметическая взвешенная.

Если известен числитель, а знаменатель - нет, то используется средняя гармоническая взвешенная.

Пример

Три предприятия производят одинаковые товары. Себестоимость одного товара составляет: на 1-ом предприятии 50 руб., на 2-ом 60 руб., на 3-ем 80 руб.

Определить среднюю себестоимость товара при условии, что общие затраты на производство товара на всех предприятиях одинаковы.

Составим исходную схему расчета (исходное соотношение):

.

Так как общие затраты на всех предприятиях одинаковы, а значения признака (себестоимости) известны (x), расчет выполняем по средней гармонической простой:

руб.

Таблица 30. Пример. Средняя выработка продукции на одного рабочего за смену в двух цехах завода, вырабатывающих однородную продукцию, характеризуется следующими данными:

Бригада

Цех № 1

Бригада

Цех № 2

дневная выработка продукции, шт

число рабочих, чел

дневная выработка продукции, шт

объем произведенной продукции, шт.

I

20

8

IV

38

418

II

30

11

V

36

432

III

35

16

VI

20

140

Определить среднюю дневную выработку продукции рабочих по каждому цеху.

Логическое исходное соотношение:

.

По первому цеху расчет произведем по средней арифметической взвешенной, поскольку по условию задачи известен знаменатель логической схемы расчета, т. е. число рабочих или частота появления признака:

шт.

По второму цеху - по средней гармонической взвешенной, т.к. известен числитель логической схемы расчета, т.е объем произведенной продукции, и не известен знаменатель - число рабочих:

шт.

Пример

Автомобиль проехал 1000 км, из них 480 км он прошел со скоростью 60 км/час, 320 со скоростью 80 км/час и 200 км со скоростью 50 км/час. Определите среднюю скорость, с которой совершался рейс.

Логическое исходное соотношение:

,

В этой задаче опять известны только значения признака, а значения частот (время) не даны, однако имеются данные о пройденном расстоянии, которое является произведением признака на частоту. В этом случае средняя рассчитывается по формуле средней гармонической взвешенной:

,

Средняя квадратическая и средняя кубическая

Средняя квадратическая и средняя кубическая необходимы для расчета средних значений, когда исходные данные представлены в квадратных или кубических единицах измерения.

Например, средняя квадратическая используется для вычисления средней величины стороны квадратных участков, средних диаметров труб, среднего отклонения от норм.

Средняя кубическая используется при определении средней длины стороны кубов.

Если при замене индивидуальных величин признака на среднюю величину необходимо сохранить неизменной сумму квадратов исходных величин, то средняя будет являться квадратической средней величиной.

Средняя квадратическая простая исчисляется по следующей формуле:

,

где - значения признака, n - число признаков.

Средняя квадратическая взвешенная:

,

где - веса.

Средняя кубическая простая определяется по формуле:

,

где где - значения признака, n - число признаков.

Средняя кубическая взвешенная:

,

где - веса.

Пример

Имеются три участка земельной площади со сторонами квадрата: = 100 м; = 200 м; =300 м. Определить среднюю сторону квадрата (участка).

Заменяя разные значения длины сторон на среднюю, мы, очевидно, должны исходить из сохранения общей площади всех участков.

Арифметическая средняя величина (100+200+300)/3 =200 м не удовлетворяет этому условию, так как общая площадь трех участков со стороной 200 м была бы равна: 3·.

В то же время площадь исходных трех участков равна:

.

Правильный ответ дает квадратическая средняя:

м.

Средняя геометрическая

Средняя геометрическая применяется для осреднения относительных величин. Чаще всего используется для определения средних коэффициентов роста, темпов роста и темпов прироста. Средняя геометрическая простая исчисляется по следующей формуле:

,

где m - число коэффициентов роста,

- относительные величины (коэффициенты роста).

Средний коэффициент роста можно определить и по значениям первого и последнего членов динамического ряда. Если первый уровень ряда обозначить, а последний - , то средняя геометрическая примет вид:

,

где n - число уровней ряда (число периодов).

Пример

Определить среднегодовой коэффициент роста выпуска продукции на заводе, если в 2012 году было произведено продукции на 21,15 млн. руб., а в 2017 году было запланировано произвести продукции на 35 млн. руб.

Когда имеются данные о первом периоде (в нашем случае выпуск продукции в 2012 году на сумму 21,15 млн. руб.) и в последнем периоде (в задаче - выпуск продукции по плану в 2017 году на сумму тыс.35 млн. руб.), среднегодовой коэффициент роста определяется так:

.

Структурные средние

Мода, медиана, децили, квартили - это структурные средние величины.

Мода - это наиболее часто встречающееся значение признака в совокупности. В дискретном ряду моде соответствует наибольшая частота. В интервальном вариационном ряду модальное значение определяют так:

,

где - мода,

- нижняя граница модального интервала, т. е. интервала, которому соответствует наибольшая частота,

- величина модального интервала,

- частота модального интервала,

и - частоты интервалов, предшествующего и последующего за модальным.

,

где - медиана,

- нижняя граница медианного интервала, т. е. интервала, где нахо дится средняя частота,

- величина медианного интервала,

- сумма накопленных частот до медианного интервала,

- частота медианного интервала.

Медиане соответствует интервал, в котором первая из накопленных частот больше или равна половине суммы всех частот, т.е. .

Квартили и децили исчисляются по той же схеме. Сначала находятся накопленные частоты. Затем по накопленным частотам определяют интервал, соответствующий искомой квартили или децили.

Децили делят совокупность на 10 равных частей, квартили - на четыре.

Первая квартиль делит совокупность на 25% и 75%, определяется по формуле:

.

Первая квартиль находится в том интервале, где первая накопленная частота .

Третья квартиль делит совокупность на 75% и 25%, определяется по формуле:

.

Третья квартиль находится в том интервале, где первая накопленная частота

.

Первая дециль делит совокупность на 10% и 90%, определяется по формуле:

.

Первая дециль находится в том интервале, где первая накопленная частота .

Девятая дециль делит совокупность на 90% и 10%, определяется по формуле:

.

Девятая дециль находится в том интервале, где первая накопленная частота

.

Структурные средние часто применяются на практике. Например, при анализе уровня жизни населения рассчитывают коэффициент дифференциации доходов населения. Он исчисляется следующим образом:

,

где - нижняя дециль по доходам населения или наименьший доход 10% населения с самыми высокими доходами, - верхняя дециль по доходам населения или наибольший доход 10% населения с самыми низкими доходами.

Медиана часто используется при обработке данных в медицине.

Квартили применяются при распределении научных журналов по степени цитируемости и значимости в научном сообществе. Так, лучшие журналы попадают в первую и вторую квартиль.

Таблица 31. Пример. Данные о распределении населения по среднедушевому денежному доходу приведены в таблице:

Группы населения по среднедушевым денежным доходом, руб./мес.

Удельный вес каждой группы, в % к итогу

Все население

100,0

в том числе:

До 5000

1,9

5000-10000

6,4

10000-15000

26,2

15000-20000

34,5

20000-25000

23,8

25000 и выше

7,2

Определить среднедушевой месячный доход, модальный и медианный доход, квартили доходов, нижнюю и верхнюю децили, коэффициент дифференциации доходов населения.

Таблица 32. Для расчета показателей составим вспомогательную таблицу:

Среднедушевой

денежный доход,

руб./мес.

Численность

населения,

% к итогу

Середина

интервала

Накопленная

частость численности населения

До 5000

1,9

2500

4750

1,9

5000-10000

6,4

7500

48000

8,3

10000-15000

26,2

12500

327500

34,5

15000-20000

34,5

17500

603750

69,0

20000-25000

23,8

22500

535500

92,8

25000 и выше

7,2

27500

198000

100

Итого

100

1717500

Среднедушевой денежный доход определим по формуле средней арифметической взвешенной:

.

Для исчисления модального дохода определим модальный интервал по наибольшей частоте. Наибольшая частота равна 34,5%, соответственно модальный интервал 15000-20000.

Модальный доход:

.

Таким образом, наиболее часто встречающийся доход населения 17184,2 рубля.

Для определения медианы вычислим накопленные частоты.

, значит медиана находится в интервале 15000-20000.

Медианный доход:

.

Следовательно 50% населения имеет доход меньше, чем 17246,4 рубля и 50% - больше, чем 17246,4 рубля.

Нижняя квартиль:

.

Следовательно, 25% населения имеет доход меньше, чем 13187 рублей, и 75% населения имеет доход больше, чем 13187 рублей.

Верхняя квартиль:

.

Следовательно, 75% населения имеет доход меньше, чем 21260,5 рублей, и 25% населения имеет доход больше, чем 21260,5 рублей.

Нижняя дециль:

.

Верхняя дециль:

.

Децильный коэффициент дифференциации:

..

Таким образом, разница между доходами 10% самых богатых и 10% самых бедных слоев населения составляет 2,36 раз.

Задачи для решения

Таблица 33. Задача 1. Известны данные о распределении наличных денег в купюрах в России на начало 2007 и 2017 годов:

Наличные деньги в купюрах

Удельный вес отдельных купюр в общей сумме, %

1.01.2007 (d0)

1.01.2017 (d1)

Всего

100,0

100,0

в т. ч. банкноты достоинством:

10 рублей

0

7

50 рублей

1

10

100 рублей

4

1

500 рублей

21

4

1000 рублей

69

22

5000 рублей

0

73

Определить показатели средней купюрности за каждый год.

Таблица 34. Задача 2. По двум группам предприятий одной отрасли промышленности имеются следующие данные о заработанной плате:

1 группа

2 группа

№ предприятия

Средняя зарплата,тыс. р.

Численность работающих

№ предприятия

Средняя зарплата, т. р.

Фонд оплаты по труду, тыс. р.

1

49,0

100

1

50,0

4500

2

52,0

120

2

54,0

5670

3

56,0

90

3

57,0

4950

По каждой группе предприятий определить среднюю зарплату, указав вид средней величины.

Таблица 35. Задача 3. Данные о распределении населения по среднедушевому денежному доходу населения в регионе приведены в таблице:

Все население

100,0

в том числе со среднедушевым денежным доходом, руб./мес.:

До 7000

3,4

7000 - 14000

5,6

14000 - 21000

21

21000 - 28000

43

28000 - 35000

12

35000 - 42000

10

42000 - 49000

3

49000 и выше

2

Определить среднедушевой месячный доход, модальный и медианный доход, квартили и децили доходов, нижнюю и верхнюю децили, децильный коэффициент дифференциации доходов населе ния.

Таблица 36. Задача 4. Данные о перевозке грузов автотранспортным предприятием приведены в таблице:

Перевезено грузов, тыс. тонн

январь

февраль

март

апрель

май

июнь

июль

август

сентябрь

октябрь

ноябрь

декабрь

35

40

42

50

52

47

64

59

56

54

67

43

Определить среднемесячный коэффициент роста грузовых перевозок

Таблица 37. Задача 5. По двум предприятиям известны следующие данные о выработке рабочих и объеме произведенной, продукции:

предприятия

Базисный период

Отчетный период

Средняя выработка на 1

рабочего, р.

Количество производственных участков

Число

рабочих

Средняя выработка на 1

рабочего, р.

Количество производственных участков

Общий объем

продукции, тыс. р.

1

1200

5

50

1300

4

58,5

2

1450

7

70

1480

6

91,76

По двум предприятиям вместе в базисном и отчетном периодах рас считать среднюю выработку на одного рабочего, указав виды используемых средних величин.

Таблица 38. Задача 6. За два отрезка времени известны следующие данные о затратах времени на производство однородной продукции:

предприятия

Базисный период

Отчетный период

Затраты времени на единицу продукции, час

Количество продукции, единиц

Затраты времени на единицу продукции, час

Затраты времени на весь выпуск, час.

1

4,1

50

214,5

3,9

2

4,6

80

420

4,2

3

5

40

153

5,1

В каждом из периодов по трем предприятиям вместе определить средние затраты времени на производство единицы продукции. Указать вид используемых средних величин.

Таблица 39. Задача 7. Имеются следующие данные о расходе сырья на производство одно родной продукции по двум предприятиям:

предприятия

Базисный период

Отчетный период

Расход сырья на 1 т готовой продукции, кг

Количество израсходованного сырья, кг

Расход сырья на 1 т готовой продукции, кг

Готовая продукция, т

1

700

14000

690

25

2

680

14960

675

28

Определить средний расход сырья на 1 т готовой продукции за каждый период по двум предприятиям вместе. Обосновать выбор способа расчета средней.

Таблица 40. Задача 8. Известны данные по двум акционерным обществам:

1 акционерное общество

2 акционерное общество

№ предприятия

Плановый объем производства, млн. р.

Процент выполнения плана

№ предприятия

объем производства, млн. р.

Процент выполнения плана

1

220

98

1

150

97

2

190

100

2

180

101

3

270

90

3

230

99

4

190

102

По каждой группе предприятий определись средний процент выполнения плана по объему производства. Указать вид используемых средних величин.

Таблица 41. Задача 9. Имеются следующие данные о выработке продукции и затратах рабочего времени на ее производство по двум заводам:

Выпуск продукции, млн. р.

Выработка на 1 человеко-день, р.

Отработано человеко-дней

Выработка на 1 человеко-день, р.

Завод 1

22

1000

2100

1200

Завод 2

25,74

1300

1900

1500

Определить среднюю выработку на один отработанный человеко-день по двум заводам в целом: а) в базисном периоде; б) в отчетном периоде.

Объяснить выбранные способы расчета средней.

Таблица 42. Задача 10. По трем объединенным торговым предприятиям известны следующие данные:

предприятия

Фактический объем товарооборота, тыс. р.

Процент выполнения плана

Процент возвращенных покупателями товаров

1

3000

98

1

2

2500

100

1,5

3

2800

99

0,5

Определить средний процент выполнения плана и средний процент возвращенных покупателями товаров, указав виды средних величин.

Таблица 43. Задача 11. Известны данные о затратах топлива по предприятию. Перевести топливо в условное топливо с теплотой сгорания 29,3 МДж/кг. Определить среднемесячный темп роста объема затраченного топлива в сумме.

Виды топлива

Теплота сгорания, МДж/кг

Затраты топлива:

январь

февраль

март

апрель

Каменный уголь

26,8

27

30

22

18

Газ

49,0

30

34

40

41

Бензин

45,0

56

55

49

44

Дизельное

42,7

100

89

95

94

Таблица 42. Задача 12 Среднегодовая численность работников организаций по строительной отрасли Иркутской области характеризуется следующими данными:

Годы

2002

2003

2004

2005

2006

2007

2008

2009

2010

Среднегодовая численность работников

44286

39640

38635

37681

33521

46013

48237

45108

42368

Определить: базисные и цепные темпы прироста численности работников, а также средний темп прироста за 9 лет.

Таблица 43. Задача 13 Известно распределение населения региона по группам доходов. По этим данным рассчитайте модальный и медианный доход населения:

Распределение населения по доходам, руб.

Численность данной группы, тыс. чел.

До 10000

40

10000-20000

65

20000-30000

105

30000-40000

87

40000-50000

13

50000-60000

11

60000-70000

8

70000 и выше

5

Таблица 44. Задача 14. Известны следующие данные рыночной продажи товара:

Продавец

Первое полугодие

Второе полугодие

Цена за единицу, руб.

Количество проданных ед., тыс.

Цена за единицу, руб.

Выручка от продажи, тыс. руб.

1

20

25

22

660

2

22

25

24

720

3

25,5

25

25

750

Итого

-

75

-

2130

Определите среднюю цену за каждое полугодие. Объясните выбор формулы в каждом случае.

Таблица 45. Задача 15. Сделайте подстановку (проставьте номера определений, соответствующих данным показателям):

Номер определения

Определение

Номер

показателя

Показатель

1

Варианта, стоящая в середине ранжированного ряда

Средняя квадратическая

2

Наиболее часто встречающееся значение признака

Средняя арифметическая взвешенная

3

Используется при вычислении среднего коэффициента роста

Средняя хронологическая

4

Сумма взвешенных вариантов признака, деленная на сумму весов

Средняя геометрическая

5

Применяется, когда приходится осреднять величины, входящие в исходную информацию в виде квадратических функций

Мода

6

Используется при вычислении средних значений признака в моментных рядах динамики

Медиана

6. Показатели вариации и выборочное наблюдение

Вариация признака - это изменчивость его численных значений. Для измерения вариации признака используют ряд показателей; размах вариации, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение, коэффициент вариации. Самым фундаментальным показателем вариации является дисперсия. При решении задач, где следует определить дисперсию, желательно для облегчения вычислений воспользоваться способом «моментов». Причем этим способом предварительно рассчитывают среднюю величину. В условиях этих задач обычно дан интервальный вариационный ряд распределения. Открытые интервалы, т. е. не имеющие верхней или нижней границы, следует «закрыть», приравнивая шаг интервала к соседнему. Средняя величина исчисляется способом моментов следующим образом:

,

где М1 - момент первого порядка;

i - величина (шаг) интервала;

А - постоянное число, обычно варианта с наибольшей частотой.

Момент первого порядка - это тоже средняя величина, вычисленная из уменьшенных значений признака:

.

Расчет средней способом моментов основан на ее свойствах. Дисперсия по способу моментов определяется следующим образом:

,

где 2 - дисперсия;

М2 - момент второго порядка.

.

Другие способы расчета дисперсии:

,

.

Среднее квадратическое отклонение () - это корень квадратный из дисперсии, т. Е

.

Cреднее квадратическое отклонение показывает, на сколько в среднем конкретные варианты отличаются от средней величины. Коэффициент вариации V характеризует относительную степень вариации и определяется:

.

Если коэффициент вариации >33%, то рассматриваемая совокупность является однородной (колебания индивидуальных значений признака небольшая).

По коэффициенту вариации можно судить о типичности средней величины. В однородной совокупности средняя величина является типичной.

Таблица 46. Пример Известны следующие данные о продаже товара за два года:

Квартал

2008 год

2011 год

Цена, руб.

Количество проданных товаров, тыс. шт.

Цена, руб.

Выручка от продажи товаров, тыс. руб.

1

23

30

28

980

2

25

20

29

522

3

25

15

30

600

4

30

10

32

640

Итого

-

75

-

2742

Выявить степень устойчивости цен посредством вариационного анализа (коэффициентов вариации). Сделать выводы.

Определим средние цены в 2008 году и в 2011 году:

,

.

Рассчитаем среднее квадратическое отклонение за каждый год:

В 2008 году:

.

В 2011 году:

.

Коэффициент вариации в 2008 году равен:

.

Коэффициент вариации в 2011году равен:

.

Значения коэффициентов вариации <33%, то есть говорят о том, что цены устойчивы, не подвержены большим внутригодовым колебаниям.

В некоторых случаях возникает необходимость измерить вариацию альтернативного признака (может принимать только два значения). Обозначив отсутствие интересующего нас признака через 0, его наличие через 1, долю единиц, обладающих данным признаком через р, не обладающих через q, дисперсию альтернативного признака можно определить следующим образом:

.

Пример

В банке 73% работников имеют высшее образование. Дисперсия данного признака равна:

.

Правило сложения дисперсий

На вариацию признака влияют различные причины и факторы, которые делятся на случайные и систематические.

В связи с этим возникает необходимость в определении случайной систематической составляющей и её роли в общей вариации.

Общую дисперсию мы рассмотрели ранее. Она характеризует общую вариацию признака под влиянием всех причин, вызывающих эту вариацию и исчисляется по формуле:

.

Для определения влияния постоянного фактора на величину вариации пользуются аналитической группировкой.

Вариация, обусловленная фактором, положенным в основание группировки, называется межгрупповой вариацией.

Размеры ее определяются при помощи межгрупповой дисперсии, которая характеризует отклонения групповых средних от общей средней:

,

где - средняя по каждой отдельной группе,

- средняя по всей совокупности,

- число единиц совокупности,

- частоты или веса.

Для определения влияния случайных факторов и их роли в общей вариации определяют внутригрупповую дисперсию, а затем среднюю из внутригрупповых дисперсий:

,

где - индивидуальные значения признака,

- групповые средние.

Средняя из групповых дисперсий определяется по формуле:

.

Общая дисперсия признака равна сумме межгрупповой дисперсии и средней из внутригрупповых дисперсий.

.

На базе общей и межгрупповой дисперсии можно определить коэффициент детерминации и показатель взаимосвязи явлений - эмпирическое корреляционное отношение.

Коэффициент детерминации характеризует долю вариации группировочного признака в общей вариации результативного признака. Коэффициент детерминации определяется отношением межгрупповой и общей дисперсии:

.

Эмпирическое корреляционное отношение показывает тесноту связи (силу интенсивности) между группировочным и результативным признаками. Оно определяется как корень квадратный из коэффициента детерминации:

.

Таблица 47 Для качественной оценки тесноты связи пользуются шкалой Чеддока:

Значения

0,1-0,3

0,3-0,5

0,5-0,7

0,7-0,9

0,9-0,99

Сила связи

Слабая

Умеренная

Заметная

Тесная

Весьма тесная

Определение предельной ошибки выборки с помощью дисперсии

С помощью дисперсии можно рассчитать предельную ошибку выборки для расчета средней величины и доли.

Предельная ошибка для средней величины - рассчитывается следующим образом:

,

где t - коэффициент доверия, связанный с определенной степенью вероятности; например при вероятности 0,997 t = 3. При вероятности 0,954 t = 2;

2 -дисперсия признака;

n - численность выборочной совокупности;

N - численность генеральной совокупности.

Выражение означает долю необследованных единиц и используется в качестве множителя только при бесповторном отборе.

После определения предельной ошибки находят возможные границы генеральной средней:

,

где - выборочная средняя.

При разных видах выборки используются разные виды дисперсий. Так, при механической выборке используется общая дисперсия, при серийной выборке - средняя из групповых дисперсий, при районированной выборке - межгрупповая дисперсия.

Возможная граница генеральной доли находится:

,

где р - доля единиц, обладающих изучаемым признаком в генеральной совокупности;

W - доля единиц, обладающих изучаемым признаком в выборочной совокупности;

ДW - предельная ошибка для доли:

.

Выборочная доля определяется отношением числа единиц, обладающих изучаемым признаком, к общему числу обследованных единиц - .

Таблица 48. Пример. В результате 10% механической выборки были получены следующие данные о весе изделий:

Группы изделий по весу, г.

Число изделий

до 4

2

4-6

8

6-8

17

8-10

10

свыше 10

3

Итого

40

Рассчитать:

1) используя способ «моментов» средний вес изделий, дисперсию, среднее квадратическое отклонение;

2) коэффициент вариации;

3) моду и медиану;

4) с вероятностью 0,997 средний вес изделий во всей их совокупности;

5) с вероятностью 0,954 пределы удельного веса изделий до 6 граммов.

Расчет средней и дисперсии способом «моментов» приведем в таблице:

Таблица 49

Группы изделий по весу, г.

Число изделий, f

Середина интервала, х

х-А

А=7

до 4

2

3

3-7 = -4

-2

-4

4

8

4-6

8

5

-2

-1

-8

1

8

6-8

17

7

0

0

0

0

0

8-10

10

9

2

1

10

1

10

свыше 10

3

11

4

2

6

4

12

Итого

40

х

х

х

4

х

38

Отсюда момент первого порядка:

.

Средний вес изделий:

.

Дисперсия:

.

.

Среднее квадратическое отклонение:

.

Следовательно, вес отдельных; изделий отличается от среднего веса в среднем на ± 1,94 грамма.

Коэффициент вариации:

.

Значит, совокупность изделий по весу довольно однородна.

Рассчитаем моду веса изделий. Модальный интервал находится против частоты - 17, так как это наибольшая частота.

.

Отсюда следует, что чаще всего встречаются изделия с весом 7,125 г.

Определим медиану веса. Медиане соответствует срединная частота. Всего частот -40, делим на 2, получается, что медианному интервалу соответствует 20 частота. Накапливая частоты (2 + 8) = 10, 10 + 17 = 27, видим, что 20 частота находится в третьей группе. До этой группы накоплено 10 частот. Используя ранее приведенную формулу, делаем цифровые подстановки:

г.

Следовательно, половина изделий с весом до 7,18 г, другая половина с весом свыше 7,18 г.

Близкие друг другу значения средней, моды, медианы (7,2; 7,125; 7,18) еще раз подчеркивают однородность совокупности изделий по весу. Теперь определим предельную ошибку для средней величины:

где 400 - численность генеральной совокупности (40 : 10% х 100%).

Следовательно, с вероятностью 0,997 средний вес изделия во всей их совокупности можно ожидать в пределах: 7,2 ± 0,87, т. е. от 6,33 г до 8,7 г.

Отвечаем на последний вопрос задачи, т. е. находим предельную ошибку для доли. Предварительно определим долю изделий с весом до 6 г в выборочной совокупности: (2 + 8): 40= 0,25 (25%).

.

Значит, удельный вес изделий с весом до 6 г, с вероятностью 0,954 можно ожидать в пределах: 25% ± 13%, т. е. от 12 до 38%.

Задачи для решения

Таблица 50. Задача 1 Для определения среднего процента влажности продукции была произведена 5% механическая выборка:

Группы продукции по влажности, %

Количество продукции, ед.

до 3

8

3-6

20

6-9

40

9-12

22

свыше 32

10

Итого

100

Нa основании полученных данных рассчитать:

1) средний процент влажности продукции, дисперсию и среднее квадратическое отклонение, используя способ «моментов»;

2) коэффициент вариации;

3) медиану влажности изделий;

4) с вероятностью 0,954 предельную ошибку выборочного среднего процента влажности и возможные границы среднего процента влажности от всей генеральной совокупности продукции;

5) с вероятностью 0,997 предельную ошибку выборочной доли и границы удельного веса изделий с влажностью свыше 12%.

Кратко пояснить полученные результаты.

Таблица 51. Задача 2. В одной из отраслей промышленности в результате 10% механического отбора было обследовано 40 предприятий. Были получены следующие данные по числу занятых работников:

Группы по числу занятых, чел

Число предприятий

до 50

3

50-100

8

100-150

12

150-200

10

200-250

6

свыше 250

1

Итого

40

На основе этих данных рассчитать:

1) среднюю численность занятых на одном предприятии, используя способ «моментов»;

2) дисперсию, среднее квадратическое отклонение числа занятых рабочих и коэффициент вариации;

3) с вероятностью 0,997 предельную ошибку числа занятых рабочих на одном предприятии и пределы среднего числа занятых на одном предприятии отрасли в целом;

4) с вероятностью 0,954 найти пределы удельного веса предприятий в отрасли с численностью занятых рабочих от 50 до 150 человек;

5) моду и медиану численности занятых рабочих.

Пояснить смысл вычисленных показателей.

Таблица 51. Задача 3. Для определения среднего размера приусадебного участка в одном из районов области было обследовано методом механического отбора 80 дворов. Получены следующие данные:

Группы по размерам приусадебных участков, м2

Число дворов

до 100

5

100-200

18

200-300

34

300-400

17

Свыше 400

6

Итого:

80

На основе полученного ряда распределения определить:

1) средний размер приусадебного участка, дисперсию и среднее квадратическое отклонение, используя способ «моментов»;

2) коэффициент вариации;

3) модальный размер приусадебного участка;

4) с вероятностью 0,997 предельную ошибку выборочного среднего размера приусадебного участка и пределы этого размера во всей совокупности дворов;

5) с вероятностью 0,954 предельную ошибку выборочной доли и границы удельного веса дворов с размером приусадебного участка от 100 до 300 м2.

Кратко пояснить полученные результаты.

Таблица 52. Задача 4Известны следующие данные о выработке рабочих предприятия. Данные получены на основе механической выборки. Было отобрано 5% рабочих-сдельщиков.

<...

Группы по выработке за смену, единиц

Число рабочих

до 5

3

5-7

8

7-9

20

9-11

6

свыше 11

2


Подобные документы

  • Статистика как общественная наука, изучающая количественную сторону массовых общественных явлений с целью выявления их особенностей и закономерностей развития. Понятия, предмет, задачи, система статистических показателей. Организация статистики в России.

    реферат [16,8 K], добавлен 04.06.2010

  • Основные категории и понятия теории статистики. Ряды динамики и их применение в анализе социально-экономических явлений. Сводка и группировка статистических данных. Общая характеристика системы национальных счетов. Статистика рынка товаров и услуг.

    курс лекций [68,4 K], добавлен 08.08.2009

  • Понятие и предмет статистики, теоретические основы и категории, взаимосвязь с другими науками. Объект и метод изучения статистики. Основные задачи, принципы организации и функции государственной статистики в РФ. Примеры статистической закономерности.

    лекция [17,3 K], добавлен 02.03.2012

  • Анализ обобщающих показателей и закономерностей социально-экономических явлений и процессов в конкретных условиях места и времени. Описание количественной стороны массовых социально-экономических явлений, отражаемых посредством показателей статистики.

    контрольная работа [761,6 K], добавлен 22.01.2015

  • Понятие статистики, ее назначение, уровни, предмет и система. Теоретические основы статистики как отрасли экономической науки, ее категории. Особенности статистической методологии. Современная организация статистики в Российской Федерации и её задачи.

    реферат [33,2 K], добавлен 27.01.2011

  • Понятие и уровни статистики, связь с другими науками. Ее категории: единица, показатель, совокупность варьирующих явлений, атрибутивные и количественные признаки, закономерность изменения массовых явлений и процессов. Стадии статистических исследований.

    презентация [104,5 K], добавлен 16.03.2014

  • Статистика как одна из древнейших отраслей знаний, возникшая на базе хозяйственного учета. Развитие статистики как науки. Определение предмета статистики. Статистическое наблюдение как этап статистического исследования. Методы и показатели статистики.

    контрольная работа [38,9 K], добавлен 20.01.2010

  • Социально-экономическая статистика как общественная наука. Ее сущность и основные методы, применяемые в ней. Проблемы интеграции отечественной статистики в международную статистику. Задачи социально-экономической статистики в условиях рыночной экономики.

    лекция [17,4 K], добавлен 14.03.2010

  • История развития статистики в России. Деятельность видных ученых в развитии статистики как науки. Основные задачи статистики. Общая теория статистики, экономическая статистика, социальная статистика. Отраслевая статистика.

    реферат [23,9 K], добавлен 12.12.2006

  • Понятие статистики, пути ее развития, отличительные черты массовых явлений и признаки единиц совокупности. Формы, виды и способы статистического наблюдения. Задачи и виды статистической сводки. Метод группировки, абсолютные и относительные показатели.

    реферат [33,9 K], добавлен 20.01.2010

  • Краткая история зарождения и развития статистики как науки. Предмет изучения и характеристика основных задач статистики. Статистические методы сбора и обработки данных для получения достоверных оценок и результатов. Источники статистических данных.

    лекция [23,7 K], добавлен 13.02.2011

  • Характеристика предмета статистики как общественной науки, статистическое изучение массовых явлений. Понятие статистической совокупности, проведение анкетного опроса покупателей для изучения контингента. Статистические показатели коммерческих банков.

    контрольная работа [24,9 K], добавлен 11.08.2015

  • Предмет, метод и организация статистики - науки, изучающей количественную сторону массовых явлений и процессов в неразрывной связи с их качественной стороной. Причинность, регрессия, корреляция, как основные статистические методы выявления взаимосвязи.

    учебное пособие [3,8 M], добавлен 05.02.2011

  • История возникновения и развития статистики. Предмет, основные понятия и категории статистики. Методы сбора, обобщения и анализа статистических данных. Экономическая статистика и ее отрасли. Современная организация статистики в Российской Федерации.

    лекция [16,5 K], добавлен 02.05.2012

  • Роль статистики в анализе социально-экономических явлений и процессов. Расчёт среднего линейного отклонения, дисперсии, среднеквадратического отклонения, линейного коэффициента вариации. Графическое и практическое определения структурных средних.

    контрольная работа [438,8 K], добавлен 06.11.2010

  • Субъективистский, неопозитивно-эмпирический, рационалистический, диалектико-материалистический подходы к изучению экономических явлений. Методы теории вероятности и математической статистики, использование экономико-математического моделирования.

    курсовая работа [146,9 K], добавлен 02.03.2014

  • Статистическое наблюдение выступает как один из главных методов статистики и как одна из важнейших стадий статистического исследования. Под статистическими данными понимают совокупность количественных характеристик социально-экономических процессов.

    контрольная работа [8,0 K], добавлен 23.03.2004

  • Целостная система научных дисциплин: общая теория статистики, социально-экономическая статистика, математическая статистика и теория вероятности, международная и отраслевая статистика. Формы, виды, способы наблюдения. Процесс статистического исследования.

    эссе [18,7 K], добавлен 17.10.2014

  • Методические рекомендации для решения задач по общей теории статистики. Формулы для вычисления моды. Расчет медианы для интервального ряда. Определение средней арифметической простой, средней геометрической. Расчет индекса структурных сдвигов.

    методичка [101,6 K], добавлен 22.03.2010

  • Развитие статистической науки. Предмет статистики, задачи и методология. Структура статистической науки. Организация статистики в Российской Федерации. Общегосударственная и ведомственная статистика. Информационный фонд.

    реферат [23,4 K], добавлен 09.10.2006

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.