Графики распределения

Анализ ряда распределения и направления его исследования, порядок проведения необходимых расчетов. Таблица для построения графиков. Построение кумуляты распределения. Расчет моды, медианы, первого и третьего квартиля. Схема дисперсионного анализа.

Рубрика Экономика и экономическая теория
Вид контрольная работа
Язык русский
Дата добавления 29.06.2013
Размер файла 412,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Распределение покупателей по стоимости покупок канцелярских товаров

Признак

Стоимость покупки (руб.)

Частота

Число покупателей

До 10

18

10-20

27

20-30

43

30-40

35

40-50

16

50-60

4

60 и выше

3

Итого (объем ряда)

146

Имеется индивидуальный ряд распределения единиц совокупности по количественному признаку.

Проанализировать ряд распределения. Изучить структуру совокупности, рассчитать типичные размеры признака на основе различного вида средних величин, проанализировать вариацию признака, написать краткое заключение по результатам анализа.

Для анализа ряда распределения выполнить следующие расчеты:

-изобразить ряд графически в виде гистограммы (полигона). Рассчитать показатели структуры. Структуру совокупности изобразить графически.

-рассчитать накопленные частоты. Построить графики накопленной частоты в виде кумуляты распределения.

-рассчитать моду, медиану первый и третий квартили.

-рассчитать средний уровень признака в совокупности. Сравнить значения моды, медианы, средней.

-рассчитать показатели вариации: размах, коэффициент осцилляции, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение, коэффициент вариции.

-сделать вывод о типичных размерах признака, его вариации, об асимметрии распределения.

-изложить суть дисперсионного анализа, сформулировать правило сложения дисперсий, показать методику расчета коэффициента детерминации и корреляционного отношения.

-дать определение дисперсии альтернативного признака и методику ее расчета.

Решение:

1. Составим таблицу для построения графиков

Признак

Стоимость покупки (руб.),х

Середина ряда, хi

Частота

Число покупателей,f

Накопленная частота,?f

До 10

5

18

18

10-20

15

27

45

20-30

25

43

88

30-40

35

35

123

40-50

45

16

139

50-60

55

4

143

60 и выше

65

3

146

Итого (объем ряда)

146

146

По данным ряда строим гистограмму.

Строим кумуляту распределения.

По виду графиков делаем вывод о нормальном распределении признака.

2. Рассчитаем моду, медиану, первый и третий квартиль

Модальным является интервал (20-30), содержащий наибольшее число покупателей (43). Мода - это значение признака, которое повторяется чаще всего и имеет максимальную частоту. Модальный размер стоимости покупок:

Где де - х0 - нижняя граница модального интервала; х0 = 20

h- величина интервала в данном ряду; h = 10

fM, fM-1, fM+1 - соответственно частоты (частости) в интервалах модальном, предшествующем модальному, и следующим за модальным. fM,= 43; fM-1= 27 fM+1 =35.

Медиана - Me- это численное значение признака той единицы изучаемой совокупности, которая расположена в середине ранжированного ряда. Медиана делит ряд на 2 равные части. В интервальных рядах можно использовать формулу:

где - х0 - нижняя граница медианного интервала; Медианным интервалом является интервал [20 - 30], содержащий 146:2 = 73 -го покупателя.

h- величина интервала в данном ряду; h = 10;

0,5?fi - половина объема ряда; 0,5?fi =146/2=73;

SM-1 - накопленная частота интервала предшествующего медианному; SM-1 = 45

fM,- частота медианного интервала. fM,= 43.

Медианный размер стоимости покупок:

Медиана обладает важными свойствами: сумма отклонений вариант от медианы по модулю всегда меньше, чем сумма отклонений вариант от любой другой величины, т.е.

Подобно медиане определяются квартили (варианты, делящие ряд на четыре равные части).

Первый квартиль делит совокупность в соотношении 0,25 и 0,75 (первая четверть ряда) определяется по формуле:

Он задается интервалом [10 - 20], содержащим 146/4=36,5 =37 -го покупателя.

Где - х0 - нижняя граница квартильного интервала; х0 = 10;

h- величина интервала в данном ряду; h = 10;

0,25?fi -четверть объема ряда; 0,25?fi =146/4=36,5;

SQ-1 - накопленная частота интервала предшествующего медианному; SQ-1 = 18

fQ,- частота квартильного интервала. fQ = 27.

Третий квартиль делит совокупность в соотношении 0,75 и 0,25 (третья четверть ряда) определяется по формуле:

Он задается интервалом [30 - 40], содержащим 3*146/4=109,5= 110 -го покупателя.

Где - х0 - нижняя граница квартильного интервала; х0 = 30;

h- величина интервала в данном ряду; h = 10;

0,75?fi -три четверти объема ряда; 0,75?fi =3*146/4=109,5;

SQ-1 - накопленная частота интервала предшествующего медианному; SQ-1 = 88

fQ,- частота квартильного интервала. fQ = 35.

Результаты:

Мода,

Медиана,

Первый квартиль,

Третий квартиль,

26,67

26,51

16,85

36,14

Максимальную частоту имеет сумма покупки 26 руб. 67 коп.

Значение середины ряда покупок 26 руб.51 коп- почти равна моде.

Значение первой четверти ряда покупок по стоимости составляет 16 руб. 85 коп.

Значение третьей четверти ряда покупок по стоимости составляет 36 руб.14 коп.

3. Переходим от интервального ряда к моментному, приняв за стоимость покупок середину соответствующего интервала

Признак

Стоимость покупки (руб.),х

Середина ряда, хi

Частота

Число покупателей,fi

Накопленная частота,?f

До 10

5

18

18

90

10-20

15

27

45

405

20-30

25

43

88

1075

30-40

35

35

123

1225

40-50

45

16

139

720

50-60

55

4

143

220

60 и выше

65

3

146

195

Итого ?

146

146

3930

Находим средний уровень признака в совокупности по формуле средней арифметической:

Где объем признака (сумма денег, уплаченных за покупки) у всех единиц совокупности (у всех покупателей в данном денежном интервале).

руб.

То есть средняя арифметическая сумма покупки составляет 26 руб. 92 коп. Имеется небольшая асимметрия. Так как мода и медиана меньше среднего уровня признака, то коэффициент асимметрии положителен.

4. Рассчитаем показатели вариации: размах, коэффициент осцилляции, среднее линейное отклонение, дисперсию, среднее квадратическое отклонение, коэффициент вариции.

№ интерва

ла

Признак.

Середина

интервала- сумма покупки, руб.

Частота.

Число

покупателей

1

5

18

-21,92

21,92

394,56

480,4864

8648,7552

2

15

27

-11,92

11,92

321,84

142,0864

3836,3328

3

25

43

-1,92

1,92

82,56

3,6864

158,5152

4

35

35

8,08

8,08

282,80

65,2864

2285,024

5

45

16

18,08

18,08

289,28

326,8864

5230,1824

6

55

4

28,08

28,08

112,32

788,4864

3153,9456

7

65

3

38,08

38,08

114,24

1450,0864

4350,2592

Всего

146

1597,6

27663,0144

Для расчетов показателей вариации составляем вспомогательную таблицу.

Размах вариации зависит только от крайних значений признака и находится по формуле:

.

руб.

Размах вариации может быть выражен в виде относительной величины, называемой коэффициентом осцилляции:

, то есть сумма средней покупки в 2,22 раз меньше того денежного интервала, в котором находятся все суммы, уплаченные покупателями.

Среднее линейное отклонение - это среднее из абсолютных значений отклонений признака от среднего уровня. Его вычислим по формуле:

=10,94 руб.- это колеблемость суммы покупок от среднего уровня, то есть на какую величину в среднем индивидуально уплаченные суммы покупок отличаются от среднего значения.

Получаем, что в среднем индивидуально уплаченные суммы покупок отличаются от среднего значения на 10 руб. 94 коп.

Относительное среднее линейное отклонение:

То есть среднее отклонение в стоимости покупки от средней суммы покупки составляет 40,64%.

Дисперсия- это средняя из квадратов отклонений значений признака от среднего уровня. Дисперсия рассматривается как безразмерная величина.

Дисперсию найдем по формуле:

=189,47

Рассчитаем также дисперсию вторым методом:

Средний квадрат найдем как:

Среднее квадратическое отклонение:

руб.

Видим, что среднее квадратическое отклонение больше среднего линейного отклонения.

Среднее квадратическое отклонение показывает на сколько рублей в среднем индивидуальные значения суммы покупки отличаются от типичного уровня суммы покупки.

Коэффициент вариации- процентное отношение среднего квадратического отклонения к средней величине:

Если коэффициент вариации меньше или равен 33%, то это означает, что изучаемая совокупность является качественно однородной. И средняя величина вычисленная по такой совокупности, является надежной характеристикой и ее можно использовать в экономическом анализе. Если же коэффициент вариации больше 33%, то это значит, что однородность изучаемой совокупности нарушена и средняя величина не является надежной характеристикой.

5. Дисперсионный анализ

Общая дисперсия D(x) измеряет вариацию признака по всей совокупности под влиянием всех факторов, обусловивших эту вариацию. Она равна среднему квадрату отклонений отдельных значений признака (хi) от общей средней величины и может быть вычислена как: 1. Простая дисперсия 2. Взвешенная дисперсия

Межгрупповая дисперсия (факторная) характеризует систематическую вариацию результативного признака, обусловленную влиянием признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений групповых (частных) средних от общей средней:

Внутригрупповая дисперсия (частная, остаточная, случайная) отражает случайную вариацию неучтенных факторов и не зависящую от признака-фактора, положенного в основание группировки. Она равна среднему квадрату отклонений отдельных значений признака внутри группы i) от средней арифметической этой группы (xср) (групповой средней) и может быть исчислена как:

1. Простая дисперсия 2. Взвешенная дисперсия

На основании внутригрупповой дисперсии по каждой группе можно определить общую среднюю из внутригрупповых дисперсий:

Дисперсия и среднее значение доли альтернативного признака.

Среди варьирующих признаков, которые изучает статистика, встречаются признаки, которые проявляются в том, что у одних единиц совокупности эти признаки наблюдаются, у других нет. Иными словами: альтернативный признак - это такой единственный признак, который может принимать единица совокупности из всех возможных вариантов. Если рассматривать продукцию по категориям (сортам), то она может быть либо только I категории (сорта), либо только II категории (сорта) -- в данном контексте следует рассматривать эти признаки как два противоположных события. Признаки, которыми обладают одни единицы и не обладают другие, называются альтернативными. Количественно вариация альтернативного признака в численности всей совокупности обозначается p, а доля единиц, не обладающих этим признаком, обозначается q и принимает значения: p=1, q=0

Дисперсия альтернативного признака. Альтернативная изменчивость - такая изменчивость (вариация), когда признак может принимать 2 взаимно исключающих друг друга значения «да» или «нет». Она характерна для атрибутивных (значимых) признаках: пол - мужской, женский, доброкачественная или нет продукция.

Подставив в формулу дисперсии q = 1 - p, получим:

Таким образом, дисперсия альтернативного признака равна произведению доли на дополняющее эту долю до единицы число. Т.к. p+q=1, то средний квадрат отклонений не может быть больше 0,25. Среднеквадратическое отклонение доли альтернативного признака:

Правило сложения дисперсий

Согласно правилу сложения дисперсий, общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий.

Пользуясь правилом сложения дисперсий, можно всегда по двум известным дисперсиям определить третью - неизвестную. Чем больше доля межгрупповой дисперсии в общей дисперсии, тем сильнее влияние группировочного признака на изучаемый признак. Поэтому в статистическом анализе широко используется эмпирический коэффициент детерминации - показатель, представляющий собой долю межгрупповой дисперсии в общей дисперсии результативного признака и характеризующий силу влияния группировочного признака на образование общей вариации:

При отсутствии связи эмпирический коэффициент детерминации равен нулю, а при функциональной связи - единице. Эмпирическое корреляционное отношение (см. пример) - это корень квадратный из эмпирического коэффициента детерминации:

Он показывает тесноту связи между группировочным и результативным признаками. Эмпирическое корреляционное отношение может принимать значения от 0 до 1. Если связь отсутствует, то корреляционное отношение равно нулю, т.е. все групповые средние будут равны между собой, межгрупповой вариации не будет. Значит, группировочный признак никак не влияет на образование общей вариации. Если связь функциональная, то корреляционное отношение будет равно единице. В этом случае дисперсия групповых средних равна общей дисперсии, т.е. внутригрупповой вариации не будет. Это означает, что группировочный признак целиком определяет вариацию изучаемого результативного признака. Чем значение корреляционного отношения ближе к единице, тем теснее, ближе к функциональной зависимости связь между признаками.

Схема дисперсионного анализа имеет следующий вид:

распределение кумулята дисперсионный квартиль

(n -число наблюдений, m-число параметров при переменной x)

Определение дисперсии на одну степень свободы приводит дисперсии к сравнимому виду. Сопоставляя факторную и остаточную дисперсии в расчете на одну степень свободы, получим величину F-критерия Фишера. Фактическое значение F -критерия Фишера сравнивается с табличным значением Fтабл. (б, k1, k2) при заданном уровне значимости б и степенях свободы k1= m и k2=n-m-1. При этом, если фактическое значение F-критерия больше табличного Fфакт > Fтеор, то признается статистическая значимость уравнения в целом. Для парной линейной регрессии m=1, поэтому:

Эта формула в общем виде может выглядеть так:

Отношение объясненной части дисперсии переменной (у) к общей дисперсии называют коэффициентом детерминации и используют для характеристики качества уравнения регрессии или соответствующей модели связи. Соотношение между объясненной и необъясненной частями общей дисперсии можно представить в альтернативном варианте:

оэффициент детерминации R2 принимает значения в диапазоне от нуля до единицы 0? R2 ?1. Коэффициент детерминации R2 показывает, какая часть дисперсии результативного признака (y) объяснена уравнением регрессии. Чем больше R2, тем большая часть дисперсии результативного признака (y) объясняется уравнением регрессии и тем лучше уравнение регрессии описывает исходные данные. При отсутствии зависимости между (у) и (x) коэффициент детерминации R2 будет близок к нулю. Таким образом, коэффициент детерминации R2 может применяться для оценки качества(точности) уравнения регрессии. Значение R-квадрата является индикатором степени подгонки модели к данным (значение R-квадрата близкое к 1.0 показывает, что модель объясняет почти всю изменчивость соответствующих переменных). Чтобы определить, при каких значениях R2 уравнение регрессии следует считать статистически не значимым, что, в свою очередь, делает необоснованным его использование в анализе, рассчитывается F-критерий Фишера: Fфакт > Fтеор - делаем вывод о статистической значимости уравнения регрессии. Величина F-критерия связана с коэффициентом детерминации R2xy (r2xy) и ее можно рассчитать по следующей формуле:

Либо при оценке значимости индекса детерминации (аналог коэффициента детерминации):

где: i2 - индекс (коэффициент) детерминации, который рассчитывается:

Использование коэффициента множественной детерминации R2 для оценки качества модели, обладает тем недостатком, что включение в модель нового фактора (даже несущественного) автоматически увеличивает величину R2. Поэтому, при большом количестве факторов, предпочтительнее использовать, так называемый, улучшенный, скорректированный коэффициент множественной детерминации R2, определяемый соотношением:

где p - число факторов в уравнении регрессии, n - число наблюдений. Чем больше величина p, тем сильнее различия между множественным коэффициентом детерминации R2и скорректированным R2. При использовании скорректированного R2, для оценки целесообразности включения фактора в уравнение регрессии, следует учитывать, что увеличение его величины (значения), при включении нового фактора, не обязательно свидетельствует о его значимости, так как значение увеличивается всегда, когда t-статистика больше единицы (|t|>1). При заданном объеме наблюдений и при прочих равных условиях, с увеличением числа независимых переменных (параметров), скорректированный коэффициент множественной детерминации убывает. При небольшом числе наблюдений, скорректированная величина коэффициента множественной детерминации R2 имеет тенденцию переоценивать долю вариации результативного признака, связанную с влиянием факторов, включенных в регрессионную модель. Низкое значение коэффициента множественной корреляции и коэффициента множественной детерминации R2 может быть обусловлено следующими причинами:

· в регрессионную модель не включены существенные факторы;

· неверно выбрана форма аналитической зависимости, которая нереально отражает соотношения между переменными, включенными в модель.

Следует также обратить внимание на важность анализа остатков (остаточной, «необъясненной» дисперсии). Остаток представляет собой отклонение фактического значения зависимой переменной от значения, полученного расчетным путем. При построении уравнения регрессии, мы можем разбить значение (у) в каждом наблюдении на 2 составляющие:

Отсюда:

Если еi=0, то для всех наблюдений фактические значения зависимой переменной совпадают с расчетными (теоретическими) значениями. Графически это означает, что теоретическая линия регрессии (линия, построенная по функции у=а01х) проходит через все точки корреляционного поля, что возможно только при строго функциональной связи. Следовательно, результативный признак (у) полностью обусловлен влиянием фактора (х).

На практике, как правило, имеет место некоторое рассеивание точек корреляционного поля относительно теоретической линии регрессии, т.е. отклонения эмпирических данных от теоретических еi?0. Величина этих отклонений и лежит в основе расчета показателей качества (адекватности) уравнения.

Размещено на Allbest.ru

...

Подобные документы

  • Интервальный ряд распределения банков по объему прибыли. Нахождение моды и медианы полученного интервального ряда распределения графическим методом и путем расчетов. Расчет характеристик интервального ряда распределения. Вычисление средней арифметической.

    контрольная работа [150,6 K], добавлен 15.12.2010

  • Затраты на рабочую силу как объект статистического изучения. Применение индексного метода. Нахождение моды и медианы интервального ряда распределения графическим методом и путем расчетов. Расчет характеристик ряда распределения, средней арифметической.

    курсовая работа [920,1 K], добавлен 04.05.2013

  • Построение таблицы и графиков ряда распределения. Показатели центра и структуры распределения. Характеристика формы распределения. Распределение показателей регионов России по показателям оборота малых предприятий. Ранжирование вариационного ряда.

    курсовая работа [344,1 K], добавлен 21.03.2014

  • Построение ряда распределения студентов по успеваемости, расчет локальных и накопительных частот. Проверка гипотезы о нормальном законе распределения студентов по успеваемости. Построение аналитической группировки. Расчет средней цены по трем рынкам.

    контрольная работа [55,1 K], добавлен 01.06.2010

  • Понятие статистических рядов распределения и их виды: атрибутивные и вариационные. Графическое изображение статистических данных: расчет показателей вариации, моды и медианы. Анализ группы предприятий по признакам Товарооборот и Средние товарные запасы.

    курсовая работа [498,5 K], добавлен 09.01.2011

  • Группировка организаций по степени износа основных фондов в виде интервалов. Расчет среднего значения, модального и медианного значения ряда. Форма распределения на основе показателей асимметрии и эксцесса. Определение степени однородности распределения.

    контрольная работа [341,6 K], добавлен 07.12.2016

  • Построение статистического ряда распределения организаций. Графическое определение значения моды и медианы. Теснота корреляционной связи с использованием коэффициента детерминации. Определение ошибки выборки среднесписочной численности работников.

    контрольная работа [82,0 K], добавлен 19.05.2009

  • Построение рядов распределения и секторной диаграммы. Графическое изображение дискретного ряда. Показатели центра распределения, к которым относятся мода, медиана, средняя арифметическая. Вычисление основных показателей вариации и формы распределения.

    контрольная работа [355,3 K], добавлен 22.12.2013

  • Построение интервального ряда распределения по группировочному признаку. Характеристика отклонения распределения частот от симметричной формы, расчет показателей эксцесса и ассиметрии. Анализ показателей бухгалтерского баланса или отчёта о прибылях.

    контрольная работа [102,4 K], добавлен 19.10.2014

  • Построение интервального вариационного ряда распределения стран Европы по объему импорта с Россией, выделение четырех групп стран с равными интервалами. Определение среднемесячных и среднегодовых остатков сырья, материалов, фурнитуры на складе ателье.

    контрольная работа [69,3 K], добавлен 16.11.2011

  • Прибыль и рентабельность как показатели, характеризующие результаты деятельности кредитных организаций. Построение статистического ряда распределения организаций, расчёт моды, медианы, дисперсии, коэффициента вариации, тесноты корреляционной связи.

    курсовая работа [599,0 K], добавлен 06.12.2013

  • Сущность оптового, розничного и общественного товарооборота. Формулы расчета индивидуальных, агрегатных индексов товарооборота. Расчет характеристик интервального ряда распределения - среднего арифметического, моды и медианы, коэффициента вариации.

    курсовая работа [1,2 M], добавлен 10.05.2013

  • Построение с помощью формулы Стержесса. Построение рядов распределения с произвольными интервалами. Построение рядов распределения с помощью среднего квадратического отклонения. Классификация рядов распределения. Расчет основных характеристик вариации.

    курсовая работа [1,4 M], добавлен 22.11.2013

  • Технико-экономические показатели групп заводов; ряды распределения. Относительные величины интенсивности, цепные и базисные индексы товарооборота. Расчет средней величины, моды и медианы. Среднее квадратическое отклонение; дисперсия, коэффициент вариации.

    контрольная работа [88,8 K], добавлен 06.10.2013

  • Оформление результатов сводки и группировки материалов статистического наблюдения в виде рядов распределения (атрибутивных и вариационных). Расчет средних величин и показателей вариации, моды и меридианы. Графическое изображение статистических данных.

    контрольная работа [226,8 K], добавлен 31.07.2011

  • Порядок построения ряда динамики и распределения, его изображение в виде линейного графика и гистограммы. Взаимосвязь цепных и базисных темпов роста и прироста. Тенденция изменения уровня. Методика и этапы расчета дисперсии альтернативного признака.

    контрольная работа [365,8 K], добавлен 27.10.2010

  • Источники данных для статистического анализа регионального рынка жилья. Статистический ряд распределения предприятий по признаку цены за 1 кв.м. Значение моды и медианы полученного ряда. Ошибка выборки средней цены за кв.м. на первичном рынке жилья.

    контрольная работа [1,2 M], добавлен 13.01.2012

  • Содержание, формы, принципы анализа и оценки распределения прибыли. Экспресс-диагностика анализа и оценки распределения прибыли на услуги ООО "Доверие". Разработка управленческого решения по повышению эффективности распределения прибыли на услуги.

    дипломная работа [2,2 M], добавлен 21.12.2013

  • Содержание, формы, принципы анализа и оценки распределения прибыли предприятия. Экспресс–диагностика анализа и оценки распределения прибыли на услуги. Технология принятия управленческого решения по повышению эффективности распределения прибыли на услуги.

    дипломная работа [1,5 M], добавлен 08.01.2014

  • Характеристика используемых статистических показателей. Графическое представление распределения значений (гистограмма, куммулята). Оценка структурных средних (моды, медианы) на основе структурной группировки. Выравнивание ряда методом скользящей средней.

    контрольная работа [464,1 K], добавлен 29.10.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.