Статистические методы обработки информации в торговле
Истоки статистической науки: немецкая описательная и английская школа политических арифметиков. Современное значение статистики. Абсолютные и относительные статистические величины, этапы статистических исследований и их применение на практике.
Рубрика | Маркетинг, реклама и торговля |
Вид | учебное пособие |
Язык | русский |
Дата добавления | 31.03.2014 |
Размер файла | 309,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
2
25
2,623
63
7
6,2
3
28
2,875
94
10
6,8
4
19
3,375
16
4
12,0
5
23
3,000
49
2
7,5
6
20
2,828
14
6
10,0
7
26
3,255
78
9
7,2
8
19
2,726
10
5
4,2
9
30
2,429
130
10
3,5
20
2,361
20
3
9,5
28
2,342
86
8
7,8
21
2,672
29
4
8,0
26
2,356
75
7
6,0
21
2,559
22
4
4,8
20
2,173
32
1
8,6
19
2,095
21
5
10,0
27
2,342
96
8
4,5
26
2,011
70
9
12,5
23
2,691
59
6
10,5
27
2,021
98
4
6,5
Построить интервальный ряд распределения признака и его график, рассчитать среднее значение признака и изучить его вариацию.
3. Выборочное наблюдение
3.1 Понятие выборочного наблюдения
Выборочный метод используется, когда применение сплошного на-блюдения физически невозможно из-за огромного массива данных или экономически нецелесообразно. Физическая невозможность имеет место, например, при изучении пассажиропотоков, рыночных цен, семейных бюджетов. Экономическая нецелесообразность имеет место при оценке качества товаров, связанной с их уничтожением. Например, дегустация, испытание кирпичей на прочность и т.п. Выборочное наблюдение используется также для проверки результатов сплошного.
Статистические единицы, отобранные для наблюдения, составляют выборочную совокупность или выборку, а весь их массив - генеральную совокупность (ГС). При этом число единиц в выборке обозначают п, во всей ГС - N. Отношение n/N называется относительный размер или доля выборки.
Качество результатов выборочного наблюдения зависит от репрезентативности выборки, т.е. от того, насколько она представительна в ГС. Для обеспечения репрезентативности вы-борки необходимо соблюдать принцип случайности отбора единиц, который предполагает, что на включение единицы ГС в выборку не может повлиять какой-либо иной фактор кроме случая.
3.2. Способы формирования выборки
1. Собственно случайный отбор: все единицы ГС нумеруются, а выпавшие в результате жеребьевки номера соответствуют единицам, попавшим в выборку, причем число номеров равно запланированному объему выборки. На практике вместо жеребьевки используют генераторы случайных чисел. Данный способ отбора может быть повторным (когда каждая единица, отобранная в выборку, после проведения наблюдения возвращается в ГС и может быть вновь подвергнута обследованию) и бесповторным (когда обследованные единицы в ГС не возвращаются и не могут быть обследованы повторно). При повторном отборе вероятность попадания в выборку для каждой единицы ГС остается неизменной, а при бесповторном отборе она меняется (увеличивается), но для оставшихся в ГС после отбора из нее нескольких единиц вероятность попадания в выборку одинакова.
2. Механический отбор: отбираются единицы генеральной совокупности с постоянным шагом N/п. Так, если одна генеральная совокупность содержит 100 тыс.ед., а требуется выбрать 1 тыс.ед., то в выборку попадет каждая сотая единица.
3. Стратифицированный (расслоенный) отбор осуществляется из неоднородной генеральной совокупности, когда ее предварительно разбивают на однородные группы, после чего производят отбор единиц из каждой группы в выборочную совокупность случайным или механическим способом пропорционально их численности в генеральной совокупности.
4. Серийный (гнездовой) отбор: случайным или механическим способом выбирают не отдельные единицы, а определенные серии (гнезда), внутри которых производится сплошное наблюдение.
3.3. Средняя ошибка выборки
После завершения отбора необходимого числа единиц в выборку и регистрации предусмотренных программой наблюдения изучаемых признаков этих единиц переходят к расчету обобщающих показателей. К ним относят среднюю величину изучаемого признака и долю единиц, обладающих каким-либо значением этого признака. Однако если в ГС произвести несколько выборок, определив при этом их обобщающие характеристики, то можно установить, что их значения будут различными, кроме того, они будут отличаться и от реального их значения в ГС, если такое определить с помощью сплошного наблюдения. Другими словами, обобщающие характеристики, рассчитанные по данным выборки, будут отличаться от их реальных значений в ГС, поэтому введем следующие условные обозначения (таблица 8).
Таблица 8. Условные обозначения
Показатель |
Совокупность |
||
Генеральная |
выборочная |
||
Число единиц совокупности |
N |
N |
|
Среднее значение |
|||
Доля единиц, обладающих каким-либо значением признака |
D |
||
Доля единиц, не обладающих каким-либо значением признака |
1-d |
1- |
|
Дисперсия |
Разность между значением обобщающих характеристик выборочной и генеральной совокупностей называется ошибкой выборки, которая подразделяется на ошибку регистрации и ошибку репрезентативности. Первая возникает из-за неправильных или неточных сведений из-за непонимания существа вопроса, невнимательности регистратора при заполнении анкет, формуляров и т.п. Она достаточно легко обнаруживается и устраняется. Вторая возникает из-за несоблюдения принципа случайности отбора единиц в выборку. Ее сложнее обнаружить и устранить, она гораздо больше первой и потому ее измерение является основной задачей выборочного наблюдения.
Для измерения ошибки выборки определяется ее средняя ошибка по формуле 3.1 для повторного отбора и по формуле 3.2 - для бесповторного:
= ; (3.1)
= . (3.2)
Из формул видно, что средняя ошибка меньше у бес-повторной выборки, что и обусловливает ее более широкое применение.
3.4 Предельная ошибка выборки
Учитывая, что на основе выборочного обследования нельзя точно оценить обобщающую характеристику ГС, необходимо найти пределы, в которых он находится. В конкретной выборке разность может быть больше, меньше или равна . Каждое из отклонений от имеет определенную вероятность. При выборочном обследовании реальное значение в ГС неизвестно. Зная среднюю ошибку выборки, с определенной вероятностью можно оценить отклонение выборочной средней от генеральной и установить пределы, в которых находится изучаемый параметр (в данном случае среднее значение) в генеральной совокупности. Отклонение выборочной характеристики от генеральной называется предельной ошибкой выборки . Она определяется в долях средней ошибки с заданной вероятностью, т.е.
=t, (3.3)
где t - коэффициент доверия, зависящий от вероятности, с которой определяется предельная ошибка выборки.
Вероятность появления определенной ошибки выборки находят с помощью теорем теории вероятностей. Согласно теореме Чебышёва, при достаточно большом объеме выборки и ограниченной дисперсии генеральной ГС вероятность того, что разность между выборочной средней и генеральной средней будет сколь угодно мала, близка к единице:
при (3.4)
А.М. Ляпунов доказал, что независимо от характера распределения генеральной ГС при увеличении объема выборки распределение вероятностей появления того или иного значения выборочной средней приближается к нормальному распределению (центральная предельная теорема). Следовательно, вероятность отклонения выборочной средней от генеральной средней, т.е. вероятность появления заданной предельной ошибки, также подчиняется указанному закону и может быть найдена как функция от t с помощью интеграла вероятностей Лапласа:
, (3.5)
где - нормированное отклонение выборочной средней от генеральной средней.
Значения P (интеграла Лапласа) для разных t рассчитаны и име-ются в таблице, приведенной в Приложении 1.
Вероятность, которая принимается при расчете выборочной характеристики, называется доверительной. Чаще всего принимают вероятность P = 0,950, которая означает, что только в 5 случаях из 100 ошибка может выйти за установленные границы. Задавшись конкретным уровнем вероятности, выбирают величину нормированного отклонения t по Приложению 1 и рассчитывают предельную ошибку выборки по формуле (3.3).
После расчета предельной ошибки находят доверительный интервал обобщающей характеристики ГС совокупности по формуле (3.4) - для среднего значения, и по формуле (3.5) - для доли единиц, обладающих каким-либо значением признака:
или (-)(+) (3.4)
или (-)d(+) (3.5)
Следовательно, при выборочном наблюдении определяется не одно, точное значение обобщающей характеристики ГС, а лишь ее доверительный интервал с заданным уровнем вероятно-сти. И это серьезный недостаток выборочного метода статистики.
3.5 Необходимая численность выборки
Разрабатывая программу выборочного наблюдения, задаются конкретным значением предельной ошибки и уровнем вероятности. Не-известной остается минимальная численность выборки, обеспечиваю-щая заданную точность. Ее можно получить из формул средней и пре-дельной ошибок в зависимости от типа выборки. Получим следующие формулы:
для повторной выборки n = ; (3.6)
для бесповторной выборки n = . (3.7)
Вариация () значений признака к началу выборочного наблюдения, как правило, неизвестна, поэтому ее берут приближенно одним из способов:
1) берется из предыдущих выборочных наблюдений;
2) по правилу «трех сигм», согласно которому в размахе вариации укладывается примерно 6 стандартных отклонений (H/ = 6, отсюда = Н2 /35);
3) если приблизительно известна средняя величина изучаемого признака, то = 2 /9;
4) если неизвестна дисперсия доли единиц, обладающих каким-либо значением признака, то используется ее максимально возможная величина = 0,25.
3.6 Методические указания
Задача. На предприятии в порядке случайной бесповторной выборки было опрошено 100 рабочих из 1000 и получены следующие данные об их доходе за месяц (таблица):
Таблица 9. Результаты бесповторного выборочного наблюдения на предприятии
Доход, у.е. |
до 300 |
300-500 |
500-700 |
700-1000 |
более 1000 |
|
Число рабочих |
8 |
28 |
44 |
17 |
3 |
С вероятностью 0,950 определить:
1) среднемесячный размер дохода работников данного предприятия;
2) долю рабочих предприятия, имеющих месячный доход более 700 у.е.;
3) необходимую численность выборки при определении среднемесячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е.;
4) необходимую численность выборки при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%.
Решение. Для расчета обобщающих характеристик выборки построим вспомогательную таблицу 10.
Таблица 10. Вспомогательные расчеты для решения задачи
X |
f |
Х' |
X'f |
(Х' -)2 |
(Х' -)2f |
|
до 300 |
8 |
200 |
1600 |
137641 |
1101128 |
|
300 - 500 |
28 |
400 |
11200 |
29241 |
818748 |
|
500 - 700 |
44 |
600 |
26400 |
841 |
37004 |
|
700 - 1000 |
17 |
850 |
14450 |
77841 |
1323297 |
|
более 1000 |
3 |
1150 |
3450 |
335241 |
1005723 |
|
Итого |
100 |
57100 |
4285900 |
По формуле рассчитаем средний доход в выборке: = 57100/100 = 571 (у.е.). Применив формулу (2.18) и рассчитав ее числитель в последнем столбце таблицы, получим дисперсию среднего выборочного дохода: = 4285900/100 = 42859.
Теперь можно определить среднюю ошибку выборки по формуле 3.2: = = 19,640 (у.е.).
В нашей задаче = 0,950, значит t = 1,96. Тогда предельная ошибка выборки по формуле (3.3):
= 1,96*19,64 = 38,494 (у.е.).
Для определения средней ошибки выборки при определении доли рабочих с доходами более 700 у.е. в ГС необходимо определить их долю: w = 20/100 = 0,2 или 20%, а затем ее дисперсию = w(1-w) = 0,2*(1-0,2) = 0,16. Тогда можно рассчитать среднюю ошибку выборки по формуле 3.2: = = 0,038 или 3,8%. А затем и предельную ошибку выборки:
= 1,96*0,038 = 0,075 или 7,5%.
Доверительный интервал среднего дохода находим по формуле (3.4):
571-38,494 571+38,494 или 532,506 у.е. 609,494 у.е., то есть средний доход всех рабочих предприятия с вероятностью 95% будет лежать в пределах от 532,5 до 609,5 у.е.
Аналогично определяем доверительный интервал для доли по формуле (3.5):
0,2-0,075 p0,2+0,075 или 0,125 p0,275, то есть доля рабочих с доходами более 700 у.е. на всем предприятии с вероятностью 95% будет лежать в пределах от 12,5% до 27,5%.
В нашей задаче выборка бесповторная, значит, воспользуемся формулой (3.7), в которую подставим уже рассчитанные дисперсии среднего выборочного дохода рабочих (= 42859) и доли рабочих с доходами более 700 у.е. (= 0,16):
nб/повт==62 (чел.),
nб/повт= = 197 (чел.).
Таким образом, необходимо включить в выборку не менее 62 рабочих при определении среднего месячного дохода работников предприятия, чтобы не ошибиться более чем на 50 у.е., и не менее 197 рабочих при определении доли рабочих с размером месячного дохода более 700 у.е., чтобы при этом не ошибиться более чем на 5%.
3.7 Контрольные задания
Для изучения вкладов населения в коммерческом банке города была проведена 5%-ная случайная бесповторная выборка лицевых счетов, в результате которой в таблице получено распределение клиентов по размеру вкладов.
Таблица 11. Варианты выполнения контрольного задания
Размер вклада, у.е. |
Число вкладчиков, чел. |
||||||||||
Вариант |
|||||||||||
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
||
до 5000 |
10 |
80 |
100 |
50 |
60 |
30 |
90 |
20 |
70 |
40 |
|
5 000 - 15 000 |
40 |
60 |
150 |
30 |
40 |
110 |
75 |
65 |
90 |
80 |
|
15 000 - 30 000 |
25 |
35 |
70 |
90 |
120 |
90 |
130 |
140 |
60 |
95 |
|
30 000 - 50 000 |
30 |
45 |
40 |
5 |
80 |
30 |
60 |
75 |
20 |
115 |
|
свыше 50 000 |
15 |
10 |
30 |
25 |
50 |
15 |
25 |
5 |
10 |
5 |
С вероятностью 0,954 определить:
1) средний размер вклада во всем банке;
2) долю вкладчиков во всем банке с размером вклада свыше 15000 у.е.;
3) необходимую численность выборки при определении среднего размера вклада, чтобы не ошибиться более чем на 500 у.е.;
4) необходимую численность выборки при определении доли вкладчиков во всем банке с размером вклада свыше 30 000 у.е., чтобы не ошибиться более чем на 10%.
4. РЯДЫ ДИНАМИКИ
4.1 Понятие о рядах динамики
Одной из важнейших задач статистики является изучение изменений анализируемых показателей во времени, то есть их динамика. Эта задача решается при помощи анализа рядов динамики (временных рядов).
Ряд динамики - это числовые значения определенного статистического показателя в последовательные моменты или периоды времени (т.е. расположенные в хронологическом порядке).
Числовые значения того или иного статистического показателя, составляющего ряд динамики, называют уровнями ряда и обычно обозначают через y. Первый член ряда y1 называют начальным (базисным) уровнем, а последний yn - конечным. Моменты или периоды времени, к которым относятся уровни, обозначают через t.
Ряды динамики, как правило, представляют в виде таблицы (см. таблица 12) или графически (см. рисунок 4), причем по оси абсцисс строится шкала времени t, а по оси ординат - шкала уровней ряда y (самостоятельное изучение с использованием Exsel).
Таблица 12. Внешнеторговый оборот (ВО) России за период 2000-2006 гг.
Год |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
2006 |
|
Млрд. долл. США |
149,9 |
155,6 |
168,3 |
212,0 |
280,6 |
368,9 |
468,4 |
Рис. 4. Внешнеторговый оборот (ВО) России за период 2000-2006 гг.
Данные таблицы 12 и рисунка 5 наглядно иллюстрируют ежегодный рост внешнеторгового оборота (ВО) в России за 2000-2006 гг.
4.2 Показатели изменения уровней ряда динамики
Анализ рядов динамики начинается с определения того, как именно изменяются уровни ряда (увеличиваются, уменьшаются или остаются неизменными) в абсолютном и относительном выражении. Чтобы проследить за направлением и размером изменений уровней во времени, для рядов динамики рассчитывают показатели изменения уровней ряда динамики:
– абсолютное изменение (абсолютный прирост);
– относительное изменение (темп роста или индекс динамики);
– темп изменения (темп прироста).
Все эти показатели могут определяться базисным способом, когда уровень данного периода сравнивается с первым (базисным) периодом, либо цепным способом - когда сравниваются два уровня соседних периодов.
Абсолютное изменение (абсолютный прирост) уровней рассчитывается как разность между двумя уровнями ряда по формуле 4.1 - для базисного способа сравнения или по формуле 4.2 - для цепного. Оно показывает, на сколько (в единицах показателей ряда) уровень одного (i-того) периода больше или меньше уровня какого-либо предшествующего периода, и, следовательно, может иметь знак «+» (при увеличении уровней) или «-» (при уменьшении уровней).
; (4.1) . (4.2)
В таблице 13 в столбце 3 рассчитаны базисные абсолютные изменения по формуле 4.1, а в столбце 4 - цепные абсолютные изменения по формуле 4.2.
Таблица 13. Анализ динамики ВО России
Год |
y |
, % |
,% |
|||||
2000 |
149,9 |
|||||||
2001 |
155,6 |
5,7 |
5,7 |
1,038 |
1,038 |
3,8 |
3,8 |
|
2002 |
168,3 |
18,4 |
12,7 |
1,123 |
1,082 |
12,3 |
8,2 |
|
2003 |
212,0 |
62,1 |
43,7 |
1,414 |
1,260 |
41,4 |
26,0 |
|
2004 |
280,6 |
130,7 |
68,6 |
1,872 |
1,324 |
87,2 |
32,4 |
|
2005 |
368,9 |
219,0 |
88,3 |
2,461 |
1,315 |
146,1 |
31,5 |
|
2006 |
468,4 |
318,5 |
99,5 |
3,125 |
1,270 |
212,5 |
27,0 |
|
Итого |
1803,7 |
318,5 |
3,125 |
Между базисными и цепными абсолютными изменениями существует взаимосвязь: сумма цепных абсолютных изменений равна последнему базисному изменению, то есть
. (4.3)
В нашем примере подтверждается правильность расчета абсолютных изменений по формуле 4.3: = 318,5 рассчитана в итоговой строке 4-го столбца, а = 318,5 - в предпоследней строке 3-го столбца таблицы 13
Относительное изменение (темп роста или индекс динамики) уровней рассчитывается как отношение (деление) двух уровней ряда по формуле 4.4 - для базисного способа сравнения или по формуле 4.5 - для цепного.
; (4.4)
. (4.5)
Относительное изменение показывает во сколько раз уровень данного периода больше уровня какого-либо предшествующего периода (при >1) или какую его часть составляет (при <1). Относительное изменение может выражаться в виде коэффициентов, то есть простого кратного отношения (если база сравнения принимается за единицу), и в процентах (если база сравнения принимается за 100 единиц) путем домножения относительного изменения на 100%.
В таблице 13 столбце 5 рассчитаны базисные относительные изменения по формуле 4.4 а в столбце 6 - цепные относительные изменения по формуле 4.5.
Между базисными и цепными относительными изменениями существует взаимосвязь: произведение цепных относительных изменений равно последнему базисному изменению, то есть
. (4.6)
В нашем примере подтверждается правильность расчета относительных изменений по формуле: = 1,038*1,082*1,260*1,324*1,315*1,270 = 3,125 рассчитано по данным 6-го столбца, а = 3,125 - в предпоследней строке 5-го столбца табл..
Темп изменения (темп прироста) уровней - относительный показатель, показывающий, на сколько процентов данный уровень больше (или меньше) другого, принимаемого за базу сравнения. Он рассчитывается путем вычитания из относительного изменения 100%, то есть по формуле 4.7:
, (4.7)
или как процентное отношение абсолютного изменения к тому уровню, по сравнению с которым рассчитано абсолютное изменение (базисный уровень), то есть по формуле 4.8:
. (4.8)
В таблице 13 в столбце 7 рассчитаны базисные темпы изменения ВО по формуле, а в столбце 8 - цепные темпы изменения по формуле. Все расчеты в таблице свидетельствуют о ежегодном росте ВО России за 2000-2006 гг.
4.3 Средние показатели ряда динамики
Каждый ряд динамики можно рассматривать как некую совокупность n меняющихся во времени показателей, которые можно обобщить в виде средних величин. Обобщенной характеристикой ряда динамики служит прежде всего средний уровень ряда . Для разных видов рядов динамики он рассчитывается неодинаково. Различают ряды динамики:
- равномерные (с равными интервалами времени между уровнями), для которых средний уровень определяется по простой формуле средней величины;
- неравномерные (с неравными интервалами), для которых используются формулы средних взвешенных (по интервалам времени) величин.
В интервальном ряду динамики (в котором время задано в виде промежутков времени, к которым относятся уровни) определяется по формуле средней арифметической, а в моментном ряду (в котором время задано в виде конкретных моментов времени или дат, к которым относятся уровни) - по формуле средней хронологической. В таблице приводятся виды рядов динамики и соответствующие формулы для расчета их среднего уровня .
Таблица 14. Виды средних величин, применяемых при расчете среднего уровня
Вид ряда Динамики |
Название средней величины |
Формула средней величины |
Номер формулы |
|
Равномерный интервальный |
Арифметическая простая |
(4.9) |
||
Равномерный моментный |
Хронологическая простая |
(4.10) |
||
Неравномерный интервальный |
Арифметическая взвешенная |
(4.11) |
||
Неравномерный моментный |
Хронологическая взвешенная |
(4.12) |
Кроме среднего уровня ряда рассчитываются и другие средние показатели:
– среднее абсолютное изменение (средний абсолютный прирост);
– среднее относительное изменение (средний темп роста);
– средний темп изменения (средний темп прироста).
Каждый из этих показателей может рассчитываться базисным и цепным способами.
Базисное среднее абсолютное изменение - это частное от деления последнего базисного абсолютного изменения на количество изменений уровней цепное среднее абсолютное изменение уровней ряда - это частное от деления суммы всех цепных абсолютных изменений на количество изменений:
Б = (4.13)
Ц = (4.14)
По знаку средних абсолютных изменений также судят о характере изменения явления в среднем: рост, спад или стабильность.
Базисное среднее относительное изменение определяется по формуле (4.15), а цепное среднее относительное изменение - по формуле (4.16):
Б== (4.15)
Ц= (4.16)
Естественно, базисное и цепное среднее относительное изменения должны быть одинаковыми и сравнением их с критериальным значением 1 делается вывод о характере изменения явления в среднем: рост, спад или стабильность.
Вычитанием 100% из среднего относительного изменения образуется соответствующий средний темп изменения, по знаку которого также можно судить о характере изменения изучаемого явления, отраженного данным рядом динамики.
4.4. Методы выявления основной тенденции (тренда) в рядах динамики
Одна из основных задач изучения рядов динамики - выявить основную тенденцию (закономерность) в изменении уровней ряда, именуемую трендом. Закономерность в изменении уровней ряда в одних случаях проявляется наглядно, в других - может маскироваться колебаниями случайного или неслучайного характера. Поэтому, чтобы сделать правильные выводы о закономерностях развития того или иного показателя, надо суметь отделить тренд от колебаний, вызванных случайными кратковременными причинами. На основании выделенного тренда можно экстраполировать (прогнозировать) развитие явления в будущем. С этой целью (устранить колебания, вызванные случайными причинами) ряды динамики подвергают обработке.
Методы обработки рядов динамики для выявления основной тенденции изменения уровней ряда: метод укрупнения интервалов, метод скользящей средней и аналитическое выравнивание. Во всех методах вместо фактических уровней при обработке ряда рассчитываются иные (расчетные) уровни, в которых тем или иным способом взаимопогашается действие случайных факторов и тем самым уменьшается колеблемость уровней. Последние в результате становятся как бы «выравненными», «сглаженными» по отношению к исходным фактическим данным. Такие методы обработки рядов динамики называются сглаживанием или выравниванием рядов динамики.
Простейший метод сглаживания уровней ряда - укрупнения интервалов, для него определяется итоговое значение или средняя величина исследуемого показателя. Этот метод особенно эффективен, если первоначальные уровни ряда относятся к коротким промежуткам времени. Например, если имеются данные о ежесуточном производстве мороженого на предприятии за месяц, то, естественно, в таком ряду возможны значительные колебания уровней, так как, чем меньше период, за который приводятся данные, тем больше влияние случайных факторов. Чтобы устранить это влияние, рекомендуется укрупнить интервалы времени, например до 5 или 10 дней, и для этих укрупненных интервалов рассчитать общий или среднесуточный объем производства (соответственно по пятидневкам или декадам). В ряду с укрупненными интервалами времени закономерность изменения уровней будет более наглядной.
По своей сути метод скользящей средней похож на метод укрупнения интервалов, но в данном случае фактические уровни заменяются средними уровнями, рассчитанными для последовательно подвижных (скользящих) укрупненных интервалов, охватывающих m уровней ряда. Например, если принять m=3, то сначала рассчитывается средняя величина из первых трех уровней, затем находится средняя величина из 2-го, 3-го и 4-го уровней, потом из 3-го, 4-го и 5-го и т.д., т.е. каждый раз в сумме трех уровней появляется новый уровень, а два остаются прежними, что и обусловливает взаимопогашение случайных колебаний в средних уровнях. Рассчитанные из m членов скользящие средние относятся к середине (центру) каждого рассматриваемого интервала.
Сглаживание методом скользящей средней можно проводить по любому числу членов m, но удобнее, если m - нечетное число, так как в этом случае скользящая средняя сразу относится к конкретной временной точке - середине (центру) интервала. Если же m - четное, то скользящая средняя относится к промежутку между временными точками: например, при сглаживании по четырем членам (m=4) средняя из первых четырех уровней будет находиться между второй и третьей временной точкой, следующая - между третьей и четвертой и т.д. Тогда, чтобы сглаженные уровни относились непосредственно к конкретным временным точкам, из каждой пары смежных промежуточных значений скользящих средних находят среднюю арифметическую, которую относят к временной точке, находящейся между смежными. Такой прием двойного расчета сглаженных уровней называется центрированием.
Недостатком метода скользящей средней является то, что сглаженный ряд укорачивается по сравнению с фактическим с двух концов: при нечетном m на (m-1)/2, а при четном m - на m/2 с каждого конца. Применяя этот метод, надо помнить, что он сглаживает (устраняет) лишь случайные колебания. Если же, например, ряд содержит сезонную волну (см. 6.6), она сохранится и после сглаживания методом скользящей средней. Кроме того, этот метод сглаживания, как и метод укрупнения интервалов не позволяет выражать общую тенденцию изменения уровней в виде математической модели.
Наиболее совершенным методом обработки рядов динамики в целях устранения случайных колебаний и выявления тренда является выравнивание уровней ряда по аналитическим формулам (или аналитическое выравнивание). Суть аналитического выравнивания заключается в замене эмпирических (фактических, исходных) уровней yi теоретическими , которые рассчитаны по определенному уравнению, принятому за математическую модель тренда, где теоретические уровни рассматриваются как функция времени: = f(t).
При этом каждый фактический уровень yi рассматривается обычно как сумма двух составляющих:
, (4.17)
где f(t) =- -- систематическая составляющая, отражающая тренд и выраженная определенным уравнением; - случайная величина, вызывающая колебания уровней вокруг тренда.
Задача аналитического выравнивания сводится к следующему:
1) определение на основе фактических данных формы (вида) гипотетической функции = f(t), способной наиболее адекватно отразить тенденцию развития исследуемого показателя;
2) нахождение по эмпирическим данным параметров указанной функции (уравнения);
3) расчет по найденному уравнению теоретических (выравненных) уровней.
В аналитическом выравнивании наиболее часто используются простейшие функции, представленные в таблице 15, где обозначено - теоретические (выравненные) уровни (читается как «игрек, выравненный по t»); t - условное обозначение времени (1, 2, 3 …); a0, a1, a2, ... - параметры аналитической функции; k - число гармоник (при выравнивании по ряду Фурье).
Выбор той или иной функции для выравнивания ряда динамики осуществляется на основании графического изображения эмпирических данных. Если по тем или иным причинам уровни эмпирического ряда трудно описать одной функцией, следует разбить анализируемый период на отдельные части и затем выровнять каждую часть по соответствующей кривой.
Таблица 15. Виды математических функций, используемые при выравнивании
Название функции |
Вид функции |
Формула |
|
Прямая линия |
(37) |
||
Парабола 2-го порядка |
или |
(38) |
|
Парабола 3-го порядка |
(39) |
||
Гипербола |
(40) |
||
Показательная |
(41) |
||
Степенная |
(42) |
||
Ряд Фурье |
(43) |
Нередко один и тот же ряд можно выровнять по разным аналитическим функциям и получить довольно близкие результаты. Чтобы решить вопрос о том, использование какой кривой дает лучший результат, обычно сопоставляют суммы квадратов отклонений эмпирических уровней от теоретических (остатки), рассчитанным по разным функциям, то есть:
. (4.18)
Та функция, при которой эта сумма минимальна, считается наиболее адекватной, приемлемой. Однако сравнивать непосредственно суммы квадратов отклонений можно в том случае, если сравниваемые уравнения имеют одинаковое число параметров. Если же число параметров k разное, то каждую сумму квадратов делят на разность (n - k), выступающую в роли числа степеней свободы, и сравнивают уже квадраты отклонений уровней, рассчитанные на одну степень свободы (т.е. остаточные дисперсии на одну степень свободы).
Параметры искомых уравнений (a0, a1, a2, ...) при аналитическом выравнивании могут быть определены по-разному, но наиболее распространенным методом является метод наименьших квадратов (МНК). При этом методе учитываются все эмпирические уровни и должна обеспечиваться минимальная сумма квадратов отклонений эмпирических значений уровней y от теоретических уровней:.(4.19)
В частности, при выравнивании по прямой вида параметры и отыскиваются по МНК следующим образом. В формуле (4.19) вместо записываем его конкретное выражение . Тогда . Дальнейшее решение сводится к задаче на экстремум, т.е. к определению того, при каком значении и функция двух переменных S может достигнуть минимума. Как известно, для этого надо найти частные производные S по и , приравнять их к нулю и после элементарных преобразований решить систему двух уравнений с двумя неизвестными.
В соответствии с вышеизложенным найдем частные производные:
(4.20)
Сократив каждое уравнение на 2, раскрыв скобки и перенеся члены с y в правую сторону, а остальные, оставив в левой, получим систему нормальных уравнений:
(4.21)
где n - количество уровней ряда; t - порядковый номер в условном обозначении периода или момента времени; y - уровни эмпирического ряда.
Эта система и, соответственно, расчет параметров и упрощаются, если отсчет времени ведется от середины ряда. Например, при нечетном числе уровней (как в нашем примере про ВО России - 7 уровней) серединная точка времени (год, месяц) принимается за нуль, тогда предшествующие периоды обозначаются соответственно -1, -2, -3 и т.д., а следующие за средним (центральным) - соответственно 1, 2, 3 и т.д. (см. 3-й столбец табл. 16). При четном числе уровней два серединных момента (периода) времени обозначают -1 и +1, а все последующие и предыдущие, соответственно, через два интервала: , , и т.д.
При таком порядке отсчета времени (от середины ряда) = 0, поэтому, система нормальных уравнений (4.20) упрощается до следующих двух уравнений, каждое из которых решается самостоятельно:
(4.22)
Как видим, при такой нумерации периодов параметр представляет собой средний уровень равномерного интервального ряда. Определим по формуле 4.20 параметры уравнения прямой для нашего примера про ВО России, для чего исходные данные и все расчеты необходимых сумм представим в таблице 16.
Таблица 16. Вспомогательные расчеты для линейного тренда
Год |
y |
t |
t2 |
yt |
|||||
2000 |
149,9 |
-3 |
9 |
-449,7 |
97,56 |
2739,78 |
25636,58 |
11614,681 |
|
2001 |
155,6 |
-2 |
4 |
-311,2 |
150,93 |
21,82 |
11394,04 |
10418,58 |
|
2002 |
168,3 |
-1 |
1 |
-168,3 |
204,30 |
1296,00 |
2848,51 |
7987,25 |
|
2003 |
212 |
0 |
0 |
0 |
257,67 |
2085,88 |
0,000 |
2085,88 |
|
2004 |
280,6 |
1 |
1 |
280,6 |
311,04 |
926,77 |
2848,51 |
525,72 |
|
2005 |
368,9 |
2 |
4 |
737,8 |
364,41 |
20,12 |
11394,04 |
12371,80 |
|
2006 |
468,4 |
3 |
9 |
1405,2 |
417,79 |
2561,81 |
25636,58 |
44406,53 |
|
Итого |
1803,7 |
0 |
28 |
1494,4 |
1803,70 |
9652,17 |
79758,26 |
89410,43 |
Из таблицы 16 получаем, что: a0 = 1803,7/7 = 257,671 и a1 = 1494,4/28 = 53,371. Отсюда искомое уравнение тренда: =257,671+53,371t.. Для иллюстрации построим график эмпирических и трендовых уровней - рисунок 6.
Рис. 6. Эмпирические и трендовые уровни ряда динамики ВО России
4.5 Оценка адекватности тренда и прогнозирование
Для найденного уравнения тренда необходимо провести оценку его надежности (адекватности), что осуществляется обычно с помощью критерия Фишера, сравнивая его расчетное значение Fр с теоретическим (табличным) значением FТ (Приложение 3). При этом расчетный критерий Фишера определяется по формуле 4.21:
, (4.21)
где k - число параметров (членов) выбранного уравнения тренда.
Для проверки правильности расчета сумм в формуле (4.21) можно использовать следующее равенство (4.22):
(4.22)
Сравнение расчетного и теоретического значений критерия Фишера ведется при заданном уровне значимости (вероятности сделать неверный прогноз) с учетом степеней свободы: и . При условии Fр > FТ считается, что выбранная математическая модель ряда динамики адекватно отражает обнаруженный в нем тренд.
Для социально-экономических явлений обычно оперируют не точечной, а интервальной оценкой, рассчитывая так называемые доверительные интервалы прогноза. Границы интервалов определяются по формуле (4.23): .
где - точечный прогноз, рассчитанный по модели тренда; - коэффициент доверия по распределению Стьюдента при уровне значимости и числе степеней свободы =n-1 (Приложение 2); - ошибка аппроксимации:
. (4.23)
Спрогнозируем ВО России на 2007 и 2008 годы с вероятностью 0,95 (значимостью 0,05), для чего найдем ошибку аппроксимации: == 43,937 и найдем коэффициент доверия по распределению Стьюдента по Приложению 2:
= 2,4469 при = 7 - 1= 6.
Прогноз на 2007 и 2008 годы с вероятностью 0,95:
Y2007 = (257,671+53,371*4)2,4469*43,937 или 363,6<Y2007<578,7 (млрд. руб.);
Y2008 = (257,671+53,371*5)2,4469*43,937 или 417,0<Y2008<632,0 (млрд. руб.).
Как видно из полученных прогнозов, доверительный интервал достаточно широк (из-за достаточно большой величины ошибки аппроксимации). Более точный прогноз можно получить при выравнивании по параболе 2-го порядка.
4.6 Контрольные задания
По статистическим данным ФСГС по России за 2000 - 2005 гг. (табл.17) вычислить: абсолютные, относительные, средние изменения и их темпы базисным и цепным способами. Проверить ряд на наличие в нем линейного тренда, на основе которого рассчитать интервальный прогноз на 2006 и 2007 г.г. с вероятностью 95%.
Таблица 17. Варианты выполнения контрольного задания
Год |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
|||
Вариант |
1 |
Валовой сбор сахарной свеклы, млн т. |
14,1 |
14,6 |
15,7 |
19,4 |
21,8 |
21,4 |
|
2 |
Валовой сбор картофеля, млн.т. |
34 |
35 |
32,9 |
36,7 |
35,9 |
37,3 |
||
3 |
Число заключенных браков, тыс |
897,3 |
1001,6 |
1019,8 |
1091,8 |
979,7 |
1066,4 |
||
4 |
Число построенных жилых домов, млн. м2 |
30,3 |
31,7 |
33,8 |
36,4 |
41,0 |
43,6 |
||
Вариант |
5 |
Поголовье крупного рогатого скота, млн. голов (на конец года) |
16,5 |
15,8 |
15,0 |
13,5 |
12,1 |
11,1 |
|
6 |
Производство мяса., млн.т |
4,4 |
4,5 |
4,7 |
4,9 |
5,0 |
4,9 |
||
7 |
Производство яиц, млрд.шт |
34,1 |
35,2 |
36,3 |
36,5 |
35,8 |
36,8 |
||
8 |
Численность населения, тыс.чел (на начало года) |
146890 |
146304 |
145649 |
144964 |
144168 |
143474 |
||
9 |
Среднегодовая численность занятых в экономике, тыс.чел. |
64327 |
64710 |
65359 |
65666 |
66407 |
66939 |
||
10 |
Доля расходов на оплату ЖКХ в бюджете домохозяйств, % |
4,6 |
5,2 |
6,2 |
7,2 |
7,7 |
8,3 |
5. Статистическое изучение взаимосвязей
5.1 Понятие корреляционной зависимости
Один из наиболее общих законов объективного мира - закон всеобщей связи и зависимости между явлениями. Естественно, что, исследуя явления в самых различных областях, статистика неизбежно сталкивается с зависимостями как между количественными, так и между качественными показателями, признаками. Ее задача - обнаружить (выявить) такие зависимости и дать им количественную характеристику.
Среди взаимосвязанных признаков (показателей) одни могут рассматриваться как определенные факторы, влияющие на изменение других (факторные), а вторые (результативные) --- как следствие, результат влияния первых.
Существует 2 вида связи между отдельными признаками: функциональная и стохастическая (статистическая), частным случаем которой является корреляционная.
Связь между двумя переменными x и y называется функциональной, если определенному значению переменной x строго соответствует одно или несколько значений другой переменной y, и с изменением значения x значение y меняется строго определенно. Такие связи обычно встречаются в точных науках. Например, известно, что площадь квадрата равна квадрату его стороны (S = a2). Это соотношение характерно для каждого единичного случая (квадрата), это так называемая жестко детерминированная связь. Такие связи можно встретить и в области экономических явлений. Например, при простой сдельной оплате труда связь между оплатой труда y и количеством изготовленных изделий x при фиксированной расценке за одну деталь, например 5 руб., легко выразить формулой .
Для изучения функциональных связей применяется индексный метод, который рассматривается в теме 7.
Существуют и иного рода связи, где взаимно действуют многие факторы, комбинация которых приводит к вариации значений результативного признака (показателя) при одинаковом значении факторного признака. Например, при изучении зависимости величины таможенных платежей, поступающих в федеральный бюджет, от количества товаров, перемещаемых через таможенную границу государства, (или от стоимостного товарооборота) последние будут рассматриваться как факторный признак, а величина таможенных платежей - как результативный. Между ними нет жестко детерминированной связи, т.е. при одном и том же количестве перемещенных через таможенную границу товаров (или стоимости товарооборота) величина таможенных платежей, перечисленных разными таможнями будет различной, так как кроме количества товаров, перемещаемых через таможенную границу государства, (или стоимость товарооборота) на величину таможенных платежей влияет много других факторов (различная номенклатура товаров, для которых применяются различные таможенные пошлины, сборы и льготы; различные таможенные режимы перемещения товаров через таможенную границу и др.), комбинация которых вызывает вариацию величины таможенных платежей.
Там, где взаимодействует множество факторов, в том числе и случайных,...
Подобные документы
Основные этапы, типы и методы маркетинговых исследований. Виды маркетинговой информации, методы ее сбора и обработки, основные инструменты. Исследование внутренней среды фирмы, потребителей, конкурентов, возможных посредников, товаров, продаж и цены.
контрольная работа [46,1 K], добавлен 22.07.2014Сущность и основные направления маркетинговых исследований. Этапы обращения информации. Методы проведения и процедура маркетинговых исследований. Способы сбора информации при проведении исследований. Достоинства и недостатки вторичной информации.
контрольная работа [64,3 K], добавлен 19.10.2010Этапы процесса, виды и методы маркетинговых исследований. Статистические показатели въездного туризма в Санкт-Петербурге, его основные проблемы в условиях мирового финансового кризиса. Оценка эффекта по совершенствованию деятельности объекта исследования.
курсовая работа [535,0 K], добавлен 24.07.2011Основные цели маркетингового анализа, характеристика его оперативного и стратегического (фундаментального) видов. Ступени аналитической деятельности в рыночной сфере. Применение статистических, эконометрических, индексных методов для обработки информации.
контрольная работа [18,9 K], добавлен 25.02.2012Выбор совокупностей объектов исследований, выделение генеральной совокупности, определение метода выборки и определение объема выборки. Статистические методы анализа данных. Типология методов прогнозирования. Эвристические и экстраполяционные методы.
реферат [77,4 K], добавлен 27.01.2009Организация проведения экспертизы. Методы определения показателей качества товаров. Математическая обработка данных и анализ результатов измерений (испытаний). Статистические методы контроля и управления качеством. Виды и формы товарной информации.
контрольная работа [39,9 K], добавлен 14.06.2012Определение маркетинговых исследований и основные понятия, этапы и принципы проведения, методы анализа и обработки информации. Характеристика товара и оценка критериев его конкурентоспособности. Принципы и методы ценообразования, обоснование цены.
курсовая работа [1,2 M], добавлен 31.05.2015Цели, основные этапы и порядок проведения маркетинговых исследований, общие требования к содержанию отчета. Планирование и организация сбора первичной информации: задачи, основные методы, систематизация полученных данных и значение самой процедуры.
реферат [11,6 K], добавлен 18.02.2009Этапы проведения маркетинговых исследований. Анализ, интерпретация данных и презентация результатов исследования. Структура маркетинговой информации. Методы первичной и вторичной информации. Эксперименты и их роль в проведении маркетинговых исследований.
курсовая работа [30,0 K], добавлен 29.01.2009Методы и процедуры маркетинговых исследований рынка. Понятие и основные этапы исследования, его методы и типы. Виды маркетинговой информации и методы ее сбора. Элементы маркетинговой информационной системы: база данных маркетинга, банк методов и моделей.
курсовая работа [67,9 K], добавлен 13.05.2009Рассмотрение методов сбора первичной информации: эксперимент, опрос, представление полученных данных, их обработка, формирование отчета. Определение направлений кабинетного маркетингового исследования: анализ рынка, конкурентов, потребителей, товара.
курсовая работа [182,0 K], добавлен 27.03.2010Типы, цели и задачи исследования в PR. Характеристика качественных (наблюдение, интервью, фокус-группа) и количественных (анализ документов, опрос) методов сбора первичной информации. Виды опросов, структура анкеты и типы вопросов для их проведения.
контрольная работа [38,7 K], добавлен 25.05.2015Методы маркетинговых исследований вторичной информации. Виды маркетинговой информации и источники вторичной информации. Методы сбора и обработки вторичных данных. План маркетингового исследования для ООО "Экономические технологии" и анализ результатов.
курсовая работа [36,2 K], добавлен 14.03.2009Исследования в связях с общественностью призваны предоставить максимум информации для проведения PR-кампании. Разработка механизмов детальной оценки достигнутых в ходе PR-кампании результатов. Эффективность первичных и вторичных видов исследований.
курсовая работа [54,4 K], добавлен 23.12.2009Сущность, методы маркетинговых исследований и информации. Практика получения и обработки маркетинговой информации на предприятии московского аэропорта Домодедово: Domodedovo Passenger Terminal. Разработка анкеты для маркетингового подразделения DPT.
курсовая работа [65,0 K], добавлен 25.06.2013Методы полевых исследований в маркетинге, их сущность и особенности. Технология проведения опросов. Изучение преимуществ проведения кабинетных исследований. Шесть типов контентанализа по Р. Мертону. Формализованный анализ документов, его этапы.
контрольная работа [37,2 K], добавлен 21.05.2014Типичные направления маркетинговых исследований. Специфика количественных и качественных методов сбора маркетинговой информации. Система сбора внешней текущей маркетинговой информации. Применение методов сбора маркетинговой информации на практике.
курсовая работа [200,6 K], добавлен 23.08.2010Сущность и типы маркетинговых исследований. Характеристика хозяйственной деятельности ТОО "Тай". Анализ методов маркетинговых исследований в оптовой и розничной торговле, проводимых на мясоперерабатывающем предприятии. Основные пути их совершенствования.
курсовая работа [44,8 K], добавлен 26.10.2010Информационные задачи маркетинга, методы сбора, получения и обработки маркетинговой информации. Особенности, цели, методика, типология и стадии процесса проведения маркетинговых исследований на примере цифрового фотоаппарата Olympus, анализ конкурентов.
дипломная работа [100,3 K], добавлен 10.11.2010Понятие товародвижения как необходимого процесса воспроизводства, его основные цели и система. Анализ натуральных и стоимостных показателей, характеризующих потоки товаров. Значение и содержание маркетинговых исследований, методы и этапы их проведения.
контрольная работа [93,6 K], добавлен 17.06.2010