Корреляционный анализ стоимости изготовления деталей
Расчет статистических средних величин на основе массовых данных с применением статистически организованного массового наблюдения (сплошного и выборочного). Корреляционный анализ связи между случайными величинами при оценке стоимости изготовления деталей.
Рубрика | Экономика и экономическая теория |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 22.02.2019 |
Размер файла | 1,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ
РОССИЙСКОЙ ФЕДЕРАЦИИ
ПЕНЗЕНСКИЙ ГОСУДАСТВЕННЫЙ УНИВЕРСИТЕТ
Кафедра бухгалтерского учета, налогообложения и аудита
КУРСОВАЯ РАБОТА
по дисциплине: «Общая теория статистики»
на тему: «Корреляционный анализ стоимости изготовления деталей»
Направление подготовки: 38.03.01 Экономика
Выполнил студент: Болеева Н.Ю.
Руководитель: Деркаченко В.Н.
Пенза, 2017
Оглавление
- Введение
- Средние величины и показатели вариации
- Корреляционный анализ
- Регрессионный анализ
- Заключение
- Список использованных источников
- Введение
- В условиях рынка предприятие является главным объектом хозяйствования, независимым товаропроизводителем, экономическое пространство для которого практически неограниченно, но всецело зависит от умения работать безубыточно, адаптируясь к условиям изменяющейся экономической среды. Производственные показатели характеризуют эффективность деятельности предприятия. Обеспечение качества систем управления требует широкого применения статистических методов. Статистические методы, позволяют установить закономерности и причины изменений явлений и процессов, имеющих место на предприятии или в организации, являются мощным инструментом обоснования принимаемых решений и оценки их эффективности. Методы экономико-статистического анализа носят универсальный характер и не зависят от отраслевой принадлежности предприятий, позволяют менеджеру анализировать положение дел в организации, разрабатывать варианты управленческих решений, выбирать наиболее эффективные, оценивать влияние этих решений на результаты деятельности.
- Средние величины и показатели вариации
- Большое распространение в статистике имеют средние величины. Средние величины характеризуют качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др.
- Средняя - это один из распространенных приемов обобщений. Правильное понимание сущности средней определяет ее особую значимость в условиях рыночной экономики, когда средняя через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития.
- Средняя величина - это обобщающие показатели, в которых находят выражение действия общих условий, закономерностей изучаемого явления.
- Статистические средние рассчитываются на основе массовых данных правильно статистически организованного массового наблюдения (сплошного и выборочного). Однако статистическая средняя будет объективна и типична, если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений). Например, если рассчитывать среднюю заработную плату в кооперативах и на госпредприятиях, а результат распространить на всю совокупность, то средняя фиктивна, так как рассчитана по неоднородной совокупности, и такая средняя теряет всякий смысл.
- При помощи средней происходит как бы сглаживание различий в величине признака, которые возникают по тем или иным причинам у отдельных единиц наблюдения.[4,25]
- Например, средняя выработка продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, здоровья и т.д.
- Средняя выработка отражает общее свойство всей совокупности.
- Средняя величина является отражением значений изучаемого признака, следовательно, измеряется в той же размерности, что и этот признак.
- Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному признаку. Чтобы получить полное и всестороннее представление об изучаемой совокупности по ряду существенных признаков, в целом необходимо располагать системой средних величин, которые могут описать явление с разных сторон.
- Существуют различные средние:
- 1. средняя арифметическая;
- 2. средняя геометрическая;
- 3. средняя гармоническая;
- 4. средняя квадратическая;
- 5. средняя хронологическая.
- Рассмотрим некоторые виды средних, которые наиболее часто используются в статистике.[3,12]
- Средняя арифметическая
- Средняя арифметическая простая (невзвешенная) равна сумме отдельных значений признака, деленной на число этих значений.
- Отдельные значения признака называют вариантами и обозначают через х (); число единиц совокупности обозначают через n, среднее значение признака - через . Следовательно, средняя арифметическая простая равна:
- (1.1)
- Основные свойства средней арифметической.
- Средняя арифметическая обладает рядом свойств:
- 1. От уменьшения или увеличения частот каждого значения признака х в п раз величина средней арифметической не изменится.
- Если все частоты разделить или умножить на какое-либо число, то величина средней не изменится.
- 2. Общий множитель индивидуальных значений признака может быть вынесен за знак средней:
- (1.2)
- 3. Средняя суммы (разности) двух или нескольких величин равна сумме (разности) их средних:
- (1.3)
- 4. Если х = с, где с - постоянная величина, то .
- 5. Сумма отклонений значений признака Х от средней арифметической х равна нулю:
- Мода.
- Характеристиками вариационных рядов, наряду со средними, являются мода и медиана.
- Мода - это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой.
- Для интервальных рядов распределения с равными интервалами мода определяется по формуле:
- (1.4)
- где - начальное значение интервала, содержащего моду;
- - величина модального интервала;
- - частота модального интервала;
- - частота интервала, предшествующего модальному;
- - частота интервала, следующего за модальным.
- Медиана
- Рассмотрим расчет медианы в интервальном вариационном ряду.
- Медиана интервального вариационного ряда распределения определяется по формуле [6,54-58]
- (1.5)
- где -- начальное значение интервала, содержащего медиану;
- -- величина медианного интервала;
- -- сумма частот ряда;
- -- сумма накопленных частот, предшествующих медианному интервалу;
- -- частота медианного интервала.
- Понятие вариации признаков. Показатели вариации.
- Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для глубокого анализа изучаемого процесса или явления. Поэтому необходимо учитывать и вариацию значений отдельных единиц совокупности.
- Значительной вариации подвержены объемы спроса и предложения, процентные ставки в различные периоды времени.
- Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака.
- Вариация - это изменение (колеблемость) значений признака внутри совокупности. Величина признаков варьирует под действием различных причин и явлений.
- Поскольку изменение (колеблемость) признаков, бывает большей или меньшей возникает задача измерения ее величины.
- Измерение вариации признака необходимо при: определении надежности средних величин, результатов выборочных наблюдений для различных совокупностей и т.д.
- Для измерения размера вариации в статистике используют различные показатели, которые принято делить на абсолютные и относительные.
- К абсолютным показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия признака и среднее квадратическое отклонение.
- Размах вариации (R) - представляет собой разность между max и min значениями признака в изучаемой совокупности.[4,25-29]
- R = X max - X min(1.6)
- Задача 1.1. По статистическим данным: 3; 5; 2; 4; 7; 3; 8; 3; 10 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение увеличить на свой номер классного журнала. Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.
- Решение:
- Проранжируем ряд. Для этого сортируем его значения по возрастанию.
- Таблица1.1
- Расчет
- Для оценки ряда распределения найдем следующие показатели:
- Показатели центра распределения.
- Простая средняя арифметическая
- Мода.
- Значение ряда 7 встречается всех больше (3 раз). Следовательно, мода равна x = 7.
- Медиана.
- Me = 8
- Показатели вариации.
- Размах вариации
- R = xmax - xmin = 14 - 6 = 8
- Среднее линейное отклонение -
- Каждое значение ряда отличается от другого в среднем на 2.22
- Дисперсия
- Среднее квадратическое отклонение.
- Каждое значение ряда отличается от среднего значения 9 в среднем на 2.58
- Выводы:
- Каждое значение ряда отличается от среднего значения 9 в среднем на 2.58.
- Задача 1.2. По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 25%, стоимость основных фондов увеличилась на 14%. Определить изменение фондоотдачи.
- Решение:
- Данную задачу можно решить на условном примере:
- Стоимость произведённой продукции = 20000 тыс. руб.
- Стоимость основных производственных фондов = 40000 тыс. руб
- Фондоотдача =
- Доход от реализации увеличился на 25 %, то есть он стал равным 25000 тыс. руб. (20000 х 1,25)
- Стоимость основных фондов увеличилась на 14% и стала равной 45600
- Фондоотдача=
- Фондоотдача уменьшилась на 5 %, то есть она стала равной 0,55 (0,55 х 0,95)
- Задача 1. 3. Объем оборота (У) и число работников (m) приведены в таблице 1. Определить среднее значение, моду и медиану.
- Таблица 1.2 - Исходные данные
x |
|x - xср| |
(x-xср)2 |
|
6 |
3 |
9 |
|
7 |
2 |
4 |
|
7 |
2 |
4 |
|
7 |
2 |
4 |
|
8 |
1 |
1 |
|
9 |
0 |
0 |
|
11 |
2 |
4 |
|
12 |
3 |
9 |
|
14 |
5 |
25 |
|
81 |
20 |
60 |
У |
80-100 |
100-120 |
120-140 |
140-160 |
160-180 |
180-200 |
|
m |
6 |
17 |
25 |
28 |
14 |
10 |
Решение:
Таблица 1.3
Расчет
Группы |
Середина интервала, xцентр |
Кол-во, fi |
xi * fi |
Накопленная частота, S |
|x - xср|*fi |
(x - xср)2*fi |
Частота, fi/f |
|
80 - 100 |
90 |
6 |
540 |
6 |
308.4 |
15851.76 |
0.06 |
|
100 - 120 |
110 |
17 |
1870 |
23 |
533.8 |
16761.32 |
0.17 |
|
120 - 140 |
130 |
25 |
3250 |
48 |
285 |
3249 |
0.25 |
|
140 - 160 |
150 |
28 |
4200 |
76 |
240.8 |
2070.88 |
0.28 |
|
160 - 180 |
170 |
14 |
2380 |
90 |
400.4 |
11451.44 |
0.14 |
|
180 - 200 |
190 |
10 |
1900 |
100 |
486 |
23619.6 |
0.1 |
|
Итого |
100 |
14140 |
2254.4 |
73004 |
1 |
Для оценки ряда распределения найдем следующие показатели:
Показатели центра распределения.
Средняя взвешенная
Мода.
Наиболее часто встречающееся значение ряда - 143.53
Медиана.
Таким образом, 50% единиц совокупности будут меньше по величине 141.43.
Задача 1.4. По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 2). Каждое значение Хi увеличить на свой номер классного журнала.
Таблица 1.4
Исходные данные по объему оборота предприятий
Хi |
mгi |
mчi |
moi |
|
5,0-5,2 |
3 |
3 |
||
5,2-5,4 |
4 |
4 |
||
5,4-5,6 |
17 |
17 |
||
5,6-5,8 |
11 |
15 |
26 |
|
5,8-6,0 |
13 |
6 |
19 |
|
6,0-6,2 |
18 |
5 |
23 |
|
6,2-6,4 |
6 |
6 |
||
6,4-6,6 |
2 |
2 |
||
50 |
50 |
100 |
Результаты, например, общая дисперсия равна 97830 руб. и коэффициент детерминации, целое число в %.
Решение:
Чтобы определить общую дисперсию, необходимо знать значение общей средней:
При расчете общей дисперсии необходимо использовать вид взвешенной, т.к. имеется частота:
= 0,09
Для вычисления внутригрупповой дисперсии по группам необходимо рассчитать среднее значение:
= 6
Внутригрупповая дисперсия определяется по формуле:
Межгрупповая дисперсия вычисляется следующим образом [3]:
Теперь необходимо рассчитать коэффициент детерминации [2]:
- связь умеренная, т.к. находится в интервале 30% - 50% (по соотношению Чэддока).
Ответ:
Задача 1. 5. Определить среднюю внутригрупповую, меж групповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).
Таблица 3 - Исходные данные
1 группа |
Хi |
1 |
2 |
8 |
|
mi |
30 |
15 |
5 |
||
2 группа |
Хi |
1 |
6 |
||
mi |
10 |
15 |
|||
3 группа |
Хi |
3 |
8 |
||
mi |
20 |
5 |
Решение:
В первую очередь, необходимо определить среднее значение для 3-х групп, и используя получившиеся результаты, рассчитать для них взвешенные дисперсии.
Для нахождения средней внутригрупповой дисперсии необходимо просуммировать получившиеся взвешенные и поделить их на 3:
Теперь необходимо рассчитать общее среднее значение и общую дисперсию:
Ответ:
Корреляционный анализ
корреляционный анализ стоимость
Целью корреляционного анализа является выявление оценки силы связи между случайными величинами (признаками), которые характеризует некоторый реальный процесс.
Задачи корреляционного анализа:
а) Измерение степени связности (тесноты, силы, строгости, интенсивности) двух и более явлений.
б) Отбор факторов, оказывающих наиболее существенное влияние на результативный признак, на основании измерения степени связности между явлениями. Существенные в данном аспекте факторы используют далее в регрессионном анализе. [2,56-59]
в) Обнаружение неизвестных причинных связей.
Формы проявления взаимосвязей весьма разнообразны. В качестве самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи.
Корреляционная связь проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятностных значений независимой переменной. Связь называется корреляционной, если каждому значению факторного признака соответствует вполне определенное неслучайное значение результативного признака.
Наглядным изображением корреляционной таблицы служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладываются значения X, по оси ординат - Y, а точками показываются сочетания X и Y. По расположению точек можно судить о наличии связи.
Показатели тесноты связи дают возможность охарактеризовать зависимость вариации результативного признака от вариации признака-фактора.
Более совершенным показателем степени тесноты корреляционной связи является линейный коэффициент корреляции. При расчете этого показателя учитываются не только отклонения индивидуальных значений признака от средней, но и сама величина этих отклонений.
Ключевыми вопросами данной темы являются уравнения регрессионной связи между результативным признаком и объясняющей переменной, метод наименьших квадратов для оценки параметров регрессионной модели, анализ качества полученного уравнения регрессии, построение доверительных интервалов прогноза значений результативного признака по уравнению регрессии.
Использование графического метода.
Этот метод применяют для наглядного изображения формы связи между изучаемыми экономическими показателями. Для этого в прямоугольной системе координат строят график, по оси ординат откладывают индивидуальные значения результативного признака Y, а по оси абсцисс - индивидуальные значения факторного признака X.
Совокупность точек результативного и факторного признаков называется полем корреляции. [5,85-89]
На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.
Линейное уравнение регрессии имеет вид y = bx + a + е
Здесь е - случайная ошибка (отклонение, возмущение).
Причины существования случайной ошибки:
1. Невключение в регрессионную модель значимых объясняющих переменных;
2. Агрегирование переменных. Например, функция суммарного потребления - это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.
3. Неправильное описание структуры модели;
4. Неправильная функциональная спецификация;
5. Ошибки измерения.
Так как отклонения еi для каждого конкретного наблюдения i - случайны и их значения в выборке неизвестны, то:
1) по наблюдениям xi и yi можно получить только оценки параметров б и в
2) Оценками параметров б и в регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;
Тогда оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + е, где ei - наблюдаемые значения (оценки) ошибок еi, а и b соответственно оценки параметров б и в регрессионной модели, которые следует найти.
Для оценки параметров б и в - используют МНК (метод наименьших квадратов). Решение ведем с использованием онлайн-калькулятора Уравнение регрессии.
Система нормальных уравнений.
a*n + b?x = ?y
a?x + b?x2 = ?y*x
Линейная связь между переменными Xi и Xj оценивается коэффициентом корреляции:
, (2.1)
где Xi и Xj - исследуемые переменные; mXi и mXj - математические ожидания переменных; уX и уX - дисперсии переменных.
Выборочный коэффициент корреляции определяют по формуле:
, (2.2)
или по преобразованной формуле:
, (2.3)
где i =1, 2,..., n, j = 1, 2,..., m, u = 1, 2,..., N; N - число опытов(объем выборки); xi, xj - оценки математических ожиданий; SXi, SXj - оценки среднеквадратических отклонений.
Только при совместной нормальной распределенности исследуемых случайных величин Xi и Xjкоэффициент корреляции имеет определенный смысл связи между переменными. В противном случае коэффициент корреляции может только косвенно характеризовать эту связь[5].
Задача 2. 1. Определить коэффициент корреляции между У и Х.
Х: 3,5; 4,6; 5,8; 4,2; 5,2;
УХ: 28,35; 43,24; 65,54; 28,98; 50,44.
Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Результаты:
1) коэффициент корреляции;
2) расчетное и табличное значения критерия Стьюдента и вывод.
Решение:
8,1 |
3,5 |
28,35 |
1,35 |
0,96 |
||
9,4 |
4,6 |
43,24 |
0 |
0,1 |
||
11,3 |
5,8 |
65,54 |
1,3 |
4,93 |
||
6,9 |
4,2 |
28,98 |
0,21 |
4,75 |
||
9,7 |
5,2 |
50,44 |
0,29 |
0,38 |
||
45,4 |
23,3 |
216,55 |
3,15 |
11,12 |
||
сред.знач. |
9,08 |
4,66 |
43,31 |
- |
- |
Перед расчетом коэффициента корреляции необходимо вычислить среднее квадратическое отклонение для показателей x и y [2]:
(14)
= 0,79
Коэффициент корреляции определяется по формуле [2]:
(15)
В соответствии с данными задачи, расчет выглядит следующим образом:
Вывод: связь между показателем и фактором очень сильная, т.к. её значение находится в интервале 0,8-1,0. Значимость коэффициента корреляции проверяется по критерию Стьюдента. В начале вычисляется расчетное значение критерия по формуле [5]:
(16)
Табличное значение находится при заданном уровне значимости значения и числе степеней свободы f. Уровень значимости в практических целях задается 0,05, а f=n-2табличное значение для рассматриваемого примера равно 3,18.
Вывод: т.к. расчетное значение меньше табличного, то коэффициент корреляции не значимый, необходимо увеличить объем выборки.
Ответ: = ; ; коэффициент не значим.
Задача 2.2. Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.
Таблица 2.3
Исходные данные
х |
у |
|
22 |
21 |
|
26 |
24 |
|
17 |
15 |
|
24 |
23 |
|
19 |
18 |
|
18 |
14 |
Решение:
Таблица 2.4
Расчет
x |
y |
x2 |
y2 |
x * y |
|
22 |
21 |
484 |
441 |
462 |
|
26 |
24 |
676 |
576 |
624 |
|
17 |
15 |
289 |
225 |
255 |
|
24 |
23 |
576 |
529 |
552 |
|
19 |
18 |
361 |
324 |
342 |
|
18 |
14 |
324 |
196 |
252 |
|
126 |
115 |
2710 |
2291 |
2487 |
Для наших данных система уравнений имеет вид
6a + 126*b = 115
126*a + 2710*b = 2487
Получаем эмпирические коэффициенты регрессии: b = 1.125, a = -4.4583
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 1.125 x -4.4583
Коэффициент корреляции.
Значимость коэффициента корреляции.
По таблице Стьюдента с уровнем значимости б=0.05 и степенями свободы k=4 находим tкрит:
tкрит (n-m-1;б/2) = (4;0.025) = 2.776
Поскольку |tнабл| > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим
Задача 2.3.
В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе. Решение:
Таблица 2.5
Исходные данные
X |
Y |
|
69 |
55 |
|
94 |
89 |
|
46 |
40 |
|
51 |
67 |
|
88 |
76 |
|
62 |
84 |
|
54 |
44 |
Присвоим ранги признаку Y и фактору X.
X |
Y |
ранг X, dx |
ранг Y, dy |
|
69 |
55 |
5 |
3 |
|
94 |
89 |
7 |
7 |
|
46 |
40 |
1 |
1 |
|
51 |
67 |
2 |
4 |
|
88 |
76 |
6 |
5 |
|
62 |
84 |
4 |
6 |
|
54 |
44 |
3 |
2 |
Матрица рангов.
ранг X, dx |
ранг Y, dy |
(dx - dy)2 |
|
5 |
3 |
4 |
|
7 |
7 |
0 |
|
1 |
1 |
0 |
|
2 |
4 |
4 |
|
6 |
5 |
1 |
|
4 |
6 |
4 |
|
3 |
2 |
1 |
|
28 |
28 |
14 |
Проверка правильности составления матрицы на основе исчисления контрольной суммы:
Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.
По формуле вычислим коэффициент ранговой корреляции Спирмена.
Связь между признаком Y и фактором X сильная и прямая
Регрессионный анализ
Основная цель регрессионного анализа состоит в определении аналитической формы связи, в которой изменение результативного признака обусловлено влиянием одного или нескольких факторных признаков, а множество всех прочих факторов, также оказывающих влияние на результативный признак, принимается за постоянные и средние значения.
Задачи регрессионного анализа:
а) Установление формы зависимости. Относительно характера и формы зависимости между явлениями, различают положительную линейную и нелинейную и отрицательную линейную и нелинейную регрессию.
б) Определение функции регрессии в виде математического уравнения того или иного типа и установление влияния объясняющих переменных на зависимую переменную.
в) Оценка неизвестных значений зависимой переменной. С помощью функции регрессии можно воспроизвести значения зависимой переменной внутри интервала заданных значений объясняющих переменных (т. е. решить задачу интерполяции) или оценить течение процесса вне заданного интервала (т. е. решить задачу экстраполяции). Результат представляет собой оценку значения зависимой переменной.
Парная регрессия - уравнение связи двух переменных у и х:
Различают линейные и нелинейные регрессии.
Линейная регрессия: y = a + bx + е
Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.
Регрессии, нелинейные по объясняющим переменным:
· полиномы разных степеней
· равносторонняя гипербола .
Регрессии, нелинейные по оцениваемым параметрам:
· степенная
· показательная
· экспоненциальная
Построение уравнения регрессии сводится к оценке ее параметров. Для оценки параметров регрессий, линейных по параметрам, Используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических минимальна, т.е.
. (3.1)
Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно a и b:
(3.2)
Можно воспользоваться готовыми формулами, которые вытекают из этой системы:
(3.3)
Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии :
(3.4)
и индекс корреляции - для нелинейной регрессии:
(3.5)
Оценку качества построенной модели даст коэффициент (индекс) детерминации, а также средняя ошибка аппроксимации. [1,24-38]
Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:
. (3.6)
Допустимый предел значений - не более 8-10%.
Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения:
. (3.7)
Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной:
, (3.8)
где - общая сумма квадратов отклонений;
- сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);
- остаточная сумма квадратов отклонений.
Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент (индекс) детерминации R2:
(3.9)
Коэффициент детерминации - квадрат коэффициента или индекса корреляции.
F-тест - оценивание качества уравнения регрессии - состоит в проверке гипотезы Но о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы: [2, 48-65]
, (3.10)
где n - число единиц совокупности; m - число параметров при переменных х.
Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости a. Уровень значимости a - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно a принимается равной 0,05 или 0,01.
Если Fтабл < Fфакт, то Но - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл > Fфакт, то гипотеза Но не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.
Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Но о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки: [4,25-29]
Задача 3.1. Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.
Характеристики модели: 1) модель (коэффициенты до 4-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;
5) вывод о значимости коэффициентов модели;
6) доверительные интервалы коэффициентов модели (до 4-х знаков).
Решение:
Для расчета параметров регрессии построим расчетную таблицу (табл. 3.1)
Таблица 3.1
Расчет
1/x |
y |
1/x2 |
y2 |
y/x |
|
0.2 |
25 |
0.04 |
625 |
5 |
|
0.1667 |
20 |
0.02778 |
400 |
3.3333 |
|
0.1429 |
19 |
0.02041 |
361 |
2.7143 |
|
0.125 |
18 |
0.01563 |
324 |
2.25 |
|
0.1111 |
17 |
0.01235 |
289 |
1.8889 |
|
0.1 |
16.5 |
0.01 |
272.25 |
1.65 |
|
0.09091 |
15 |
0.00826 |
225 |
1.3636 |
|
0.08333 |
15.5 |
0.00694 |
240.25 |
1.2917 |
|
0.07692 |
14 |
0.00592 |
196 |
1.0769 |
|
0.07143 |
12 |
0.0051 |
144 |
0.8571 |
|
1.1682 |
172 |
0.1524 |
3076.5 |
21.4259 |
Для наших данных система уравнений имеет вид
10a + 1.168*b = 172
1.168*a + 0.152*b = 21.426
Получаем эмпирические коэффициенты регрессии: b = 83.7484, a = 7.4163
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 83.7484 / x + 7.4163
Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:
Ошибка аппроксимации.
В среднем, расчетные значения отклоняются от фактических на 3.88%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Индекс детерминации.
т.е. в 94.48% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 5.52% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
Для оценки качества параметров регрессии построим расчетную таблицу (табл. 3.2)
Таблица 3.2
Расчетная таблица
x |
y |
y(x) |
(yi-ycp)2 |
(y-y(x))2 |
|y - yx|:y |
|
5 |
25 |
24.166 |
60.84 |
0.696 |
0.0334 |
|
6 |
20 |
21.374 |
7.84 |
1.889 |
0.0687 |
|
7 |
19 |
19.38 |
3.24 |
0.145 |
0.02 |
|
8 |
18 |
17.885 |
0.64 |
0.0133 |
0.0064 |
|
9 |
17 |
16.722 |
0.04 |
0.0775 |
0.0164 |
|
10 |
16.5 |
15.791 |
0.49 |
0.503 |
0.043 |
|
11 |
15 |
15.03 |
4.84 |
0.000886 |
0.00198 |
|
12 |
15.5 |
14.395 |
2.89 |
1.22 |
0.0713 |
|
13 |
14 |
13.858 |
10.24 |
0.02 |
0.0101 |
|
14 |
12 |
13.398 |
27.04 |
1.955 |
0.117 |
|
95 |
172 |
172 |
118.1 |
6.519 |
0.388 |
Оценка параметров уравнения регрессии.
S2 = 0.815 - необъясненная дисперсия или дисперсия ошибки регрессии (мера разброса зависимой переменной вокруг линии регрессии).
S = 0.9 - стандартная ошибка оценки (стандартная ошибка регрессии).
Sa - стандартное отклонение случайной величины a.
Sb - стандартное отклонение случайной величины b.
F-статистика. Критерий Фишера.
или по формуле:
где
Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5.32
Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
Задача 3.2. Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:
Определить характеристики модели.
Характеристики модели:
1) модель (коэффициенты до 2-х знаков);
2) индекс детерминации (до 2-х знаков);
3) стандартную ошибку (до 4-х знаков);
4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.
х |
у |
|
5 |
14 |
|
6 |
17,4 |
|
7 |
19,4 |
|
8 |
20,5 |
|
9 |
22,6 |
|
10 |
23,1 |
Решение:
Для решения задачи используем программу MS Excel, для этого введем исходные данные на рабочий лист и прологарифмируем значении х (рисунок 1)
Рисунок 1 - Ввод исходных данных
Затем на панели задач выбираем вкладку Данные и Анализ данных, выбираем инструмент Регрессия в появившемся диалоговом окне вводим исходные данные (рисунок 2)
Рисунок 2 - Заполнение диалогового окна Регрессия
В результате решения получим следующие данные (рисунок 3)
Рисунок 3 - Вывод результатов
По результатам решение сделаем следующие выводы
1) y = 13,06-6,46;
2) индекс детерминации равен 0,98 (максимальное значение 1), это означает очень тесную связь между факторным признаком и результативным показателем;
3) стандартная ошибка - 0,54;
4) расчетное значение критерия Фишера 197,37. Значимость модели равна 0,00015, что значительно меньше 0,05, следовательно, модель значима;
5) значимость коэффициентов модели определяется по t - статистике и Р-значению. P - значение для обоих коэффициентов значительно меньше 0,05 коэффициенты модели значимы.
Для определения значительности коэффициентов модели по t - статистике необходимо знать расчетное и табличное значение критерия Стьюдента для обоих показателей. Для расчетное значение составляет 14,04, а табличное при = 0,05 и df = n-1составляет 2,57. Расчетное значение больше табличного коэффициент значим. Для определение значимости происходим аналогично:
Расчетное значение - 14,04;
Табличное значение - 2,57.
Вывод: расчетное значение критерия Стьюдента больше табличного коэффициент значим.
6) Доверительные интервалы для а0 = -11,63 - -1,29; а1 = 10,46 - 15,64;
Ответ: y = 13,06-6,46 стандартная ошибка 0,54; F - критерий = 197,67; модель значима; коэффициенты модели значимы; а0 (11,63 - -1,29); а1 (10,46 - 15,64)
Задача 3.3. Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1.
Таблица 3.5
Динамика коэффициента рождаемости в Пензенской области
Год |
2000 |
2001 |
2002 |
2003 |
2004 |
2005 |
|
Коэффициент рождаемости |
7,5 |
7,5 |
8,0 |
8,4 |
8,6 |
8,4 |
|
Год |
2006 |
2007 |
2008 |
2009 |
2010 |
2011 |
|
Коэффициент рождаемости |
8,6 |
9,7 |
10,2 |
10,3 |
10,2 |
10,1 |
|
Год |
2012 |
2013 |
2014 |
2015 |
2016 |
||
Коэффициент рождаемости |
10,8 |
10,6 |
10,8 |
10,7 |
10,2 |
Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г.
Решение:
Таблица 3.6
Расчет
x |
y |
x2 |
y2 |
x * y |
|
1 |
7.5 |
1 |
56.25 |
7.5 |
|
2 |
7.5 |
4 |
56.25 |
15 |
|
3 |
8 |
9 |
64 |
24 |
|
4 |
8.4 |
16 |
70.56 |
33.6 |
|
5 |
8.6 |
25 |
73.96 |
43 |
|
6 |
8.4 |
36 |
70.56 |
50.4 |
|
7 |
8.6 |
49 |
73.96 |
60.2 |
|
8 |
9.7 |
64 |
94.09 |
77.6 |
|
9 |
10.2 |
81 |
104.04 |
91.8 |
|
10 |
10.3 |
100 |
106.09 |
103 |
|
11 |
10.2 |
121 |
104.04 |
112.2 |
|
12 |
10.1 |
144 |
102.01 |
121.2 |
|
13 |
10.8 |
169 |
116.64 |
140.4 |
|
14 |
10.6 |
196 |
112.36 |
148.4 |
|
15 |
10.8 |
225 |
116.64 |
162 |
|
16 |
10.7 |
256 |
114.49 |
171.2 |
|
17 |
10.2 |
289 |
104.04 |
173.4 |
|
153 |
160.6 |
1785 |
1539.98 |
1534.9 |
Для наших данных система уравнений имеет вид
17a + 153*b = 160.6
153*a + 1785*b = 1534.9
Получаем эмпирические коэффициенты регрессии: b = 0.2194, a = 7.4728
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 0.2194 x + 7.4728
Параметры уравнения регрессии.
Выборочные средние.
Выборочные дисперсии:
Среднеквадратическое отклонение
Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:
Коэффициент корреляции.
Уравнение регрессии
Линейное уравнение регрессии имеет вид y = 0.219 x + 7.473
Ошибка аппроксимации.
В среднем, расчетные значения отклоняются от фактических на 3.49%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Коэффициент детерминации.
R2= 0.9282 = 0.8618
т.е. в 86.18% случаев изменения х приводят к изменению y.
Прогноз
Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 1
tкрит (n-m-1;б/2) = (15;0.025) = 2.131
y(1) = 0.219*1 + 7.473 = 7.692
Вычислим ошибку прогноза для уравнения y = bx + a
или
7.692 ± 0.453
(7.24;8.15)
С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.
Вычислим ошибку прогноза для уравнения y = bx + a + е
7.692 ± 1.08
(6.62;8.77)
F-статистика. Критерий Фишера.
или по формуле:
где
Табличное значение критерия со степенями свободы k1=1 и k2=15, Fтабл = 4.54
Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).
Задача 3.4. Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.
Таблица 3.7
Курс рубля к доллару
Месяц и год |
январь2017 |
февраль |
март |
апрель |
май |
июнь |
июль |
август2017 |
|
Цена одного доллара |
59,6 |
58,5 |
58,0 |
56,4 |
57,0 |
57,9 |
59,7 |
59,6 |
Решение:
Построим линейную модель
Для наших данных система уравнений имеет вид
8a + 36*b = 466.7
36*a + 204*b = 2103.3
Получаем эмпирические коэффициенты регрессии: b = 0.075, a = 58
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 0.075 x + 58
Уравнение регрессии (оценка уравнения регрессии).
Линейное уравнение регрессии имеет вид y = 0.075 x + 58
Ошибка аппроксимации.
В среднем, расчетные значения отклоняются от фактических на 1.74%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Построим модель вида lnу = ао + а1t
Для этого значения у заменим значениями lny
Для расчета параметров регрессии построим расчетную таблицу (табл. 3.8)
Таблица 3.8
Расчет
x |
y |
x2 |
y2 |
x * y |
|
1 |
4.09 |
1 |
16.7281 |
4.09 |
|
2 |
4.07 |
4 |
16.5649 |
8.14 |
|
3 |
4.06 |
9 |
16.4836 |
12.18 |
|
4 |
4.03 |
16 |
16.2409 |
16.12 |
|
5 |
4.04 |
25 |
16.3216 |
20.2 |
|
6 |
4.06 |
36 |
16.4836 |
24.36 |
|
7 |
4.09 |
49 |
16.7281 |
28.63 |
|
8 |
4.09 |
64 |
16.7281 |
32.72 |
|
36 |
32.53 |
204 |
132.2789 |
146.44 |
Для наших данных система уравнений имеет вид
8a + 36*b = 32.53
36*a + 204*b = 146.44
Получаем эмпирические коэффициенты регрессии: b = 0.00131, a = 4.0604
Уравнение регрессии (эмпирическое уравнение регрессии):
y = 0.00131 x + 4.0604
Ошибка аппроксимации.
В среднем, расчетные значения отклоняются от фактических на 0.46%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.
Коэффициент детерминации.
R2= 0.1382 = 0.01902
т.е. в 1.9% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - низкая. Остальные 98.1% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).
F-статистика. Критерий Фишера.
или по формуле:
где
Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5.99
Поскольку фактическое значение F < Fтабл, то к...
Подобные документы
Статистика денежного обращения, инфляции и цен. Построение сводки и ряда распределения. Характеристика используемых статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки. Корреляционный анализ количественных признаков.
контрольная работа [564,1 K], добавлен 13.09.2012Предмет и метод статистики. Сводка и группировка статистических данных. Функции статистических показателей. Статистические ряды, вариация и дисперсия. Преимущества выборочного наблюдения. Методы анализа корреляционных связей, экономические индексы.
методичка [371,4 K], добавлен 15.01.2010Сводка и группировка материалов статистического наблюдения. Абсолютные, относительные и средние величины, показатели вариации. Ряды динамики, индексный анализ. Проведение корреляционно-регрессионного анализа таблиц о сборе урожая и внесении удобрений.
курсовая работа [667,1 K], добавлен 14.05.2013Группы средних величин: степенные, структурные. Особенности применения средних величин, виды. Рассмотрение основных свойств средней арифметической. Характеристика структурных средних величин. Анализ примеров на основе реальных статистических данных.
курсовая работа [230,6 K], добавлен 24.09.2012Характеристика методов выполнения оценок параметров больших множеств по данным выборочного наблюдения. Особенности работы с большими массивами данных. Расчет основных показателей совокупности. Корреляционно-регрессионный анализ. Анализ рядов динамики.
курсовая работа [1,2 M], добавлен 24.08.2010Сущность и назначение корреляционного метода изучения взаимосвязей между явлениями. Зависимость чистых процентных доходов от выданных кредитов, активов банка от величины вкладов частных лиц, стоимости акции на ММВБ от величины операционных доходов.
курсовая работа [2,1 M], добавлен 07.03.2011Построение корреляционного поля и предложение гипотезы о связи между денежными доходами и потребительскими расходами, выдвижение предположения о наличии выбросов. Оценка статистической надежности и значимости вычисленного коэффициента корреляции.
контрольная работа [3,0 M], добавлен 15.11.2012Сущность и содержание корреляционного анализа, его значение и эффективность в оценке связи. Множественная регрессия как один из наиболее распространенных способов получения многофакторных прогнозов, оценка ее преимуществ и недостатков, применение.
лабораторная работа [535,0 K], добавлен 17.11.2010Сбор исходных статистических данных. Расчет характеристик экспериментальных данных. Характеристики среднего положения измеренных значений. Распределение статистических данных. Построение и анализ контрольных карт средних арифметических и размахов.
курсовая работа [146,8 K], добавлен 17.10.2013Организация статистики и источники статистических данных. Наблюдение по способу регистрации данных. Выявление и изучение связи и взаимозависимости между явлениями. Система статистических показателей. Определение средних и относительных величин.
контрольная работа [53,6 K], добавлен 27.01.2011Сущность статистического анализа и выборочного метода. Правила группировки данных выборочного наблюдения по величине объема инвестиций. Графическое представление вариационного ряда (гистограмма, кумулята, кривая Лоренца). Расчет асимметрии и эксцесса.
курсовая работа [70,7 K], добавлен 26.10.2011Организация производства услуг и обслуживания заказчиков на предприятии в условиях рынка. Расчет стоимости изготовления женского костюма. Определение времени на изготовление изделия. Расчет планируемых издержек производства. Реклама, стимулирование сбыта.
курсовая работа [297,7 K], добавлен 22.11.2013Корреляционный анализ наличия и плотности связи между дифференциацией доходов населения (коэффициентом Джини) и макроэкономическими факторами: ВВП, производительность труда в промышленности, инфляция, безработица. Интерпретация регрессионного уравнения.
статья [28,4 K], добавлен 23.02.2010Краткая природно-экономическая характеристика хозяйства. Параметры линейной модели тренда. Расчет величин для определения показателей вариации. Корреляционно-регрессионный анализ связи между продуктивностью коров и себестоимостью одного центнера молока.
курсовая работа [199,9 K], добавлен 17.03.2015Сущность и назначение корреляционного анализа в статистике, основные этапы его реализации. Краткая экономическая характеристика Великобритании и Венгрии. Корреляционный анализ экономики данных государств, показателей прироста иностранных инвестиций.
курсовая работа [181,4 K], добавлен 25.06.2010Анализ финансового состояния компании, ее баланса и финансовых результатов. Расчет финансовых коэффициентов. Затратный и доходный подходы к оценке рыночной стоимости. Направления процедуры оценки. Сравнительный подход к оценке стоимости (метод сделок).
курсовая работа [95,9 K], добавлен 19.04.2014Оценка стоимости как инструмент принятия эффективных управленческих решений. Стоимостной подход к оценке эффективности управления. Расчет рыночной стоимости ЗАО "ПИК-Регион", выбор подхода к оценке. Описание компании, анализ ее финансовых показателей.
дипломная работа [147,3 K], добавлен 17.03.2013Расчёт программы участка слесарно-механического цеха. Ритм выпуска деталей и определение количества деталей в партиях. Необходимое количество оборудования и его загрузки. Расчет количества рабочих мест. Плановая себестоимость изготовления деталей.
курсовая работа [327,3 K], добавлен 05.06.2009Основные приемы и методы обработки и анализа статистических данных. Исчисление арифметической, гармонической и геометрической средних величин. Ряды распределения, их основные характеристики. Методы выравнивания рядом динамики. Система национальных счетов.
курсовая работа [1,2 M], добавлен 24.10.2014Определение основных вопросов оценки объекта недвижимости. Сбор, проверка и анализ информации. Анализ наиболее эффективного использования земельного участка. Расчет рыночной стоимости на основе трех подходов к оценке и согласование полученных результатов.
курсовая работа [35,9 K], добавлен 30.11.2010