Корреляционный анализ стоимости изготовления деталей

Расчет статистических средних величин на основе массовых данных с применением статистически организованного массового наблюдения (сплошного и выборочного). Корреляционный анализ связи между случайными величинами при оценке стоимости изготовления деталей.

Рубрика Экономика и экономическая теория
Вид курсовая работа
Язык русский
Дата добавления 22.02.2019
Размер файла 1,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

ПЕНЗЕНСКИЙ ГОСУДАСТВЕННЫЙ УНИВЕРСИТЕТ

Кафедра бухгалтерского учета, налогообложения и аудита

КУРСОВАЯ РАБОТА

по дисциплине: «Общая теория статистики»

на тему: «Корреляционный анализ стоимости изготовления деталей»

Направление подготовки: 38.03.01 Экономика

Выполнил студент: Болеева Н.Ю.

Руководитель: Деркаченко В.Н.

Пенза, 2017

Оглавление

  • Введение
  • Средние величины и показатели вариации
  • Корреляционный анализ
  • Регрессионный анализ
  • Заключение
  • Список использованных источников
  • Введение
  • В условиях рынка предприятие является главным объектом хозяйствования, независимым товаропроизводителем, экономическое пространство для которого практически неограниченно, но всецело зависит от умения работать безубыточно, адаптируясь к условиям изменяющейся экономической среды. Производственные показатели характеризуют эффективность деятельности предприятия. Обеспечение качества систем управления требует широкого применения статистических методов. Статистические методы, позволяют установить закономерности и причины изменений явлений и процессов, имеющих место на предприятии или в организации, являются мощным инструментом обоснования принимаемых решений и оценки их эффективности. Методы экономико-статистического анализа носят универсальный характер и не зависят от отраслевой принадлежности предприятий, позволяют менеджеру анализировать положение дел в организации, разрабатывать варианты управленческих решений, выбирать наиболее эффективные, оценивать влияние этих решений на результаты деятельности.
  • Средние величины и показатели вариации
  • Большое распространение в статистике имеют средние величины. Средние величины характеризуют качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др.
  • Средняя - это один из распространенных приемов обобщений. Правильное понимание сущности средней определяет ее особую значимость в условиях рыночной экономики, когда средняя через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития.
  • Средняя величина - это обобщающие показатели, в которых находят выражение действия общих условий, закономерностей изучаемого явления.
  • Статистические средние рассчитываются на основе массовых данных правильно статистически организованного массового наблюдения (сплошного и выборочного). Однако статистическая средняя будет объективна и типична, если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений). Например, если рассчитывать среднюю заработную плату в кооперативах и на госпредприятиях, а результат распространить на всю совокупность, то средняя фиктивна, так как рассчитана по неоднородной совокупности, и такая средняя теряет всякий смысл.
  • При помощи средней происходит как бы сглаживание различий в величине признака, которые возникают по тем или иным причинам у отдельных единиц наблюдения.[4,25]
  • Например, средняя выработка продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, здоровья и т.д.
  • Средняя выработка отражает общее свойство всей совокупности.
  • Средняя величина является отражением значений изучаемого признака, следовательно, измеряется в той же размерности, что и этот признак.
  • Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному признаку. Чтобы получить полное и всестороннее представление об изучаемой совокупности по ряду существенных признаков, в целом необходимо располагать системой средних величин, которые могут описать явление с разных сторон.
  • Существуют различные средние:
  • 1. средняя арифметическая;
  • 2. средняя геометрическая;
  • 3. средняя гармоническая;
  • 4. средняя квадратическая;
  • 5. средняя хронологическая.
  • Рассмотрим некоторые виды средних, которые наиболее часто используются в статистике.[3,12]
  • Средняя арифметическая
  • Средняя арифметическая простая (невзвешенная) равна сумме отдельных значений признака, деленной на число этих значений.
  • Отдельные значения признака называют вариантами и обозначают через х (); число единиц совокупности обозначают через n, среднее значение признака - через . Следовательно, средняя арифметическая простая равна:
  • (1.1)
  • Основные свойства средней арифметической.
  • Средняя арифметическая обладает рядом свойств:
  • 1. От уменьшения или увеличения частот каждого значения признака х в п раз величина средней арифметической не изменится.
  • Если все частоты разделить или умножить на какое-либо число, то величина средней не изменится.
  • 2. Общий множитель индивидуальных значений признака может быть вынесен за знак средней:
  • (1.2)
  • 3. Средняя суммы (разности) двух или нескольких величин равна сумме (разности) их средних:
  • (1.3)
  • 4. Если х = с, где с - постоянная величина, то .
  • 5. Сумма отклонений значений признака Х от средней арифметической х равна нулю:
  • Мода.
  • Характеристиками вариационных рядов, наряду со средними, являются мода и медиана.
  • Мода - это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой.
  • Для интервальных рядов распределения с равными интервалами мода определяется по формуле:
  • (1.4)
  • где - начальное значение интервала, содержащего моду;
  • - величина модального интервала;
  • - частота модального интервала;
  • - частота интервала, предшествующего модальному;
  • - частота интервала, следующего за модальным.
  • Медиана
  • Рассмотрим расчет медианы в интервальном вариационном ряду.
  • Медиана интервального вариационного ряда распределения определяется по формуле [6,54-58]
  • (1.5)
  • где -- начальное значение интервала, содержащего медиану;
  • -- величина медианного интервала;
  • -- сумма частот ряда;
  • -- сумма накопленных частот, предшествующих медианному интервалу;
  • -- частота медианного интервала.
  • Понятие вариации признаков. Показатели вариации.
  • Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для глубокого анализа изучаемого процесса или явления. Поэтому необходимо учитывать и вариацию значений отдельных единиц совокупности.
  • Значительной вариации подвержены объемы спроса и предложения, процентные ставки в различные периоды времени.
  • Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака.
  • Вариация - это изменение (колеблемость) значений признака внутри совокупности. Величина признаков варьирует под действием различных причин и явлений.
  • Поскольку изменение (колеблемость) признаков, бывает большей или меньшей возникает задача измерения ее величины.
  • Измерение вариации признака необходимо при: определении надежности средних величин, результатов выборочных наблюдений для различных совокупностей и т.д.
  • Для измерения размера вариации в статистике используют различные показатели, которые принято делить на абсолютные и относительные.
  • К абсолютным показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия признака и среднее квадратическое отклонение.
  • Размах вариации (R) - представляет собой разность между max и min значениями признака в изучаемой совокупности.[4,25-29]
  • R = X max - X min(1.6)
  • Задача 1.1. По статистическим данным: 3; 5; 2; 4; 7; 3; 8; 3; 10 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение увеличить на свой номер классного журнала. Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.
  • Решение:
  • Проранжируем ряд. Для этого сортируем его значения по возрастанию.
  • Таблица1.1
  • Расчет
  • x

    |x - xср|

    (x-xср)2

    6

    3

    9

    7

    2

    4

    7

    2

    4

    7

    2

    4

    8

    1

    1

    9

    0

    0

    11

    2

    4

    12

    3

    9

    14

    5

    25

    81

    20

    60

    • Для оценки ряда распределения найдем следующие показатели:
    • Показатели центра распределения.
    • Простая средняя арифметическая
    • Мода.
    • Значение ряда 7 встречается всех больше (3 раз). Следовательно, мода равна x = 7.
    • Медиана.
    • Me = 8
    • Показатели вариации.
    • Размах вариации
    • R = xmax - xmin = 14 - 6 = 8
    • Среднее линейное отклонение -
    • Каждое значение ряда отличается от другого в среднем на 2.22
    • Дисперсия
    • Среднее квадратическое отклонение.
    • Каждое значение ряда отличается от среднего значения 9 в среднем на 2.58
    • Выводы:
    • Каждое значение ряда отличается от среднего значения 9 в среднем на 2.58.
    • Задача 1.2. По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 25%, стоимость основных фондов увеличилась на 14%. Определить изменение фондоотдачи.
    • Решение:
    • Данную задачу можно решить на условном примере:
    • Стоимость произведённой продукции = 20000 тыс. руб.
    • Стоимость основных производственных фондов = 40000 тыс. руб
    • Фондоотдача =
    • Доход от реализации увеличился на 25 %, то есть он стал равным 25000 тыс. руб. (20000 х 1,25)
    • Стоимость основных фондов увеличилась на 14% и стала равной 45600
    • Фондоотдача=
    • Фондоотдача уменьшилась на 5 %, то есть она стала равной 0,55 (0,55 х 0,95)
    • Задача 1. 3. Объем оборота (У) и число работников (m) приведены в таблице 1. Определить среднее значение, моду и медиану.
    • Таблица 1.2 - Исходные данные
    • У

      80-100

      100-120

      120-140

      140-160

      160-180

      180-200

      m

      6

      17

      25

      28

      14

      10

      Решение:

      Таблица 1.3

      Расчет

      Группы

      Середина интервала, xцентр

      Кол-во, fi

      xi * fi

      Накопленная частота, S

      |x - xср|*fi

      (x - xср)2*fi

      Частота, fi/f

      80 - 100

      90

      6

      540

      6

      308.4

      15851.76

      0.06

      100 - 120

      110

      17

      1870

      23

      533.8

      16761.32

      0.17

      120 - 140

      130

      25

      3250

      48

      285

      3249

      0.25

      140 - 160

      150

      28

      4200

      76

      240.8

      2070.88

      0.28

      160 - 180

      170

      14

      2380

      90

      400.4

      11451.44

      0.14

      180 - 200

      190

      10

      1900

      100

      486

      23619.6

      0.1

      Итого

      100

      14140

      2254.4

      73004

      1

      Для оценки ряда распределения найдем следующие показатели:

      Показатели центра распределения.

      Средняя взвешенная

      Мода.

      Наиболее часто встречающееся значение ряда - 143.53

      Медиана.

      Таким образом, 50% единиц совокупности будут меньше по величине 141.43.

      Задача 1.4. По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., mг - число государственных предприятий; mч - частных; mо - общее число (таблица 2). Каждое значение Хi увеличить на свой номер классного журнала.

      Таблица 1.4

      Исходные данные по объему оборота предприятий

      Хi

      mгi

      mчi

      moi

      5,0-5,2

      3

      3

      5,2-5,4

      4

      4

      5,4-5,6

      17

      17

      5,6-5,8

      11

      15

      26

      5,8-6,0

      13

      6

      19

      6,0-6,2

      18

      5

      23

      6,2-6,4

      6

      6

      6,4-6,6

      2

      2

      50

      50

      100

      Результаты, например, общая дисперсия равна 97830 руб. и коэффициент детерминации, целое число в %.

      Решение:

      Чтобы определить общую дисперсию, необходимо знать значение общей средней:

      При расчете общей дисперсии необходимо использовать вид взвешенной, т.к. имеется частота:

      = 0,09

      Для вычисления внутригрупповой дисперсии по группам необходимо рассчитать среднее значение:

      = 6

      Внутригрупповая дисперсия определяется по формуле:

      Межгрупповая дисперсия вычисляется следующим образом [3]:

      Теперь необходимо рассчитать коэффициент детерминации [2]:

      - связь умеренная, т.к. находится в интервале 30% - 50% (по соотношению Чэддока).

      Ответ:

      Задача 1. 5. Определить среднюю внутригрупповую, меж групповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).

      Таблица 3 - Исходные данные

      1 группа

      Хi

      1

      2

      8

      mi

      30

      15

      5

      2 группа

      Хi

      1

      6

      mi

      10

      15

      3 группа

      Хi

      3

      8

      mi

      20

      5

      Решение:

      В первую очередь, необходимо определить среднее значение для 3-х групп, и используя получившиеся результаты, рассчитать для них взвешенные дисперсии.

      Для нахождения средней внутригрупповой дисперсии необходимо просуммировать получившиеся взвешенные и поделить их на 3:

      Теперь необходимо рассчитать общее среднее значение и общую дисперсию:

      Ответ:

      Корреляционный анализ

      корреляционный анализ стоимость

      Целью корреляционного анализа является выявление оценки силы связи между случайными величинами (признаками), которые характеризует некоторый реальный процесс.

      Задачи корреляционного анализа:

      а) Измерение степени связности (тесноты, силы, строгости, интенсивности) двух и более явлений.

      б) Отбор факторов, оказывающих наиболее существенное влияние на результативный признак, на основании измерения степени связности между явлениями. Существенные в данном аспекте факторы используют далее в регрессионном анализе. [2,56-59]

      в) Обнаружение неизвестных причинных связей.

      Формы проявления взаимосвязей весьма разнообразны. В качестве самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи.

      Корреляционная связь проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятностных значений независимой переменной. Связь называется корреляционной, если каждому значению факторного признака соответствует вполне определенное неслучайное значение результативного признака.

      Наглядным изображением корреляционной таблицы служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладываются значения X, по оси ординат - Y, а точками показываются сочетания X и Y. По расположению точек можно судить о наличии связи.

      Показатели тесноты связи дают возможность охарактеризовать зависимость вариации результативного признака от вариации признака-фактора.

      Более совершенным показателем степени тесноты корреляционной связи является линейный коэффициент корреляции. При расчете этого показателя учитываются не только отклонения индивидуальных значений признака от средней, но и сама величина этих отклонений.

      Ключевыми вопросами данной темы являются уравнения регрессионной связи между результативным признаком и объясняющей переменной, метод наименьших квадратов для оценки параметров регрессионной модели, анализ качества полученного уравнения регрессии, построение доверительных интервалов прогноза значений результативного признака по уравнению регрессии.

      Использование графического метода.

      Этот метод применяют для наглядного изображения формы связи между изучаемыми экономическими показателями. Для этого в прямоугольной системе координат строят график, по оси ординат откладывают индивидуальные значения результативного признака Y, а по оси абсцисс - индивидуальные значения факторного признака X.

      Совокупность точек результативного и факторного признаков называется полем корреляции. [5,85-89]

      На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.

      Линейное уравнение регрессии имеет вид y = bx + a + е

      Здесь е - случайная ошибка (отклонение, возмущение).

      Причины существования случайной ошибки:

      1. Невключение в регрессионную модель значимых объясняющих переменных;

      2. Агрегирование переменных. Например, функция суммарного потребления - это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.

      3. Неправильное описание структуры модели;

      4. Неправильная функциональная спецификация;

      5. Ошибки измерения.

      Так как отклонения еi для каждого конкретного наблюдения i - случайны и их значения в выборке неизвестны, то:

      1) по наблюдениям xi и yi можно получить только оценки параметров б и в

      2) Оценками параметров б и в регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;

      Тогда оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + е, где ei - наблюдаемые значения (оценки) ошибок еi, а и b соответственно оценки параметров б и в регрессионной модели, которые следует найти.

      Для оценки параметров б и в - используют МНК (метод наименьших квадратов). Решение ведем с использованием онлайн-калькулятора Уравнение регрессии.

      Система нормальных уравнений.

      a*n + b?x = ?y

      a?x + b?x2 = ?y*x

      Линейная связь между переменными Xi и Xj оценивается коэффициентом корреляции:

      , (2.1)

      где Xi и Xj - исследуемые переменные; mXi и mXj - математические ожидания переменных; уX и уX - дисперсии переменных.

      Выборочный коэффициент корреляции определяют по формуле:

      , (2.2)

      или по преобразованной формуле:

      , (2.3)

      где i =1, 2,..., n, j = 1, 2,..., m, u = 1, 2,..., N; N - число опытов(объем выборки); xi, xj - оценки математических ожиданий; SXi, SXj - оценки среднеквадратических отклонений.

      Только при совместной нормальной распределенности исследуемых случайных величин Xi и Xjкоэффициент корреляции имеет определенный смысл связи между переменными. В противном случае коэффициент корреляции может только косвенно характеризовать эту связь[5].

      Задача 2. 1. Определить коэффициент корреляции между У и Х.

      Х: 3,5; 4,6; 5,8; 4,2; 5,2;

      УХ: 28,35; 43,24; 65,54; 28,98; 50,44.

      Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Результаты:

      1) коэффициент корреляции;

      2) расчетное и табличное значения критерия Стьюдента и вывод.

      Решение:

      8,1

      3,5

      28,35

      1,35

      0,96

      9,4

      4,6

      43,24

      0

      0,1

      11,3

      5,8

      65,54

      1,3

      4,93

      6,9

      4,2

      28,98

      0,21

      4,75

      9,7

      5,2

      50,44

      0,29

      0,38

      45,4

      23,3

      216,55

      3,15

      11,12

      сред.знач.

      9,08

      4,66

      43,31

      -

      -

      Перед расчетом коэффициента корреляции необходимо вычислить среднее квадратическое отклонение для показателей x и y [2]:

      (14)

      = 0,79

      Коэффициент корреляции определяется по формуле [2]:

      (15)

      В соответствии с данными задачи, расчет выглядит следующим образом:

      Вывод: связь между показателем и фактором очень сильная, т.к. её значение находится в интервале 0,8-1,0. Значимость коэффициента корреляции проверяется по критерию Стьюдента. В начале вычисляется расчетное значение критерия по формуле [5]:

      (16)

      Табличное значение находится при заданном уровне значимости значения и числе степеней свободы f. Уровень значимости в практических целях задается 0,05, а f=n-2табличное значение для рассматриваемого примера равно 3,18.

      Вывод: т.к. расчетное значение меньше табличного, то коэффициент корреляции не значимый, необходимо увеличить объем выборки.

      Ответ: = ; ; коэффициент не значим.

      Задача 2.2. Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.

      Таблица 2.3

      Исходные данные

      х

      у

      22

      21

      26

      24

      17

      15

      24

      23

      19

      18

      18

      14

      Решение:

      Таблица 2.4

      Расчет

      x

      y

      x2

      y2

      x * y

      22

      21

      484

      441

      462

      26

      24

      676

      576

      624

      17

      15

      289

      225

      255

      24

      23

      576

      529

      552

      19

      18

      361

      324

      342

      18

      14

      324

      196

      252

      126

      115

      2710

      2291

      2487

      Для наших данных система уравнений имеет вид

      6a + 126*b = 115

      126*a + 2710*b = 2487

      Получаем эмпирические коэффициенты регрессии: b = 1.125, a = -4.4583

      Уравнение регрессии (эмпирическое уравнение регрессии):

      y = 1.125 x -4.4583

      Коэффициент корреляции.

      Значимость коэффициента корреляции.

      По таблице Стьюдента с уровнем значимости б=0.05 и степенями свободы k=4 находим tкрит:

      tкрит (n-m-1;б/2) = (4;0.025) = 2.776

      Поскольку |tнабл| > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим

      Задача 2.3.

      В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе. Решение:

      Таблица 2.5

      Исходные данные

      X

      Y

      69

      55

      94

      89

      46

      40

      51

      67

      88

      76

      62

      84

      54

      44

      Присвоим ранги признаку Y и фактору X.

      X

      Y

      ранг X, dx

      ранг Y, dy

      69

      55

      5

      3

      94

      89

      7

      7

      46

      40

      1

      1

      51

      67

      2

      4

      88

      76

      6

      5

      62

      84

      4

      6

      54

      44

      3

      2

      Матрица рангов.

      ранг X, dx

      ранг Y, dy

      (dx - dy)2

      5

      3

      4

      7

      7

      0

      1

      1

      0

      2

      4

      4

      6

      5

      1

      4

      6

      4

      3

      2

      1

      28

      28

      14

      Проверка правильности составления матрицы на основе исчисления контрольной суммы:

      Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.

      По формуле вычислим коэффициент ранговой корреляции Спирмена.

      Связь между признаком Y и фактором X сильная и прямая

      Регрессионный анализ

      Основная цель регрессионного анализа состоит в определении аналитической формы связи, в которой изменение результативного признака обусловлено влиянием одного или нескольких факторных признаков, а множество всех прочих факторов, также оказывающих влияние на результативный признак, принимается за постоянные и средние значения.

      Задачи регрессионного анализа:

      а) Установление формы зависимости. Относительно характера и формы зависимости между явлениями, различают положительную линейную и нелинейную и отрицательную линейную и нелинейную регрессию.

      б) Определение функции регрессии в виде математического уравнения того или иного типа и установление влияния объясняющих переменных на зависимую переменную.

      в) Оценка неизвестных значений зависимой переменной. С помощью функции регрессии можно воспроизвести значения зависимой переменной внутри интервала заданных значений объясняющих переменных (т. е. решить задачу интерполяции) или оценить течение процесса вне заданного интервала (т. е. решить задачу экстраполяции). Результат представляет собой оценку значения зависимой переменной.

      Парная регрессия - уравнение связи двух переменных у и х:

      Различают линейные и нелинейные регрессии.

      Линейная регрессия: y = a + bx + е

      Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.

      Регрессии, нелинейные по объясняющим переменным:

      · полиномы разных степеней

      · равносторонняя гипербола .

      Регрессии, нелинейные по оцениваемым параметрам:

      · степенная

      · показательная

      · экспоненциальная

      Построение уравнения регрессии сводится к оценке ее параметров. Для оценки параметров регрессий, линейных по параметрам, Используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических минимальна, т.е.

      . (3.1)

      Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно a и b:

      (3.2)

      Можно воспользоваться готовыми формулами, которые вытекают из этой системы:

      (3.3)

      Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии :

      (3.4)

      и индекс корреляции - для нелинейной регрессии:

      (3.5)

      Оценку качества построенной модели даст коэффициент (индекс) детерминации, а также средняя ошибка аппроксимации. [1,24-38]

      Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

      . (3.6)

      Допустимый предел значений - не более 8-10%.

      Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения:

      . (3.7)

      Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной:

      , (3.8)

      где - общая сумма квадратов отклонений;

      - сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);

      - остаточная сумма квадратов отклонений.

      Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент (индекс) детерминации R2:

      (3.9)

      Коэффициент детерминации - квадрат коэффициента или индекса корреляции.

      F-тест - оценивание качества уравнения регрессии - состоит в проверке гипотезы Но о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического Fфакт и критического (табличного) Fтабл значений F-критерия Фишера. Fфакт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы: [2, 48-65]

      , (3.10)

      где n - число единиц совокупности; m - число параметров при переменных х.

      Fтабл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости a. Уровень значимости a - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно a принимается равной 0,05 или 0,01.

      Если Fтабл < Fфакт, то Но - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если Fтабл > Fфакт, то гипотеза Но не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

      Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Но о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки: [4,25-29]

      Задача 3.1. Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.

      Характеристики модели: 1) модель (коэффициенты до 4-х знаков);

      2) индекс детерминации (до 2-х знаков);

      3) стандартную ошибку (до 4-х знаков);

      4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;

      5) вывод о значимости коэффициентов модели;

      6) доверительные интервалы коэффициентов модели (до 4-х знаков).

      Решение:

      Для расчета параметров регрессии построим расчетную таблицу (табл. 3.1)

      Таблица 3.1

      Расчет

      1/x

      y

      1/x2

      y2

      y/x

      0.2

      25

      0.04

      625

      5

      0.1667

      20

      0.02778

      400

      3.3333

      0.1429

      19

      0.02041

      361

      2.7143

      0.125

      18

      0.01563

      324

      2.25

      0.1111

      17

      0.01235

      289

      1.8889

      0.1

      16.5

      0.01

      272.25

      1.65

      0.09091

      15

      0.00826

      225

      1.3636

      0.08333

      15.5

      0.00694

      240.25

      1.2917

      0.07692

      14

      0.00592

      196

      1.0769

      0.07143

      12

      0.0051

      144

      0.8571

      1.1682

      172

      0.1524

      3076.5

      21.4259

      Для наших данных система уравнений имеет вид

      10a + 1.168*b = 172

      1.168*a + 0.152*b = 21.426

      Получаем эмпирические коэффициенты регрессии: b = 83.7484, a = 7.4163

      Уравнение регрессии (эмпирическое уравнение регрессии):

      y = 83.7484 / x + 7.4163

      Параметры уравнения регрессии.

      Выборочные средние.

      Выборочные дисперсии:

      Среднеквадратическое отклонение

      Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:

      Ошибка аппроксимации.

      В среднем, расчетные значения отклоняются от фактических на 3.88%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

      Индекс детерминации.

      т.е. в 94.48% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 5.52% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

      Для оценки качества параметров регрессии построим расчетную таблицу (табл. 3.2)

      Таблица 3.2

      Расчетная таблица

      x

      y

      y(x)

      (yi-ycp)2

      (y-y(x))2

      |y - yx|:y

      5

      25

      24.166

      60.84

      0.696

      0.0334

      6

      20

      21.374

      7.84

      1.889

      0.0687

      7

      19

      19.38

      3.24

      0.145

      0.02

      8

      18

      17.885

      0.64

      0.0133

      0.0064

      9

      17

      16.722

      0.04

      0.0775

      0.0164

      10

      16.5

      15.791

      0.49

      0.503

      0.043

      11

      15

      15.03

      4.84

      0.000886

      0.00198

      12

      15.5

      14.395

      2.89

      1.22

      0.0713

      13

      14

      13.858

      10.24

      0.02

      0.0101

      14

      12

      13.398

      27.04

      1.955

      0.117

      95

      172

      172

      118.1

      6.519

      0.388

      Оценка параметров уравнения регрессии.

      S2 = 0.815 - необъясненная дисперсия или дисперсия ошибки регрессии (мера разброса зависимой переменной вокруг линии регрессии).

      S = 0.9 - стандартная ошибка оценки (стандартная ошибка регрессии).

      Sa - стандартное отклонение случайной величины a.

      Sb - стандартное отклонение случайной величины b.

      F-статистика. Критерий Фишера.

      или по формуле:

      где

      Табличное значение критерия со степенями свободы k1=1 и k2=8, Fтабл = 5.32

      Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

      Задача 3.2. Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:

      Определить характеристики модели.

      Характеристики модели:

      1) модель (коэффициенты до 2-х знаков);

      2) индекс детерминации (до 2-х знаков);

      3) стандартную ошибку (до 4-х знаков);

      4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.

      х

      у

      5

      14

      6

      17,4

      7

      19,4

      8

      20,5

      9

      22,6

      10

      23,1

      Решение:

      Для решения задачи используем программу MS Excel, для этого введем исходные данные на рабочий лист и прологарифмируем значении х (рисунок 1)

      Рисунок 1 - Ввод исходных данных

      Затем на панели задач выбираем вкладку Данные и Анализ данных, выбираем инструмент Регрессия в появившемся диалоговом окне вводим исходные данные (рисунок 2)

      Рисунок 2 - Заполнение диалогового окна Регрессия

      В результате решения получим следующие данные (рисунок 3)

      Рисунок 3 - Вывод результатов

      По результатам решение сделаем следующие выводы

      1) y = 13,06-6,46;

      2) индекс детерминации равен 0,98 (максимальное значение 1), это означает очень тесную связь между факторным признаком и результативным показателем;

      3) стандартная ошибка - 0,54;

      4) расчетное значение критерия Фишера 197,37. Значимость модели равна 0,00015, что значительно меньше 0,05, следовательно, модель значима;

      5) значимость коэффициентов модели определяется по t - статистике и Р-значению. P - значение для обоих коэффициентов значительно меньше 0,05 коэффициенты модели значимы.

      Для определения значительности коэффициентов модели по t - статистике необходимо знать расчетное и табличное значение критерия Стьюдента для обоих показателей. Для расчетное значение составляет 14,04, а табличное при = 0,05 и df = n-1составляет 2,57. Расчетное значение больше табличного коэффициент значим. Для определение значимости происходим аналогично:

      Расчетное значение - 14,04;

      Табличное значение - 2,57.

      Вывод: расчетное значение критерия Стьюдента больше табличного коэффициент значим.

      6) Доверительные интервалы для а0 = -11,63 - -1,29; а1 = 10,46 - 15,64;

      Ответ: y = 13,06-6,46 стандартная ошибка 0,54; F - критерий = 197,67; модель значима; коэффициенты модели значимы; а0 (11,63 - -1,29); а1 (10,46 - 15,64)

      Задача 3.3. Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1.

      Таблица 3.5

      Динамика коэффициента рождаемости в Пензенской области

      Год

      2000

      2001

      2002

      2003

      2004

      2005

      Коэффициент рождаемости

      7,5

      7,5

      8,0

      8,4

      8,6

      8,4

      Год

      2006

      2007

      2008

      2009

      2010

      2011

      Коэффициент рождаемости

      8,6

      9,7

      10,2

      10,3

      10,2

      10,1

      Год

      2012

      2013

      2014

      2015

      2016

      Коэффициент рождаемости

      10,8

      10,6

      10,8

      10,7

      10,2

      Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г.

      Решение:

      Таблица 3.6

      Расчет

      x

      y

      x2

      y2

      x * y

      1

      7.5

      1

      56.25

      7.5

      2

      7.5

      4

      56.25

      15

      3

      8

      9

      64

      24

      4

      8.4

      16

      70.56

      33.6

      5

      8.6

      25

      73.96

      43

      6

      8.4

      36

      70.56

      50.4

      7

      8.6

      49

      73.96

      60.2

      8

      9.7

      64

      94.09

      77.6

      9

      10.2

      81

      104.04

      91.8

      10

      10.3

      100

      106.09

      103

      11

      10.2

      121

      104.04

      112.2

      12

      10.1

      144

      102.01

      121.2

      13

      10.8

      169

      116.64

      140.4

      14

      10.6

      196

      112.36

      148.4

      15

      10.8

      225

      116.64

      162

      16

      10.7

      256

      114.49

      171.2

      17

      10.2

      289

      104.04

      173.4

      153

      160.6

      1785

      1539.98

      1534.9

      Для наших данных система уравнений имеет вид

      17a + 153*b = 160.6

      153*a + 1785*b = 1534.9

      Получаем эмпирические коэффициенты регрессии: b = 0.2194, a = 7.4728

      Уравнение регрессии (эмпирическое уравнение регрессии):

      y = 0.2194 x + 7.4728

      Параметры уравнения регрессии.

      Выборочные средние.

      Выборочные дисперсии:

      Среднеквадратическое отклонение

      Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:

      Коэффициент корреляции.

      Уравнение регрессии

      Линейное уравнение регрессии имеет вид y = 0.219 x + 7.473

      Ошибка аппроксимации.

      В среднем, расчетные значения отклоняются от фактических на 3.49%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

      Коэффициент детерминации.

      R2= 0.9282 = 0.8618

      т.е. в 86.18% случаев изменения х приводят к изменению y.

      Прогноз

      Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и Xp = 1

      tкрит (n-m-1;б/2) = (15;0.025) = 2.131

      y(1) = 0.219*1 + 7.473 = 7.692

      Вычислим ошибку прогноза для уравнения y = bx + a

      или

      7.692 ± 0.453

      (7.24;8.15)

      С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

      Вычислим ошибку прогноза для уравнения y = bx + a + е

      7.692 ± 1.08

      (6.62;8.77)

      F-статистика. Критерий Фишера.

      или по формуле:

      где

      Табличное значение критерия со степенями свободы k1=1 и k2=15, Fтабл = 4.54

      Поскольку фактическое значение F > Fтабл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

      Задача 3.4. Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = ао + а1t; lnу = ао + а1t; у = 1/(ао + а1t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.

      Таблица 3.7

      Курс рубля к доллару

      Месяц и год

      январь

      2017

      февраль

      март

      апрель

      май

      июнь

      июль

      август

      2017

      Цена одного доллара

      59,6

      58,5

      58,0

      56,4

      57,0

      57,9

      59,7

      59,6

      Решение:

      Построим линейную модель

      Для наших данных система уравнений имеет вид

      8a + 36*b = 466.7

      36*a + 204*b = 2103.3

      Получаем эмпирические коэффициенты регрессии: b = 0.075, a = 58

      Уравнение регрессии (эмпирическое уравнение регрессии):

      y = 0.075 x + 58

      Уравнение регрессии (оценка уравнения регрессии).

      Линейное уравнение регрессии имеет вид y = 0.075 x + 58

      Ошибка аппроксимации.

      В среднем, расчетные значения отклоняются от фактических на 1.74%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

      Построим модель вида lnу = ао + а1t

      Для этого значения у заменим значениями lny

      Для расчета параметров регрессии построим расчетную таблицу (табл. 3.8)

      Таблица 3.8

      Расчет

      x

      y

      x2

      y2

      x * y

      1

      4.09

      1

      16.7281

      4.09

      2

      4.07

      4

      16.5649

      8.14

      3

      4.06

      9

      16.4836

      12.18

      4

      4.03

      16

      16.2409

      16.12

      5

      4.04

      25

      16.3216

      20.2

      6

      4.06

      36

      16.4836

      24.36

      7

      4.09

      49

      16.7281

      28.63

      8

      4.09

      64

      16.7281

      32.72

      36

      32.53

      204

      132.2789

      146.44

      Для наших данных система уравнений имеет вид

      8a + 36*b = 32.53

      36*a + 204*b = 146.44

      Получаем эмпирические коэффициенты регрессии: b = 0.00131, a = 4.0604

      Уравнение регрессии (эмпирическое уравнение регрессии):

      y = 0.00131 x + 4.0604

      Ошибка аппроксимации.

      В среднем, расчетные значения отклоняются от фактических на 0.46%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

      Коэффициент детерминации.

      R2= 0.1382 = 0.01902

      т.е. в 1.9% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - низкая. Остальные 98.1% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

      F-статистика. Критерий Фишера.

      или по формуле:

      где

      Табличное значение критерия со степенями свободы k1=1 и k2=6, Fтабл = 5.99

      Поскольку фактическое значение F < Fтабл, то к...


Подобные документы

  • Статистика денежного обращения, инфляции и цен. Построение сводки и ряда распределения. Характеристика используемых статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки. Корреляционный анализ количественных признаков.

    контрольная работа [564,1 K], добавлен 13.09.2012

  • Предмет и метод статистики. Сводка и группировка статистических данных. Функции статистических показателей. Статистические ряды, вариация и дисперсия. Преимущества выборочного наблюдения. Методы анализа корреляционных связей, экономические индексы.

    методичка [371,4 K], добавлен 15.01.2010

  • Сводка и группировка материалов статистического наблюдения. Абсолютные, относительные и средние величины, показатели вариации. Ряды динамики, индексный анализ. Проведение корреляционно-регрессионного анализа таблиц о сборе урожая и внесении удобрений.

    курсовая работа [667,1 K], добавлен 14.05.2013

  • Группы средних величин: степенные, структурные. Особенности применения средних величин, виды. Рассмотрение основных свойств средней арифметической. Характеристика структурных средних величин. Анализ примеров на основе реальных статистических данных.

    курсовая работа [230,6 K], добавлен 24.09.2012

  • Характеристика методов выполнения оценок параметров больших множеств по данным выборочного наблюдения. Особенности работы с большими массивами данных. Расчет основных показателей совокупности. Корреляционно-регрессионный анализ. Анализ рядов динамики.

    курсовая работа [1,2 M], добавлен 24.08.2010

  • Сущность и назначение корреляционного метода изучения взаимосвязей между явлениями. Зависимость чистых процентных доходов от выданных кредитов, активов банка от величины вкладов частных лиц, стоимости акции на ММВБ от величины операционных доходов.

    курсовая работа [2,1 M], добавлен 07.03.2011

  • Построение корреляционного поля и предложение гипотезы о связи между денежными доходами и потребительскими расходами, выдвижение предположения о наличии выбросов. Оценка статистической надежности и значимости вычисленного коэффициента корреляции.

    контрольная работа [3,0 M], добавлен 15.11.2012

  • Сущность и содержание корреляционного анализа, его значение и эффективность в оценке связи. Множественная регрессия как один из наиболее распространенных способов получения многофакторных прогнозов, оценка ее преимуществ и недостатков, применение.

    лабораторная работа [535,0 K], добавлен 17.11.2010

  • Сбор исходных статистических данных. Расчет характеристик экспериментальных данных. Характеристики среднего положения измеренных значений. Распределение статистических данных. Построение и анализ контрольных карт средних арифметических и размахов.

    курсовая работа [146,8 K], добавлен 17.10.2013

  • Организация статистики и источники статистических данных. Наблюдение по способу регистрации данных. Выявление и изучение связи и взаимозависимости между явлениями. Система статистических показателей. Определение средних и относительных величин.

    контрольная работа [53,6 K], добавлен 27.01.2011

  • Сущность статистического анализа и выборочного метода. Правила группировки данных выборочного наблюдения по величине объема инвестиций. Графическое представление вариационного ряда (гистограмма, кумулята, кривая Лоренца). Расчет асимметрии и эксцесса.

    курсовая работа [70,7 K], добавлен 26.10.2011

  • Организация производства услуг и обслуживания заказчиков на предприятии в условиях рынка. Расчет стоимости изготовления женского костюма. Определение времени на изготовление изделия. Расчет планируемых издержек производства. Реклама, стимулирование сбыта.

    курсовая работа [297,7 K], добавлен 22.11.2013

  • Корреляционный анализ наличия и плотности связи между дифференциацией доходов населения (коэффициентом Джини) и макроэкономическими факторами: ВВП, производительность труда в промышленности, инфляция, безработица. Интерпретация регрессионного уравнения.

    статья [28,4 K], добавлен 23.02.2010

  • Краткая природно-экономическая характеристика хозяйства. Параметры линейной модели тренда. Расчет величин для определения показателей вариации. Корреляционно-регрессионный анализ связи между продуктивностью коров и себестоимостью одного центнера молока.

    курсовая работа [199,9 K], добавлен 17.03.2015

  • Сущность и назначение корреляционного анализа в статистике, основные этапы его реализации. Краткая экономическая характеристика Великобритании и Венгрии. Корреляционный анализ экономики данных государств, показателей прироста иностранных инвестиций.

    курсовая работа [181,4 K], добавлен 25.06.2010

  • Анализ финансового состояния компании, ее баланса и финансовых результатов. Расчет финансовых коэффициентов. Затратный и доходный подходы к оценке рыночной стоимости. Направления процедуры оценки. Сравнительный подход к оценке стоимости (метод сделок).

    курсовая работа [95,9 K], добавлен 19.04.2014

  • Оценка стоимости как инструмент принятия эффективных управленческих решений. Стоимостной подход к оценке эффективности управления. Расчет рыночной стоимости ЗАО "ПИК-Регион", выбор подхода к оценке. Описание компании, анализ ее финансовых показателей.

    дипломная работа [147,3 K], добавлен 17.03.2013

  • Расчёт программы участка слесарно-механического цеха. Ритм выпуска деталей и определение количества деталей в партиях. Необходимое количество оборудования и его загрузки. Расчет количества рабочих мест. Плановая себестоимость изготовления деталей.

    курсовая работа [327,3 K], добавлен 05.06.2009

  • Основные приемы и методы обработки и анализа статистических данных. Исчисление арифметической, гармонической и геометрической средних величин. Ряды распределения, их основные характеристики. Методы выравнивания рядом динамики. Система национальных счетов.

    курсовая работа [1,2 M], добавлен 24.10.2014

  • Определение основных вопросов оценки объекта недвижимости. Сбор, проверка и анализ информации. Анализ наиболее эффективного использования земельного участка. Расчет рыночной стоимости на основе трех подходов к оценке и согласование полученных результатов.

    курсовая работа [35,9 K], добавлен 30.11.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.