Главная Коллекция "Revolution" Экономика и экономическая теория Корреляционный анализ стоимости изготовления деталей

Корреляционный анализ стоимости изготовления деталей

Расчет статистических средних величин на основе массовых данных с применением статистически организованного массового наблюдения (сплошного и выборочного). Корреляционный анализ связи между случайными величинами при оценке стоимости изготовления деталей.

Рубрика	Экономика и экономическая теория
Вид	курсовая работа
Язык	русский
Дата добавления	22.02.2019
Размер файла	1,1 M

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ

РОССИЙСКОЙ ФЕДЕРАЦИИ

ПЕНЗЕНСКИЙ ГОСУДАСТВЕННЫЙ УНИВЕРСИТЕТ

Кафедра бухгалтерского учета, налогообложения и аудита

КУРСОВАЯ РАБОТА

по дисциплине: «Общая теория статистики»

на тему: «Корреляционный анализ стоимости изготовления деталей»

Направление подготовки: 38.03.01 Экономика

Выполнил студент: Болеева Н.Ю.

Руководитель: Деркаченко В.Н.

Пенза, 2017

Оглавление

Введение
Средние величины и показатели вариации
Корреляционный анализ
Регрессионный анализ
Заключение
Список использованных источников
Введение
В условиях рынка предприятие является главным объектом хозяйствования, независимым товаропроизводителем, экономическое пространство для которого практически неограниченно, но всецело зависит от умения работать безубыточно, адаптируясь к условиям изменяющейся экономической среды. Производственные показатели характеризуют эффективность деятельности предприятия. Обеспечение качества систем управления требует широкого применения статистических методов. Статистические методы, позволяют установить закономерности и причины изменений явлений и процессов, имеющих место на предприятии или в организации, являются мощным инструментом обоснования принимаемых решений и оценки их эффективности. Методы экономико-статистического анализа носят универсальный характер и не зависят от отраслевой принадлежности предприятий, позволяют менеджеру анализировать положение дел в организации, разрабатывать варианты управленческих решений, выбирать наиболее эффективные, оценивать влияние этих решений на результаты деятельности.
Средние величины и показатели вариации
Большое распространение в статистике имеют средние величины. Средние величины характеризуют качественные показатели коммерческой деятельности: издержки обращения, прибыль, рентабельность и др.
Средняя - это один из распространенных приемов обобщений. Правильное понимание сущности средней определяет ее особую значимость в условиях рыночной экономики, когда средняя через единичное и случайное позволяет выявить общее и необходимое, выявить тенденцию закономерностей экономического развития.
Средняя величина - это обобщающие показатели, в которых находят выражение действия общих условий, закономерностей изучаемого явления.
Статистические средние рассчитываются на основе массовых данных правильно статистически организованного массового наблюдения (сплошного и выборочного). Однако статистическая средняя будет объективна и типична, если она рассчитывается по массовым данным для качественно однородной совокупности (массовых явлений). Например, если рассчитывать среднюю заработную плату в кооперативах и на госпредприятиях, а результат распространить на всю совокупность, то средняя фиктивна, так как рассчитана по неоднородной совокупности, и такая средняя теряет всякий смысл.
При помощи средней происходит как бы сглаживание различий в величине признака, которые возникают по тем или иным причинам у отдельных единиц наблюдения.[4,25]
Например, средняя выработка продавца зависит от многих причин: квалификации, стажа, возраста, формы обслуживания, здоровья и т.д.
Средняя выработка отражает общее свойство всей совокупности.
Средняя величина является отражением значений изучаемого признака, следовательно, измеряется в той же размерности, что и этот признак.
Каждая средняя величина характеризует изучаемую совокупность по какому-либо одному признаку. Чтобы получить полное и всестороннее представление об изучаемой совокупности по ряду существенных признаков, в целом необходимо располагать системой средних величин, которые могут описать явление с разных сторон.
Существуют различные средние:
1. средняя арифметическая;
2. средняя геометрическая;
3. средняя гармоническая;
4. средняя квадратическая;
5. средняя хронологическая.
Рассмотрим некоторые виды средних, которые наиболее часто используются в статистике.[3,12]
Средняя арифметическая
Средняя арифметическая простая (невзвешенная) равна сумме отдельных значений признака, деленной на число этих значений.
Отдельные значения признака называют вариантами и обозначают через х (); число единиц совокупности обозначают через n, среднее значение признака - через . Следовательно, средняя арифметическая простая равна:
(1.1)
Основные свойства средней арифметической.
Средняя арифметическая обладает рядом свойств:
1. От уменьшения или увеличения частот каждого значения признака х в п раз величина средней арифметической не изменится.
Если все частоты разделить или умножить на какое-либо число, то величина средней не изменится.
2. Общий множитель индивидуальных значений признака может быть вынесен за знак средней:
(1.2)
3. Средняя суммы (разности) двух или нескольких величин равна сумме (разности) их средних:
(1.3)
4. Если х = с, где с - постоянная величина, то .
5. Сумма отклонений значений признака Х от средней арифметической х равна нулю:
Мода.
Характеристиками вариационных рядов, наряду со средними, являются мода и медиана.
Мода - это величина признака (варианта), наиболее часто повторяющаяся в изучаемой совокупности. Для дискретных рядов распределения модой будет значение варианта с наибольшей частотой.
Для интервальных рядов распределения с равными интервалами мода определяется по формуле:
(1.4)
где - начальное значение интервала, содержащего моду;
- величина модального интервала;
- частота модального интервала;
- частота интервала, предшествующего модальному;
- частота интервала, следующего за модальным.
Медиана
Рассмотрим расчет медианы в интервальном вариационном ряду.
Медиана интервального вариационного ряда распределения определяется по формуле [6,54-58]
(1.5)
где -- начальное значение интервала, содержащего медиану;
-- величина медианного интервала;
-- сумма частот ряда;
-- сумма накопленных частот, предшествующих медианному интервалу;
-- частота медианного интервала.
Понятие вариации признаков. Показатели вариации.
Информация о средних уровнях исследуемых показателей обычно бывает недостаточной для глубокого анализа изучаемого процесса или явления. Поэтому необходимо учитывать и вариацию значений отдельных единиц совокупности.
Значительной вариации подвержены объемы спроса и предложения, процентные ставки в различные периоды времени.
Различие индивидуальных значений признака внутри изучаемой совокупности в статистике называется вариацией признака.
Вариация - это изменение (колеблемость) значений признака внутри совокупности. Величина признаков варьирует под действием различных причин и явлений.
Поскольку изменение (колеблемость) признаков, бывает большей или меньшей возникает задача измерения ее величины.
Измерение вариации признака необходимо при: определении надежности средних величин, результатов выборочных наблюдений для различных совокупностей и т.д.
Для измерения размера вариации в статистике используют различные показатели, которые принято делить на абсолютные и относительные.
К абсолютным показателям вариации относятся: размах вариации, среднее линейное отклонение, дисперсия признака и среднее квадратическое отклонение.
Размах вариации (R) - представляет собой разность между max и min значениями признака в изучаемой совокупности.[4,25-29]
R = X max - X min(1.6)
Задача 1.1. По статистическим данным: 3; 5; 2; 4; 7; 3; 8; 3; 10 определить среднее значение, моду, медиану, дисперсию, среднеквадратическое отклонение, коэффициент вариации. Каждое значение увеличить на свой номер классного журнала. Дисперсия до одного знака после запятой; среднеквадратическое - до двух; коэффициент вариации - до одного в процентах.
Решение:
Проранжируем ряд. Для этого сортируем его значения по возрастанию.
Таблица1.1
Расчет

x	\|x - x_ср\|	(x-x_ср)²
6	3	9
7	2	4
7	2	4
7	2	4
8	1	1
9	0	0
11	2	4
12	3	9
14	5	25
81	20	60

Для оценки ряда распределения найдем следующие показатели:
Показатели центра распределения.
Простая средняя арифметическая
Мода.
Значение ряда 7 встречается всех больше (3 раз). Следовательно, мода равна x = 7.
Медиана.
Me = 8
Показатели вариации.
Размах вариации
R = x_max - x_min = 14 - 6 = 8
Среднее линейное отклонение -
Каждое значение ряда отличается от другого в среднем на 2.22
Дисперсия
Среднее квадратическое отклонение.
Каждое значение ряда отличается от среднего значения 9 в среднем на 2.58
Выводы:
Каждое значение ряда отличается от среднего значения 9 в среднем на 2.58.
Задача 1.2. По данным статистики в отчетном периоде по сравнению с базисным доход от реализации продукции предприятия увеличился на 25%, стоимость основных фондов увеличилась на 14%. Определить изменение фондоотдачи.
Решение:
Данную задачу можно решить на условном примере:
Стоимость произведённой продукции = 20000 тыс. руб.
Стоимость основных производственных фондов = 40000 тыс. руб
Фондоотдача =
Доход от реализации увеличился на 25 %, то есть он стал равным 25000 тыс. руб. (20000 х 1,25)
Стоимость основных фондов увеличилась на 14% и стала равной 45600
Фондоотдача=
Фондоотдача уменьшилась на 5 %, то есть она стала равной 0,55 (0,55 х 0,95)
Задача 1. 3. Объем оборота (У) и число работников (m) приведены в таблице 1. Определить среднее значение, моду и медиану.
Таблица 1.2 - Исходные данные

У	80-100	100-120	120-140	140-160	160-180	180-200
m	6	17	25	28	14	10

Решение:

Таблица 1.3

Расчет

Группы	Середина интервала, x_центр	Кол-во, f_i	x_i * f_i	Накопленная частота, S	\|x - x_ср\|*f_i	(x - x_ср)²*f_i	Частота, f_i/f
80 - 100	90	6	540	6	308.4	15851.76	0.06
100 - 120	110	17	1870	23	533.8	16761.32	0.17
120 - 140	130	25	3250	48	285	3249	0.25
140 - 160	150	28	4200	76	240.8	2070.88	0.28
160 - 180	170	14	2380	90	400.4	11451.44	0.14
180 - 200	190	10	1900	100	486	23619.6	0.1
Итого		100	14140		2254.4	73004	1

Для оценки ряда распределения найдем следующие показатели:

Показатели центра распределения.

Средняя взвешенная

Мода.

Наиболее часто встречающееся значение ряда - 143.53

Медиана.

Таким образом, 50% единиц совокупности будут меньше по величине 141.43.

Задача 1.4. По данным таблицы определить среднюю внутригрупповую, межгрупповую и общую дисперсии, а также коэффициент детерминации. В таблице: Х-объем оборота предприятий, млн. руб., m_г - число государственных предприятий; m_ч - частных; m_{о -}общее число (таблица 2). Каждое значение Х_iувеличить на свой номер классного журнала.

Таблица 1.4

Исходные данные по объему оборота предприятий

Х_i	m_гi	m_чi	m_oi
5,0-5,2		3	3
5,2-5,4		4	4
5,4-5,6		17	17
5,6-5,8	11	15	26
5,8-6,0	13	6	19
6,0-6,2	18	5	23
6,2-6,4	6		6
6,4-6,6	2		2
	50	50	100

Результаты, например, общая дисперсия равна 97830 руб. и коэффициент детерминации, целое число в %.

Решение:

Чтобы определить общую дисперсию, необходимо знать значение общей средней:

При расчете общей дисперсии необходимо использовать вид взвешенной, т.к. имеется частота:

= 0,09

Для вычисления внутригрупповой дисперсии по группам необходимо рассчитать среднее значение:

= 6

Внутригрупповая дисперсия определяется по формуле:

Межгрупповая дисперсия вычисляется следующим образом [3]:

Теперь необходимо рассчитать коэффициент детерминации [2]:

- связь умеренная, т.к. находится в интервале 30% - 50% (по соотношению Чэддока).

Ответ:

Задача 1. 5. Определить среднюю внутригрупповую, меж групповую и общую дисперсии совокупности, состоящей из трех групп (таблица 3).

Таблица 3 - Исходные данные

1 группа	Х_i	1	2	8
	m_i	30	15	5
2 группа	Х_i	1	6
	m_i	10	15
3 группа	Х_i	3	8
	m_i	20	5

Решение:

В первую очередь, необходимо определить среднее значение для 3-х групп, и используя получившиеся результаты, рассчитать для них взвешенные дисперсии.

Для нахождения средней внутригрупповой дисперсии необходимо просуммировать получившиеся взвешенные и поделить их на 3:

Теперь необходимо рассчитать общее среднее значение и общую дисперсию:

Ответ:

Корреляционный анализ

корреляционный анализ стоимость

Целью корреляционного анализа является выявление оценки силы связи между случайными величинами (признаками), которые характеризует некоторый реальный процесс.

Задачи корреляционного анализа:

а) Измерение степени связности (тесноты, силы, строгости, интенсивности) двух и более явлений.

б) Отбор факторов, оказывающих наиболее существенное влияние на результативный признак, на основании измерения степени связности между явлениями. Существенные в данном аспекте факторы используют далее в регрессионном анализе. [2,56-59]

в) Обнаружение неизвестных причинных связей.

Формы проявления взаимосвязей весьма разнообразны. В качестве самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи.

Корреляционная связь проявляется в среднем, для массовых наблюдений, когда заданным значениям зависимой переменной соответствует некоторый ряд вероятностных значений независимой переменной. Связь называется корреляционной, если каждому значению факторного признака соответствует вполне определенное неслучайное значение результативного признака.

Наглядным изображением корреляционной таблицы служит корреляционное поле. Оно представляет собой график, где на оси абсцисс откладываются значения X, по оси ординат - Y, а точками показываются сочетания X и Y. По расположению точек можно судить о наличии связи.

Показатели тесноты связи дают возможность охарактеризовать зависимость вариации результативного признака от вариации признака-фактора.

Более совершенным показателем степени тесноты корреляционной связи является линейный коэффициент корреляции. При расчете этого показателя учитываются не только отклонения индивидуальных значений признака от средней, но и сама величина этих отклонений.

Ключевыми вопросами данной темы являются уравнения регрессионной связи между результативным признаком и объясняющей переменной, метод наименьших квадратов для оценки параметров регрессионной модели, анализ качества полученного уравнения регрессии, построение доверительных интервалов прогноза значений результативного признака по уравнению регрессии.

Использование графического метода.

Этот метод применяют для наглядного изображения формы связи между изучаемыми экономическими показателями. Для этого в прямоугольной системе координат строят график, по оси ординат откладывают индивидуальные значения результативного признака Y, а по оси абсцисс - индивидуальные значения факторного признака X.

Совокупность точек результативного и факторного признаков называется полем корреляции. [5,85-89]

На основании поля корреляции можно выдвинуть гипотезу (для генеральной совокупности) о том, что связь между всеми возможными значениями X и Y носит линейный характер.

Линейное уравнение регрессии имеет вид y = bx + a + е

Здесь е - случайная ошибка (отклонение, возмущение).

Причины существования случайной ошибки:

1. Невключение в регрессионную модель значимых объясняющих переменных;

2. Агрегирование переменных. Например, функция суммарного потребления - это попытка общего выражения совокупности решений отдельных индивидов о расходах. Это лишь аппроксимация отдельных соотношений, которые имеют разные параметры.

3. Неправильное описание структуры модели;

4. Неправильная функциональная спецификация;

5. Ошибки измерения.

Так как отклонения е_i для каждого конкретного наблюдения i - случайны и их значения в выборке неизвестны, то:

1) по наблюдениям x_i и y_i можно получить только оценки параметров б и в

2) Оценками параметров б и в регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;

Тогда оценочное уравнение регрессии (построенное по выборочным данным) будет иметь вид y = bx + a + е, где e_i - наблюдаемые значения (оценки) ошибок е_i, а и b соответственно оценки параметров б и в регрессионной модели, которые следует найти.

Для оценки параметров б и в - используют МНК (метод наименьших квадратов). Решение ведем с использованием онлайн-калькулятора Уравнение регрессии.

Система нормальных уравнений.

a*n + b?x = ?y

a?x + b?x² = ?y*x

Линейная связь между переменными X_i и X_j оценивается коэффициентом корреляции:

, (2.1)

где X_i и X_j - исследуемые переменные; mX_i и mX_j - математические ожидания переменных; у_X и у_X - дисперсии переменных.

Выборочный коэффициент корреляции определяют по формуле:

, (2.2)

или по преобразованной формуле:

, (2.3)

где i =1, 2,..., n, j = 1, 2,..., m, u = 1, 2,..., N; N - число опытов(объем выборки); x_i, x_j - оценки математических ожиданий; S_Xi, S_Xj - оценки среднеквадратических отклонений.

Только при совместной нормальной распределенности исследуемых случайных величин X_i и X_jкоэффициент корреляции имеет определенный смысл связи между переменными. В противном случае коэффициент корреляции может только косвенно характеризовать эту связь[5].

Задача 2. 1. Определить коэффициент корреляции между У и Х.

Х: 3,5; 4,6; 5,8; 4,2; 5,2;

УХ: 28,35; 43,24; 65,54; 28,98; 50,44.

Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Результаты:

1) коэффициент корреляции;

2) расчетное и табличное значения критерия Стьюдента и вывод.

Решение:


	8,1	3,5	28,35	1,35	0,96
	9,4	4,6	43,24	0	0,1
	11,3	5,8	65,54	1,3	4,93
	6,9	4,2	28,98	0,21	4,75
	9,7	5,2	50,44	0,29	0,38
	45,4	23,3	216,55	3,15	11,12
сред.знач.	9,08	4,66	43,31	-	-

Перед расчетом коэффициента корреляции необходимо вычислить среднее квадратическое отклонение для показателей x и y [2]:

(14)

= 0,79

Коэффициент корреляции определяется по формуле [2]:

(15)

В соответствии с данными задачи, расчет выглядит следующим образом:

Вывод: связь между показателем и фактором очень сильная, т.к. её значение находится в интервале 0,8-1,0. Значимость коэффициента корреляции проверяется по критерию Стьюдента. В начале вычисляется расчетное значение критерия по формуле [5]:

(16)

Табличное значение находится при заданном уровне значимости значения и числе степеней свободы f. Уровень значимости в практических целях задается 0,05, а f=n-2табличное значение для рассматриваемого примера равно 3,18.

Вывод: т.к. расчетное значение меньше табличного, то коэффициент корреляции не значимый, необходимо увеличить объем выборки.

Ответ: = ; ; коэффициент не значим.

Задача 2.2. Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.

Таблица 2.3

Исходные данные

х	у
22	21
26	24
17	15
24	23
19	18
18	14

Решение:

Таблица 2.4

Расчет

x	y	x²	y²	x * y
22	21	484	441	462
26	24	676	576	624
17	15	289	225	255
24	23	576	529	552
19	18	361	324	342
18	14	324	196	252
126	115	2710	2291	2487

Для наших данных система уравнений имеет вид

6a + 126*b = 115

126a + 2710b = 2487

Получаем эмпирические коэффициенты регрессии: b = 1.125, a = -4.4583

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 1.125 x -4.4583

Коэффициент корреляции.

Значимость коэффициента корреляции.

По таблице Стьюдента с уровнем значимости б=0.05 и степенями свободы k=4 находим t_крит:

t_крит (n-m-1;б/2) = (4;0.025) = 2.776

Поскольку |t_набл| > t_крит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим

Задача 2.3.

В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе. Решение:

Таблица 2.5

Исходные данные

X	Y
69	55
94	89
46	40
51	67
88	76
62	84
54	44

Присвоим ранги признаку Y и фактору X.

X	Y	ранг X, d_x	ранг Y, d_y
69	55	5	3
94	89	7	7
46	40	1	1
51	67	2	4
88	76	6	5
62	84	4	6
54	44	3	2

Матрица рангов.

ранг X, d_x	ранг Y, d_y	(d_x - d_y)²
5	3	4
7	7	0
1	1	0
2	4	4
6	5	1
4	6	4
3	2	1
28	28	14

Проверка правильности составления матрицы на основе исчисления контрольной суммы:

Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.

По формуле вычислим коэффициент ранговой корреляции Спирмена.

Связь между признаком Y и фактором X сильная и прямая

Регрессионный анализ

Основная цель регрессионного анализа состоит в определении аналитической формы связи, в которой изменение результативного признака обусловлено влиянием одного или нескольких факторных признаков, а множество всех прочих факторов, также оказывающих влияние на результативный признак, принимается за постоянные и средние значения.

Задачи регрессионного анализа:

а) Установление формы зависимости. Относительно характера и формы зависимости между явлениями, различают положительную линейную и нелинейную и отрицательную линейную и нелинейную регрессию.

б) Определение функции регрессии в виде математического уравнения того или иного типа и установление влияния объясняющих переменных на зависимую переменную.

в) Оценка неизвестных значений зависимой переменной. С помощью функции регрессии можно воспроизвести значения зависимой переменной внутри интервала заданных значений объясняющих переменных (т. е. решить задачу интерполяции) или оценить течение процесса вне заданного интервала (т. е. решить задачу экстраполяции). Результат представляет собой оценку значения зависимой переменной.

Парная регрессия - уравнение связи двух переменных у и х:

Различают линейные и нелинейные регрессии.

Линейная регрессия: y = a + bx + е

Нелинейные регрессии делятся на два класса: регрессии, нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам, и регрессии, нелинейные по оцениваемым параметрам.

Регрессии, нелинейные по объясняющим переменным:

· полиномы разных степеней

· равносторонняя гипербола .

Регрессии, нелинейные по оцениваемым параметрам:

· степенная

· показательная

· экспоненциальная

Построение уравнения регрессии сводится к оценке ее параметров. Для оценки параметров регрессий, линейных по параметрам, Используют метод наименьших квадратов (МНК). МНК позволяет получить такие оценки параметров, при которых сумма квадратов отклонений фактических значений результативного признака у от теоретических минимальна, т.е.

. (3.1)

Для линейных и нелинейных уравнений, приводимых к линейным, решается следующая система относительно a и b:

(3.2)

Можно воспользоваться готовыми формулами, которые вытекают из этой системы:

(3.3)

Тесноту связи изучаемых явлений оценивает линейный коэффициент парной корреляции для линейной регрессии :

(3.4)

и индекс корреляции - для нелинейной регрессии:

(3.5)

Оценку качества построенной модели даст коэффициент (индекс) детерминации, а также средняя ошибка аппроксимации. [1,24-38]

Средняя ошибка аппроксимации - среднее отклонение расчетных значений от фактических:

. (3.6)

Допустимый предел значений - не более 8-10%.

Средний коэффициент эластичности показывает, на сколько процентов в среднем по совокупности изменится результат у от своей средней величины при изменении фактора x на 1% от своего среднего значения:

. (3.7)

Задача дисперсионного анализа состоит в анализе дисперсии зависимой переменной:

, (3.8)

где - общая сумма квадратов отклонений;

- сумма квадратов отклонений, обусловленная регрессией («объясненная» или «факторная»);

- остаточная сумма квадратов отклонений.

Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент (индекс) детерминации R²:

(3.9)

Коэффициент детерминации - квадрат коэффициента или индекса корреляции.

F-тест - оценивание качества уравнения регрессии - состоит в проверке гипотезы Но о статистической незначимости уравнения регрессии и показателя тесноты связи. Для этого выполняется сравнение фактического F_факт и критического (табличного) F_табл значений F-критерия Фишера. F_факт определяется из соотношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы: [2, 48-65]

, (3.10)

где n - число единиц совокупности; m - число параметров при переменных х.

F_табл - это максимально возможное значение критерия под влиянием случайных факторов при данных степенях свободы и уровне значимости a. Уровень значимости a - вероятность отвергнуть правильную гипотезу при условии, что она верна. Обычно a принимается равной 0,05 или 0,01.

Если F_табл < F_факт, то Н_о - гипотеза о случайной природе оцениваемых характеристик отклоняется и признается их статистическая значимость и надежность. Если F_табл > F_факт, то гипотеза Н_о не отклоняется и признается статистическая незначимость, ненадежность уравнения регрессии.

Для оценки статистической значимости коэффициентов регрессии и корреляции рассчитываются t-критерий Стьюдента и доверительные интервалы каждого из показателей. Выдвигается гипотеза Н_о о случайной природе показателей, т.е. о незначимом их отличии от нуля. Оценка значимости коэффициентов регрессии и корреляции с помощью t-критерия Стьюдента проводится путем сопоставления их значений с величиной случайной ошибки: [4,25-29]

Задача 3.1. Построить нелинейную обратную модель связи себестоимости единицы продукции (у) со стоимостью основных фондов (х). Определить характеристики модели.

Характеристики модели: 1) модель (коэффициенты до 4-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели;

5) вывод о значимости коэффициентов модели;

6) доверительные интервалы коэффициентов модели (до 4-х знаков).

Решение:

Для расчета параметров регрессии построим расчетную таблицу (табл. 3.1)

Таблица 3.1

Расчет

1/x	y	1/x²	y²	y/x
0.2	25	0.04	625	5
0.1667	20	0.02778	400	3.3333
0.1429	19	0.02041	361	2.7143
0.125	18	0.01563	324	2.25
0.1111	17	0.01235	289	1.8889
0.1	16.5	0.01	272.25	1.65
0.09091	15	0.00826	225	1.3636
0.08333	15.5	0.00694	240.25	1.2917
0.07692	14	0.00592	196	1.0769
0.07143	12	0.0051	144	0.8571
1.1682	172	0.1524	3076.5	21.4259

Для наших данных система уравнений имеет вид

10a + 1.168*b = 172

1.168a + 0.152b = 21.426

Получаем эмпирические коэффициенты регрессии: b = 83.7484, a = 7.4163

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 83.7484 / x + 7.4163

Параметры уравнения регрессии.

Выборочные средние.

Выборочные дисперсии:

Среднеквадратическое отклонение

Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:

Ошибка аппроксимации.

В среднем, расчетные значения отклоняются от фактических на 3.88%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Индекс детерминации.

т.е. в 94.48% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - высокая. Остальные 5.52% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

Для оценки качества параметров регрессии построим расчетную таблицу (табл. 3.2)

Таблица 3.2

Расчетная таблица

x	y	y(x)	(y_i-y_cp)²	(y-y(x))²	\|y - y_x\|:y
5	25	24.166	60.84	0.696	0.0334
6	20	21.374	7.84	1.889	0.0687
7	19	19.38	3.24	0.145	0.02
8	18	17.885	0.64	0.0133	0.0064
9	17	16.722	0.04	0.0775	0.0164
10	16.5	15.791	0.49	0.503	0.043
11	15	15.03	4.84	0.000886	0.00198
12	15.5	14.395	2.89	1.22	0.0713
13	14	13.858	10.24	0.02	0.0101
14	12	13.398	27.04	1.955	0.117
95	172	172	118.1	6.519	0.388

Оценка параметров уравнения регрессии.

S² = 0.815 - необъясненная дисперсия или дисперсия ошибки регрессии (мера разброса зависимой переменной вокруг линии регрессии).

S = 0.9 - стандартная ошибка оценки (стандартная ошибка регрессии).

S_a - стандартное отклонение случайной величины a.

S_b - стандартное отклонение случайной величины b.

F-статистика. Критерий Фишера.

или по формуле:

где

Табличное значение критерия со степенями свободы k₁=1 и k₂=8, F_табл = 5.32

Поскольку фактическое значение F > F_табл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

Задача 3.2. Построить полулогарифмическую модель вида: y=a0+a1lnx по данным:

Определить характеристики модели.

Характеристики модели:

1) модель (коэффициенты до 2-х знаков);

2) индекс детерминации (до 2-х знаков);

3) стандартную ошибку (до 4-х знаков);

4) расчетное и табличное значения критерия Фишера (до 2-х знаков) и вывод о значимости модели.

х	у
5	14
6	17,4
7	19,4
8	20,5
9	22,6
10	23,1

Решение:

Для решения задачи используем программу MS Excel, для этого введем исходные данные на рабочий лист и прологарифмируем значении х (рисунок 1)

Рисунок 1 - Ввод исходных данных

Затем на панели задач выбираем вкладку Данные и Анализ данных, выбираем инструмент Регрессия в появившемся диалоговом окне вводим исходные данные (рисунок 2)

Рисунок 2 - Заполнение диалогового окна Регрессия

В результате решения получим следующие данные (рисунок 3)

Рисунок 3 - Вывод результатов

По результатам решение сделаем следующие выводы

1) y = 13,06-6,46;

2) индекс детерминации равен 0,98 (максимальное значение 1), это означает очень тесную связь между факторным признаком и результативным показателем;

3) стандартная ошибка - 0,54;

4) расчетное значение критерия Фишера 197,37. Значимость модели равна 0,00015, что значительно меньше 0,05, следовательно, модель значима;

5) значимость коэффициентов модели определяется по t - статистике и Р-значению. P - значение для обоих коэффициентов значительно меньше 0,05 коэффициенты модели значимы.

Для определения значительности коэффициентов модели по t - статистике необходимо знать расчетное и табличное значение критерия Стьюдента для обоих показателей. Для расчетное значение составляет 14,04, а табличное при = 0,05 и df = n-1составляет 2,57. Расчетное значение больше табличного коэффициент значим. Для определение значимости происходим аналогично:

Расчетное значение - 14,04;

Табличное значение - 2,57.

Вывод: расчетное значение критерия Стьюдента больше табличного коэффициент значим.

6) Доверительные интервалы для а₀ = -11,63 - -1,29; а₁ = 10,46 - 15,64;

Ответ: y = 13,06-6,46 стандартная ошибка 0,54; F - критерий = 197,67; модель значима; коэффициенты модели значимы; а₀ (11,63 - -1,29); а₁ (10,46 - 15,64)

Задача 3.3. Реальные статистические данные о рождаемости в Пензенской области приведены в таблице 3.1.

Таблица 3.5

Динамика коэффициента рождаемости в Пензенской области

Год	2000	2001	2002	2003	2004	2005
Коэффициент рождаемости	7,5	7,5	8,0	8,4	8,6	8,4
Год	2006	2007	2008	2009	2010	2011
Коэффициент рождаемости	8,6	9,7	10,2	10,3	10,2	10,1
Год	2012	2013	2014	2015	2016
Коэффициент рождаемости	10,8	10,6	10,8	10,7	10,2

Построить трендовую линейную регрессионную модель. Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. Спрогнозировать коэффициент рождаемости в 2017г.

Решение:

Таблица 3.6

Расчет

x	y	x²	y²	x * y
1	7.5	1	56.25	7.5
2	7.5	4	56.25	15
3	8	9	64	24
4	8.4	16	70.56	33.6
5	8.6	25	73.96	43
6	8.4	36	70.56	50.4
7	8.6	49	73.96	60.2
8	9.7	64	94.09	77.6
9	10.2	81	104.04	91.8
10	10.3	100	106.09	103
11	10.2	121	104.04	112.2
12	10.1	144	102.01	121.2
13	10.8	169	116.64	140.4
14	10.6	196	112.36	148.4
15	10.8	225	116.64	162
16	10.7	256	114.49	171.2
17	10.2	289	104.04	173.4
153	160.6	1785	1539.98	1534.9

Для наших данных система уравнений имеет вид

17a + 153*b = 160.6

153a + 1785b = 1534.9

Получаем эмпирические коэффициенты регрессии: b = 0.2194, a = 7.4728

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 0.2194 x + 7.4728

Параметры уравнения регрессии.

Выборочные средние.

Выборочные дисперсии:

Среднеквадратическое отклонение

Коэффициент корреляции b можно находить по формуле, не решая систему непосредственно:

Коэффициент корреляции.

Уравнение регрессии

Линейное уравнение регрессии имеет вид y = 0.219 x + 7.473

Ошибка аппроксимации.

В среднем, расчетные значения отклоняются от фактических на 3.49%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Коэффициент детерминации.

R²= 0.928² = 0.8618

т.е. в 86.18% случаев изменения х приводят к изменению y.

Прогноз

Рассчитаем границы интервала, в котором будет сосредоточено 95% возможных значений Y при неограниченно большом числе наблюдений и X_p = 1

t_крит (n-m-1;б/2) = (15;0.025) = 2.131

y(1) = 0.219*1 + 7.473 = 7.692

Вычислим ошибку прогноза для уравнения y = bx + a

или

7.692 ± 0.453

(7.24;8.15)

С вероятностью 95% можно гарантировать, что значения Y при неограниченно большом числе наблюдений не выйдет за пределы найденных интервалов.

Вычислим ошибку прогноза для уравнения y = bx + a + е

7.692 ± 1.08

(6.62;8.77)

F-статистика. Критерий Фишера.

или по формуле:

где

Табличное значение критерия со степенями свободы k₁=1 и k₂=15, F_табл = 4.54

Поскольку фактическое значение F > F_табл, то коэффициент детерминации статистически значим (найденная оценка уравнения регрессии статистически надежна).

Задача 3.4. Реальные статистические данные о курсе валют приведены в таблице 3.2. Построить линейную и нелинейные регрессионные модели вида: у = а_о + а₁t; lnу = а_о + а₁t; у = 1/(а_о + а₁t). Определить коэффициент детерминации, стандартную ошибку, значимость модели и ошибку аппроксимации. В электронную таблицу вместо года записывать 1,2,… По стандартной ошибке выбрать лучшую модель и спрогнозировать цену одного доллара в декабре 2017 года.

Таблица 3.7

Курс рубля к доллару

Месяц и год

январь

2017

февраль

март

апрель

май

июнь

июль

август

2017

Цена одного доллара

59,6

58,5

58,0

56,4

57,0

57,9

59,7

59,6

Решение:

Построим линейную модель

Для наших данных система уравнений имеет вид

8a + 36*b = 466.7

36a + 204b = 2103.3

Получаем эмпирические коэффициенты регрессии: b = 0.075, a = 58

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 0.075 x + 58

Уравнение регрессии (оценка уравнения регрессии).

Линейное уравнение регрессии имеет вид y = 0.075 x + 58

Ошибка аппроксимации.

В среднем, расчетные значения отклоняются от фактических на 1.74%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Построим модель вида lnу = а_о + а₁t

Для этого значения у заменим значениями lny

Для расчета параметров регрессии построим расчетную таблицу (табл. 3.8)

Таблица 3.8

Расчет

x	y	x²	y²	x * y
1	4.09	1	16.7281	4.09
2	4.07	4	16.5649	8.14
3	4.06	9	16.4836	12.18
4	4.03	16	16.2409	16.12
5	4.04	25	16.3216	20.2
6	4.06	36	16.4836	24.36
7	4.09	49	16.7281	28.63
8	4.09	64	16.7281	32.72
36	32.53	204	132.2789	146.44

Для наших данных система уравнений имеет вид

8a + 36*b = 32.53

36a + 204b = 146.44

Получаем эмпирические коэффициенты регрессии: b = 0.00131, a = 4.0604

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 0.00131 x + 4.0604

Ошибка аппроксимации.

В среднем, расчетные значения отклоняются от фактических на 0.46%. Поскольку ошибка меньше 7%, то данное уравнение можно использовать в качестве регрессии.

Коэффициент детерминации.

R²= 0.138² = 0.01902

т.е. в 1.9% случаев изменения х приводят к изменению y. Другими словами - точность подбора уравнения регрессии - низкая. Остальные 98.1% изменения Y объясняются факторами, не учтенными в модели (а также ошибками спецификации).

F-статистика. Критерий Фишера.

или по формуле:

где

Табличное значение критерия со степенями свободы k₁=1 и k₂=6, F_табл = 5.99

Поскольку фактическое значение F < F_табл, то к...

курсовая работа "Корреляционный анализ стоимости изготовления деталей" скачать

Подобные документы

Статистическое исследование фактических данных
Статистика денежного обращения, инфляции и цен. Построение сводки и ряда распределения. Характеристика используемых статистических показателей. Расчет средних величин и показателей вариации, ошибок выборки. Корреляционный анализ количественных признаков.

контрольная работа [564,1 K], добавлен 13.09.2012
Статистика
Предмет и метод статистики. Сводка и группировка статистических данных. Функции статистических показателей. Статистические ряды, вариация и дисперсия. Преимущества выборочного наблюдения. Методы анализа корреляционных связей, экономические индексы.

методичка [371,4 K], добавлен 15.01.2010
Корреляционный анализ в статистических расчетах
Сводка и группировка материалов статистического наблюдения. Абсолютные, относительные и средние величины, показатели вариации. Ряды динамики, индексный анализ. Проведение корреляционно-регрессионного анализа таблиц о сборе урожая и внесении удобрений.

курсовая работа [667,1 K], добавлен 14.05.2013
Средние величины в статистике
Группы средних величин: степенные, структурные. Особенности применения средних величин, виды. Рассмотрение основных свойств средней арифметической. Характеристика структурных средних величин. Анализ примеров на основе реальных статистических данных.

курсовая работа [230,6 K], добавлен 24.09.2012
Статистическая совокупность
Характеристика методов выполнения оценок параметров больших множеств по данным выборочного наблюдения. Особенности работы с большими массивами данных. Расчет основных показателей совокупности. Корреляционно-регрессионный анализ. Анализ рядов динамики.

курсовая работа [1,2 M], добавлен 24.08.2010
Корреляционный анализ основных показателей деятельности Сбербанка России
Сущность и назначение корреляционного метода изучения взаимосвязей между явлениями. Зависимость чистых процентных доходов от выданных кредитов, активов банка от величины вкладов частных лиц, стоимости акции на ММВБ от величины операционных доходов.

курсовая работа [2,1 M], добавлен 07.03.2011
Корреляционный анализ
Построение корреляционного поля и предложение гипотезы о связи между денежными доходами и потребительскими расходами, выдвижение предположения о наличии выбросов. Оценка статистической надежности и значимости вычисленного коэффициента корреляции.

контрольная работа [3,0 M], добавлен 15.11.2012
Корреляционный анализ. Множественная регрессия
Сущность и содержание корреляционного анализа, его значение и эффективность в оценке связи. Множественная регрессия как один из наиболее распространенных способов получения многофакторных прогнозов, оценка ее преимуществ и недостатков, применение.

лабораторная работа [535,0 K], добавлен 17.11.2010
Статистическая обработка результатов выборочного контроля по количественному признаку
Сбор исходных статистических данных. Расчет характеристик экспериментальных данных. Характеристики среднего положения измеренных значений. Распределение статистических данных. Построение и анализ контрольных карт средних арифметических и размахов.

курсовая работа [146,8 K], добавлен 17.10.2013
Количественные методы в экономике и управлении
Организация статистики и источники статистических данных. Наблюдение по способу регистрации данных. Выявление и изучение связи и взаимозависимости между явлениями. Система статистических показателей. Определение средних и относительных величин.

контрольная работа [53,6 K], добавлен 27.01.2011
Статистический анализ данных выборочного наблюдения по объему инвестиций
Сущность статистического анализа и выборочного метода. Правила группировки данных выборочного наблюдения по величине объема инвестиций. Графическое представление вариационного ряда (гистограмма, кумулята, кривая Лоренца). Расчет асимметрии и эксцесса.

курсовая работа [70,7 K], добавлен 26.10.2011
Расчет стоимости изготовления комплекта в ателье по индивидуальным заказам
Организация производства услуг и обслуживания заказчиков на предприятии в условиях рынка. Расчет стоимости изготовления женского костюма. Определение времени на изготовление изделия. Расчет планируемых издержек производства. Реклама, стимулирование сбыта.

курсовая работа [297,7 K], добавлен 22.11.2013
Влияние социально-экономического развития на уровень дифференциации доходов населения Украины
Корреляционный анализ наличия и плотности связи между дифференциацией доходов населения (коэффициентом Джини) и макроэкономическими факторами: ВВП, производительность труда в промышленности, инфляция, безработица. Интерпретация регрессионного уравнения.

статья [28,4 K], добавлен 23.02.2010
Экономико-статистический анализ продуктивности молочного стада крупного рогатого скота в СПК "Украинский" Исилькульского района Омской области
Краткая природно-экономическая характеристика хозяйства. Параметры линейной модели тренда. Расчет величин для определения показателей вариации. Корреляционно-регрессионный анализ связи между продуктивностью коров и себестоимостью одного центнера молока.

курсовая работа [199,9 K], добавлен 17.03.2015
Расчет коэффициента корреляции между притоком прямых иностранных инвестиций и темпами экономического роста на примере Великобритании и Венгрии
Сущность и назначение корреляционного анализа в статистике, основные этапы его реализации. Краткая экономическая характеристика Великобритании и Венгрии. Корреляционный анализ экономики данных государств, показателей прироста иностранных инвестиций.

курсовая работа [181,4 K], добавлен 25.06.2010
Определение рыночной стоимости предприятия
Анализ финансового состояния компании, ее баланса и финансовых результатов. Расчет финансовых коэффициентов. Затратный и доходный подходы к оценке рыночной стоимости. Направления процедуры оценки. Сравнительный подход к оценке стоимости (метод сделок).

курсовая работа [95,9 K], добавлен 19.04.2014
Оценка стоимости предприятия ЗАО "ПИК-Регион"
Оценка стоимости как инструмент принятия эффективных управленческих решений. Стоимостной подход к оценке эффективности управления. Расчет рыночной стоимости ЗАО "ПИК-Регион", выбор подхода к оценке. Описание компании, анализ ее финансовых показателей.

дипломная работа [147,3 K], добавлен 17.03.2013
Организация и планирование на ремонтных заводах
Расчёт программы участка слесарно-механического цеха. Ритм выпуска деталей и определение количества деталей в партиях. Необходимое количество оборудования и его загрузки. Расчет количества рабочих мест. Плановая себестоимость изготовления деталей.

курсовая работа [327,3 K], добавлен 05.06.2009
Обработка и анализ статистических данных
Основные приемы и методы обработки и анализа статистических данных. Исчисление арифметической, гармонической и геометрической средних величин. Ряды распределения, их основные характеристики. Методы выравнивания рядом динамики. Система национальных счетов.

курсовая работа [1,2 M], добавлен 24.10.2014
Расчет рыночной стоимости объекта оценки
Определение основных вопросов оценки объекта недвижимости. Сбор, проверка и анализ информации. Анализ наиболее эффективного использования земельного участка. Расчет рыночной стоимости на основе трех подходов к оценке и согласование полученных результатов.

курсовая работа [35,9 K], добавлен 30.11.2010

Другие документы, подобные "Корреляционный анализ стоимости изготовления деталей"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.

Корреляционный анализ стоимости изготовления деталей

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Корреляционный анализ

корреляционный анализ стоимость

Целью корреляционного анализа является выявление оценки силы связи между случайными величинами (признаками), которые характеризует некоторый реальный процесс.

Задачи корреляционного анализа:

а) Измерение степени связности (тесноты, силы, строгости, интенсивности) двух и более явлений.

в) Обнаружение неизвестных причинных связей.

Формы проявления взаимосвязей весьма разнообразны. В качестве самых общих их видов выделяют функциональную (полную) и корреляционную (неполную) связи.

Показатели тесноты связи дают возможность охарактеризовать зависимость вариации результативного признака от вариации признака-фактора.

Использование графического метода.

Совокупность точек результативного и факторного признаков называется полем корреляции. [5,85-89]

Линейное уравнение регрессии имеет вид y = bx + a + е

Здесь е - случайная ошибка (отклонение, возмущение).

Причины существования случайной ошибки:

1. Невключение в регрессионную модель значимых объясняющих переменных;

3. Неправильное описание структуры модели;

4. Неправильная функциональная спецификация;

5. Ошибки измерения.

Так как отклонения еi для каждого конкретного наблюдения i - случайны и их значения в выборке неизвестны, то:

1) по наблюдениям xi и yi можно получить только оценки параметров б и в

2) Оценками параметров б и в регрессионной модели являются соответственно величины а и b, которые носят случайный характер, т.к. соответствуют случайной выборке;

Для оценки параметров б и в - используют МНК (метод наименьших квадратов). Решение ведем с использованием онлайн-калькулятора Уравнение регрессии.

Система нормальных уравнений.

a*n + b?x = ?y

a?x + b?x2 = ?y*x

Линейная связь между переменными Xi и Xj оценивается коэффициентом корреляции:

, (2.1)

где Xi и Xj - исследуемые переменные; mXi и mXj - математические ожидания переменных; уX и уX - дисперсии переменных.

Выборочный коэффициент корреляции определяют по формуле:

, (2.2)

или по преобразованной формуле:

, (2.3)

где i =1, 2,..., n, j = 1, 2,..., m, u = 1, 2,..., N; N - число опытов(объем выборки); xi, xj - оценки математических ожиданий; SXi, SXj - оценки среднеквадратических отклонений.

Задача 2. 1. Определить коэффициент корреляции между У и Х.

Х: 3,5; 4,6; 5,8; 4,2; 5,2;

УХ: 28,35; 43,24; 65,54; 28,98; 50,44.

Оценить значимость коэффициента корреляции при уровне 0,05. Расчеты и ответы до двух знаков. Результаты:

1) коэффициент корреляции;

2) расчетное и табличное значения критерия Стьюдента и вывод.

Решение:

Перед расчетом коэффициента корреляции необходимо вычислить среднее квадратическое отклонение для показателей x и y [2]:

(14)

= 0,79

Коэффициент корреляции определяется по формуле [2]:

(15)

В соответствии с данными задачи, расчет выглядит следующим образом:

(16)

Вывод: т.к. расчетное значение меньше табличного, то коэффициент корреляции не значимый, необходимо увеличить объем выборки.

Ответ: = ; ; коэффициент не значим.

Задача 2.2. Определить коэффициент корреляции между количеством деталей (у) и стоимостью их изготовления (х). Оценить его значимость.

Таблица 2.3

Исходные данные

Решение:

Таблица 2.4

Расчет

Для наших данных система уравнений имеет вид

6a + 126*b = 115

126*a + 2710*b = 2487

Получаем эмпирические коэффициенты регрессии: b = 1.125, a = -4.4583

Уравнение регрессии (эмпирическое уравнение регрессии):

y = 1.125 x -4.4583

Коэффициент корреляции.

Значимость коэффициента корреляции.

По таблице Стьюдента с уровнем значимости б=0.05 и степенями свободы k=4 находим tкрит:

tкрит (n-m-1;б/2) = (4;0.025) = 2.776

Поскольку |tнабл| > tкрит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим

Задача 2.3.

В результате тестирования 7 студентов они получили баллы по теории вероятностей и статистики по сто балльной системе. Решение:

Таблица 2.5

Исходные данные

Присвоим ранги признаку Y и фактору X.

Матрица рангов.

Проверка правильности составления матрицы на основе исчисления контрольной суммы:

Сумма по столбцам матрицы равны между собой и контрольной суммы, значит, матрица составлена правильно.

По формуле вычислим коэффициент ранговой корреляции Спирмена.

Связь между признаком Y и фактором X сильная и прямая

Регрессионный анализ

Задачи регрессионного анализа:

б) Определение функции регрессии в виде математического уравнения того или иного типа и установление влияния объясняющих переменных на зависимую переменную.

Так как отклонения е_i для каждого конкретного наблюдения i - случайны и их значения в выборке неизвестны, то:

1) по наблюдениям x_i и y_i можно получить только оценки параметров б и в

a?x + b?x² = ?y*x

Линейная связь между переменными X_i и X_j оценивается коэффициентом корреляции:

где X_i и X_j - исследуемые переменные; mX_i и mX_j - математические ожидания переменных; у_X и у_X - дисперсии переменных.

где i =1, 2,..., n, j = 1, 2,..., m, u = 1, 2,..., N; N - число опытов(объем выборки); x_i, x_j - оценки математических ожиданий; S_Xi, S_Xj - оценки среднеквадратических отклонений.

126a + 2710b = 2487

По таблице Стьюдента с уровнем значимости б=0.05 и степенями свободы k=4 находим t_крит:

t_крит (n-m-1;б/2) = (4;0.025) = 2.776

Поскольку |t_набл| > t_крит, то отклоняем гипотезу о равенстве 0 коэффициента корреляции. Другими словами, коэффициент корреляции статистически - значим

Долю дисперсии, объясняемую регрессией, в общей дисперсии результативного признака у характеризует коэффициент (индекс) детерминации R²: