Статистические методы решения инженерных задач
Изучение межпредметных связей математики с инженерными дисциплинами. Рассмотрение применения математического моделирования для анализа производственных процессов и их прогнозирования. Формирование знаний основных сведений математической статистики.
Рубрика | Математика |
Вид | учебное пособие |
Язык | русский |
Дата добавления | 06.04.2014 |
Размер файла | 1005,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Для решения этих задач применяют методы корреляционного анализа. При анализе зависимостей между производственными показателями методом корреляционного анализа выделяют два основных типа переменных количественных признаков: независимые переменные (факторные признаки) и зависимые переменные (результативные признаки).
При изучении взаимосвязей между переменными признаками надо, прежде всего, установить, к какому типу зависимостей относится эта связь.
Зависимость между признаками и называется корреляционной, если каждому возможному значению признака сопоставляется условная средняя соответствующего распределения признака .
Среднее арифметическое значение признака , вычисленное при условии, что признак принимает фиксированное значение , называется условным средним, обозначается через и вычисляется по формуле
(42)
где -- частоты, показывающие сколько раз повторяются парные значения , в данной выборке, -- частота появления признака .
Теория корреляции изучает такую зависимость между признаками и , при которой с изменением одного признака меняется распределение другого. Она применяется для того, чтобы при сложном взаимодействии посторонних факторов выяснить, какова должна быть зависимость между признаками и , если бы посторонние факторы не изменялись и своим изменением не искажали истинную статистическую зависимость.
В теории корреляции решаются две задачи. Первая задача состоит в выявлении на основе опытных данных характера корреляционной зависимости между признаками и . При парной корреляции для ее решения применяют графический метод. В системе координат состоят корреляционное поле. Если точки хорошо ложатся на прямую, то связь между признаками и носит линейный характер. Если точки в корреляционном поле хорошо ложатся на кривую, то связь будет криволинейной. Исходя из геометрических соображений, выбирают уравнение линии, которые называют уравнением регрессии, и находят неизвестные параметры, входящие в уравнение. Вторая задача состоит в определении тесноты связи между признаками, включенными в модель, путем вычисления коэффициента корреляции в случае линейной корреляции или корреляционных отношений в случае криволинейной корреляции. Здесь же решается вопрос об адекватности, построенной корреляционной модели (проверяется соответствие полученного уравнения регрессии опытным данным).
§9. Парная линейная корреляция
Предположим, что на основе геометрических или других соображений установлено, что между двумя количественными признаками и существует линейная корреляционная зависимость. Если признаки подчиняются нормальному закону распределения, то уравнение линии регрессии записывают в виде
(43)
Пусть опытные данные не сгруппированы в корреляционную таблицу, то есть заданы в виде табл. 18.
Таблица 18
… |
||||||
… |
В этом случае значения и , являющиеся оценками истинных величин уравнения регрессии, находят по методу наименьших квадратов, решая систему нормальных уравнений
, (44)
где , , , .
Для нахождения сумм, входящих в систему (44) составляется табл. 19.
Таблица 19
Если опытные данные сгруппированы в корреляционную таблицу, то значения и уравнения регрессии (43) находят по методу наименьших квадратов, решая систему нормальных уравнений
,(45)
где и -- частоты признаков и , -- частота совместного появления признаков и .
Для нахождения сумм, входящих в систему (45) составляется табл. 20.
Таблица 20
x y |
… |
||||||
… |
|||||||
… |
|||||||
… |
… |
… |
… |
… |
… |
… |
|
… |
|||||||
… |
|||||||
… |
|||||||
… |
|||||||
… |
Суммы , , в табл. 20 находятся по строкам, а сумма находится по последнему столбцу табл. 20.
В уравнении регрессии (43) параметр характеризуют усредненное влияние на результативный признак неучтенных (не выявленных для исследования) факторных признаков . Параметр показывает, на сколько изменяется в среднем значение результативного признака при увеличении факторного признака на единицу.
Используя параметр , вычисляют коэффициент эластичности по формуле
(46)
Коэффициент эластичности показывает на сколько изменяется в процентах результативный признак при изменении факторного признака на 1 %.
В случае линейной корреляционной зависимости между признаками и , если нет уверенности в том, что эти признаки подчиняются нормальному закону распределения, уравнения линий регрессий находят по формулам:
, (47)
, (48)
где , -- выборочные средние признаков и ; , -- выборочные средние квадратические отклонения признаков и , вычисляемые по формулам:
, где ,(49)
, где .(50)
При и находят по формулам:
, где , (51)
, где . (52)
Коэффициент линейной корреляции находят по формуле
, (53)
где -- средняя произведения значений признаков и , , -- средние значения признаков и , , -- выборочные средние квадратические отклонения признаков и , вычисленные по формулам (49) и (50), если или по формулам (51) и (52), если .
Уравнение (47) называют уравнением регрессии на , а уравнение (48) -- уравнением регрессии на .
Если данные выборки для признаков и заданы в виде корреляционной таблицы и объем выборки , то для нахождения величин, входящих в уравнения линий регрессий (47) и (48), переходят к вспомогательному распределению с условными вариантами и , вычисляемых по формулам:
, (54)
, (55)
где , , и -- шаги значений признаков и .
Выборочный коэффициент линейной корреляции в этом случае находят по формуле
,(56)
где
, (57)
Для нахождения суммы составляется расчетная табл. 21.
Таблица 21
… |
||||||
… |
||||||
… |
||||||
… |
… |
… |
… |
… |
… |
|
… |
||||||
… |
Статистики , , , находят по формулам:
, , , .(58)
§10. Коэффициент корреляции, его свойства и значимость
После выбора функции как формы корреляционной зависимости между признаками и решается задача, состоящая в определении тесноты связи между ними, в оценке рассеяния относительно линии регрессии значений одного признака для различных значений другого. Для этого используют выборочный коэффициент корреляции , который вычисляют по формуле (53). Линейный коэффициент корреляции изменяется на множестве , то есть . Если , то корреляционная зависимость становится функциональной. При эта зависимость прямая (рис. 6), при связь обратная (рис. 7).
Размещено на http:www.allbest.ru/
Если , то линейная связь между признаками и отсутствует, но может существовать криволинейная корреляционная связь или нелинейная функциональная.
Оценку тесноты линейной корреляционной связи определяют, пользуясь табл. 22.
Таблица 22
Теснота связи |
Величина |
||
Прямая связь |
Обратная связь |
||
Линейной связи нет |
|||
Слабая |
|||
Средняя |
|||
Сильная |
|||
Функциональная |
Значимость выборочного коэффициента корреляции проверяют по критерию Стьюдента. По опытным данным находят статистику , пользуясь формулой
(59)
Затем по таблице критических точек распределения Стьюдента (приложение) по заданному уровню значимости и числу степеней свободы находят табличное значение двусторонней критической области. Если , то незначимый (мало отличается от нуля) и признаки и некоррелированы. Если , то приходят к выводу о наличии линейной корреляционной связи.
§11. Определение надежности (доверительного интервала) коэффициента корреляции
Коэффициент корреляции, как правило, рассчитывается по данным выборки. Чтобы полученный результат распространить на генеральную совокупность, приходится допустить некоторую ошибку, которую оценивают с помощью средней квадратической ошибки . С помощью производят оценку надежности коэффициента корреляции, построив доверительные интервалы для различных объемов выборки. Пусть число наблюдений пар чисел меньше 50 . В этом случае средняя квадратическая ошибка вычисляется по формуле
, (60)
где -- коэффициент парной линейной корреляции, -- объем выборки. Доверительный интервал для оценки находят по формуле
(61)
где находят по таблице значений функции Лапласа (приложение).
Если задать надежность , то и .
Если объем выборки , то погрешность для коэффициента корреляции находят также по формуле (60). Затем вычисляют отношение . Если это отношение больше 3, то можно считать, что найденный коэффициент корреляции отражает истинную зависимость между признаками и . Величина является гарантийным минимумом, а величина гарантийным максимумом коэффициента корреляции и доверительный интервал для оценки запишется в виде
(62)
§12. Коэффициент корреляции
Линейный коэффициент корреляции оценивает тесноту взаимосвязи между признаками и показывает, является ли эта связь прямой или обратной. Однако понятия тесноты взаимосвязи бывает недостаточно при содержательном анализе взаимосвязей. В частности коэффициент корреляции не показывает степень воздействия факторного признака на результативный . Таким показателем является коэффициент детерминации.
Пусть по опытным данным для признаков и получены уравнения регрессий и . Величину называют коэффициентом детерминации. Этот коэффициент детерминации можно находить и по формуле
, (63)
где -- опытные значения признака , -- значения , найденные по уравнению регрессии, -- средняя признака . Формулой (63) пользуется тогда, когда общее число значений равно числу значений признака .
Коэффициент детерминации используется, во-первых, для контроля вычислений, проводимых при получении уравнений регрессий и, во-вторых, он показывает, какую часть рассеяния результативного признака можно объяснить принятой регрессионной моделью.
§13. Проверка адекватности модели
Для проверки соответствия уравнения регрессии опытным данным применяют критерий Фишера-Снедекора. Вычисляют статистику по формуле
,(64)
где -- коэффициент детерминации, -- объем выборки. Чем ближе значение к единице, тем лучше модель согласуется с опытными данными. Затем при заданном уровне значимости и числах степеней свободы , находят по таблице критических точек распределения Фишера-Снедекора (приложение) . Если окажется, что , то полученное уравнение линейной регрессии согласуется с опытными данными. Если , то модель регрессии не согласуется с данными опыта. Формулой (64) пользуются тогда, когда исходные данные заданы не в виде корреляционной таблицы. Если опытные данные заданы в виде корреляционной таблицы, то проверку модели на адекватность можно выполнить тогда, когда общее число значений больше числа значений . В этом случае находят остаточную сумму квадратов , характеризующую влияние неучтенных в модели факторов, по формуле
, (65)
где -- сумма квадратов отклонений значений от средней , -- сумма квадратов отклонений условных средних от средней . Затем вычисляется статистика по формуле
. (66)
По таблице критических точек распределения Фишера-Снедекора при заданном уровне значимости и числах степеней свободы , находят . Если , то модельное уравнение регрессии значимо описывает опытные данные, в противном случае нет.
§14. Оценка величины погрешности линейного однофакторного уравнения
После проверки модельного уравнения линейной регрессии на адекватность находят относительную погрешность уравнения по формуле
, (67)
где , -- стандартная ошибка уравнения регрессии,
-- остаточная дисперсия,
, -- опытные значения , -- значения , полученные по уравнению регрессии, -- среднее значение , -- объем выборки.
Если величина мала, то прогнозные качества оценочного регрессивного уравнения высоки.
Одновременно производят оценку коэффициентов уравнения регрессии . Пусть и -- средние квадратические (или стандартные) ошибки соответственно коэффициентов и уравнения регрессии. Их вычисление производят по формулам:
(68)
(69)
Коэффициенты и считаются значимыми, если
и .
Если коэффициенты и незначимы, то ситуацию можно поправить путем увеличения объема выборки , увеличения числа факторов, включаемых в модель или изменения формы уравнения связи.
Применения теории §§ 8-14 демонстрируется на примере выполнения лабораторных работ № 3 и № 4.
Контрольные вопросы
1. Дать определение корреляционной зависимости между двумя признаками и .
2. Дать определение условной средней признака и записать формулу для ее нахождения.
3. Сформулировать задачи, решаемые в теории корреляции.
4. Записать систему нормальных уравнений для нахождения параметров и уравнения линейной регрессии в случае, когда опытные данные не сгруппированы в корреляционную таблицу.
5. Записать уравнения линий регрессий на и на , используя коэффициент линейной корреляции .
6. Дать определение коэффициента линейной корреляции, сформулировать его свойства.
7. Рассказать о том, как определяется теснота линейной корреляционной связи между двумя признаками с помощью коэффициента линейной корреляции.
8. Как определяется значимость коэффициента линейной корреляции?
9. Записать доверительные интервалы для оценки коэффициента линейной корреляции при различных объемах выборки.
10. Записать формулу для нахождения коэффициента детерминации в случае парной линейной корреляции и рассказать о его назначении.
11. Рассказать о проверке адекватности уравнения линейной регрессии на для случая несгруппированных опытных данных.
12. Рассказать о нахождении относительной погрешности линейного уравнения регрессии .
13. Как производится оценка коэффициента и уравнения линейной регрессии ?
Лабораторная работа № 3
Построение модели линейной регрессии для несгруппированных данных
Цель работы: овладение способами построения моделей линейной регрессии для несгруппированных данных, выработка умения и навыков оценки надежности коэффициента корреляции, уравнения регрессии и его коэффициентов.
Содержание работы: на основании опытных данных требуется:
1. Построить корреляционное поле. По характеру расположения точек в корреляционном поле выбрать общий вид функции регрессии.
2. Вычислить числовые характеристики , , , , , .
3. Определить значимость коэффициента корреляции и найти для него доверительный интервал с надежностью .
4. Написать эмпирические уравнения линий регрессий на и на .
5. Вычислить коэффициент детерминации и объяснить его смысловое значение.
6. Проверить адекватность уравнения регрессии на .
7. Провести оценку величины погрешности уравнения регрессии на и его коэффициентов.
8. Построить уравнение регрессии на в первоначальной системе координат.
Выполнение лабораторной работы покажем, решая следующую задачу.
Задача. Результаты наблюдений изменения средней заработной платы (тыс. руб.) и производительности труда (тыс. руб.) по цеху технологической связи ТПЭУС № 1 по кварталам приведены в табл. 23.
Таблица 23
Производительность труда, (тыс. руб.) |
24,3 |
24,9 |
28,1 |
30,5 |
31,5 |
39,3 |
40,2 |
43,5 |
45,4 |
45,9 |
|
Средняя зарплата, (тыс. руб.) |
8,2 |
8,6 |
8,7 |
8,9 |
9,1 |
10,6 |
11,3 |
11,8 |
12,9 |
13,1 |
Выполнение работы
Для решения поставленной задачи методами корреляционного анализа определим, какой из указанных в условии показателей выбрать за факторный признак, а какой за результативный. На основании экономического анализа производственной деятельности и взаимосвязи производительности трудаи средней заработной платы следует, что за факторный признак следует принять производительность труда, а среднюю зарплату за результативный признак .
Для определения формулы связи между признаками и в системе координат строим точки , пользуясь табл. 23.
Размещено на http:www.allbest.ru/
Рис. 8
Около построенных точек проводим линию трэнда (пунктирная линия). По расположению точек около этой линии делаем вывод о том, что связь между производительностью труда и средней зарплатой может носить линейный характер. произведем расчет статистик , , , , , которые войдут в уравнения линий регрессий. Составим расчетную табл. 24
Таблица 24
24,3 |
-11,06 |
122,3236 |
8,2 |
-2,12 |
4,4944 |
590,49 |
199,26 |
|
24,9 |
-10,46 |
109,4116 |
8,6 |
-1,72 |
2,9584 |
620,01 |
214,14 |
|
28,1 |
-7,26 |
52,7076 |
8,7 |
-1,62 |
2,6244 |
789,61 |
244,47 |
|
30,5 |
-4,86 |
23,6196 |
8,9 |
-1,42 |
2,0164 |
930,25 |
271,45 |
|
31,5 |
-3,86 |
14,8996 |
9,1 |
-1,22 |
1,4884 |
992,25 |
286,65 |
|
39,3 |
3,94 |
15,5236 |
10,6 |
0,28 |
0,0784 |
1544,49 |
416,58 |
|
40,2 |
4,84 |
23,4256 |
11,3 |
0,98 |
0,9604 |
1616,04 |
454,26 |
|
43,5 |
8,14 |
66,2596 |
11,8 |
1,48 |
2,1904 |
1892,25 |
513,3 |
|
45,4 |
10,04 |
100,8016 |
12,9 |
2,58 |
6,6564 |
2061,16 |
585,66 |
|
45,9 |
10,54 |
11,0916 |
13,1 |
2,78 |
7,7284 |
2106,81 |
601,29 |
|
353,6 |
640,064 |
103,2 |
31,196 |
13143,36 |
3787,06 |
Пользуясь результатами последней строки табл. 24, находим:
-- средняя производительность труда.
-- средняя зарплата сотрудников цеха технологический связи.
, ,
, ,
,
.
Проверяем ”значимость” коэффициента корреляции. Вычислим статистику по формуле (59):
.
По таблице критических точек распределения Стьюдента (приложение ) по уровню значимости и числу степеней свободы находим . Так как , то выборочный коэффициент корреляции значимо отличается от нуля. Следовательно, можно предположить, что средняя зарплата и производительность труда рабочих связаны линейной регрессионной зависимостью. Подтверждением может служить рис. 8.
Находим доверительный интервал для выборочного коэффициента корреляции с надежностью . Так как объем выборки , то доверительный интервал находим по формуле (61):
.
Так как по условию надежность (доверительная вероятность) , то по таблице функции Лапласа (приложение) находим . Вычисляем среднюю квадратическую ошибку по формуле (60):
.
Записываем доверительный интервал: или . Следовательно, с вероятностью 0,95 линейный коэффициент корреляции генеральной совокупности находится в пределах от 0,71 до 1. Применительно к решаемой задаче полученный результат означает, что по имеющейся выборке следует ожидать влияние производительности труда на рост средней зарплаты работников цеха технологической связи не менее чем на 71 %.
Найдем эмпирические линейные уравнения регрессии на и на , которые являются приближенными уравнениями для истинных уравнений регрессий.
Уравнение регрессии на :
или .
Уравнение регрессии на :
или .
Контроль вычислений: .
. Так как выполняется условие , то вычисления проведены верно.
Из уравнения следует, что при увеличении производительности труда на 1 тыс. руб. средняя зарплата работников цеха технологической связи возрастает на 192,989 рублей. Этот результат следует учесть на предприятии при разработке мероприятий по стимулированию производственной деятельности работников цеха в условиях рыночных отношений.
Подставляя в уравнения регрессий и , получаем точки, координаты которых совпадают с координатами центра распределения . Cледовательно, линии регрессий пересекаются в точке .
Находим коэффициент детерминации. Для линейной регрессии при вычисленном коэффициенте он равен . У нас . Это означает, что 76 % рассеивания средней зарплаты работников технологического цеха связи объясняется линейной регрессионной зависимостью между средней зарплатой и производительностью труда, и только 24 % рассеивания средней зарплаты работников технологического цеха остались необъяснимыми. Такое положение могло произойти из-за того, что в модель не включены другие факторы, влияющие на изменение средней зарплаты работников технологического цеха связи, либо опытных данных в данной выборке не достаточно, чтобы построить более надежное уравнение регрессии.
Проверим адекватность уравнения линейной регрессии на по критерию Фишера-Снедекора. Вычислим статистики по формуле (64):
, где .
Для нахождения суммы составляем табл. 25.
Талица 25
8,2 |
8,18 |
0,02 |
0,0004 |
|
8,6 |
8,3 |
0,3 |
0,09 |
|
8,7 |
8,9 |
-0,2 |
0,04 |
|
8,9 |
9,4 |
-0,5 |
0,25 |
|
9,1 |
9,6 |
-0,5 |
0,25 |
|
10,6 |
11,1 |
-0,5 |
0,25 |
|
11,3 |
11,25 |
0,05 |
0,0025 |
|
11,8 |
11,9 |
-0,1 |
0,01 |
|
12,9 |
12,2 |
0,7 |
0,49 |
|
13,1 |
12,4 |
0,7 |
0,49 |
|
1,8729 |
Из табл. 24 и 25 находим: , . Тогда
, .
При уровне значимости и числах степеней свободы , по таблице критических точек распределения Фишера-Снедекора (приложение) находим . Так как , то заключаем, что есть уравнение линейной регрессии статистически значимо описывает результаты эксперимента.
Проведем оценку величины погрешности уравнения регрессии . Найдем относительную погрешность уравнения по формуле (67):
, где , , .
Так как , то . Для нахождения суммы составляем табл. 26.
Таблица 26
0,02 |
-0,17 |
0,0289 |
|
0,03 |
-0,16 |
0,0256 |
|
-0,2 |
-0,39 |
0,1521 |
|
-0,5 |
-0,69 |
0,4761 |
|
-0,5 |
-0,69 |
0,4761 |
|
-0,5 |
-0,69 |
0,4761 |
|
0,05 |
-0,14 |
0,0196 |
|
-0,1 |
-0,29 |
0,0841 |
|
0,7 |
0,51 |
0,2601 |
|
0,7 |
0,51 |
0,2601 |
|
2,2588 |
Тогда , .
Так как величина мала, то уравнение линейной регрессии хорошо описывает опытные данные.
Оценим коэффициенты уравнения регрессии. У нас , . Для нахождения отношений и вычислим средние квадратические ошибки коэффициентов по формулам (68) и (69):
, , .
По табл. 24 находим: , . Учитывая, что ,
и , находим:
,
,
.
Так как и , то коэффициенты и уравнения регрессии на значимы. Графики найденных линейных уравнений регрессий построены на рис. 8.
Таким образом, уравнение регрессии , описывающее зависимость средней зарплаты работников цеха технологической связи от производительности труда, значимо описывает опытные данные и может быть принято для практического руководства.
Варианты заданий к лабораторной работе №3.
Вариант № 1
При исследовании зависимости между средней заработной платой на одного работника (тыс. руб.) и выпуском продукции на одного работника (тыс. руб.) по заводу Пластмасс получены следующие данные:
21,07 |
23,07 |
28,69 |
22,42 |
21,41 |
18,49 |
21,64 |
39,19 |
51,96 |
42,36 |
51,80 |
50,45 |
||
30,2 |
47,0 |
29,6 |
39,5 |
43,9 |
47,6 |
46,6 |
28,7 |
10,8 |
16,97 |
20,1 |
23,80 |
Вариант №2
Данные о производстве дистоплива (тыс. руб.) и себестоимости единицы продукции (тыс. руб.) по “Уренгойгазпром” приведены в таблице:
5 |
6 |
8 |
13 |
34 |
72 |
95 |
113 |
127 |
90 |
||
143 |
125 |
87 |
45 |
33 |
27 |
16 |
25 |
24 |
27 |
Вариант №3
Компанию по прокату автомобилей интересует зависимость между пробегом автомобилей () и стоимостью ежемесячного технического обслуживания (). Для выяснения характера этой связи было отбрано 15 автомобилей. Данные приведены в таблице:
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
17 |
18 |
19 |
20 |
||
13 |
16 |
15 |
20 |
19 |
21 |
26 |
24 |
30 |
32 |
30 |
35 |
34 |
40 |
39 |
Вариант №4
Данные зависимости мощности на долоте (кВт) осевой статической нагрузки на забой (ТС) при бурении пород Подольского горизонта Туймазинского месторождения приведены в таблице:
1 |
3 |
5 |
7 |
9 |
11 |
13 |
15 |
17 |
||
12,5 |
17,8 |
37 |
41,9 |
45 |
47 |
39 |
32 |
23 |
Вариант №5
Зависимость скорости отскока инструмента (м/с) при ударно-вращательном бурении от коэффициента пластичности долот задана таблицей:
1,5 |
2,5 |
3,5 |
4,5 |
5,5 |
6,5 |
||
1,2 |
0,6 |
0,21 |
0,9 |
0,8 |
0,75 |
Вариант №6
Данные о количестве выпускаемых деталей (тыс. руб.) и полных затратах на их изготовление (сотни руб.) на однотипных предприятиях приведены в таблице:
1 |
2 |
4 |
9 |
13 |
18 |
20 |
||
26 |
22 |
19 |
12 |
9 |
8 |
6 |
Вариант №7
При исследовании зависимости времени на обработку одной детали (мин.) от стажа работы (в годах) на Тюменском моторостроительном объединении в цехе резиново - технических и пластмассовых изделий на слесарном участке получены следующие данные:
1 |
2 |
3 |
4 |
5 |
6 |
7 |
||
5 |
3,33 |
2,9 |
2,2 |
2,1 |
2 |
2 |
Вариант №8
Зависимость удельного момента на долоте (кгс·м/тс) от осевой статической нагрузки на забой (тс) при бурении пород задана таблицей:
1 |
3 |
5 |
7 |
9 |
11 |
13 |
15 |
||
22,5 |
11,5 |
6 |
5,5 |
2,6 |
2,4 |
2,1 |
2 |
Вариант №9
Результаты измерений зависимости фазовой проницаемости воды от нефтенасыщенности породы приведены в таблице:
0,25 |
0,35 |
0,45 |
0,55 |
0,65 |
0,75 |
0,85 |
||
0,65 |
0,45 |
0,25 |
0,15 |
0,10 |
0,05 |
0,07 |
Вариант №10
В результате исследований установлено, что между овальностью колец после их обработки и термической обработки , существует связь, которая задана таблицей:
5 |
10 |
15 |
20 |
25 |
||
21 |
29,3 |
36 |
38 |
39,2 |
Вариант №11
При исследовании зависимости между выпуском готовой продукции (тыс. руб.) и коэффициентом использования техники (%) получены следующие данные:
73 |
75 |
79 |
82 |
83 |
86 |
80 |
85 |
95 |
93 |
97 |
77 |
||
14 |
21 |
29 |
30 |
315 |
35 |
34 |
41 |
38 |
39 |
46 |
27 |
Вариант №12
Давление (кг) воздуха на парашют возрастает при увеличении скорости (м/сек.) падения следующим образом:
2,23 |
3,28 |
4,65 |
6,5 |
8,1 |
||
0,3 |
0,6 |
1,2 |
2,4 |
4,2 |
Вариант №13
Прочность бетона (кг/см2) при испытании цилиндрических образцов в зависимости от отношения высоты к диаметру оказалась равной:
0,5 |
1,0 |
2,0 |
3,0 |
4,0 |
5,0 |
6,0 |
||
290 |
250 |
216 |
206 |
200 |
195 |
190 |
Вариант №14
Зависимость между размером предприятия по стоимости основных средств (млн. руб.) и себестоимостью единицы продукции (руб.) характеризуется следующими данными:
0,5 |
1,5 |
2,5 |
3,5 |
4,5 |
5,5 |
7,5 |
||
15 |
11 |
12 |
10,8 |
10 |
9 |
8 |
Вариант №15
Зависимость между ростом производительности труда на одного работающего (тыс. руб.) и выпуском товарной продукции (тыс. руб.) ремонтного цеха машиностроительного завода характеризуется следующими данными:
1,5 |
2,9 |
3,0 |
3,1 |
3,2 |
3,4 |
3,5 |
3,6 |
4,2 |
||
580 |
618 |
658 |
670 |
662 |
699 |
717 |
775 |
786 |
Вариант №16
Зависимость себестоимости продукции (тыс. руб.) от затрат на единицу продукции (тыс. руб.) по объединению «Сибкомплектмонтаж» характеризуется следующими данными:
0,1 |
0,4 |
1 |
4 |
6 |
10 |
20 |
26 |
||
2248 |
1950 |
1500 |
1020 |
906 |
290 |
175 |
121 |
Вариант №17
Компрессорную скважину исследовали на приток нефти (т/сут.) при различных режимах работы с замером забойных давлений (атм) глубинным манометром. Результаты исследований приведены в таблице:
5 |
15 |
25 |
35 |
45 |
55 |
||
1,25 |
1,3 |
5,25 |
11,25 |
17,25 |
21,25 |
Вариант №18
Зависимость между стоимостью основных средств предприятия (млн. руб.) и выработкой продукции (тыс. руб.) на одного работника характеризуется следующими данными:
1 |
1,5 |
2,5 |
3,5 |
4,5 |
5,5 |
6,5 |
||
4 |
6 |
6,8 |
7,9 |
8,7 |
9 |
9,5 |
Вариант №19
Ниже приводятся данные удельного момента на долото (кг·м/тс) и осевой статистической нагрузки на забой (тс) при бурении пород на одном из месторождений Тюменской области:
1 |
3 |
5 |
7 |
9 |
11 |
13 |
15 |
17 |
||
25 |
15 |
12 |
8 |
10 |
5 |
4,5 |
3 |
2,8 |
Вариант №20
Зависимость между мощностью предприятия (млн. ед. продукции в год) и фактическими капитальными вложениями (млн. руб.) характеризуется следующими данными:
1 |
2 |
3 |
4 |
5 |
6 |
||
1,2 |
2,6 |
3,8 |
4,6 |
4,9 |
5,4 |
Вариант №21
Результаты изучения зависимости между среднемесячной производительностью труда рабочего (руб) и себестоимостью одной тонны продукции (руб.) приведены в следующей таблице:
21 |
24 |
30 |
34 |
35 |
36 |
39 |
40 |
||
20 |
13 |
12 |
13 |
11 |
10 |
11 |
10 |
Вариант 22
Энерговооруженность труда на одного рабочего (тыс. кВт-час) и производительность труда одного рабочего (тыс. штук) изделий на ряде предприятий характеризуется следующими данными:
3 |
3,05 |
3,6 |
4,25 |
4,45 |
4,55 |
||
1 |
1,5 |
1,8 |
2,5 |
3 |
4 |
Вариант 23
Зависимость между стоимостью основных средств предприятий и месячным выпуском продукции характеризуется следующими данными:
Стоимость основных средств, , (млн. руб.) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
Месячный выпуск продукции, , (тыс. руб.) |
10 |
12 |
28 |
40 |
42 |
52 |
54 |
Вариант 24
Зависимость между капитальными вложениями (млн. руб.) и мощностью предприятий данного типа (млн. тонн) продукции задана таблицей:
1 |
2 |
3 |
4 |
5 |
6 |
||
0,9 |
2,59 |
3,67 |
4,45 |
4,95 |
5,20 |
Вариант 25
Распределение однотипных предприятий по объему произведенной за день продукции и себестоимости единицы продукции в условных единицах приведено в таблице:
50 |
100 |
150 |
200 |
250 |
300 |
||
140 |
120 |
118 |
110 |
115 |
100 |
Вариант 26
Результаты исследования зависимости объема зоны разрушения з. р. (см3) от предела текучести (кг/мм2) известняков приведены в таблице:
12,5 |
37,5 |
62,5 |
87,5 |
112,5 |
137,5 |
187,5 |
||
з. р. |
0,19 |
0,13 |
0,11 |
0,10 |
0,08 |
0,07 |
0,06 |
Вариант 27
Зависимость перепада давления (кг/см2) (разность между гидростатическим и пластовым давлением) от времени сек. при бурении в песчанике задана таблицей:
0,025 |
0,074 |
0,125 |
0,175 |
0,225 |
0,275 |
0,325 |
||
95 |
73 |
52 |
45 |
35 |
33 |
31 |
Вариант 28
Зависимость среднемесячной заработной платы рабочих (тыс. руб.) нефтеперерабатывающего завода от них квалификации (разряд) характеризуется следующими данными:
1 |
2 |
3 |
4 |
5 |
6 |
7 |
||
0,8 |
1,2 |
1,8 |
2,9 |
4,2 |
5,9 |
12,5 |
Вариант 29
Зависимость между размером предприятия по стоимости основных средств (млн. руб.) и себестоимостью единицы продукции (тыс. руб.) характеризуется следующими данными:
0,5 |
1,5 |
2,5 |
3,5 |
4,5 |
6,0 |
9 |
10 |
||
14 |
11 |
10 |
8 |
6,5 |
5 |
4,5 |
4 |
Вариант 30
Зависимость между фазовой проницаемостью нефти и насыщенностью породы нефтью характеризуется следующими данными:
0,35 |
0,45 |
0,55 |
0,65 |
0,75 |
0,85 |
||
0,05 |
0,1 |
0,15 |
0,45 |
0,55 |
0,75 |
§16. Лабораторная работа №4
Построение модельного уравнения линейной регрессии для сгруппированных данных
Цель работы: овладение способами построения моделей линейной регрессии для сгруппированных данных по методу наименьших квадратов и с использованием коэффициента линейной корреляции, выработка умения и навыков оценки надежности уравнения регрессии и его коэффициентов.
Содержание работы: по опытным данным требуется:
1. Построить корреляционное поле. По характеру расположения точек в корреляционном поле выбрать общий вид функции регрессии.
2. Написать уравнение линейной регрессии на по методу наименьших квадратов и с использованием коэффициента корреляции . Сравнить полученные уравнения и сделать вывод о выборке одного из них.
3. Оценить тесную связь между признаками и с помощью выборочного коэффициента корреляции и его значимость.
4. Проверить адекватность модельного уравнения регрессии на , записанного через коэффициент корреляции .
5. Проверить надежность уравнения регрессии на , записанного через коэффициент корреляции и его коэффициентов.
6. Построить уравнения регрессий в первоначальной системе координат.
Задача. Валики при черновой обработке на станке №1 передаются последовательно на станок №2 для чистовой обработки. Экспериментатор, изучающий зависимость между отклонениями размеров валиков от номинала при черновой обработке (мкм), от номинала при чистовой обработке (мкм) произвел измерения отклонений у 50 случайно отобранных валиков. Результаты измерений сведены в табл. 27.
Таблица 27
-30 |
-20 |
-10 |
0 |
|||
-8 |
1 |
1 |
||||
-4 |
4 |
1 |
5 |
|||
0 |
1 |
15 |
1 |
17 |
||
4 |
2 |
13 |
15 |
|||
8 |
2 |
1 |
3 |
|||
12 |
9 |
9 |
||||
6 |
18 |
16 |
10 |
50 |
Выполнение работы.
Пусть признак характеризует отклонение размеров валиков от номинала при черновой обработке, а признак отклонение размеров валиков от номинала при чистовой обработке. Используя данные табл. 27, строим корреляционное поле (рис. 9).
Проведя линию трэнда (пунктирная линия), видим, что число точек, расположенных над и под ней, практически одинаково, причем расстояния этих точек до линии трэнда одинаковые. Это дает основание предположить наличие линейной зависимости между признаками и . Для подтверждения этой гипотезы перейдем от денного распределения к новому, найдя для каждого значения признак условное среднее признака по формуле (42):
.
При , .
При , .
При , .
При , .
Строим точки с координатами (рис. 10).
Из рис. 10 видно, что отклонения точек от построенной прямой незначительны. Следовательно, связь между признаками и может носить линейный характер. Составим уравнения линий регрессий на по методу наименьших квадратов и через коэффициент линейной корреляции .
Применим метод наименьших квадратов к нахождению коэффициентов и уравнения линейной регрессии . Решаем систему нормальных уравнений (45):
.
Для нахождения сумм, входящих в систему составляем табл. 28.
Таблица 28
-30 |
-20 |
-10 |
0 |
||||
-8 |
1 |
1 |
-8 |
||||
-4 |
4 |
1 |
5 |
-20 |
|||
0 |
1 |
15 |
1 |
17 |
0 |
||
4 |
2 |
13 |
15 |
60 |
|||
8 |
2 |
1 |
3 |
24 |
|||
12 |
9 |
9 |
108 |
||||
6 |
18 |
16 |
10 |
50 |
164 |
||
-180 |
-360 |
-160 |
0 |
-700 |
|||
5400 |
7200 |
1600 |
0 |
14200 |
|||
720 |
-80 |
-680 |
0 |
-40 |
Пользуясь табл. 28, записываем и решаем систему уравнений:
, ,
Тогда уравнение линейной регрессии запишется в виде
(70)
Найдем уравнение линейной регрессии на по формуле (47), используя коэффициент линейной корреляции:
.
Так как данные выборки для признаков и заданы в виде корреляционной таблицы и объем выборки , то для нахождения величин, входящих в уравнение регрессии, переходим к вспомогательному распределению с условными вариантами и . По корреляционной табл. 27 находим наибольшую частоту совместного появления признаков и : . Тогда , , , . Составляем корреляционную табл. 29 в условных вариантах.
Таблица 29
-1 |
0 |
1 |
2 |
|||
-2 |
1 |
1 |
||||
-1 |
4 |
1 |
5 |
|||
0 |
1 |
15 |
1 |
17 |
||
1 |
2 |
13 |
15 |
|||
2 |
2 |
1 |
3 |
|||
3 |
9 |
9 |
||||
6 |
18 |
16 |
10 |
50 |
По табл. 29 находим:
,
,
,
Тогда
.
Для нахождения суммы составляем табл. 30.
Таблица 30
-1 |
0 |
1 |
2 |
|||
-2 |
1 2 |
2 |
||||
-1 |
4 1 |
4 |
||||
0 |
||||||