Методика Вальда для проверки гипотезы о свойствах случайной величины

Правила составления интерполяционного полинома Лагранжа, его графическое изображение. Процесс построения квадратичного сплайна. Сущность множественной регрессии, проверка коллинеарности и мультиколлинеарности. Построения временного ряда, оценка качества.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 26.02.2013
Размер файла 534,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Министерство образования и науки

Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

«Тихоокеанский Государственный университет»

Кафедра: Прикладная математика

Курсовая работа

по дисциплине: Обработка экспериментальных данных на ЭВМ

Методика Вальда для проверки гипотезы о свойствах случайной величины

Выполнил: ст. группы ПМ-81

Литовченко И.Ю.

Проверил: доцент

Агапова Е.Г.

Хабаровск 2012г.

Содержание

Введение

1. Интерполяционный полином Лагранжа. Сплайн-функции

2. Множественная регрессия

3. Временной ряд

интерполяционный полинома лагранж регрессия

1. Интерполяционный полином Лагранжа. Сплайн-функции

Составить интерполяционный многочлен Лагранжа для следующих данных:

Таблица 1.1 Данные

X

-2

0

1

2

4

XO=3,5

Y

1

1.5

3

3.5

4

Интерполяционный полином Лагранжа:

. (1.1)

Построим полином:

L5(x)= (0,00694) (x-0)(x-1)(x-2)(x-4)+(-0,0938) (x--2)(x-1)(x-2)(x-4)+(0,333) (x--2)(x-0)(x-2)(x-4)+(-0,219) (x--2)(x-0)(x-1)(x-4)+(0,0278) (x--2)(x-0)(x-1)(x-2)

Подставим X0=3,5, и вычислим значение полинома. Получаем, что значение полинома Лагранжа равно 3,38.

График полинома представлен на рисунке 1.1.

Рисунок 1.1 График полинома Лагранжа

По приведенной ниже таблице 1.2 значений функции требуется построить квадратичный сплайн, который в точке x=1.5 равен 0.43 и который в каждой данной точке имеет первую производную, равную результату численного дифференцирования данной функции в данной точке.

Таблица 1.2 Данные

x

-1.2

-0.5

0.4

1.5

2.1

2.9

3.3

3.9

4.3

5.1

f(x)

-2.11

-2.33

-0.14

0.43

1.34

2.65

6.23

9.23

7.65

4.23

График квадратичного сплайна имеет вид:

Рисунок 1.2 График квадратичного сплайна

2. Множественная регрессия

На основании данных Таблицы 1:

Проверить наличие коллинеарности и мультиколлинеарности. Отобрать неколлинеарные факторы.

Построить уравнение линейной регрессии.

Определить коэффициент множественной регрессии.

Проверить значимость уравнения при уровне значимости 0,05.

Построить частные уравнения регрессии.

Определить средние частные коэффициенты эластичности.

Построить уравнение линейной регрессии в стандартном масштабе.

Оценить информативность факторов на основе уравнения линейной регрессии в стандартизированном масштабе.

Вычислить частные коэффициенты корреляции.

Оценить их значимость при уровне значимости 0,05.

Оценить информативность факторов на основе частных коэффициентов корреляции.

Построить уравнение регрессии с учетом только информативных факторов.

Проверить гипотезу о гомоскедастичности ряда остатков с уровнем значимости 0,05.

Таблица 2.1 Исходные данные

у

х1

х2

х3

136

95

74

71

126

87

76

66

115

94

75

67

113

93

77

58

124

72

64

50

124

90

77

68

109

93

74

70

138

95

64

60

122

96

66

60

128

92

71

71

124

85

74

38

140

88

81

66

146

87

68

55

144

109

74

86

148

92

78

69

117

85

58

58

114

90

74

67

113

78

66

51

123

84

71

52

122

95

73

66

134

87

72

73

130

89

77

58

139

87

81

62

149

92

87

74

125

101

81

75

130

76

56

45

124

105

82

66

126

93

73

72

121

94

70

69

123

98

73

75

117

82

65

60

120

91

73

60

120

80

65

51

128

100

76

68

118

87

65

62

125

93

66

49

114

91

78

49

118

99

74

65

120

90

76

55

122

87

64

65

123

97

69

74

116

96

77

67

128

85

76

78

136

88

71

69

1. Построим корреляционную матрицу, используя пакет Excel

у

х1

х2

х3

у

1

х1

0,11

1

х2

0,25

0,49

1

х3

0,21

0,55

0,3

1

Рисунок 2.1 Корреляционна матрица

Из корреляционной матрицы следует, что наблюдается коллинеарность между факторами x2 и x1 . Исключаем x1 так как он имеет наименьшую тесноту связи с y. Следовательно будем строить уравнение регрессии y(х), зависящее от факторов x2 и x3.

2. Построим линейное уравнение регрессии.

Для построения уравнения линейной регрессии используем функцию «Сервис. Анализ данных. Регрессия.

Регрессионная статистика

Множественный R

0,287678553

R-квадрат

0,08275895

Нормированный R-квадрат

0,039080805

Стандартная ошибка

9,639145252

Наблюдения

45

Рисунок 2.2 Регрессионная статистика

Дисперсионный анализ

df

SS

MS

F

Значимость F

Регрессия

2

352,093354

176,0466772

1,8947451

0,162987066

Остаток

42

3902,35109

92,91312119

Итого

44

4254,44444

Коэффициенты

Стандартная ошибка

t-статистика

P-Значение

Y-пересечение

94,43

16,87

5,60

0,000002

Переменная X 1

0,32

0,24

1,32

0,19

Переменная X 2

0,14

0,15

0,93

0,36

Рисунок 2.3 Дисперсионный анализ

Отсюда уравнение линейной регрессии имеет вид:

3. Коэффициент множественной регрессии равен 0,08.

4. Для проверки уровня значимости уравнения при уровне значимости 0,05 необходимо использовать F-критерия Фишера. Фактическое значение критерия .

Для определения табличных значений используем встроенную функцию MS Excel «FРАСПОБР», задавая параметры б = 0,05, k1 = 2, k2 = 45 - 2 - 1 = 42.

В результате получаем . Так как то отсюда следует, что уравнение регрессии при уровне значимости 0,05 незначимо.

5.Построим частные уравнения регрессии. Чтобы построить частные уравнения регрессии, предварительно определим средние значения переменных:

125,9, 72,5, 62,8

С учетом средних значений построим частные уравнения регрессии:

, (2.3)

6.Определить средние частные коэффициенты эластичности.

,

Средний коэффициент эластичности характеризует на сколько процентов изменится результативная переменная y(х) относительно своего среднего уровня при изменении х на 1%. В нашем случае если факторная переменная x2 изменится на 1% относительно своего среднего уровня, то результат- на 18%,а если измениться x3 измениться на 1% -то на 7%.

7.Построим уравнение линейной регрессии в стандартизированном масштабе. Его коэффициенты связанны с коэффициентами обычного уравнения регрессии соотношениями:

(2.4)

Определим среднеквадратические отклонения используя функцию MS Excel «Стандотклонп»:

,,

Следовательно

и уравнение линейной регрессии в стандартизированном масштабе имеет вид

(2.5)

8.Оценим информативность факторов на основе уравнения линейной регрессии в стандартизированном масштабе. Так как , то делаем вывод что факторы не одинаково информативны и так как то можно предположить что большее влияние оказывает фактор .

9. Для вычисления частных коэффициентов корреляции воспользуемся рекуррентными формулами

(2.6)

(2.7)

Отсюда0,15

10. Оценить значимость частных коэффициентов корреляции при уровне значимости 0,05. Для оценки значимости вычислим фактические значения частного F-критерия Фишера

0,02

Для определения табличных значений используем MS Excel «FРАСПОБР», задавая параметры , , . В результате получаем 3,219942293. Откуда следует, что частные коэффициенты корреляции незначимы.

11. Оценим информативность факторов на основе частных коэффициентов корреляции. Так как оба коэффициента незначимы, то оба фактора неинформативны и могут быть не включены в уравнение регрессии.

Построить уравнение регрессии с учетом только информативных факторов.

x1.

Проверить гипотезу о гомоскедастичности ряда остатков с уровнем значимости 0,05. Для проверки гипотезы о гомоскедастичности ряда остатков используем тест Гольфрельда-Квандта.

Упорядочим выборку по переменной затем построим регрессию для первых 11 наблюдений и для последних 11 наблюдений. Для каждой найдем ; 14,2, 198,7

Найдем статистику :

2,27

Так как то гипотеза о гомоскедастичности отвергается. Следовательно переменная негомоскедастична.

Проверим переменную на гомоскедастичность. Упорядочим выборку по переменной затем построим регрессию для первых 11 наблюдений и для последних 11 наблюдений. Для каждой найдем

16,3,

Найдем статистику :

, 2,27

Так как то гипотеза о гомоскедастичности отвергается. Следовательно переменная негомоскедастична.

В результате проверки гипотезы на гомоскадастичность, можно сделать вывод что модель негомоскедастична.

3. Временной ряд

Имеются условные данные об объемах потребления электроэнергии (уt) жителями региона за 16 кварталов. Данные представлены в таблице 4.1. Требуется:

1. Построить график данного временного ряда и сделать вывод о наличии и периодичности сезонных колебаний.

2. Построить мультипликативную модель временного ряда.

3. Оцените качество модели через показатели средней абсолютной ошибки и среднего относительного отклонения.

4. Сделать прогноз на 2 квартала вперед.

Таблица 3.1 Данные

t

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

Yt

5,8

4,5

5,1

9,1

7

5

6

10,1

7,9

5,5

6,3

10,8

9

6,5

7

11,1

1. Построим график данного временного ряда. Он представлен

Рисунок 3.1 График временного ряда

Из графика видно, что значения объемов потребления электроэнергии имеют ярко выраженную сезонность периодичностью в 4 квартала.

2. Построим аддитивную модель временного ряда.

Общий вид аддитивной модели следующий:

T+S+E=Y,

- тренд, - сезонная компонента, .- случайная составляющая.

Процесс построения аддитивной модели включает в себя следующие шаги:

1)Выравнивание исходного ряда методом скользящей средней

2)Расчет значений сезонной компоненты S

3)Устранение сезонной компоненты из исходных уровней ряда и получение выровненных данных (T + E) в аддитивной модели.

4)Аналитическое выравнивание уровней (T + E) и расчет значений T с использованием полученного уравнения тренда.

5)Расчет полученных по модели значений (T + E)

6)Расчет абсолютных и/или относительных ошибок. Если полученные значения ошибок не содержат автокорреляции, ими можно заменить исходные уровни ряда и в дальнейшем использовать временной ряд ошибок E для анализа взаимосвязи исходного ряда и других временных рядов.

Проведем выравнивание исходных уровней ряда методом скользящей средней. Проведем оценку сезонной компоненты.

Таблица 3.2 Оценка сезонная компонента

№ квартала,

Объем потребления электроэне ргии,

Итого за четыре квартала

Скользящая средняя за четыре квартала

Центрированная скользящая средняя

Оценка сезонной компоненты

1

2

3

4

5

6

1

5,8

-

-

-

-

2

4,5

24,5

6,125

--

--

3

5,1

25,7

6,425

6,275

-1,175

4

9,1

26,2

6,55

6,4875

2,6125

5

7

27,1

6,775

6,6625

0,3375

6

5

28,1

7,025

6,9

-1,9

7

6

29

7,25

7,1375

-1,1375

8

10,1

29,5

7,375

7,3125

2,7875

9

7,9

29,8

7,45

7,4125

0,4875

10

5,5

30,5

7,625

7,5375

-2,0375

11

6,3

31,6

7,9

7,7625

-1,4625

12

10,8

32,6

8,15

8,025

2,775

13

9

33,3

8,325

8,2375

0,7625

14

6,5

33,6

8,4

8,3625

-1,8625

15

7

-

-

-

-

16

11,1

-

-

-

-

Рассчитаем значения сезонной компоненты.

Таблица 3.3 Скорректированная сезонная компонента

Показатели

№ квартала,

I

II

III

IV

-

-

-1,175

2,6125

0,3375

-1,9

-1,1375

2,7875

0,4875

-2,0375

-1,4625

2,775

0,7625

-1,8625

--

--

Всего за -й квартал

1,5875

-5,8

-3,775

8,175

Средняя оценка сезонной компоненты для -го квартала,

0,529167

-1,93333

-1,25833

2,725

Скорректированная сезонная компонента,

0,5135

-1,9489

-1,2739

2,7093

В моделях с сезонной компонентой обычно предполагается, что сезонные воздействия за период взаимопогашаются. В аддитивной модели это выражается в том, что сумма значений сезонной компоненты по всем кварталам должна быть равна нулю.

Для данной модели имеем:

0,529-1,93-1,26+2,725=0,0625

Корректирующий коэффициент: k=0,0625/4=0,0156

Рассчитываем скорректированные значения сезонной компоненты () и заносим данные в табл. 4.3.

Исключим влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим величины (гр. 4 табл. 4.4). Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту.

3) Исключим влияние сезонной компоненты, вычитая ее значение из каждого уровня исходного временного ряда. Получим величины (гр. 4 табл. 4.7). Эти значения рассчитываются за каждый момент времени и содержат только тенденцию и случайную компоненту.

4) Определим компоненту данной модели.

Для этого проведем аналитическое выравнивание ряда () с помощью линейного тренда. Результаты аналитического выравнивания следующие: 0,1865*t+5,7081

Подставляя в это уравнение значения , найдем уровни для каждого момента времени (табл. 4.4).

Таблица 3.4 Величины, содержащие тенденцию и случайную компоненту

1

2

3

4

5

6

7

8

1

5,8

0,5135

5,2865

5,8946

6,4081

-0,6081

0,369786

2

4,5

-1,9489

6,4489

6,0811

4,1322

0,3678

0,135277

3

5,1

-1,2739

6,3739

6,2676

4,9937

0,1063

0,0113

4

9,1

2,7093

6,3907

6,4541

9,1634

-0,0634

0,00402

5

7

0,5135

6,4865

6,6406

7,1541

-0,1541

0,023747

6

5

-1,9489

6,9489

6,8271

4,8782

0,1218

0,014835

7

6

-1,2739

7,2739

7,0136

5,7397

0,2603

0,067756

8

10,1

2,7093

7,3907

7,2001

9,9094

0,1906

0,036328

9

7,9

0,5135

7,3865

7,3866

7,9001

-0,0001

1E-08

10

5,5

-1,9489

7,4489

7,5731

5,6242

-0,1242

0,015426

11

6,3

-1,2739

7,5739

7,7596

6,4857

-0,1857

0,034484

12

10,8

2,7093

8,0907

7,9461

10,6554

0,1446

0,020909

13

9

0,5135

8,4865

8,1326

8,6461

0,3539

0,125245

14

6,5

-1,9489

8,4489

8,3191

6,3702

0,1298

0,016848

15

7

-1,2739

8,2739

8,5056

7,2317

-0,2317

0,053685

16

11,1

2,7093

8,3907

8,6921

11,4014

-0,3014

0,090842

5) Найдем значения уровней ряда, полученные по аддитивной модели. Для этого прибавим к уровням значения сезонной компоненты для соответствующих кварталов ( табл. 4.4).

На одном графике отложим фактические значения уровней временного ряда и теоретические, полученные по аддитивной модели.

Рисунок 3.2 Фактические и теоретические значения уровней ряда

Для оценки качества построенной модели применим сумму квадратов полученных абсолютных ошибок.

R2=0,98, отсюда можно говорить о том, что аддитивная модель объясняет 97% общей вариации уровней временного ряда количества правонарушений по кварталам за 4 года.

6) Прогнозирование по аддитивной модели. Предположим, что по нашему примеру необходимо дать прогноз об общем потребления электроэнергии на 2 квартала вперед. Прогнозное значение уровня временного ряда в аддитивной модели есть сумма трендовой и сезонной компонент. Для определения трендовой компоненты воспользуемся уравнением тренда =0,1865*t+5,7081

Получим

T17=0,1865*17+5,7081= 8,8786;

T18=0,1865*18+5,7081= 9,0651;

Значения сезонных компонент за соответствующие кварталы равны: S1=0,5135 и S2=-1,9489.

Таким образом,

F17=T17+S17=8,8786+0,5135=9,3921;

F18=T18+S18=9,0651-1,9489=7,1162;

Т.е. в следующие первые два квартала следует ожидать объемы потребление электроэнергии порядка 9,3921 и 7,1162 соответственно.

Т.е. в первые два квартала 2003 г. следовало ожидать порядка 395 и 422 правонарушений соответственно.

Размещено на Allbest.ru

...

Подобные документы

  • Сущность построения, особенности применения и теоретическое обоснование алгоритмов приближенного решения математических задач. Основы численного метода, нахождение интерполяционного полинома методом Лагранжа. Руководство программиста и пользователя.

    курсовая работа [527,6 K], добавлен 16.08.2012

  • Создание макроса на языке Statistica Visual Basic (SVB) для проверки гипотезы о нормальности остатков множественной регрессии. Возможности программирования на языке SVB в пакете STATISTICA. Проверка гипотезы в модели вторичного рынка жилья в г. Минске.

    курсовая работа [573,1 K], добавлен 02.10.2009

  • Создание программы, вычисляющей значение функции, заданной таблично при помощи интерполяционного полинома Лагранжа на языке Pascal с комментариями. Диалоговое взаимодействие пользователя с программой, модули для ввода и вывода данных и основных действий.

    курсовая работа [49,2 K], добавлен 02.11.2011

  • Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели. Оценка параметров регрессии по методу наименьших квадратов. Нахождение определителей матриц. Применение инструмента Регрессия.

    контрольная работа [1,0 M], добавлен 13.01.2013

  • Разработка программы построения графика экспериментальных точек и полинома регрессии второй степени в среде Turbo Pascal. Блок-схемы алгоритмов используемых процедур. Листинг программы. Составление вектора свободных членов и матрицы коэффициентов.

    курсовая работа [46,6 K], добавлен 24.11.2013

  • Построение интерполяционного полинома Ньютона по значениям функции в узлах согласно методу Лагранжа. Составление алгоритмов решения задачи, их реализация на программном уровне на языке Turbo Pascal. Представление результатов работы программы Polinom.

    курсовая работа [667,9 K], добавлен 01.10.2010

  • Возможности и синтаксис команд MATLAB, листинг программы и описание цикла. Порядок составления программы вычисления коэффициентов алгебраического интерполяционного многочлена и построения сплайн-функции, "склеенной" из кусков многочленов 3-го порядка.

    лабораторная работа [30,8 K], добавлен 04.07.2009

  • Алгоритмы кластеризации данных, отбора факторов, построения множественной линейной регрессии, оценки параметров процесса на скользящем постоянном интервале. Решение задач анализа данных на нейронных сетях и результаты моделирования нелинейных функций.

    контрольная работа [1,5 M], добавлен 11.01.2016

  • Интерполирование функций методом Лагранжа. Получение функциональной зависимости по экспериментальным данным. Близость интерполяционного многочлена к заданной функции. Интерполяционный полином в форме Лагранжа. Построение интерполяционных графиков.

    лабораторная работа [315,8 K], добавлен 24.05.2014

  • Методика разработки, практической апробации программы в среде Turbo Pascal по построению графика прямой линии регрессии. Формирование блок-схемы данной программы, ее листинг. Построение графика с помощью математических формул и графического модуля Graph.

    контрольная работа [46,2 K], добавлен 22.07.2011

  • Предварительный анализ заданного временного ряда на предмет наличия тренда. Обоснование наличия сезонности по графическому представлению одноименных элементов ряда разных лет. Применение модели для прогноза. Выбор типа остатков и корректировка модели.

    контрольная работа [218,8 K], добавлен 12.09.2011

  • Проверка работоспособности, оценка качества, надежности функционирования и определение статистических параметров вычислительных устройств. Особенности построения программной модели системы обработки информации, содержащей мультиплексный канал и ЭВМ.

    курсовая работа [1,1 M], добавлен 30.10.2013

  • Сложность построения модели "черный ящик" структуры OSI, описание входов и выходов. Графическое изображение модели структуры системы "OSI", уровни средств взаимодействия: физический, канальный, транспортный и сетевой, представительный и прикладной.

    курсовая работа [1,0 M], добавлен 11.01.2016

  • Алгоритмы построения изображений, близких к фотореалистичным. Трассировка лучей и построение теней. Схема расчета интенсивности света. Параметры, задающие свойства тел. Зависимость времени построения от глубины рекурсии и количества источников освещения.

    курсовая работа [734,3 K], добавлен 18.06.2009

  • Обнаружение грубых погрешностей. Проверка случайности и независимости результатов измерений в выборке. Приближенная проверка гипотезы о нормальном распределении экспериментальных данных. Проверка гипотезы о равенстве дисперсий и средних значений.

    курсовая работа [1,1 M], добавлен 01.07.2011

  • Особенности построения и функционирования информационных систем. Понятие, цель и задачи информационной логистики, информационные потоки и системы. Виды и принципы построения логистических информационных систем. Повышение качества логистического процесса.

    контрольная работа [25,4 K], добавлен 11.11.2010

  • Назначение, функции и структура электронных таблиц Microsoft Excel. Методика выполнения расчетов с использованием стандартных функций и построения диаграмм. Пример построения таблицы и диаграммы о размере выплат заработной платы сотрудникам предприятия.

    контрольная работа [1,5 M], добавлен 24.07.2010

  • Функциональные возможности библиотеки OpenGL. Разработка процедуры визуализации трехмерной сцены, интерфейса пользователя и подсистемы управления событиями с целью создания приложения для построения динамического изображения 3D-модели объекта "Самолет".

    курсовая работа [1,7 M], добавлен 28.06.2011

  • Способы получения случайных чисел в программировании и их использование для решения ряда задач. Принцип действия и тестирование работы генератора случайных чисел в Borland C++, его преимущества. Генерация одномерной и двумерной случайной величины.

    лабораторная работа [105,4 K], добавлен 06.07.2009

  • Выбор и обоснование методов составления схемы алгоритма и разработки программы для построения графика временной функции, работающей как в машинном, так и в реальном времени. Алгоритм Горнера. Программа на языке Quick BASIC (с распечаткой листинга).

    курсовая работа [55,1 K], добавлен 21.11.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.