Компьютерное моделирование экономических процессов

Рассмотрение особенностей приемов обработки экспериментальных статистических данных. Построение эконометрических моделей и их решение в среде Microsoft Excel. Основные правила осуществления эконометрического анализа исходной экономической задачи.

Рубрика Программирование, компьютеры и кибернетика
Вид методичка
Язык русский
Дата добавления 17.01.2016
Размер файла 869,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Компьютерный практикум

по дисциплине "Рынки ИКТ и организация продаж"

для студентов 4 курса направления подготовки "Бизнес-информатика"

Черпаков И.В.

Основные положения по выполнению лабораторных работ

Цель выполнения работ

Целью выполнения лабораторных работ является приобретение навыков использования основных приемов обработки экспериментальных статистических данных, построение эконометрических моделей и их решение в среде Microsoft Excel, осуществление эконометрического анализа исходной экономической задачи.

Руководство к выполнению лабораторной работы

Для выполнения лабораторной работы каждый студент обязан:

1. Повторить теоретический материал, относящийся к теме лабораторной работы.

2. Изучить технологию решения задач с помощью Excel, руководство к лабораторной работе, уяснить основную задачу занятия, методику и порядок ее выполнения.

3. По номеру своего варианта выбрать экономическую задачу и, согласно рассмотренным задачам, провести эконометрический анализ.

4. В процессе работы руководствоваться описанием лабораторной работы, строго придерживаясь рекомендованного порядка ее проведения.

5. После выполнения определенного объема работ, самостоятельно выполнить предложенное ему зачетное задание и сдать его в распечатанном виде с подробным эконометрическим анализом преподавателю.

Лабораторная работа 1. Линейная парная регрессия. Коэффициент корреляции. Коэффициент детерминации

Цель: научиться находить коэффициент корреляции и детерминации; находить коэффициенты регрессии, строить уравнение регрессии.

Основные сведения

Пусть переменные и заданы наблюдаемыми парами значений и соответственно, . Будем предполагать, что между переменными и существует линейная зависимость вида

Предположение о линейной зависимости можно сделать по виду корреляционного поля - графическому изображению на плоскости точек .

Коэффициенты и находятся из системы нормальных уравнений

Здесь

Из системы нормальных уравнений найдем

Коэффициент называется (выборочным) коэффициентом регрессии по . Коэффициент регрессии по показывает, на сколько единиц в среднем изменяется переменная при увеличении переменной на одну единицу.

Величина называется (выборочной) дисперсией . Аналогично, величина называется (выборочной) дисперсией .

Величины и называются среднеквадратическими отклонениями по и соответственно.

Величина называется коэффициентом корреляции. Она показывает, на сколько величин в среднем изменится величина , если увеличится на одно .

Коэффициент корреляции является показателем тесноты связи между переменными и . Свойства коэффициента корреляции:

1. . Чем ближе по модулю к единице, тем теснее связь.

2. Если , то связь между и является точной линейной функциональной зависимостью. Все точки лежат на линии регрессии.

3. При зависимость отсутствует. Линия регрессии параллельна оси .

4. Знаки и совпадают.

5. Если , то увеличение (уменьшение) значения ведет к увеличению (уменьшению) . Такую связь между переменными называют прямой.

6. Если , то увеличение (уменьшение) значения ведет к уменьшению (увеличению) . Такую связь между переменными называют обратной.

Кроме приведенной формулы для вычисления существуют и другие:

Для оценки тесноты связи на естественном языке можно воспользоваться шкалой Чеддока:

Связь

Слабая

Умеренная

Заметная

Высокая

Весьма высокая

Проверить значимость уравнения регрессии - значит установить, соответствует ли математическая модель, выражающая зависимость между переменными, экспериментальным данным и достаточно ли включенных в уравнение объясняющих переменных (одной или нескольких) для описания зависимой переменной. Значимость проверяется на основе дисперсионного анализа.

Введем обозначения:

, , .

Можно показать, что

Величина TSS (Total Sum of Squares) показывает разброс наблюдаемых значений от среднего и назывется общим отклонением.

Величина RSS (Regression Sum of Squares) показывает разброс расчетных значений от среднего и называется факторным или объяснкнным отклонением. Эта мера рассеяния расчетных значений , которая обусловлена включением в уравнение значений независимой переменной.

Величина ESS (Error Sum of Squares) называется остаточным отклонением. Оно не может быть объяснено корреляционной зависимостью между и и является результатом рассеяния, возникающего из-за случайных факторов.

Величина

называется коэффициентом детерминации. Она показывает, какая часть (доля) вариации зависимой переменной обусловлена вариацией объясняющей переменной. Остальная часть вариации зависимой переменной - влияние случайных (неучтенных) факторов.

Свойства коэффициента детерминации:

1. Значение находится в пределах . Чем ближе к единице, тем лучше регрессия аппроксимирует эмпирические данные, тем теснее наблюдения примыкают к линии регрессии.

2. Если , то эмпирические точки лежат на линии регрессии и между переменными и существует линейная функциональная зависимость.

3. Если , то вариация зависимой переменной полностью обусловлена воздействием неучтенных переменных, и линия регрессии параллельна оси абсцисс.

4. Для парной линейной регрессионной модели выполняется соотношение , где - коэффициент корреляции.

При практическом вычислении можно воспользоваться тем, что

Задание для выполнения

Исследуется зависимость количества проданных копий (тыс. шт. в год) от затрат на разработку ПО (тыс. долл. в год) по 12 однотипным проектам:

18

21

20

22

12

22

15

14

18

17

25

30

43

48

54

50

30

59

39

33

48

47

61

72

По данной выборке исследовать зависимость результата от фактора .

Порядок выполнения работы

Для выполнения задания необходимо:

1. Построить корреляционное поле и сделать предположение о наличии линейной связи.

2. Найти коэффициенты линейной парной регрессии

1) рассчитав по приведенным выше формулам;

2) используя встроенные функции MS Excel.

3. Указать смысл коэффициентов регрессии.

4. Построить график линии регрессии.

5. Найти коэффициент корреляции и указать его смысл.

6. Рассчитать величины , и .

7. Вычислить коэффициент детерминации и указать его смысл.

8. Проверить соотношение .

Пример выполнения лабораторной работы

Шаг 1. Создайте новую книгу MS Excel и сохраните в Вашей папке под именем Лабораторная работа 1-3.xlsx. Переименуйте лист "Лист 1" в "ЛинПарРег".

Шаг 2. На листе ЛинПарРег в диапазоне A1:F18 подготовьте исходные данные и структуру таблицы будущих вычислений:

Шаг 3. Постройте корреляционное поле (точечную диаграмму по данным диапазона B2:C13):

Вывод: по вытянутости корреляционного поля можно сделать вывод о наличии линейной связи между и .

Шаг 4. Заполните таблицу формулами:

Ячейка

Формула

Примечание

D2

=B2*C2

Скопировать в диапазон D3:D13

E2

=B2^2

Скопировать в диапазон E3:E13

F2

=C2^2

Скопировать в диапазон F3:F13

B14

=СРЗНАЧ(B2:B13)

Скопировать в диапазон C14:F14

B15

=СУММ(B2:B13)

Скопировать в диапазон C15:F15

A18

=E14-B14^2

Выборочная дисперсия по

B18

=F14-C14^2

Выборочная дисперсия по

C18

=КОРЕНЬ(A18)

Ср.-квадр. отклонение по

D18

=КОРЕНЬ(B18)

Ср.-квадр. отклонение по

E18

=(D14-B14*C14)/A18

Коэффициент

F18

=C14-E18*B14

Коэффициент

Шаг 5. Для диапазонов B14:F15 и A18:F18 установите формат ячеек Числовой с отображением трех знаков после запятой. Проверьте правильность вычислений:

Таким образом, уравнение регрессии имеет вид

.

Коэффициент показывает, что если затраты на разработку проекта увеличить на 1 тыс. долл. в год, то количество проданных копий в среднем увеличится на тыс. шт. в год.

Значение коэффициента можно интерпретировать как значение функции при , т.е. когда затраты затраты на разработку проекта не производятся. Таким образом, этот коэффициент показывает, что, если затраты затраты на разработку проекта отсутствуют, то будет реализовано в среднем будет тыс. копий программного продукта в год.

Шаг 6. Рассчитайте коэффициенты регрессии, используя встроенные функции MS Excel. Для этого сформируйте в диапазоне A20:B22 таблицу для вычислений:

Для вычисления и воспользуйтесь встроенными функциями НАКЛОН и ОТРЕЗОК соответственно (группа функций Статистические). Их синтаксис:

=НАКЛОН (массив_y;массив_x),

=ОТРЕЗОК(массив_y;массив_x),

где массив_y - диапазон значений объясняемой переменной, массив_x - диапазон значений факторной переменной.

Ячейка

Формула

Примечание

A22

=НАКЛОН(C2:C13;B2:B13)

Коэффициент

B22

=ОТРЕЗОК(C2:C13;B2:B13)

Коэффициент

Для диапазона A22:B22 установите формат ячеек Числовой с отображением трех знаков после запятой. Значения рассчитанные "вручную" и с помощью встроенных функций, совпадают.

Шаг 7. Постройте линию регрессии. Для этого на построенной точечной диаграмме выделите график функции, щелкнув по нему левой кнопкой мыши. Выделение обозначается светлыми маркерами на функции. Нажав правую кнопку мыши, вызовите контекстное меню, в котором выберите опцию Добавить линию тренда.

Шаг 8. В окне Формат линии тренда на вкладке Параметры линии тренда выберите тип линии Линейная. Включите опцию Показывать уравнение на диаграмме. В результате на диаграмме появится вид теоретической кривой - тренда и ее уравнение. Добавьте также подписи к осям диаграммы.

Шаг 9. Рассчитайте коэффициент корреляции "вручную" и с использованием встроенных функций MS Excel. Для этого сформируйте в диапазоне C20:D22 таблицу для вычислений:

Ячейка

Формула

Примечание

C22

=E18*C18/D18

"Ручной" способ

D22

=КОРРЕЛ(B2:B13;C2:C13)

Встроенная функция

Для диапазона C22:D22 установите формат ячеек Числовой с отображением трех знаков после запятой. Значения рассчитанные "вручную" и с помощью встроенных функций, совпадают.

Коэффициент корреляции показывает, что связь между величинами является прямой и весьма высокой.

Шаг 10. Вычислите коэффициент детерминации. Для этого в диапазоне G1:J16 сформируйте структуру таблицы для вычислений.(для заполнения ячеек G1:J1 воспользуйтесь встроенным редактором формул Microsoft Equation):

Шаг 11. Заполните таблицу формулами:

Ячейка

Формула

Примечание

G2

=$F$18+B2*$E$18

Значения функции регрессии.

Скопировать в ячейки G3:G13

H2

=C2-$C$14

Скопировать в ячейки H3:H13

I2

=G2-$C$14

Скопировать в ячейки I3:I13

J2

=C2-G2

Скопировать в ячейки J3:J13

H14

=СУММКВ(H2:H13)

Значение TSS

H15

=СУММКВ(I2:I13)

Значение RSS

H16

=СУММКВ(J2:J13)

Значение ESS

H17

=H15/H14

Коэффициент детерминации

Коэффициент детерминации . Это означает, что для данной выборки значение количества реализованных копий программного продукта (зависимой переменной) на определяется затратами на разработку проекта (объясняющей переменной). Остальные - влияние случайных факторов.

Для диапазонов G2:J13 и H14:H18 установите формат ячеек Числовой с отображением трех знаков после запятой.

Шаг 12. Для проверки соотношения в ячейку H18 введите формулу =C22^2. Значения и совпадают.

Итоговая таблица с вычислениями имеет вид:

Индивидуальные задания к лабораторной работе №1

По организациям ИТ-индустрии получена информация, характеризующая зависимость количества положительных отзывов о программном продукте от (, тыс.шт.) от объема продаж продукта (, тыс.шт.):

По заданной выборке исследовать зависимость результата от фактора . Для этого:

1. Построить корреляционное поле и сделать предположение о наличии линейной связи.

2. Найти коэффициенты линейной парной регрессии

1) рассчитав по приведенным выше формулам;

2) используя встроенные функции MS Excel.

3. Указать смысл коэффициентов регрессии.

4. Построить график линии регрессии.

5. Найти коэффициент корреляции и указать его смысл.

6. Рассчитать величины , и .

7. Вычислить коэффициент детерминации и указать его смысл.

8. Проверить соотношение .

Отчет по выполнению лабораторной работы №1

Отчет по выполнению лабораторной работы №1 должен включать следующие элементы и ответы на вопросы:

1. Корреляционное поле вместе с построенным линейным трендом.

2. Итоговую таблицу с вычислениями в виде скриншота листа MS Excel.

3. Записанное в виде уравнение линейной парной регрессии с пояснением смысла его параметров.

4. Укажите, что является показателем тесноты связи в парной линейной регрессии?

5. Каково значение коэффициента корреляции? Укажите направление и тип связи между и .

6. Укажите, чему равен коэффициент детерминации и поясните его смысл.

Лабораторная работа №2. Проверка качества модели линейной парной регрессии

Цель: научиться осуществлять проверку статистической значимости коэффициентов уравнения регрессии, проверку общего качества уравнения регрессии, проверку точности модели.

Основные сведения

Пусть - случайная величина, с помощью которой судят о значениях некоторого параметра .

Функцию результатов наблюдения над называют статистикой случайной величины .

Значение функции , найденное по выборке и зависящее от объема выборки , называется точечной оценкой параметра .

Интервальной называют оценку, которая определяется двумя числами - концами интервала, в пределах которого оценка заключена. Обычно в качестве подобного интервала рассматривают интервал или

где - точечная оценка, - некоторое малое положительное число.

Методы статистики не позволяют категорически утверждать, что оценка удовлетворяет указанному неравенству, а позволяет говорить только о вероятности , с которой это неравенство может осуществиться.

Надежностью (доверительной вероятностью) называется вероятность , c которой осуществляется указанное выше неравенство. Интервал называется доверительным.

Надежность обычно задается наперед и принимает значение, близкое к , например, . Часто выражают как , величина называется уровнем значимости и представляет собой вероятность, противоположную к .

Статистическая значимость результата представляет собой оцененную меру уверенности в том, что выборка репрезентативна.

Репрезентативность - это способность выборки представлять изучаемую совокупность. Чем точнее состав выборки представляет совокупность по изучаемым вопросам, тем выше ее репрезентативность.

Для характеристики статистической значимости вводится понятие уровня статистической значимости . Он представляет собой вероятность ошибки, связанной с распространением наблюдаемого результата на всю генеральную совокупность.

Обычно уровень является приемлемой границей статистической значимости. Результаты, значимые на уровне , обычно рассматриваются как статистически значимые, а результаты с уровнем или - как высоко значимые.

Статистической гипотезой называется любое предположение о виде или параметре неизвестного закона распределения.

Проверяемую гипотезу обычно называют нулевой и обозначают . Наряду с нулевой гипотезой рассматривают альтернативную, или конкурирующую, гипотезу , являющуюся логическим отрицанием . Нулевая и альтернативная гипотезы представляют собой две возможности выбора, осуществляемого в задачах проверки статистических гипотез.

Суть проверки (тестирования) статистической гипотезы заключается в том, что используется специально составленная выборочная характеристика (статистика) точное или приближенное распределение которой известно. Затем по этому выборочному распределению определяется критическое значение - такое, что если гипотеза верна, то вероятность событие можно (с некоторым риском) считать практически невозможным.

Если в данном конкретном случае проверки выполняется , то гипотеза не принимается, иначе не отвергается.

Для критических значений указанных статистик составлены таблицы. Значения статистик связаны с уровнем значимости (надежностью ) и числом степеней свободы.

I. Проверка статистической значимости коэффициентов линейной парной регрессии. Интервальная оценка для дисперсии возмущений

Воздействие неучтенных факторов и ошибок определяется с помощью дисперсии возмущений . Известно, что несмещенной оценкой этой дисперсии является (выборочная) остаточная дисперсия

Проверим статистическую значимость коэффициентов и . Проверка значимости первого коэффициента означает проверку наличия линейной связи между и .

Сформулируем две гипотезы:

Можно показать, что гипотеза не принимается, если

где - стандартная ошибка коэффициента .

Определение 1 Стандартная ошибка - это стандартное отклонение оценок, которые будут получены при многократной случайной выборке данного объема из одной и той же генеральной совокупности.

Стандартная ошибка является убывающей функцией от объема выборки: чем меньше стандартная ошибка, тем более достоверной является оценка. Является показателем надежности расчетного параметра.

Можно показать, что вычисляется по формуле

где - остаточная дисперсия.

Значение соответствует табличному значению распределения Стьюдента на уровне значимости с степенями свободы.

Если расчетное значение будет меньше табличного , то нулевая гипотеза принимается (), что означает отсутствие связи между и .

Если расчетное значение будет больше табличного , то нулевая гипотеза отклоняется () и коэффициент признается статистически значимым на выбранном -уровне. В этом случае для этого коэффициента можно построить доверительный интервал

где - математическое ожидание параметра .

По аналогии для cформулируем две гипотезы:

Можно показать, что гипотеза не принимается, если

где - стандартная ошибка коэффициента , вычисляемая по формуле

Доверительным интервалом будет

где - математическое ожидание параметра .

Интервальная оценка для дисперсии возмущений имеет вид

где и - табличные значения критерия Пирсона с степенями свободы.

II. Проверка общего качества регрессионной модели

Пусть - число оцениваемых параметров уравнения регрессии, - число наблюдений. Уравнение регрессии значимо на уровне , если выполняется условие

где - табличное значение критерия Фишера при уровне значимости при и степенях свободы.

Величина , называемая также -критерием, показывает, в какой мере регрессия лучше оценивает значение зависимой переменной по сравнению с ее средней.

В случае линейной парной регрессии и критерий примет вид

III. Проверка значимости коэффициентов корреляции и детерминации

Коэффициент корреляции значим на уровне , если

где - статистика, имеющая распределение Стьюдента с степенями свободы при уровне значимости . Здесь - статистическая ошибка для .

Для коэффициента корреляции может быть построен доверительный интервал:

где - математическое ожидание для .

Чем шире интервал, тем больше неопределенность в оценке связи между и .

Критерий значимости коэффициента детерминации можно записать в следующем виде:

где - табличное значение критерия Фишера при уровне значимости при и степенях свободы.

IV. Оценка точности модели

Наблюдаемые значения зависимой переменной отличаются от рассчитанных по уравнению регрессии на величину отклонения . Чтобы отклонения можно было сравнить между собой, рассматривают относительные величины отклонений , выраженные в процентах, т.е.

Для модели вцелом рассчитывают среднюю относительную ошибку

Если средняя относительная ошибка составляет менее , это свидетельствует о хорошей точности модели. Считается, что при средней ошибке более , выбранный тип линии регрессии является, скорее всего, неподходящим.

Задание для выполнения

Используя данные к лабораторной работе №1, найти уравнение линейной регрессии и проверить качество модели для уровней значимости и .

Порядок выполнения работы

Для решения поставленной задачи необходимо:

1. Проверить статистическую значимость коэффициента .

а. Вычислить выборочную остаточную дисперсию

б. Вычислить стандартную ошибку для этого коэффициента

в. Рассчитать фактическое значение статистики

г. Сравнить расчетное значение с табличным и сделать вывод о значимости. Если расчетное значение будет меньше табличного , то коэффициент незначим, иначе значим.

д. Если коэффициет значим, то построить доверительный интервал

2. Проверить статистическую значимость коэффициента .

а. Вычислить стандартную ошибку для этого коэффициента

б. Рассчитать фактическое значение статистики

в. Сравнить расчетное значение с табличным и сделать вывод о значимости. Если расчетное значение будет меньше табличного , то коэффициент незначим, иначе значим.

г. Если коэффициет значим, то построить доверительный интервал

3. Дать интервальную оценку для дисперсии возмущений .

а. Найти табличные значение критерия Пирсона.

б. Построить интервал

.

в. Указать границы среднеквадратического отклонения

и указать его смысл.

4. Проверить общее качество регрессионной модели.

а. Найти значение -критерия

б. Сравнить расчетное и табличное значение -критерия и сделать вывод о значимости уравнения регрессии. Если , то уравнение значимо на выбранном уровне.

5. Проверить значимость коэффициента корреляции.

а. Рассчитать статистическую ошибку .

б. Сделать вывод о стватистической значимости коэффициента корреляции. Если то он значим, иначе незначим.

в. Если коэффициент значим, построить доверительный интервал

6. Проверить значимость коэффициента детерминации.

а. Найти значение

б. Сделать вывод о стватистической значимости коэффициента детерминации. Если , то он значим, иначе незначим.

7. Сделать оценку точности модели.

а. Рассчитать среднюю относительную ошибку

б. Сделать вывод о точности построенной модели.

Пример выполнения лабораторной работы

Шаг 1. Откройте книгу Лабораторная работа 1-3.xlsx. Переименуйте лист "Лист 2" в "Качество ЛинПарРег (0,05)". Скопируйте ячейки A1:C13 с листа "ЛинПарРег" в диапазон A1:C13 на листе "Качество ЛинПарРег (0,05)".

Шаг 2. Перейдите на лист "Качество ЛинПарРег (0,05)". В диапазоне A15:B21 создайте структуру таблицы для вспомогательных данных:

Шаг 3. Заполните ячейки вспомогательными данными:

Ячейка

Формула

Примечание

B16

0,05

Уровень значимости

B17

12

Число наблюдений

B18

=НАКЛОН(C2:C13;B2:B13)

Коэффициент

B19

=ОТРЕЗОК(C2:C13;B2:B13)

Коэффициент

B20

=СРЗНАЧ(B2:B13)

Среднее по

B21

=СРЗНАЧ(C2:C13)

Среднее по

Проверка статистической значимости коэффициентов линейной парной регрессии. Интервальная оценка для дисперсии возмущений

Шаг 4. В ячейки D1:F1 и C14 введите наименования для дополнительных вычислений:

Ячейка

D1

E1

F1

C14

Наименование

Сумма

Произведите дополнительные вычисления

Ячейка

Формула

Примечание

D2

=$B$19+$B$18*B2

Скопировать в ячейки D3:D13

E2

=(D2-C2)^2

Скопировать в ячейки E3:E13

F2

=(B2-$B$20)^2

Скопировать в ячейки F3:F13

D14

=СУММ(D2:D13)

Скопировать в ячейки E14:F14

Для диапазонов D2:F14 и B18:B21 установите формат ячеек Числовой с отображением трех знаков после запятой.

Шаг 5. В диапазоне A23:D30 создайте структуру таблицы для определения значимости коэффициента :

Произведите вычисления. Для расчета табличного значения t-статистики воспользуйтесь функцией СТЬЮДРАСПОБР (для ранних версий MS Excel) либо СТЬЮДЕНТ.ОБР.2Х (для поздних). Ее синтаксис

=СТЬЮДЕНТ.ОБР.2Х(ур_знач;степ_своб),

где ур_знач - уровень значимости (в нашем случае 0,05); степ_своб - число степеней свободы, определяемое как , где - число наблюдений.

Ячейка

Формула

Примечание

D24

=E14/(B17-2)

Остаточная дисперсия

D25

=КОРЕНЬ(D24/F14)

Стандартная ошибка для

D26

=ABS(B18)/D25

Расчетная

t-статистика

D27

=СТЬЮДЕНТ.ОБР.2Х(B16;B17-2)

Табличная

t-статистика

D28

=ЕСЛИ(D26>D27;"Значим";"Незначим")

Автоматическое получение вывода о значимости

D29

=ЕСЛИ(D28="Значим";B18-D27*D25;"-")

Автоматическое получение границы

D30

=ЕСЛИ(D28="Значим";B18+D27*D25;"-")

Автоматическое получение границы

Шаг 6. Проверьте правильность вычислений:

Выводы:

1. Коэффициент является статистически значимым на выбранном уровне . Это означает, что с надежностью, т.е. , значение коэффициента отражает реальную связь между количеством реализованных копий и затратами на разработку проекта. Оставшиеся представляют вероятность того, что найденная зависимость является лишь случайной особенностью данной выборки.

2. Доверительным интервалом для будет . Это означает, что при увеличении затрат разработку проекта на 1 тыс. долл. с вероятностью увеличение количества проданных копийв среднем составит от до тыс. шт. в год.

Шаг 7. Аналогично проверьте значимость коэффициента . Введите в ячейку G1 наименование столбца с дополнительными вычислениями: .

Произведите дополнительные вычисления:

Ячейка

Формула

Примечание

G2

=B2^2

Скопируйте в ячейки G2:G13

G14

=СУММ(G2:G13)

Шаг 8. В диапазоне A32:D38 создайте структуру таблицы для определения значимости коэффициента :

Произведите вычисления:

Ячейка

Формула

Примечание

D33

=D25*КОРЕНЬ(G14/B17)

Стандартная ошибка для

D34

=ABS(B19)/D33

Расчетная t-статистика

D35

=СТЬЮДЕНТ.ОБР.2Х(B16;B17-2)

Табличная t-статистика

D36

=ЕСЛИ(D34>D35;"Значим";"Незначим")

Автоматическое получение вывода о значимости

D37

=ЕСЛИ(D36="Значим";B19-D35*D33;"-")

Автоматическое получение границы

D38

=ЕСЛИ(D36="Значим";B19+D35*D33;"-")

Автоматическое получение границы

Шаг 9. Проверьте правильность вычислений:

Вывод: коэффициент незначим, т.е. нельзя утверждать с надежностью , что при отсутствии затрат на проект среднее количество проданных копий составит тыс. шт. в год.

Шаг 10. В диапазоне A40:D46 создайте структуру таблицы для оценки дисперсии возмущений:

Для получения табличных значений -критерия Пирсона воспользуемся функциями ХИ2ОБР (для ранних версий MS Excel) или ХИ2.ОБР.ПХ (для поздних). Синтаксис:

эконометрический статистический excel

=ХИ2ОБР(вероятность;степени_свободы),

=ХИ2.ОБР.ПХ(вероятность;степени_свободы),

где вероятность - вероятность, связанная с распределением , степени_свободы - количество степеней свободы .

Произведите вычисления:

Ячейка

Формула

Примечание

D41

=ХИ2.ОБР.ПХ(B16/2;B17-2)

D42

=ХИ2.ОБР.ПХ(1-B16/2;B17-2)

D43

=B17*D24/D41

Нижняя граница

D44

=B17*D24/D42

Верхняя граница

D45

=КОРЕНЬ(D43)

Нижняя граница

D46

=КОРЕНЬ(D44)

Верхняя граница

Для диапазона D41:F46 установите формат ячеек Числовой с отображением трех знаков после запятой.

Шаг 11. Проверьте правильность вычислений:

Вывод: Интервал изменений среднеквадратического отклонения составляет . Это означает, что с -й вероятностью отклонение значений количества проданных копий от среднего значения количества проданных копий будет изменяться от до .

Проверка общего качества регрессионной модели

Шаг 12. В ячейку H1 введите наименование столбца для расчета RSS: . В ячейкуH2 введите формулу

=(D2-СРЗНАЧ($C$2:$C$13))^2

и скопируйте ее в диапазон H3:H13.

В диапазоне F23:H27 создайте структуру таблицы для применения -критерия:

Для получения табличных значений F-критерия воспользуемся функциями FРАСПОБР (для ранних версий MS Excel) или F.ОБР.ПХ (для поздних версий). Их синтаксис:

=FРАСПОБР(ур_знач;k1;k2),

=F.ОБР.ПХ(ур_знач;k1;k2),

где ур_знач - уровень значимости , k1 - степень свободы ; k1 - степень свободы .

Произведите вычисления:

Ячейка

Формула

Примечание

H24

=E14

ESS

H25

=H14

RSS

H26

=H25*(B17-2)/H24

F-тест

H27

=F.ОБР.ПХ(B16;1;B17-2)

Критическое значение F

H28

=ЕСЛИ(H26>H27;"Значимо";"Незначимо")

Проверка значимости уравнения

Для диапазонов H2:H14 и H24:H27 установите формат ячеек Числовой с отображением трех знаков после запятой.

Проверьте правильность вычислений:

Вывод: уравнение регрессии значимо.

Проверка значимости коэффициентов корреляции и детерминации

Шаг 13. В диапазоне F32:H38 создайте структуру таблицы оценки значимости коэффициента корреляции:

Произведите вычисления:

Ячейка

Формула

Примечание

H33

=КОРРЕЛ(B2:B13;C2:C13)

Коэффициент корреляции

H34

=КОРЕНЬ((1-H33^2)/(B17-2))

Статистическая ошибка для

H35

=ABS(H33)/H34

Расчетная -статистика

H36

=СТЬЮДЕНТ.ОБР.2Х(B16;B17-2)

Табличная -статистика

H37

=ЕСЛИ(H35>H36;"Значимо";"Незначимо")

Автоматическая проверка значимости

H38

=ЕСЛИ(H37="Значимо";H33-H36*H34;"-")

Нижняя граница

H39

=ЕСЛИ(H37="Значимо";H33+H36*H34;"-")

Верхняя граница

Для диапазона H33:H39 установите формат ячеек Числовой с отображением трех знаков после запятой.

Проверьте правильность вычислений:

Вывод: коэффициент корреляции является значимым.

Шаг 14. В диапазоне F41:H44 создайте структуру таблицы оценки значимости коэффициента детерминации:

Произведите вычисления:

Ячейка

Формула

Примечание

H42

=H33^2*(B17-2)/(1-H33^2)

Расчетная -статистика

H43

=F.ОБР.ПХ(B16;1;B17-2)

Табличная -статистика

H44

=ЕСЛИ(H42>H43;"Значимо";"Незначимо")

Автоматическая проверка значимости

Для диапазона H42:H44 установите формат ячеек Числовой с отображением трех знаков после запятой.

Проверьте правильность вычислений:

Вывод: коэффициент детерминации является значимым.

Оценка точности модели

Шаг 15. В диапазоне I1:J14 создайте структуру таблицы вспомогательных вычислений для оценки точности. Ее заголовочная часть:

Произведите вычисления:

Ячейка

Формула

Примечание

I2

=ABS(C2-D2)

Скопировать в диапазон I3:I13

J2

=I2/D2*100%

Скопировать в диапазон J3:J13

Для диапазона I2:I13 установите формат ячеек Числовой с отображением трех знаков после запятой.

Для диапазона J2:J13 установите формат ячеек Процентный с отображением трех знаков после запятой.

Шаг 16. В диапазоне F16:G16 вычислите среднюю относительную ошибку: в ячейку G16 введите формулу

=СУММ(J2:J13)/B17.

Проверьте правильность вычислений

Вывод: Средняя относительная ошибка составляет , что свидетельствует о хорошей точности модели.

Шаг 17. Для расчетов значимости на уровне переименуйте лист "Лист 3" в "Качество ЛинПарРег (0,01)" и измените значение в ячейке B16 с на . Проверьте результаты:

Выводы (для ):

1. Коэффициент является статистически значимым на выбранном уровне . Это означает, что с надежностью, т.е. , значение коэффициента отражает реальную связь между количеством проданных копий и затратами на проект. Оставшийся представляет вероятность того, что найденная зависимость является лишь случайной особенностью данной выборки.

2. Доверительным интервалом для будет . Это означает, что при увеличении затрат на проект на 1 тыс. долл. с вероятностью увеличение количества проданных копий в среднем составит от до тыс. шт. в год.

3. Вывод: коэффициент незначим, т.е. нельзя утверждать с надежностью , что при отсутствии затрат на проект среднее количество проданных копий составит тыс. шт. в год.

4. Интервал изменений среднеквадратического отклонения составляет . Это означает, что с -й вероятностью отклонение значений количества проданных копий от среднего значения количества проданных копий будет изменяться от до .

5. Уравнение регрессии значимо.

6. Коэффициент корреляции является значимым.

7. Коэффициент детерминации является значимым.

Индивидуальные задания к лабораторной работе №2

Для своего варианта, используя данные к лабораторной работе №1, выполните оценку качества модели линейной парной регрессии на уровнях значимости и .

Отчет по выполнению лабораторной работы №2

Отчет по выполнению лабораторной работы №1 должен включать следующие элементы и ответы на вопросы:

1. Итоговую таблицу с вычислениями в виде скриншота листа MS Excel (в случае мелкого изображения разделите на несколько скриншотов). Привести для каждого уровня значимости.

2. Запишите уравнение линейной парной регрессии для своего варианта.

3. Как оценивается значимость параметров уравнения регрессии?

4. Являются ли коэффициенты уравнения регрессии для вашего варианта значимыми и почему? Ответить для каждого уровня значимости.

5. Запишите доверительные интервалы для коэффициентов уравнения регрессии и среднеквадратического отклонения для вашего варианта и, если возможно, укажите экономический смысл. Ответить для каждого уровня значимости.

6. Значимо ли уравнение регрессии для вашего варианта и почему? Ответить для каждого уровня значимости.

7. Каким образом осуществляется проверка качества уравнения регрессии?

8. Каким образом осуществляется проверка значимости коэффициента корреляции и детерминации? Значимы ли эти коэффициенты для вашего варианта. Ответить для каждого уровня значимости.

9. В чем смысл средней относительной ошибки и каково ее значение для вашего варианта?

Лабораторная работа №3. Использование линейной парной регрессии для прогнозирования

Цель: научиться вычислять доверительный интервал для функции регрессии, доверительный интервал для индивидуальных значений зависимой переменной.

Основные сведения

Пусть - значение функции регрессии при некотором . Величина являяется средней оценкой среднего значения в точке . Доверительный интервал, который с заданной надежностью накрывает неизвестное значение при некотором определяется как

где

- значение групповой средней для некоторого значения (прогнозное значение);

- статистика, имеющая распределение Стьюдента с степенями свободы при уровне значимости ;

- стандартная ошибка групповой средней (иногда называемой ошибкой прогноза), определяемая из соотношения

находится как

Величина составляет предельную ошибку прогшноза.

Точность прогноза можно оценить с помощью относительной ошибки прогноза

.

Если построить границы доверительных интервалов на графике, то они будут представлять собой гиперболы, расположенные по обе стороны от линии регрессии.

Наилучшие результаты прогноза будут в том случае, если , результат прогноза ухудшается при удалении от . Если же значение оказывается за пределами наблюдаемых значений , которые использовались при построении линейной регрессии, то результаты прогноза будут ухудшаться в зависимости удаления от области наблюдаемых значений .

Пусть ищется доверительный интервала для некоторого индивидуального значения , которое связано с некоторым . В несколько иной форме эта проблема может быть сформулирована так: при получении новой пары наблюдений выяснить, удовлетворяет ли она прежней зависимости, т.е. равняется ли значению , полученному подстановкой в уравнение модели.

Пусть . Сформулируем две гипотезы:

Можно показать, что оценочная дисперсии величины вычисляется по формуле

где

- значение групповой средней для некоторого значения ;

- статистика, имеющая распределение Стьюдента с степенями свободы при уровне значимости .

Статистика имеет -распределение Стьюдента с степенями свободы.

Гипотеза не принимается, если на выбранном уровне значение . В этом случае можно утверждать, что статистически значимо (существенно) отличается от значения и пара не соответствует рассматриваемой зависимости. В этом случае доверительный интервал для находится как

Задание для выполнения

Используя данные к лабораторной работе №1, выполните прогнозирование указанные элементы прогнозирования при уровнях надежности 80%, 90%, 95%. Индивидуальным значением считать :

Порядок выполнения работы

Используя данные к лабораторной работе №1 при :

1. Найти уравнение регрессии.

2. Рассчитать доверительный интервал прогноза при значениях уровня надежности 80%, 90%, 95%.

3. Найти относительную ошибку прогноза.

4. Построить графики линии регрессии с доверительными границами.

5. Найти доверительный интервал для индивидуального значения, связанного с .

Пример выполнения лабораторной работы

Шаг 1. Откройте книгу Лабораторная работа 1-3.xlsx. Создайте три новых листа с именами "Прогноз 80%", "Прогноз 90%", "Прогноз 95%". Скопируйте ячейки A1:C13 с листа "ЛинПарРег" в диапазон A1:C13 на листе "Прогноз 80%". Сделайте активным лист "Прогноз 80%". В ячейку B14 введите значение, для которого будем строить прогноз: 19. В ячейку D1 введите заголовок .

Шаг 2. В диапазоне A17:C25 создайте структуру таблицы вспомогательных вычислений:

Для вычисления величины без использования формулы можно воспользоваться встроенной функцией

=СТОШYX(массив_y;массив_x),

где массив_y - значения объясняемой переменной, массив_x - значения фактора.

Произведите вычисления:

Ячейка

Формула

Примечание

C18

=НАКЛОН(C2:C13;B2:B13)

Коэффициент

C19

=ОТРЕЗОК(C2:C13;B2:B13)

Коэффициент

C20

=СРЗНАЧ(B2:B13)

Среднее по

C21

=СТОШYX(C2:C13;B2:B13)

Стандартная ошибка регрессии

C22

0,8

Надежность

C23

0,2

Уровень значимости

C24

10

Число степеней свободы

C25

=СТЬЮДЕНТ.ОБР.2Х(C23;C24)

Табличная t-статистика

D2

=(B2-$C$20)^2

D14

=СУММ(D2:D13)

Для диапазона C18:C21 и ячейки С25 установите формат ячеек Числовой с отображением трех знаков после запятой.

Проверьте результаты вычислений:

Шаг 3. В диапазоне A27:C33 создайте структуру таблицы вычислений для прогноза:

Произведите вычисления:

Ячейка

Формула

Примечание

C28

=C21*КОРЕНЬ(1/12+(B14-C20)^2/D14)

Стандартная ошибка

C29

=C25*C28

Предельная ошибка

C30

=C19+B14*C18

Прогнозное значение

C31

=C30-C29

Нижняя граница доверительного интервала

C32

=C30+C29

Верхняя граница доверительного интервала

C33

=C29/ABS(C30)*100%

Относительная ошибка прогноза

Для диапазона C28:C32 установите формат ячеек Числовой с отображением трех знаков после запятой.

Для ячейки C33 установите формат ячеек Процентный с отображением трех знаков после запятой.

Проверьте правильность вычислений:

Шаг 4. Для визуализации доверительного интервала для функции регрессии рассчитайте нижнюю и верхнюю границу для всех наблюдаемых значений фактора. Для этого сформируйте в диапазоне E1:I1 наименования следующих столбцов:

Произведите вычисления:

Ячейка

Формула

Примечание

E2

=$C$21*КОРЕНЬ(1/12+(B2-$C$20)^2/$D$14)

Скопировать в ячейки E3:E13

F2

=$C$25*E2

Скопировать в ячейки F3:F13

G2

=$C$19+$C$18*B2

Скопировать в ячейки G3:G13

H2

=G2-F2

Скопировать в ячейки H3:H13

I2

=G2+F2

Скопировать в ячейки I3:I13

Для диапазона E2:I13 установите формат ячеек Числовой с отображением трех знаков после запятой.

В и тоге получим:

Шаг 5. Для визуализации постройте на одной диаграмме точечные графики диапазонов B2:C13, H2:H13, I2:I13. Для этого выделите указанные диапазоны (так как диапазоны несмежные, выделяйте с зажатой клавишей Ctrl), вставьте точечную диаграмму. Отформатируйте диаграмму следующим образом:

1. Для рядов H2:H13 и I2:I13 уберите маркеры, установите пунктирный тип линий.

2. Для точечного графика диапазона B2:C13 добавьте линию тренда.

3. Задайте названия для рядов данных: "Наблюдаемые данные" для диапазона B2:C13, "Нижняя граница" для диапазона H2:H13, "Верхняя граница" для диапазона I2:I13.

4. Добавьте еще один ряд данных. Укажите название "Прогноз", значения по X - ячейка B14, значения по Y - С30. Отформатируйте этот ряд, указав для него маркер какого-либо яркого цвета.

В результате диаграмма примет вид:

Из графика видно, что границы доверительных интервалов действительно представляют собой гиперболы, между которыми находится линия регрессии.

Выводы:

1. При имеем . Это означает, что при затратах на проект в размере 19 тыс. долл. в год среднее ожидаемое количество проданных копий (прогнозное значение) составит 47,518 тыс. шт.

2. Доверительный интервал для прогнозного значения при и надежности 0,8 составляет . Это означает, что при затратах на проект в размере 19 тыс. долл. в год с надежностью 80% средняя количество реализованных копий будет находиться в интервале от до тыс. шт. в год.

Шаг 6. Для формирования прогноза для индивидуального значения , связанного с , в диапазоне A36:C43 сформируйте структуру таблицы для вычислений:

Произведите вычисления:

Ячейка

Формула

Примечание

C37

45

Индивидуальное значение

C38

=C21*КОРЕНЬ(1+1/12+(B14-C20)^2/D14)

Оценочная дисперсия

C39

=C37-C30

z

C40

=ABS(C39)/C38

Расчетная t-статистика

C41

=ЕСЛИ(C40<C25;"Значимо";"Незначимо")

Автоматическое определение значимости

C42

=ЕСЛИ(C41="Значимо";C30-C25*C38;"-")

Нижняя граница

C43

=ЕСЛИ(C41="Значимо";C30+C25*C38;"-")

Верхняя граница

Для диапазонов C37:C40 и C42:C43 установите формат ячеек Числовой с отображением трех знаков после запятой.

Проверьте правильность вычислений:

Вывод: индивидуальное значение количества проданных копий в тыс. шт. при затратах на проект в 19 тыс. долл. в год возможно. С надежностью 80% количество проданных копий может варьироваться от 42,639 тыс. шт. в год до 52, 398 тыс. шт. в год.

Шаг 7. Чтобы получить расчеты для уровней надежности 90% и 95%, достаточно скопировать лист "Надежность 80%" на листы "Надежность 90%" и "Надежность 95%" и ввести на них в ячейки С22 и C23 значения 0,9 и 0,1 (для 90%) и 0,95 и 0,05 (для 95%). При этом диаграммы, полученные при таком копировании, следует удалить и построить заново на основе расчетов, полученных на новых листах.

Результаты:

Сравним относительные погрешности прогнозов при различных уровнях надежности

Уровень надежности

80%

90%

95%

Относительная погрешность

2,863%

3,781%

6,611%

Вывод: повышение уровня надежности с 80% до 95% снижает точность прогноза в 6,611/2,863?2,31 раза.

Индивидуальные задания к лабораторной работе №3

Для своего варианта, используя данные к лабораторной работе №1, рассчитайте доверительный интервал прогноза при значениях уровня надежности 80%, 90%, 95% при и для индивидуального значения .

Отчет по выполнению лабораторной работы №3

Отчет по выполнению лабораторной работы №3 должен включать следующие элементы и ответы на вопросы (для каждого уровня надежности):

1. Итоговые таблицы с вычислениями.

2. Графики предельных значений доверительных интервалов для каждого уровня надежности.

3. Чему равны прогнозируемые средние значения объема выпуска продукции при объеме капиталовложений ?

4. Приведите доверительные интервалы для прогнозируемых средних значений и укажите их экономический смысл.

5. Соответствует ли индивидуальное значение исследуемой зависимости? В случае положительного ответа приведите доверительный интервал и укажите его экономический смысл.

6. Как определяется точность прогноза? Как изменилась точность прогноза при повышении уровня надежность с 80 до 95%?

Размещено на Allbest.ru

...

Подобные документы

  • Функции Microsoft Excel - встроенные инструменты, которые применяются в формулах. Их виды и основы работы с ними. Организация обработки табличных данных при помощи статистических функций. Примеры решения различных задач при помощи электронных таблиц.

    курсовая работа [958,6 K], добавлен 21.07.2011

  • Постановка расчетной экономической задачи. Решение расчетной экономической задачи в среде MS Excel и в среде MS Access. Результаты компьютерных экспериментов и их анализ. Технология построения гистограммы. Визуальное представление хранимых данных.

    курсовая работа [1,7 M], добавлен 25.04.2015

  • Решение в среде Microsoft Excel с помощью программной модели "Поиск решения" транспортной задачи, системы нелинейных уравнений, задачи о назначениях. Составление уравнения регрессии по заданным значениям. Математические и алгоритмические модели.

    лабораторная работа [866,6 K], добавлен 23.07.2012

  • Математическая статистика. Выборочная функция распределения. Использование инструментов Мастера функций и Пакета анализа Excel при статистической обработке данных. Анализ однородности выборки. Корреляционный, регрессионный анализ экспериментальных данных.

    курсовая работа [473,6 K], добавлен 22.12.2015

  • Принцип работы и особенности интерфейса табличного процессора Microsoft Office Excel. Описание правил адресации ячеек, освоение приемов их выделения и заполнения данными. Обобщение приемов ввода и редактирования данных в ячейках. Элементы окна Excel.

    лабораторная работа [2,7 M], добавлен 15.11.2010

  • Свойства объектов и проверка расчетной зависимости на основании экспериментальной выборки. Построение графической зависимости экспериментальных и расчетных значений от x для их сравнения. Выполнение работы в среде Visual Basic, Excel и MathCAD.

    курсовая работа [261,9 K], добавлен 20.05.2011

  • Оптимизационные модели на производстве. Компьютерное моделирование и программные средства. Трехмерное моделирование в T-Flex. Инженерный анализ в ANSYS. Интерфейс табличного процессора MS Excel. Построение математической модели задачи, ее реализация.

    курсовая работа [5,2 M], добавлен 13.04.2014

  • Основные возможности программного пакета Microsoft Excel, его популярность среди бухгалтеров и экономистов. Использование математических, статистических и логических функций. Определение частоты наступления событий. Особенности ранжирования данных.

    презентация [1,1 M], добавлен 22.10.2015

  • Краткие сведения об электронных таблицах MS Excel. Решение задачи линейного программирования. Решение с помощью средств Microsoft Excel экономической оптимизационной задачи, на примере "транспортной задачи". Особенности оформления документа MS Word.

    курсовая работа [1,1 M], добавлен 27.08.2012

  • Метод наименьших квадратов. Возможные варианты расположения экспериментальных точек. Аппроксимация экспериментальных данных в программах Microsoft Excel, MathCAD и MatLAB. Вычисление средних значений и их сумм. Коэффициенты корреляции и детерминации.

    курсовая работа [890,9 K], добавлен 30.10.2012

  • Техника создания списков, свободных таблиц и диаграмм в среде табличного процессора Microsoft Excel. Технология создания базы данных в среде СУБД Microsoft Access. Приобретение навыков подготовки и демонстрации презентаций в среде Microsoft Power Point.

    лабораторная работа [4,8 M], добавлен 05.02.2011

  • Подбор информации, характеризующей деятельность предприятий на данном сегменте рынка. Решение оптимизационной задачи для получения системы основных показателей. Разработка интерфейса для управления задачей с использованием возможностей Microsoft Excel.

    курсовая работа [2,4 M], добавлен 17.12.2014

  • Процессор электронных таблиц Microsoft Excel - прикладная программа, предназначенная для автоматизации процесса обработки экономической информации, представленной в виде таблиц; применение формул и функций для производства расчетов; построение графиков.

    реферат [2,4 M], добавлен 03.02.2013

  • Принципы решения задач линейного программирования в среде электронных таблиц Excel, в среде пакета Mathcad. Порядок решения задачи о назначении в среде электронных таблиц Excel. Анализ экономических данных с помощью диаграмм Парето, оценка результатов.

    лабораторная работа [2,0 M], добавлен 26.10.2013

  • Организации данных в таблице для документирования и графического представления информации при помощи программы Microsoft Excel. Создание и оформление исходных таблиц. Расчеты в таблицах, сортировка и фильтрация данных. Построение нестандартных диаграмм.

    реферат [3,6 M], добавлен 27.12.2013

  • Microsoft Office как семейство программных продуктов Microsoft, его возможности и функции. Решение пользовательских задач с помощью встроенных функций Excel, создание базы данных. Формирование блок-схемы алгоритма с использованием Microsoft Visio.

    контрольная работа [1,4 M], добавлен 28.01.2014

  • Технологии обработки экономической информации в среде ТП MS Excel. Работа в среде СКМ Maple. Технологии обработки данных в среде СУБД MS Access и анализ языка запросов SQL как средства расширения возможностей СУБД. Разработка отчетов в СУБД Access.

    контрольная работа [1,5 M], добавлен 04.04.2012

  • Численное и графическое моделирование динамических процессов в механической системе вибрационного типа. Обработка исходных данных и получение необходимых значений в MathCAD Professional. Решение задачи Коши модифицированным методом Эйлера в Excel.

    курсовая работа [3,7 M], добавлен 27.08.2012

  • Анализ и формализация задачи моделирования: построение концептуальной модели, ее формализация в виде Q-схемы. Построение имитационной модели: создание блок-схемы, представление базовой исходной имитационной модели. Исследование экономических процессов.

    контрольная работа [156,0 K], добавлен 21.11.2010

  • Анализ программы Microsoft Excel. Способы оформления элементов таблицы различными цветами. Этапы подготовки табличных документов. Характеристика табличного процессора EXCEL. Особенности проведения однотипных расчетов над большими наборами данных.

    реферат [565,9 K], добавлен 14.09.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.