Линейное и нелинейное оценивание параметров регрессии в Microsoft Excel
Ознакомление с типами нелинейных регрессий. Исследование специфических особенностей линейного оценивания параметров регрессии в табличном процессоре Microsoft Excel. Рассмотрение и характеристика оптимальных значений параметров уравнения регрессии.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 09.06.2021 |
Размер файла | 1,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Линейное и нелинейное оценивание параметров регрессии в Microsoft Excel
В.Б. Яковлев
В статье рассматривается сравнительная оценка линейного и нелинейного оценивания параметров регрессии в Microsoft Excel. Для нелинейного оценивания предлагается применение нелинейного метода обобщенного понижающего градиента, реализованного в надстройке Поиск решения.
Ключевые слова: регрессионный анализ; оценивание параметров регрессии; метод обобщенного понижающего градиента.
V.B. Yakovlev
Linear and Nonlinear Estimation of Regression Parameters in Microsoft Excel
The article deals with the comparative evaluation of linear and nonlinear estimation of regression parameters in Microsoft Excel. For nonlinear estimation, it is proposed to apply the nonlinear method of the generalized gradient, reduction implemented in Solver add-in.
Keywords: regression analysis; estimation of regression parameters; generalized gradient reduction method.
При оценивании параметров линейной регрессии применяют различные методы (см., например, [1-5]). Из них наиболее часто используемым является метод наименьших квадратов, с помощью которого находят значения параметров уравнения регрессии, минимизируя суммы квадратов отклонений фактических данных от расчетных yx :
Для данной функции найдем частные производные по каждому из параметров а и b и приравниваем их к нулю:
Соответствующую систему нормальных уравнений можно получить для любого уравнения линейной и нелинейной регрессии. При этом для нелинейной зависимости необходимо произвести линеаризацию переменных.
Нелинейные регрессии бывают трех типов.
Линеаризацию переменных можно произвести только для первых двух типов нелинейных уравнений регрессии. Первые приводят к линейному виду простой заменой переменных, вторые -- с помощью логарифмирования (см. табл. 1). Внутренне нелинейные к линейному виду не приводятся.
Оценка параметров регрессий нелинейных по оцениваемым параметрам, но внутренне линейных, основывается, как правило, на минимизации суммы квадратов отклонений в логарифмах. В результате оценки параметров для линеаризуемых уравнений оказываются несколько смещенными, то есть заниженными.
Таблица 1 Линеаризация нелинейных регрессий
Это будет наглядно видно из дальнейшего анализа. Поэтому для таких регрессий предпочтительнее использовать нелинейные методы наименьших квадратов. В них, как и в классическом методе наименьших квадратов, находят значения параметров уравнения регрессии, при которых сумма квадратов отклонений S фактических данных у от расчетных yx является минимальной.
Для решения этой задачи применяют два основных метода:
1) прямую минимизацию функции S методами нелинейной оптимизации, которые позволяют находить экстремумы выпуклых линий (сюда можно отнести различные методы наискорейшего спуска (градиентные методы), например метод обобщенного понижающего градиента, используемый в табличном процессоре Microsoft Excel, и др.);
2) решение системы нелинейных уравнений, полученной из необходимого условия экстремума функции -- равенства нулю частных производных по каждому из параметров (эта система решается итерационными методами, например методом Гаусса-Ньютона, который используется в статистическом пакете Statistica, и др.).
Существуют также методы оценивания параметров нелинейной регрессии, которые сочетают в себе два вышеизложенных метода. Сюда можно отнести метод Левенберга-Марквардта, являющийся сочетанием направления Ньютона-Г аусса и метода наискорейшего спуска. Данный метод используется во многих статистических пакетах (Statistica, IBM SPSS Statistics и др.).
Рассмотрим методику линейного и нелинейного оценивания параметров регрессии для зависимости численности обучающихся от количества организаций высшего образования по Центральному федеральному округу (табл. 2).
Таблица 2 Количество государственных организаций высшего образования и численность обучающихся в них в Центральном федеральном округе в 2016 г.
№ |
РегионБез г. Москвы -- столицы Российской Федерации (город федерального значения). |
Численность обучающихся, тыс. чел. (у) |
Государственные организации высшего образования, ед. (х) |
|
1 |
Белгородская область |
45,4 |
7 |
|
2 |
Брянская область |
26,3 |
4 |
|
3 |
Владимирская область |
27,3 |
2 |
|
4 |
Воронежская область |
82,0 |
10 |
|
5 |
Ивановская область |
27,0 |
6 |
|
6 |
Калужская область |
15,5 |
1 |
|
7 |
Костромская область |
11,3 |
2 |
|
8 |
Курская область |
36,2 |
5 |
|
9 |
Липецкая область |
19,8 |
4 |
|
10 |
Московская область |
69,4 |
12 |
|
11 |
Орловская область |
30,5 |
4 |
|
12 |
Рязанская область |
28,8 |
4 |
|
13 |
Смоленская область |
18,9 |
5 |
|
14 |
Тамбовская область |
26,5 |
4 |
|
15 |
Тверская область |
22,6 |
4 |
|
16 |
Тульская область |
25,9 |
2 |
|
17 |
Ярославская область |
28,7 |
7 |
Линейное оценивание параметров регрессии
В табличном процессоре Microsoft Excel линейное оценивание параметров регрессии может проводиться с помощью надстройки Анализ данных и с помощью добавления выбранных регрессий (линий тренда) на диаграмму зависимости результативного признака от факторного признака.
На основе данных диаграммы имеется возможность получать пять типов линейно оцененных регрессий или линий тренда, таких как линейная, полиномиальная различных степеней, логарифмическая, степенная и экспоненциальная.
При подборе линии тренда автоматически рассчитывается коэффициент детерминации R2, который характеризует достоверность аппроксимации: чем ближе значение R2 к единице, тем надежнее линия тренда аппроксимирует исследуемый процесс.
Осуществим линейное оценивание параметров указанных выше регрессий с помощью точечной диаграммы, на которую добавим соответствующие линии трендов. Для этого подготовим данные в таблице MS Excel в соответствии с рисунком 1.
Рис. 1. Данные в MS Excel
Построим точечную диаграмму данной зависимости. Для этого выделим ячейки d:D18 и выполним команду Вставка, Рекомендуемые диаграммы. В открывшемся диалоговом окне Вставка диаграммы установим параметры в соответствии с рисунком 2.
Рис. 2. Диалоговое окно Вставка диаграммы
Точечная диаграмма выводится в следующем отформатированном виде (рис. 3). Вначале проведем оценивание параметров линейного уравнения регрессии. Для этого установим курсор на любую точку диаграммы и щелкнем правой кнопкой мыши. В появившемся контекстном меню нажмем на кнопку Добавить линию тренда.
* Численность обучающихся, тыс. чел. (у)
Рис. 3. Точечная диаграмма
В диалоговом окне Формат линии тренда установим параметры в соответствии с рисунком 4.
Рис. 4. Формат линии тренда
Диаграмма выводится в следующем отформатированном виде (рис. 5).
Рис. 5. Диаграмма
Проведем выравнивание по остальным уравнениям тренда аналогично выравниванию по линейному уравнению тренда (рис. 6).
Рис. 6. Выравнивание по остальным уравнениям тренда
Более высокий индекс детерминации R2 получается у полиномиальной (0,786) и линейной (0,741) регрессий. Поэтому можно сделать вывод, что данные регрессии в лучшей степени отражают зависимость численности обучающихся от количества организаций высшего образования.
Нелинейное оценивание параметров регрессии
Осуществим расчет параметров линейной, полиномиальной, логарифмической, степенной и экспоненциальной регрессий в Microsoft Excel с помощью нелинейного оценивания. Для этого используем надстройку Поиск решения, в которой реализован поиск решения нелинейных задач методом обобщенного понижающего градиента (ОПГ).
Подготовим данные в MS Excel в соответствии с рисунком 7.
Рис. 7. Подготовка данных в MS Excel
Рассчитаем параметры уравнения линейной регрессии yx = a + bx. Для этого вначале введем в ячейки Е2 и F2 соответственно формулы =$C$21+$C$22*C2 и =D2-E2 и скопируем их в ячейки B3:F18.
Затем найдем оптимальные значения параметров уравнения регрессии а и b, минимизируя сумму квадратов остатков (отклонений фактических уровней ряда от предсказанных значений ряда). Для этого введем в ячейку С24 функцию =СУММПРОИЗВ(Е2:Р18;Р2:Р18) и выполним команду Данные, Поиск решения. В диалоговом окне Параметры поиска решения установим параметры в соответствии с рисунком 8.
Рис. 8. Параметры поиска решения
В результате будут получены оптимальные значения параметров уравнения регрессии а и b (см. рис. 9).
Рис. 9. Оптимальные значения параметров уравнения регрессии а и b
Для этого введем:
• в ячейку С26 функцию =ДИСП.Г(В2:Б18) для расчета общей дисперсии;
• в ячейку С27 формулу =C24/A18 для расчета остаточной дисперсии;
• в ячейку С28 формулу =1-C27/C26 для расчета индекса детерминации. Результаты выводятся в следующем виде (рис. 10).
А В |
с |
||
25 |
Оценка параметров уравнения регрессии |
||
26 |
Общая дисперсия |
316,6 |
|
27 |
Остаточная дисперсия |
81,9 |
|
28 |
Индекс детерминации |
0,741 |
Рис. 10. Параметры уравнения регрессии
Как видим, получены те же результаты, что и при линейной оценке параметров линейного уравнения регрессии (см. рис. 5).
Аналогично проведем нелинейное оценивание параметров полиномиальной, логарифмической, степенной и экспоненциальной регрессий. Для этого для каждого уравнения регрессии создадим копии листа с расчетными данными по линейной регрессии и на скопированных листах проведем соответствующие расчеты: на каждом листе введем в ячейку Е2 соответствующие формулы и скопируем их в ячейки Е3:Е15:
• =$C$21+$C$22*C2+$C$23*C2A2 (полиномиальная регрессия);
• =$C$21+$C$22*LN(C2) (логарифмическая регрессия);
• =$C$21*C2A$C$22 (степенная регрессия);
• =$C$21*EXP($C$22*C2) (экспоненциальная регрессия).
Получим следующие результаты нелинейного оценивания (см. табл. 3). Для сравнения в таблице приведены также результаты линейного оценивания параметров регрессий.
Таблица 3 Линейное и нелинейное оценивание параметров регрессии
Нелинейное оценивание степенной и экспоненциальной регрессий показывает лучшие результаты по сравнению с линейным оцениванием (см. рис. 6), поскольку получен более высокий индекс детерминации, характеризующий достоверность аппроксимации. Это следует из того, что оценки параметров для линеаризуемых уравнений, как правило, оказываются несколько смещенными, то есть заниженными.
Нанесем на диаграммы результаты линейного и нелинейного оценивания степенной (рис. 11) и экспоненциальной регрессий (рис. 12). На рисунках наглядно видны различия в их оценке, особенно степенной регрессии. нелинейный регрессия excel
Проверка итогов нелинейного оценивания регрессии в статистическом пакете Statistica 10 показала аналогичные результаты (см. рис. 13, 14).
Таким образом, нелинейное оценивание регрессий в Microsoft Excel, нелинейных по оцениваемым параметрам, приводит к лучшим результатам по сравнению с линейным оцениванием. Поэтому его рекомендуется применять на практике для такого рода регрессий, причем как внутренне линейных, так и внутренне нелинейных.
Рис. 11. Результаты линейного и нелинейного оценивания степенной регрессии
Рис. 12. Результаты линейного и нелинейного оценивания экспоненциальной регрессии
Рис. 13. Проверка итогов нелинейного оценивания регрессии в статистическом пакете Statistica 10
Рис. 14. Проверка итогов нелинейного оценивания регрессии в статистическом пакете Statistica 10
Литература
1. Воскобойников Ю.Е. Построение регрессионных эконометрических моделей (с примерами в Excel): учебное пособие. Новосибирск: НГАСУ (Сибстрин), 2014. 224 с.
2. Конрад Карлберг. Регрессионный анализ в Microsoft Excel. М.: Диалектика, 2017. 400 с.
3. ЯковлевВ.Б. Статистика. Расчеты в Microsoft Excel: учебное пособие. М.: Юрайт, 2017. 353 с.
4. Яковлев В.Б. Эконометрика в Excel и Statistica: учебное пособие. Ч. 1. Регрессионный анализ. М.: Эдитус, 2018. 168 с.
5. Яковлев В.Б., Яковлева О.А. Практикум по общей теории статистики: учебное пособие. М.: ИНФРА-М, 2016. 382 с.
Literatura
1. Voskobojnikov Уп.Е. Postroenie regressionny'x e'konometricheskix modelej (s primerami v Excel): uchebnoe posobie. Novosibirsk: NGASU (Sibstrin), 2014. 224 s.
2. Konrad Karlberg. Regressionny'j analiz v Microsoft Excel. M.: Dialektika, 2017. 400 s.
3. Yakovlev V.B. Statistika. Raschety' v Microsoft Excel: uchebnoe posobie. M.: Yurajt, 2017. 353 s.
4. Yakovlev V.B. E'konometrika v Excel i Statistica: uchebnoe posobie. Ch. 1. Regressionny'j analiz. M.: E'ditus, 2018. 168 s.
5. Yakovlev V.B., Yakovleva O.A. Praktikum po obshhej teorii statistiki: uchebnoe posobie. M.: INFRA-M, 2016. 382 s.
Размещено на Allbest.ru
...Подобные документы
Анализ программы Microsoft Excel. Способы оформления элементов таблицы различными цветами. Этапы подготовки табличных документов. Характеристика табличного процессора EXCEL. Особенности проведения однотипных расчетов над большими наборами данных.
реферат [565,9 K], добавлен 14.09.2012Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели. Оценка параметров регрессии по методу наименьших квадратов. Нахождение определителей матриц. Применение инструмента Регрессия.
контрольная работа [1,0 M], добавлен 13.01.2013Создание круговой диаграммы в табличном процессоре Microsoft Office Excel. Построение графиков математических функций. Назначение и алгоритм построение диаграммы с помощью Мастера диаграмм. Типы диаграмм в Excel. Метки строк и столбцов диаграммы.
лабораторная работа [1,6 M], добавлен 15.11.2010Решение в среде Microsoft Excel с помощью программной модели "Поиск решения" транспортной задачи, системы нелинейных уравнений, задачи о назначениях. Составление уравнения регрессии по заданным значениям. Математические и алгоритмические модели.
лабораторная работа [866,6 K], добавлен 23.07.2012Основные функции и методы работы в табличном процессоре Microsoft Excel. Создание и редактирование простейших таблиц и диаграмм. Характеристика встроенных функций программы. Использование формул и правил введения, их комбинирование и редактирование.
курсовая работа [2,2 M], добавлен 08.06.2014Microsoft Excel: случаи нелинейной регрессии (гипербола, экспонента и парабола), проверка ее результатов. Создание и применение гиперссылок в системе MathCAD. Основы работы с блоками документов. Контур управления производством комплекса "Галактика".
контрольная работа [725,0 K], добавлен 03.08.2011Поиск значений показателя "количество абонентов оператора Мегафон" в сети Интернет с помощью различных поисковых систем; их сравнительный анализ. Формирование навыков работы с приложением Microsoft Word; работа с электронными таблицами в Microsoft Excel.
курсовая работа [3,9 M], добавлен 12.05.2011Извлечение информации, организация и отбор данных с помощью приложения Microsoft Query. Обработка полученных данных средствами сводной таблицы в табличном процессоре Excel в соответствии с индивидуальным заданием. Возможности Мастера сводных таблиц.
курсовая работа [2,4 M], добавлен 20.11.2011История развития и функции линейного программирования. Исследование условий типовых задач и возможностей табличного процессора. Решение задач о рационе питания, плане производства, раскрое материалов и рациональной перевозке груза в среде MS Excel.
курсовая работа [3,3 M], добавлен 28.04.2014Формирование и расчет таблиц в табличном процессоре Excel. Расчет таблицы с использованием "Мастера функций". Построение диаграмм на основе табличных данных. Работа с базой данных "Книжный магазин" в Excel. Выручка по книгам, относящимся к одному типу.
контрольная работа [329,2 K], добавлен 26.09.2012История использования механических и полуавтоматических средств для арифметических операций. Работа с табличным процессором Microsoft Excel. Поиск и замена данных в таблице Microsoft Access. Сортировка записей в запросе, его создание с помощью мастера.
контрольная работа [22,8 K], добавлен 13.01.2010Программа Microsoft Excel для работы с таблицами данных и формулами. Абсолютные и относительные ссылки. Использование мастера функций, ввод ее параметров. Суммирование, построение диаграмм и графиков. Арифметические и логические табличные формулы.
курсовая работа [47,3 K], добавлен 28.11.2009Характеристика влияния компьютера на здоровье человека. Определение корней уравнения в Microsoft Excel с точностью до шестого знака после запятой. Решение системы линейных уравнений методом вычисления определителей и матричным способом в Microsoft Excel.
контрольная работа [734,0 K], добавлен 19.03.2012Создание таблицы "Покупка товаров с предпраздничной скидкой". Понятие формулы и ссылки в Excel. Структура и категории функций, обращение к ним. Копирование, перемещение и редактирование формул, автозаполнение ячеек. Формирование текста функции в диалоге.
лабораторная работа [450,2 K], добавлен 15.11.2010Работа с базами данных в табличном процессоре Microsoft Excel. Сортировка и фильтрация данных. Встроенные функции Excel. Подведение промежуточных итогов в таблице. Макет сводной диаграммы. Условие проверки для поля. Сообщение об ошибке при вводе.
курсовая работа [1,0 M], добавлен 19.05.2014Microsoft Word — текстовый процессор, предназначенный для создания, просмотра и редактирования текстовых документов с использованием таблично-матричных алгоритмов. Область применения Microsoft Excel; общие операции над листами и ячейками рабочей книги.
реферат [2,5 M], добавлен 23.02.2012Ознакомление с разнообразными надстройками, входящими в состав Microsoft Excel; особенности их использования. Примеры решения задач линейного программирования с помощью вспомогательных программ "Подбор параметра", "Поиск решения" и "Анализ данных".
реферат [2,5 M], добавлен 25.04.2013Основные возможности программного пакета Microsoft Excel, его популярность среди бухгалтеров и экономистов. Использование математических, статистических и логических функций. Определение частоты наступления событий. Особенности ранжирования данных.
презентация [1,1 M], добавлен 22.10.2015Решение циклических программ и программ вычисления функции с условием. Уравнение в табличном редакторе Microsoft Excel и в Turbo Pascal. Вычисление определенного интеграла методом прямоугольников, трапеции, Симпсона. Линейные и нелинейные уравнения.
курсовая работа [233,6 K], добавлен 27.12.2009Обробка інформації нетекстового характеру. Електронні редактори для опрацювання даних. Пошук даних у діапазоні клітинок або в таблиці. Фільтрування даних в Microsoft Excel. Вимоги до апаратного забезпечення. Мотивація вибору програми Microsoft Excel.
реферат [2,9 M], добавлен 18.03.2013