Корреляция и регрессия

Регрессионный анализ, влияние одних значений (самостоятельных, независимых) на зависимую переменную. Корреляционный анализ, определение, есть ли между показателями в одной или двух выборках связь. Генерация исходных данных, коэффициенты регрессии.

Рубрика Программирование, компьютеры и кибернетика
Вид лабораторная работа
Язык русский
Дата добавления 19.12.2022
Размер файла 822,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

ОТЧЕТ ПО ЛАБОРАТОРНОЙ РАБОТЕ

на тему «Корреляция и регрессия»

Студента 2 курса

Направления подготовки

38.03.05 «Бизнес-информатика»

Кириллова Владислава Сергеевича

2022

ВВЕДЕНИЕ

Регрессионный и корреляционный анализ - статистические методы исследования. Это наиболее распространенные способы показать зависимость какого-либо параметра от одной или нескольких независимых переменных.

Регрессионный анализ показывает влияние одних значений (самостоятельных, независимых) на зависимую переменную. К примеру, как зависит количество экономически активного населения от числа предприятий, величины заработной платы и др. параметров. Или: как влияют иностранные инвестиции, цены на энергоресурсы и др. на уровень ВВП.

Результат анализа позволяет выделять приоритеты. И основываясь на главных факторах, прогнозировать, планировать развитие приоритетных направлений, принимать управленческие решения.

Регрессия бывает:

линейной (у = а + bx);

параболической (y = a + bx + cx2);

экспоненциальной (y = a * exp(bx));

степенной (y = a*x^b);

гиперболической (y = b/x + a);

логарифмической (y = b * 1n(x) + a);

показательной (y = a * b^x).

Корреляционный анализ помогает установить, есть ли между показателями в одной или двух выборках связь. Например, между временем работы станка и стоимостью ремонта, ценой техники и продолжительностью эксплуатации, ростом и весом детей и т.д.

Если связь имеется, то влечет ли увеличение одного параметра повышение (положительная корреляция) либо уменьшение (отрицательная) другого. Корреляционный анализ помогает аналитику определиться, можно ли по величине одного показателя предсказать возможное значение другого.

Коэффициент корреляции обозначается r. Варьируется в пределах от +1 до -1. Классификация корреляционных связей для разных сфер будет отличаться. При значении коэффициента 0 линейной зависимости между выборками не существует.

ОСНОВНАЯ ЧАСТЬ

Упражнение 1. Генерация исходных данных

Сгенерируем значения двух переменных x и y, в соответствии со своим вариантом (вариант№1) с объемом выборки 100 - элементов.

Рисунок 1.1. Генерация двух переменных

После генерации получим значения, а также с помощью функции ОКРУГЛ(число; число разрядов) округлим полученные данные.

Рисунок 1.2.Результат генерации и округления данных

Упражнение 2. Корреляционный анализ

Вычислим коэффициент корреляции, который можно получить как с помощью функции «Корреляция» статистической надстройки, так и с помощью функции КОРРЕЛ(диапазон_x; диапазон_y).

Рисунок 2.1. Вычисления коэффициентов корреляции

Заметим, что коэффициент корреляции равен 0,9, это значит, что значение находится в диапазоне 0,7 ? |r| < 1 и характер связи данных - сильный. То есть уже сейчас можно предположить, что присутствует линейный тип связи.

Упражнение 3. Регрессионный анализ

Из пакета анализа данных найдем значения регрессии.

Рисунок 3.1. Ввод данных для регрессионного анализа

Рисунок 3.2. Результат регрессионного анализа

Обратим внимание на значение R-квадрат, которое также как и коэффициент корреляции показывает связь между значениями. R-квадрат равен 0,8, это значит, что значение также находится в диапазоне 0,7 ? |r| < 1 и характер связи данных также сильный.

Чтобы убедиться графически в наших предположениях значения «Фактор» (т.е. значения X) возведём в квадрат и куб.

Рисунок 3.3. Возведение в квадрат и куб значения «Фактор»

Коэффициенты регрессии можно также найти с помощью функции ЛИНЕЙН или статистической надстройки (функция «Регрессия»). Однако, в этом случае необходимо создать дополнительные столбцы данных, содержащие значения регрессоров, например, x 2 и x 3, т.к. данные функции вычисляют коэффициенты лишь для линейной множественной регрессии.

Рисунок 3.4. Вычисления коэффициентов регрессии с помощью функции

регрессионный корреляционный анализ

Далее построим корреляционное поле с линиями регрессии. Для этого воспользуемся точечной диаграммой. На диаграмме сделаем линии тренда: первая - это линейная линия, вторая - логарифмическая, третья - полиноминальная.

Следует отметить, что связь тем точнее, чем больше значение R^2. Зависимость зависит также от R^2, чем выше, тем она ближе. Как видим по графику все три зависимости (а точнее их значения R^2) довольно близки к единице, а значит можно точно сказать, что наши данные очень близки к линейной связи.

Рисунок 3.5. Точечная диаграмма с линиями регрессии.

ЗАКЛЮЧЕНИЕ

Проанализировав график и все наши полученные данные можно с уверенность сказать, что наши значения очень близки к линейной связи.

КОНТРОЛЬНЫЕ ВОПРОСЫ

1. Что такое корреляционная зависимость?

Корреляционная зависимость - это согласованные изменения двух (парная корреляционная связь) или большего количества признаков (множественная корреляционная связь). Суть ее заключается в том, что при изменении значения одной переменной происходит закономерное изменение (уменьшение или увеличение) другой(-их) переменной(-ых).

2. Что изучает корреляционный анализ?

Корреляционный анализ - статистический метод, позволяющий с использованием коэффициентов корреляции определить, существует ли зависимость между переменными и насколько она сильна.

3. Как коэффициент корреляции характеризует взаимосвязь параметров?

Коэффициент корреляции (r) характеризует величину отражающую степень взаимосвязи двух переменных между собой. Он может варьировать в пределах от -1 (отрицательная корреляция) до +1 (положительная корреляция). Если коэффициент корреляции равен 0 то, это говорит об отсутствии корреляционных связей между переменными. Причем если коэффициент корреляции ближе к 1 (или -1) то говориться о сильной корреляции, а если ближе к 0, то о слабой.

4. Что изучает регрессионный анализ?

Регрессионный анализ - это набор статистических методов оценки отношений между переменными. Его можно использовать для оценки степени взаимосвязи между переменными и для моделирования будущей зависимости. По сути, регрессионные методы показывают, как по изменениям «независимых переменных» можно зафиксировать изменение «зависимой переменной».

5. Что такое регрессия?

Регрессией называется зависимость среднего значения одной случайной величины от некоторой другой (или от нескольких случайных величин).

6. Как определить параметры уравнения регрессии?

Для определения параметров уравнения регрессии применяют метод наименьших квадратов (МНК). Сущность метода наименьших квадратов заключается в том, что отыскиваются такие значения параметров уравнения регрессии, при которых сумма квадратов отклонений фактических значений результативного признака от теоретических будет наименьшей из всех возможных.

7. Как определить оптимальный вид уравнения регрессии?

Оценить значимость уравнения регрессии - значит установить, соответствует ли математическая, модель, выражающая зависимость между Y и X, экспериментальным данным.

8. Что такое эмпирическая регрессия?

Эмпирическая регрессия - это метод непараметрической регрессии. Ключевая идея состоит в том, чтобы оценить плотность соединения X, Y, обозначающих p(X, Y). Из этой совместной плотности можно вывести условное p(Y|X) и условное среднее E(Y|X). Это E(Y|X) является эмпирической регрессией.

9. Что такое условное среднее?

Условное среднее- среднее арифметическое значений случайной величины X, наблюдавшихся при фиксированном значении случайной величины Y= y.

10. Что такое корреляционное поле?

Поле корреляции - это поле точек, на котором каждая точка соответствует единице совокупности: её координаты определяются значением признаков х и у.

Размещено на Allbest.ru

...

Подобные документы

  • Построение корреляционного поля, гипотеза связи исследуемых факторов. Определение коэффициента корреляции. Оценка статистической значимости вычисленных коэффициентов корреляции. Параметры уравнения линейной парной регрессии, коэффициента эластичности.

    реферат [526,7 K], добавлен 10.11.2010

  • Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели. Оценка параметров регрессии по методу наименьших квадратов. Нахождение определителей матриц. Применение инструмента Регрессия.

    контрольная работа [1,0 M], добавлен 13.01.2013

  • Рассмотрение основ проведения корреляционного анализа по исходным данным группы студентов. Построение теоретической и эмпирической линий регрессии; проведение анализа с помощью программы "regres.exe". Представление копий экрана зависимости показателей.

    контрольная работа [2,8 M], добавлен 07.06.2014

  • Математическая статистика. Выборочная функция распределения. Использование инструментов Мастера функций и Пакета анализа Excel при статистической обработке данных. Анализ однородности выборки. Корреляционный, регрессионный анализ экспериментальных данных.

    курсовая работа [473,6 K], добавлен 22.12.2015

  • Функции ввода-вывода строк и символов языка Си. Вычисление среднего значения, дисперсии, среднеквадратических отклонений х и у, коэффициента парной корреляции, регрессии двух функций, остаточных дисперсий. Расчет параметров регрессионных зависимостей.

    курсовая работа [421,7 K], добавлен 12.03.2016

  • Создание структуры интеллектуального анализа данных. Дерево решений. Характеристики кластера, определение групп объектов или событий. Линейная и логистическая регрессии. Правила ассоциативных решений. Алгоритм Байеса. Анализ с помощью нейронной сети.

    контрольная работа [2,0 M], добавлен 13.06.2014

  • Получение навыков работы в Mathcad при использовании интерполяции и регрессии. Постройте функции сглаживания и предсказания данных с помощью различных встроенных функций. Применение операций как калькулятор, математический анализ, матрица и вычисление.

    лабораторная работа [205,1 K], добавлен 23.12.2014

  • Оценка адекватности уравнения регрессии по значению коэффициента детерминированности. Составление плана производства изделий, обеспечивающего максимальную прибыль от их реализации. Оптимизация плана перевозок с целью уменьшения транспортных расходов.

    контрольная работа [1,4 M], добавлен 06.01.2014

  • Оптимальное планирование производства и решение транспортной задачи с помощью оптимизатора Solver программы Excel. Численные методы решения систем линейных алгебраических уравнений на Excel. Корреляционно-регрессионный анализ, линейная форма связи.

    курсовая работа [2,7 M], добавлен 12.12.2009

  • Интеллектуальный анализ данных как метод поддержки принятия решений, основанный на анализе зависимостей между данными, его роль, цели и условия применения. Сущность основных задач интеллектуального анализа: классификации, регрессии, прогнозирования.

    контрольная работа [25,8 K], добавлен 08.08.2013

  • Исследование процесса оперативного управления на основе решения задач нелинейного программирования. Рассмотрение содержания выпуклого симплексного метода Зангвилла. Построение модели регрессии при наличии сильной корреляции независимых факторов.

    курсовая работа [1,1 M], добавлен 15.01.2018

  • Виды неопределенностей в исходных данных систем и процессов защиты информации. Методы восстановления пропущенных значений в исходных данных. Моделирование методом экспертного построения функций, принадлежности оценки уровня риска информационной системы.

    дипломная работа [735,3 K], добавлен 13.07.2011

  • Общее описание программы Statistica. Архитектура и интерфейс системы. Регрессионный анализ в Statistica. Решение задачи регрессионного анализа с помощью пакета анализа данных табличного процессора MS Excel. Многомерный дисперсионный анализ в SPSS.

    курсовая работа [2,4 M], добавлен 22.01.2013

  • Листы рабочей книги. Расположение рабочих книг. Переходы между рабочими книгами. Копирование данных из одной рабочей книги в другую. Перенос данных между рабочими книгами. Использование в формуле связывания ссылки на другой рабочий лист.

    реферат [9,1 K], добавлен 17.11.2002

  • Общие требования к изображению отрезка с помощью цифрового дифференциального анализатора. Сравнительный анализ обычного и несимметричного алгоритмов и алгоритма Брезенхема для генерации векторов (соединения двух точек изображения отрезком прямой).

    презентация [65,3 K], добавлен 14.08.2013

  • Демонстрация программы генераций заданий по математике, удовлетворяющих условиям различности и равноценности. Подготовка контрольных и самостоятельных работ в 5–7 классах. Поддержка написания тестов, с перемешиванием вариантов ответов в каждом варианте.

    реферат [96,6 K], добавлен 07.09.2009

  • Вычисление значений регрессионно-авторегрессионной зависимости заданного выражения линейного программирования. Графическое представление математической модели в виде уравнения регрессии. Принципи оптимизации производственных и коммерческих операций.

    контрольная работа [2,2 M], добавлен 01.03.2011

  • Определение зависимости одной физической величины от другой. Применение метода наименьших квадратов с помощью программного обеспечения Mathcad. Суть метода наименьших квадратов. Корреляционный анализ, интерпретация величины корреляционного момента.

    курсовая работа [63,8 K], добавлен 30.10.2013

  • Анализ существующего подхода к построению трехмерного изображения данных из симметричных матричных форм. Технические характеристики ПЭВМ, требования к документации. Функции, автоматизирующие процесс взаимодействия пользователей с графической информацией.

    дипломная работа [192,8 K], добавлен 05.06.2011

  • Классификация задач Data Mining. Задача кластеризации и поиска ассоциативных правил. Определению класса объекта по его свойствам и характеристикам. Нахождение частых зависимостей между объектами или событиями. Оперативно-аналитическая обработка данных.

    контрольная работа [26,1 K], добавлен 13.01.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.