Анализ данных в Excel
Подсчёт выборочного среднего представленной выборки значений. Понятие дисперсии и вычисление стандартного отклонения. Понятие коэффициента корреляции и его возможные значения. Регрессионный анализ заданных величин. Цель применения дисперсионного анализа.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 08.08.2020 |
Размер файла | 2,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Федеральное государственное образовательное
бюджетное учреждение высшего профессионального образования
«ФИНАНСОВЫЙ УНИВЕРСИТЕТ
ПРИ ПРАВИТЕЛЬСТВЕ РОССИЙСКОЙ ФЕДЕРАЦИИ»
Kафедра «Математика и информатика»
Факультет Менеджмент
Направление подготовки Маркетинг
КОНТРОЛЬНАЯ РАБОТА
по дисциплине «Анализ данных в Excel»
Вариант № 5
Студент Устеменко У.А
Курс 1 № группы 2
Преподаватель Дюдин М.С
Краснодар 2015
СОДЕРЖАНИЕ
выборка дисперсия корреляция регрессионный дисперсионный
1. Подсчёт выборочного среднего представленной выборки значений
2. Понятие дисперсии и вычисление стандартного отклонения
3. Генерация нормально распределённой случайной величины с данным средним значением и стандартным отклонением. Построение гистограммы, иллюстрирующей плотность распределения
4. Понятие коэффициента корреляции и его возможные значения
5. Подсчёт коэффициента корреляции данных выборок случайных величин
6. Понятие регрессионного анализа, его предпосылки. Модель однофакторного регрессионного анализа
7. Проведение регрессионного анализа заданных величин
8. Проведение двухфакторного регрессионного анализа заданных величин
9. Цель применения дисперсионного анализа. Соотношение межгрупповой и внутригрупповой дисперсии при наличии влияния фактора
1. Дана выборка значений случайной величины:
X |
23 |
37 |
30 |
29 |
34 |
Посчитайте выборочное среднее.
Решение:
Для начала откроем программу Microsoft Excel, создадим пустой лист и введём в таблицу данные в условиях параметры X. Далее, для подсчёта выборочного среднего значения, воспользуемся функцией СРЗНАЧ, которую можно найти во вкладке Формулы:
Затем, в открывшемся диалогом окне поочерёдно в поля чисел вводим заданные параметры X:
В результате чего получаем выборочное среднее значение для выборки случайных величин:
2. Что такое выборочная дисперсия? Как считается стандартное отклонение? Посчитайте стандартное отклонение и дисперсию для предыдущего примера.
Решение:
Дисперсия (выборочная дисперсия, дисперсия выборки) -- это наиболее используемая мера рассеяния в статистическом анализе, описывающая сравнительное отклонение между значениями данных и средней величиной. Для вычисления выборочной дисперсии в Excel используется функция «ДИСП» в меню формул.
Для вычисления стандартного отклонения заданных параметров из задания №1 воспользуемся формулой «СТАНДОТКЛОН» в меню функций:
В открывшемся диалоговом окне поочерёдно в поля чисел вводим заданные параметры X:
В результате чего получаем искомое стандартное отклонение для заданных величин:
Далее вычислим дисперсию выборки. В меню функций находим формулу «ДИСП» и, поочерёдно заполнив числовые поля данными значениями, вычисляем дисперсию выборки, в итоге имеем:
С помощью данных функций в Excel можно определить общие характеристики выборки случайных величин.
3. Сгенерируйте нормально распределенную случайную величину со средним значением 5 и стандартным отклонением 2,5. (N=50). Постройте гистограмму, иллюстрирующую плотность распределения.
Решение:
Для генерации нормально распределённой случайной величины используем пакет «Анализ данных» в Excel и выберем необходимый инструмент анализа, а именно «Генерация случайных чисел»:
Далее, в открывшемся окне вводим следующие параметры: в поля «среднее» и «стандартное отклонение» вводим данные значения, тип распределения выбираем «нормальный», число переменных устанавливаем равным 1, а число случайных чисел равное 50, для того, чтобы в последующем построить более подробную гистограмму плотности распределения:
В итоге получаем столбец значений из 50 случайных чисел:
Далее нам требуется построить гистограмму для иллюстрации плотности распределения чисел. Для этого мы также воспользуемся пакетом «Анализ данных», где выберем инструмент «Гистограмма». В открывшемся окне указываем заданный входной и необходимый выходной интервалы, а для наглядной демонстрации гистограммы ставим галочку на параметре «Вывод графика»:
В результате мы получаем гистограмму наших сгенерированных нормально распределённых случайных величин, которая демонстрирует плотность полученного распределения:
4. Что показывает коэффициент корреляции, какие значения он может принимать?
Решение:
Корреляция -- это статистическая зависимость двух и более независимых друг от друга величин. При этом изменение значения одной из них приводит к изменению значения других. В качестве математической меры корреляции двух величин служит коэффициент корреляции, который показывает степень статистической зависимости между двумя числовыми переменными. Значения коэффициента корреляции всегда расположены в диапазоне от -1 до 1, при этом если коэффициент корреляции близок к 1, то между переменными наблюдается положительная корреляция, будет отмечаться высокая степень связи входной и выходной переменных. Если же если коэффициент корреляции близок к -1, то между переменными будет наблюдаться отрицательная корреляция. Иными словами, поведение выходной переменной будет противоположным поведению входной. Имеют место ситуации, когда коэффициент принимает промежуточные значения близкие к 0, в таких случаях корреляция между переменными будет слабо выражена, а их зависимость, соответственно, низкой.
5. Даны две выборки случайных величин. Посчитайте их к-т корреляции, сделайте вывод о степени их коррелированности.
X |
25 |
32,5 |
30 |
28,75 |
31,25 |
|
Y |
52,5 |
75 |
82,5 |
45 |
57 |
Решение:
Для начала создаём новый лист в нашей книге Excel и заполняем его данными, указанными в задании:
Далее для вычисления коэффициента корреляции воспользуемся меню формул и выберем функцию «КОРРЕЛ»:
Для поля Массива1 выделяем значения X, а для Массива2 - значения Y:
В результате получаем значение коэффициента, равное 0,5294, что не совсем удобно для точного определения положения полученного результата в диапазоне значений коэффициента корреляции, и чтобы округлить число до сотых, меняем формат ячейки нашего результата на числовой:
После вычисления коэффициента корреляции величин двух заданных выборок, необходимо сделать выводы о степени их коррелированности. Коэффициент корреляции равен 0,53. Это число близко к верхней положительной границе диапазона, к 1, отсюда следует, что между переменными выборок наблюдается положительная корреляция, которой присуща высокая степень связи входной и выходной переменных:
6. Для чего применяется регрессионный анализ? При каких результатах корреляционного анализа есть смысл проводить регрессионный анализ? Перечислите 4 предпосылки регрессионного анализа, напишите модель однофакторного регрессионного анализа.
Решение:
Регрессионный анализ применяется в тех случаях, когда необходимо оценить зависимость переменной Y от переменной X. Также регрессионный анализ позволяет оценить количественные влияния независимой переменной X. Задачами регрессионного анализа являются установление формы зависимости между переменными, оценка функции регрессии, оценка неизвестных значений (прогноз) зависимой переменной.
Регрессионному анализу свойственны определённые предпосылки, он имеет место в тех случаях, когда:
1) в линейной парной регрессионной модели (Yi = в0 + в1x + еi) зависимая переменная Yi является случайной величиной, а объясняющая переменная X - неслучайной;
2) математическое ожидание возмущения еi линейной парной регрессионной модели равно 0;
3) Дисперсия возмущения еi (или зависимой переменной Yi ) постоянна для любого i;
4) возмущения еi и еj или зависимые переменные Yi и Yj не коррелированы;
5) возмущение еi (или зависимая переменная Yi) есть нормально распределённая случайная величина.
Для получения уравнения регрессии достаточно первых четырёх предпосылок.
Модель однофакторного регрессионного анализа в Excel состоит из двух выборок - выборки значений зависимой переменной Y и выборки значений независимой переменной X. В однофакторном регрессионном анализе предполагается, что переменная Y определяется только одной независимой переменной (одним фактором).
7. Проведите регрессионный анализ для данных из вопроса №5, взяв зависимой переменной Y, зависимой - X. Напишите уравнение регрессии и значение R^2. Является ли точность регрессии удовлетворительной?
Решение:
X |
25 |
32,5 |
30 |
28,75 |
31,25 |
|
Y |
52,5 |
75 |
82,5 |
45 |
57 |
Для того, чтобы произвести регрессионный анализ для заданных значений, создадим новый лист, скопируем туда данные, откроем пакет «Анализ данных» и выберем инструмент «Регрессия»:
В появившемся окне для поля Y выделим значения зависимой переменной Y из данной выборки, а для поля X, соответственно, используем значения выборки X:
В результате получаем следующий вывод итогов регрессионного анализа:
Как видно из таблицы, значение R2 = 0,2802648, следовательно, коэффициент детерминации R2 составляет 28%, а модель имеет низкую значимость.
Уравнение линейной регрессии имеет вид: y = b0 + b1x + b2x, где b - коэффициенты регрессии, а x - влияющие факторы. В соответствии с этим составим уравнение для данной регрессии:
Y = 23,4655485 + 0,09670595x
8. Проведите двухфакторный регрессионный анализ взяв зависимой переменной Y.
Y |
49,3 |
24,5 |
37,7 |
30,5 |
30,5 |
|
X1 |
10,6 |
5 |
9,2 |
7,5 |
10,7 |
|
X2 |
15 |
7,5 |
9 |
8,1 |
5,1 |
Решение:
Затем воспользуемся инструментом «Регрессия» в пакете «Анализ данных». Заполним поля появившегося окна следующим образом:
В поле входного интервала Y вводим столбец данных Y, в поле входного интервала X вводим массив значений переменных X1 и X2.
В результате получаем следующую таблицу регрессионного анализа:
По итогам регрессии можно сделать вывод о высокой значимости модели, так как коэффициент детерминации равен 0,986725, т.е. 99%. Также можно отметить, что значение F > Fкритерия, следовательно, имеет место влияние фактора.
9. Расскажите цель применения дисперсионного анализа. Как должны соотносится межгрупповая и внутригрупповая дисперсия при наличии влияния фактора? Проведите дисперсионный анализ по следующим данным:
Отсутствие фактора: |
10,5 |
14,5 |
12,5 |
16,5 |
15,5 |
|
Слабая степень влияния фактора: |
14,5 |
16,5 |
15,5 |
18,5 |
17 |
|
Сильная степень влияния фактора: |
16,7 |
17,5 |
15 |
18,5 |
19,5 |
Подтверждается ли влияние фактора с уровнем значимости 0,05? С каким уровнем значимости присутствует влияние исследуемого фактора?
Решение:
Назначением дисперсионного анализа (целью применения) является определение влияния фактора на определённый процесс или явление. Процесс проведения дисперсионного анализа заключается в сравнении внутригрупповой и межгрупповой дисперсии. Между общей дисперсией, средней из внутригрупповых дисперсий и межгрупповой дисперсией существует соотношение, определяемое правилом сложения дисперсий. Согласно этому правилу общая дисперсия равна сумме средней из внутригрупповых и межгрупповой дисперсий. Это правило позволяет выявить зависимость результата от влияния исследуемого фактора.
Проведём дисперсионный анализ имеющихся данных. Для начала создадим новый лист и перенесём туда заданные параметры:
Данная модель имеет лишь один фактор влияния, следовательно, используем инструмент «Однофакторный дисперсионный анализ» из пакета данных «Анализ». Значение «Альфа» выставляем на 0,05, в поле «Входной интервал» вставляем ссылку на массив данных и выбираем метод группировки по столбцам:
В качестве выходного интервала указываем ссылку на необходимые ячейки листа, в результате чего получаем следующие статистические данные:
Влияние исследуемого фактора определяется по величине значимости критерия Фишера, которая находится в таблице «Дисперсионный анализ» на пересечении строки «Между группами» и столбца «Р-Значение». Эта величина показывает, с каким минимальным уровнем значимости выполняется наличие фактора. В случаях, когда Р-Значение < 0,05, критерий Фишера значим, и влияние исследуемого фактора можно считать доказанным. В нашей же модели P-Значение равно 0,035083, а выборочное значение критерия Фишера, F = 4,486628117, что немного превышает Fкрит, равное 3,885294, следовательно, влияние фактора имеет место в данной модели.
Размещено на Allbest.ru
...Подобные документы
Математическая статистика. Выборочная функция распределения. Использование инструментов Мастера функций и Пакета анализа Excel при статистической обработке данных. Анализ однородности выборки. Корреляционный, регрессионный анализ экспериментальных данных.
курсовая работа [473,6 K], добавлен 22.12.2015Задачи линейного программирования. Многоугольник решений системы. Вычисление значения целевой функции. Интервальная группировка данных. Среднее квадратическое отклонение выборки. Вычисление коэффициента корреляции. Закон распределения случайной величины.
контрольная работа [389,6 K], добавлен 11.01.2012Метод наименьших квадратов. Возможные варианты расположения экспериментальных точек. Аппроксимация экспериментальных данных в программах Microsoft Excel, MathCAD и MatLAB. Вычисление средних значений и их сумм. Коэффициенты корреляции и детерминации.
курсовая работа [890,9 K], добавлен 30.10.2012Функции ввода-вывода строк и символов языка Си. Вычисление среднего значения, дисперсии, среднеквадратических отклонений х и у, коэффициента парной корреляции, регрессии двух функций, остаточных дисперсий. Расчет параметров регрессионных зависимостей.
курсовая работа [421,7 K], добавлен 12.03.2016Общее описание программы Statistica. Архитектура и интерфейс системы. Регрессионный анализ в Statistica. Решение задачи регрессионного анализа с помощью пакета анализа данных табличного процессора MS Excel. Многомерный дисперсионный анализ в SPSS.
курсовая работа [2,4 M], добавлен 22.01.2013Подбор параметров линейной функции. Вычисление значения функции в заданных промежуточных точках с использованием математических пакетов. Исследование математической модели решения задачи. Составление программы для вычисления коэффициента корреляции.
курсовая работа [2,3 M], добавлен 21.10.2014Понятие и возможности MS Excel. Основные элементы его окна. Возможные ошибки при использовании функций в формулах. Структура электронных таблиц. Анализ данных в Microsoft Excel. Использование сценариев электронных таблиц с их практическим применением.
курсовая работа [304,3 K], добавлен 09.12.2009Функции для проведения финансово-экономических расчетов в пакете Excel. Будущая и текущая стоимость вклада. Экономический регрессионный анализ на основе собранных статистических данных. Модель Леонтьева многоотраслевой экономики (балансовый анализ).
контрольная работа [372,4 K], добавлен 23.07.2009Генерирование выборок, имеющих нормальный закон распределения, и определение для них математического ожидания и дисперсии. Нахождение значения критерия Фишера, сравнивнение его с критическим. Проведение однофакторного дисперсионного анализа выборок.
лабораторная работа [291,0 K], добавлен 19.02.2014Математические возможности Mathcad и Microsoft Excel. Преобразование алгебраических выражений. Вычисление значения функции. Решение уравнений и систем. Вычисление значения интеграла, производных и пределов. Построение графиков функций. Работа с матрицами.
курсовая работа [559,5 K], добавлен 15.07.2012Специальные финансовые функции Excel: вычисление процентов по вкладу или кредиту, амортизационных отчислений, норм прибыли и разнообразных обратных и родственных величин. Категории логических, математических и текстовых команд. Работа с базой данных.
реферат [20,5 K], добавлен 21.05.2009Ввод данных, построение графиков, встроенные функции БС и ПС для вычисления будущей стоимости с помощью формулы простых процентов (MS Excel). Синтаксис функции БС, вычисление будущего значения единой суммы. Вычисление текущего значения суммы (функция ПС).
лабораторная работа [1,8 M], добавлен 12.12.2010Особенности применения компьютерных программ Pascal, Excel, MathCAD и Delphi для вычисления значения функции y(x) с заданным промежутком и шагом. Виды результатов вычислений, их сравнение и вывод. Изображение блок-схемы алгоритма решения задания.
контрольная работа [760,0 K], добавлен 08.03.2011Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели. Оценка параметров регрессии по методу наименьших квадратов. Нахождение определителей матриц. Применение инструмента Регрессия.
контрольная работа [1,0 M], добавлен 13.01.2013Оптимальное планирование производства и решение транспортной задачи с помощью оптимизатора Solver программы Excel. Численные методы решения систем линейных алгебраических уравнений на Excel. Корреляционно-регрессионный анализ, линейная форма связи.
курсовая работа [2,7 M], добавлен 12.12.2009Построение корреляционного поля, гипотеза связи исследуемых факторов. Определение коэффициента корреляции. Оценка статистической значимости вычисленных коэффициентов корреляции. Параметры уравнения линейной парной регрессии, коэффициента эластичности.
реферат [526,7 K], добавлен 10.11.2010Встроенные функции Excel, их статистический анализ. Организации данных в таблице для документирования и графического представления информации. Создание базы данных "Автомагазин". Построение логических конструкций, создание графиков и диаграмм в MS Excel.
курсовая работа [711,7 K], добавлен 31.07.2014Свойства объектов и проверка расчетной зависимости на основании экспериментальной выборки. Построение графической зависимости экспериментальных и расчетных значений от x для их сравнения. Выполнение работы в среде Visual Basic, Excel и MathCAD.
курсовая работа [261,9 K], добавлен 20.05.2011Особенности создания и заполнения таблиц в Microsoft Excel. Типы представления данных. Способы ввода числовых значений и текстовой информации в таблицу. Выставление форматов времени. Работа с ячейкой. Использование операторов формул для расчета значений.
презентация [53,8 K], добавлен 06.01.2014Понятие "сортировка" как упорядочение элементов некоторой последовательности, ее цель и методы. Разработка алгоритмов, подпрограмм сортировок различного рода, анализ и вычисление среднего времени каждой сортировки, составление графического меню.
курсовая работа [165,4 K], добавлен 24.06.2012