Анализ данных в Excel
Понятие выборочного среднего. Расчет стандартного отклонения и дисперсии. Значение коэффициента корреляции. Построение гистограммы, иллюстрирующей плотность распределения. Исследование значимости различий между средними с помощью сравнения дисперсий.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | русский |
Дата добавления | 08.08.2020 |
Размер файла | 900,4 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.Allbest.Ru/
Размещено на http://www.Allbest.Ru/
Размещено на http://www.Allbest.Ru/
Федеральное государственное образовательное юджетное учреждение высшего профессионального образования
Финансовый университет при Правительстве Российской Федерации
Kафедра «Математика и информатика»
Факультет Менеджмент
Направление подготовки Маркетинг
КОНТРОЛЬНАЯ РАБОТА
по дисциплине «Анализ данных в Excel»
Выполнила Скрынникова А.В.
Студент 1 курса
Преподаватель Дюдин М.С.
Краснодар 2015
План контрольной работы
1. Посчитайте выборочное среднее
2. Выборочная дисперсия. Стандартное отклонение
Посчитайте стандартное отклонение и дисперсию для предыдущего примера
3. Сгенерируйте распределенную по закону Пуассона случайную величину. Постройте гистограмму, иллюстрирующую плотность распределения
4. Коэффициент корреляции и его значения
5. Посчитайте их к-т корреляции, сделайте вывод о степени их коррелированности
6. Регрессионный анализ
7. Проведите регрессионный анализ
8. Проведите двухфакторный регрессионный анализ взяв зависимой переменной Y
9. Расскажите цель применения дисперсионного анализа
1. Дана выборка значений случайной величины
X |
2,1 |
3,5 |
2,8 |
2,7 |
3,2 |
Посчитайте выборочное среднее.
Ответ:
2. Что такое выборочная дисперсия? Как считается стандартное отклонение? Посчитайте стандартное отклонение и дисперсию для предыдущего примера
Ответ:
Выборочная дисперсия в математической статистике - это оценка теоретической дисперсии распределения, рассчитанная на основе данных выборки.
Стандартное отклонение можно рассчитать по следующему алгоритму:
1. Сначала - вычисление среднего арифметического выборки данных.
2. Затем нужно вычесть среднее арифметическое от каждого элемента выборки.
3. Каждую полученную разницу следует возвести в квадрат.
4. Сложить все квадраты разниц, полученные в пункте 3.
5. Поделить сумму квадратов на количество элементов выборки.
6. Теперь из этого частного нужно извлечь квадратный корень.
Результат является стандартным отклонением.
Стандартное отклонение
Дисперсия
3. Сгенерируйте распределенную по закону Пуассона случайную величину с лямбда равным 4. (N = 50). Постройте гистограмму, иллюстрирующую плотность распределения.
Ответ:
4. Что показывает коэффициент корреляции, какие значения он может принимать?
Ответ:
Величина влияния фактора на исследуемый отклик может быть оценена при помощи коэффициента линейной парной корреляции, характеризующего тесноту (силу) линейной связи между двумя переменными.
Изменяется в диапазоне от -1 до +1. Положительное значение свидетельствует о прямой линейной связи, отрицательное - об обратной. Чем ближе абсолютное значение коэффициента к единице, тем теснее связь. Считается, что связь достаточно сильная, если коэффициент по абсолютной величине превышает 0,7, и слабая, если он менее 0,3.
5. Даны две выборки случайных величин. Посчитайте их к-т корреляции, сделайте вывод о степени их коррелированности
X |
Y |
|
40 |
35 |
|
55 |
50 |
|
50 |
55 |
|
47,5 |
30 |
|
52,5 |
38 |
Ответ:
Коэффициент корреляции приближен к 1, следовательно, существует сильная связь.
6. Для чего применяется регрессионный анализ? При каких результатах корреляционного анализа есть смысл проводить регрессионный анализ? Перечислите 4 предпосылки регрессионного анализа, напишите модель однофакторного регрессионного анализа
Ответ:
Регрессионный анализ - способ моделирования измеряемых данных и исследования их параметров. Данные состоят из пар значений зависимой переменной (переменной отклика) и независящей переменной (объясняющей переменной). Регрессионная модель есть функция независящей переменной и характеристик с добавленной случайной переменной.
Регрессионный анализ именуют главным способом современной математической статистики для выявления неявных и завуалированных связей меж данными наблюдений.
Регрессионный и корреляционный анализы - это эффективные методы, которые разрешают анализировать значительные объемы информации с целью исследования вероятной взаимосвязи двух и больше переменных. В регрессивном анализе рассматривается связь между одной переменной, которая называется зависимой переменной, или признаком, и несколькими другими, которые называются независимыми переменными. Поскольку целью регрессионного анализа есть выявление влияния переменных X на значение переменной Y, последнюю еще называют откликом, или результативным фактором, а переменные x - факторами, которые влияют на отклик.
С помощью регрессии определяются аналитические зависимости между переменными, а через корреляционный анализ - сила связи между факторами и откликом.
Именно поэтому, что основные статистические проблемы регрессионного анализа решаются анализом корреляций, методы регрессионного и корреляционного анализа тесно связанные между собою.
Применение метода наименьших квадратов для определения параметров регрессии предполагает выполнение некоторых предпосылок.
Отметим наиболее существенные из них.
Предпосылка 1. При нахождении оценок переменной у предполагается существование зависимости переменной у только от тех объясняющих переменных, которые вошли в модель (регрессию). Влияние прочих факторов и случайностей учитывается случайной возмущающей переменной z. При этом полагаем, что для фиксированных значений переменных хi, среднее значение переменной z равно нулю.
Предпосылка 2. Предполагается, что влияние неучтенных факторов постоянно. Так, при рассмотрении временных рядов в различные периоды эти неучтенные факторы оказывают одинаковое влияние.
Предпосылка 3. Отсутствует автокорреляция между возмущающими переменными z.
Предпосылка 4. Число наблюдений должно превышать число параметров регрессии, иначе невозможна оценка этих параметров.
7. Проведите регрессионный анализ для данных из вопроса №5, взяв зависимой переменной Y, зависимой - X. Напишите уравнение регрессии и значение R2.
Ответ:
R2= 0,280264801
Y= -5.7358+0.96604x
отклонение дисперсия корреляция распределение
8. Проведите двухфакторный регрессионный анализ взяв зависимой переменной Y
Y |
24,5 |
12,1 |
18,7 |
15,1 |
15,1 |
|
X1 |
10,1 |
4,5 |
8,7 |
7 |
10,2 |
|
X2 |
15,2 |
7,7 |
9,2 |
8,3 |
5,3 |
Ответ:
По итогам регрессии можно сделать вывод о высокой значимости модели, так как коэффициент детерминации равен 0,48, т.е. 48%. Также можно отметить, что значение F > F критерия, следовательно, имеет место влияние фактора.
9. Расскажите цель применения дисперсионного анализа. Как должны соотноситься межгрупповая и внутригрупповая дисперсия при наличии влияния фактора? Проведите дисперсионный анализ по следующим данным
Отсутствие фактора: |
5 |
7 |
6 |
8 |
7,5 |
|
Слабая степень влияния фактора: |
7 |
8 |
7,5 |
9 |
8,25 |
|
Сильная степень влияния фактора: |
8,1 |
8,5 |
7,25 |
9 |
9,5 |
Подтверждается ли влияние фактора с уровнем значимости 0,05? С каким уровнем значимости присутствует влияние исследуемого фактора?
Ответ:
Основной целью дисперсионного анализа является исследование значимости различия между средними с помощью сравнения (анализа) дисперсий.
Разделение общей дисперсии на несколько источников, позволяет сравнить дисперсию, вызванную различием между группами, с дисперсией, вызванной внутригрупповой изменчивостью. При истинности нулевой гипотезы (о равенстве средних в нескольких группах наблюдений, выбранных из генеральной совокупности), оценка дисперсии, связанной с внутригрупповой изменчивостью, должна быть близкой к оценке межгрупповой дисперсии.
Если вы просто сравниваете средние в двух выборках, дисперсионный анализ даст тот же результат, что и обычный t-критерий для независимых выборок (если сравниваются две независимые группы объектов или наблюдений) или t-критерий для зависимых выборок (если сравниваются две переменные на одном и том же множестве объектов или наблюдений).
межгрупповая дисперсия - это средний квадрат отклонений групповых средних относительно общего среднего
внутригрупповая дисперсия - это средняя арифметическая частных (групповых) дисперсий, взвешенная объемам групп
Размещено на allbest.ru
...Подобные документы
Коэффициент парной линейной корреляции, формула его расчета. Вычисление коэффициента в MS Excel. Оценка достоверности выборочного коэффициента корреляции в качестве нулевой гипотезы. Выборочный критерий Стьюдента. Построение графика зависимости.
научная работа [622,6 K], добавлен 09.11.2014Оценка среднего количества окиси железа в руде, содержащей 25% закиси железа, с помощью уравнения регрессии. Выявление силы корреляции. Выборочное корреляционное отношение. Прямая криволинейная зависимость с высокой теснотой связи между величинами.
лабораторная работа [868,3 K], добавлен 14.05.2014Построение гистограммы и эмпирической функции распределения. Нахождение доверительного интервала для оценки математического распределения. Проверка статистической гипотезы о равенстве средних значений, дисперсий, их величине, о виде закона распределения.
курсовая работа [1,7 M], добавлен 29.11.2014Поиск несмещенных оценок математического ожидания и для дисперсии X и Y. Расчет выборочного коэффициента корреляции, анализ степени тесноты связи между X и Y. Проверка гипотезы о силе линейной связи между X и Y, о значении параметров линейной регрессии.
контрольная работа [19,2 K], добавлен 25.12.2010Оценка социально-экономического развития Финляндии. Установление степени однородности и закономерности распределения рядов данных в среде MS Excel с помощью инструментов "Описательная статистика" и "Скользящее среднее". Расчет коэффициента корреляции.
курсовая работа [176,8 K], добавлен 29.11.2014Расчет параметров парной линейной регрессии. Оценка статистической значимости уравнения регрессии и его параметров с помощью критериев Фишера и Стьюдента. Построение матрицы парных коэффициентов корреляции. Статистический анализ с помощью ППП MS EXCEL.
контрольная работа [1,6 M], добавлен 14.05.2008Понятие корреляционно-регрессионного анализа как метода изучения по выборочным данным статистической зависимости ряда величин. Оценка математического ожидания, дисперсии, среднего квадратического отклонения и коэффициента корреляции случайных величин.
курсовая работа [413,0 K], добавлен 11.08.2012Структурная, аналитическая и комбинационная группировка по признаку-фактору. Расчет среднего количества балансовой прибыли, среднего арифметического значения признака, медианы, моды, дисперсии, среднего квадратического отклонения и коэффициента вариаций.
контрольная работа [194,5 K], добавлен 06.04.2014Расчет выборочной средней, дисперсии, среднего квадратического отклонения и коэффициента вариации. Точечная оценка параметра распределения методом моментов. Решение системы уравнений по формулам Крамера. Определение уравнения тренда для временного ряда.
контрольная работа [130,4 K], добавлен 16.01.2015Построение вариационного (статистического) ряда, гистограммы и эмпирической функции распределения. Определение выборочных оценок числовых характеристик случайной величины. Расчет матрицы парных коэффициентов корреляции и создание модели парной регрессии.
контрольная работа [2,0 M], добавлен 05.04.2014Построение диаграммы рассеяния, иллюстрирующей взаимосвязь переменных, гипотеза о виде их функциональной зависимости. Сущность линейной однофакторной регрессии, интервальные оценки ее коэффициентов. Расчет значения линейного коэффициента корреляции.
контрольная работа [235,6 K], добавлен 04.11.2013Построение поля корреляции, расчет уравнений линейной парной регрессии, на основе данных о заработной плате и потребительских расходах в расчете на душу населения. Анализ коэффициента эластичности, имея уравнение регрессии себестоимости единицы продукции.
контрольная работа [817,3 K], добавлен 01.04.2010Расчет коэффициентов регрессии. Теоретическая и экспериментальная зависимость параметров а и b. Определение значений статистической дисперсии и среднеквадратического отклонения. Составление графика гистограммы распределения признака и кумулятивной прямой.
контрольная работа [679,1 K], добавлен 12.05.2014Нахождение уравнения линейной регрессии, парного коэффициента корреляции. Вычисление точечных оценок для математического ожидания, дисперсии, среднеквадратического отклонения показателей x и y. Построение точечного прогноза для случая расходов на рекламу.
контрольная работа [216,6 K], добавлен 12.05.2010Построение поля корреляции с формулировкой гипотезы о форме связи. Построение моделей парной регрессии. Оценка тесноты связи с помощью коэффициента (индекса) корреляции. Расчет прогнозного значения результата и доверительного интервала прогноза.
контрольная работа [157,9 K], добавлен 06.08.2010Построение поля корреляции по данным, гипотеза о форме связи. Оценка тесноты связи с помощью показателей корреляции и детерминации. Определение коэффициента эластичности и индекса корреляции. Расчет критериев Фишера. Модель денежного и товарного рынков.
контрольная работа [353,7 K], добавлен 21.06.2011Определение методом регрессионного и корреляционного анализа линейных и нелинейных связей между показателями макроэкономического развития. Расчет среднего арифметического по столбцам таблицы. Определение коэффициента корреляции и уравнения регрессии.
контрольная работа [4,2 M], добавлен 14.06.2014Построение модели для зависимой переменной, используя пошаговую множественную регрессию. Рассчет индекса корреляции, оценка качества полученного уравнения регрессии с помощью коэффициента детерминации. Оценка статистической значимости уравнения регрессии.
лабораторная работа [2,1 M], добавлен 25.05.2009Расчет корреляции между экономическими показателями; построение линейной множественной регрессии в программе Excel. Оценка адекватности построенной модели; ее проверка на отсутствие автокорреляции и на гетероскедастичность с помощью теста Бреуша-Пагана.
курсовая работа [61,2 K], добавлен 15.03.2013Построение поля корреляции. Оценка данной зависимости линейной, степенной и гиперболической регрессией. Оценка тесноты связи с помощью показателей корреляции и детерминации. Расчет коэффициента эластичности. Определение доверительного интервала прогноза.
контрольная работа [508,1 K], добавлен 13.11.2011