Разработка массивов в Exсel
Статистическая обработка массивов в рабочем листе в Exсel. Построение гистограммы и контроль исходной информации на наличие грубых ошибок и выбросов. Определение уровня значимости и разработка корреляции и регрессии с учетом распределения признаков.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | практическая работа |
Язык | русский |
Дата добавления | 14.04.2015 |
Размер файла | 30,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Производим контроль исходной информации на наличие грубых ошибок и выбросов:
А) Вводим многомерную выборку своего задания в смежный диапазон ячеек рабочего листа электронной таблицы (ЭТ). Результативный признак разместить после последнего факторного признака.
Б) Для каждого фактора определяем подозрительные значения, используя функцию min, max.
Определяем Х1 в ячейку В22=МАКС(В2:В21), а затем курсором протягиваем формулу до ячейки Е22.
Аналогично определяем функцию МИН для каждого фактора. Для Х1 в ячейку В23 =МИН(В2:В21), протягиваем курсором до ячейки Е23.
Подозрительными значениями будут :
для Х1 - 71,1; 30,8
для Х2 - 442,3; 14,7
для Х3 - 214,3; 0,1
для Y - 38,5; 3,5.
В) Копируем данные, которые оказались под подозрением в отдельную область таблиц и сортируем в порядке возрастания, чтобы экстремальное значение оказалось на месте первого элемента массива. Обозначим первый элемент массива - Х1.
Г)Для выборки малого размера объема (n?25) определяем расчетное значение по формуле:
М=
Где еxсel массив гистограмма регрессия
Х1- это экстремальное значение;
n- последний отсортированный элемент.
Определяем выброс для х1:
Рассчитываем Мrверхнее = 30,8-33,1/30,8-60,8=0,0766.
Расчетное значение М сравниваем с критическим при заданном уровне значимости Мkr20=0,45. Так как Мр. верхнее меньше критического, то в данном случаи выбросов нет.
Mrn=71,7-60,8/71,7-33,1=0,2711
Расчетное значение М сравниваем с критическим при заданном уровне значимости Мkr20=0,45. Так как Mrn меньше критического, то в данном случаи выбросов нет.
Определяем выброс для х2:
Рассчитываем Мr верхнее = 14,7-23,1/14,7-442,3=0,0402
Расчетное значение М сравниваем с критическим при заданном уровне значимости Мkr20=0,45. Так как Мр. верхнее меньше критического, то в данном случаи выбросов нет.
Mrn=442,3 - 223,6/442,3 - 23,1=0,5217
Расчетное значение М сравниваем с критическим при заданном уровне значимости Мkr20=0,45. Так как Mrn больше критического, то строку с этим значением в исходной таблице убираем, так как оно является выбросом.
Определяем Мr верхнее2 = 14,7-23,1/14,7-200,4=0,045
Рассчитываем Mrn2=282,2-200,4/282,2-23,1=0,316
Так как Мr верхнее2, Mrn2 меньше Мkr19=0,462, то в данном случаи выбросов нет.
Определяем выброс для х3:
Рассчитываем Мrверхнее = 0,1-4,4/0,1-104,1=0,041
Расчетное значение М сравниваем с критическим при заданном уровне значимости Мkr20=0,45. Так как Мр. верхнее меньше критического, то в данном случаи выбросов нет.
Mrn=214,3-104,1/214,3-4,4=0,525
Расчетное значение М сравниваем с критическим при заданном уровне значимости Мkr20=0,45. Так как Mrn больше критического, то строку с этим значением в исходной таблице убираем, так как оно является выбросом.
Определяем Мr верхнее2 = 0,1-4,4/0,1-97,3=0,044
Рассчитываем Mrn2=104,1-93,7/104,1-4,4=0,068
Так как Мr верхнее2, Mrn2 меньше Мkr18=0,475, то в данном случаи выбросов нет.
Д) Расчетное значение сравнили с критическим при заданном уровне значимости.
Уровень значимости - это процент ошибки, если расчетное окажется больше критического, то строку с этим значением в исходной таблице убираем, т.к оно является выбросом, если же нет, то подозрительное значение не является выбросом.
В данном случаи значения: 442,3, 214,3, 202 являются выбросом. Строку с этим значением в исходной таблице убираем.
Все основные положения теории корреляции и регрессии разработаны с учетом предположения о нормальном законе распределения исследуемых признаков. Если какой-либо признак не подчиняется нормальному закону распределения, то он не включается в математическую модель.
Основу для выдвижения гипотезы о том, что случайная величина подчиняется нормальному закону распределения, можно получить по гистограмме и числовым характеристикам. Если близки по значению оценки выборочного среднего, моды и медианы, а оценки асимметричности и эксцесса незначительно отличаются от нуля, то случайная величина подчиняется нормальному закону распределения.
После удаления строчек с грубыми ошибками и выбросами выполняется анализ исследуемых признаков на подчинение их нормальному закону распределения.
Инструмент «Описательная статистика» позволяет получить 13 статистических характеристик для десяти и более массивов переменных. Массивы на рабочем листе ЭТ должны быть размещены в смежном диапазоне ячеек, иметь одинаковый размер и заголовки в первой строке.
Для статистической обработки массивов следует выполнить последовательность операций Сервис Анализ данныхОписательная статистика. В диалоговом окне «Описательная статистика» заполняем поля:
1. входной интервал - указываем диапазон ячеек, занимаемых элементами многомерной выборки вместе с заголовками;
2. указываем метки в первой строке;
3. выходной интервал - указываем адрес ячейки, начиная с которой будут размещаться результаты обработки;
4. щелкаем мышью в квадратике «Итоговая статистика».
По данным можно сделать вывод, что среднее близко по значению медианы, а оценки асимметричности и эксцесса незначительно отличаются от нуля, то случайная величина подчиняется нормальному закону распределения.
Функция МОДА возвращает наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. Если множество данных не содержит одинаковых данных, то функция МОДА возвращает значение ошибки #Н/Д.
3. Для результативного признака строим гистограмму Таблица 5. с помощью инструмента «Гистограмма» пакета анализа ЭТ и убедимся, что он подчиняется нормальному закону распределения.
Гистограмма строится для одного из признаков, например, результативного, с помощью инструмента «Гистограмма». Числовые характеристики для всех исследуемых признаков определяются с помощью инструмента «Описательная статистика» пакета анализа. Диалоговое окно «Гистограмма». Для построения гистограммы следует установить курсор на свободную ячейку, войти в меню Сервис, выбрать операцию Анализ данных и в появившемся диалоговом окне выбрать инструмент пакета анализа Гистограмма.
С помощью инструмента «Корреляция» пакета анализа ЭТ получаем корреляционную матрицу многомерной выборки.
Корреляционная зависимость проявляется при большом количестве данных. Существуют определенные требования к исходной информации, а именно рассматриваемые объекты выборки должны быть однотипными. Выборка должна быть многочисленная. Для всех элементов выборки признак, который рассматривается должен иметь одинаковую размерность и одинаковую точность.
В математическую модель должны включатся независимые друг от друга факторные признаки и те, которые функционально связаны с результативным признаком.
Рассмотрим парную линейную корреляцию, тоесть связь между признаками один из которых является фактором, а другой результатом.
Для парной связи, кроме обратной и прямой можно выделить линейную и нелинейную связи. Вид связи, что по направлению и линейности можно определить при помощи корреляционного поля.
Для построения диаграммы Y от х1 выделяем диапазон ячеек х1 и Y, а затем используем Мастер диаграмм>Точечная>Ok.
Для построения диаграммы Y от х2 выделяем диапазон ячеек х2 и Y, а затем используем Мастер диаграмм>Точечная>Ok.
Для построения диаграммы Y от х3 выделяем диапазон ячеек х3 и Y, а затем используем Мастер диаграмм>Точечная>Ok.
По корреляционной матрице и корреляционному полю выполняем анализ парной корреляции, т.е. устанавливаем по знакам коэффициентов парной корреляции наличие прямой или обратной связи, а по расположению точек корреляционного поля (без точек выброса) - линейной или нелинейной зависимости. Кроме того, по абсолютной величине коэффициента парной корреляции оцениваем тесноту связи.
Для получения парных линейных коэффициентов корреляции используем инструмент корреляция пакета анализа.
Сервис> пакет анализа > корреляция
После построения корреляционной матрицы для возможности создания парной линейной модели из всех предложенных факторов выбирают тот, который с результатом имеет самый большой коэффициент корреляции, в нашем случае самый большой коэффициент в х2.
Так как полученное значение имеет положительный знак - связь прямая, заметная.
При анализе тесноты связи, кроме коэффициента корреляции, рассмотрим коэффициент детерминации R2
R2=r2xy
Он показывает долю изменения результативного признака под влиянием факторного
R2=0,5995
На 59,95% вариация зависит от вариации изминения х (факторный признак).
Выполняем парный регрессионный анализ, включяя в математическую модель результативный признак и наиболее значимый по тесноте связи факторный признак. Уравнение линейной регрессии получить с помощью инструмента «Регрессия» пакета анализа ЭТ. Уравнение нелинейной регрессии получить, используя метод наименьших квадратов и надстройку «Поиск решения». Оцениваем значимость коэффициентов уравнения линейной регрессии и самого уравнения по соответствующим критериям. Анализ качества уравнения нелинейной регрессии выполнить по критерию Фишера и коэффициенту парной корреляции. Выполняем точечный и интервальный прогноз на основе полученной модели.
Запишем математическую модель парной линейной регрессии в виде
Y=b0+b1x
Регрессия - это односторонняя статистическая зависимость устанавливающая соответствие между случайными переменными.
Уравнение описывающее такую связь называется регрессионным, так как одному и тому же значению х соответствует несколько разных значений y, то эти значения усредняют.
Уравнение парной линейной регрессии будет иметь вид:
Yx=a0+a1x
Параметры регрессии определим с помощью инструмента «Регрессия» пакета анализа.
Приведена следующая информация:
ячейка В4 - множественный коэффициент корреляции (в данном случае это коэффициент парной корреляции );
ячейка В5 - коэффициент детерминации
ячейка В5 - нормированный коэффициент детерминации, определяемый по формуле
где - объем выборки, - число неизвестных параметров уравнения регрессии. Коэффициент детерминации корректируется с учетом числа факторных признаков.
ячейка В7 - стандартная ошибка ;
ячейка В8 - объем выборки ;
ячейка В12 - число степеней свободы для определения критического значения критерия Фишера;
ячейка В13 - число степеней свободы для определения критического значения критерия Фишера;
ячейка С12 - сумма квадратов разностей между расчетными значениями и средним значением результативного признака т.е. сумма квадратов, объясняемая регрессией ( );
ячейка С13 -остаточная сумма квадратов, т.е. сумма квадратов отклонений ;
ячейка D13 - остаточная дисперсия
ячейка Е12 - расчетное значение критерия Фишера;
ячейка В17 - коэффициент уравнения регрессии;
ячейка В18 - коэффициент уравнения регрессии;
ячейка С17 - стандартная ошибка коэффициента ;
ячейка С18 - стандартная ошибка коэффициента ;
ячейка D17 - расчетное значение статистики коэффициента
ячейка D18 - расчетное значение статистики коэффициента ;
ячейка Е17 - значение коэффициента ;
ячейка Е18 -значение коэффициента ;
ячейки F17:F18 - нижние границы доверительных интервалов соответствующих коэффициентов уравнения регрессии;
ячейки G17:G18 -верхние границы доверительных интервалов этих коэффициентов.
Для оценки статистической значимости коэффициентов регрессии удобно использовать метод значение (value). Обозначив через уровень значимости, получают следующее правило принятия решения:
принять нулевую гипотезу о том, что коэффициент регрессии может быть равен нулю, если
отвергнуть нулевую гипотезу, если
Следовательно, уравнение парной линейной регрессии имеет вид:
Yx = 44,2814 - 0,3766х1 - 0,0931х2+0,1563х3 (23)
Выполним анализ качества полученной модели регрессии:
R2 = 0,4079 следовательно, только 40,8% дисперсии рентабельности объясняется влиянием факторного признака «премии и вознаграждения», т.е. необходимо включить в математическую модель регрессии другие факторные признаки и выполнить многомерный регрессионный анализ;
Fрасч.=0,055. Критическое значение критерия Фишера при m1=3; m2=14; б=0,05; F= 3,2156. Следовательно, уравнение регрессии (23) в целом статистически значимо, т.е. имеется хорошее соответствие данным наблюдений;
Критическое значение - статистики. Для коэффициентов уравнения регрессии расчетные значения - статистики соответственно равны 4,3396, -1,5867, -2,1331, 1,6898 т.е. оба коэффициента регрессии статистически значимы. Об этом же свидетельствуют: - значение (<0,05) и доверительные интервалы (нижние 95% и верхние 95%) для этих коэффициентов. Следовательно, нулевая гипотеза о том, что параметры регрессии могут принимать нулевые значения отвергается.
Выполняем многомерный линейный регрессионный анализ с помощью инструмента «Регрессия» пакета анализа. В математическую модель включаем все независимые между собой факторные признаки. Оцениваем значимость каждого коэффициента уравнения регрессии и уравнения в целом. Выполняем точечный и интервальный прогноз на основе полученной модели.
Так как факторные признаки и зависимы между собой, то их нельзя вместе вводить в математическую модель многомерной регрессии.
Математическая модель многомерной линейной регрессии:
(26)
Математическая запись метода наименьших квадратов:
(27)
Коэффициенты регрессии определяем с помощью инструмента «Регрессия» пакета анализа.
Анализ результатов расчета:
Уравнение многомерной линейной регрессии
Yx = 44,2814 - 0,3766х1 - 0,0931х2+0,1563х3
Критическое значение - статистики равно 2,009. Для коэффициента регрессии при факторном признаке расчетное значение - статистики меньше критического и Р - значение больше 0,05, т.е. этот коэффициент статистически не значим и он может принимать нулевые значения.
Критическое значение критерия Фишера равно 10,2038. Расчетное значение критерия больше критического, следовательно, уравнение регрессии в целом статистически значимо и его можно использовать для прогноза.
Коэффициент детерминации меньше 0,5. Следовательно, среди неучтенных факторных признаков есть еще более существенные, которые необходимо включить в математическую модель многомерной регрессии.
Точечный прогноз: среднее значение рентабельности при и равно 19,4488 %.
Интервальный прогноз: с вероятностью 95% рентабельность предприятия будет находиться в пределах от 22,3962 до 66,1665 %.
9. Парный нелинейный регрессионный анализ
Запишем уравнение парной нелинейной регрессии
Yx=a0+a1x2+a2x22 (24)
Для этого случая математическая запись метода наименьших квадратов имеет вид:
(25)
Параметры регрессии определяем с помощью надстройки «Поиск решения». В качестве целевой функции принимаем выражение (25). Так как параметры регрессии могут принимать любые значения, то ограничения и граничные условия в математической модели оптимизации отсутствуют.
Анализ результатов расчета.
Уравнение парной нелинейной регрессии
Yx = 31,5793 - 0,05522 x2- 0,00008x22
Коэффициент парной корреляции ryY=0,4667 т.е. связь между фактическими и теоретическими значениями результативного признака умеренная.
Расчетное значение критерия Фишера больше критического, следовательно, уравнение регрессии в целом статистически значимо и его можно использовать для прогноза.
Точечный прогноз: среднее значение рентабельности при равно 20,147 %.
Подставив в уравнение регрессии соответствующие значения факторного признака, можно определить теоретические значения результативного признака для каждого предприятия. Например, чтобы рассчитать рентабельность для первого предприятия, в котором премии и вознаграждения на одного работника составляют 1,23 %, необходимо это значение подставить в уравнение регрессии:
Полученная величина показывает, какой бы была рентабельность предприятия при премиях 1,23%, если бы данное предприятие использовало свои производственные возможности в такой степени, как в среднем все предприятия. Фактическое значение рентабельности первого предприятия Следовательно, первое предприятие использует свои возможности хуже, чем в среднем все исследуемые предприятия.
Выполнить многомерный нелинейный регрессионный анализ, используя метод наименьших квадратов и надстройку «Поиск решения». В математическую модель включить результативный признак и два независимых между собой и наиболее значимых факторных признака. Оценить уравнение регрессии по критерию Фишера и коэффициенту парной корреляции. Выполнить точечный прогноз на основе полученной модели.
Запишем математическую модель регрессии
(28)
Математическую запись метода наименьших квадратов представим в виде:
(29)
Параметры регрессии определяем в среде ЭТ с помощью надстройки «Поиск решения».
Анализ результатов расчета.
Уравнение многомерной нелинейной регрессии
Yx=-0,95+0,0003х2-0,0009х3+0,0002х22+0,0111х2х3-0,0198х32
Коэффициент парной корреляции равен -0,4203 т.е. связь между фактическими и теоретическими значениями результативного признака обратная.
Расчетное значение критерия Фишера больше критического, следовательно, уравнение регрессии в целом статистически значимо и его можно использовать для прогноза.
Точечный прогноз: среднее значение Y при х2=158,9 и х3=81,8 равно -0,1861%.
Выполняем прогноз на основе методов оптимизации - определяем значения факторных признаков, обеспечивающих заданное значение результативного признака.
Целевая функция
Yx=-0,95+0,0003х2-0,0009х3+0,0002х22+0,0111х2х3-0,0198х32=
Ограничения:
Граничные условия:
Так как целевая функция нелинейная, то имеем задачу нелинейного программирования. Для ее решения используем надстройку «Поиск решения».
Размещено на Allbest.ru
...Подобные документы
Разработка программ на языке Turbo Pascal на основе использования массивов данных. Особенности хранения данных, способы объявления переменных, действия над элементами массивов, их ввод и вывод. Практическое применение одномерных и многомерных массивов.
методичка [17,8 K], добавлен 25.11.2010Реализация различных методов сортировки. Алгоритмические языки программирования. Обработка большого числа единообразно организованных данных. Алгоритмы сортировки массивов. Анализ проблем реализации и использования различных видов сортировок массивов.
курсовая работа [640,3 K], добавлен 07.07.2011Ознакомление с основными понятиями и организацией ввода-вывода, обработкой массивов. Описание одномерных и двумерных массивов. Описание строк и операции с ними. Комбинированный тип данных - записи. Характеристика записей, использующих вариантную часть.
реферат [84,6 K], добавлен 09.02.2011Обработка данных в электронных таблицах. Создание данных с заданной структурой в Microsoft Office Exсel: сортировка, фильтр, вычисляемый критерий, сводная таблица, промежуточные итоги. Работа с формами, отчетами, запросами в среде Microsoft Office Access.
курсовая работа [4,9 M], добавлен 24.05.2015Разработка и реализация типовых алгоритмов обработки одномерных массивов на языке Delphi. Максимальный и минимальный элемент массива. Значение и расположение элементов массива. Элементы массива, находящиеся перед максимальным или минимальным элементом.
лабораторная работа [12,8 K], добавлен 02.12.2014Построение корреляционного поля, гипотеза связи исследуемых факторов. Определение коэффициента корреляции. Оценка статистической значимости вычисленных коэффициентов корреляции. Параметры уравнения линейной парной регрессии, коэффициента эластичности.
реферат [526,7 K], добавлен 10.11.2010Структура – это объединение одного либо более объектов (переменных, массивов, указателей, других структур). Понятие структурной переменной. Создание массивов структур. Использование вложенных структур в виде элементов массивов person, date, pibm.
лабораторная работа [17,6 K], добавлен 15.07.2010Работа с массивами, их ввод и вывод, организация программ циклической структуры. Способы описания и использования массивов, алгоритмы их сортировки, сортировка выбором и вставками. Алгоритмы поиска элемента в неупорядоченном и упорядоченном массивах.
лабораторная работа [14,2 K], добавлен 03.10.2010Понятие массива и правила описания массивов в программах на языке С. Рассмотрение основных алгоритмов обработки одномерных массивов. Примеры программ на языке С для всех рассмотренных алгоритмов. Примеры решения задач по обработке одномерных массивов.
учебное пособие [1,1 M], добавлен 22.02.2011Разработка программы для решения инженерных задач с использованием функций, процедур и сложных типов данных, в том числе динамических массивов и объединений. Интерфейс ввода/вывода. Схемы алгоритмов отдельных подзадач. Технические требования к программе.
курсовая работа [60,7 K], добавлен 26.11.2012Изучение понятия и основных видов массивов. Ввод массива с клавиатуры и вывод на экран. Сортировка массивов. Метод простых обменов (пузырьковая сортировка). Сортировка простым выбором и простым включением. Решение задач с использованием массивов Паскаля.
курсовая работа [82,1 K], добавлен 18.03.2013Обработка текстовых данных, хранящихся в файле. Задачи и алгоритмы обработки больших массивов действительных и натуральных чисел. Практические задачи по алгоритмам обработки данных. Решение задачи о пяти ферзях. Программа, которая реализует сортировку Шел
курсовая работа [29,2 K], добавлен 09.02.2011Исследование основных отличий ассоциативных массивов от массивов скаляров. Разработка библиотеки классов. Выбор языка программирования. Сравнение языка C++ с Delphi, Java и JavaScript. Изучение методики тестирования и структуры тестового приложения.
практическая работа [390,2 K], добавлен 06.01.2013Аппаратные и программные RAID-массивы. Расчет объема массива. Временные затраты на расчет и запись контрольных сумм. Пример распределения файлов по JBOD-массиву. Вероятности отказа каждого диска в массиве. Сравнение стандартных уровней RAID-массивов.
курсовая работа [3,0 M], добавлен 28.03.2011Создание и редактирование таблиц в Excel, выполнение сортировки и переименование ячеек. Работа формул массивов и определение адреса ячейки, расположенной на другом листе. Различия относительной и абсолютной адресации. Функции для работы с базой данных.
контрольная работа [786,1 K], добавлен 23.12.2010Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели. Оценка параметров регрессии по методу наименьших квадратов. Нахождение определителей матриц. Применение инструмента Регрессия.
контрольная работа [1,0 M], добавлен 13.01.2013Понятие и назначение, основы создания RAID–массивов, принципы их работы и законы функционирования. Классификация и разновидности систем RAID, их отличительные признаки, оценка преимуществ и недостатков каждого вида. Тестовая разработка RAID-массива.
курсовая работа [1,7 M], добавлен 24.04.2010Ознакомление с особенностями программной реализации алгоритмов преобразования одномерных массивов. Исследование развития вычислительной техники, которое подразумевает использование компьютерных и информационных технологий. Изучение интерфейса программы.
курсовая работа [1,0 M], добавлен 02.06.2017Широкое использование компьютерных и информационных технологий. Концепции типов данных. Алгоритмы сортировки одномерных массивов. Описание двумерного массива Паскаля. Методы доступа к элементам массивов. Индексные, динамические и гетерогенные массивы.
курсовая работа [66,3 K], добавлен 07.12.2010Алгоритм по обработке массивов таким образом, чтобы группы, состоящие из трех или более подряд стоящих нулей, были переписаны в начало массива. Сортировка полученных массивов методом всплывающего пузырька. Вывод на дисплей монитора обновленной матрицы.
курсовая работа [300,1 K], добавлен 30.08.2011