Разработка массивов в Exсel

Статистическая обработка массивов в рабочем листе в Exсel. Построение гистограммы и контроль исходной информации на наличие грубых ошибок и выбросов. Определение уровня значимости и разработка корреляции и регрессии с учетом распределения признаков.

Рубрика Программирование, компьютеры и кибернетика
Вид практическая работа
Язык русский
Дата добавления 14.04.2015
Размер файла 30,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Производим контроль исходной информации на наличие грубых ошибок и выбросов:

А) Вводим многомерную выборку своего задания в смежный диапазон ячеек рабочего листа электронной таблицы (ЭТ). Результативный признак разместить после последнего факторного признака.

Б) Для каждого фактора определяем подозрительные значения, используя функцию min, max.

Определяем Х1 в ячейку В22=МАКС(В2:В21), а затем курсором протягиваем формулу до ячейки Е22.

Аналогично определяем функцию МИН для каждого фактора. Для Х1 в ячейку В23 =МИН(В2:В21), протягиваем курсором до ячейки Е23.

Подозрительными значениями будут :

для Х1 - 71,1; 30,8

для Х2 - 442,3; 14,7

для Х3 - 214,3; 0,1

для Y - 38,5; 3,5.

В) Копируем данные, которые оказались под подозрением в отдельную область таблиц и сортируем в порядке возрастания, чтобы экстремальное значение оказалось на месте первого элемента массива. Обозначим первый элемент массива - Х1.

Г)Для выборки малого размера объема (n?25) определяем расчетное значение по формуле:

М=

Где еxсel массив гистограмма регрессия

Х1- это экстремальное значение;

n- последний отсортированный элемент.

Определяем выброс для х1:

Рассчитываем Мrверхнее = 30,8-33,1/30,8-60,8=0,0766.

Расчетное значение М сравниваем с критическим при заданном уровне значимости Мkr20=0,45. Так как Мр. верхнее меньше критического, то в данном случаи выбросов нет.

Mrn=71,7-60,8/71,7-33,1=0,2711

Расчетное значение М сравниваем с критическим при заданном уровне значимости Мkr20=0,45. Так как Mrn меньше критического, то в данном случаи выбросов нет.

Определяем выброс для х2:

Рассчитываем Мr верхнее = 14,7-23,1/14,7-442,3=0,0402

Расчетное значение М сравниваем с критическим при заданном уровне значимости Мkr20=0,45. Так как Мр. верхнее меньше критического, то в данном случаи выбросов нет.

Mrn=442,3 - 223,6/442,3 - 23,1=0,5217

Расчетное значение М сравниваем с критическим при заданном уровне значимости Мkr20=0,45. Так как Mrn больше критического, то строку с этим значением в исходной таблице убираем, так как оно является выбросом.

Определяем Мr верхнее2 = 14,7-23,1/14,7-200,4=0,045

Рассчитываем Mrn2=282,2-200,4/282,2-23,1=0,316

Так как Мr верхнее2, Mrn2 меньше Мkr19=0,462, то в данном случаи выбросов нет.

Определяем выброс для х3:

Рассчитываем Мrверхнее = 0,1-4,4/0,1-104,1=0,041

Расчетное значение М сравниваем с критическим при заданном уровне значимости Мkr20=0,45. Так как Мр. верхнее меньше критического, то в данном случаи выбросов нет.

Mrn=214,3-104,1/214,3-4,4=0,525

Расчетное значение М сравниваем с критическим при заданном уровне значимости Мkr20=0,45. Так как Mrn больше критического, то строку с этим значением в исходной таблице убираем, так как оно является выбросом.

Определяем Мr верхнее2 = 0,1-4,4/0,1-97,3=0,044

Рассчитываем Mrn2=104,1-93,7/104,1-4,4=0,068

Так как Мr верхнее2, Mrn2 меньше Мkr18=0,475, то в данном случаи выбросов нет.

Д) Расчетное значение сравнили с критическим при заданном уровне значимости.

Уровень значимости - это процент ошибки, если расчетное окажется больше критического, то строку с этим значением в исходной таблице убираем, т.к оно является выбросом, если же нет, то подозрительное значение не является выбросом.

В данном случаи значения: 442,3, 214,3, 202 являются выбросом. Строку с этим значением в исходной таблице убираем.

Все основные положения теории корреляции и регрессии разработаны с учетом предположения о нормальном законе распределения исследуемых признаков. Если какой-либо признак не подчиняется нормальному закону распределения, то он не включается в математическую модель.

Основу для выдвижения гипотезы о том, что случайная величина подчиняется нормальному закону распределения, можно получить по гистограмме и числовым характеристикам. Если близки по значению оценки выборочного среднего, моды и медианы, а оценки асимметричности и эксцесса незначительно отличаются от нуля, то случайная величина подчиняется нормальному закону распределения.

После удаления строчек с грубыми ошибками и выбросами выполняется анализ исследуемых признаков на подчинение их нормальному закону распределения.

Инструмент «Описательная статистика» позволяет получить 13 статистических характеристик для десяти и более массивов переменных. Массивы на рабочем листе ЭТ должны быть размещены в смежном диапазоне ячеек, иметь одинаковый размер и заголовки в первой строке.

Для статистической обработки массивов следует выполнить последовательность операций Сервис Анализ данныхОписательная статистика. В диалоговом окне «Описательная статистика» заполняем поля:

1. входной интервал - указываем диапазон ячеек, занимаемых элементами многомерной выборки вместе с заголовками;

2. указываем метки в первой строке;

3. выходной интервал - указываем адрес ячейки, начиная с которой будут размещаться результаты обработки;

4. щелкаем мышью в квадратике «Итоговая статистика».

По данным можно сделать вывод, что среднее близко по значению медианы, а оценки асимметричности и эксцесса незначительно отличаются от нуля, то случайная величина подчиняется нормальному закону распределения.

Функция МОДА возвращает наиболее часто встречающееся или повторяющееся значение в массиве или интервале данных. Если множество данных не содержит одинаковых данных, то функция МОДА возвращает значение ошибки #Н/Д.

3. Для результативного признака строим гистограмму Таблица 5. с помощью инструмента «Гистограмма» пакета анализа ЭТ и убедимся, что он подчиняется нормальному закону распределения.

Гистограмма строится для одного из признаков, например, результативного, с помощью инструмента «Гистограмма». Числовые характеристики для всех исследуемых признаков определяются с помощью инструмента «Описательная статистика» пакета анализа. Диалоговое окно «Гистограмма». Для построения гистограммы следует установить курсор на свободную ячейку, войти в меню Сервис, выбрать операцию Анализ данных и в появившемся диалоговом окне выбрать инструмент пакета анализа Гистограмма.

С помощью инструмента «Корреляция» пакета анализа ЭТ получаем корреляционную матрицу многомерной выборки.

Корреляционная зависимость проявляется при большом количестве данных. Существуют определенные требования к исходной информации, а именно рассматриваемые объекты выборки должны быть однотипными. Выборка должна быть многочисленная. Для всех элементов выборки признак, который рассматривается должен иметь одинаковую размерность и одинаковую точность.

В математическую модель должны включатся независимые друг от друга факторные признаки и те, которые функционально связаны с результативным признаком.

Рассмотрим парную линейную корреляцию, тоесть связь между признаками один из которых является фактором, а другой результатом.

Для парной связи, кроме обратной и прямой можно выделить линейную и нелинейную связи. Вид связи, что по направлению и линейности можно определить при помощи корреляционного поля.

Для построения диаграммы Y от х1 выделяем диапазон ячеек х1 и Y, а затем используем Мастер диаграмм>Точечная>Ok.

Для построения диаграммы Y от х2 выделяем диапазон ячеек х2 и Y, а затем используем Мастер диаграмм>Точечная>Ok.

Для построения диаграммы Y от х3 выделяем диапазон ячеек х3 и Y, а затем используем Мастер диаграмм>Точечная>Ok.

По корреляционной матрице и корреляционному полю выполняем анализ парной корреляции, т.е. устанавливаем по знакам коэффициентов парной корреляции наличие прямой или обратной связи, а по расположению точек корреляционного поля (без точек выброса) - линейной или нелинейной зависимости. Кроме того, по абсолютной величине коэффициента парной корреляции оцениваем тесноту связи.

Для получения парных линейных коэффициентов корреляции используем инструмент корреляция пакета анализа.

Сервис> пакет анализа > корреляция

После построения корреляционной матрицы для возможности создания парной линейной модели из всех предложенных факторов выбирают тот, который с результатом имеет самый большой коэффициент корреляции, в нашем случае самый большой коэффициент в х2.

Так как полученное значение имеет положительный знак - связь прямая, заметная.

При анализе тесноты связи, кроме коэффициента корреляции, рассмотрим коэффициент детерминации R2

R2=r2xy

Он показывает долю изменения результативного признака под влиянием факторного

R2=0,5995

На 59,95% вариация зависит от вариации изминения х (факторный признак).

Выполняем парный регрессионный анализ, включяя в математическую модель результативный признак и наиболее значимый по тесноте связи факторный признак. Уравнение линейной регрессии получить с помощью инструмента «Регрессия» пакета анализа ЭТ. Уравнение нелинейной регрессии получить, используя метод наименьших квадратов и надстройку «Поиск решения». Оцениваем значимость коэффициентов уравнения линейной регрессии и самого уравнения по соответствующим критериям. Анализ качества уравнения нелинейной регрессии выполнить по критерию Фишера и коэффициенту парной корреляции. Выполняем точечный и интервальный прогноз на основе полученной модели.

Запишем математическую модель парной линейной регрессии в виде

Y=b0+b1x

Регрессия - это односторонняя статистическая зависимость устанавливающая соответствие между случайными переменными.

Уравнение описывающее такую связь называется регрессионным, так как одному и тому же значению х соответствует несколько разных значений y, то эти значения усредняют.

Уравнение парной линейной регрессии будет иметь вид:

Yx=a0+a1x

Параметры регрессии определим с помощью инструмента «Регрессия» пакета анализа.

Приведена следующая информация:

ячейка В4 - множественный коэффициент корреляции (в данном случае это коэффициент парной корреляции );

ячейка В5 - коэффициент детерминации

ячейка В5 - нормированный коэффициент детерминации, определяемый по формуле

где - объем выборки, - число неизвестных параметров уравнения регрессии. Коэффициент детерминации корректируется с учетом числа факторных признаков.

ячейка В7 - стандартная ошибка ;

ячейка В8 - объем выборки ;

ячейка В12 - число степеней свободы для определения критического значения критерия Фишера;

ячейка В13 - число степеней свободы для определения критического значения критерия Фишера;

ячейка С12 - сумма квадратов разностей между расчетными значениями и средним значением результативного признака т.е. сумма квадратов, объясняемая регрессией ( );

ячейка С13 -остаточная сумма квадратов, т.е. сумма квадратов отклонений ;

ячейка D13 - остаточная дисперсия

ячейка Е12 - расчетное значение критерия Фишера;

ячейка В17 - коэффициент уравнения регрессии;

ячейка В18 - коэффициент уравнения регрессии;

ячейка С17 - стандартная ошибка коэффициента ;

ячейка С18 - стандартная ошибка коэффициента ;

ячейка D17 - расчетное значение статистики коэффициента

ячейка D18 - расчетное значение статистики коэффициента ;

ячейка Е17 - значение коэффициента ;

ячейка Е18 -значение коэффициента ;

ячейки F17:F18 - нижние границы доверительных интервалов соответствующих коэффициентов уравнения регрессии;

ячейки G17:G18 -верхние границы доверительных интервалов этих коэффициентов.

Для оценки статистической значимости коэффициентов регрессии удобно использовать метод значение (value). Обозначив через уровень значимости, получают следующее правило принятия решения:

принять нулевую гипотезу о том, что коэффициент регрессии может быть равен нулю, если

отвергнуть нулевую гипотезу, если

Следовательно, уравнение парной линейной регрессии имеет вид:

Yx = 44,2814 - 0,3766х1 - 0,0931х2+0,1563х3 (23)

Выполним анализ качества полученной модели регрессии:

R2 = 0,4079 следовательно, только 40,8% дисперсии рентабельности объясняется влиянием факторного признака «премии и вознаграждения», т.е. необходимо включить в математическую модель регрессии другие факторные признаки и выполнить многомерный регрессионный анализ;

Fрасч.=0,055. Критическое значение критерия Фишера при m1=3; m2=14; б=0,05; F= 3,2156. Следовательно, уравнение регрессии (23) в целом статистически значимо, т.е. имеется хорошее соответствие данным наблюдений;

Критическое значение - статистики. Для коэффициентов уравнения регрессии расчетные значения - статистики соответственно равны 4,3396, -1,5867, -2,1331, 1,6898 т.е. оба коэффициента регрессии статистически значимы. Об этом же свидетельствуют: - значение (<0,05) и доверительные интервалы (нижние 95% и верхние 95%) для этих коэффициентов. Следовательно, нулевая гипотеза о том, что параметры регрессии могут принимать нулевые значения отвергается.

Выполняем многомерный линейный регрессионный анализ с помощью инструмента «Регрессия» пакета анализа. В математическую модель включаем все независимые между собой факторные признаки. Оцениваем значимость каждого коэффициента уравнения регрессии и уравнения в целом. Выполняем точечный и интервальный прогноз на основе полученной модели.

Так как факторные признаки и зависимы между собой, то их нельзя вместе вводить в математическую модель многомерной регрессии.

Математическая модель многомерной линейной регрессии:

(26)

Математическая запись метода наименьших квадратов:

(27)

Коэффициенты регрессии определяем с помощью инструмента «Регрессия» пакета анализа.

Анализ результатов расчета:

Уравнение многомерной линейной регрессии

Yx = 44,2814 - 0,3766х1 - 0,0931х2+0,1563х3

Критическое значение - статистики равно 2,009. Для коэффициента регрессии при факторном признаке расчетное значение - статистики меньше критического и Р - значение больше 0,05, т.е. этот коэффициент статистически не значим и он может принимать нулевые значения.

Критическое значение критерия Фишера равно 10,2038. Расчетное значение критерия больше критического, следовательно, уравнение регрессии в целом статистически значимо и его можно использовать для прогноза.

Коэффициент детерминации меньше 0,5. Следовательно, среди неучтенных факторных признаков есть еще более существенные, которые необходимо включить в математическую модель многомерной регрессии.

Точечный прогноз: среднее значение рентабельности при и равно 19,4488 %.

Интервальный прогноз: с вероятностью 95% рентабельность предприятия будет находиться в пределах от 22,3962 до 66,1665 %.

9. Парный нелинейный регрессионный анализ

Запишем уравнение парной нелинейной регрессии

Yx=a0+a1x2+a2x22 (24)

Для этого случая математическая запись метода наименьших квадратов имеет вид:

(25)

Параметры регрессии определяем с помощью надстройки «Поиск решения». В качестве целевой функции принимаем выражение (25). Так как параметры регрессии могут принимать любые значения, то ограничения и граничные условия в математической модели оптимизации отсутствуют.

Анализ результатов расчета.

Уравнение парной нелинейной регрессии

Yx = 31,5793 - 0,05522 x2- 0,00008x22

Коэффициент парной корреляции ryY=0,4667 т.е. связь между фактическими и теоретическими значениями результативного признака умеренная.

Расчетное значение критерия Фишера больше критического, следовательно, уравнение регрессии в целом статистически значимо и его можно использовать для прогноза.

Точечный прогноз: среднее значение рентабельности при равно 20,147 %.

Подставив в уравнение регрессии соответствующие значения факторного признака, можно определить теоретические значения результативного признака для каждого предприятия. Например, чтобы рассчитать рентабельность для первого предприятия, в котором премии и вознаграждения на одного работника составляют 1,23 %, необходимо это значение подставить в уравнение регрессии:

Полученная величина показывает, какой бы была рентабельность предприятия при премиях 1,23%, если бы данное предприятие использовало свои производственные возможности в такой степени, как в среднем все предприятия. Фактическое значение рентабельности первого предприятия Следовательно, первое предприятие использует свои возможности хуже, чем в среднем все исследуемые предприятия.

Выполнить многомерный нелинейный регрессионный анализ, используя метод наименьших квадратов и надстройку «Поиск решения». В математическую модель включить результативный признак и два независимых между собой и наиболее значимых факторных признака. Оценить уравнение регрессии по критерию Фишера и коэффициенту парной корреляции. Выполнить точечный прогноз на основе полученной модели.

Запишем математическую модель регрессии

(28)

Математическую запись метода наименьших квадратов представим в виде:

(29)

Параметры регрессии определяем в среде ЭТ с помощью надстройки «Поиск решения».

Анализ результатов расчета.

Уравнение многомерной нелинейной регрессии

Yx=-0,95+0,0003х2-0,0009х3+0,0002х22+0,0111х2х3-0,0198х32

Коэффициент парной корреляции равен -0,4203 т.е. связь между фактическими и теоретическими значениями результативного признака обратная.

Расчетное значение критерия Фишера больше критического, следовательно, уравнение регрессии в целом статистически значимо и его можно использовать для прогноза.

Точечный прогноз: среднее значение Y при х2=158,9 и х3=81,8 равно -0,1861%.

Выполняем прогноз на основе методов оптимизации - определяем значения факторных признаков, обеспечивающих заданное значение результативного признака.

Целевая функция

Yx=-0,95+0,0003х2-0,0009х3+0,0002х22+0,0111х2х3-0,0198х32=

Ограничения:

Граничные условия:

Так как целевая функция нелинейная, то имеем задачу нелинейного программирования. Для ее решения используем надстройку «Поиск решения».

Размещено на Allbest.ru

...

Подобные документы

  • Разработка программ на языке Turbo Pascal на основе использования массивов данных. Особенности хранения данных, способы объявления переменных, действия над элементами массивов, их ввод и вывод. Практическое применение одномерных и многомерных массивов.

    методичка [17,8 K], добавлен 25.11.2010

  • Реализация различных методов сортировки. Алгоритмические языки программирования. Обработка большого числа единообразно организованных данных. Алгоритмы сортировки массивов. Анализ проблем реализации и использования различных видов сортировок массивов.

    курсовая работа [640,3 K], добавлен 07.07.2011

  • Ознакомление с основными понятиями и организацией ввода-вывода, обработкой массивов. Описание одномерных и двумерных массивов. Описание строк и операции с ними. Комбинированный тип данных - записи. Характеристика записей, использующих вариантную часть.

    реферат [84,6 K], добавлен 09.02.2011

  • Обработка данных в электронных таблицах. Создание данных с заданной структурой в Microsoft Office Exсel: сортировка, фильтр, вычисляемый критерий, сводная таблица, промежуточные итоги. Работа с формами, отчетами, запросами в среде Microsoft Office Access.

    курсовая работа [4,9 M], добавлен 24.05.2015

  • Разработка и реализация типовых алгоритмов обработки одномерных массивов на языке Delphi. Максимальный и минимальный элемент массива. Значение и расположение элементов массива. Элементы массива, находящиеся перед максимальным или минимальным элементом.

    лабораторная работа [12,8 K], добавлен 02.12.2014

  • Построение корреляционного поля, гипотеза связи исследуемых факторов. Определение коэффициента корреляции. Оценка статистической значимости вычисленных коэффициентов корреляции. Параметры уравнения линейной парной регрессии, коэффициента эластичности.

    реферат [526,7 K], добавлен 10.11.2010

  • Структура – это объединение одного либо более объектов (переменных, массивов, указателей, других структур). Понятие структурной переменной. Создание массивов структур. Использование вложенных структур в виде элементов массивов person, date, pibm.

    лабораторная работа [17,6 K], добавлен 15.07.2010

  • Работа с массивами, их ввод и вывод, организация программ циклической структуры. Способы описания и использования массивов, алгоритмы их сортировки, сортировка выбором и вставками. Алгоритмы поиска элемента в неупорядоченном и упорядоченном массивах.

    лабораторная работа [14,2 K], добавлен 03.10.2010

  • Понятие массива и правила описания массивов в программах на языке С. Рассмотрение основных алгоритмов обработки одномерных массивов. Примеры программ на языке С для всех рассмотренных алгоритмов. Примеры решения задач по обработке одномерных массивов.

    учебное пособие [1,1 M], добавлен 22.02.2011

  • Разработка программы для решения инженерных задач с использованием функций, процедур и сложных типов данных, в том числе динамических массивов и объединений. Интерфейс ввода/вывода. Схемы алгоритмов отдельных подзадач. Технические требования к программе.

    курсовая работа [60,7 K], добавлен 26.11.2012

  • Изучение понятия и основных видов массивов. Ввод массива с клавиатуры и вывод на экран. Сортировка массивов. Метод простых обменов (пузырьковая сортировка). Сортировка простым выбором и простым включением. Решение задач с использованием массивов Паскаля.

    курсовая работа [82,1 K], добавлен 18.03.2013

  • Обработка текстовых данных, хранящихся в файле. Задачи и алгоритмы обработки больших массивов действительных и натуральных чисел. Практические задачи по алгоритмам обработки данных. Решение задачи о пяти ферзях. Программа, которая реализует сортировку Шел

    курсовая работа [29,2 K], добавлен 09.02.2011

  • Исследование основных отличий ассоциативных массивов от массивов скаляров. Разработка библиотеки классов. Выбор языка программирования. Сравнение языка C++ с Delphi, Java и JavaScript. Изучение методики тестирования и структуры тестового приложения.

    практическая работа [390,2 K], добавлен 06.01.2013

  • Аппаратные и программные RAID-массивы. Расчет объема массива. Временные затраты на расчет и запись контрольных сумм. Пример распределения файлов по JBOD-массиву. Вероятности отказа каждого диска в массиве. Сравнение стандартных уровней RAID-массивов.

    курсовая работа [3,0 M], добавлен 28.03.2011

  • Создание и редактирование таблиц в Excel, выполнение сортировки и переименование ячеек. Работа формул массивов и определение адреса ячейки, расположенной на другом листе. Различия относительной и абсолютной адресации. Функции для работы с базой данных.

    контрольная работа [786,1 K], добавлен 23.12.2010

  • Анализ матрицы коэффициентов парной корреляции. Выбор факторных признаков для построения двухфакторной регрессионной модели. Оценка параметров регрессии по методу наименьших квадратов. Нахождение определителей матриц. Применение инструмента Регрессия.

    контрольная работа [1,0 M], добавлен 13.01.2013

  • Понятие и назначение, основы создания RAID–массивов, принципы их работы и законы функционирования. Классификация и разновидности систем RAID, их отличительные признаки, оценка преимуществ и недостатков каждого вида. Тестовая разработка RAID-массива.

    курсовая работа [1,7 M], добавлен 24.04.2010

  • Ознакомление с особенностями программной реализации алгоритмов преобразования одномерных массивов. Исследование развития вычислительной техники, которое подразумевает использование компьютерных и информационных технологий. Изучение интерфейса программы.

    курсовая работа [1,0 M], добавлен 02.06.2017

  • Широкое использование компьютерных и информационных технологий. Концепции типов данных. Алгоритмы сортировки одномерных массивов. Описание двумерного массива Паскаля. Методы доступа к элементам массивов. Индексные, динамические и гетерогенные массивы.

    курсовая работа [66,3 K], добавлен 07.12.2010

  • Алгоритм по обработке массивов таким образом, чтобы группы, состоящие из трех или более подряд стоящих нулей, были переписаны в начало массива. Сортировка полученных массивов методом всплывающего пузырька. Вывод на дисплей монитора обновленной матрицы.

    курсовая работа [300,1 K], добавлен 30.08.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.