Специализированные статистические пакеты

Изучение функций статистических пакетов. Основные возможности Microsoft Excel. Статистические функции, которыми располагает программа STATISTICA. Deductor Viewer - программный продукт, используемый в статистике. Области применения статистических пакетов.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык русский
Дата добавления 24.04.2015
Размер файла 61,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ СТАТИСТИЧЕСКИХ ПАКЕТОВ

1.1 Предпосылки создания статистических пакетов

В современных условиях наблюдается постоянный рост интенсивности информационных потоков и объемов обрабатываемой информации. Это требует непрерывного обновления знаний о состоянии предметной области и перспектив развития. При решении задач планирования и выбора стратегии развития предприятия, фирмы можно выделить ряд блоков задач, в решении которых используется статистическая информация:

- формирование стратегических целевых установок фирмы;

- прогнозирование потребности в материальных, энергетических, трудовых и финансовых ресурсах;

- анализ конкурентов и рынков сбыта;

- анализ спроса и предложений;

- оценка финансовой деятельности предприятия и другие.

Особенность решения таких задач заключается не только в обработке большого объема информации, но и в необходимости выявления причинно-следственных связей, построении формализованных моделей для анализа и прогноза. К основным предпосылкам применения современных информационных технологий в области статистической обработки информации можно отнести следующие:

- большое количество объектов статистического наблюдения, многомерность данных;

- необходимость отслеживания динамики массива показателей во времени, формирование на их основе различных сводок;

- низкую оперативность обработки данных;

- высокие материальные и трудовые затраты на сбор и обработку статистической информации;

- территориальную разобщенность исходных данных, необходимость их интеграции и одновременной обработки;

- сложность математических методов анализа данных.

В последнее время получили широкое распространение программные средства или информационные системы, предназначенные для автоматизации работ статистической обработки данных, которые позволяют собирать, хранить и обрабатывать разнородные массивы данных с использованием единой информационной базы. Такие системы на предприятии ориентируются на потребности руководства при выполнении функций управления на основе внутренних и внешних статистических данных.

Достоинством таких систем является адаптация информационной базы и функций системы к условиям функционирования предприятия. Однако, в силу сложности реализации математических методов, такие системы, как правило, включают лишь ограниченный набор аналитических методов.

В настоящее время получили распространение статистические пакеты, которые могут быть легко подключены к существующей информационной системе обработки информации на предприятии. [2]

1.2 Сущность, требования, классификация статистических пакетов

Статистический пакет - это программный продукт, предназначенный для статистической обработки данных. Является надежным инструментом повышения качества принимаемых решений. В пакет, как правило, входит: деловая графика, дисперсионный анализ, регрессионный анализ, анализ временных рядов и пр.

Международный рынок насчитывает более 1000 пакетов, решающих задачи статистического анализа данных в среде операционных систем Windows, DOS, OS/2 [7].

Основную часть имеющихся пакетов составляют:

1) Специализированные пакеты обычно содержат методы из нескольких разделов статистики или методы, используемые в конкретной предметной области (контроль качества промышленной продукции, расчет страховых сумм и т.д.). Чаще всего встречаются пакеты для анализа временных рядов регрессионного и факторного анализа. Обычно эти пакеты содержат весьма полный набор традиционных методов в своей области, а иногда включают также и оригинальные методы и алгоритмы, созданные разработчиками пакета. Как правило, пакет и его документация ориентированы на специалистов, хорошо знакомых с соответствующими методами.

Применять такие пакеты целесообразно в тех случаях, когда требуется систематически решать задачи из этой области, для которой предназначен специализированный пакет, а возможностей пакетов общего назначения недостаточно [7].

Из российских пакетов более известны STADIA, Олимп, Класс-Мастер, КВАЗАР, Статистик-Консультант; американские пакеты - ODA, WinSTAT, Statit и т.д.

2) Пакеты общего назначения. Особое место на рынке занимают так называемые статистические пакеты общего назначения. Широкий диапазон статистических методов, дружелюбный интерфейс пользователя привлекает в них не только начинающих пользователей, но и специалистов. Универсальность этих пакетов особенно полезна:

- на начальных этапах обработки, когда речь идет о подборе статистической модели или метода анализа данных;

- когда поведение статистических данных выходит за рамки использовавшейся ранее модели;

- в процессе обучения основам статистики.

Именно пакеты общего назначения составляют большинство продаваемых на рынке статистических программ. Из зарубежных универсальных пакетов наиболее распространены BAS, SPSS, Systat, Minilab, Statgraphics, STATISTICA.

Статистический пакет в идеале должен удовлетворять определенным требованиям:

- модульность;

- ассистирование при выборе способа обработки данных;

- использование простого проблемно-ориентированного языка для формулировки задания пользователя;

- автоматическая организация процесса обработки данных и связей с модулями пакета;

- ведение банка данных пользователя и составление отчета о результатах проделанного анализа;

- диалоговый режим работы пользователя с пакетом;

- совместимость с другим программным обеспечением.

Следует заметить, что развитие статистических программных продуктов (СПП) обычно идет поэтапно, на каждом из них создается вариант пакета, все в большей степени удовлетворяющий перечисленным выше требованиям. При этом если создание есть результат разработки, то на каждом этапе пакет, с одной стороны, должен представлять собой готовую к использованию программную продукцию, а с другой - входить составной частью в более поздние стадии развития пакета.

Для того, чтобы статистический пакет общего назначения был удобным и эффективным в работе, он должен удовлетворять многочисленным и весьма жестким требованиям. В частности, необходимо, чтобы он:

- содержал достаточно полный набор стандартных статистических методов;

- был достаточно простым для быстрого освоения и использования;

- отвечал высоким требованиям к вводу, преобразованиям и организации хранения данных, как в самом пакете, так и обмену с широко распространенными базами данных (dBase, Lotus 1-2-3 и т.п.);

- имел широкий набор средств графического представления данных и результатов.

- предоставлял удобные возможности для включения в отчеты таблиц исходных данных, графиков, промежуточных и окончательных результатов обработки;

- имел подробную документацию, хорошо продуманную с учетом интересов, как начинающего пользователя, так и специалиста-статистика.

Наконец, немаловажное значение имеет цена пакета. Профессиональные западные статистические пакеты (SAS, BMDP и т.д.) обычно стоят от 2 до 10 тысяч долларов и более. Эти пакеты позволяют обрабатывать гигантские объемы данных, включают средства описания задач на встроенном языке и дают возможность построения на их основе систем обработки информации для целых предприятий.

Пакеты, рассчитанные на массового пользователя, стоят дешевле -- обычно 500 - 1500 долларов. Эти пакеты отличаются от профессиональных прежде всего ориентацией на индивидуального пользователя: преимущественно диалоговым режимом работы, наличием ограничений по объему обрабатываемых данных и т.д. Имеются и более дешевые пакеты (200-300 долларов и ниже), но они обычно обладают весьма скромными возможностями.

Отечественные статистические пакеты стоят существенно дешевле, как правило, их цена составляет от 200 до 500 долларов. [8]

Методориентированные СПП, как правило, имеют следующую структуру:

1. Блок описательной статистики и разведочного анализа исходных данных: анализ резко выделяющихся значение исследуемого признака, восстановление пропущенных значений, частотная обработка исходных данных (построение гистограмм, полигонов частот, вычисление выборочных средних дисперсий и т.д.), проверка статистических гипотез об однородности исследуемых совокупностей, оценка критериев согласия, визуализация распределения статистических данных и др.;

2. Блок статистического исследования динамики и зависимостей: дисперсионный и ковариационный анализ, корреляционно-регрессионый анализ, анализ временных рядов и др.;

3. Блок классификации и снижения размерности: дискриминантный анализ, статистических анализ смесей распределений, кластерный анализ и др.;

4. Блок методов статистического анализа нечисловых данных и экспертых оценок: анализ таблиц сопряженности, логлинейные модели, ранговые методы и др.;

5. Блок планирования эксперимента и выборочных исследований;

6. Блок вспомогательных программ.

Пакеты статистической обработки позволяют изучать тенденции изменения числовых данных и оценивать уровень достоверности результатов. Под статистической обработкой понимается использование методов однофакторного и двухфакторного анализа, статистических показателей (вариация, среднее, медиана, мода и т.д.), частотного распределения, корреляционного и регрессионного анализа и т.д. [6]

1.3 Описание и возможности статистических пакетов

Наибольшее распространение получили ряд статистических пакетов, которые представлены ниже.

MS Excel. Самой часто упоминаемой (и используемой) в отечественных статьях является приложение MS Excel из пакета офисных программ компании Microsoft - MS Office. Причины этого кроются в широком распространении этого программного обеспечения, наличии русскоязычной версии, тесной интеграцией с MS Word и PowerPoint. Однако, MS Excel - это электронная таблица с достаточно мощными математическими возможностями, где некоторые статистические функции являются просто дополнительными встроенными формулами. Расчеты сделанные при ее помощи не признаются авторитетными биомедицинскими журналами. Также в MS Excel невозможно построить качественные научные графики. Безусловно, MS Excel хорошо подходит для накопления данных, промежуточного преобразования, предварительных статистических прикидок, для построения некоторых видов диаграмм. Однако окончательный статистический анализ необходимо делать в программах, которые специально созданы для этих целей. Существует макрос-дополнение XLSTAT-Pro для MS Excel который, включает в себя более 50 статистических функций, включая анализ выживаемости, которых в основных случаях достаточно для обычного применения [3].

Пакет прикладных программ STATISTICA - это универсальная интегрированная система, предназначенная для статистического анализа и визуализации данных, управления базами данных и разработки пользовательских приложений, содержащая широкий набор процедур анализа для применения в научных исследованиях, технике, бизнесе, а также специальные методы добычи данных.

Помимо общих статистических и графических средств в системе имеются специализированные модули, при чем, каждый модуль выполняет определенный набор функций и может быть использован и автономно, например, для проведения социологических или биомедицинских исследований, решения технических и, что очень важно, промышленных задач: карты контроля качества, анализ процессов и планирование эксперимента. Работа со всеми модулями происходит в рамках единого программного пакета, для которого можно выбирать один из нескольких предложенных интерфейсов пользователя.

С помощью реализованных в системе STATISTICA мощных языков программирования, снабженных специальными средствами поддержки, легко создаются законченные пользовательские решения и встраиваются в различные другие приложения или вычислительные среды. Очень трудно представить себе, что кому-то могут понадобиться абсолютно все статистические процедуры и методы визуализации, имеющиеся в системе STATISTICA, однако опыт многих людей, успешно работающих с пакетом, свидетельствует о том, что возможность доступа к новым, нетрадиционным методам анализа данных (а STATISTICA предоставляет такие возможности в полной мере) помогает находить новые способы проверки рабочих гипотез и исследования данных. [5]

Следует отметить основные возможности пакета:

- реализует широкий набор математических методов (табл.1.1);

- дает возможность представить графическую интерпретацию результатов (в графиках типа 2D, 3D, пиктограммах или в разработанных в собственном дизайне графиках);

- осуществляет поддержку всех стандартов современных офисных приложений (импорт данных из электронных таблиц, в том числе и их MS Excel, экспорт диаграмм в приложения MS Office и др.);

- позволяет расширять возможности пакета за счет встроенного языка программирования Statistica Visual Basic [2].

STATISTICA разрабатывается компанией StatSoft. На сегодняшний день последней версией является STATISTICA 9 [9].

Пакет STATISTICA является наиболее динамично развивающимся статистическим пакетом и по многочисленным рейтингам является мировым лидером на рынке статистического программного обеспечения.

Пользователь может добавить собственную панель инструментов с тем или иным методом статистического анализа. Несомненным достоинством пакета является возможность дописывать (наращивать) систему при помощи встроенного языка программирования.

STATISTICA Neural Networks - универсальный и мощный нейронно-сетевой пакет. Он дает возможность автоматически получать эффективные и правильные решения для широкого круга задач, в которых использование традиционных статистических методов затруднено, например, из-за отсутствия априорных моделей или конкретных гипотез. [8]

Пакет прикладных программ SPSS (Statistical Package for Social Science) - статистический пакет, разработанный компанией SPSS Inc, предназначенный для работы в операционной системе MS Windows. Является пакетом обработки и анализа социологических данных [2].

SPSS - одна из старейших систем статистического анализа и управления данными. Самый часто используемый пакет статистической обработки данных с более чем 30-и летней историей. Сегодня SPSS является одним из лидеров среди универсальных статистических пакетов [4].

Отличается гибкостью, мощностью применим для всех видов статистических расчетов применяемых в биомедицине. Недавно вышла 13-я англоязычная версия. Существует русскоязычное представительство компании, которое предлагает полностью русифицированную версию SPSS 12.0.2 для Windows [3].

Основные возможности пакета:

- реализует набор математических методов статистической обработки данных (табл.1.1);

- осуществляет доступ к территориально распределенным данным и позволяет объединять несколько баз данных;

- формирует нестандартные отчеты, позволяющие оценить данные с разных точек зрения;

- осуществляет настройку интерфейса и процедур работы с данными с помощью встроенного языка сценариев;

- поддерживает связь с большинством форматов данных и обмен данными с другими приложениями MS Windows [2].

Статистические функции, которыми располагают STATISTICA и , поражают своим разнообразием. Складывается впечатление, что данные инструменты статистического анализа позволяют делать все, что угодно, при условии, что пользователь хорошо изучил принципы их работы. Главным препятствием на пути освоения этих программ является время, которое необходимо затратить на обучение. Именно из-за недостатка знаний у пользователя, в большинстве случаев, мощь статистических пакетов подобного уровня не используется даже в половину [9].

Пакет прикладных программ Deductor - статистический пакет, разработанный фирмой Base Group Labs, состоит из 3-х частей: многомерного хранилища данных Deductor Warehouse, аналитического приложения Deductor Studio и рабочего места конечного пользователя Deductor Viewer.

Deductor Warehouse - многомерное хранилище данных, аккумулирующее всю необходимую для анализа предметной области информацию.

Deductor Studio - программа, реализующая функции импорта, обработки, визуализации и экспорта данных. В Deductor Studio включен полный набор механизмов, позволяющий получить информацию из произвольного источника данных, провести весь цикл обработки, используя Мастера обработки (очистку, трансформацию данных, построение моделей), отобразить полученные результаты наиболее удобным образом (OLAP, диаграммы, деревья и т.д.) и экспортировать результаты на сторону. Это полностью соответствует концепции извлечения знаний из баз данных.

Deductor Viewer - рабочее место конечного пользователя. Позволяет отделить процесс построения моделей от использования уже готовых моделей. Все сложные операции по подготовке моделей выполняются аналитиками-экспертами при помощи Deductor Studio, а Deductor Viewer обеспечивает пользователям простой способ работы с готовыми результатами.

Реализованные в Deductor обработчики покрывают основную потребность в анализе данных и создании законченных аналитических решений на базе Data Mining.

Сопоставление возможностей статистических пакетов, которые были рассмотрены выше, представлено в табл.1.1. [2]

Таблица 1.1 Сопоставление возможностей статистических пакетов

Функции и методы

Пакеты прикладных программ

MS Excel

STATISTICA

SPSS

Deductor

1

2

3

4

5

Описательные методы статистического анализа:

1) вычисления математических ожиданий, дисперсий изучаемых величин и др.

встроенные функции Excel

модуль Описательной статистики

команда Descriptives

при выполнении функции Линейная регрессия

2) проверка гипотез о равенстве математических ожиданий

функции пакета Анализа данных

модуль Описательной статистики

широкий спектр команд One sample Ttest, Independent sample T-test и др. Непараметрические методы

-

3) построение гистограмм

функции пакета Анализа данных

модуль Описательной статистики

Команды FREQUENCIES STATISTICS, HISTOGRAM

-

Построение модели временного ряда и прогнозирование с учетом сезонных колебаний и периодических трендов

требуется самостоятельно создавать шаблон на листе Excel

модуль Временные ряды и прогнозирование с поквартальной и месячной десонализацией

-

-

Построение многомерной линейной регрессионной модели

встроенная функция ЛИНЕЙН и функция пакета Анализ данных РЕГРЕССИЯ

модуль Множественная регрессия

линейная регрессия в процедуре REGRESSION

функция Линейная регрессия

Построение нелинейной регрессионной модели

встроенные функции позволяют построить полиномиальную и экспоненциальную модели

модуль Множественная регрессия дает большой выбор нелинейных моделей

логистическая регрессия в процедуре REGRESSION

-

Корреляционный анализ

встроенные функции Excel КОРРЕЛ, КОВАР, функции пакета Анализа данных

модули Описательной статистики, Непараметрический анализ

процедуры связи количественных переменных CORRELATIONS и неколичественных переменных CROSSTABS

функция Корреляционный анализ

Одномерный и двухмерный дисперсионный анализ

функции пакета Анализ данных

модуль Дисперсионный анализ

процедура ANOVA

-

Кластерный анализ

-

модуль Кластерный анализ

процедуры CLUSTER, QUICK CLUSTER или команда k-means

функции Дерево решений и Карта Кохонена

Факторный анализ

-

модуль Факторный анализ

процедура FACTOR

функция Факторный анализ

Дискриминантный анализ

-

модуль Дискрим. функциональный анализ

-

-

Многомерное шкалирование

-

модуль Многомерное шкалирование

Процедура Multidimentional scaling

-

Возможности графического отображения результатов

встроенные функции Мастер диаграмм

графики типа 2М, 3М, пиктограммы

графики, дендрограммы в процедуре PLOT DEND-ROGRAM

диаграммы, гистограммы, OLAP - многомерное представление данных в виде кросс-таблиц и кросс-диаграмм

Возможности импорта данных

из других приложений MS Office

из других приложений MS Office, в том числе из MS Excel

из других приложений MS Office, в том числе из MS Excel

из других приложений MS Office программой Deductor Studio

Возможности экспорта данных

таблицы и диаграммы в другие приложения MS Office

таблицы и диаграммы в другие приложения MS Office

таблицы и диаграммы в другие приложения MS Office

таблицы и диаграммы в другие приложения MS Office программой Deductor Studio

Возможности интеллектуализации данных

-

дополнительный модуль Нейронные сети

-

методы Мастера обработки: Нейросеть

Очистка и трансформация данных

-

модуль Временные ряды и прогнозирование

-

широкий спектр, в том числе: сглаживание (скользящее окно), очистка от шумов (фильтрация), группировка

Программа MedCalc, разрабатываемая с 1993 года бельгийской компанией MedCalc Software, позиционируется как полноценное статистическое приложение, созданное в соответствии с потребностями исследователей биомедицинского направления. Разработчики акцентируют внимание исследователей на удобстве использования MedCalc для анализа ROC-кривых.

Программа удобна тем, что не предлагает избыточной функциональности, которая зачастую приводит в замешательство неподготовленного человека, начинающего работать с универсальными приложениями. В дополнение к этому, возможность работы только в графическом интерфейсе без использования командной строки делает программу менее гибкой, но зато более привлекательной для использования в данной области науки, поскольку специалисты с медицинским образованием очень редко могут похвастаться большим опытом работы с математическими программами.

На сегодняшний день создана уже двенадцатая версия программы. К сожалению, работать в MedCalc могут только пользователи Windows, но этот недостаток компенсируется относительно малыми системными требованиями и есть возможность запустить приложение как в Windows 2000, так и в Windows 7.

Среди функций, реализованных в MedCalc, следует особо отметить возможность проведения основных видов статистического анализа, не имея выборочных значений, т.е. на основе средних величин, показателей разброса и т.п. Это может быть полезно при изучении литературных данных, поскольку полной информации о первичных результатах эксперимента в публикациях не приводится. Например, для сравнения выборочных средних с помощью критерия Стьюдента достаточно знать сами средние арифметические, стандартное отклонение и размеры обеих выборок.

Таким образом, программа MedCalc за относительно небольшую цену предоставляет пользователю удобный интерфейс без излишней «функциональности», снабженный хорошим табличным редактором. Все вычисления и диаграммы сохраняются в одном файле и легко сортируются в специальном списке в левой части главного окна программы. Статистический анализ выполняется с помощью удобно организованных меню, снабженных лаконичным и понятным справочным материалом. [9]

STADIA - это программа отечественной разработки с 16-и летней историей. Пакет STADIA разработан и поддерживается НПО “Информатика и компьютеры” при активном участи ведущих специалистов МГУ им. М.В. Ломоносова. Включает в себя все необходимые статистические функции. Она прекрасно справляется со своей задачей - статистическим анализом.

Данный пакет является аналитическим инструментом для многих тысяч пользователей в различных областях науки, техники, планирования, управления, производства, сельского хозяйства, экономики, бизнеса, маркетинга, образования, медицины по всей русскоязычной Евразии. По своим базовым возможностям сопоставим с наиболее известными западными статистическими пакетами [8].

Следует обратить внимание на удивительную компактность пакета STADIA: он требует в несколько раз меньше места на диске, чем его конкуренты, и при этом не уступает, а часто и превосходит их по своим функциональным возможностям.

Пакет содержит широкий набор методов анализа данных из всех областей статистики и доступен широкому кругу прикладных специалистов, менеджеров и студентов. Сейчас распространяется версия 6.2 для среды Windows. Пакет может появляться в трех вариантах: study, basе и рrоf, различающихся лишь объемами обрабатываемых массивов и ценой. Самый дешевый вариант study имеет максимальный объем матрицы данных в 400 чисел. Он предназначен главным образом для учебных заведений и задач с небольшими объемами данных. Самая дорогая версия STADIA 6.2 рrоf. имеет максимальный объем матрицы данных 20000 чисел и расширенные возможности статистических процедур для их обработки по сравнению с базовыми версиями. У пакета имеется бесплатная учебно-демонстрационная версия, позволяющая обрабатывать большое количество демонстрационных примеров из всех разделов статистического анализа. Эта версия также допускает ввод с клавиатуры и полную обработку данных пользователей. Однако при этом существуют ограничения на объемы вводимых данных, и отсутствует возможность сохранения введенных данных в файле. Документация пакета является одновременно детальным справочником по использованию статистических методов и может быть приобретена отдельно от пакета.

Следует выделить основные возможности пакета STADIA:

1. исчерпывающий набор самых современных и эффективных методов анализа: описательная статистика, дисперсионный, корреляционный и спектральный анализ, сглаживание, прогнозирование, простая, нелинейная регрессия, кластерный и факторный анализ, методы контроля качества, анализ и замена пропущенных значений.

2. полный комплект деловой и научной, 2-х, 3-х и многомерной графики: функции, зависимости, прогнозы, диаграммы рассеяния, карты, гистограммы, столбиковые, башенные и круговые диаграммы, установка размеров, надписей по осям и под рисунком и проч.

3. разнообразные преобразования и вычисления, импорт / экспорт данных и результатов;

4. развитая экранная помощь, понятная интерпретация результатов.

Demo-версия программы STADIA обладает всеми возможностями пакета и позволяет обрабатывать данные небольшого объема (до 400 чисел), вводимые с клавиатуры. Тем самым она позволяет самостоятельно и практически овладеть всеми современными методами прикладной статистики, а во многих областях исследования сразу получить научные и практически значимые результаты. [8]

Программа внешне фактически не изменяется с 1996 года. Графики и диаграммы, построенные при помощи STADIA, выглядят в современных презентациях архаично. Цветовая гамма программы (красный шрифт на зеленом) очень утомляет в работе. К положительным качествам программы можно отнести русскоязычный интерфейс и наличие книг описывающих работу [3].

Пакет «Олимп» предназначен для автоматизации обработки данных на основе широкого набора современных методов прикладной статистики. Он реализован в расчете на самых разнообразных пользователей - от новичков до экспертов в области статистики.

В состав пакета, кроме основных программ, входят также электронная таблица MNCALC и программное средство «Прикладные социологические исследования (ПСИ)».

Пакет «ОЛИМП» позволяет организовать полный цикл исследований по статистическому анализу и прогнозированию данных, начиная с ввода исходных данных, их проверке и визуализации и заканчивая проведением расчетов и анализом результатов.

С функциональной точки зрения пакет состоит из следующих программ (процедур): редактора средств графического отображения и утилит преобразования данных, а также программ реализации методов статистического анализа.

Редактор данных обеспечивает возможность ввода, просмотра и редактирования исходных данных (в том числе пропущенных наблюдений).

Средства графического отображения данных позволяют выводить различные виды графиков на экран, а также сохранять их на диске для дальнейшего использования.

Программы пакета «ОЛИМП» реализуют следующие методы статистического анализа: корреляционный, регрессионный, дисперсионный, дискриминантный, факторный и компонентный, анализ таблиц сопряженности рядов и др.

Для анализа и прогнозирования динамических данных применяются следующие методы:

- адаптивные методы прогнозирования;

- модели динамической регрессии;

- модели прогнозирования на основе линейной регрессии;

- модели гармонического, спектрального анализа и частотной фильтрации.

Каждая из перечисленных выше моделей может управляться пользователем с помощью параметров, характеризующих эту модель. Такой подход позволяет постепенно осваивать заложенные в программе возможности и облегчает работу с ней.

Основное назначение пакета «МЕЗОЗАВР» заключается в проведении разведочного анализа временных рядов. Это касается ситуации, когда необходимо «пощупать» имеющуюся числовую информацию, по усмотрению исследователя применяя различные методы обработки и анализируя получающиеся при этом результаты и их адекватность. Пакет позволяет осуществлять подобные исследования весьма оперативно и эффективно.

Пакет «МЕЗОЗАВР» используется для анализа временных рядов умеренной (не более нескольких тысяч наблюдений) длины. Диалог происходит по желанию пользователя на русском или английском языке. Управление осуществляется с помощью меню и клавиш быстрого доступа.

Под временным рядом понимается последовательность наблюдений за некоторой числовой характеристикой показателей, сделанных с постоянным шагом во времени (например ежегодно, ежемесячно, каждый час и т.п.). В статистике примерами подобных показателей могут служить на макроэкономическом уровне ежегодные, ежеквартальные, ежемесячные и т.п. объемы производства, поставок, перевозок, потребления; индексы цен и другие макроэкономические показатели; на уровне предприятия - объемы выпуска продукции, затраты, расход ресурсов, эволюция характеристик качества и др.

Пакет «МЕЗОЗАВР» обладает следующими преимуществами по вводу и хранению информации:

- имеет свой стандарт файлов, ввод информации в которые осуществляется через встроенный редактор данных типа «электронной таблицы»;

- предоставляет возможность сохранения в стандартных файлах любых данных, полученных в ходе анализа;

- допускает экспорт и импорт информации из текстовых файлов.

Предельная длина одного анализируемого временного ряда равна 16 тыс. значений, однако возможности анализа такого ряда будут весьма ограничены и поэтому наиболее эффективно работать с рядами до 2 - 3 тыс. значений.

Одновременно можно анализировать до 256 рядов, однако их суммарная не должна превышать 60 тыс. чисел. При этом можно пользоваться либо реальными временными шкалами (шаг по времени - начиная от 1 мин. до любого (целого) числа лет), или же условной временной шкалой.

Редактирование данных осуществляется с помощью встроенного табличного редактора или же в графическом режиме, а их преобразование - с помощью дополнительного меню преобразований более специального характера.

Кроме того, есть возможность непосредственно указать предварительное преобразование данных, которое далее учитывается в процессе анализа. При всех арифметических операциях над рядами учитывается совместимость временных шкал.

Пакет «МЕЗОЗАВР» реализует следующие основные процедуры по анализу временных рядов: сглаживание, прогнозирование, фильтрацию, а также построение различных регрессионных зависимостей. Все процедуры снабжены мощной графической поддержкой с большим числом интерактивных возможностей, таких, как установка различных шкал, увеличение любого куска графика и т.д.

JMR. Один из мировых лидеров в анализе данных. Развивает этот статистический пакет SAS Institute, который выкупил в конце 2002 года известную статистическую программу StatView. Однако особых преимуществ для медико-биологической статистики этот программный продукт не имеет.

SYSTAT. Статистическая система для персональных компьютеров. Последняя 11 версия обладает неплохим интуитивно понятным интерфейсом. Компания Systat Software также разрабатывает популярные у отечественных исследователей SigmaStat и SigmaPlot, которые являются соответственно, программой статистической обработки и программой построения диаграмм. При совместной работе становятся единым пакетом для статистической обработки и визуализации данных.

STATGRAPHICS PLUS . Довольно мощная статистическая программа. Содержит более 250 статистических функций, генерирует понятные, настраиваемые отчеты.

PRISM. Эта программа создавалась специально для биомедицинских целей. Интуитивно понятный интерфейс позволяет в считанные минуты проанализировать данные и построить качественные графики. Программа содержит основные часто применяемые статистические функции, которых в большинстве исследований будет достаточно. Однако, как отмечают сами разработчики, программа не может полностью заменить серьезных статистических пакетов. [3]

Наряду с коммерческими статистическими пакетами существует довольно большое число полностью бесплатных статистических программ и приложений. При этом ряд бесплатных программ не только не уступает, но и превосходит по функциональности коммерческие приложения. Приведены основные бесплатные программы для статистической обработки данных.

R - безусловно, наиболее мощный бесплатный программный инструмент с невероятно широким набором библиотек. R 2013 году R стал самым широко используемым в научной литературе пакетом для статистического анализа. С R может быть довольно непривычно работать на начальном этапе, поскольку пользователь должен разобраться в том, как подключать библиотеки, как выполнять и сохранять процедуры, а также из-за отсутствия привычного графического интерфейса. Но эти трудности с лихвой компенсируются многочисленными руководствами по работе с R.

EpiInfo - бесплатный статистический пакет, разработка которого поддерживается Центром по контролю за заболеваниями США. Основной особенностью является возможность не только проводить статистический анализ, но и создавать опросники и формы для ввода данных (включая создание форм для сбора информации в Интернет).

OpenEpi - набор статистических функций, позволяющий быстро применить относительно простые и часто используемые статистические тесты. OpenEpi можно использовать в он-лайн режиме на сайте разработчика, либо установить себе на компьютер. Плюсом пакета является набор функций для расчета статистической мощности, численности групп, генерации случайных чисел, а также возможность расчета статистической значимости на основании групповых статистик, что бывает полезно при оценке статей.

PSPP - по внешнему виду и функциональности очень напоминает SPSS (собственно, и название пакета является зеркальным отражением).

SOFA - позволяет выполнять основные статистические тесты, но не дает возможности проводить регрессионный анализ. Одной из отличительных особенностей пакета является быстрое создание различных типовых графиков и не требующих форматирования суммирующих таблиц.

SEER-Stat - ориентированный на применение в онкологии, разработка которого поддерживается Институтом Онкологии США. В программном пакете много функций по расчету заболеваемости, выживаемости и летальности (включая стандартизованные по возрасту показатели).

Statistical Analysis for Genetic Epidemiology - программа для статистического анализа для генетиков и эпидемиологов, которая содержит множество функций для получения описательной статистики, проверки данных, количественной оценки наследственности признака или заболевания, оценки наиболее вероятного возраста начала заболевания, выявления закономерностей встречаемости отдельных аллелей или однонуклеотидных изменений, и другие возможности.

Наряду с этими существует еще около 30 бесплатных программ для статистической обработки данных, которые имеют разную функциональность и «заточены» под разные цели. [1]

1.4 Преимущества и недостатки статистических пакетов

Анализ возможностей различных пакетов (табл.1.1) позволил сформулировать их преимущества и недостатки и дать рекомендации по их применению:

1. Хотя пакет MS Excel не является статистическим пакетом, но он входит в MS Office, включает много статистических функций и дает возможность подключить встроенный пакет Анализа данных. Поэтому следует рассмотреть его возможности для статистического анализа. Для небольших предприятий, когда не требуется проводить кластеризации данных, а лишь необходимо установить некоторые зависимости, дать статистическое описание исследуемым переменным, данный пакет будет экономически выгодным.

2. Пакет STATISTICA является мощным средством статистического анализа, нашедший применение во многих сферах деятельности. Он включает большое количество методов, реализуемых в отдельных модулях, которые могут запускаться автономно. Но для реализации каждого метода не хватает методики их выполнения и толкований полученных результатов. Этот недостаток может затруднить внедрение пакета.

3. Пакет ППП SPSS включает широкий спектр команд и процедур, связанных с описательными методами статистики: описание распределения, анализ связи количественных и качественных переменных, наряду с параметрическими методами сравнения средних, большой набор непараметрических тестов. Такая обработка актуальна в ходе социологических исследований. Имеется возможность работать с данными, подготовленными в MS Excel.

4. Пакет Deductor имеет единое хранилище данных (а не отдельные файлы, как ППП STATISTICA), разработанные сценарии, включающие загрузку данных из хранилища или внешнего источника, восстановление пропущенных значений, установления незначимых факторов, построение моделей. В пакете при открытии файла с данными он проверяется на пропущенные данные, идет их восстановление, поэтому результаты дальнейшей обработки могут немного отличаться от других пакетов.

Недостатки западных статистических пакетов. Следует отметить, что продвижение западных продуктов в российской аудитории наталкивается на ряд ограничений в связи с неадекватностью культурно-исторической ситуации.

Большинство из таких статистических пакетов имеют следующие недостатки:

- требуют наличие профессиональных навыков и высокой квалификации, широкого первоначального статистического образования, доступной литературы и консультационных служб. Поэтому они содержат мало экранных подсказок и требуют внимательного изучения документации на английском языке.

- представляют сложности для быстрого освоения и использования.

- отсутствие подробной документации, доступной для начинающих и информативной для специалистов-статистиков (исключение SPSS).

- требуют больших финансовых затрат, так как немаловажное значение имеет цена пакета. Профессиональные западные статистические пакеты (SРSS,SAS,BMDР и т.д.) обычно стоят от 1 до 10 тыс. долларов и более. Мало кто готов заплатить такие деньги. [7]

2. ОБЛАСТИ ПРИМЕНЕНИЯ СТАТИСТИЧЕСКИХ ПАКЕТОВ

статистический пакет excel программный

В развитых странах практически любое решение: политическое, финансовое, техническое, научно-исследовательское и даже бытовое решение принимается только после всестороннего анализа данных. Поэтому изучение прикладной статистики и методов анализа данных является неотъемлемым компонентом образования на всех уровнях, а компьютерные пакеты для аналитических исследований и прогнозирования являются настольным рабочим инструментом любого специалиста, так или иначе связанного с информационной сферой.

Исключительно важное значение при выполнении психологического исследования имеет психометрическая обработка результатов экспериментальных исследований. Современные компьютерные программы обработки данных предлагают богатый набор способов такого преобразования, замечательным образом расширяющий возможности анализа данных .

О ценности полученных эмпирических данных нельзя судить без серьезного математического анализа, без использования современных информационных компьютерных технологий, применение которых свидетельствует не только об умении исследователя применять статистические методы исследования, но и о достоверности полученных результатов и возможности их использования в практике. По утверждению Е.В. Сидоренко, «многие психологические концепции ныне подвергаются сомнению на основании того, они не были подтверждены статистически».

Как утверждает А.Д. Наследов, «психология во всех ее приложениях - и практических, и теоретических, может развиваться только на основе количественных исследований, связывающих теорию и практику с фактами». Исследователю необходимо умение организовать эмпирические данные, обработать и проинтерпретировать, что невозможно без применения математических методов и современных компьютерных программ, применение которых сейчас становится нормой для исследователя.

Математические методы статистики становятся всё более популярными в психологии. Объясняется это просто: математическая статистика даёт специалистам-практикам мощный, хорошо разработанный аппарат для объективного анализа результатов педагогического, медицинского, психологического обследований и выработки практических рекомендаций. [6]

Продолжительное время анализ медицинских данных был уделом специалистов, так как это требовало серьезной предварительной подготовки. С появлением и совершенствованием современных программ обработки данных статистическая обработка поднялась на новый уровень. Теперь исследователь-медик может и не иметь математической подготовки. Достаточно оперировать статистическими понятиями и, самое главное, правильно выбрать метод анализа. Все осуществимо благодаря компьютеру и новейшим программам [3].

К основным полупрофессиональным программным пакетам пригодным для статистической обработки биомедицинских данных относятся MS Excel, STADIA, SPSS, STATA, STATISTICA, JMR, NCSS, SYSTAT, MINITAB 14, PRISM, STATGRAPHICS PLUS, MedCalc Software.

Пакет STATISTICA может применяться в разнообразных сферах деятельности:

- в банковской деятельности (для анализа кредитных рисков и прогнозирования финансовых показателей);

- торговой деятельности (для сравнительного анализа поставщиков и прогнозирования потребления товаров и ресурсов);

- маркетинговых исследованиях (для изучения сезонности спроса, классификации товара по потребительским свойствам);

- производственной деятельности (для прогнозирования потребности материальных ресурсов, выявления причинно-следственных связей между технологическими параметрами, анализа надежности и долговечности продукции);

- медицинском обслуживании (для анализа результатов обследования, диагностики);

- социологических исследованиях (для анализа опроса общественного мнения).

Кроме этого, пакет STATISTICA является базовым статистическим пакетом в большинстве вузов России, служит для обучения методам статистического анализа. [2]

Пользователями системы являются крупнейшие университеты, исследовательские центры, компании, банки всего мира, государственные учреждения.

Система STATISTICA может служить не только эффективным инструментом для научных исследований, но и чрезвычайно удобной средой для обучения методам статистического анализа. Система STATISTICA активно используется в учебном процессе в таких вузах, как МГУ, МГИЭМ, МЭСИ, МФТИ, МИФИ, МГТУ им. Баумана, СПбГУЭФ и многих других. [8]

Размещено на Allbest.ru

...

Подобные документы

  • Развитие новых информационных и телекоммуникационных технологий. Решение экономической задачи с использованием табличного процессора Microsoft Excel. Возможности Excel при работе с функциями. Математические и статистические пакеты прикладных программ.

    курсовая работа [452,8 K], добавлен 01.04.2009

  • Основные возможности программного пакета Microsoft Excel, его популярность среди бухгалтеров и экономистов. Использование математических, статистических и логических функций. Определение частоты наступления событий. Особенности ранжирования данных.

    презентация [1,1 M], добавлен 22.10.2015

  • Функции Microsoft Excel - встроенные инструменты, которые применяются в формулах. Их виды и основы работы с ними. Организация обработки табличных данных при помощи статистических функций. Примеры решения различных задач при помощи электронных таблиц.

    курсовая работа [958,6 K], добавлен 21.07.2011

  • Классификация пакетов прикладных программ. Microsoft Office как популярный пакет, предназначенный для решения задач автоматизации офиса. Пример формирования калькуляции стоимости выпечных изделий на хлебозаводе с помощью табличного процессора MS Excel.

    курсовая работа [1,3 M], добавлен 05.06.2013

  • Microsoft Office как семейство программных продуктов Microsoft, его возможности и функции. Решение пользовательских задач с помощью встроенных функций Excel, создание базы данных. Формирование блок-схемы алгоритма с использованием Microsoft Visio.

    контрольная работа [1,4 M], добавлен 28.01.2014

  • Особенности использования встроенных функций Microsoft Excel. Создание таблиц, их заполнение данными, построение графиков. Применение математических формул для выполнения запросов с помощью пакетов прикладных программ. Технические требования к компьютеру.

    курсовая работа [1,1 M], добавлен 25.04.2013

  • Логические и статистические функции программа Microsoft Excel, задание формул и расчеты по ним. Выполнение финансово-экономических расчетов с помощью программы и построение диаграммы по полученным результатам. Разработка оптимальных решений производства.

    контрольная работа [1,3 M], добавлен 14.07.2009

  • Понятие и возможности MS Excel. Основные элементы его окна. Возможные ошибки при использовании функций в формулах. Структура электронных таблиц. Анализ данных в Microsoft Excel. Использование сценариев электронных таблиц с их практическим применением.

    курсовая работа [304,3 K], добавлен 09.12.2009

  • Обзор и сравнительный анализ современных математических пакетов. Вычислительные и графические возможности системы MATLAB, а также средства программирования в среде MATLAB. Основные возможности решения задач оптимизации в табличном процессоре MS Excel.

    дипломная работа [6,6 M], добавлен 04.09.2014

  • Обзор встроенных функции табличного процессора Microsoft Excel, особенности их практического использования. Создание таблиц и их заполнение данными, построение графиков. Применение математических формул для выполнения запросов пакетов прикладных программ.

    курсовая работа [3,9 M], добавлен 25.04.2013

  • История счета как начало начал всех измерений. Калькулятор и его типы: простейшие, бухгалтерские, финансовые, инженерные, программируемые. Microsoft Excel - программа для работы с электронными таблицами и выполнения экономико-статистических расчетов.

    презентация [181,5 K], добавлен 26.03.2013

  • Сущность понятия "диапазон ячеек". Правила образования выражений. Приоритеты выполнения операций в выражениях. Категории стандартных функций: математические; статистические; логические; финансовые. Стандартные действия, которые можно выполнять с данными.

    лабораторная работа [19,0 K], добавлен 11.12.2009

  • Microsoft Word как многофункциональный многооконный редактор текстов, позволяющий создавать и редактировать документы любого уровня сложности. Принципы работы с программами Microsoft Excel, Outlook, Access, Calc, Writer, их функциональные возможности.

    презентация [1,0 M], добавлен 23.12.2011

  • Общие сведения о глобальных сетях с коммутацией пакетов, построение и возможности сетей, принцип коммутации пакетов с использованием техники виртуальных каналов. Характеристики и возможности коммутаторов сетей, протоколы канального и сетевого уровней.

    курсовая работа [2,0 M], добавлен 26.08.2010

  • Финансовые функции, представленные в MicrosoftExcel для анализа облигаций с фиксированным купоном. Анализ экономической проблемы и потребность в финансовых вычислениях. Основные возможности применения, ошибки и примеры использования функции ДАТАКУПОНДО.

    отчет по практике [484,9 K], добавлен 24.07.2014

  • Структура систем Transcend Manager, их основные элементы и характеристика, назначение. Методы цветового кодирования. Выбор узла для перехвата пакетов и выделение под перехват пакетов буфер. Установка фильтров и декодирование пакетов, определение ошибки.

    лабораторная работа [2,5 M], добавлен 23.08.2009

  • Новые пакеты, серверы и службы Microsoft Office 2007, "ленты" и всплывающие подсказки. Структурные нововведения: формат Microsoft Office Open XML, новинки Excel, PowerPoint, Outlook 2007. Новые возможности, помогающие повысить производительность труда.

    реферат [709,2 K], добавлен 01.03.2010

  • Назначение и составляющие формул, правила их записи и копирования. Использование математических, статистических и логических функций, функций даты и времени в MS Excel. Виды и запись ссылок табличного процессора, технология их ввода и копирования.

    презентация [193,2 K], добавлен 12.12.2012

  • Расчеты с использованием финансовых функций. Оформление таблицы и построение диаграммы, отражающей динамику роста вклада по годам. Экономический анализ для заданных статистических данных. Порядок решения задач методом линейного программирования.

    контрольная работа [90,5 K], добавлен 15.06.2009

  • Характеристика интегрированных информационных технологий. Интегрированный офисный пакет – набор программных продуктов, объединенных в единый удобный инструмент. Microsoft Word как наиболее известный текстовый редактор. Работа с Microsoft Publisher.

    контрольная работа [1,3 M], добавлен 01.02.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.