Статистические пакеты данных
Программный продукт, предназначенный для статистической обработки данных. Отечественные статистические пакеты, представленные на рынке. Статистические пакеты STATA, STADIA, SPSS, STATISTICA и др., их особенности, возможности, преимущества и недостатки.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 30.01.2014 |
Размер файла | 18,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Статистический пакет - программный продукт, предназначенный для статистической обработки данных.
Являются надежным инструментом повышения качества принимаемых решений. В пакет, как правило, входит: деловая графика, дисперсионный анализ, регрессионный анализ, анализ временных рядов и пр.
Для успешной работы любой организации в условиях рынка и конкуренции, конечно, необходим тщательный анализ имеющейся информации о создании продукции, её сбыте, эксплуатации, а также анализ информации о конкурентах и т. п. Конечно можно положиться на интуицию, но, скорее всего, правильное решение будет принято, только если у вас имеется огромный многолетний опыт в этой сфере деятельности. Но можно (и даже нужно, несмотря на весь опыт) пойти другим путём -- воспользоваться специальными средствами для обработки информации. И вот здесь-то и потребуется профессионализм -- необходимо правильно выбрать программное обеспечение, корректно ввести информацию, которую вы хотите проанализировать, выбрать методы и алгоритмы для решения именно этой задачи и многое другое.
Можно выделить 2 вида статистических пакетов.
Из зарубежных пакетов это STATGRAPHICS, SPSS, SYSTAT, BMDP,SAS, CSS, STATISTICA, S-plus, и др. Из отечественных можно назвать такие пакеты, как STADIA, ЭВРИСТА, МЕЗОЗАВР, ОЛИМП: Стат-Эксперт, Статистик-Консультант, САНИ, КЛАСС-МАСТЕР и др.
Отечественные статистические пакеты, которые устойчиво представлены на рынке в течение последних лет, в значительной степени лишены таких недостатков, которые есть у западных продуктов. Они предполагают наличие широкого первоначального статистического образования, доступной литературы и консультационных служб. Поэтому они содержат мало экранных подсказок и требуют внимательного изучения документации на английском языке.
Одним из обязательных этапов любого научного исследования является статистический анализ данных. Продолжительное время анализ медицинских данных был уделом специалистов, так как это требовало серьезной предварительной подготовки. С появлением и совершенствованием современных программ обработки данных статистическая обработка поднялась на новый уровень. Теперь исследователь-медик может и не иметь математической подготовки. Достаточно оперировать статистическими понятиями и, самое главное, правильно выбрать метод анализа. Все осуществимо благодаря компьютеру и новейшим программам.
Все программы статистической обработки данных можно разделить на профессиональные, полупрофессиональные (популярные) и специализированные. Статистические программы относятся к наукоемкому программному обеспечению, цена их часто недоступна индивидуальному пользователю. Профессиональные пакеты имеют большое количество методов анализа, популярные пакеты - количество функций, достаточное для универсального применения. Специализированные же пакеты ориентированы на какую-либо узкую область анализа данных. Создатели программных статистических пакетов заявляют, что их продукт превосходит аналоги. Отсутствие у большинства исследователей времени для освоения нескольких программ, делает непростым ее выбор. В данной статье приведена базовая информация о присутствующих на рынке основных полупрофессиональных программных пакетах пригодных для статистической обработки биомедицинских данных.
STADIA. Программа отечественной разработки с 16-и летней историей. Включает в себя все необходимые статистические функции. Она прекрасно справляется со своей задачей - статистическим анализом. Но. Программа внешне фактически не изменяется с 1996 года. Графики и диаграммы, построенные при помощи STADIA, выглядят в современных презентациях архаично. Цветовая гамма программы (красный шрифт на зеленом) очень утомляет в работе. К положительным качествам программы можно отнести русскоязычный интерфейс и наличие книг описывающих работу.
SPSS (Statistical Package for Social Science). Самый часто используемый пакет статистической обработки данных с более чем 30-и летней историей). Отличается гибкостью, мощностью применим для всех видов статистических расчетов применяемых в биомедицине. Недавно вышла 13-я англоязычная версия. Существует русскоязычное представительство компании которое предлагает полностью русифицированную версию SPSS 12.0.2 для Windows. Появился учебник на русском языке, позволяющий шаг за шагом освоить возможности SPSS, репетитор по статистике на русском языке, помогающий в выборе нужной статистической или графической процедуры для конкретных данных и задач, а также справка по SPSS Base и SPSS Tables. Российский офис SPSS регулярно проводит учебные курсы по анализу данных при помощи программного обеспечения SPSS. На русский язык переведена книга по SPSS, которая вышла в свет в 2002 году в Киевском издательстве «Диасофт» под названием «SPSS 10: искусство обработки информации. Анализ статистических данных и восстановление скрытых закономерностей».
STATA. Профессиональный статистический программный пакет с data-management system, который может применятся для биомедицинских целей. Один из самых популярных в образовательных и научных учреждениях США наряду с SPSS. Официальный сайт. Программа хорошо документирована, издается специальный журнал для пользователей системы. Однако возможности предварительного ознакомления с демо-версией нет.
STATISTICA. Производителем программы является фирма StatSoft Inc. (США), которая выпускает статистические приложения, начиная с 1985 года. STATISTICA включает большое количество методов статистического анализа (более 250 встроенных функций) объединенных следующими специализированными статистическими модулями: Основные статистики и таблицы, Непараметрическая статистика, Дисперсионный анализ, Множественная регрессия, Нелинейное оценивание, Анализ временных рядов и прогнозирование, Кластерный анализ, Факторный анализ, Дискриминантный функциональный анализ, Анализ длительностей жизни, Каноническая корреляция, Многомерное шкалирование, Моделирование структурными уравнениями и др. Несложный в освоении этот статистический пакет может быть рекомендован для биомедицинских исследований любой сложности.
Статистический пакет STATISTIKA
Statistica-- пакет для всестороннего статистического анализа, разработанный компанией StatSoft.
Алгоритмы математической статистики, реализованные в пакете:
Описательная статистика
Многомерная линейная и нелинейная регрессия;
Дискриминантный и кластерный анализ, деревья классификаций;
Факторный анализ;
Проверка гипотез о виде распределения;
Некоторые алгоритмы непараметрической статистики;
Прогнозирование временных рядов на основе одномерных моделей АРПСС.
Преимущества и недостатки пакета STATISTICA
Преимущества пакета STATISTICA:
- Наибольший из всех изученных пакетов инструментарий визуализации полученных результатов;
- Наличие руссифицированной версии;
- В пакете представлена полная реализация алгоритмов статистической классификации;
- Наличие возможности реализовать и использовать собственные алгоритмы (через написание макросов).
- Алгоритмы интеллектуального анализа данных (Data Mining).
Недостатки пакета STATISTICA:
- Применение пакета требует высокой теоретической подготовки в ТВиМС. статистический обработка данные пакет
- Отсутствие реализации некоторых важных тестов временных рядов (в частности - тестов на стационарность).
В случае парной регрессии уравнение определяется по двум наборам данных, один из которых представляет значения зависимой переменной y, а другой - независимой переменной х. В случае множественной регрессии уравнение определяется по нескольким наборам данных, один из которых представляет значения зависимой переменной y, а другие независимыми переменными х1, х2,, xm. Получение уравнения регрессии происходит в два этапа: подбор вида функции и вычисление параметров функции. Выбор функции, в большинстве случаев, производятся среди линейной, квадратичной, степенной и др. видов функций (табл. 2). К функции предъявляются следующие требования: она должна быть достаточно простой для использования ее в дальнейших вычислениях и график этой функции должен проходить вблизи экспериментальных точек так, чтобы сумма квадратов отклонений y-координаты всех экспериментальных точек от y-координат графика функции была ба минимальной (метод наименьших квадратов). Таблица 2 - Виды функций, применяемых в регрессионных моделях Парная (простая) регрессия Множественная регрессия Линейная регрессия y=ax b, y = а0 a1x1 amxm Квадратичная (параболическая) y=ax2 bx c y= а0 a1x12 am xm2 Степенная y=axb y = а0 x1 a1 x2 a2 xm am Логарифмическая y=al x b, Гиперболическая y = а0 a1 (1/x1) am(1/xm) Экспоненциальная y=aebx где a, b, c - коэффициенты парной регрессии. где а0, a1, a2,,am - коэффициенты множественной регрессии, - объем совокупности, m - количество факторных признаков. ? Какой вид регрессионного анализа (парный или множественный) в большей степени отвечает реальным условиям? ? Можно ли учесть все факторы х1, х2,, xm, в случае множественной корреляции? Для количественной оценки точности построения уравнения регрессии предназначен коэффициент детерминации R2, равный квадрату коэффициента корреляции и указывающий, какой процент изменения функции у объясняется воздействием факторов хk. Чем его значение ближе к 1, тем уравнение точнее описывает исследуемую зависимость. Значимое уравнение (с R2 близким к 1) используется, как правило, для прогнозирования изучаемого явления. Прогноз - это вероятностное суждение о будущем, полученное путем использования совокупности научных методов. Например, прогнозирование финансового состояния выполняется для того, чтобы получить ответы на два вопроса: «как это может быть (какими могут стать финансовые показатели, если не будут приняты меры по их изменению)» и «как это должно быть (какими должны стать финансовые показатели фирмы для того, чтобы ее финансовое состояние обеспечивало высокий уровень конкурентоспособности)». Прогнозирование с целью получения ответа на первый вопрос принято называть исследовательским, на второй - нормативным. Существует два способа прогнозов по уравнению регрессии: в пределах экспериментальных значений (интерполяция) и за пределами (экстраполяция). Применимость всякой регрессионной модели ограничена, особенно за пределами экспериментальной области, т.к. характер зависимости может существенно измениться. Поэтому достоверность исследовательского прогноза может быть невысокой. Однако его выполнение полностью обосновано. 1.2 Статистический пакет S A IS ICA Так как статистические методы находят широкое применение во всех сферах производства, то рынок компьютерных технологий предлагает большое количество прикладных программ, которые позволяют проводить такой анализ.
Иногда это можно сделать, изменив порядок следования команд в коде, предназначенном для проведения атаки. Иногда проще организовать нападение таким образом, чтобы взламывать пакеты выборочно. Так же как антивирусным компьютерным программам нужно постоянное обновление и пополнение новыми образцами кода, этому типу системы обнаружения вторжений необходимо постоянное обновление базы данных образцов нападения. Не ясно, сможет ли когда-нибудь такая база данных не отстать в соревновании с инструментом хакера. Другим принципом работы системы обнаружения вторжений является обнаружение аномалии. IDS осуществляет некоторое статистическое моделирование вашей сети и вычисляет, что является нормой. Затем, если происходит какое-либо отклонение от нормы, она подает звуки тревоги. Здесь все может быть сделано по правилам (система знает, что нормально, и сигнализирует обо всем остальном), с использованием статистики (система статистически вычисляет, что нормально, и сигнализирует обо всем остальном) или с применением методов искусственного интеллекта
SPSS
SPSS Statistics (Statistical Package for the Social Sciences) -- компьютерная программа для статистической обработки данных, предназначенная для проведения прикладных исследований в первую очередь социальных науках.
По сравнению с ранее приведенными пакетами, обладает существенно меньшим инструментарием статистического анализа данных.
Преимущества и недостатки пакета SPSS
Преимущества пакета SPSS:
- Имеются русифицированные версии пакета.
- Позволяет параллельно обрабатывать несколько подвыборок.
- Простота в освоении.
- Имеются специфические методы, нацеленные исключительно на маркетинговые и социологические исследования (например, Conjoint analysis). Удобен при обработке результатов опроса.
- Имеется модуль для автоматизации процесса разработки анкеты и ввода результатов опросов (Data Entry).
Недостатки пакета SPSS:
- Отсутствует возможность реализации собственных алгоритмов;
- Существенно уступает в глубине анализа данных.
Список использованной литературы
1. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере / Под ред. В. Э. Фигурнова. 3-е изд., перераб. и доп. М.:ИНФРА - М. 2003. 544 с.
2. Электронный учебник по дисциплине "Математическая статистика" / В.В. Шеломовский, Мурманский федеральный государственный педагогический университет. http://www.exponenta.ru/educat/systemat/shelomovsky/lab/lab14.asp.
3. Тюрин Ю.Н. Исследования по непараметрической статистике (непараметрические методы и линейная модель): Автореф. дисс. … д-ра физ.-мат. наук. М., 1985. 33 с.
4. http://www.referat.star-info.ru/info_314616.
Размещено на Allbest.ru
...Подобные документы
Спектр задач, которые решают математические программные пакеты (Maple, MathCad, Mathematica и MatLab). Математические исследования, требующие вычислений и аналитических выкладок. Разработка и анализ алгоритмов. Визуализация, научная и инженерная графика.
презентация [148,7 K], добавлен 06.01.2014Развитие новых информационных и телекоммуникационных технологий. Решение экономической задачи с использованием табличного процессора Microsoft Excel. Возможности Excel при работе с функциями. Математические и статистические пакеты прикладных программ.
курсовая работа [452,8 K], добавлен 01.04.2009Входные данные - статистические сведения о работе механообрабатывающего цеха, представленные в виде файла. Способы расчета основных характеристик работы. Описание работы созданного программного комплекса. Формы отображения выходных данных проекта.
курсовая работа [36,8 K], добавлен 23.06.2011Сущность понятия "диапазон ячеек". Правила образования выражений. Приоритеты выполнения операций в выражениях. Категории стандартных функций: математические; статистические; логические; финансовые. Стандартные действия, которые можно выполнять с данными.
лабораторная работа [19,0 K], добавлен 11.12.2009Базы данных, содержащие информацию о графических редакторах. Предметная область, словарь понятий и терминов. Построение функциональных зависимостей. Синтез схемы базы данных на основании функциональных зависимостей. Построение неизбыточного покрытия.
курсовая работа [190,8 K], добавлен 12.05.2009Системное, прикладное и инструментальное программное обеспечение. Наиболее распространённые пакеты прикладных программ. Назначение и структура системных программ. Заполнение таблицы и работа с итогами в Excel, фильтрация данных и построение диаграммы.
контрольная работа [1,6 M], добавлен 29.01.2014Общее описание программы Statistica. Архитектура и интерфейс системы. Регрессионный анализ в Statistica. Решение задачи регрессионного анализа с помощью пакета анализа данных табличного процессора MS Excel. Многомерный дисперсионный анализ в SPSS.
курсовая работа [2,4 M], добавлен 22.01.2013Географическая информационная система как программный продукт, предназначенный для сбора, хранения, анализа и графической визуализации пространственных данных и информации об объектах: компоненты, структуры, модели, классификация; этапы ввода данных.
курс лекций [4,5 M], добавлен 07.02.2012Программы в составе интегрированного пакета для MS Office, общий интерфейс пользователя. Компоненты: текстовый редактор (Word), табличный процессор (Excel), создание презентаций (PowerPoint), управление базами данных (Access). Функции и их применение.
презентация [2,5 M], добавлен 20.01.2012Место и роль различных изданий в современном обществе. Основные требования к подготовке электронных учебных изданий. Разработка приложений. Операционная система Android. Выбор программного обеспечения. Пакеты для обработки растровой и векторной графики.
отчет по практике [1,6 M], добавлен 26.05.2014Создание специализированных пакетов прикладных программ как условие эффективного внедрения вычислительной техники в практику. Текстовые, графические и музыкальные редакторы, электронные таблицы. Системы управления базами данных и программы архиваторы.
курсовая работа [114,7 K], добавлен 14.04.2009Основные возможности текстового редактора Word по оформлению научно-технического документа. Прикладные программные пакеты в информационных технологиях (форматированный текст). Источники возникновения и потоки маркетинговой информации на предприятии.
отчет по практике [106,8 K], добавлен 11.02.2007Ознакомление с основами программного пакета Statistica. Описание статистики и графики. Группировка данных, корреляции, методы множественной регрессии. Рассмотрение набора непараметрических статистик. Реализация дисперсионного и ковариационного анализа.
контрольная работа [544,5 K], добавлен 09.06.2015Моделирование системы, состоящей из ЭВМ (BLK1, BLK2, BLK3) и передающей пакеты данных на обслуживание; распределение вероятностей передачи пакетов. Имитационное моделирование GPSS/PC; математическая модель, машинная программа, оценка и анализ результатов.
курсовая работа [69,1 K], добавлен 28.06.2011Система компьютерной обработки данных для сбора, систематизации, статистической обработки, анализа результатов учебного процесса за четверть, полугодие, год. Модуль обработки данных о качестве обучения, итогов успеваемости и данных о движении учащихся.
реферат [22,5 K], добавлен 05.02.2011Наиболее известные сетевые модели. Физический уровень, получающий пакеты данных от вышележащего канального уровня. Лидирующая роль стека TCP/IP. Протокол telnet, обеспечивающий передачу потока байтов между процессами, а также между процессом и терминалом.
реферат [289,8 K], добавлен 17.12.2014Общедоступные электронные архивы данных социологических опросов: характеристика основных разделов и география пользователей. Сущность методов социологических исследований, описание необходимых процедур и их реализация в программном пакете SPSS 17.0.
курс лекций [9,0 M], добавлен 05.11.2013История развития IT-сферы, средства информатизации. Типовая структура хранения данных. Уровни изучения информации. Области приложения информационных технологий в экономике. Универсальное программное обеспечение. Финансово-экономические пакеты программ.
учебное пособие [720,3 K], добавлен 09.04.2014Обзор программ, поставляемых нескольким пользователям для общего применения или функционирования. Анализ требований к описанию программного продукта, пользовательской документации, программам и данным. Защита информации от несанкционированного доступа.
презентация [42,4 K], добавлен 27.12.2013ООО "Межрегиональный Центр инновационных технологий" и программные продукты на предприятии. Учёт движения пациентов при оказании им стационарной помощи. Статистические документы, оформляемые при выписке из стационара. Реляционная модель базы данных.
отчет по практике [2,6 M], добавлен 22.03.2014