Анализ данных компьютерных средств
Обзор компьютерных средств анализа данных. Statgraphics Plus for Windows: общие и уникальные свойства программы. Связь приложений и гибкий импорт информации. Расширения для решения сложных статистических и инженерных задач. Создание графической диаграммы.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | русский |
Дата добавления | 09.05.2014 |
Размер файла | 28,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Содержание
Введение
1. Обзор компьютерных средств анализа данных
2. Statgraphics Plus for Windows - общие и уникальные свойства
3. Анализ данных Microsoft Excel
Список использованных источников
Введение
Человеческий разум сам по себе не может извлечь полной информации из данных. Он не приспособлен к непосредственному и глубокому восприятию массивов чисел. Поэтому в современном мире умение пользоваться компьютерными системами обработки и анализа данных стало необходимым для успешной деятельности в любой области. Запас сведений о таких системах является обязательным элементом эрудиции инженера по знаниям.
Не следует думать, что системы анализа данных представляют собой нечто подвластное только узким специалистам. В результате прогресса вычислительной техники средства анализа данных стали теперь доступны практически каждому. Материал этого раздела полезен не только инженерам по знаниям, но и многим другим людям (особенно руководителям, бизнесменам, экономистам и т. п.), которым при принятии решений приходится иметь дело с данными различной природы.
1. Обзор компьютерных средств анализа данных
Рынок компьютерных программ анализа данных обширен и разнообразен. На нем представлены продукты более тысячи наименований. Такое разнообразие отражает многоплановость задач анализа в различных областях человеческой деятельности. Обзоры указанных программ приводятся в специальных справочниках, где содержатся краткие описания их назначения, требования к техническим характеристикам компьютера, сведения о дополнительных сервисных возможностях, цены и адреса фирм поставщиков. Это весьма объемные издания, публикуемые в западной прессе.
Информация о последних версиях программ регулярно помещается в популярных компьютерных журналах и газетах типа "PC Magazine", "PC World", "BYTE", "PC Week" и др. Известны аналогичные отечественные публикации. Они представлены, в основном, в журнале "Мир ПК". Назовем, например, следующие статьи: "Векслер Л.С. Статистический анализ на персональном компьютере", №2, 1992", "Кулаичев А.П. Средства и программные системы анализа данных, №10, 1994", "Макаров А.А. STADIA против STATGRAPHICS, или кто ваш лоцман в море статистических данных, №3, 1992", "Кулаичев А.П. Пакеты для анализа данных, №1, 1995", "Дюк В.А., Мирошников А.И. Эволюция STATGRAPHICS, №12, 1995" и другие.
Ценные сведения о компьютерных системах обработки данных можно почерпнуть в книгах А.А. Макарова и Ю.Н. Тюрина "Анализ данных на компьютере" /1995, 1997/. Кроме теории в этих книгах дается классификация программного обеспечения в области анализа данных, рассматриваются требования к статистическим пакетам общего назначения, характеризуются особенности российского рынка, приводится краткий обзор наиболее популярных программ и предлагаются рекомендации по их выбору. Также немало полезной информации содержится в словаре справочнике: Информатика в статистике, выпущенном в 1994 году издательством "Финансы и статистика". Реальные примеры практически по всем основным разделам анализа данных разобраны в монографии "Дюк В.А. Обработка данных на ПК в примерах. - СПб.: Питер, 1997".
Вместе с тем, необходимо отметить, что значительная часть публикуемой информации быстро устаревает. Это связано со стремительными темпами развития отрасли. На рынке программного обеспечения в условиях жесткой конкуренции происходит процесс консолидации, и положение на сегодняшний день заметно отличается от ситуации, скажем, трехлетней давности. Возглавляют процесс консолидации (как недавно сказал Jack Noonan, президент корпорации SPSS) те, кто может предложить наилучший продукт и сделать это быстрее всех. Для тех же, кто испытывает трудности при переходе к новым операционным системам, процесс объединения оказывается фатальным. Пример такой консолидации - слияние SPSS с фирмой SYSTAT и приобретение в январе 1996 года корпорацией SPSS одного из крупнейших конкурентов, фирмы BMDP Statistical Software Inc.
На рынке математического обеспечения в эпоху больших компьютеров лидировали несколько статистических пакетов - BMDP, SAS и SPSS. Это объяснялось тем, что фирмы разработчики достаточно быстро реагировали на достижения в области анализа данных и ими был накоплен большой запас прочности, позволивший далеко оторваться от конкурентов. С появлением персональных компьютеров, новых языков программирования и технологий лидировавшим фирмам пришлось решать сложную задачу: создавать пакет для ПК заново или адаптировать уже существующую программу к требованиям "маломощных" компьютеров. Вместе с тем, богатые графические возможности ПК дали шанс менее известным фирмам сравнительно быстро создать новые, ныне очень популярные, программные средства анализа данных. В этот период появился пакет STATGRAPHICS (STATistical GRAPHICs System) фирмы Manugistics. Он настолько выигрышно отличался от других статистических пакетов удобством пользовательского интерфейса, что завоевал огромную популярность и в дальнейшем задал основные ориентиры для развития всей индустрии в целом. За последние годы, наконец, появились Windows версии наиболее известных статистических систем. А корпорации SPSS и Manugistics выпустили версии для Windows 95/NT и продолжают наращивать огромный потенциал своих систем.
Таблица 1. Классификация статистических пакетов
Типы |
Отечественные |
Зарубежные |
|
Профессиональные |
Нет |
SAS, BMDP |
|
Универсальные |
STADIA, Olymp |
STATGRAPHICS, SPSS STATISTICA, S-PLUS |
|
Специализированные |
Mesosaur, DataScope, Класс-Мастер, Эвриста, САНИ |
Большое многообразие |
Выбор пакета для анализа данных зависит от характера решаемых задач, объема обрабатываемого материала, квалификации пользователей, имеющегося оборудования и т. д.
Для пользователей, имеющих дело со сверхбольшими объемами данных или узкоспециализированными методами анализа, пока нет альтернативы профессиональным западным пакетам. Среди них самыми широкими возможностями обладает SAS. Для создания собственной системы обработки данных можно обратиться к библиотеке IMSL, содержащей сотни тщательно и квалифицированно составленных статистических подпрограмм.
Несколько меньшими возможностями обладают универсальные пакеты. Вместе с тем, их стоимость значительно ниже, чем профессиональных. При приобретении такого пакета не мешает, однако, лишний раз убедиться, что он содержит требуемые методы обработки.
Все универсальные пакеты имеют много пересечений по составу статистических процедур. Кроме того, современные версии программ обладают, как правило, модульной структурой, что позволяет существенно экономить средства. Windows интерфейс последних версий пакетов во многом унифицирует взаимодействие пользователя с аналитическими, графическими и системными процедурами. Основные отличия кроются, главным образом, в цене. Кроме того, по-разному организован диалог. Функциональное наполнение пакетов также может варьироваться. Здесь, по мнению автора, с учетом всех аспектов в лучшую сторону отличается STATGRAPHICS Plus for Windows. Именно поэтому примеры анализа данных с целью извлечения знаний построены с использованием универсальной статистической графической системы STATGRAPHICS Plus for Windows. Вместе с тем, следует отметить, что такие же функции могут быть выполнены практически любым другим пакетом анализа данных, обладающим развитыми средствами интерактивной графики. Фактически, изучив принципы работы STATGRAPHICS Plus for Windows, не составляет особого труда перенести полученные навыки на другие пакеты.
2. Statgraphics Plus for Windows - общие и уникальные свойства
Statgraphics Plus for Windows включает более 250 статистических и системных процедур, применяющихся в бизнесе, экономике, маркетинге, медицине, биологии, социологии, психологии, на производстве и в других областях. Каждой группе процедур соответствует собственное меню. В Базовой Системе функционируют следующие процедуры:
· Меню Describe содержит статистические методы анализа по одной и множеству переменных, процедуры подбора распределений, средства табуляции и кросс табуляции данных;
· Меню Compare включает методы сравнения двух и более выборок данных, процедуры одно и многофакторного дисперсионного анализа;
· Меню Relate содержит процедуры простого, полиномиального и множественного регрессионного анализа.
Как видим, в Базовую Систему включен достаточно полный набор наиболее часто встречающихся видов статистического анализа данных. В то же время для расширения возможностей системы предлагаются дополнительные модули, инициализация которых осуществляется через меню Special. К ним относятся:
· Модуль "Контроль качества" предназначен для оценки эффективности всех звеньев производственного процесса и формирования соответствующих контрольных карт. В модуле прекрасно организованы процедуры для конструирования Парето карт, анализа возможностей процесса и построения X и R контрольных карт. Тесная связь с базовой системой STATGRAPHICS Plus for Windows обеспечивает доступ к полному набору статистических методов. Представляется, что процедуры контроля качества реализованы наилучшим образом.
· Модуль "Планирование эксперимента" помогает сформулировать критерий оптимальности плана эксперимента, подобрать наилучший план, организовать сбор и обработку требуемой информации. При работе с этим модулем пользователю не стоит беспокоиться, много или мало ему известно о планировании эксперимента. В модуле предлагаются эффективные способы упрощения и интеграции знаний об исследуемом процессе. Процедура взаимодействия с модулем следующая: определение факторов; выбор плана; генерация рабочей таблицы для сбора и записи данных; подбор модели; интерпретация результатов. Все вместе позволяет уменьшить время исследования, снизить общие затраты и в целом повысить производительность.
· Модуль "Анализ временных рядов" содержит описательные методы; процедуры сглаживания рядов, сезонной декомпозиции и прогнозирования. Данный модуль помогает увидеть чистую картину динамических данных. Целесообразно начать работу с описательных методов, чтобы получить первое визуальное представление. Затем можно сделать более точное описание динамического ряда, учитывая сезонные эффекты, циклические изменения, тренды, ошибки, выбросы или точки излома в ваших данных. Результаты представляются в табличной форме или на удобных для восприятия графиках.
Если приходится иметь дело с данными из области финансов, STATGRAPHICS Plus for Windows предоставляет возможность определить оптимальное управление капиталом. А если требуется преобразовать данные для лучшей подгонки модели, то для этого существует широкий спектр встроенных функций, например преобразования Бокса Кокса. В модуле предусмотрена также возможность автоматического учета инфляционных факторов!
· Модуль "Многомерные методы" предназначен для изучения и раскрытия взаимоотношений множества факторов (переменных). Если пользователь занимается исследованиями в физике, социологии, медицине или других областях, где объекты исследования характеризуются большим числом признаков, данный модуль поможет сортировать и группировать данные, определять отношения между переменными, выдвигать и проверять различные гипотезы. Для этого в модуле функционирует пять мощных процедур, обеспечивающих проведение Кластерного анализа, анализа по методу Главных Компонент, Факторного, Дискриминантного и Канонического Корреляционного анализа.
· Расширенный регрессионный анализ, кроме базисных процедур регрессионного анализа, включает различные калибровочные модели, процедуры сравнения линий регрессии, отбора наилучших регрессионных моделей, нелинейную множественную регрессию, ридж регрессию и логистическую регрессию. Требуется ли создать комплексную модель множественной регрессии, или рассмотреть и оценить лабораторные методы, или просто попытаться выбрать лучшую регрессионную модель, - все это представлено в прекрасно организованном модуле расширенного регрессионного анализа.
Все перечисленные выше модули интегрируются в систему и полностью наследуют ее свойства. Модульная структура STATGRAPHICS Plus for Windows позволяет пользователю приобретать только то, что ему необходимо. Учитывая сравнительно невысокую стоимость Базовой Системы (например, по отношению к известному пакету SPSS), это позволяет существенно сэкономить средства.
Из множества свойств STATGRAPHICS Plus for Windows выделим и охарактеризуем следующие:
· Гибкий импорт/экспорт данных
Система обеспечивает связь со всеми Windows приложениями посредством OLE и DDE. Кроме того, файлы Windows и DOS версий полностью совместимы между собой и система без проблем обменивается данными с другими программными продуктами, использующими Lotus, dBASE, DIF, DBF и ASCII файлы.
· Широкие возможности манипулирования данными
Управление данными организовано удобным и целесообразным способом. Легко доступные из редактора данных или из окна ввода данных опции преобразования предоставляют широкий набор возможностей сортировки данных и трансформации переменных, для чего предназначено более 100 операторов. При этом производимые манипуляции не изменяют содержимого исходных файлов.
3. Анализ данных Microsoft Excel
В состав Microsoft Excel входит набор средств анализа данных (называемый пакет анализа), предназначенный для решения сложных статистических и инженерных задач. Для проведения анализа данных с помощью этих инструментов следует указать входные данные и выбрать параметры; анализ будет проведен с помощью подходящей статистической или инженерной макрофункции, а результат будет помещен в выходной диапазон.
Если команда Анализ данных отсутствует в меню Сервис, то необходимо запустить программу установки Microsoft Excel. После установки пакета анализа его необходимо выбрать и активизировать с помощью команды Настройки. Для успешного применения процедур анализа необходимы начальные знания в области статистических и инженерных расчетов, для которых эти инструменты были разработаны.
Чтобы запустить пакет анализа:
1. В меню Сервис выберите команду Анализ данных.
2. В списке Инструменты анализа выберите нужную строку.
3. Введите входной и выходной диапазоны, затем выберите необходимые параметры.
Другие инструменты позволяют представить результаты анализа в графическом виде. компьютерный программа информация
Создание диаграммы
В Microsoft Excel имеется возможность графического представления данных в виде диаграммы. Диаграммы связаны с данными листа, на основе которых они были созданы, и изменяются каждый раз, когда меняются данные на листе.
Диаграммы могут использовать данные несмежных ячеек и сводной таблицы.
Можно создать либо внедренную диаграмму (то есть поместить её на лист рядом с таблицей), либо лист диаграммы.
1. Выделите ячейки, содержащие данные, которые должны быть отражены на диаграмме.
2. Если необходимо, чтобы в диаграмме были отражены и названия строк или столбцов, выделите также содержащие их ячейки.
3. Меню Вставка - Диаграмма.
4. Следуйте инструкциям Мастера.
Примечание. Если на листе присутствуют многоуровневые названия строк или столбцов, то их также можно отразить на диаграмме. При создании диаграммы выделите названия строк и столбцов для каждого уровня. Чтобы при добавлении данных в диаграмму была сохранена заданная иерархия, измените диапазон ячеек, использованных при создании диаграммы.
Изменение диаграммы:
1. Выберите изменяемую диаграмму.
2. В меню Диаграмма выберите нужную строку, например Диапазон данных.
3. В окне редактирования внесите нужные изменения.
Вычисления
Сумму значений выделенных ячеек можно ввести --автоматически с помощью кнопки Автосуммирование.
При нажатии кнопки Автосуммирование автоматически предлагается формула вычисления, например = СУММ(E5:E10). Чтобы принять формулу, нажмите клавишу Enter.
Синтаксис формулы
Синтаксисом формул называется порядок, в котором вычисляются значения и задается последовательность вычислений. Формула должна начинаться со знака равенства (=), за которым следует набор вычисляемых величин. В следующем примере представлена формула, вычисляющая разность между числами 5 и 1. Результат выполнения отобразится в ячейке, в которой указана формула.
Ссылки на ячейку =5-1
В формуле может быть указана ссылка на ячейку. Если необходимо, чтобы в ячейке содержалось значение другой ячейки, введите знак равенства, после которого укажите ссылку на эту ячейку. Ее значение зависит от значения другой ячейки. Формула может вернуть другое значение, если изменить ячейку, на которую формула ссылается. Следующая формула умножает значение ячейки B15 на число 5. Формула будет пересчитываться при изменении значения ячейки B15.
=B15*5
Формулы могут ссылаться на ячейки или на диапазоны ячеек, а также на имена или заголовки, представляющие ячейки или диапазоны ячеек.
Функции
В Microsoft Excel содержится большое количество стандартных формул, называемых функциями, которые используются для простых или сложных вычислений.
1. Меню Вставка - Функции - f(x).
2. Следуйте за Мастером функций.
Примечание. Помните, что Excel посчитает все числа, но правильность расчетов зависит от вашего знания математики и правильности задания формул.
Сводная таблица
Сводная таблица создается с помощью Мастера сводных таблиц, используемого для размещения и объединения анализируемых данных:
1. Меню Данные - Сводная таблица.
2. Идите по шагам Мастера.
Подведение итогов в сводной таблице производится с помощью итоговой функции (например, "Сумма", "Кол-во значений" или "Среднее").
В таблицу можно автоматически поместить промежуточные или общие итоги, а также добавить формулы в вычисляемые поля или элементы полей.
В сводной таблице содержатся поля, подводящие итоги исходных данных в нескольких строках.
Переместив кнопку поля в другое место сводной таблицы, можно изменить представление данных.
Список использованных источников
1. Векслер Л.С. Статистический анализ на персональном компьютере//Мир ПК, № 2, 1992.
2. Дюк В.А., Мирошников А.И. Эволюция STATGRAPHICS//Мир ПК, № 12, 1995.
3. Дюк В.А. Обработка данных на ПК в примерах. - СПб: Питер, 1997.
4. Информатика в статистике: Словарь справочник. - М.: Финансы и статистика, 1994.
5. Кулаичев А.П. Пакеты для анализа данных//Мир ПК, №1, 1995.
6. Кулаичев А.П. Средства и программные системы анализа данных//Мир ПК, № 10, 1994.
7. Макаров А.А. STADIA против STATGRAPHICS, или кто ваш лоцман в море статистических данных//Мир ПК, № 3, 1992.
8. Международная конференция "Статистическое образование в современном мире: идеи, ориентации, технологии", 3--5 июля 1996. Тезисы докладов. - СПб: Изд во СПбУЭФ, 1996.
9. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. - М.: ИНФРА М, Финансы и статистика, 1995.
10. Тюрин Ю.Н., Макаров А.А. Анализ данных на компьютере. - М.: ИНФРА М, Финансы и статистика, 1997.
Размещено на Allbest.ru
...Подобные документы
Характеристика принципов решения инженерных задач с помощью различных информационных компьютерных комплексов. Решение задачи на языке программирования Pascal, с помощью средств математического пакета MathCAD, так же с помощь табличного процессора Excel.
курсовая работа [218,1 K], добавлен 22.08.2013Первая перфорированная лента. "Мамонты" среди носителей информации. Дискета, гибкий магнитный диск, используемый для многократной записи и хранения данных. Облачное хранилище данных. Основное назначение, достоинства жёстких дисков и сменных накопителей.
презентация [1,5 M], добавлен 17.05.2014Разработка программы для решения инженерных задач с использованием функций, процедур и сложных типов данных, в том числе динамических массивов и объединений. Интерфейс ввода/вывода. Схемы алгоритмов отдельных подзадач. Технические требования к программе.
курсовая работа [60,7 K], добавлен 26.11.2012Общие сведения о компьютерных преступлениях. Основные направления компьютерных преступлений и их классификация. Методы защиты информации. Обзор современных программных средств, обеспечивающих обслуживание ПК: Norton Utilities, Acronis Power Utilities.
курсовая работа [56,5 K], добавлен 26.06.2009Расчеты с использованием финансовых функций. Оформление таблицы и построение диаграммы, отражающей динамику роста вклада по годам. Экономический анализ для заданных статистических данных. Порядок решения задач методом линейного программирования.
контрольная работа [90,5 K], добавлен 15.06.2009Разработка программы на языке Си++ и осуществление постановки и выбора алгоритмов решения задач обработки экономической информации, создание и редактирование базы данных, сортировка записей по определенному запросу, анализ эффективности обработки данных.
контрольная работа [316,8 K], добавлен 28.08.2012Обзор пакетов программ, предназначенных для визуализации и анализа данных. Обоснование выбора среды программирования. Организация аварийного буфера. Передача данных от нижнего уровня к верхнему и сохранение данных. Отображение данных в графической форме.
дипломная работа [512,4 K], добавлен 28.08.2012Изучение понятия локальной вычислительной сети, назначения и классификации компьютерных сетей. Исследование процесса передачи данных, способов передачи цифровой информации. Анализ основных форм взаимодействия абонентских ЭВМ, управления звеньями данных.
контрольная работа [37,0 K], добавлен 23.09.2011Возможности современных компьютерных технологий решения задач в средах MS Excel, MS Word. Область программирования в офисных пакетах. Применение ЭВМ в решении математических задач. Разработка программного обеспечения. Разработка приложений с помощью VBA.
дипломная работа [742,2 K], добавлен 29.01.2009Выбор программных и аппаратных средств для создания базы данных. Описание структуры программы. Описание разработки приложения. Подключение к базе данных, выполняемое с помощью компонента ADOConnectio. Создание средств защиты информации в программе.
курсовая работа [2,1 M], добавлен 16.02.2015Создание автоматизированной информационной системы учета оборудования (компьютерной и оргтехники) на АКБ НМБ ОАО с использованием современных компьютерных средств. Проектирование базы данных. Алгоритмы решения задач. Расчёт затрат на проектирование.
дипломная работа [2,1 M], добавлен 16.12.2013Реализация программы, созданной средствами языка C#. Предназначение Windows-приложения для решения комплекса задач. Определение состава форм с графиком функции. Вычисление коэффициентов полинома. Создание текстового поля для введения корней многочлена.
курсовая работа [234,8 K], добавлен 13.11.2016Носители данных. Операции с данными. Основные структуры данных. Требования к криптосистемам. Законодательная поддержка вопросов защиты информации. Средства архивации информации. Антивирусные программы. Классификация компьютерных вирусов. Сканеры.
курсовая работа [563,1 K], добавлен 16.12.2004Назначение и классификация компьютерных сетей. Распределенная обработка данных. Классификация и структура вычислительных сетей. Характеристика процесса передачи данных. Способы передачи цифровой информации. Основные формы взаимодействия абонентских ЭВМ.
контрольная работа [36,8 K], добавлен 21.09.2011История создания компьютерных вирусов, их свойства и классификация. Пути проникновения компьютерных вирусов в компьютер и способы защиты от них. Понятие антивирусной программы. Типы специализированных программ для защиты. Обзор существующих приложений.
курсовая работа [417,3 K], добавлен 05.08.2013Методы и средства защиты информационных данных. Защита от несанкционированного доступа к информации. Особенности защиты компьютерных систем методами криптографии. Критерии оценки безопасности информационных компьютерных технологий в европейских странах.
контрольная работа [40,2 K], добавлен 06.08.2010Создание автоматизированной системы по сбору и анализу статистических данных сайта. Принципы сбора статистических данных. Исследование информационных потоков. Обзор современных СУБД и языков программирования. Логическая и физическая модель базы данных.
дипломная работа [3,0 M], добавлен 08.07.2012Конфигурация аппаратных средств и характеристика программных средств для создания беспроводных компьютерных сетей, особенности их использования и анализ возможных проблем. Технология организация безопасной работы в беспроводных компьютерных сетях.
курсовая работа [2,5 M], добавлен 27.12.2011Изучение существующих методов и программного обеспечения для извлечения числовых данных из графической информации. Программное обеспечение "graphtrace", его структура и методы обработки данных. Использование этой системы для данных различного типа.
дипломная работа [3,9 M], добавлен 06.03.2013Функции компьютерных сетей (хранение и обработка данных, доступ пользователей к данным и их передача). Основные показатели качества локальных сетей. Классификация компьютерных сетей, их главные компоненты. Топология сети, характеристика оборудования.
презентация [287,4 K], добавлен 01.04.2015