Управляющие информационные системы

Схема обработки данных и подготовки информации в управляющих информационных системах. Основные характеристики корпоративных управляющих систем. Система поддержки принятия решения как часть корпоративной информационной системы. Технологии Data Mining.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 28.09.2017
Размер файла 1,6 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Управляющие информационные системы

Первые управляющие информационные системы (Management Information Systems - MIS) стали появляться в 70-х годах ХХ века с развитием вычислительной техники.

Рис. 1 Схема обработки данных и подготовки информации в MIS

Такие ИС обслуживают управленческий уровень, обеспечивая менеджеров среднего и высшего звеньев текущей информацией о выполнении основных бизнес-процессов в компании и о некоторых изменениях во внешней среде. Они обеспечивают интерактивный доступ к показателям текущей деятельности фирмы, архиву отчетов и решений, приказам, распоряжениям, протоколам совещаний, отчетным формам.

Обычно такие системы ориентированы в основном на внутреннего пользователя и обслуживают функции планирования, управления подразделениями и службами, контроля и поддержки решений на управленческом уровне. Блок-схема типичной MIS приведена на рис. 1.

Приведем основные характеристики корпоративных управляющих систем. Такие системы:

· работают с формализованными и/или частично формализованными данными и поддерживают частично структурированные и слабоструктурированные решения в широком диапазоне на функционально-оперативном и управленческих уровнях, преобразуя формализованные данные в "MIS-файлы". Решения, поддержанные MIS, обязательны для исполнения на эксплуатационном уровне, пополняют "копилку" решений в KWS и транслируются посредством OAS;

· ориентированы на обеспечение текущих бизнес-процессов управленческими решениями, на создание отчетов и контроль исполнения;

· задают правила формирования информационных потоков и пучков внутри информационного поля компании, информационные требования известны и устойчивы;

· имеют небольшие аналитические возможности, ограниченные рамками текущей деятельности на уровне подразделений;

· недостаточно гибки, но имеют возможности для адаптации в любом подразделении;

· помогают в принятии оперативных решений, используя прошлые и настоящие данные, при этом используется больше внутренних данных, чем внешних.

Автоматизированная информационная система управления деятельностью предприятия - это взаимосвязанная совокупность данных, процедур, процессов, стандартов, программно-аппаратных и телекоммуникационных средств, предназначенная для сбора, обработки, систематизации, распределения, хранения, доставки в автоматизированном режиме информации конечному пользователю в соответствии с требованиями, вытекающими из целей деятельности.

MIS, как правило, является одним из основных модулей общей корпоративной ИС; для его разработки, внедрения и интеграции требуется тщательный анализ процессов и идентификация параметров информационного поля организации.

В российских компаниях MIS обычно развивается на базе систем TPS и OAS, с которых часто начинается автоматизация рутинных процедур и процессов. Вследствие этого MIS постепенно превращается в автоматизированную информационную систему управления предприятием (не путать с АСУП - Автоматизированной Системой Управления Производством).

Рис. 2 Состав автоматизированной информационной системы управления (MIS)

Технология работы в компьютеризированной информационной системе строится так, чтобы ею могло одновременно пользоваться большое количество сотрудников. Пользователями MIS являются практически все менеджеры компании. Выходные данные - периодические результаты деятельности в виде сводок, резюме, отчетов, докладных записок, служебные расследования. В связи с тем, что часть такой информации может быть конфиденциальной, менеджеры обладают доступом различной степени. MIS имеет функциональную и обеспечивающую части.

Техническое обеспечение - комплекс технических средств, средств эксплуатационной поддержки и документация на эти средства и технологические процессы, внутренние стандарты предприятия. Это:

· технические средства сбора, регистрации, накопления, обработки, отображения, размножения, доставки, сохранения и обеспечения безопасности информации;

· компьютеры любых моделей, мощные серверные и сетевые устройства, оргтехника;

· телекоммуникационная техника и средства связи;

· общесистемная документация, включающая государственные, отраслевые и корпоративные стандарты по техническому обеспечению;

· специализированная документация, содержащая методические материалы по всем этапам проектирования, разработки, внедрения, сопровождения и применения технических и технологических средств;

· нормативно-справочная документация для выполнения технического обеспечения.

Математическое обеспечение - совокупность математических методов, моделей, алгоритмов обработки информации, типовые задачи управления системами, теории массового обслуживания, теории игр и другие.

Программное обеспечение - комплексы программ, ориентированных на пользователей и предназначенные для решения типовых задач обработки информации. Они служат для расширения функциональных возможностей процессов контроля и управления. В программное обеспечение входят пакеты прикладных программ, которые реализуют экономико-математические модели разной степени адекватности, отражающие функционирование реального объекта.

Методическое и организационное обеспечение - совокупность методов, средств и документов, регламентирующих взаимодействие модулей ИС, технических и технологических средств, персонала в процессе разработки, внедрения и эксплуатации ИС.

Лингвистическое (онтологическое) обеспечение - набор согласованных правил, методик, словарей, алгоритмических языков высокого уровня, языков управления и манипулирования данными, позволяющий специалистам, разработчикам, пользователям и эксплуатационникам говорить на одном языке. Это средство общения с программным, техническим и информационным обеспечением, а также совокупность терминов, используемых в данной информационной системе.

Правовое обеспечение - федеральные законы и указы президента РФ, постановления государственных органов власти, приказы, отраслевые инструкции, нормативные акты налоговых органов и таможенной службы.

На этапе разработки ИС: нормативные акты, связанные с договорными отношениями разработчика и заказчика ИС, правовое регулирование споров, обеспечение этапов разработки и внедрения охраной прав интеллектуальной собственности.

На этапе функционирования ИС: определения статуса и сферы действия ИТ в конкретных органах управления и контроля, прав и обязанностей персонала, процедуры сбора и обработки информации, обеспечение прав доступа пользователям, нормативная документация о работе с информацией, содержащей секретные и конфиденциальные сведения.

Обучение персонала и сертификация систем и оборудования - набор требований к уровню подготовки специалистов и обслуживающего персонала, учебно-методическая и плановая документации подготовки и повышения квалификации. Требования и спецификации для подготовки разработанных систем для сертификации в отраслевых, государственных и международных сертифицирующих организациях (Госстандарт, Оборонсертифик, ISO, SEI и т. д.).

Функциональная часть MIS реализует назначение информационной системы. Здесь содержится модель управления организацией, отдельных ее составляющих и взаимосвязи.

В рамках функциональной части происходит трансформация целей и задач управления в функции, функций - в алгоритмы, алгоритмов - в конкретные управляющие воздействия на управляемый объект. Эти действия выполняются в подсистемах MIS, выделенных на каждом уровне управления в соответствии с предназначенной функцией (таблица 1).

Таблица 1

Базовые функции управляющей информационной системы

Информационная подсистема маркетинга

Производственные подсистемы

Финансовые и учетные подсистемы

Кадровая и квалификационная подсистемы

Подсистемы высших менеджеров

Исследование рынка, сегментация, прогнозирование продаж

Планирование объемов работ, разработка календарных планов

Управление портфелем заказов и ценных бумаг

Анализ и прогнозирование потребностей в трудовых ресурсах

Элементы стратегического планирования. Реагирование на изменения во внешней среде

Управление закупками и продажами

Оперативный контроль и управление производственными процессами

Управление кредитной политикой

Кадровый учет, учет назначений и перемещений

Анализ стратегических и управленческих ситуаций

Рекомендации по изменению номенклатуры продукции

Анализ работы оборудования и потребности в обновлении

Разработка финансового плана

Ведение текущих и архивных записей о персонале

Выявление и решение тактических проблем

Анализ конъюнктуры и рекомендации по установлению цены

Участие в формировании заказов поставщиков

Финансовый анализ и прогнозирование. Контроль исполнения бюджета

Планирование повышения квалификации персонала

Обеспечение процесса выработки стратегических решений

Учет заказов, рекомендации по рекламной деятельности

Управление запасами и ресурсами

Бухгалтерский учет, расчеты и платежи

Контроль обучения персонала

Контроль деятельности фирмы

Системы поддержки принятия решений

В 1980-е годы американские и японские компании начали развивать информационные системы, которые разительно отличались от MIS. Эти системы положили начало процессу "интеллектуализации" ИС. Новые системы были меньшими, интерактивными, и их целью было помочь конечным пользователям работать со всеми типами данных, проводить аналитические исследования, строить модели и разыгрывать сценарии для решения слабоструктурированных и вообще неструктурированных проблем в инновационных проектах. Системы, предоставляющие такие возможности, называются системами поддержки принятия решений - СППР (Decision Support System - DSS) [Turban E., www.abc.org.ru/smd.html].

Рис. 3 Система поддержки принятия решения как составная часть КИС

В середине 1980-х такие системы стали использоваться в текущей деятельности крупных компаний и корпораций. В настоящее время DSS является обязательной частью корпоративных ИС (КИС) (рис. 3).

Приведем основные характеристики систем поддержки принятия решения:

· предлагают гибкость использования, адаптируемость и быструю реакцию;

· допускают управление входом и выходом;

· работают практически без участия профессиональных программистов;

· обеспечивают информационную поддержку для решений проблем, которые не могут быть определены заранее;

· применяют сложный многомерный и многофакторный анализ и инструментальные средства моделирования.

Данные, приведенные в таблице 2, показывают различия между системами MIS и DSS.

Таблица 2

Параметр

MIS

DSS

Концепция

Обеспечивает формализованные и частично формализованные данные для принятия структурированных решений

Обеспечивает интегрированные инструментальные средства, многомерные разнородные данные, динамические модели и язык интерпретации

Системный анализ

Выделяет информационные требования в соответствии с установленными правилами

Формирует порядок применения инструментальных средств и динамических правил в процессе работы

Проект

Поставляет информацию, основанную на утвержденных требованиях

Итеративный процесс добавления новых данных и информации, вытекающий из динамики среды

Источник данных

Внутренняя и частично внешняя среда

Внешняя и внутренняя среда

Пользователи

Менеджеры эксплуатационного и управленческого уровней

Высшее руководство, менеджеры департаментов, ИТ-служб, управленческого уровня, аналитики

Хорошо разработанные DSS применяются на многих уровнях предприятия. Руководители компании и ведущие менеджеры могут пользоваться финансовыми модулями DSS, чтобы предсказать эффективность использования активов компании при изменении деловой активности или экономической ситуации в стране. Менеджерам среднего звена та же система может быть полезной для оценки перспективности краткосрочных инвестиций по выполняемым проектам. Для руководителей проектов - это инструмент для финансового планирования и распределения средств по планируемым закупкам.

DSS состоят из трех компонент: программного ядра и хранилища данных, аналитических средств обработки, анализа и представления информации, телекоммуникационных устройств.

Рис. 4 Основные компоненты системы поддержки принятия решения

Хранилище данных предоставляет единую среду хранения корпоративных данных, организованных в структуры и оптимизированных для выполнения аналитических операций.

Аналитические средства позволяют конечному пользователю, не имеющему специальных знаний в области информационных технологий, осуществлять навигацию и представление данных в терминах предметной области. Для пользователей различной квалификации DSS располагают различными типами интерфейсов доступа к своим сервисам (рис. 4).

Аналитические системы позволяют решать три основных задачи: анализ разнородной многомерной информации разной степени формализованности в реальном времени, последующий интеллектуальный анализ данных с построением моделей развития деловой ситуации и ведение отчетности.

Процесс принятия делового решения (рис. 5) отличается от аналогичного процесса в научной или социальной сфере тем, что преобразование рабочей гипотезы в решение осложняется двумя объективно существующими проблемами.

Рис. 5 Итерационный процесс принятия решения

Первая из них состоит в том, что накопление личного опыта в ходе повседневной деятельности у бизнесменов отстает от динамичного изменения экономической ситуации - что особенно характерно для современной России. Вторая проблема заключается в том, что в предпринимательской деятельности - да еще в условиях свободного рынка - практически отсутствует возможность проведения целенаправленных экспериментов, которые позволяют проверять правильность гипотезы на практике.

Следовательно, применительно к бизнес-деятельности процесс принятия решения претерпевает разрыв как минимум в двух точках: на этапе выдвижения гипотез и на этапе экспериментальной верификации моделей. Ликвидировать эти разрывы призвано активно развивающееся направление информационных технологий - технология многомерного анализа данных (On-Line Analytical Processing - OLAP).

Коротко эту технологию можно охарактеризовать следующими словами: Быстрый Анализ Разделяемой Многомерной Информации (Fast Analysis of Shared Multidimensional Information - FASMI).

Ценность технологии многомерного анализа данных для бизнеса определяется тем, что она позволяет извлекать из "сырых" структурированных (как правило, в виде таблиц) данных информацию и знания, использование которых в принятии и реализации решений позволяет создавать дополнительную стоимость в компании по сравнению со стоимостью, создаваемой в отсутствие такой информации.

OLAP-технологии

В 1993 году основоположник реляционного подхода к построению баз данных Эдгар Кодд с партнерами (Edgar Codd, математик и стипендиат IBM), опубликовали статью, инициированную компанией "Arbor Software" (сегодня это известнейшая компания "Hyperion Solutions"), озаглавленную "Обеспечение OLAP (оперативной аналитической обработки) для пользователей-аналитиков", в которой сформулированы 12 особенностей технологии OLAP, которые впоследствии были дополнены еще шестью. Эти положения стали основным содержанием новой и очень перспективной технологии.

Основные особенности технологии OLAP (Basic):

· многомерное концептуальное представление данных;

· интуитивное манипулирование данными;

· доступность и детализация данных;

· пакетное извлечение данных против интерпретации;

· модели анализа OLAP;

· архитектура "клиент-сервер" (OLAP доступен с рабочего стола);

· прозрачность (прозрачный доступ к внешним данным);

· многопользовательская поддержка.

Специальные особенности (Special):

· обработка неформализованных данных;

· сохранение результатов OLAP: хранение их отдельно от исходных данных;

· исключение отсутствующих значений;

· обработка отсутствующих значений.

Особенности представления отчетов (Report):

· гибкость формирования отчетов;

· стандартная производительность отчетов;

· автоматическая настройка физического уровня извлечения данных.

Управление измерениями (Dimension):

· универсальность измерений;

· неограниченное число измерений и уровней агрегации;

· неограниченное число операций между размерностями.

Исторически сложилось так, что сегодня термин "OLAP" подразумевает не только многомерный взгляд на данные со стороны конечного пользователя, но и многомерное представление данных в целевой БД. Именно с этим связано появление в качестве самостоятельных терминов "Реляционный OLAP" (ROLAP) и "Многомерный OLAP" (MOLAP).

OLAP-сервис представляет собой инструмент для анализа больших объемов данных в режиме реального времени. Взаимодействуя с OLAP- системой, пользователь сможет осуществлять гибкий просмотр информации, получать произвольные срезы данных и выполнять аналитические операции детализации, свертки, сквозного распределения, сравнения во времени одновременно по многим параметрам. Вся работа с OLAP-системой происходит в терминах предметной области и позволяет строить статистически обоснованные модели деловой ситуации.

Программные средства OLAP - это инструмент оперативного анализа данных, содержащихся в хранилище. Главной особенностью является то, что эти средства ориентированы на использование не специалистом в области информационных технологий, не экспертом-статистиком, а профессионалом в прикладной области управления - менеджером отдела, департамента, управления, и, наконец, директором. Средства предназначены для общения аналитика с проблемой, а не с компьютером. На рис. 6 показан элементарный OLAP-куб, позволяющий производить оценки данных по трем измерениям.

Многомерный OLAP-куб и система соответствующих математических алгоритмов статистической обработки позволяет анализировать данные любой сложности на любых временных интервалах.

Рис. 6 Элементарный OLAP-куб

Имея в своем распоряжении гибкие механизмы манипулирования данными и визуального отображения (рис. рис. 7, рис. 8), менеджер сначала рассматривает с разных сторон данные, которые могут быть (а могут и не быть) связаны с решаемой проблемой.

Далее он сопоставляет различные показатели бизнеса между собой, стараясь выявить скрытые взаимосвязи; может рассмотреть данные более пристально, детализировав их, например, разложив на составляющие по времени, по регионам или по клиентам, или, наоборот, еще более обобщить представление информации, чтобы убрать отвлекающие подробности. После этого с помощью модуля статистического оценивания и имитационного моделирования строится несколько вариантов развития событий, и из них выбирается наиболее приемлемый вариант.

Рис. 7 Аналитическая ИС извлечения, обработки данных и представления информации

У управляющего компанией, например, может зародиться гипотеза о том, что разброс роста активов в различных филиалах компании зависит от соотношения в них специалистов с техническим и экономическим образованием. Чтобы проверить эту гипотезу, менеджер может запросить из хранилища и отобразить на графике интересующее его соотношение для тех филиалов, у которых за текущий квартал рост активов снизился по сравнению с прошлым годом более чем на 10%, и для тех, у которых повысился более чем на 25%. Он должен иметь возможность использовать простой выбор из предлагаемого меню. Если полученные результаты ощутимо распадутся на две соответствующие группы, то это должно стать стимулом для дальнейшей проверки выдвинутой гипотезы.

В настоящее время быстрое развитие получило направление, называемое динамическим моделированием (Dynamic Simulation), в полной мере реализующее указанный выше принцип FASMI.

Используя динамическое моделирование, аналитик строит модель деловой ситуации, развивающуюся во времени, по некоторому сценарию. При этом результатом такого моделирования могут быть несколько новых бизнес-ситуаций, порождающих дерево возможных решений с оценкой вероятности и перспективности каждого.

Рис. 8 Аналитическая ИС извлечения, обработки данных и представления информации

В таблице 3 приведены сравнительные характеристики статического и динамического анализа.

Таблица 3

Характеристика

Статический анализ

Динамический анализ

Типы вопросов

Кто? Что? Сколько? Как? Когда? Где?

Почему так? Что было бы, если…? Что будет, если…?

Время отклика

Не регламентируется

Секунды

Типичные операции работы с данными

Регламентированный отчет, диаграмма, таблица, рисунок

Последовательность интерактивных отчетов, диаграмм, экранных форм. Динамическое изменение уровней агрегации и срезов данных

Уровень аналитических требований

Средний

Высокий

Тип экранных форм

В основном, определенный заранее, регламентированный

Определяемый пользователем, есть возможности настройки

Уровень агрегации данных

Детализированные и суммарные

Определяется пользователем

"Возраст" данных

Исторические и текущие

Исторические, текущие и прогнозируемые

Типы запросов

В основном, предсказуемые

Непредсказуемые - от случаю к случаю

Назначение

Регламентированная аналитическая обработка

Многопроходный анализ, моделирование и построение прогнозов

Практически всегда задача построения аналитической системы для многомерного анализа данных - это задача построения единой, согласованно функционирующей информационной системы, на основе неоднородных программных средств и решений. И уже сам выбор средств для реализации ИС становится чрезвычайно сложной задачей. Здесь должно учитываться множество факторов, включая взаимную совместимость различных программных компонент, легкость их освоения, использования и интеграции, эффективность функционирования, стабильность и даже формы, уровень и потенциальную перспективность взаимоотношений различных фирм производителей.

OLAP применим везде, где есть задача анализа многофакторных данных. Вообще, при наличии некоторой таблицы с данными, в которой есть хотя бы одна описательная колонка и одна колонка с цифрами, OLAP-инструмент будет эффективным средством анализа и генерации отчетов. В качестве примера применения OLAP-технологии рассмотрим исследование результатов процесса продаж.

Ключевые вопросы "Сколько продано?", "На какую сумму продано?" расширяются по мере усложнения бизнеса и накопления исторических данных до некоторого множества факторов, или разрезов: "..в Санкт-Петербурге, в Москве, на Урале, в Сибири…", "..в прошлом квартале, по сравнению с нынешним", "..от поставщика А по сравнению с поставщиком Б…" и т. д.

Ответы на подобные вопросы необходимы для принятия управленческих решений: об изменении ассортимента, цен, закрытии и открытии магазинов, филиалов, расторжении и подписании договоров с дилерами, проведения или прекращения рекламных кампаний и т. д.

Если попытаться выделить основные цифры (факты) и разрезы (аргументы измерений), которыми манипулирует аналитик, стараясь расширить или оптимизировать бизнес компании, то получится таблица, подходящая для анализа продаж как некий шаблон, требующий соответствующей корректировки для каждого конкретного предприятия.

Поля таблицы: Время, Категория товара, Товар, Регион, Продавец, Покупатель, Сумма, Количество.

Время. Как правило, это несколько периодов: Год, Квартал, Месяц, Декада, Неделя, День. Многие OLAP-инструменты автоматически вычисляют старшие периоды из даты и вычисляют итоги по ним.

Категория товара. Категорий может быть несколько, они отличаются для каждого вида бизнеса: Сорт, Модель, Вид упаковки и пр. Если продается только один товар или ассортимент очень невелик, то категория не нужна.

Товар. Иногда применяются название товара (или услуги), его код или артикул. В тех случаях, когда ассортимент очень велик (а некоторые предприятия имеют десятки тысяч позиций в своем прайс-листе), первоначальный анализ по всем видам товаров может не проводиться, а обобщаться до некоторых согласованных категорий.

Регион. В зависимости от глобальности бизнеса можно иметь в виду Континент, Группа стран, Страна, Территория, Город, Район, Улица, Часть улицы. Конечно, если есть только одна торговая точка, то это измерение отсутствует.

Продавец. Это измерение тоже зависит от структуры и масштабов бизнеса. Здесь может быть: Филиал, Магазин, Дилер, Менеджер по продажам. В некоторых случаях измерение отсутствует, например, когда продавец не влияет на объемы сбыта, магазин только один и так далее.

Покупатель. В некоторых случаях, например, в розничной торговле, покупатель обезличен и измерение отсутствует, в других случаях информация о покупателе есть, и она важна для продаж. Это измерение может содержать название фирмы-покупателя или множество группировок и характеристик клиентов: Отрасль, Группа предприятий, Владелец и так далее.

Важный вопрос - наличие данных. Если они есть в каком-либо виде (Excel- или Access-таблица, данные из базы учетной системы, в виде структурированных отчетов филиалов), ИТ-специалист сможет передать их OLAP-системе напрямую или с промежуточным преобразованием. Для этого OLAP-системы имеют специальные инструменты конвертации данных.

После настройки OLAP-системы на данные пользователь получит возможность быстро получать ответы на ключевые вопросы путем простых манипуляций мышью над OLAP-таблицей и соответствующими меню. При этом будут доступны некоторые стандартные методы анализа, логически следующие из природы OLAP-технологии.

Факторный (структурный) анализ. Анализ структуры продаж для выявления важнейших составляющих в интересующем разрезе. Для этого удобно использовать, например, диаграмму типа "Пирог" в сложных случаях, когда исследуется сразу 3 измерения - "Столбцы". Например, в магазине "Компьютерная техника" за квартал продажи компьютеров составили $100000, фототехники -$10000, расходных материалов - $4500. Вывод: оборот магазина зависит в большой степени от продажи компьютеров (на самом деле, быть может, расходные материалы необходимы для продажи компьютеров, но это уже анализ внутренних зависимостей).

Анализ динамики (регрессионный анализ - выявление трендов). Выявление тенденций, сезонных колебаний. Наглядно динамику отображает график типа "Линия". Например, объемы продаж продуктов компании Intel в течение года падали, а объемы продаж Microsoft росли. Возможно, улучшилось благосостояние среднего покупателя, или изменился имидж магазина, а с ним и состав покупателей. Требуется провести корректировку ассортимента. Другой пример: в течение 3 лет зимой снижается объем продаж видеокамер.

Анализ зависимостей (корреляционный анализ). Сравнение объемов продаж разных товаров во времени для выявления необходимого ассортимента - "корзины". Для этого также удобно использовать график типа "Линия". Например, при удалении из ассортимента принтеров в течение первых двух месяцев обнаружилось падение продаж картриджей с порошком.

Сопоставление (сравнительный анализ). Сравнение результатов продаж во времени, или за заданный период, или для заданной группы товаров. В зависимости от количества анализируемых факторов (от 1 до 3-х) используется диаграмма типа "Пирог" или "Столбцы". Пример: сравнение результатов продаж однотипных магазинов для оценки качества работы менеджеров.

Дисперсионный анализ. Исследование распределения вероятностей и доверительных интервалов рассматриваемых показателей. Применяется для прогнозирования и оценки рисков.

Этими видами анализа возможности OLAP не исчерпываются. Например, применяя в качестве алгоритма вычисления промежуточных и окончательных итогов функции статистического анализа - дисперсию, среднее отклонение, моды более высоких порядков, - можно получить самые изощренные виды аналитических отчетов.

OLAP-системы являются частью более общего понятия "интеллектуальные ресурсы предприятия" или "средства интеллектуального бизнес-анализа" (Business Intelligence - BI), которое включает в себя помимо традиционного OLAP-сервиса средства организации совместного использования данных и информации, возникающих в процессе работы пользователей хранилища. Технология Business Intelligence обеспечивает электронный обмен отчетными документами, разграничение прав пользователей, доступ к аналитической информации из Internet и Intranet.

информационный управляющий систем корпоративный

Технологии Data Mining

В настоящее время элементы искусственного интеллекта активно внедряются в практическую деятельность менеджера. В отличие от традиционных систем искусственного интеллекта, технология интеллектуального поиска и анализа данных или "добыча данных" (Data Mining - DM), не пытается моделировать естественный интеллект, а усиливает его возможности мощностью современных вычислительных серверов, поисковых систем и хранилищ данных. Нередко рядом со словами "Data Mining" встречаются слова "обнаружение знаний в базах данных" (Knowledge Discovery in Databases).

Рис. 9

Data Mining - это процесс обнаружения в сырых данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Data Mining представляют большую ценность для руководителей и аналитиков в их повседневной деятельности. Деловые люди осознали, что с помощью методов Data Mining они могут получить ощутимые преимущества в конкурентной борьбе.

В основу современной технологии Data Mining (Discovery-driven Data Mining) положена концепция шаблонов (Patterns), отражающих фрагменты многоаспектных взаимоотношений в данных. Эти шаблоны представляют собой закономерности, свойственные выборкам данных, которые могут быть компактно выражены в понятной человеку форме. Поиск шаблонов производится методами, не ограниченными рамками априорных предположений о структуре выборки и виде распределений значений анализируемых показателей. На рис. 6.9 показана схема преобразования данных с использованием технологии Data Mining.

Рис. 10

Основой для всевозможных систем прогнозирования служит историческая информация, хранящаяся в БД в виде временных рядов. Если удается построить шаблоны, адекватно отражающие динамику поведения целевых показателей, есть вероятность, что с их помощью можно предсказать и поведение системы в будущем. На рис. 10 показан полный цикл применения технологии Data Mining.

Важное положение Data Mining - нетривиальность разыскиваемых шаблонов. Это означает, что найденные шаблоны должны отражать неочевидные, неожиданные (Unexpected) регулярности в данных, составляющие так называемые скрытые знания (Hidden Knowledge). К деловым людям пришло понимание, что "сырые" данные (Raw Data) содержат глубинный пласт знаний, и при грамотной его раскопке могут быть обнаружены настоящие самородки, которые можно использовать в конкурентной борьбе.

Сфера применения Data Mining ничем не ограничена - технологию можно применять всюду, где имеются огромные количества каких-либо "сырых" данных!

В первую очередь методы Data Mining заинтересовали коммерческие предприятия, развертывающие проекты на основе информационных хранилищ данных (Data Warehousing). Опыт многих таких предприятий показывает, что отдача от использования Data Mining может достигать 1000%. Известны сообщения об экономическом эффекте, в 10-70 раз превысившем первоначальные затраты от 350 до 750 тыс. долларов. Есть сведения о проекте в 20 млн долларов, который окупился всего за 4 месяца. Другой пример - годовая экономия 700 тыс. долларов за счет внедрения Data Mining в одной из сетей универсамов в Великобритании.

Компания Microsoft официально объявила об усилении своей активности в области Data Mining. Специальная исследовательская группа Microsoft, возглавляемая Усамой Файядом, и шесть приглашенных партнеров (компании Angoss, Datasage, Epiphany, SAS, Silicon Graphics, SPSS) готовят совместный проект по разработке стандарта обмена данными и средств для интеграции инструментов Data Mining с базами и хранилищами данных.

Data Mining является мультидисциплинарной областью, возникшей и развивающейся на базе достижений прикладной статистики, распознавания образов, методов искусственного интеллекта, теории баз данных и др. (рис. 11). Отсюда обилие методов и алгоритмов, реализованных в различных действующих системах Data Mining. [Дюк В.А. www.inftech.webservis.ru/it/datamining/ar2.html]. Многие из таких систем интегрируют в себе сразу несколько подходов. Тем не менее, как правило, в каждой системе имеется какая-то ключевая компонента, на которую делается главная ставка.

Можно назвать пять стандартных типов закономерностей, выявляемых с помощью методов Data Mining: ассоциация, последовательность, классификация, кластеризация и прогнозирование.

Рис. 11 Области применения технологии Data Mining

Ассоциация имеет место в том случае, если несколько событий связаны друг с другом. Например, исследование, проведенное в компьютерном супермаркете, может показать, что 55% купивших компьютер берут также и принтер или сканер, а при наличии скидки за такой комплект принтер приобретают в 80% случаев. Располагая сведениями о подобной ассоциации, менеджерам легко оценить, насколько действенна предоставляемая скидка.

Если существует цепочка связанных во времени событий, то говорят о последовательности. Так, например, после покупки дома в 45% случаев в течение месяца приобретается и новая кухонная плита, а в пределах двух недель 60% новоселов обзаводятся холодильником.

С помощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Это делается посредством анализа уже классифицированных объектов и формулирования некоторого набора правил.

Кластеризация отличается от классификации тем, что сами группы заранее не заданы. С помощью кластеризации средства Data Mining самостоятельно выделяют различные однородные группы данных.

Статистические пакеты

Последние версии почти всех известных статистических пакетов включают наряду с традиционными статистическими методами также элементы Data Mining. Но основное внимание в них уделяется все же классическим методикам - корреляционному, регрессионному, факторному анализу и другим.

Недостатком систем этого класса считают требование к специальной подготовке пользователя. Также отмечают, что мощные современные статистические пакеты являются слишком "тяжеловесными" для массового применения в финансах и бизнесе.

Есть еще более серьезный принципиальный недостаток статистических пакетов, ограничивающий их применение в Data Mining. Большинство методов, входящих в состав пакетов, опираются на статистическую парадигму, в которой главными фигурантами служат усредненные характеристики выборки. А эти характеристики при исследовании реальных сложных жизненных феноменов часто являются фиктивными величинами. Это чрезвычайно важное обстоятельство следует обязательно учитывать при анализе многомерных данных.

В качестве примеров наиболее мощных и распространенных статистических пакетов можно назвать SAS (компания SAS Institute), SPSS (компания SPSS), STATGRAPHICS (компания Manugistics), STATISTICA для WINDOWS, STADIA и другие. Эти пакеты с успехом могут применять небольшие и средние предприятия, а большие многопрофильные компании могут интегрировать их в общую корпоративную сеть.

Размещено на Allbest.ru

...

Подобные документы

  • Совершенствование технологий записи и хранения данных. Специфика современных требований к переработке информационных данных. Концепция шаблонов, отражающих фрагменты многоаспектных взаимоотношений в данных в основе современной технологии Data Mining.

    контрольная работа [565,6 K], добавлен 02.09.2010

  • Перспективные направления анализа данных: анализ текстовой информации, интеллектуальный анализ данных. Анализ структурированной информации, хранящейся в базах данных. Процесс анализа текстовых документов. Особенности предварительной обработки данных.

    реферат [443,2 K], добавлен 13.02.2014

  • Этапы развития информационной системы и происходящие в ней процессы. Виды, инструментарий, составляющие информационных технологий. Производство информации для ее анализа человеком и принятия на его основе решения как цель информационной технологии.

    контрольная работа [2,7 M], добавлен 18.12.2009

  • Описание функциональных возможностей технологии Data Mining как процессов обнаружения неизвестных данных. Изучение систем вывода ассоциативных правил и механизмов нейросетевых алгоритмов. Описание алгоритмов кластеризации и сфер применения Data Mining.

    контрольная работа [208,4 K], добавлен 14.06.2013

  • Основные факторы, влияющие на историю развития корпоративных автоматизированных информационных систем. Их общая характеристика и классификация. Состав и структура интегрированных АИС. ERP-системы как современный вид корпоративной информационной системы.

    презентация [194,0 K], добавлен 14.10.2013

  • Реляционные базы данных как часть корпоративных информационных систем, их построение по принципам клиент-серверной технологии. Основные характеристики СУБД Firebird. Проектирование базы данных для информационной системы "Компьютерные комплектующие".

    курсовая работа [1,9 M], добавлен 28.07.2013

  • Технологические процессы обработки информации в информационных технологиях. Способы доступа к Internet. Информационные технологии в локальных и корпоративных компьютерных сетях. Средства обработки графической информации. Понятие информационной технологии.

    учебное пособие [1,4 M], добавлен 23.03.2010

  • Информационные связи в корпоративных системах. Банк данных, его состав, модели баз данных. Системы классификации и кодирования. Интегрированные информационные технологии. Задачи управления и их реализация на базе информационной технологии фирмы.

    практическая работа [31,0 K], добавлен 25.07.2012

  • Принцип работы и назначение обучаемых информационных систем, их классификация по различным критериям, разновидности и отличия. Характеристика систем поддержки принятия решений. Механизм и основные этапы проектирования информационной обучаемой системы.

    реферат [23,9 K], добавлен 22.11.2009

  • Data Mining как процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации). Его закономерности и этапы реализации, история разработки данной технологии, оценка преимуществ и недостатков, возможности.

    эссе [36,8 K], добавлен 17.12.2014

  • Осмысление и переработка информационных данных, которые используются для решения управленческих задач. Общая схема информационной системы, ввод данных, их обработка, хранение и распределение полученной информации. Характеристики информационных систем.

    контрольная работа [59,8 K], добавлен 03.10.2010

  • Типы административных информационных систем: системы генерации отчетов, системы поддержки принятия решений, системы поддержки принятия стратегических решений. Сортировка и фильтрация списков в Microsoft Excel. Работа с базами данных в Microsoft Access.

    контрольная работа [6,0 M], добавлен 19.11.2009

  • Понятие информационных систем и принципы их проектирования. Изучение различных методов извлечения знаний, построение оптимальной информационной системы Data Mining, позволяющей разбивать набор данных, представленных реляционными базами данных на кластеры.

    аттестационная работа [4,7 M], добавлен 14.06.2010

  • Изучение понятия корпоративной информационной системы; требования к их разработке. Ознакомление с процессом проектирования и внедрения данных компьютерных технологий на производстве. Рассмотрение специфики работы корпоративных информационных систем.

    курсовая работа [33,1 K], добавлен 02.11.2014

  • Корпоративные информационные системы и базы данных, их использование для совершенствования и отлаживания ведения бизнеса. Классификация корпоративных информационных систем. Информационные системы класса OLTP. Оперативная аналитическая обработка.

    курсовая работа [54,2 K], добавлен 19.01.2011

  • Обслуживание двух встречных потоков информации. Структура информационных систем. Разработка структуры базы данных. Режимы работы с базами данных. Четыре основных компонента системы поддержки принятия решений. Выбор системы управления баз данных.

    курсовая работа [772,0 K], добавлен 21.04.2016

  • Классификация информационно-управляющих систем, технологии их проектирования. Функциональное назначение модулей корпоративной ИУС, анализ современного состояния рынка в этой области, описание архитектуры. Методологии моделирования предметной области.

    презентация [498,3 K], добавлен 14.10.2013

  • Классификация информационных систем. Использование баз данных в информационных системах. Проектирование и реализация информационной системы средствами MS Access. Анализ входной информации предметной области и выделение основных информационных объектов.

    курсовая работа [2,5 M], добавлен 09.08.2012

  • Основные характеристики и принцип новой информационной технологии. Соотношение информационных технологий и информационных систем. Назначение и характеристика процесса накопления данных, состав моделей. Виды базовых информационных технологий, их структура.

    курс лекций [410,5 K], добавлен 28.05.2010

  • Сущность системы поддержки принятия управленческих решений. Функции корпоративной системы SAP R3, выполнение регрессионного анализа в табличном процессоре Excel, создание в Access базы данных. Характеристика информационных служб в сети Интернет.

    контрольная работа [2,0 M], добавлен 18.02.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.