Модели и алгоритмы системы поддержки принятия решений на основе многомерных хранилищ данных

Анализ существующих систем хранения и обработки информации. Разработка новых аналитических моделей и алгоритмов интеллектуального анализа данных и программного комплекса системы поддержки принятия решений на основе многомерных моделей хранилищ данных.

Рубрика Программирование, компьютеры и кибернетика
Вид автореферат
Язык русский
Дата добавления 28.03.2018
Размер файла 490,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

АВТОРЕФЕРАТ

диссертации на соискание ученой степени кандидата технических наук

Модели и алгоритмы системы поддержки принятия решений на основе многомерных хранилищ данных

Специальность: 05.13.18 - математическое моделирование, численные методы и комплексы программ

На правах рукописи

Рахал Ясер

Казань 2010

Диссертация выполнена в Казанском государственном техническом университете им. А.Н. Туполева.

Научный руководитель:кандидат технических наук, доцент Ризаев Ильдус Султанович.

Официальные оппоненты: доктор технических наук, профессор Захаров Вячеслав Михайлович;

доктор технических наук, профессор Симонова Лариса Анатольевна.

Ведущая организация: Научно-исследовательский институт математики и механики им. Н.Г.Чеботарева Казанского (Приволжского) федерального университета.

Защита состоится « 1 » октября 2010 г. в часов на заседании диссертационного совета Д 212.079.01 в Казанском государственном техническом университете им. А.Н. Туполева по адресу: 420111, г. Казань, ул. Карла Маркса, д. 10, зал заседаний ученого совета. Автореферат диссертации размещен на сайте Казанского государственного технического университета им. А.Н. Туполева www.kai.ru

С диссертацией можно ознакомиться в научной библиотеке Казанского государственного технического университета им. А.Н. Туполева.

Автореферат разослан « » 2010 г.

Ученый секретарь диссертационного совета доктор физ.-мат. наук, профессор Данилаев П.Г.

Общая характеристика работы

Актуальность темы. В настоящее время базы данных широко используются в нашей повседневной жизни. Любая, успешно работающая организация, хранит свои данные и обрабатывает их с использованием современных систем управления базами данных. Они повсеместно используются для получения сведений о сотрудниках, о товарах, о продажах, бухгалтерских данных, данных бизнеса и т.д. Но информация сама по себе без обработки не представляет интерес, поэтому работа с базами данных всегда требует совершенствования способов хранения данных, а также сокращения времени выборки данных, необходимых для получения своевременной и необходимой информации.

Важным фактором в современных рыночных условиях является оперативное принятие деловых решений. Однако многие предприятия сталкивается с таким препятствием, как большой объём и высокая сложность данных. Решением данного вопроса может стать создание системы поддержки принятия решений (СППР) на основе хранилищ данных (ХД). Хранилище данных представляет собой накопитель информации из других систем (баз данных, файлов, электронных таблиц и др.), на основе которых строятся процессы принятия решений и анализа данных.

Системы поддержки принятия решений (СППР) - это системы, обладающие средствами ввода, хранения и анализа данных, относящихся к определённой предметной области, с целью поиска решений.

Основная задача СППР - предоставление аналитикам инструмента для выполнения анализа данных. СППР не гарантирует правильных решений, а только поставляет аналитику данные в виде таблиц, отчётов, графиков и т.п. для изучения и анализа.

Исследованию СППР на основе ХД посвящены работы Э.Спирли, Р.Кимбала, А.А.Барсегяна, И.А.Чубуковой, М.С. R.Agrawal, P.Vassiliadis, С.Хайкина, И.С.Ризаева, А.Н.Кузьмина, Л.Ю.Емалетдиновой, Н.М.Вдовичева и др.

Трудно переоценить актуальность построения системы принятия решений (СППР) для крупных банков, предприятий нефтяной, газовой отрасли, машиностроении, металлургии, торговле и т.д. Конечно, СППР, основанная на технологии хранилищ данных или витрин данных (а большинство СППР базируются именно на них), будет быстрее окупаться на крупных предприятий или организациях с развитой филиальной сетью и разнообразной деятельностью, внедряющих корпоративные информационные системы.

Объект исследования. Системы хранения, обработки и извлечения информации из баз данных и хранилищ данных.

Предмет исследования. Модели и алгоритмы систем поддержки принятия решений на основе многомерных моделей баз и хранилищ данных.

Научная задача. Разработка новых аналитических моделей и алгоритмов интеллектуального анализа данных и программного комплекса системы поддержки принятия решений на основе многомерных моделей хранилищ данных

Цель и задачи исследований. Целью работы является повышение эффективности обработки и хранения больших объемов информации за счет использования технологии хранилищ данных.

Для достижения поставленной цели необходимо решить следующие задачи:

1. Проанализировать и исследовать существующие способы хранения и обработки информации.

2. Разработать модели и алгоритмы интеллектуального анализа данных с целью прогнозирования и поддержки принятия решений.

3. Создать методику разработки концептуальной модели многомерного представления данных для эффективного хранения и быстрого выполнения запросов при хранении объектной информации.

4. Провести экспериментальные исследования моделей и алгоритмов с помощью разработанных программ интеллектуального анализа данных и системы поддержки принятия решений в среде СУБД ORACLE на основе концепции хранилищ данных

Методы исследования. При решении поставленных задач использовались математические модели и методы системного и интеллектуального анализа данных, теории вероятностей, теории множеств, теории нейронных сетей, классические методы линейного и целочисленного программирования, системного программирования.

Научная новизна работы.

1. Предложено использование математической модели на основе теории множеств для интеллектуального анализа данных с целью решения задач классификации различных объектов. Разработаны алгоритмы разбиения клиентов на классы с использованием метода “классификационных правил”, в случае учета нескольких независимых переменных наивный метод Байеса для получения таблицы решений.

2. Разработан алгоритм вычисления ассоциативных правил с учетом распределенного хранения информации с целью ускорения процесса выполнения таких правил.

3. Разработан модифицированный алгоритм кластеризации на основе k-среднего и предложен метод исправления результатов кластеризация для категориальных объектов на основе информационного подхода, с применением критерия энтропии.

4. Разработана структура трехслойной нейронной сети с вычислением весовых коэффициентов для прогнозирования и принятия решений.

5. Разработана методика построения многомерной модели хранилища данных, а также дано формализованное описание гиперкуба и возможных операций над кубом данных.

Практическая ценность диссертации состоит в следующем:

-разработан программный комплекс системы поддержки принятия решений и прогнозирования с использованием многомерных моделей для интеллектуального анализа данных;

- разработаны алгоритмы и комплексы программ на языке PL/SQL в среде СУБД ORACLE для решения задач классификации, кластеризации, поиска ассоциативных правил для крупных информационных предприятий;

- разработана структура трехслойной нейронной сети для решения задач прогнозирования для торговых организаций, банковских структур, и др.;

- разработаны методы увеличения быстродействия выполнения запросов за счет использования материализованного представления, индексов и параллельного выполнения транзакций при разделении данных.

Результаты работы. Результаты выполненных исследований и разработок использовались:

- в Торговом доме «Лес Парк Сад», занимающегося оптовой и розничной продажей товаров;

- в научно-техническом центре ООО фирмы «ЛУН-М», занимающегося формированием комплектующих технических средств для подъемных кранов;

- в учебном процессе кафедры Автоматизированных систем обработки информации и управления в форме электронного учебного пособия «Лабораторный практикум СУБД ORACLE» по дисциплине «Распределенные базы данных» для студентов специальности 230102, кроме того, разработанные методы и алгоритмы по классификации, кластеризации, прогнозированию на основе нейронных сетей рекомендованы студентам для выполнения курсовых и дипломных работ.

Апробация работы. Основные результаты диссертации докладывались и обсуждались на следующих международных и всероссийских конференциях:

Всероссийская научно-практическая конференция. “Наука и профессиональная деятельность”. (Нижнекамск. 2008,2009,2010);

Международная конференция. Инфокоммуникационные технологии глобального информационного общества. (Казань, 2008, 2009); XVI Международной конференции по вычислительной механике и современным прикладным программным системам. (Крым, Алушта 2009); Седьмая международная конференция «Исследование, разработка и применение высоких технологий в промышленности» (Санкт-Петербург, 2009); Международная молодежная научная конференция “Туполевские чтения”.(Казань, КГТУ им. А.Н. Туполева, 2008, 2009).

Публикации. Содержание диссертации опубликовано в 16 работах, включая 8 статей, в том числе две статьи в изданиях, входящих в перечень ВАК (Вестник КГТУ им. А.Н.Туполева).

Структура и объем работы.

Диссертационная работа состоит из введения, четырех глав, заключения, списка литературы и приложений. Работа содержит 146 страниц основного текста, 50 рисунков, 27 таблиц. и 5 приложений. Список литературы включает 93 наименования.

интеллектуальный многомерный хранение информация

СОДЕРЖАНИЕ РАБОТЫ

Во введении обосновываются актуальность и практическая значимость работы, определена цель работы, формулируются основные задачи исследования и пути их решения.

В первой главе рассматривается классическая реляционная модель данных, основанная на теории нормализации отношений. Показана область применения реляционных моделей. Показано, что тогда, когда целью является выполнение задач связанных со сбором, хранением и поиском информации, эффективным средством является применение традиционных реляционных баз данных. В случае же анализа и принятия решения с использованием существующих (исторически накопленных) данных, лучше воспользоваться хранилищем данных с технологией OLAP. Использование материализованных представлений и организация данных в виде кросс-таблиц значительно сокращается время выборки данных.

В главе проведено экспериментальное сравнение между OLTP и OLAP системами, а также сравнение между существующими архитектурными принципами построения ХД (с точки зрения «Bill Inmon» и «Ralph Kimball»).

В диссертации приведены примеры, связанные с предметной областью в сфере торговли.

В результате анализа и исследований, проведенных в первой главе сделан вывод о необходимости использования многомерных моделей данных для повышения эффективности обработки информации.

Во второй главе исследуются и решаются задачи интеллектуального анализа данных с целью обнаружения знаний и прогнозирования. Для этого используются методы интеллектуального анализа, в число которых входят классификация, поиск ассоциативных правил, кластеризация, регрессия и др. На примерах возможности обслуживания клиентов в торговых организациях используются методы классификации (классификационные правила, наивный метод Байеса, деревья решений). Выбор между первым и вторым зависит от количества независимых атрибутов входящих в процесс классификации. Деревья решений используются для представления правил в иерархическом виде. Для оценки точности алгоритма и определения порядка атрибутов во время процесса разбиения объектов на классы предлагается выполнять это на основе теории информации. Тогда оценка среднего количества информации, необходимого для определения класса объектов из множества X, дает выражение

При решении задачи поиска ассоциативных правил рассматриваются два подхода: по одному атрибуту или по нескольким. В первом случае решается задача определения наборов товаров, совместно приобретаемых (покупаемых) клиентами. В случае нескольких атрибутов исследуются отношения между возрастом клиентов, их доходов и объемом покупок. Характеристиками ассоциативных правил являются поддержка и достоверность.

Пусть множество транзакций, - множество объектов. Тогда правило представляется в виде: если (условие) то (результат), (если X то Y) с доверием C. Если C% транзакций из множества T содержат X, то они также содержать Y, с поддержкой S. Если S% транзакций множества T содержат XY, где X I и Y I & X Y = O.

Поддержка правила:

и его доверия

Алгоритм поиска требует нахождения наибольшего количества всех подгрупп {G}, состоящих из множества I объектов, которые всегда встречаются вместе.

Из тех подгрупп, которые повторяются больше, чем определенное число (поддержка) можно вычислить все возможные ассоциативные правила. Количество групп из множества N объектов можно определить по формуле

При этом из каждой группы извлекают ряд возможных подмножеств . Количество возможных правил из множества N объектов определяется по формуле:

Предложен пример алгоритма поиска совместно встречаемых товаров, результаты поиска представлены на рис.1.

Рис.1. Результаты поиска ассоциативных правил

Задача поиска ассоциативных правил по нескольким атрибутам состоит в анализе отношений между атрибутами. Если рассмотрим многомерную базу данных, представленную в форме гиперкуба, то данные будут храниться в форме двух или более измерений. В этом случае нет отношения между значениями одного измерения. Пусть множества измерений многомерной базы данных, каждый из них имеет свое множество значений: , где cardDi- количество различных значений измерения «Di».

Правила будут в форме:

где: k {K} {1,2,…n} и s {S} {1,2,…n} и {K}{S}=, l {1,2,…card Dk} , v {1,2,…card Ds} .

В диссертации приведен алгоритм поиска ассоциативных правил для изучения отношения между возрастом клиента, его доходом и объемом покупок.

Для разделения объектов по целому набору параметров используется кластерный анализ. Кластерный анализ состоит в разделении множества объектов на группы похожих объектов, при этом каждый объект характеризуется набором атрибутов ,. Пусть C множество кластеров

где сj - кластер, содержащий объекты из множества X, похожих друг на друга.

где - расстояние между объектами и . - величина, которая определяет меру близости.

Для категориальных объектов расстояние можно вычислить следующим образом:

где

Алгоритм разбиения требует определения точек центров кластеров и их количества. Определим центры на основе энтропии

.

Энтропия системы будет минимальной, если энтропия каждого кластера также будет минимальной.

Поскольку количество кластеров заранее неизвестно, вычисляются все возможные кластеры в соответствии с алгоритмом.

1- For k=2 to N (Количество объектов) loop

2- Найти k наиболее разнородных объектов (по критерию энтропии)

3- Для каждого объекта из остальных повторить:

3-1- положить объект в наиболее близкий кластер,

Найти

,

где j=1,2,…K, i=1,2…n-k;

3-2- вычислить новый центр,

3-3- закончить, если все объекты размещены по кластерам и больше нет изменений в центрах кластеров.

Основной проблемой кластерного анализа является предварительное определение количества центров кластеров. Для решения этой проблемы надо выполнить процесс кластеризации и определить качество разделения объектов на кластеры. Это означает, что необходимо выполнить процесс кластеризации и выяснить эффективность разбиения с помощью критерия. Предлагается использование критериев Hubert и Schultz и индекса эффективности.

- Критерий Hubert и Schultz

где, где ,

,

Где - сумма наименьших расстояний сочетаний всех пар для каждого кластера. - сумма наибольших расстояний для всех пар. - представляет собой сумму расстояний над всеми парами модели из того же кластера. Минимум этого критерия дает оптимальное количество кластеров.

- Индекс эффективности:

где - межкластерные отличия, и - внутрикластерные отличия, .

Минимум этого критерия дает оптимальное количество кластеров.

На рис.2. представлен результат выполнения процесса кластеризации для исходных данных (возраст клиента, объем покупок) и на рис.3 представлен критерии эффективности результата на основе критериев Hubert и Schultz и индекса эффективности.

Рис.2. Результат процесса кластеризации

Для рассмотренного примера оптимальное количество центров кластеризации равно трем, на что указывают оба критерия.

Рис.3. Критерии кластеризации

Для исправления эффективности алгоритма k-средний используем новый алгоритм на основе энтропии. Основная идея данного метода - найти объекты, которые окружены объектами, принадлежащими другому кластеру (см.рис.4). Если при вычислении энтропия будет уменьшаться, то перераспределение объектов по кластерам будет давать более правильный результат. Алгоритм улучшения разделения объектов по кластерам будет следующим:

Рис.4. Пример кластеризации: A- Исходные данные, B - Кластеры на основе алгоритма k-средних, C- Кластеры с учетом исправлений на основе энтропии

1. Повторять для каждого объекта Xi (принадлежат кластеру Ci) исходных данных.

2. Найти самые близкие N объектов (), где .

3. Найти кластер Cj каждого объекта Yj.

4. Из этих кластеров найти кластер Cij где есть большинство объектов Yj.

5. Если .

6. где

a. : сумма энтропии всех кластеров, если Xi Ci.

b. : сумма энтропий всех кластеров после изменения кластера объекта Xi на Cij.

7. Если пусть .

8. До стабильности объектов определенным кластерам.

Для прогнозирования финансового рынка, объема продаж, изменения ценовой политики приводится сравнение между экспоненциальным сглаживанием и использованием нейронных сетей для прогнозирования цены доллара в рублях (см.рис.5).

Рис. 5. Результаты прогнозирование

В третьей главе разработана модель трехуровневого хранилища данных, с независимыми витринами данных, ориентированных на подразделения предприятия.

Для перехода от реляционной базы данных к хранилищу данных выделены три категории сущностей: сущность транзакций, составные сущности, сущности классификаций. Сущность транзакций это сущность, где собирается информация о конкретных событиях, которые происходят в бизнесе, например, «продажа», «заказ» и т.д. Составные сущности это сущности, которые непосредственно связаны с сущностями транзакций через отношения “один - ко - многим". Составные сущности определяют детали или компоненты каждой транзакции. Например, сущность, «клиент», «товар», «время» и т.д. Объекты составные сущности размещены в определенном порядке, называемым «классом иерархии».

Сущности классификации это сущности, которые имеют отношение к составным сущностям типа “один - ко - многим ", т. е. они функционально зависят от них. Они представляют иерархию, встроенную в модель данных, которые могут быть свернуты в составные компоненты в форме таблиц измерений в схеме "звезда". Например, сущность «тип-клиент», «тип-товар». Атрибуты сущностей транзакций представлены в виде фактов, а атрибуты составных сущностей представлены в виде измерений. Такое представление образует гиперкуб данных.

Математическая модель представления гиперкуба с «N» измерениями строится с использованием теории множеств. Такая модель включает следующие компоненты:

(1)

где , - множество измерений куба и - мера, которая представляет собой факт куба (например, продажа); - множество значений измерения (уровни) или мера куба. Ts - Набор данных ячейки или набор кортежей в форме: , где ti1 dom(d1), … tin dom(ds).

C0n -базовый куб, состоящий из детальных данных в соответствие с самым низким уровнем класса иерархии.

,

где , - множество измерений куба и - мера, которая представляет собой факт куба (продажа); , множество значений измерения, представляющий самый низкий уровень класса иерархии; T0n - набор данных ячейки или набор кортежей в форме:

где ti1 dom(d1), … tin dom(ds).

Утверждение. Отношение (1) отображает таблицу фактов и позволяет представить все возможные операции гиперкуба: срез, вращение, консолидация и детализация.

Операции на кубе

Одним из важнейших свойств куба данных является возможность получения другого куба с помощью функций группирования, таких как {sum, avg, count, max, min ….}. В диссертации даны формальные методы преобразования гиперкуба.

Покажем, что

где f - функции группирования, k - номер атрибута группировки, если

·

·

·

Для базового куба: ,

здесь y может представлять одну или несколько строк, поэтому обычно количества строк в кубе меньше чем количества строк в кубе .

Операция проекции () позволяет уменьшить количество измерений куба

если

·

·

· ,

где количество измерения куба C.

Навигация (nav) -позволяет подготовить новый куб с новым состоянием, за счет использования функций навигации (f). Обычно навигации выполняется над классом измерений, чтобы перейти на более низкий уровень данных или на более высокий уровень детализации.

Допустим куб, представляет данные, касающиеся продаж в виде (квартал, город, товар), но тут возникает необходимость просмотреть данные и на других уровнях измерений. В виде (год, город, товар) или (день, город, товар).

если

·

·

·

Существуют пять основных команд OLAP (Roll Up, DRILL DOWN, SLICE, DICE, PIVOT), позволяющих производить определенные операции над кубом. Для успешного выполнения этих команд куб должен обладать определенными свойствами. Например, в кубе не допустимо, чтобы два уровня принадлежали одному и тому же иерархическому измерению.

- Операция Roll Up используется для перехода на более высокие уровни обобщения. Эта команда берет текущий куб - данных, и выполняет GROUP BY по одному из его измерений. Например, с учетом общего числа проданных единиц в месяц, можно установить продажи с обобщением за квартал или за год следующим образом:

если

·

·

где - новый уровень измерения, над которым была выполнена функция группирования.

· - функция группирование.

·

- Операция DRILL DOWN, используется для перехода на более низкий уровень детализации. Здесь детализация идет сверху - вниз. Эта команда является противоположностью Roll Up, например, зная общее количество проданных товаров в стране, можно представить продажи по каждому городу. Чтобы выполнить данную операцию необходимо использовать «базовый» куб.

если

·

·

где - новый уровень измерения, над которым была выполнена функция детализации.

где T0 - строки центрального куба,

- функция группирования.

· .

- Операция Срез (Slice) позволяет взять куб с конкретным состоянием, вырезать указанные измерения и оставить остальные измерения без изменения так, как показана на рис.6, где срез выполнен по измерению «Товар».

·

·

·

· .

· .

Рис. 6. Операция срез и кость над кубом данных

- Операция Кость (Dice) позволяет определить подкуб (кость) путем выборки по двум или более измерениям как показано на рис.6, где кость выполнена по измерениям «Время» и «Место».

где k <n.

· - (d1,d2…,dk)

·

·

· .

В четвертой главе описывается система поддержки принятия решений для интеллектуального анализа данных и прогнозирования. Система включает в себя, несколько подсистем: подсистему извлечения данных, подсистему хранения, подсистему поиска, интеллектуального анализа, прогнозирования и подсистему безопасности.

Также в четвертой главе рассматриваются методы повышения эффективности обработки данных с целью ускорения времени выполнения запросов. Предложены следующие методы:

1. Использование материализованного представления, предназначенного для хранения агрегированных данных в отдельной таблице, что позволяет избежать эффекта разреженной таблицы. На рис.7 показан эффект использования материализованного представления во время выполнения запросов.

2. Разделение таблиц и параллельность выборки. Предлагается делить большие таблицы на маленькие и работать с полученным результатом в параллельном режиме. Таблицы могут быть разделены по вертикали или горизонтали. По вертикали они делятся в соответствии с витринами данных. Горизонтальное деление позволит сократить время выполнения запросов так, как показано на рис.8.

3. Индексирование данных также влияет на производительность ХД. Для этого могут быть использованы индексы «Bitmap» и «B-tree». Эффект от применения этих индексов показан на рис.9. Экспериментально доказана эффективность применения индекса «Bitmap» для таблицы фактов тогда, когда количество различных значений атрибутов не является достаточно большим. Индекс «B-tree» лучше использовать для таблиц с детализированными данными.

Размещено на http://www.allbest.ru/

Система разработана в среде СУБД «Oracle 9.2» и программы «Developer 2000». Архитектура системы показана на рис.10, Система имеет возможность выполнения всех алгоритмов по анализу и добыче данных, представленных во второй главе.

Размещено на http://www.allbest.ru/

A: Bitmap индекс. B: B-tree индекс. C: без индекса

Рис.9. Сравнение времени выполнения запросов в ХД без индекса и с использованием разных типов индексов

Размещено на http://www.allbest.ru/

Рис.10. Архитектура системы поддержки принятия решения

Основные результаты работы

1. Проведен анализ существующих систем хранения и обработки информации, который показал, что в случае анализа данных с целью принятия решения и прогнозирования на основе больших объемов данных лучше воспользоваться технологией ХД на основе многомерных данных. Экспериментально показано, что при использовании нереляционных моделей время выполнения запросов значительно уменьшается.

2. С целью интеллектуального анализа данных для корпоративных информационных систем предложено использование технологии «Data mining» с применением методов классификации, кластеризации, поиска ассоциативных правил и регрессионного анализа.

3. Для решения задачи прогнозирования разработана трехслойная нейронная сеть и проведен эксперимент по прогнозированию валютного рынка. Показана эффективность применения нейронной сети.

4. Дано формализованное описание многомерной модели данных и математическое представление гиперкуба данных. Разработаны методы повышения производительности ХД с использованием материализованного представления, индексирования данных и разделения таблиц, а также применение параллельности выборки.

5. Разработана система анализа данных и прогнозирования и поддержки решений в сфере торговли, в среде СУБД Oracle и программы «developer2000», на основе трехуровневого хранилища данных с использованием многомерных моделей данных. Коды составлены на языке запросов SQL и языке программирования PL/SQL.

Список публикаций по теме диссертации

Статьи по теме диссертации, опубликованные в журналах, из перечня ВАК.

1. Рахал Я. , Ризаев И. С. Повышение эффективности обработки данных в СУБД / Вестник КГТУ им. А.Н. Туполева. Казань, 2008, №3. С. 98 -101.

2. Рахал Я. Итеративный метод кластерного анализа / Вестник КГТУ им. А.Н. Туполева. Казань, 2009, №4. С. 88-90.

Статьи в сборниках и материалах научно-технических конференций.

3. Рахал Я., Ризаев И.С. Группирование информации в хранилищах данных. Расширение функциональных возможностей баз данных // Инфокоммуникационные технологии глобального информационного общества. Сб. трудов 6-й ежегодной международной научно-практической конференции. Казань: ООО «Центр Оперативной печати», 2008. С. 137-143.

4. Ризаев И.С., Сапаркин П.В. Рахал Я. Инструментальные средства хранения и обработки пространственных данных // Международный журнал «Образовательные технологии и общество», 2009. Т.12. №1. 10 с.

5. Рахал Я., Ризаев И.С. Классификация объектов на основе таблицы решений // Высокие технологии, фундаментальные исследования, образование: Сб. трудов 7-й международной конференции «Исследование, разработка и применение высоких технологий в промышленности». Санкт-Петербург: Изд-во Политехн. ун-та, 2009, С. 140-142.

6. Рахал Я., Ризаев И.С. Кластеризация объектов на основе энтропийной оценки // Материалы XVI Международной конференции по вычислительной механике и современным прикладным программным системам. Алушта: Изд-во МАИ-Принт, 2009. С. 600-602.

7. Рахал Я., Ризаев И.С. Технология поиска ассоциативных правил // Инфокоммуникационные технологии глобального информационного общества. Сб. трудов 7-й международной научно-практической конференции. Казань: ООО «Центр Оперативной печати», 2009. С. 103-109.

8. Рахал Я., Ризаев И.С. Применение нейронные сетей для прогнозирования рыночных ситуаций // Образование в техническом вузе в XX1 веке: Международный межвузовский научно-методический сборник, вып.6. Набережные Челны: Изд-во Камск. гос. инж.-экон. акад., 2010. С. 135-137.

Тезисы в сборниках и материалах научно-технических конференциях

9. Ризаев И.С. Рахал Я., Многомерные модели данных // Наука и профессиональная деятельность. Всероссийск. науч.-практич конференция. Нижнекамск: Изд-во КГТУ им. А.Н. Туполева, 2008. С. 237-238.

10. Рахал Я., Ризаев И.С. Группирование информации в хранилищах данных Инфокоммуникационные технологии глобального информационного общества. 6-я международная конференция. Казань: ООО «Центр Оперативной печати», 2008. С. 152-154.

11. Рахал Я., Ризаев И.С. Концепция построения хранилищ данных // XVI Туполевские Чтения. Международная молодежная научная конференция. Казань: Изд-во КГТУ им. А.Н.Туполева, 2008. С.186 -188

12. Рахал Я. Применение таблицы решений для классификации объектов // XVII Туполевские чтения. Международная молодежная научная конференция. Том IV. - Казань: Изд-во КГТУ им. А.Н. Туполева, 2009. С.203

13. Рахал Я. Кластеризация объектов // XVII Туполевские чтения. Международная молодежная научная конференция. Том IV. - Казань: Изд-во КГТУ им. А.Н. Туполева, 2009. С. 206-208.

14. Рахал Я., Ризаев И.С. Применение кластерного анализа в сфере торговли Наука: Современное состояние и перспективы развития : Материалы всероссийской научно-практической конференции. Нижнекамск. Изд-во КГТУ им. А.Н. Туполева, 2009. С.173-174.

15. Ризаев И.С. Рахал Я., Повышение производительности хранилищ данных // Проблемы перехода к устойчивому развитию монопрофильных городов. Материалы всероссийской научно-практической конференции. Нижнекамск: Изд-во КГТУ им. А.Н. Туполева, 2010. С. 169-171.

Размещено на Allbest.ur

...

Подобные документы

  • Концепции хранилищ данных для анализа и их составляющие: интеграции и согласования данных из различных источников, разделения наборов данных для систем обработки транзакций и поддержки принятия решений. Архитектура баз для хранилищ и витрины данных.

    реферат [1,3 M], добавлен 25.03.2013

  • Обслуживание двух встречных потоков информации. Структура информационных систем. Разработка структуры базы данных. Режимы работы с базами данных. Четыре основных компонента системы поддержки принятия решений. Выбор системы управления баз данных.

    курсовая работа [772,0 K], добавлен 21.04.2016

  • Основные модели представления знаний. Системы поддержки принятия решений. Диаграмма UseCase. Разработка базы данных на основе трех моделей: продукционные правила, семантическая сеть, фреймовая модель. Программная реализация системы принятия решений.

    курсовая работа [715,1 K], добавлен 14.05.2014

  • Классификация систем поддержки принятия решений. Сравнительный анализ методик для оценки рисков розничного кредитования. Структура системы поддержки принятия решений, формирование начальной базы знаний. Проектирование базы данных информационной системы.

    дипломная работа [1,9 M], добавлен 10.07.2017

  • Рассмотрение OLAP-средств: классификация витрин и хранилищ информации, понятие куба данных. Архитектура системы поддержки принятия решений. Программная реализация системы "Abitura". Создание Web-отчета с использованием технологий Reporting Services.

    курсовая работа [2,7 M], добавлен 05.12.2012

  • Анализ существующих решений системы поддержки принятия решений для корпоративной сети. Многоагентная система. Разработка концептуальной модели. Структура базы знаний. Разработка модели многоагентной системы на базе сетей Петри. Методика тестирования.

    дипломная работа [5,1 M], добавлен 19.01.2017

  • Типы административных информационных систем: системы генерации отчетов, системы поддержки принятия решений, системы поддержки принятия стратегических решений. Сортировка и фильтрация списков в Microsoft Excel. Работа с базами данных в Microsoft Access.

    контрольная работа [6,0 M], добавлен 19.11.2009

  • Обзор существующих решений на основе открытых данных. Технологии обработки данных и методы их визуализации. Социальные сети для извлечения данных. Ограничение географической локации. Выбор набора и формат хранения открытых данных, архитектура системы.

    курсовая работа [129,5 K], добавлен 09.06.2017

  • Изучение возможностей среды статистических вычислений R для классификации многомерных неоднородных ассиметричных данных с помощью Expectation-Maximization (EM) алгоритмов. Использование R для анализа модели смеси вероятностных распределений (FMM).

    реферат [1,8 M], добавлен 09.12.2014

  • Рассмотрение понятия и истории возникновения систем поддержки принятия решения. Приспособленность информационных систем к задачам повседневной управленческой деятельности. Понятие термина "интеллектуальный анализ данных". Методика извлечения знаний.

    реферат [79,8 K], добавлен 14.04.2015

  • Концепция систем поддержки принятия решений. Диапазон применения Analytica 2.0. Программное обеспечение количественного моделирования. Графический интерфейс для разработки модели. Основные способы моделирования. Диаграмма влияния и дерево решений.

    контрольная работа [1,1 M], добавлен 08.09.2011

  • Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.

    лекция [15,5 K], добавлен 19.08.2013

  • Интеллектуальный анализ данных как метод поддержки принятия решений, основанный на анализе зависимостей между данными, его роль, цели и условия применения. Сущность основных задач интеллектуального анализа: классификации, регрессии, прогнозирования.

    контрольная работа [25,8 K], добавлен 08.08.2013

  • Теоретические аспекты функционирования Business intelligence - систем в сфере логистики. Анализ условий для разработки системы поддержки принятия решений. Характеристика процесса создания программного продукта, применение аналитической платформы QlikView.

    курсовая работа [2,5 M], добавлен 09.09.2017

  • Информация и ее свойства. Автоматизированные системы обработки инструментальных и лабораторных данных, включающие рабочие места врачей. Интеллектуальные системы поддержки принятия врачебных решений. Телекоммуникационная инфраструктура в медицине.

    реферат [40,4 K], добавлен 12.10.2014

  • Понимание хранилища данных, его ключевые особенности. Основные типы хранилищ данных. Главные неудобства размерного подхода. Обработка информации, аналитическая обработка и добыча данных. Интерактивная аналитическая обработка данных в реальном времени.

    реферат [849,7 K], добавлен 16.12.2016

  • Классификация методов анализа по группам. Сбор и хранение необходимой для принятия решений информации. Подготовка результатов оперативного и интеллектуального анализа для эффективного их восприятия потребителями и принятия на её основе адекватных решений.

    контрольная работа [93,2 K], добавлен 15.02.2010

  • Использование информационных технологий управления, поддержки и принятия решений, экспертных систем и обработки данных. Автоматизация бухгалтерии на примере ООО "Уралконфи": универсальная бухгалтерская программа "1С: Бухгалтерия" и ее основные функции.

    курсовая работа [1,9 M], добавлен 26.03.2012

  • Методы решения проблем, возникающих на стадиях и этапах процесса принятия решений, их реализация в информационных системах поддержки принятия решений (СППР). Назначение СППР, история их эволюции и характеристика. Основные типы СППР, области их применения.

    реферат [389,3 K], добавлен 22.11.2016

  • Разработка алгоритмического и программного обеспечения для решения задачи поддержки принятия решений о выпуске новой продукции. Математическое обеспечение задачи поддержки принятия решений о выпуске новой продукции, основные входные и выходные данные.

    дипломная работа [943,0 K], добавлен 08.03.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.