Модель інформаційного сховища в Інтранет-середовищі

Створення корпоративної бази знань із використанням у якості базового компонента документоорієнтованого інформаційного сховища. Нарощення можливостей доступу користувачів до бази знань із мінімальними витратами. Аналіз застосування файлової системи.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык украинский
Дата добавления 29.01.2019
Размер файла 133,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

В. В. Хаджинов, І. О. Храмова

Размещено на http://www.allbest.ru/

110

Системи збереження

і масового розповсюдження даних

104

УДК 681.3

Інститут проблем реєстрації інформації НАН України

Модель інформаційного сховища в Інтранет-середовищі

B.B. Хаджинов

І.О. Храмова

Управління корпоративними знаннями передбачає ефективне використання наявної інформації та доступу до неї, витяг потрібних знань, створення нових знань та прийняття оптимальних рішень, як результат цих дій.

Для представлення корпоративних знань використовуються предметні області знань (ПОЗ), що складаються з об'єктів знань (ОЗ). Кожна з ПОЗ має свого власника та споживача (споживачів). Об'єктами знань на сучасному етапі розвитку інформаційних технологій виступає також електронна інформація. Предметними областями знань можна вважати корпоративні інформаційні системи, під якими розуміються системи, що забезпечують у тій чи іншій формі зберігання, перетворення та доступ користувачів до інформаційних об'єктів, наданих в електронній формі, та задовольняє потребам колективної діяльності. Джерелом електронної інформації можуть бути:

-- надіслані та отримані повідомлення електронної пошти разом із прикріпленими до них файлами;

-- документи (звіти), що були створені функціонуючими програмними додатками або за їх допомогою власними фахівцями та зовнішніми експертами;

-- перетворені на електронні копії факсимільні та паперові документи, які ще складають значну частину в інформаційному просторі.

Загальною властивістю такої інформації є те, що вона тісно пов'язана з життєдіяльністю корпорації, має попит різних робочих груп та може бути неодноразово використаною.

Електронна складова корпоративної інформаційної бази зараз найчастіше являє собою сукупність фізичних файлів довільного типу, структурованих засобами файлової системи операційного оточення.

Застосування файлової системи виключає можливість перетворення інформаційного об'єкта на ОЗ, що передбачає супроводження інформації додатковими ознаками. Також у цьому випадку некерованим стає процес продукування версій оригінальної інформації, що може привести до фальсифікації ОЗ та дискредитації рішень, які на ньому грунтуються.

Менш поширеним підходом є застосування системи управління документами (СУД), що є складовою деяких функціонально-спрямованих інтегрованих програмних систем, орієнтованих на роботу з документами. Серед таких виділимо системи документообігу [1-3]; системи підтримки колективної роботи [4, 5]; електронні архіви [6, 7]. Усі ці засоби вирішують серед інших задачу збору, зберігання та надання колективного доступу до інформаційних об'єктів, виходячи з абстрактного поняття документа як облікової одиниці даних користувача, що має довільний формат та понятійний зміст і має певну завершеність та самостійність. Надана класифікація програмних систем є значною мірою умовною і скоріше відображає їх переважне функціональне спрямування.

Використання інтегрованих рішень стримується значною вартістю та необхідністю переходу на запропоновану виробником технологію, яка може значно відрізнятися від звичної, що вже набула сталого вигляду.

Пропонується створення програмної системи, призначеної безпосередньо для накопичення та класифікації електронної інформації у вигляді електронних документів як базового компонента корпоративної бази знань. Така система може бути використана як автономний компонент, а також у комплексі з іншими програмними системами, спрямованими на роботу з електронними документами.

У роботі розглядаються структура та приклад реалізації основних компонентів такої системи.

Аналіз підходів до побудови корпоративного інформаційного сховища

Головними завданнями, що вирішуються під час побудови корпоративного сховища знань є наступні.

Реєстрація інформаційного об'єкта як ОЗ із заповненням необхідних супроводжуючих атрибутів.

За звичай ділові процеси використовують різноманітну за форматом інформацію, що має як структурований, так і неструктурований вигляд. При цьому важливо знати, до якої категорії чи предметної області відноситься інформація, із яких джерел вона надійшла і т.ін. Найкраще, коли інформаційний об'єкт при завантаженні до інформаційного сховища супроводжується реєстраційною карткою, атрибути якої вміщують необхідну інформацію.

Забезпечення збереження ОЗ.

Реєстраційна картка здебільшого зберігається у БД. Контекст інформаційного об'єкта може зберігатися у файловій системі або у БД. При цьому перевага, на наш, погляд належить саме файловій системі. Однак у цьому випадку існує небезпека втрати синхронізації внаслідок видалення або переміщення файлу. Існує позитивна практика організації кількарівневого сховища, де найменше вживані та некритичні для ділових процесів інформаційні об'єкти витісняються з БД до файлової системи. При цьому можливе використання як автоматичного, так і налаштованого користувачем режиму переносу ОЗ з одного на інший рівень зберігання.

Організація спільної роботи з ОЗ.

Сюди відноситься встановлення режиму «тільки для читання» для загального доступу за умовчуванням, функції блокування одночасного редагування атрибутів ОЗ кількома уповноваженими користувачами. На відміну від систем управління документами з реєстрацією ОЗ набуває чинності факту, який не може мати версій. Тому інша версія інформаційного об'єкта або заміщує існуючу, або розглядається як інший ОЗ (факт).

Підтримка операцій резервування, відновлення, копіювання, видалення ОЗ.

Підтримка індексування для здійснення пошуку потрібної інформації.

Використовуються повнотекстова та атрибутивна індексації. Здебільшого для сучасних ділових процесів достатньою й ефективною є індексація за атрибутами ОЗ. Особливо, якщо є можливість занурення в атрибутивну систему результатів семантичного аналізу змісту ОЗ у вигляді сукупності ключових слів і виразів та рефератів.

Наявність механізму визначення інтенсивності звернень до (використання) ОЗ.

На відміну від сховищ даних, інформаційні сховища, орієнтовані на зберігання знань, поновлюються та ревізуються в залежності від запитів користувачів.

Контроль повноважень доступу до ОЗ під час здійснення операцій перегляду, завантаження, редагування, копіювання та знищення ОЗ.

На сьогодні можна виділити декілька підходів до побудови корпоративного інформаційного сховища.

Використання файлової системи операційного оточення.

Переваги -- використання стандартних засобів із складу операційного оточення, зрозумілі звичні технології ведення документальних баз, наявність великої кількості готових компонентів (бібліотек) підтримки файлових операцій, найдешевше рішення.

Недоліки -- вузькі можливості супроводження документів класифікаційними метаданими, що надали б інформацію про час створення, джерело виникнення та сукупність понять, яких торкається документ. Неможливість підтримки складних операцій з інформаційним сховищем на зразок трансакцій. Найнижчий рівень підтримки цілісності інформаційних ресурсів. корпоративний документоорієнтований інформаційний файловий

Використання документальних баз даних (на зразок Lotus Notus).

Переваги -- надширокі функціональні можливості (щоправда, більшість із яких на сучасному рівні діловодства в нашій країні ніколи не використовується), повнотекстова індексація і, завдяки цьому, швидкий пошук.

Недоліки -- необхідність роботи у середовищі документальних баз під час створення додатків, що використовують документи, надто вузькі можливості або недоступність специфікацій API інтерфейсу, а також значне транспортне запізнення під час оперативного доступу до документа, особливо якщо розміри сховища документів стають значними. Часто повнотекстова індексація, що потребує чималих ресурсів, формує надмірну кількість пошукових контекстів, яка значно перевищує понятійний словник, що задовольнив би бізнес потребам користувачів.

Створення клієнт-серверних додатків разом із промисловими СУБД, частіше реляційними, для зберігання взаємовідносин між інформаційними сутностями документів і, власне, самих документів. При цьому сьогодні використовуються наступні технології реалізації:

1) розробка клієнт-серверного додатку у одному з мовних середовищ 4-ї генерації (VB, Java, VFoxPro, Delphi, PowerBuilder та ін.).

Переваги -- підвищення швидкості реалізації за рахунок застосування готових компонентів для найбільш поширених функцій програмних додатків.

Недоліки -- необхідність програмування як клієнтської, так і серверної частин системи. В тому разі, якщо клієнтів достатньо багато, з'являються певні незручності з інсталяцією та подальшим супроводом програмного забезпечення клієнтської частини;

2) створення Java-аплетів.

Цей варіант може бути взятий до уваги, якщо виключена необхідність збереження інформації на боці клієнта, що пов'язане із забороною системи безпеки аплетів відносно переносу документів на клієнтську станцію;

3) використання технології активних серверних сторінок (на зразок ASP) для інтерфейсу з клієнтом, транспорту інформації із сервера, формування копії документа на боці будь-якого клієнта.

Останній підхід, на наш погляд, є найбільш перспективним для застосування.

Структура моделі інформаційного сховища

Загальна архітектура корпоративного інформаційного сховища з оглядом на вищезгаданий підхід до реалізації представлена на рис. 1.

При цьому, звичайно, деякі з елементів структури можуть бути об'єднані (наприклад, сховище реєстраційних даних та сховище файлів документів) або відсутні (ввід документів із паперових носіїв або архів документів 2 рівня на Raid-масивах).

Стисло принципи функціонування такої системи можуть бути описані наступним чином.

Завантаження первинних інформаційних ресурсів до корпоративного архіву відбувається у формі електронного документа, який складається з одного або декількох первинних файлів, що інтерпретуються як окремий факт та супроводжується метаданими, які дозволяють віднести цей факт до якогось із фреймів корпоративної бази знань.

Рис. 1

Сукупність фреймів та їх структура відображається структурою рубрикатора архіву.

Встановлення взаємних зв'язків між фактами відбувається за допомогою знаходження спільних понять із сукупності понять, властивих для контексту кожного факту.

Система понять будується як словник ключових слів та виразів

Концептуально модель інформаційного сховища, що підтримує наведену схе-му функціонування, в загальному вигляді описується схемою, що показана на рис. 2.

Нижче наведене призначення сутностей концептуальної схеми.

Сутність

Призначення

Рубрики

Перелік та взаємозв'язок рубрик

Документи

Реєстраційні картки документів

Джерела документів

Джерела надходження документів

Файли

Характеристики файлів, що включені до електронних документів

Шаблони

Шаблони реквізитів документів за умовчуванням для завантаження регламентних документів

Ключові слова

Колекція ключових слів та виразів

Контекст файлів

Вміщує зміст файлів (або посилання на фізичний файл) первинних електронних документів

Рис. 2

Базовий склад режимів функціонування додатка,

що реалізує модель інформаційного сховища

Система складається з таких частин:

реляційної СУБД та схеми БД, що забезпечує технологію завантаження та роботи з об'єктами корпоративного електронного архіву;

клієнтського додатка «Робоче місце референта (реєстратора) документів», побудованого як «товстий» клієнт;

серверних компонентів «Інтерфейс користувача», які підтримують функціонування «тонкого» клієнта на станціях користувачів, що підключені до мережі Intranet, за допомогою стандартних програм-оглядячів на зразок Microsoft Internet Explorer. Згадані компоненти забезпечують навігацію у системі фреймів, пошук та доступ користувачів до документів корпоративного архіву з метою отримання контексту електронного документа для перегляду чи створення копії.

«Робоче місце референта (реєстратора) документів» надає можливість виконання наступних дій:

-- ведення рубрикатора та довідників;

-- реєстрації та завантаження електронного документа до БД;

-- редагування метаданих електронного документа;

-- застосування шаблонів;

-- перегляд файлу перед завантаженням;

-- вивантаження електронних документів з БД до архіву 2 рівня (у файлову систему) за запитом, по закінченні терміну зберігання, або за певним правилом, що базується на показниках релевантності документа.

Серверні сторінки додатку «Робоче місце користувача» забезпечують перегляд структури архіву та вмісту рубрик, які можуть бути відфільтровані за рубриками та (або) критеріями часу реєстрації документів. Також надаються можливості:

-- перегляду надходжень до архіву за останню добу;

-- пошуку за рубрикатором або назвою документа;

-- розширеного пошуку за критеріями часу та ключовими словами;

-- отримання документів з електронного архіву для перегляду.

Висновки

Вагомі переваги викладеного підходу до реалізації моделі інформаційного сховища можна викласти наступним чином.

Реалізація функцій роботи з документами у середовищах Інтранет та реляційної СУБД надає системі властивостей масштабування та збереження інформаційної цілісності.

Серверний додаток, побудований, наприклад, за технологією ASP, набуває повноцінних багатопотокових властивостей та має високу гнучкість, що дозволяє легко пристосовуватися до вимог користувача, які змінюються.

Заміна клієнтського додатку стандартним броузером полегшує супровід та використання системи.

Література

1. Гленн У., Инглиш Б. Microsoft Exchange 2000 Server. Справочник администратора // Эком. -- 2001. -- 720 с.

2. Линд Д., Керн С. Lotus Notes и Domino R5 // Энциклопедия пользователя. -- К.: Диасофт. -- 2000. -- 656 с.

3. Баласанян В. Концепция системы автоматизации отечественного документооборота // Открытые системы. -- 1997. -- № 1.

4. Жучков K. Microsoft Content Management Server и SharePoint Portal Server в корпоративных Web-решениях. -- М.: «BYTE/Россия». -- 2002. -- № 6.

Анотація

Розглянуто підхід до створення корпоративної бази знань із використанням у якості базового компонента документоорієнтованого інформаційного сховища. Визначено функціональні вимоги, проаналізовано існуючі підходи до створення подібних інформаційних систем та технології, які для цього використовуються. Запропоновано використання змішаної технології, що дозволяє нарощувати можливості доступу користувачів до бази знань із мінімальними витратами, з одного боку, та вжити керовані процеси наповнення інформаційного сховища й класифікації інформаційного вмісту з іншого. Наведено структуру основних компонентів подібної системи, яку вже реалізовано.

Ключові слова: корпоративна база знань, електронний документ, інформаційне сховище, інформаційна технологія.

Размещено на Allbest.ru

...

Подобные документы

  • Характеристика проблемних моментів автоматизації процесу формування питань у білеті для визначення рівня знань студента. Розробка бази вимог щодо організації перевірки якості знань і програмного забезпечення для організації та управління даними бази.

    курсовая работа [2,6 M], добавлен 06.12.2013

  • Поняття експертної системи, приклади сфер її використання. Класифікація та задачі експертних систем. Означення продукційної експертної системи, приклад її дії та опис програми. Побудова бази знань із чіткою логікою, що вирішує завдання класифікації.

    лабораторная работа [712,5 K], добавлен 19.03.2011

  • Опис програми "Мала експертна система": класифікація, основні задачі; використання байєсівської системи логічного виведення. Опис програми "Редактор баз знань", її застосування. Створення власної БД з чіткою логікою та двома можливими результатами.

    лабораторная работа [491,9 K], добавлен 20.03.2011

  • Вплив інформаційних потреб користувачів на організацію інформаційного обслуговування. Бібліотечно-інформаційний сервіс: сучасний стан, можливості вдосконалення. Ресурси Інтернет і трансформація системи інформаційного обслуговування у Сарненській ЦСПШБ.

    дипломная работа [57,0 K], добавлен 21.12.2010

  • Сутність інформаційного обслуговування користувачів. Створення веб-сайту та віртуальної виставки інформаційної установи, за допомогою яких відбувається обслуговування в мережі Інтернет. Порівняльний аналіз віртуальних довідкових служб двох бібліотек.

    дипломная работа [73,6 K], добавлен 23.11.2011

  • Схема взаємодії учасників платіжної системи з використанням пластикових карток. Вхідні та вихідні повідомлення для проектування бази даних для автоматизації аналізу користувачів пластикових карток. Проектування та реалізація бази даних у MS Access.

    курсовая работа [3,0 M], добавлен 27.12.2013

  • Поняття та переваги реляційної бази, автоматизація аналізу даних. Опис основних компонентів сховища даних AS/400. Процес перетворення оперативних даних в інформаційні. Багатовимірні бази даних (MDD). Опис даних і створення файлів в інтеграційних базах.

    реферат [36,8 K], добавлен 14.01.2012

  • Проектування та реалізація бази даних на фізичному рівні. Формування сутності з їх атрибутами. Вибір засобів розробки даного програмного забезпечення. Створення інтерфейсу для роботи з базою даних. Інструкція користувача, головне функціональне вікно.

    курсовая работа [1,7 M], добавлен 26.09.2013

  • Розгляд онтології як способу представлення знань; використання технологій Інтернет. Створення сховища даних Працевлаштування, в якому буде міститись інформація про роботодавців, організації, вакансії, безробітних. Розробка модулів для надання інформації.

    курсовая работа [1,7 M], добавлен 12.05.2015

  • Класифікація експертних систем. Представлення знань, переваги та слабкі місця. База знань як елемент експертної системи. Сфера застосувань та перспективи розвитку. Створення експертної системи для оцінки ступеня підготовленості студента до іспиту.

    курсовая работа [1,4 M], добавлен 04.02.2014

  • Основні відомості про реляційні бази даних, система управління ними. Основні директиви для роботи в середовищі MySQ. Визначення та опис предметної області. Створення таблиць та запитів бази даних автоматизованої бази даних реєстратури в поліклініці.

    курсовая работа [2,9 M], добавлен 06.11.2011

  • Зміст та завдання інформаційного обслуговування користувачів на сучасному етапі функціонування інформаційних установ. Характеристика основних видів інформаційного обслуговування користувачів, формування та методи вивчення їх інформаційних потреб.

    дипломная работа [121,2 K], добавлен 20.12.2010

  • Мета, цілі та задачі створення бази даних, головні вимоги до її можливостей та використовуваного інформаційного забезпечення. Логічна та функціональна структура. Побудова концептуальної моделі проходження практики студентами, фізичне проектування.

    курсовая работа [83,9 K], добавлен 13.01.2017

  • Роль інформаційних систем і комп’ютерних технологій в удосконаленні управління. Особливості вхідної, вихідної та довідкової інформації. Основи організації машинної інформаційної бази. Інтелектуальні інформаційні системи в економіці. Поняття бази знань.

    курс лекций [1,9 M], добавлен 16.04.2014

  • Систематизація знань як основна функція бази даних. Логічне та фізичне проектування бази даних. Створення таблиць у базі даних, визначення основних зв'язків. Інструментальні засоби проектування та створення програмного забезпечення для обробки даних.

    курсовая работа [1,4 M], добавлен 29.04.2010

  • Набори структур даних, використовуваних для управління файлами. Права доступу до файлу. Монітор файлової системи Process Monitor. Управління аудитом в ОС Windows та в ОС Linux. Доступ до служби каталогів. Практичне застосування Process Monitor.

    курсовая работа [695,9 K], добавлен 09.01.2014

  • Опис предметної області та середовища розробки бази даних. Модель реальної системи - ієрархія діаграм DFD. Складання таблиці списку подій. Переробка ERD в реляційне відношення клієнтів, постачальників та автомобілів. Створення ключових полів таблиць БД.

    курсовая работа [606,4 K], добавлен 04.02.2013

  • Переваги електронної комерції. Історія створення та мова WEB-сценаріїв PHP. Розробка системи доступу до бази даних магазину за допомогою WEB-каталогу, який надає інформацію про товари в зручній для клієнта формі, використовуючи нові Internet-технології.

    курсовая работа [78,2 K], добавлен 28.12.2013

  • Створення інформаційних таблиць бази даних. Створення екранних форм як засобу організації інтерфейсу користувача. Створення запитів для вибору, сортування і обчислення з використанням даних однієї таблиці. Оформлення звітів за допомогою команд MS Access.

    лабораторная работа [397,7 K], добавлен 09.09.2010

  • Коротка характеристика MSSqlServer 2008, принципи створення та вимоги до бази даних "Автоматизація обліку автомобілів МРЕВ" в середовищі, що вивчається. Формування та зміст відповідних таблиць, установка зв’язків між ними. Створення та оцінка запитів.

    контрольная работа [1,3 M], добавлен 13.05.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.