Методи і моделі оцінки та підвищення ефективності проблемно-орієнтованого інтерфейсу користувача інформаційно-пошукової системи

Особливості застосування та можливості вдосконалення загальної технології GOMS для оцінки продуктивності інтерфейсу користувача у задачах пошуку за ключовим словом. Розробка технології реалізації квазидовільних структурованих запитів до баз даних.

Рубрика Программирование, компьютеры и кибернетика
Вид автореферат
Язык украинский
Дата добавления 30.07.2015
Размер файла 218,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Національна академія наук України

Інститут проблем математичних машин і систем

УДК 004.5; 004.657

Автореферат

дисертації на здобуття наукового ступеня кандидата технічних наук

Методи і моделі оцінки та підвищення ефективності проблемно-орієнтованого інтерфейсу користувача інформаційно-пошукової системи

05.13.06 - Інформаційні технології

Оксанич Ірина Миколаївна

Київ 2011

Загальна характеристика роботи

Актуальність теми. У теперішній час значна, якщо не переважна, частина комп'ютерної індустрії та проблемних областей застосування інформаційних технологій орієнтована на створення та ефективне використання людино-машинних систем, орієнтованих на аналіз (інтелектуальні інформаційно-аналітичні системи, проблемно-орієнтовані системи підтримки прийняття рішень, ситуаційні центри, глобальні інформаційні системи). Серед розмаїття задач проектування людино-машинних систем важливу роль відіграють задачі побудови ефективних інтерфейсів користувача (ІК). «Користувач не замислюється над тим, як побудований комп'ютер та який використовується процесор або мова програмування. Для користувачів важливі зручності роботи і результати. Але оскільки все, що бачать користувачі на екрані - це інтерфейс, то, з їхньої точки зору, інтерфейс і є кінцевим продуктом» (Джеф Раскін).

Невід'ємною складовою систем, орієнтованих на аналіз, є інформаційні ресурси і системи, що забезпечують доступ до цих ресурсів (в широкому тлумаченні - інформаційно-пошукові системи (ІПС)). Наразі для ІПС існує певна диспропорція між «людською» швидкістю формулювання запиту на пошук і комп'ютерною швидкістю реалізації запиту. Так, наприклад, у глобальних ІПС GOOGLE, YANDEX, RAMBLER та ін. пошук та представлення користувачеві інформаційних ресурсів, пов'язаних із заданим ключовим словом, потребує менше секунди, а увід та ідентифікація ключового слова - до десяти і більше секунд. Ще більша диспропорція можлива у випадку реалізації структурованих запитів до баз даних (БД).

Тому задача оцінки та підвищення ефективності ІК ІПС у напрямі зниження трудомісткості (підвищення продуктивності) є актуальною.

Зв'язок роботи з науковими програмами, планами, темами. Робота над дисертацією виконувалася у відділі «Інтелектуальні інформаційно-аналітичні системи» Інституту проблем математичних машин і систем Національної академії наук України в рамках держбюджетних фундаментальних тем НАНУ і прикладних науково-дослідних робіт:

1. «Дослідження та розробка інтелектуалізованих технологій для інформаційно-аналітичних систем типу «Ситуаційні центри» («СИТЦЕНТР»)», № 0104U000646, 2007 р.

2. «Методи та моделі створення та інтеграції новітніх інформаційних технологій в системах підтримки прийняття рішень різного призначення («ІНТЕГРАЦІЯ»)», № 0107U000483, 2008-2011 рр.

3. Договір з виконання послуг з встановлення спеціальних програмних засобів для формування, доступу та ведення геобази лісовпорядкування як складової частини

4. «Автоматизованої цифрової технології виготовлення і тиражування планово-картографічних матеріалів лісовпорядкування», №8486, 2009 - 2010 рр.

Мета і завдання дослідження. Мета дисертаційної роботи полягає в дослідженні шляхів і конкретних методів вирішення задачі підвищення ефективності інтерфейсу користувача інформаційно-пошукових систем у напрямі зниження трудомісткості формування користувачем запитів до інформаційних ресурсів.

З цією метою в роботі обґрунтовуються і вирішуються такі науково-практичні завдання:

1. Аналіз сучасного стану в області проектування ІК ІПС, визначення і обґрунтування конкретних напрямів і задач досліджень.

2. Дослідження особливостей застосування та можливостей вдосконалення загальної технології GOMS для оцінки продуктивності (трудомісткості) ІК у задачах пошуку за ключовим словом (зразком) (ІККС).

3. Побудова і дослідження моделей механізмів і процесів упереджуючої підказки в ІККС, аналіз основних характеристик і залежностей, що визначають трудомісткість ІККС та напрямів її зниження.

4. Побудова моделей і розробка технології реалізації квазидовільних структурованих запитів (КДЗ) до БД з боку некваліфікованого користувача, а також відповідного інтерфейсу.

5. Розробка програмних засобів реалізації запропонованих методів, моделей і технологій.

Об'єктом дослідження є інтерфейс користувача інформаційно-пошукових систем.

Предметом дослідження є методи і моделі оцінки та підвищення ефективності інтерфейсу користувача в напрямі зниження трудомісткості формування неструктурованих (зокрема, за ключовими словами) та структурованих (за описом змісту і структури) запитів до інформаційних ресурсів СППР.

Методи дослідження. Проведені дослідження базуються на:

1) загальній методології наукового пізнання (аналіз проблемної області, обґрунтування і постановка задач досліджень, декомпозиція задач і моделей, побудова моделей і вирішення задач на основі математичної індукції та дедукції, узагальнення результатів);

2) загальних і прикладних методах теорії ймовірностей та математичної статистики, алгебри логіки, методах математичного та імітаційного моделювання, загальній методології оцінки продуктивності ІК (побудова і дослідження моделей);

3) методах теорії та практики системного програмування (програмна реалізація моделей).

Наукова новизна одержаних результатів.

1. Розвинуто і вдосконалено технологію GOMS-KLM у напрямі спеціалізації моделей оцінок ІК для проблемної області задач вводу та візуальної ідентифікації даних на основі запропонованої та експериментально дослідженої моделі декомпозиції ментальних операторів.

2. Вперше запропоновано методи, побудовано та досліджено математичні логіко-ймовірнісні моделі варіантів «покрокової» та «прицільної» підказки в ІККС, встановлено залежності між варіантами, суттєвими параметрами та характеристиками трудомісткості ІККС з урахуванням, у тому числі, і функції розподілу ймовірностей звертання (ІЗ) до слів базового словника (БС).

3. Вперше побудовано та експериментально досліджено імітаційні моделі ІККС, що, з одного боку, підтверджують адекватність математичних моделей в рамках базових припущень щодо рівномірно-випадкової структури розподілу слів БС, а, з іншого, - можуть слугувати як інструмент: а) оцінки характеристик ІККС для даного БС з конкретним дискретним розподілом ІЗ; б) розробки програмного забезпечення ІККС.

4. Вдосконалено ІК системи реалізації структурованих запитів до БД у напрямі створення можливості формування КДЗ в природно-мовному середовищі, вперше запропоновано інформаційну модель та технологію реалізації КДЗ за допомогою стандартних CASE - засобів, а також створено відповідний ІК.

Практичне значення одержаних результатів. Досліджені методи і створені моделі реалізовано у вигляді таких програмних продуктів:

1. Пакет програм розрахунку прогнозних характеристик ІККС на основі заданих узагальнених параметрів БС і функцій розподілу ІЗ (ПП «ММП»).

2. Пакет програм імітаційного моделювання і експериментального визначення прогнозних характеристик ІККС для конкретного БС (ПП «ІМП»).

3. Пакет програм реалізації запропонованої технології побудови КДЗ (ПП «ЗАПИТ»).

Пакети програм впроваджено у складі проектно-інструментального та функціонального програмного забезпечення на двох підприємствах.

У цілому практична значимість одержаних результатів визначається можливостями використання ПП і наведених практичних рекомендацій для вдосконалення ІК ІПС у напрямі зниження трудомісткості інтерфейсу і для розробки програмного забезпечення ІК.

Особистий внесок здобувача. У працях, опублікованих у співавторстві, здобувачу належать: моделі і технології реалізації запитів до БД [1, 9], ергономічна модель складових інтерфейсу [4], модель декомпозиції ментальних операторів GOMS-KLM та результати її досліджень [6], модель розрахунку трудомісткості ІК [7], алгоритми та імітаційні моделі обробки словника при вводі тексту та ідентифікації помилок користувача [13], механізми підказки в ІК та оцінки їх трудомісткості [12].

Апробація результатів дисертації. Результати дисертаційної роботи пройшли апробацію на таких науково-технічних конференціях: VIII міжнародній конференції «Интеллектуальный анализ информации ИАИ-2008» (м. Київ, 2008 р.), IX міжнародній конференції ім. Т.А.Таран «Интеллектуальный анализ информации ИАИ-2009» (м. Київ, 2009 р.), «System Analysis and Information Technologies»: 12th International Conference, SAIT 2010 (Kyiv, 2010), 2-й, 3-й, 4-й науково-практичних конференціях з міжнародною участю «Системи підтримки прийняття рішень.

Теорія і практика» (м. Київ, 2008 - 2010 рр.), П'ятій науково-практичній конференції з міжнародною участю «Математичне та імітаційне моделювання систем. МОДС'2010» (м. Київ, 2010 р.).

Публікації. За темою дисертації опубліковано 13 наукових праць, з них 6 статей у фахових спеціалізованих виданнях і збірниках наукових праць, згідно з переліком ВАК України (з них 2 одноосібні), 7 тез виступів на наукових конференціях (з них 1 одноосібна).

Структура дисертації. Робота складається із вступу, чотирьох розділів, висновків, списку використаних джерел з 97 найменувань та п'яти додатків. Обсяг дисертації становить 155 сторінок основного тексту, ілюстрованих 55 рисунками та 41 таблицею.

Основний зміст роботи

У вступі обґрунтовано актуальність теми дослідження, сформульовано мету та завдання дослідження, визначено наукову новизну і практичне значення одержаних результатів. Наведено інформацію про особистий внесок здобувача у результати досліджень, виконаних і опублікованих разом із співавторами.

У першому розділі розглянуто загальні вимоги до ІК і напрями підвищення його ефективності, визначено зміст і роль таких шляхів, як урахування проблемної орієнтації типових інтерфейсів, їх інтелектуалізації, створення та/або використання адекватного інструментарію оцінки характеристик. Розглянуто використання ергономічних моделей для комплексної оцінки віртуальної інтелектуальності ІК та запропоновано конкретну модель розрахунку визначених складових. Розглянуто додаток загальних вимог до ІПС з неструктурованими (за ключовим словом) та структурованими (в термінах інформаційної моделі відповідної БД) запитами. Запропоновано алгоритм обробки словника припустимих слів при вводі тексту і автоматичної ідентифікації помилок користувача. Введено поняття «квазидовільних» структурованих запитів до БД та сформовано вимоги до технології їх реалізації. Запропоновано підхід до вдосконалення відомої методології GOMS-KLM у напрямі спеціалізації моделей для конкретного класу задач. Обґрунтовано і сформульовано конкретні задачі подальших досліджень.

У другому розділі розглядається та досліджується модель декомпозиції ментальних операторів GOMS-KLM.

Схему декомпозиції ментальних операторів для класу задач, що розглядається, наведено на рис. 1.

Размещено на http://www.allbest.ru/

Рис. 1. Схема декомпозиції ментальних операторів

- трудомісткість (продуктивність) читання тексту з первинного носія і його осмислення (запам'ятовування) - с/симв;

- трудомісткість пошуку символів на клавіатурі і переміщення руки в позицію «над символом» - с/симв;

- трудомісткість візуального аналізу введених символів на екрані і прийняття рішення про подальші дії (зокрема, про наявність чи відсутність помилки) - с/симв;

- трудомісткість виправлення помилкового символу оn-line - с/симв;

- трудомісткість візуального аналізу та порівняння слова, що вводиться, з запропонованим на екрані словом - с/симв;

- «чиста» трудомісткість натискання клавіші рукою, розташованою над символом - с/симв.

За своєю суттю оператори - це чисто ментальні оператори, - оператор руху, і - композиція ментальних дій і рухів.

Для отримання експериментальних оцінок значень , важливими є такі фактори: характер інформації, що вводиться; кваліфікація користувача.

З точки зору першого фактора, що враховує вплив вихідного знання користувача про словник припустимих символів і слів, виділено 3 типи інформації, що вводиться: 1) цифрові і алфавітно-цифрові коди; 2) мнемотекст (текст на природній мові, рідній мові користувача); 3) кодотекст (текст на природній мові, незнайомій користувачеві).

З точки зору другого чинника, взято до уваги, що типовий користувач інформаційно-пошукових систем не має достатнього досвіду і спеціальної підготовки в сенсі машинопису, так що його кваліфікація не є високою.

В процесі експериментів визначалися значення часу (с/симв.):

; ; ; ;

(через позначена статистична ймовірність появи помилкового символу). Виміряні та розраховані значення , наведені в табл. 1.

Таблиця 1. Виміряні і розраховані значення

Мова

Код

1,20

0,73

0,98

0,53

0,0435

0,47

0,38

0,214

1,06

0,0435

0,15

Кодотекст

1,13

0,69

0,91

0,50

0,045

0,44

0,35

0,214

1,00

0,045

0,15

Мнемотекст

0,60

0,44

0,54

0,40

0,045

0,16

0,25

0,055

0,80

0,045

0,15

Результати відповідних розрахунків підтверджують прийнятність відносних значень похибок для даної групи користувачів. Тим не менш, для уточнення одержаних значень і можливого розширення круга користувачів в контексті кількісних оцінок рівня їх кваліфікації потрібно подальший розвиток експериментальної бази. Щодо цього запропонована та обґрунтована технологія розподілених вимірювань та інтеграції результатів, що спрощує процеси збору інформації та розрахунків.

Третій розділ присвячений формалізації процесів формування підказки в IK системи пошуку за ключовим словом IККС, створенню та дослідженню моделей, що встановлюють залежність між суттєвими параметрами IККС, можливими варіантами механізмів підказки і результатною трудомісткістю інтерфейсу.

Загальна схема ІККС включає базовий словник (БС), що містить слова-еталони у алфавіті , поточний довідник (джерело підказки) та рядок зразка.

Користувач послідовно вводить символи зразка (починаючи з першого, старшого). На кожному кроці з базового словника БС у поточний довідник заносяться слова з однаковими значеннями символів , , . Назвемо множину слів з однаковими значеннями символів - множиною потужністю . Відносно слів - множин справедливі такі очевидні і важливі твердження:

Твердження 1. - множина є підмножиною - множини, тобто .

Твердження 2. Слово-еталон , що належить - множині, належить і -множині, тобто, якщо , то .

В основі побудови кінцевих моделей оцінки трудомісткості ІККС лежать субмоделі організації обробки БС і формування підказки, які визначають суттєві характеристики інтерфейсу (зокрема, лінійна та логіко-ймовірнісна моделі).

Лінійна модель БС

Деякий реєстр містить комірок одиничної довжини з номерами . Частина комірок у кількості, позначеній через , є «активною». Для них поєднання значень відповідає реально існуючим словам словника.

Прийняті такі базові припущення:

1. Розподіл активних комірок вздовж регістра є випадковим.

2. Для значень N, q, n виконується .

З прийнятих припущень випливає, що ймовірність r того, що для БС з параметрами N, q, n довільно взята комірка є активною, дорівнює , і значення . Графічна інтерпретація моделі показана на рис. 2.

Размещено на http://www.allbest.ru/

Рис. 2. Лінійна модель розподілу слів БС

Визначимо ймовірність P(g,r,G) того, що з довільно взятих G комірок активними виявилися рівно g. Значення P(g,r,G) можна інтерпретувати як відносну кількість вдалих результатів у наступному абстрактному процесі. У деяку урну «з вузьким отвором» вкидаються кулі. Ймовірність того, що чергова куля потрапляє в отвір урни дорівнює r. Величина g у такому трактуванні дорівнює кількості куль, що потрапили в урну при вкиданні G куль. Оскільки ймовірність чергової кулі потрапити в урну не залежить від результатів попередніх вкидань, наведений процес може бути описаний схемою і співвідношеннями процесу незалежних випробувань Бернуллі.

Відповідно з такою інтерпретацією

. (1)

Покладемо , де відповідає кількості введених символів зразка. Тоді є випадковою кількістю активних комірок у інтервалі довжиною , тобто значення визначає кількість недовизначених слів БС, що мають однакові значення старших символів . Ускладнимо процес вкидання шарів таким чином. В урну послідовно вкидається шарів . Якщо на кроці в урні опинилася задана кількість шарів або , процес завершується. Треба визначити розподіл ймовірностей і середнє значення , яке відповідає завершенню процесу при багатократних випробуваннях. З урахуванням незалежності кроків та (1) для

(2)

Таким чином, (2) визначає середню кількість символів, які треба ввести, щоб одержати .

Логіко-ймовірнісна модель процесу обробки БС

Доповнимо лінійну модель БС такими властивостями:

- виділимо одну з активних комірок як «цільову», що відповідає пошуковому слову БС при завданні зразка;

- припишемо кожній активній комірці значення

,

що має сенс ймовірності того, що при довільному звертанні до БС слово є пошуковим.

Подальші етапи побудови моделі полягають у наступному:

· впорядкуванні активних комірок по зменшенню (умовний перенос їх на позиції, номери яких відповідають номерам у впорядкованому списку);

· апроксимації одержаного впорядкованого розподілу безперервною функцією .

Розглядається модель покрокового процесу вкидання в урну шарів, один з яких є «міченим» (відповідає цільовому пошуковому слову-еталону) і вилучення порції з m найбільш ймовірних шарів, аж поки в черговій порції не знайдеться мічений шар. Визначається розподіл ймовірностей значень , при яких процес буде закінчений, і відповідне середнє значення, що позначене через :

інтерфейс користувач пошуковий система

, (3)

. (4)

Розглядається випадок, коли цільове слово-еталон в БС відсутнє (негативний результат пошуку), і здобуваються відповідні значення і . Для спрощення процесу розрахунків для виводиться наближений вираз, що оперує середніми значеннями .

Моделі оцінки трудомісткості ІККС

При вводі зразка і пошуку відповідного еталону можливі ситуативні результати, що ілюструє рис. 3.

В подальшому приймемо позначення: - середня кількість введених символів зразка і - середня кількість слів, що візуально аналізує користувач при позитивному () та негативному () результатах пошуку відповідно.

Размещено на http://www.allbest.ru/

Рис. 3. Складові трудомісткості інтерфейсів при різних результатах пошуку

де - ймовірність позитивного результату пошуку.

Типовим рішенням щодо підказки є «покрокова» підказка, у якій на кожному кроці користувачеві надається сторінка з m слів-еталонів. Для покрокової підказки з урахуванням результатів розд. 2:

, (5)

, (6)

де - оператори GOMS-KLM.

Значення

визначаються на основі співвідношень (3), (4) для випадків рівномірного та експоненціального розподілу ймовірностей .

У першому випадку

,

у другому

.

Результат відповідних розрахунків для слів російської мови (q=32) та цифрових кодів (q=10) для значень

N=106, 104; n=8, 10; r=10-6, 10-8;

свідчить про те, що трудомісткість ІК з покроковою підказкою відносно велика. Дійсно, в пошукових системах GOOGLE, YANDEX, RAMBLER та ін. пошук і надання користувачу інформаційних ресурсів, пов'язаних із зразком, вимагає менше секунди, а введення та ідентифікація зразка недосвідченим користувачем - до десяти і більше секунд. Щоправда, на одному із кроків введення до ідентифікації зразка користувач може виявити в еталонах запропонованої сторінки щось, що підходить за змістом, і, таким чином, ввести в результаті менше символів. Однак це вимагає додаткових роздумів, більш тривалих, ніж просто порівняння еталона із задуманим зразком. Крім того, подібні роздуми практично неприйнятні при введенні кодів.

Можливість зниження значення базується на тому, що ймовірності , є малими для малих та великими в області значень , близьких до , . Звідси випливає простий, чисто користувальницький, прийом прискорення - введення початкових символів зразка «наосліп» і затримка початку перегляду сторінок підказки.

Ефективною програмною реалізацією цього прийому повинна бути «прицільна підказка», тобто надання користувачу для перегляду лише останньої сторінки, обсяг якої , або, принаймні, інформування користувача про появу цієї сторінки (наприклад, звуковим сигналом).

Ще більш ефективним уявляється рішення, яке полягає в автоматичному звуженні області пошуку до одного пошукового слова.

Для прицільної підказки з точністю до сторінки величини і визначаються аналогічно (5), (6), а для обчислень відповідних значень , використовуються співвідношення (2) при умові: для позитивного та для негативного результатів пошуку. Для прицільної підказки з точністю до слова для обчислень , використовуються співвідношення (2) при умові та для позитивного і негативного результатів пошуку відповідно. Для враховується помилковопозитивний випадок.

Виконані розрахунки підтверджують суттєве скорочення трудомісткості ІККС з прицільною підказкою , , яка для набуває мінімального значення (тобто ).

Імітаційне моделювання процесів обробки БС

Побудовані та розглянуті вище математичні моделі за визначенням дають наближені результати. Основна мета імітаційного моделювання полягає в перевірці меж застосування та уточненні математичних моделей на основі узагальнюючих показників, що не залежать від експериментальних оцінок складових операцій (значень та ін.). Як показники обрано значення , , , .

Побудовано імітаційні моделі процесів обробки БС і формування підказки для розглянутих видів ІККС. Імітаційне моделювання проведено для 8 базових варіантів сполучень параметрів («сигнатур»): ; =8, 12; =32, 10; . Для покрокової підказки додатково враховуються значення

Результати імітаційного моделювання свідчать про те, що відхилення розрахункових і експериментальних даних у середньому тим більше, чим менше і більше .

В цілому, для відносне відхилення залишається в межах 3-4% для значень , , і 5-6% для .

Аналіз результатів розрахунків моделей

Проведений комплекс розрахунків спрямований на виявлення залежностей між видами, параметрами і характеристиками трудомісткості розглянутих ІККС.

Як випливає з результатів розрахунків, значення при інших рівних умовах збільшуються з ростом , зменшуються з ростом та мало залежать від . Як виявляється, значення для заданого не залежать від і, відповідно, від , а лише від .

Параметри БС () не є предметом можливого вибору. Можна виділити два питання, пов'язаних з відповідними рішеннями: 1) вибір виду підказки з урахуванням її переваг та недоліків; 2) вибір об'єму сторінки .

Конкретні відповіді на обидва питання може дати застосування створених моделей (математичних та імітаційних). Загальні ж тенденції щодо другого питання відбивають дані табл.2.

Таблиця 2. Значення , у залежності від m, , ()

Зразок

Вид ІК

ТЕКСТ

0

1

3,14

2,93

3,78

5

2,55

9,87

6,01

10

2,11

15,69

7,90

15

1,96

18,94

9,01

10

1

2,39

1,83

3,04

5

1,88

6,31

4,42

10

1,75

11,9

6,38

15

1,65

14,8

7,38

-

1

3,29

1

3,16

5

2,98

2

3.38

10

2,63

3,25

3,67

15

2,13

4,5

3,89

-

1

3,29

1

2,26

5

3,29

1

2,26

10

3,29

1

2,26

15

3,29

1

2,26

Наведені залежності одержані в результаті відповідного узагальнення моделей (5) та (6) для одержання значень , , .

Розглянуто порівняльні результати застосування до кінцевого етапу розрахунку трудомісткості ІККС моделі декомпозиції ментальних операторів («-модель») та класичної моделі GOMS-KLM («-модель»).

В основу застосування -моделі мають бути покладені значення (стандартні оператори GOMS), , та загальні правила розстановки операторів (щодо яких можливі різні припустимі варіанти). У зв'язку з цим відзначимо, що запропоновані вище і досліджені моделі визначення в рівній мірі потрібні і для -моделі. У цілому, для обох моделей розрахунку і різних сигнатур за інших рівних умов зберігаються такі ключові характеристики: значення ; значення зменшується з ростом ; значення збільшуються зі зростанням N. Таким чином, обидві моделі розрахунку дають подібні відносні результати, однак суттєво різні абсолютні значення. Більш висока точність -моделі обґрунтовується її властивостями і можливостями та підтверджується експериментально шляхом порівняння розрахункових та експериментальних значень часу вводу та візуальної ідентифікації вибіркової групи російськомовних слів некваліфікованим користувачем пошукової системи GOOGLE.

Наводяться практичні рекомендації щодо застосування видів ІККС і моделей оцінки .

У четвертому розділі обґрунтовуються і створюються моделі і технологія реалізації інтерфейсу користувача-аналітика (КА) СППР у системі реалізації структурованих квазидовільних запитів до тематичної бази даних (ТБД) «вітринного» рівня.

Основою технології створення КДЗ є опис семантики ТБД на природній мові (ПМ) користувача, тобто поданні сутностей і атрибутів ТБД в ПМ - термінах предметної області (ПрО). Такий опис може бути зроблений за допомогою стандартних CASE-засобів. Тобто основні принципи запропонованої технології створення системи побудови КДЗ (СПКДЗ) полягають у наступному:

· поданні сутностей та атрибутів ТБД на ПМ в термінах предметної області за допомогою CASE-засобів (наприклад, Sybase PowerDesigner 9);

· визначенні правил знаходження різних атрибутів та формування функцій, які можна застосувати до них, та опису їх на ПМ за допомогою CASE-засобів;

· розробці інтерфейсу, у якому КА пропонуються на вибір знайомі йому терміни предметної області і правила їх знаходження.

Інформаційна модель (I-модель) ПрО, що описує семантику предметної області, представляється у вигляді сукупності реляційної моделі (-модель) даних ПрО, фреймової моделі (-модель) ПрО та моделі бізнес-правил (-модель).

- модель включає «первинні» сутності , атрибути та відношення між сутностями: R-модель = {, , Rel()}.

Непідготовленому КА складно розібратися у -моделі і зрозуміти, як правильно з'єднати таблиці і сконструювати запит. Для нього потрібна більш проста і знайома структура понять ПрО, якій би відповідав граф з мінімальним вершинним покриттям (без дублюючих і кільцевих зв'язків, що призводять до неоднозначності побудови запитів). Функції такої структури виконує фреймова модель ПрО:

F-модель = {Fi ,Slik, Rel},

де - фрейми (розділи ПрО, що складаються з одного або декількох понять ПрО);

- слоти фрейма (терміни розділів ПрО, які можуть приймати певні значення);

Rel - відношення між фреймами.

Фрейми виступають у ролі сутностей, а слоти - у ролі атрибутів, підміняючи собою сутності й атрибути R-моделі. У БД створення вирішується за допомогою віртуальних таблиць - тематичних уявлень (TemaView). Кожне TemaView являє собою один з фреймів F-моделі, а його атрибути - це слоти F-моделі. Вміст TemaView конкретизується СУБД на підставі даних, що знаходяться у таблицях R-моделі.

Розглядаються дві схеми з'єднання ТемаView (ТV) - послідовна та ієрархічна.

У результаті з'єднання всіх TemaView створюється відношення , представлене у диз'юнктивній нормальній формі виконанням операції left outer join відповідно для послідовної (7) та ієрархічної (8) схем.

, (7)

, (8)

де - кількість ТемаView.

Недоліком схеми (7) є той факт, що відсутність даних у будь-якому з TemaView (NULL-значення TVi) призводить до розриву ланцюга і недоступності правої частини, тобто дані з усіх TemaView, що стоять правіше, не будуть вибрані. Тому доцільно використовувати схему (8).

Модель бізнес-правил (B-модель) описує правила, яким підкоряються значення слотів, з'єднуючи кожен слот F-моделі з певним набором правил Bрik, визначеним для слота k та фрейма i: B-модель ={Bрik}.

Відношення, отримане у результаті з'єднання TemaView (8), являє собою вихідне відношення, з яким буде працювати КА, вибираючи атрибути (слоти окремих фреймів) і накладаючи обмеження або застосовуючи функції, задані B-моделлю.

Технологія створення СПКДЗ включає таку послідовність етапів:

1. Аналіз ПрО і побудова фреймової моделі.

2. Визначення головного фрейма (розділу) ПрО і його слотів.

3. Визначення бізнес-правил фреймової моделі.

4. Побудова реляційної моделі БД, що відповідає фреймовій моделі ПрО.

5. Створення тематичних уявлень, що відповідають фреймам ПрО на ПМ.

6. Створення бізнес-правил для атрибутів тематичних уявлень на ПМ.

7. Надання бізнес-правил.

8. Створення нових запитів за допомогою СПКДЗ.

9. Збереження створених запитів у БД.

Пп. 1-6 виконуються адміністратором (розробником) спільно з КА, п. 7 може виконуватися як адміністратором, так і КА, пп. 8-9 виконуються КА за допомогою ПП «ЗАПИТ».

Структура та функції СПКДЗ наведені на рис. 4.

Размещено на http://www.allbest.ru/

Рис. 4. Структура СПКДЗ

Розглядається виконання етапів технології на прикладі конкретної ТБД «Надзвичайні події» та конкретного запиту, наводяться скріншоти інтерфейсів та автоматично згенерованого SQL - коду виконання запиту.

Даються порівняльні оцінки продуктивності (трудомісткості) ІК для запитів різної складності з використанням загальних правил GOMS з урахуванням результатів розд. 2.

У додатку А подано акти впровадження програмного забезпечення.

У додатку Б наведено математичні моделі формування упереджуючої підказки та трудомісткості ІККС.

У додатку В подано приклади інтерфейсу для вводу параметрів БС і текст основних програмних модулів розрахунку параметрів упереджуючої підказки.

У додатку Д наведено приклад інтерфейсу і основні програмні модулі імітаційної моделі розрахунку параметрів упереджуючої підказки.

У додатку Ж наведено приклади вікон ІК СПКДЗ та тексти основних програмних модулів.

Висновки

У дисертаційній роботі обґрунтовано актуальність задач підвищення продуктивності (зниження трудомісткості) ІК інформаційно-пошукових систем, запропоновані методи і моделі їх вирішення у напрямі вдосконалення типових технологічних рішень щодо інтерфейсів систем реалізації неструктурованих (за ключовим словом-зразком) та структурованих (за описом змісту і структури потрібних даних) запитів до інформаційних ресурсів СППР.

У процесі виконання роботи отримано такі основні результати:

1. Проаналізовано сучасний стан проблематики проектування ІК у ІПС СППР з різними видами інформаційних ресурсів і запитів до них, сформульовано критерії і виділено напрями підвищення ефективності ІК при формуванні неструктурованих та структурованих запитів. Розглянуто кількісний підхід до оцінки складових віртуальної інтелектуальності ІК через розрахунок трудомісткості відповідної ергономічної моделі, запропоновано алгоритм обробки словника при вводі тексту та автоматичній ідентифікації помилок користувача.

2. Розглянуто особливості застосування та можливі напрями вдосконалення загальної технології моделі GOMS-KLM як інструменту оцінки продуктивності ІК в області задач вводу та візуальної ідентифікації даних. Обґрунтовано, запропоновано та експериментально досліджено модель декомпозиції ментальних операторів GOMS-KLM на спеціалізовані мікрооператори, що забезпечують більш визначену деталізацію і формалізацію оцінки ментальних складових ІК. Експериментально визначені значення тривалості ментальних мікрооперацій для некваліфікованого користувача.

3. Побудовано і досліджено математичні моделі механізмів і процесів формування «покрокової» та «прицільної» упереджуючої підказки при вводі ключового слова-зразка. Моделі базуються на припущенні щодо випадковості розподілу реально існуючих слів базового словника (БС) серед усіх можливих значень та дозволяють оцінити залежності між параметрами ключових слів (алфавіт, довжина, обсяг БС), функцією розподілу ймовірностей звертання до слів БС, обсягом сторінки підказки, коефіцієнтом результативності підказки, з одного боку, і суттєвими характеристиками процесу підказки з візуальною ідентифікацією зразка та результатною трудомісткістю варіантів ІК - з іншого боку.

4. Побудовано і експериментально досліджено імітаційні моделі процесів вводу зразка, механізмів формування різних видів підказки і ідентифікації заданого слова БС. Імітаційні моделі підтверджують адекватність математичних моделей в рамках базових припущень щодо випадкового розподілу слів БС (з похибкою в межах 4 - 6 % для БС обсягом більше 500 - 1000 слів) і можуть слугувати як інструментом оцінки прогнозних характеристик ІК, що проектується для конкретного словника з конкретним дискретним розподілом ймовірностей звертання, так і інструментом створення програмного забезпечення інтерфейсу.

5. Запропоновано інформаційну модель та технологію побудови структурованих квазидовільних запитів до БД. Технологія орієнтована на некваліфікованого користувача, від якого не вимагається знання мови SQL та структури БД. Технологія базується на поданні сутностей, атрибутів БД і правил їх визначення в природно-мовній формі за допомогою стандартних CASE-засобів (зокрема, Sybase PowerDesigner 9) і створенні інтерфейсу, в якому користувачеві пропонується вибір зрозумілих для нього термінів предметної області та правил їх знаходження.

6. Запропоновані методи і моделі реалізовано у вигляді пакетів програм розрахунку прогнозних характеристик ІК, імітаційного моделювання, системи створення квазидовільних запитів. Пакети програм впроваджено у ВО «Укрдержліспроект» та ТОВ «Комп'ютерна лабораторія» (у складі програмного забезпечення інформаційно-управляючої системи ЗАТ «Оболонь»).

Список опублікованих праць за темою дисертації

1. Кузьменко Г.Є. Інструментальні засоби створення єдиного інформаційного середовища корпоративних систем / Г.Є. Кузьменко, І.М. Оксанич, Ю.Г. Пилипенко // Математичні машини і системи. - 2004. - №4. - С. 126-135.

2. Литвинов В.А. Оценка уровня виртуальной интеллектуальности прикладной программно-технической системы на основе анализа эргономической модели / Валерий Андроникович Литвинов, Ирина Николаевна Оксанич // Математичні машини і системи. - 2008. - №2. - С. 100-105.

3. Литвинов В.А. Применение модели GOMS для оценки характеристик и трудоемкости интерфейса пользователя в задаче поиска по образцу / В.А. Литвинов, С.Я. Майстренко, И.Н. Оксанич // Системи підтримки прийняття рішень. Теорія і практика: зб. доп. наук.-практ. конф. з міжнар. участю. - Київ: ІПММС НАНУ, 2008. - С. 84-87.

4. Литвинов В.А. К использованию эргономической модели интерфейса пользователя для оценки уровня виртуальной интеллектуальности прикладной системы / Валерий Андроникович Литвинов, Ирина Николаевна Оксанич // Восьмая междунар. науч. конф. «Интеллектуальный анализ информации ИАИ-2008»: сб. труд. - Киев, 2008. - С. 296-297.

5. Оксанич И.Н. К вопросу реализации произвольных запросов пользователя к тематической базе данных / И.Н. Оксанич // Системи підтримки прийняття рішень. Теорія і практика: зб. доп. наук.-практ. конф. з міжнар. участю. - Київ: ІПММС НАНУ, 2009. - С. 79-81.

6. Кузьменко Г.Е. Декомпозиция ментальных операторов в моделях GOMS-KLM применительно к интерфейсу пользователя в задачах ввода и контроля данных / Г.Е. Кузьменко, В.А. Литвинов, И.Н. Оксанич // Девятая междунар. науч. конф. им. Т.А. Таран «Интеллектуальный анализ информации ИАИ-2009»: сб. труд. - Киев, 2009. - С. 212-218.

7. Литвинов В.А. Трудоемкость интерфейса пользователя в задаче поиска образца в справочнике и ее оценка на основе модели GOMS / В.А. Литвинов, С.Я. Майстренко, И.Н. Оксанич // Математичні машини і системи. - 2009. - №3. - С. 120-125.

8. Оксанич И.Н. Модель декомпозиции ментальных операторов в проблемно-ориентированном интерфейсе пользователя и ее экспериментальное исследование / И.Н. Оксанич // Математичні машини і системи. - 2010. - №1. - С. 105-112.

9. Литвинов В.А. Технология реализации и интерфейс квазипроизвольных запросов к БД / Валерий Андроникович Литвинов, Ирина Николаевна Оксанич // «System Analysis and Information Technologies»: 12th International Conference, SAIT 2010. Proceedings. - Kyiv, 2010. - P. 453.

10. Некоторые методы ускоренной обработки словаря допустимых слов при автоматической идентификации и исправлении ошибок пользователя / В.А. Литвинов, С.Я. Майстренко, И.Н. Оксанич, В.И. Ходак // Математичні машини і системи. - 2010. - №2. - С. 86-93.

11. Оксанич И.Н. Квазипроизвольные запросы к базам данных и информационная модель их реализации / И.Н. Оксанич // Математичні машини і системи. - 2010. -№3. - С. 45-52.

12. Кузьменко Г.Е. Некоторые характеристики результативности механизмов подсказки в интерфейсе пользователя информационно-поисковой системы / Г.Е. Кузьменко, В.А. Литвинов, И.Н. Оксанич // Системи підтримки прийняття рішень. Теорія і практика: зб. доп. наук.-практ. конф. з міжнар. участю. - Київ: ІПММС НАНУ, 2010. - С. 53-54.

13. Литвинов В.А. Имитационная модель обработки словаря допустимых слов в задаче автоматической идентификации ошибок пользователя / В.А. Литвинов, С.Я. Майстренко, И.Н. Оксанич // П'ята наук.-практ. конф. з міжнар. участю «Математичне та імітаційне моделювання систем. МОДС`2010»: тези доповідей. - Київ, 2010. - С. 220-221.

Анотація

Оксанич І.М. Методи і моделі оцінки та підвищення ефективності проблемно-орієнтованого інтерфейсу користувача інформаційно-пошукової системи. - Рукопис.

Дисертація на здобуття наукового ступеня кандидата технічних наук за спеціальністю 05.13.06 - Інформаційні технології. - Інститут проблем математичних машин і систем НАН України, Київ, 2011.

Дисертаційна робота присвячена дослідженню шляхів і методів вирішення задачі підвищення ефективності інтерфейсу користувача (ІК) інформаційно-пошукових систем (зниженню трудомісткості формування користувачем запитів до інформаційних ресурсів) на основі методів теорії ймовірностей, математичної статистики, алгебри логіки, методів математичного та імітаційного моделювання.

Запропоновано та експериментально досліджено модель декомпозиції ментальних операторів технології GOMS-KLM для задач вводу та візуальної ідентифікації даних. Побудовано та досліджено математичні логіко-ймовірнісні моделі «покрокової» та «прицільної» підказки в ІК, залежності між варіантами та характеристиками ІК з урахуванням функції розподілу ймовірностей звертання до слів базового словника. Побудовано та експериментально перевірено імітаційні

моделі ІК. Запропоновано технологію та розроблено інформаційну модель системи квазидовільних запитів користувача до баз даних у природно-мовному середовищі за допомогою стандартних CASE - засобів.

Ключові слова: інтерфейс користувача, пошук за ключовими словами, підказка ключових слів, довільні запити, модель декомпозиції, ментальні оператори, GOMS-KLM.

Аннотация

Оксанич И.Н. Методы и модели оценки и повышения эффективности проблемно-ориентированного интерфейса пользователя информационно-поисковой системы. - Рукопись.

Диссертация на соискание научной степени кандидата технических наук по специальности 05.13.06 - Информационные технологии. - Институт проблем математических машин и систем НАН Украины, Киев, 2011.

В настоящее время значительная, если не преобладающая, часть компьютерной индустрии и проблемных областей применения информационных технологий ориентирована на создание и эффективное использование человеко-машинных систем, ориентированных на анализ (интеллектуальные информационно-аналитические системы, проблемно-ориентированные системы поддержки принятия решений, ситуационные центры, глобальные информационные системы), среди которых важную роль играют задачи построения эффективных интерфейсов пользователя (ИП). Неотъемлемой составляющей систем, ориентированных на анализ, являются информационные ресурсы и системы, обеспечивающие доступ к этим ресурсам (в широком толковании - информационно поисковые системы (ИПС)). Сейчас для ИПС существует определенная диспропорция между «человеческой» скоростью формулировки запроса на поиск и компьютерной скоростью реализации запроса. Так, например, в глобальных ИПС GOOGLE, YANDEX, RAMBLER и др. поиск и предоставление пользователю информационных ресурсов, связанных с заданным ключевым словом, требует меньше секунды, а ввод и идентификация ключевого слова - до десяти и более секунд. Еще большая диспропорция возможна в случае реализации структурированных запросов к базам данных (БД).

Поэтому задача оценки и повышения эффективности ИП ИПС в направлении снижения трудоемкости (повышения производительности) является актуальной.

Диссертация посвящена исследованию путей и методов решения задачи повышения эффективности интерфейса пользователя информационно-поисковой системы, в частности снижению трудоемкости формирования пользователем неструктурированных (по ключевому слову - образцу) и структурированных (по описанию содержания и структуры требуемых данных) запросов к информационным ресурсам.

Исследования базируются на общей методологии научного познания (анализ проблемной области, обоснование и постановка задач исследований, декомпозиция задач и моделей, построение моделей и решение задач на основе математической индукции и дедукции, обобщение результатов), общих и прикладных методах теории вероятностей и математической статистики, алгебры логики, методах математического и имитационного моделирования, общей методологии оценки производительности ИП (построение и исследование моделей), методах теории и практики системного программирования (программная реализация моделей)

В работе рассмотрены особенности применения и возможные направления усовершенствования общей технологии модели GOMS-KLM, как инструмента оценки производительности ИП в области задач ввода и визуальной идентификации данных. Обоснована, предложена и экспериментально исследована модель декомпозиции ментальных операторов GOMS-KLM на специализированные микрооператоры, обеспечивающие более определенную детализацию и формализацию оценки ментальных составляющих ИП и, благодаря этому, более высокую точность моделей. Экспериментально определены значения продолжительности ментальных микрооператоров для неквалифицированного пользователя.

Построены и исследованы математические модели механизмов и процессов формирования «пошаговой» и «прицельной» упреждающей подсказки при вводе ключевого слова-образца. Модели основаны на предположении о случайности распределения реально существующих слов базового словаря (БС) среди всевозможных значений и позволяют оценить зависимости между параметрами ключевых слов (алфавит, длина, объем БС), функцией распределения вероятностей обращения к словам БС, объемом страницы подсказки, коэффициентом результативности подсказки, с одной стороны, и существенными характеристиками процесса подсказки с визуальной идентификацией образца и исходной трудоемкостью вариантов ИП - с другой стороны.

...

Подобные документы

  • Існуючі технології інтерфейсів, критерії та оцінка їх ефективності. Голосовий інтерфейс та його практичне застосування, особливості реалізації в AutoCAD. Методика побудови та оцінювання ефективності, а також розробка програм з голосовим інтерфейсом.

    дипломная работа [1,1 M], добавлен 30.10.2014

  • Критерії (вимоги) до створення автоматичного робочого місця оператора реєстратури. Обґрунтування вибору середовища програмування та засобів збереження даних. Алгоритм програми. Опис інтерфейсу проекту системи. Програмні модулі та керівництво користувача.

    дипломная работа [1017,0 K], добавлен 31.10.2014

  • Проектування інтерфейсу користувача. Стилі взаємодії користувача з програмними системами. Стилі представлення інформації і доцільність графічного представлення даних. Правила проектування засобів підтримки користувача, вбудованих в програмне забезпечення.

    доклад [1,2 M], добавлен 08.12.2008

  • Виявлення основних сутностей предметної області. Побудова схеми реляційної бази даних. Вбудовані процедури і тригери. Опис архітектури програмної системи і концептуальної моделі бази даних, програмної реалізації та інтерфейсу користувача додатку.

    курсовая работа [4,3 M], добавлен 05.12.2012

  • Проектування інформаційно-пошукової системи магазину спорттоварів, забезпечення можливості додавати, редагувати, вилучати дані. Виведення результатів пошуку у формі звітів на екран або друк їх. Розробка зручного інтерфейсу з використанням системи меню.

    курсовая работа [5,8 M], добавлен 05.01.2014

  • Створення баз даних з використанням платформи Microsoft Access 2010 та структурованих запитів SQL. ER-діаграма бази даних з описом кожної сутності та її атрибутів. Розробка інтерфейсу, елементів навігації та макросів для автоматичного виконання запитів.

    курсовая работа [3,1 M], добавлен 21.08.2014

  • Методи первинної обробки даних - згладжування та характеристика сплайнів. Загальна характеристика об'єктно-орієнтованої мови Java. Принципи побудови графічного інтерфейсу. Розробка алгоритму програми та інтерфейсу користувача програмного продукту.

    дипломная работа [3,3 M], добавлен 10.10.2013

  • Розробка та проектування інтерфейсу користувача у середовищі Microsoft Visual Studio 2010 з використання Visaul C#. Введення, додавання, вилучення даних. Пошук і фільтрація потрібних записів за допомогою запитів. Реалізація валідації, обробка виключень.

    курсовая работа [1,5 M], добавлен 29.03.2017

  • Розроблення та створення автоматизованої інформаційно-довідкової системи обліку проданих квитків на авіарейси. Обробка баз даних СКБД Access. Розробка зручного діалогового інтерфейсу у вигляді меню користувача, яке реалізоване через керуючу форму.

    курсовая работа [56,9 K], добавлен 16.04.2011

  • Обробка масивів формалізованих записів, їх застосування у базах даних підприємств для пошуку інформації про об’єкт. Вимоги до програмного продукту і документації; його структура і функціональна схема. Посібник користувача, умови виконання програми.

    курсовая работа [391,0 K], добавлен 13.10.2012

  • Вибір середовища програмування Borland Delphi 7.0 для створення електронно-медичного довідника. Формування бази даних для перегляду та пошуку медичних препаратів для лікування. Особливості програмування інтерфейсу програми, інструкція користувача.

    курсовая работа [2,2 M], добавлен 19.09.2012

  • Особливості роботи ресторану та необхідність автоматизації процесів документообігу. Вимоги до продукту, вид інтерфейсу для користувача, додаткові функції при роботі з базою даних та веденням обліку. Вибір операційної системи та її основних компонентів.

    курсовая работа [310,6 K], добавлен 18.09.2012

  • Етапи розробки проекту. Вимоги до апаратного і програмного забезпечення, до користувача. Специфікація та структура даних, які мають бути розміщеними в системі. Вигляд інтерфейсу системи програмного забезпечення. Розробка бази даних косметичного салону.

    дипломная работа [1,8 M], добавлен 21.02.2015

  • Визначення необхідних даних для створення бази даних "Бібліотека", групування їх по таблицях. Передбачення ключових полів, зв’язків між таблицями Access. Створення запитів для функціонування фільтрів у головній формі, а також інтерфейсу користувача.

    курсовая работа [2,5 M], добавлен 22.01.2015

  • Створення інформаційних таблиць бази даних. Створення екранних форм як засобу організації інтерфейсу користувача. Створення запитів для вибору, сортування і обчислення з використанням даних однієї таблиці. Оформлення звітів за допомогою команд MS Access.

    лабораторная работа [397,7 K], добавлен 09.09.2010

  • Розробка інтерфейсу користувача системи. Розробка підсистеми планування ремонтно-профілактичних робіт для відділу головного інженера на ВАТ "Макаронна фабрика". Розробка логічної і фізичної моделей бази даних. Опис реалізованих функцій системи.

    дипломная работа [103,0 K], добавлен 14.02.2014

  • Розробка інформаційної системи, що містить дані про товари, їх поставку і доставку за допомогою моделі "Сутність-зв'язок". Вибір засобів її реалізації Структурна схема реляційної бази даних та таблиці БД. Інструкція для користувача програмним продуктом.

    курсовая работа [2,4 M], добавлен 19.06.2013

  • Процес і результати проектування автоматизованої системи "Облік паспортних даних", призначеної для автоматизації обліку паспортних даних. Обґрунтування вибору методів та засобів обробки даних. Створення зручного графічного інтерфейсу користувача.

    курсовая работа [1,8 M], добавлен 23.09.2010

  • Основні вимоги та актуальність розробки бази даних для обліку зернових в приватному сільськогосподарському підприємстві засобами сучасної СУБД Ассess. Основні задачі: формування таблиць, запитів та звітів; розробка функціонального інтерфейсу користувача.

    курсовая работа [2,7 M], добавлен 15.04.2011

  • Побудова інформаційно-математичної моделі задачі. Визначення структури даних, розробка інтерфейсу. Складання коду програми за допомогою мови програмування Delphi 7.0. Реалізація проекту у візуальному середовищі. Інструкція з експлуатації програми.

    курсовая работа [601,3 K], добавлен 03.09.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.