Дослідження принципів двовимірної структуризації інформаційних джерел
Представлення знань у неструктурованому або слабоструктурованому вигляді. Сучасні методи представлення даних. Окреслення структурних ядер та мап знань, представлення типових випадків, означення переваг, недоліків та можливостей використання мап знань.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | украинский |
Дата добавления | 22.03.2024 |
Размер файла | 625,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Харківський національний університет радіоелектроніки
ДОСЛІДЖЕННЯ ПРИНЦИПІВ ДВОВИМІРНОЇ СТРУКТУРИЗАЦІЇ ІНФОРМАЦІЙНИХ ДЖЕРЕЛ
Д'яков Ян Русланович аспірант
кафедри електронно-обчислювальних машин
Анотація
Сучасність передбачає велику кількість шумів (повтори, елементи емоційного забарвлення), малодостовірних даних в інформаційних джерелах. Пошук "точок опори" у пізнанні навколишнього світу визначається складним питанням, що призводить до помилок у роботі штучного інтелекту, пов'язаних етичних проблем; недостатнього й неефективного впровадження інформаційних технологій у освітніх процесах. Задля вирішення означених проблем автор пропонує до розгляду систему двовимірної структуризації інформаційних джерел. Увагу акцентовано на окресленні структурних ядер та мап знань; представленні типових випадків; означенні переваг, недоліків та можливостей використання мап знань.
Ключові слова: знання, структуризація, модель, аналіз, візуалізація.
Виклад основного матеріалу
ядро мапа знання структурний
Представлення знань у неструктурованому або слабоструктурованому вигляді є проблемою як для людини, так й для електронно-обчислювальної машини. Відсутність впорядкування інформаційних джерел призводить до накопичення шумів, ускладнення пошуку малодостовірних даних тощо. Сучасні стандарти оформлення документів, зокрема наукових праць, захист від плагіату підвищують якість джерел знань, однак залишають позаду численні інтернет-ресурси, застарілі джерела та ін.
Щодо освітніх процесів визнано не лише актуальність впровадження інформаційно-комунікаційних технологій, але й низку пов'язаних проблемних аспектів [1]. При зосередженні уваги на апаратному забезпеченні й підготовці педагогів до інформатизованих освітніх процесів вторинною представляється подальша структуризація інформаційних джерел задля поглиблення освітніх процесів.
Ті ж проблеми актуалізуються у процесі підготовки численних даних для навчання штучного інтелекту, зокрема нейронних мереж. Результат такого процесу -- т. з. датасет -- може бути сприйнятий машиною, але не є корисним для людини; лише засобами статистичного аналізу можливо виокремити корисні компоненти, тобто знання як таке. Малодостовірні знання у якості джерел для генерації таких датасетів призводить й до етичних проблем.
Аналізуючи сучасні методи представлення даних й керування ними, ефективні засоби взаємодії з машинами через мови програмування, можливо створити проміжний шар структуризації між інформаційними джерелами та суб'єктами пізнання.
Для цього насамперед необхідно окреслити т. з. структурне ядро, тобто первинну послідовність сильнозв'язаних функціональних елементів, за допомогою яких можливо ефективно описати деяку предметну область.
Розглянемо структурне ядро з наступними типами елементів:
- сутність (entity) з означенням "ent". Сутність представляє такі компоненти предметної області дефінітивного характеру, без прийняття яких неможливо побудувати будь-яке відображення предметної області (тіло, атом у фізиці; число у арифметиці, нота у музиці тощо);
- операція (operation) з означенням "op". Операція є узагальненою й систематизованою сукупністю кроків з переробки визначеної кількості сутностей (операнди) у деякий результат. Основними видами цього елементу є унарна операція (opi), бінарна операція (op2) та N-арна операція (оры);
- характеристика (characteristic) з означенням "char". Характеристика представляється властивістю визначеного елемента, тобто акцентуацією деякого аспекту його існування, що має значний вплив на подальших процес пізнання. Основними видами цього елементу є, відповідно, характеристика сутності (charent) та характеристика операції (charop).
Шляхом аналізу предметної області, а саме: знаходження ключових матеріалів, з'ясування зв'язків між їхнім сенсом та елементами використовуваного структурного ядра, перенесення зв'язаних елементів у графічну площину із впорядкуванням відносно оптимального процесу накопичення знання (наприклад, порядок викладення матеріалу) у деякому акумуляторі (розум у випадку людини, як суб'єкту пізнання) -- отримуємо представлення предметної області, т. з. мапу знань.
Для створення мап знань також потрібен набір графічних примітивів, що поєднує фігури для зображення елементів (наприклад, прямокутники), типів елементів (різні види фігур відповідно до різних типів або вертикальні смуги тощо), зв'язків між ними (стрілки). Двовимірний характер таких примітив визначає двовимірність мапи знань та системи структуризації знань, що її породжує.
Стосовно мап знань доцільно увести наступні обмеження:
- у мапі знань існує лише висхідний процес. Таким чином стандартний пізнавальний процес людини поєднується з ітеративним процесом навчання машини. Також забезпечується принцип того, що кожен елемент можливо розкрити через сукупність попередніх елементів;
- мапа знань орієнтована лише на одну предметну область. Мінімізація домішок з інших предметних областей уніфікує мапу знань, підвищує її якість та здатність до зв'язування з іншими мапами без повторів;
Систему двовимірної структуризації інформаційних джерел доцільно описати алгоритмічно. Наведемо основні етапи такого алгоритму структуризації (впорядкування) інформаційних джерел:
1. Первинний аналіз інформаційного джерела. До цього етапу відносяться; створення прототипу мапи знань, визначення його назви; насичення прототипу елементами відповідно до їхніх взаємозв'язків, первинному порядку.
2. "Кластеризация" предметних областей. Визначення основної та супутніх предметних областей, їх первинний розділ усередині прототипу мапи знань.
3. Ізоляція супутніх предметних областей у власних мапах знань (щодо них алгоритм структуризації починається з першого етапу). Встановлення міри залежності між ними та основною предметною областю.
Як приклад, розглянемо структуризацію типової предметної області -- арифметики; візуалізуємо етапи вищеозначеного алгоритму. Новостворений прототип мапи знань отримає назву "Арифметика" (рис. 1).
Рис. 1 Графічний результат першого етапу структуризації інформаційного джерела
У означеному прототипі присутні елементи (т. з. домішки), які не співвідносяться з арифметикою напряму, але відображають деякі приклади її застосування. Проаналізуємо й відокремимо супутню предметну область відповідно до другого етапу алгоритму структуризації (рис. 2).
Рис. 2 Графічний результат другого етапу структуризації інформаційного джерела
За характером сутностей супутньої предметною області визнаємо її фізикою. Наявність лише одного переходу до неї від основної предметної області полегшує подальшу роботу відповідно до алгоритму структуризації. З іншого боку, проблемною є сутність “Виділення рівності”, яка хоч і знаходиться усередині супутньої предметної області, але потребується й арифметиці.
“Арифметику” й “Фізику” можна візуалізувати окремо, як дві мапи знань. Проте фізичні тіла неможливо представити без здатності їхнього лічення, арифметичних операцій над ними. Тож, для ефективного пізнання фізики необхідні первинні знання з арифметики. Таким чином, у контексті мап знань фізика має залежність від арифметики; “Арифметика” породжує “Фізику” -- що й є шуканою мірою залежності (рис. 3).
Рис. 3 Скомпонований графічний результат третього етапу структур изації знань
Як результат, отримуємо дві мапи знань -- "Арифметика" й “Фізика”.
Типовими прикладами використання характеристик у контексті мапи знань “Арифметика" є властивості арифметичних операцій, як-от комутативність, асоціативність тощо (рис. 4, а).
Механізми штучного інтелекту задля освоєння предметних областей за допомогою мап знань потребують додаткового шару формалізації. Таким чином вирішується проблема автоматизованої генерації навчальних вибірок, слабкості (розмитості) окреслення елементів, їхнє додаткове зв'язування; актуалізується можливість автоматизованої генерації навчальних вибірок тощо.
Нехай існує система псевдокодової формалізації "Q", що співвідносить будь-який елемент структурного ядра з впорядкованою множиною термінів мови програмування, використовуваною для передачі команд електронно-обчислювальним машинам. Також нехай існує множина лінгвістичних невідомих "L" та такий її елемент "І", який однозначно інтерпретує будь-який елемент структурного ядра термінами природної мови. Верхній індекс визначатиме нумерацію представників елемента (або латинська велика літера у випадку довільної кількості; у такому випадку оперуємо множиною елементів, що підкреслюємо символом “..."). Тоді можливо увести шар формалізації до попередньо визначеного структурного ядра, а саме до сутності (1), унарної (2), бінарної (3) та N-арної (4) операції, характеристики сутності (5) та операції (6).
Задля спрощення процесу пізнання деяку інформацію можна увести аксіоматично. Типовим випадком може виступати інформація, отримана шляхом часозатратних роздумів та / або розрахунків (леми, теореми й їхні наслідки тощо). Для цього необхідно до вищеозначеного структурного ядра додати елемент аксіоми з означенням “axiom” (рис. 4, б).
З іншого боку, уведення такого елементу створює потенційну загрозу для процесу пізнання. Так, якщо у процесі освоєння предметної області неможливо логічним шляхом прийти до аксіоматично затверджених знань, попередньо не знаючи їх -- відповідна мапа знань не буде повноцінно відображати означену предметну область; крім того, підвищується вірогідність виникнення конфліктів між елементами. Таким чином, розробка мап знань має проводитись з урахуванням можливості повного пізнання предметної області без елементів аксіом навіть у випадку погіршення тривалості такого пізнання.
Рис. 4 Приклад організації мап знань з урахуванням характеристик (а) та аксіом (б)
Особливістю означеної будови мап знань є її інформаційне насичення. Так, елементи представляються будівельними блоками, що зв'язують представлення з первинним інформаційним джерелом. Висхідні зв'язки між ними окреслюють порядок пізнання. Вертикальна сітка використовується задля групування елементів як за типами, так й за мапами знань в цілому (основна -- супутні). Горизонтальна сітка визначає “кроки пізнання”, тобто порядкову мітку горизонталі, на якій знаходяться ті чи інші елементи. Завдяки їй можливо визначити поточний рівень пізнання предметної області.
На одному горизонтальному рівні можуть бути численні елементи. їхній розподіл на одному кроці пізнання означає, що вони можуть оброблюватись (вивчатись) незалежно одне від одного, тобто у довільному порядку.
Іншою перевагою є можливість використання електронно - обчислювальних машин для створення, редагування, зберігання, передачі й відтворення структурних ядер та пов'язаних мап знань. Елементарний аналіз подібності назв сутності гарантує мінімізацію повторів. Ітеративне розширення мап знань, збільшення їхньої чисельності, аналіз й відсікання непотрібних (зайвих) гілок структур мінімізує шуми. Залучення численних користувачів до означених процесів (тобто створення середовища для керування та візуалізації мап знань як інтернет-ресурсу) активує суспільний механізм контролю за малодостовірними даними (наприклад, Wikipedia [2]).
Типовими проблемами структурних ядер варто відзначити:
- гнучкість. Визнається складним підібрати структурне ядро, що б відповідало будь-якій структурі знання. Більш вузьке означення елементів перешкоджає використанню ядра для роботи з іншими предметними областями. З іншого боку, процес абстрагування розмиває елементи, зменшуючи їхню здатність до формалізації. Пошуку субоптимальних структурних ядер необхідно присвятити додаткові дослідження;
- розширення. Впровадження нових типів елементів, зв'язків ускладнює процес формалізації, підвищує можливість “зашумлення” пов'язаних мап знань.
Мапи знання поділяють наступні проблемні аспекти:
- низька швидкість розширення. Збільшення кількості мап знань, подальше їхнє наповнення потребує експертів у тих чи інших предметних областях; пошук й перевірка їхньої компетенції вимагає додаткового часу. У випадку відкриття середовища візуалізації та керування для численних користувачів також актуалізується питання їхньої компетенції й ефективності роботи.
- збереження й відновлення даних. Зі збільшенням кількості сутностей мап знань актуалізується проблема збереження даних. Визначальним є баланс між розміром контейнера мапи знань (байти) та наочністю його наповнення для пересічного користувача. Варіантом вирішення поставленої проблеми є уведення файлової розмітки за форматами JSON, XML або CSV (файли конфігурації, наборів даних тощо). З іншого боку, можливо повністю відмовитись від наочності наповнення та зберігати інформацію у зашифрованому вигляді (контейнери нейронних мереж, бібліотек), представивши візуалізаційні можливості у спеціалізованому середовищі;
- обмеження базових джерел знань. Як і у випадку з наборами даних для навчання нейронних мереж, мапа знань залежить від базових джерел. Отже, вона є відображенням не лише корисної, інформативної частки, але й супутніх неточностей, фальсифікацій тощо. Методами вирішення такої проблеми є більш прискіпливий вибір джерел, залучення експертів предметних областей. Перевагою у цьому випадку є графічна наочність мап знань, як результат -- розширені й полегшені можливості до редагування після структуризації;
- групування. Збільшення числа вузькоспеціалізованих мап знань актуалізує питання їхнього групування (наприклад, збірка мап знань математичних дисциплін, що виступає як окрема мапа знань "Математика"). Структурне ядро таких генералізованих мап знань, можливі обмеження потребують додаткових досліджень.
Щодо мап знань можливі наступні застосування:
- представлення предметних областей у освітніх процесах;
- визначення подібності предметних областей. Абсолютна або переважна структурна одноманітність різних мап знань за умови використання єдиного структурного ядра дозволяє висунути гіпотезу про подібність предметних областей;
- пошук конфліктів предметних областей. Так, дуплікація назв сутностей у різних мапах знань може виступати конфліктом й вирішуватись пошуком оригінальних (унікальних) назв; неможливість чіткого з'ясування міри залежності між тими чи іншими мапами знань актуалізує ширші питання стосовно доцільності самого факту залежності, пошуку невідомих сутностей;
- представлення даних для штучного інтелекту. Необхідність впровадження алгоритмів семантичного аналізу задля розуміння природних мов ускладнює механізми штучного інтелекту. Попередня обробка даних шляхом створення мап знань з шаром формалізації пропонує можливості до автоматизованої генерації навчальних вибірок, представлення даних у більш структурованому вигляді.
Висновки
Слабка структуризація знань шкодить пов'язаним процесам людської діяльності, ефективному освоєнню знань механізмами штучного інтелекту тощо. Одним з шляхів підвищення структуризації є впровадження двовимірної системи структуризації інформаційних джерел з урахуванням процесу пізнання. Структурне ядро є джерелом будівельних блоків, якими можливо описати ту чи іншу предметну область й отримати мапу знань за умови слідування чіткому алгоритму. Попри численні проблемні аспекти за мапами знань визнається потенціал у вирішенні освітніх, загальнонаукових проблем; проблем взаємодії людина-машина. Визнається необхідність у проведенні подальших досліджень.
Список використаних джерел
1. Корнійчук, В. Процес впровадження інформаційно-комунікаційних технологій у навчальний процес: проблеми та перспективи. Концептуальні шляхи розвитку сучасної науки: збірник наукових праць «АОГОІ» з матеріалами міжнародної науковопрактичної конференції (Т. 3, с. 70-71). 20 листопада 2020, Бухарест, Румунія: Європейська платформа допомоги.
2. Вікіпедія: Консенсус. (2022). Вилучено з https://uk.wikipedia.org/w/index.php?curid=901879.
Размещено на Allbest.ru
...Подобные документы
Внутрішнє представлення в пам’яті комп’ютера даних базових та похідних типів, масивів. Ідентифікатор, зв'язаний з константним виразом та основи представлення даних. Алгоритм представлення цілих, дійсних, логічних і символьних чисел, структур і об’єднань.
курсовая работа [279,1 K], добавлен 25.08.2014Класифікація експертних систем. Представлення знань, переваги та слабкі місця. База знань як елемент експертної системи. Сфера застосувань та перспективи розвитку. Створення експертної системи для оцінки ступеня підготовленості студента до іспиту.
курсовая работа [1,4 M], добавлен 04.02.2014Розгляд онтології як способу представлення знань; використання технологій Інтернет. Створення сховища даних Працевлаштування, в якому буде міститись інформація про роботодавців, організації, вакансії, безробітних. Розробка модулів для надання інформації.
курсовая работа [1,7 M], добавлен 12.05.2015Ознайомлення з поняттям HMI (Human Machine Interface) на прикладі редактора представлення даних системи Trace Mode. Структура та властивості редактора представлення даних для розробки графічної частини проекту системи управління. Типи графічних елементів.
лабораторная работа [1,2 M], добавлен 20.03.2011Поняття HMI (Human Machine Interface) на прикладі редактора представлення даних системи Trace Mode. Побудова людино-машинного інтерфейсу за допомогою графічних елементів. Короткий огляд форм відображення: динамічного тесту, кнопок, колірних індикаторів.
лабораторная работа [633,9 K], добавлен 20.03.2011Проектування інтерфейсу користувача. Стилі взаємодії користувача з програмними системами. Стилі представлення інформації і доцільність графічного представлення даних. Правила проектування засобів підтримки користувача, вбудованих в програмне забезпечення.
доклад [1,2 M], добавлен 08.12.2008Поняття експертної системи, приклади сфер її використання. Класифікація та задачі експертних систем. Означення продукційної експертної системи, приклад її дії та опис програми. Побудова бази знань із чіткою логікою, що вирішує завдання класифікації.
лабораторная работа [712,5 K], добавлен 19.03.2011Додавання (віднімання) чисел на ДСОК: двійкова система числення, представлення з рухомою комою, суматор оберненого коду. Побудова схеми керування заданого автомату, алгоритм додавання(віднімання) та його представлення у вигляді блок-схеми, кодування.
курсовая работа [616,7 K], добавлен 03.01.2014Бізнес процеси й елементи даних. Специфікація елементів даних. Діаграма класів проектування. Створення та використання об'єктів бази даних. Таблиці, обмеження цілісності, тригери, типові вибірки, представлення, індекси. Типові оператори модифікації даних.
курсовая работа [255,3 K], добавлен 01.06.2019Характеристика проблемних моментів автоматизації процесу формування питань у білеті для визначення рівня знань студента. Розробка бази вимог щодо організації перевірки якості знань і програмного забезпечення для організації та управління даними бази.
курсовая работа [2,6 M], добавлен 06.12.2013Фізичне та логічне представлення топології мереж, кабельна система. Вибір мережевого устаткування. Імітаційне моделювання корпоративної комп’ютерної мережі в NetCracker 4.0. Представлення локальної мережі в Microsoft Visio 2013, економічне обґрунтування.
курсовая работа [993,5 K], добавлен 17.05.2015Дослідження теоретичних аспектів проектування автоматизованих систем тестування знань. Розробка програми, яка призначена для забезпечення автоматизації процесу формування тестів та всього процесу контролю знань у дистанційній навчальній системі.
дипломная работа [2,1 M], добавлен 26.10.2012Проектування інформаційної системи для супроводу баз даних. Моделі запиту даних співробітником автоінспекції та обробки запиту про машини та їх власників. База даних за допомогою SQL-сервер. Реалізація запитів, процедур, тригерів і представлення.
курсовая работа [1,7 M], добавлен 18.06.2012Представлення типів даних при роботі нейронними мережами. Корисні вхідні змінні, їх тестування методом спроб та помилок. Генетичний алгоритм відбору вхідних даних. Нелінійне пониження розмірності, пропущені значення. Створення нового набору даних.
реферат [1,1 M], добавлен 09.07.2011Особливості технології Flash, основні переваги: невеликий розмір файлів, наявність вмонтованої мови опису сценаріїв. Розгляд вимог до діагностичних тестів: валідність, надійність, простота. Аналіз принципів побудови автоматизованих систем контролю знань.
дипломная работа [5,0 M], добавлен 22.10.2012Аналіз відомих підходів до проектування баз даних. Моделі "сутність-зв'язок". Ієрархічна, мережева та реляційна моделі представлення даних. Організація обмежень посилальної цілісності. Нормалізація відносин. Властивості колонок таблиць фізичної моделі.
курсовая работа [417,6 K], добавлен 01.02.2013Опис програми "Мала експертна система": класифікація, основні задачі; використання байєсівської системи логічного виведення. Опис програми "Редактор баз знань", її застосування. Створення власної БД з чіткою логікою та двома можливими результатами.
лабораторная работа [491,9 K], добавлен 20.03.2011Теоретичне дослідження особливостей проектування систем дистанційного навчання. Створення програмного забезпечення процедури статистичної обробки результатів тестування знань і оцінки якості тесту. Економічне обґрунтування доцільності розробки програми.
дипломная работа [3,6 M], добавлен 22.10.2012Поняття та основна мета створення інформаційної системи, її різновиди та процедура побудови, підходи до обробки. Концепція баз даних та методи керування ними, предметна область і процес проектування. Структурована мова запитів SQL, елементи та оператори.
учебное пособие [1,7 M], добавлен 14.11.2009Потреба людини в кодованих сигналах спілкування на ранніх етапах історії. Інформаційні технології - технологічна підтримка природних можливостей людини з накопичення та передачі знань. Властивості інформаційних технологій, їх засоби та користувачі.
презентация [3,0 M], добавлен 18.11.2015