Семантичне індексування документів в галузі парламентського контролю
Представлення нових можливостей обробки правової інформації із застосуванням систем генеративного штучного інтелекту. Створення каузальних мереж, отриманих шляхом багаторівневої декомпозиції поняття "Парламентський контроль" за допомогою системи ChatGPT.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | украинский |
Дата добавления | 21.05.2024 |
Размер файла | 22,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Державна наукова установа «Інститут інформації, безпеки і права НАПрН України»
СЕМАНТИЧНЕ ІНДЕКСУВАННЯ ДОКУМЕНТІВ В ГАЛУЗІ ПАРЛАМЕНТСЬКОГО КОНТРОЛЮ
Ланде Д.В. доктор технічних наук, професор,
керівник наукового центру правової інформації
Системи генеративного штучного інтелекту (СГШІ), такі як ChatGPT (https://chat.openai.com/), стають все більш поширеними в різних галузях. Можливості у виділенні основних концепцій та іменних сутностей роблять ChatGPT корисним у фактографічних системах, зокрема в медицині та економіці [1]. СГШІ з зовнішніми системами, такими як геоінформаційні [2], системи аналізу та візуалізації графіків і мереж. В роботі [3] показано, як можна створювати мережі зв'язків між персонажами літературних творів.
Такі СГШІ, як ChatGPT, зазвичай називають великими мовними моделями (LLM). Ці системи використовують глибоке навчання та моделі генерації мови для створення зрозумілих людині відповідей на текстові запити. Вони тренуються на великих обсягах даних (Big Data). Принципи роботи таких систем включають розуміння тексту, генерацію відповідей та покращення якості моделі за допомогою зворотного зв'язку та додаткового навчання. парламентський контроль штучний інтелект
Мета роботи - є представлення нових можливостей обробки правової інформації із застосуванням систем генеративного штучного інтелекту, зокрема, ChatGPT, для вирішення задач семантичного індексування і побудови семантичних мап, що дозволяє розглядати такі системи як корисний аналітичний інструмент в галузі права, зокрема, для здійснення парламентського контролю.
Доповідь присвячена опису методики семантичного індексування і створення каузальних мереж, отриманих шляхом багаторівневої декомпозиції поняття «Парламентський контроль» за допомогою системи ChatGPT, а також візуалізації та аналізу цих мереж за допомогою спеціально створеної програми LegalGraph (https://bigsearch.space/legal.html). Сформовану мережу можна розглядати як семантичну карту, де кожен її вузол або зв'язок є гіперпосиланням, що веде до юридичної пошукової системи.
Парламентський контроль - це система, яка дозволяє парламентарям контролювати діяльність уряду. Ця система є важливою для забезпечення прозорості та підзвітності уряду перед народом [4]. Загалом, парламентський контроль на базі СГШІ має потенціал для революціонізації сфери парламентського контролю. Ця технологія може допомогти парламентарям бути більш ефективними та прозорими, а також може допомогти їм приймати більш обґрунтовані рішення. Для того, щоб мінімізувати ризики застосування СГШІ, необхідно розробити чіткі правила щодо використання. Ці правила повинні враховувати такі аспекти, як прозорість, відповідальність та справедливість.
Основна проблема, яка виникає при створенні семантичних карт, полягає в тому, що зазвичай для цього потрібні великі ресурси та залучення експертів. Запропонований підхід створення рою віртуальних експертів [5] може суттєво спростити і прискорити цей процес.
Формування семантичної мапи
Прикладом моделі предметної області «Парламентський контроль», в якості якої можна представити мережевий масив даних, який буде зручним для обробки комп'ютером, є направлена зважена мережа термінів. Якщо нас цікавить проблематика парламентського контролю, тому треба запросимо у сервісу ChatGPT декомпозувати це поняття і видати відомі їй часткові поняття, що складають суть парламентського контролю. Тобто центральним вузлом майбутньої мережі має стати поняття «Парламентський контроль». Після цього для кожного такого часткового поняття також здійснюється декомпозиція. Такий процес може тривати нескінченно, але в роботі зупинимося лише на трьох рівнях. Незважаючи на ієрархічне формування такої мережі, вона загалом не буде строго ієрархічною структурою, а скоріше квазіієрархічною. Деякі часткові поняття при декомпозиції різних понять можуть співпадати.
Найчастіше при використанні ГСШІ сутності або пари сутностей (а саме це потребується при побудові мережевих структур) можна витягувалися безпосередньо з навченої моделі системи. Промпт для виявлення сутностей - результатів декомпозиції основного поняття може мати такий вигляд:
ГСШІ видає відповідь такого вигляду:
Система ChatGPT може надати різні відповіді під час обробки тексту в різний час, і всі вони розумні з точки зору людської логіки. Кожну з цих відповідей можна сприйняти як відповідь штучного експерта. Узагальнивши відповіді багатьох таких експертів, можна отримати більш повну і точну відповідь. Тому наведений промпт можна задати системі декілька разів, запустивши тим самим «рій віртуальних агентів». Багаторазове виконання дозволяє отримати різні відповіді, багато з яких співпадуть. Із статистичного погляду, - це самі достовірні результати. У разі розгляду первинного поняття «Парламентський контроль», отримуємо такі поняття, як «ПАРЛАМЕНТ», «КОНТРОЛЬ», «НАГЛЯД», «ВИКОНАВЧА ВЛАДА», «ЗВІТНІСТЬ» тощо.
Після виконання першого етапу - отримання результату декомпозиції, для кожного із отриманих часткових понять здійснюється подальша декомпозиція за допомогою промптів типу:
При цьому система ChatGPT може допомогти отримати зміст CSVфайлу (поля, розділені точкою з комою), а саме:
ВИКОНАВЧА ВЛАДА; ВИКОНАННЯ ЗАКОНІВ
ВИКОНАВЧА ВЛАДА; РЕГУЛЮВАННЯ ГАЛУЗЕЙ ГОСПОДАРСТВА
ВИКОНАВЧА ВЛАДА; РОЗРОБКА ТА ВИКОНАННЯ БЮДЖЕТУ
ВИКОНАВЧА ВЛАДА; ЗОВНІШНІ СПРАВИ
ВИКОНАВЧА ВЛАДА; НАЦІОНАЛЬНА БЕЗПЕКА
Такого типу відповіді можуть слугувати інформаційною основою для побудови графових структур -- семантичних мапа, які одночасно є джерелом посилань, тому що кожний вузол і кожний зв'язок цієї мережі містить гіперпосилання на відповідні запити до пошукової систем порталу
Верховної Ради України (https://zakon.rada.gov.ua/laws). Кожне екстраговане поняття може розглядатись як вузол мережі. Крім того, з подібним промтом можна звернутися до декількох систем штучного інтелекту, серед яких ChatGPT, Bard (https://bard.google.com/chat), GPT Free (https:// gptfree.co) тощо.
Аналіз і візуалізація семантичної мапи
Аналіз мереж є важливим методом для розуміння взаємозв'язків між об'єктами та виявлення зв'язків між ними, що може значно полегшити дослідження конкретної сфери. Для проведення аналізу та візуалізації мереж, спільно з системами, подібними до ChatGPT, можна використовувати сучасні графові інструменти, такі як Gephi [7]. Однак при використанні таких програмних продуктів аналітики стикаються з двома труднощами: потребою встановлення програм, що не завжди можливо, особливо при обмеженнях на встановлення стороннього програмного забезпечення, та потребою досконально вивчити особливості функціонування цих систем, розібратися в численних параметрах, режимах розміщення графів, кластеризації тощо.
Для вирішення цих проблем на основі бібліотеки системи GrahViz розроблено програму LegalGraph, доступного наразі в Інтернет за адресою https://bigsearch.space/legal.html. Ця програма забезпечує первинний аналіз і відображення графів, інформація про які відповідає формату CSV (від англ. Comma-Separated Values - значення, розділені комою), кожен запис в якому відповідає парі сутностей. При цьому кожному вузлу і ребру графа у відповідність ставиться гіперпосилання на законодавчу базу даних, розміщену в Інтернеті.
На Рис. 1 показано результат -- фрагмент семантичної мапи предметної області «Парламентський контроль», який було сформовано на ресурсів сервісу ChatGPT. Як бачимо, ця мережа квазіієрархічна, до вузлів, що поєднують різні часткові поняття, тобто є транзитними, відіграють особливу роль в процесі парламентського контролю виявились такі: «КОНТРОЛЬ ЗА ВИКОНАВЧОЮ ВЛАДОЮ»; «ЗВІТНІСТЬ ВІИКОНАВЧОЇ ВЛАДИ»; «ПАРЛАМЕНТСЬКІ СЛУХАННЯ»; «АУДИТ БЮДЖЕТНИХ ВИТРАТ» тощо.
Програмою формується відображення орієнтованих графів, вузли ранжуються за ступенем і розфарбовуються, визначається товщина і напрямок ребер. При цьому формується зображення графа у форматі SVG, що дає можливість формувати гіперпосилання, що ведуть до пошукових форм системи Верховної Ради України. з вузлів і ребер графа. Реалізація гіперпосилань надає можливість перегляду нормативних документів, які, з одного боку надає інформаційне розкриття поняття або зв'язку, а з іншого, підтверджує коректність побудови семантичної мапи.
Висновки
Створення семантичної мапи на основі технології генеративного штучного інтелекту і системи LegalGraph може допомогти юристами при використанні правових знань при здійснені парламентського контролю завдяки зручному доступу до інформації; структуруванні та візуалізації знань; зв'язкам між різними сутностями і документами.
Використання методики семантичного індексування і формування семантичних мап може сприяти покращенню рівня парламентського контролю завдяки зручному охопленню всієї понятійної бази і швидкому доступу до відповідної нормативно-правової інформації.
Використана література
1. Lande, Dmitry and Strashnoy, Leonard, Concept Networking Methods Based on ChatGPT & Gephi (April 17, 2023). SSRN. Available at http:// dx.doi.org/10.2139/ssrn.4420452
2. Tamilla Triantoro. Graph Viz: Exploring, Analyzing, and Visualizing Graphs and Networks with Gephi and ChatGPT (March 30, 2023). ODSC Community. Available at https://opendatascience.com/graph-viz-exploringanalyzing-and-visualizing-graphs-and-networks-with-gephi-and-chatgpt/
3. Solat J. Sheikh, Sajjad Haider, Alexander H. Levis, On semi-automated extraction of causal networks from raw text, Engineering Applications of Artificial Intelligence, Volume 123, Part A, 2023, 106189, ISSN 0952-1976, https://doi.org/10.1016/j.engappai.2023.106189.
4. Інформатика парламентського контролю: посібник / Д. В. Ланде, В. М. Фурашев, С. М. Брайчевський. - Київ 2022. - 256 с. ISBN 978-9662344-80-6
5. Dmytro Lande, Leonard Strashnoy. GPT Semantic Networking: A Dream of the Semantic Web - The Time is Now - Kyiv: Engineering, 2023. - 168 p. ISBN 978-966-2344-94-3.
6. Ken Cherven. Mastering Gephi Network Visualization. - Packt Publishing, 2015. ISBN 78-1-78398-734-4.
Размещено на Allbest.ru
...Подобные документы
Застосування нейронних мереж при вирішенні різних технічних проблем. Архітектура штучних нейронних мереж. Дослідження штучного інтелекту. Гіпотеза символьних систем. Представлення за допомогою символів. Синтаксичний та семантичний аналіз розуміння мови.
курсовая работа [985,8 K], добавлен 14.01.2010Логічний, структурний, еволюційний та імітаційний підходи до побудови системи штучного інтелекту. Використання формально-логічних структур, що обумовлено їх алгоритмічним характером. Методи реалізації системи штучного інтелекту, інтелектуальні програми.
реферат [34,5 K], добавлен 14.04.2014Вивчення технології та принципів індексування, яке забезпечує групування документів відповідно до їх тематики і галузі знання. Аналіз таких видів індексування як систематизація, предметизація, координатне індексування. Транспортні ресурси мережі Інтернет.
реферат [24,5 K], добавлен 26.10.2010Поняття штучного інтелекту, його порівняння з природним. Коротка характеристика особливостей використання штучного інтелекту в медицині, військовій справі та комп'ютерних іграх. Проблема взаємодії носіїв універсального штучного інтелекту та суспільства.
контрольная работа [29,6 K], добавлен 07.01.2014Поняття та види правової інформації, напрямки її використання. Характеристика основних типів мереж, які виділені за способом організації обробки інформації. Суб’єкти реєстрації застав рухомого майна і зміст Державного реєстру застав рухомого майна.
контрольная работа [21,9 K], добавлен 20.07.2011Суть, значення і види наукової обробки документів. Обов'язкова державна реєстрація книжкових пам'яток. Інформаційно-пошукові системи, їх види. Опис змісту документа за допомогою дескрипторів. Анотування і реферування як вид інформаційної діяльності.
курсовая работа [44,7 K], добавлен 22.11.2010Нові інформаційні технології (НІТ) як сукупність нових засобів і методів обробки, зберігання і передачі інформації. Технологічна основа та основні принципи створення НІТ. Класифікатори техніко-економічної інформації в фінансовому контролі й аудиті.
контрольная работа [21,5 K], добавлен 27.09.2010Класифікація експертних систем. Представлення знань, переваги та слабкі місця. База знань як елемент експертної системи. Сфера застосувань та перспективи розвитку. Створення експертної системи для оцінки ступеня підготовленості студента до іспиту.
курсовая работа [1,4 M], добавлен 04.02.2014Місце мікропроцесора в структурі мікропроцесорних приладів, його функції. Інтегральні мікросхеми із великою ступінню інтеграції. Розробка структурної схеми мікропроцесорної системи обробки інформації на основі мікроконтролера ATmega128 та інших мікросхем.
курсовая работа [2,1 M], добавлен 18.09.2010Сутність поняття "плагіат документів" та методи виявлення плагіату. Попередня обробка документу - токенізація, видалення стоп-слів та коренів. Семантичне та синтаксичне представлення документів. Алгоритм апроксимованої подібності, побудова N-грам.
дипломная работа [2,4 M], добавлен 12.09.2012Комп'ютерні інформаційні системи. Характеристика автоматизованої системи обробки економічної інформації на підприємстві. Технологічний процес обробки інформації конкретної задачі в системі. Впровадження в дію автоматизації бухгалтерського обліку.
контрольная работа [25,1 K], добавлен 26.07.2009Інтуїтивне розуміння поняття "інтелект". Основні проблемні середовища штучного інтелекту. Проблема неточних і неповних знань. Тест Тьюринга і фатичний діалог. Метод комп’ютерної реалізації фатичного діалогу. Принцип віртуальної семантичної сітки.
курсовая работа [560,0 K], добавлен 27.12.2007Принцип роботи конвеєрних комп’ютерних систем. Опис можливостей паралельної обробки інформації обчислювальною системою. Конвеєрна обробка на кожному з рівнів. Розширення трирівневої моделі паралелізму засобами опису потенційних можливостей конвейєризації.
лабораторная работа [44,0 K], добавлен 21.10.2014Основні можливості створення та редагування документів в текстовому редакторі Microsoft Word. Вставка спеціальних символів, табуляція, створення списків, колонок та буквиці за допомогою програми. Особливості та правила оформлення текстових документів.
курсовая работа [795,8 K], добавлен 06.07.2011Створення нової бази даних та таблиць MS Access. Пов’язування таблиць та індексування їх за тими полями, по яким створюється зв’язок. Створення запиту на вибірку в режимі конструктора. Створення екранних форм для роботи з даними за допомогою майстра форм.
контрольная работа [26,6 K], добавлен 04.02.2013Автоматизація роботи диспетчера швидкої допомоги. Забезпечення контролю, обігу документів та створення карток хворих при занесенні інформації бригад швидкої допомоги за допомогою програмного забезпечення. Захист системи від несанкціонованого доступу.
курсовая работа [1,4 M], добавлен 14.09.2014Сутність поняття "контроль". Оцінювання результатів навчально-пізнавальної діяльності учнів. Особливості комп’ютерного контролю знань. Підходи до зіставлення комп’ютерних програм контролю. Створення тесту з математики за допомогою програми MyTest.
курсовая работа [278,4 K], добавлен 24.04.2012Автоматизована системи обробки економічної інформації, яка використовується на підприємстві, її характеристика. Технологічний процес обробки інформації конкретної задачі в системі. Зауваження користувача щодо функціональних і ергономічних характеристик.
контрольная работа [26,5 K], добавлен 27.07.2009Типологія засобів проектування економічних інформаційних систем з використанням ЕОМ. Описання видів реєстраційних і класифікаційних систем кодування інформації. Операції автоматизованого введення паперових документів, етапи процесу їх сканування.
контрольная работа [114,7 K], добавлен 00.00.0000Типологія засобів проектування економічних інформаційних систем з використанням ЕОМ. Описання видів реєстраційних і класифікаційних систем кодування інформації. Операції автоматизованого введення паперових документів, етапи процесу їх сканування.
контрольная работа [114,7 K], добавлен 14.02.2011