Формування мереж понять в галузі права за допомогою системи штучного інтелекту
Опис методики формування мереж понять, пов’язаних із правовими документами і поняттями предметної галузі "Інформаційне право". Використання системи штучного інтелекту ChatGPT і програми аналізу і візуалізації мереж. Можливості побудови мереж концептів.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | украинский |
Дата добавления | 03.02.2024 |
Размер файла | 3,2 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Формування мереж понять в галузі права за допомогою системи штучного інтелекту
Ланде Д.В., доктор технічних наук, професор, керівник
Наукового центру інформатики і права ДНУ ІІБП НАПрН України,
завідувач кафедри НН ФТІ КПІ ім. Ігоря Сікорського
Страшной Л.Л., старший фахівець з архітектури даних
(Senior Data Architect), Університет Каліфорнії (UCLA)
Анотація
Описується методика формування мереж понять, пов'язаних із правовими документами і поняттями предметної галузі “Інформаційне право”. Методика базується на використанні системи штучного інтелекту ChatGPT і програми аналізу і візуалізації мереж Gephi. Показано можливість побудови мереж концептів на основі використання ChatGPT, вирішуються завдання, які раніше вирішувалися із залученням великих часових та людських ресурсів. Показано, як інтегруються засоби інтелектуальної текстової аналітики та аналізу мереж, а також їхня візуалізація. Запропоновано емуляцію багатьох експертів шляхом багаторазової побудови запиту до системи ChatGPT. Методика може застосовуватися для мережного аналізу документальних джерел, побудови моделей предметних галузей.
Ключові слова: ChatGPT, мережі понять, візуалізація графів, мережевий аналіз документів, модель домену, штучні експерти, інформаційне право.
Summary
The article describes a methodology for constructing networks of concepts related to legal documents and the subject area of “Information Law”. The methodology is based on the use of the artificial intelligence system ChatGPT and the Gephi network analysis and visualization program. The article demonstrates the possibility of constructing concept networks using ChatGPT, solving tasks that previously required large time and human resources. It shows how tools of intelligent text analytics and network analysis are integrated, as well as their visualization. The article proposes emulating multiple experts by repeatedly querying the ChatGPT system. The methodology can be applied to network analysis of documentary sources and the construction of subject area models.
Keywords: ChatGPT, Concept networks, Graph visualization, Book network analysis, Domain model, Artificial experts, Information law.
Вступ
Постановка проблеми. У сучасному світі здатність обробляти дані стала одним з найважливіших пріоритетів. Великі дані (Big Data) революціонізують наше розуміння світу, але екстрагування значущої інформації з такої величезної кількості даних є нелегкою задачею. Тут на допомогу приходять системи штучного інтелекту, зокрема, ChatGPT, що дозволяє користувачам ефективно обробляти та аналізувати масиви даних великих обсягів.
Метою статті є представлення нових можливостей обробки правової інформації із застосуванням систем штучного інтелекту, зокрема, ChatGPT, для вирішення задач семантичного аналізу та візуалізації, що дозволяє розглядати такі системи як корисний інструмент для аналізу правових документів, формування моделей предметних галузей.
Виклад основного матеріалу
Технологічне підґрунтя
Мережевий аналіз та візуалізація є важливими засобами для розуміння зв'язків між елементами даних та виявлення прихованих закономірностей, що може допомогти дослідникам оптимізувати свій робочий процес.
Для мережевого аналізу та візуалізації в поєднанні з системою ChatGPT можуть використовуватися сучасні інструменти, такі як Neo4j та Gephi. Neo4j є потужною графовою базою даних на сервері, яка дозволяє ефективно зберігати та обробляти великі обсяги пов'язаних даних. Більш орієнтований на користувача Gephi є інтерактивною персональною платформою, яка дозволяє легко досліджувати та візуалізувати складні мережі. Саме цим інструментом будуть демонструватися приклади в цій статті.
Ця робота присвячена опису методів формування семантичних мереж, онтологічних структур, пов'язаних з різними поняттями конкретного юридичного документа (Конституції США) та цілої предметної області “Інформаційне право”. Про значення таких мереж для науки та практики написано багато робіт, створені концепції, спеціальні програми та мови опису даних [1 - 2]. Методика дозволяє формувати мережі, графові структури, що мають різні топологічні ознаки: прості ненаправлені, зважені, направлені зважені, направлені з підписаними ребрами. І звичайно, методика базується на використанні системи ChatGPT, навченої лінгвістичної мережі, тому в статті не буде використано жодної формули чи явно прописаного розрахунку. Це саме те, про що писав колись С. Вольфрам, коли йшлося про клітинні автомати [3]. До речі, сьогодні він також багато пише про можливості ChatGPT [4]. Методика включає візуалізацію сформованих мереж. Для цього використовується програма Gephi (gephi.org) - найпопулярніша на сьогодні програма візуалізації графових структур з вільною ліцензією [5]. Для завантаження даних в середовище Gephi досить підходить формат CSV, тому всі запити до ChatGPT будуть супроводжуватися вимогою до формату.
Формування мережі понять із юридичного документу
Отже, в наших планах передбачено описання процедур формування мереж з різними властивостями. Перейдемо безпосередньо до опису задач та їх розв'язань. Ми покажемо, як формуються мережі понять на прикладі аналізу Конституції США. Слід зауважити, що не кожен документ був охоплений системою ChatGPT під час її навчання. Очевидно, що система “знає” документ такого масштабу. Для побудови мережі достатньо отримати файл у форматі CSV та завантажити його в програму Gephi.
Створення ненаправленої мережі
Для початку треба знати декілька, наприклад, 20 основних пар понять у тексті. Система ChatGPT може допомогти отримати вміст такого файлу у потрібному форматі (поля, які відповідають назвам понять, розділені крапкою з комою). Для цього можна застосувати, наприклад, такий запит до системи ChatGPT:
Prompt 1 (з англ. “підкажіть”) - Надайте мені 20 пар найважливіших зв'язаних понять із Конституції США. Кожна пара понять нехай видається у форматі “поняття 1; поняття 2”. Кожна така пара понять виводиться з нового рядка.
У результаті ChatGPT видає таку відповідь:
1. Федералізм; Державний суверенітет.
2. Конгрес; Сенат.
3. Представницький дім; Обрання президента.
4. Кабінет міністрів; Президент.
5. Верховний суд; Конституційні права.
6. Конституційні права; Законодавча влада.
7. Виконавча влада; Право вето.
8. Право вето; Конгрес.
9. Конституційні права; Судді.
10. Державний суверенітет; Законодавча влада.
Завантаживши отримані дані в систему Gephi, вибираємо розмір вузлів, пропорційний ступеню (кількості прилеглих зв'язків) і, розділивши мережу на кластери за критерієм модулярності, отримуємо наочний графік (Рис. 1).
Отже, перша мережа побудована і по ній видно, що центральну частину Конституції США займають “Законодавча влада” та “Конституційні права”, що загалом підтверджує правильність вибору понять системою ChatGPT.
Очевидно, сформована мережа слабко зв'язана і неповна. Вважатимемо, що це мережа, отримана в результаті опитування одного штучного експерта.
поняття право штучний інтелект
Емуляція багатьох експертів шляхом багаторазового виконання запиту
Система ChatGPT може видавати різні варіанти відповідей на текст у різні моменти обробки, причому всі вони можуть бути правильними з точки зору людської логіки. Кожен з таких варіантів можна сприймати як відповідь від окремого штучного експерта [6 - 7].
Рис. 1. Ненаправлена мережа 20 головних понять Конституції США за оцінкою програми ChatGPT
Можна припустити, що, поєднуючи відповіді багатьох подібних експертів, можна отримати більш повну та точну відповідь. Щоб забезпечити повноту набору понять (або їх пар), а також точність (незначні зв'язки матимуть малу вагу), можна скористатися можливістю запуску “рою” штучних агентів. Для цього можна запустити попередній запит декілька разів та об'єднати відповіді в агрегований CSV-файл. Мережу можна доповнювати до тих пір, поки вона не стане достатньо повною згідно з оцінками експерта-людини. Центральний фрагмент отриманої мережі після первинної обробки представлено на Рис. 2.
Формування мережі понять -- моделі предметної області
Мережу понять предметної області представимо у вигляді спрямованої зваженої мережі. У попередніх прикладах ми формували мережу понять, пов'язану із конкретним документом - Конституцією США, який, звичайно ж, охоплювався системою ChatGPT при її навчанні. Далі розглянемо завдання формування мережі понять, пов'язаних з цілою предметною областю. Очевидно, ChatGPT знає основні поняття з найважливіших предметних областей. Нас цікавить область інформаційного права, тому запитаємо у системи знайти 20 пар найпопулярніших понять з даної предметної галузі, пов'язаних між собою. При цьому визначимо відношення порядку - нехай перше поняття у парі буде загальнішим, ніж друге.
Запропонуємо системі ChatGPT виконати такий запит:
Prompt 2 -- Назвіть мені 20 пар важливих понять із галузі Інформаційного права. Перше слово нехай буде більш загальне, ніж друге. Кожна пара понять нехай видається у форматі “поняття 1; поняття 2”. Кожна така пара понять виводиться з нового рядка.
Рис. 2. Центральний фрагмент агрегованої мережі понять Конституції США
Зважаючи на широкий спектр галузей, що стосуються “Інформаційного права”, надамо список пар понять з різних підгалузей:
1. Конфіденційність інформації; захист персональних даних.
2. Авторське право; інтелектуальна власність.
3. Комп'ютерний злочин; кібербезпека.
4. Свобода слова; регулювання контенту в Інтернеті.
5. Право на доступ до інформації; прозорість влади.
6. Цифровий підпис; електронний документообіг.
7. Інформаційна безпека; захист від кібератак.
8. Електронна комерція; правила дистанційної торгівлі.
9. Антимонопольне законодавство; боротьба з монополіями в галузі ІТ.
10. Інтернет-права; регулювання використання Інтернету.
Емуляція багатьох експертів шляхом багаторазового повторення запиту
Як було показано раніше, при побудові мережі понять за Конституцією США, для забезпечення повноти та точності множини понять можна запустити “рій” штучних агентів. Для цього досить запустити наведений вище запит кілька разів і об'єднати відповіді. На Рис. 3 показано центральний фрагмент мережі понять, що відповідає предметній області “Інформаційне право” після завантаження агрегованих даних, багато разів отриманих від системи ChatGPT.
Рис. 3. Мережа понять з предметної галузі “Інформаційне право”
Висновки
У цій роботі:
1. Показано можливість використання ChatGPT для побудови концептуальних мереж, що має потенціал для значного скорочення ресурсів, які зазвичай потрібні для виконання цих завдань вручну. Крім того, ми показали, що інтеграція інструментів текстової аналітики та мережевого аналізу може виявитися дуже корисною для отримання інформації з великих обсягів неструктурованих даних.
2. Вперше запропоновано емуляцію “рою” експертів шляхом багаторазового виконання запиту до системи штучного інтелекту. Цей підхід може значно підвищити ефективність екстрагування знань і забезпечити глибше розуміння структури та значення окремих документів і цілих предметних областей.
3. Запропоновано методику, яка може застосовуватися для мережевого аналізу документів, побудови моделей різних предметних областей.
Ця робота демонструє практичне застосування передової технології штучного інтелекту для аналізу тексту в правовій галузі. На прикладах показано, як використання алгоритмів машинного навчання може допомогти розкрити приховані ідеї та закономірності в текстових даних.
Важливо зазначити, що цей підхід не позбавлений обмежень. Інтерпретація результатів вимагає досвіду в досліджуваній області, зокрема в галузі права, і все ще існує потреба в нагляді людини для забезпечення повноти і точності результатів.
Загалом очевидно, що штучний інтелект має величезний потенціал для трансформації сфери аналізу тексту та візуалізації мереж. Хоча існує ще багато проблем, які потрібно вирішити, це дослідження є певним кроком у розкритті можливостей технологій штучного інтелекту для глибшого розуміння знань, закладених в правові документи.
Використана література
1. Berners-Lee, T., Hendler, J., Lassila, O. The semantic web. Scientific American, 2001. Vol. 284. No. 5. Pp. 34-43.
2. Ланде Д.В., Дмитренко О.О. Побудова семантичних мереж та визначення ступеня розбіжності текстів. Інформація і право. № 2(41)/2022. С. 44-51.
3. Wolfram S. A New Kind of Science. Wolfram Media Inc. 2002. 1264 p.
4. Wolfram S. What Is ChatGPT Doing and Why Does it Work? Wolfram Media Inc. 2023. 112 p.
5. Cherven K. Mastering Gephi. Network Visualization. Packt Publishing. 2015. 378 p.
6. Mnih, V., Badia, A.P., Mirza, M., Graves, A., Lillicrap, T., Harley, T., Silver, D., Kavukcuoglu, K. Asynchronous methods for deep reinforcement learning. International Conference on Machine Learning. 2016. Bp. 1928-1937.
7. Silver, D., Huang, A., Maddison, C.J., Guez, A., Sifre, L., Van Den Driessche, G., Schrittwieser, J., Antonoglou, I., Panneershelvam, V., Lanctot, M. Mastering the game of go with deep neural networks and tree search. Nature, 529 (2016). Рр. 484-503.
Размещено на Allbest.ru
...Подобные документы
Застосування нейронних мереж при вирішенні різних технічних проблем. Архітектура штучних нейронних мереж. Дослідження штучного інтелекту. Гіпотеза символьних систем. Представлення за допомогою символів. Синтаксичний та семантичний аналіз розуміння мови.
курсовая работа [985,8 K], добавлен 14.01.2010Логічний, структурний, еволюційний та імітаційний підходи до побудови системи штучного інтелекту. Використання формально-логічних структур, що обумовлено їх алгоритмічним характером. Методи реалізації системи штучного інтелекту, інтелектуальні програми.
реферат [34,5 K], добавлен 14.04.2014Поняття штучного інтелекту, його порівняння з природним. Коротка характеристика особливостей використання штучного інтелекту в медицині, військовій справі та комп'ютерних іграх. Проблема взаємодії носіїв універсального штучного інтелекту та суспільства.
контрольная работа [29,6 K], добавлен 07.01.2014Особливості архітектури комп'ютерних мереж. Апаратні та програмні засоби комп'ютерних мереж, їх класифікація та характеристика. Структура та основні складові комунікаційних технологій мереж. Концепції побудови та типи функціонування комп'ютерних мереж.
отчет по практике [1,2 M], добавлен 12.06.2015Характеристика соціальних мереж та аналіз можливостей використання їх інформації для виявлення, розслідування злочинів. Значення соціальних мереж у процесі попередження кримінальних правопорушень. Зарубіжне правове регулювання Інтернет-простору.
статья [21,2 K], добавлен 31.08.2017Визначення поняття і дослідження структури топології комп'ютерних мереж як способу організації фізичних зв'язків персональних комп'ютерів в мережі. Опис схеми топології типів шина, зірка і кільце. Багатозначність структур топології комп'ютерних мереж.
реферат [158,1 K], добавлен 27.09.2012Історія створення комп’ютерних комунікацій та принципи їх побудови. Характеристика устаткування для створення комп’ютерних мереж. Поняття адресації, види протоколів, їх розвиток, комбінування та особливості використання. Стандарти бездротових мереж.
курс лекций [1,3 M], добавлен 04.06.2011Знайомство з основами побудови і функціонування комп'ютерних мереж, виділення їх особливостей і відмінностей. Характеристика основних способів побудови мереж. Розрахунок економічної ефективності впровадження корпоративної локальної обчислювальної мережі.
курсовая работа [275,0 K], добавлен 18.11.2014Структуризація комп’ютерних мереж. Принцип роботи повторювача. Класифікація мережних адаптерів. Включення віддаленого комп’ютера. Додаткові функції серверних адаптерів стандартів Gigabit Ethernet. Етапи прийняття кадру з кабелю. Мости мереж Ethernet.
лекция [3,7 M], добавлен 18.10.2013Інтуїтивне розуміння поняття "інтелект". Основні проблемні середовища штучного інтелекту. Проблема неточних і неповних знань. Тест Тьюринга і фатичний діалог. Метод комп’ютерної реалізації фатичного діалогу. Принцип віртуальної семантичної сітки.
курсовая работа [560,0 K], добавлен 27.12.2007Характеристика інструментів MatLab - пакету прикладних програм для числового аналізу. Основні функції та можливості програмного комплексу. Скриптова мова програмування. Побудова моделі штучної нейронної мережі за допомогою команди NNTool та її тестування.
лабораторная работа [215,8 K], добавлен 11.06.2015Класифікація комп'ютерних мереж. Забезпечення функціонування локальної мережі за допомогою сервера. Топологія локальної мережі. Оптоволоконний інтерфейс до розподілених даних FDDI. Бездротові технології Wi-Fi, Bluetooth, GPRS. Мережеві апаратні засоби.
реферат [561,2 K], добавлен 15.03.2013Апаратні та програмні засоби комп'ютерних мереж, необхідність об'єднання ПК у одне ціле - локальну обчислювальну мережу. Вимоги, які висуваються до сучасних технологій обміну даними. Середовище обміну, канали, пристрої передавання та приймання даних.
реферат [549,2 K], добавлен 18.03.2010Особливості процесів гнучких виробничих систем з погляду функціонування. Визначення поняття мережі Петрі як двочасткового орієнтованого графа, способи її розмітки. Принципи розширення стандартів мереж Петрі: використання часу, рішення конфлікту переходів.
контрольная работа [479,9 K], добавлен 17.11.2010Часовий ряд як сукупність значень будь-якого показника за декілька послідовних моментів або періодів часу. Знайомство з методами для прогнозування часового ряду за допомогою штучних нейронних мереж. Розгляд головних задач дослідження часового ряду.
контрольная работа [1,1 M], добавлен 14.09.2014Історія досліджень, пов’язаних з розпізнаванням образів, його практичне використання. Методи розпізнавання образів: метод перебору, глибокий аналіз характеристик образу, використання штучних нейронних мереж. Характерні риси й типи завдань розпізнавання.
реферат [61,7 K], добавлен 23.12.2013Технологічні процеси складання, монтажу, налагодження і тестування комп'ютерних мереж між двома чи більше комп'ютерами. Функціонування локальної обчислювальної мережі. Офісні програмні продукти з пакету MS Office. Топологія мережі підприємства "зірка".
отчет по практике [1,5 M], добавлен 28.08.2014Історія розвитку соціальних мереж, їх класифікація за тематикою. Інтернетизація як інструмент маніпуляції та провокації для впливу на масову свідомість. Етапи та тактики ведення інформаційної війни. Роль соціальних Інтернет-мереж у житті суспільства.
реферат [19,7 K], добавлен 04.12.2014Класифікація мереж залежно від призначення та кола користувачів, визначена законодавством України. Порівняльна характеристика систем автоматизації роботи з документами. Переваги використання комп'ютерних технологій при проведенні судової експертизи.
контрольная работа [47,7 K], добавлен 20.07.2011Аналіз фізичної організації передачі даних по каналах комп'ютерних мереж, топологія фізичних зв'язків та організація їх сумісного використання. Методи доступу до каналів, настроювання мережевих служб для здійснення авторизації доступу до мережі Інтернет.
дипломная работа [2,6 M], добавлен 12.09.2010