Методи та моделі семантичного анотування текстових документів з використанням штучних нейронних мереж

Розробка моделі семантичного анотування текстових документів з урахуванням бінарних виходів штучної нейронної мережі та ймовірнісної моделі семантичного анотування для формування RDF-описів. Функції інструментальних засобів вирішення прикладних задач.

Рубрика Программирование, компьютеры и кибернетика
Вид автореферат
Язык украинский
Дата добавления 19.06.2018
Размер файла 502,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Во втором разделе получила дальнейшее развитие модель семантического аннотирования на основе бинарных выходов искусственной нейронной сети, которая отличается от моделей описания семантических аннотаций на основе RDF-структур использованием информации с выходов искусственной нейронной сети, что позволило учитывать ее при формировании семантических аннотаций текстовых документов.

Впервые предложена иерархическая радиально-базисная нейронная сеть с многослойной архитектурой, которая в каждом узле использует радиально-базисную нейронную сеть сниженной размерности, что позволяет сократить количество признаков, которые поступают на вход каждого слоя при ограниченной обучающей выборке для формирования семантических аннотаций текстовых документов. Метод семантического аннотирования на основе данной искусственной нейронной сети позволяет решить проблему извлечения знаний из текстовых источников с учетом максимального числа релевантных признаков для построения семантических аннотаций текстовых документов узкоспециализированной предметной области, предусматривает возможность обработки информации по мере ее поступления в последовательном режиме, характеризуется простотой реализации.

В третьем разделе впервые предложена вероятностная модель семантического аннотирования на основе моделей описания семантических аннотаций RDF-структур и вероятностных нейронных сетей специального вида, которая позволяет формировать метаданные текстовых документов с учетом вероятностей принадлежности текстового объекта к текущему концепту онтологии предметной области. Таким образом, проводится оценка вероятности принадлежности текстовых данных относительно текущей онтологии и формируется включение этих знаний в машинно-понятное описание.

Впервые предложены вероятностные нейронные сети специального вида, а именно: модифицированная и конкурентная, представляющие собой гибриды стандартной вероятностной и обобщенной регрессионной нейронных сетей, а также самоорганизующихся карт Кохонена. Разработанные специализированные искусственные нейронные сети позволяют определить вероятности принадлежности входного текстового объекта к каждому из возможных классов онтологии предметной области. Для автоматической настройки значения ширины активационной функции введены латеральные связи между группами классов в слое образов. Таким образом, становится возможным определить более точные значения вероятностей принадлежности входящего текстового объекта к каждому из потенциально возможных классов онтологии предметной области. Методы семантического аннотирования на основе предложенных вероятностных нейронных сетей позволяют обрабатывать текстовые документы в последовательном режиме по мере их поступления, а также обеспечивают простоту реализации и высокую скорость обработки информации.

Проведено экспериментальное моделирование по решению ряда практических задач, на основе которых показана эффективность использования предложенных моделей и методов семантического аннотирования текстовых документов, которые являются средством представления текстовой информации в машинно-понятном виде, а также основой для разработки и внедрения средств принятия решений. Они могут быть использованы не только в задаче семантического аннотирования текстовых документов, но и в других областях, где могут быть применены методы интеллектуального анализа данных.

Ключевые слова: семантическая аннотация, искусственные нейронные сети, методы обучения, вероятность принадлежности, многослойная архитектура.

ABSTRACT

Shubkina O.V. Semantic annotation of text documents' methods and models using artificial neural networks. - Manuscript.

The thesis for the candidate degree in technical sciences on the specialty 05.13.23 - systems and tools of artificial intelligence. - Kharkiv National University of Radio Electronics, Kharkiv, 2011.

The thesis is devoted to developing methods and models for semantic annotation of text documents using artificial neural networks.

The problem of semantic annotation for text documents, the main methods of text processing to form the semantic annotations, the main advantages and disadvantages of these approaches are investigated. Hierarchical radial-basis function neural network with a multilayered architecture, which uses the same type of each node in the radial basic function neural network, thus reducing the number of attributes that to the input of each layer with a limited training set to generate semantic annotation of text documents is developed.

Probabilistic neural networks, a special form, namely, modified and competition, are developed as a hybrid of the standard probabilistic and generalized regression neural networks, as well as self-organizing Kohonen maps. It can determine the probability of belonging for the input text object to each of the possible classes of the domain ontology, handle text documents in sequential mode, as they become available, and provide easy of implementation and speed of information processing. Binary and probabilistic semantic annotation models used information from the text processing by artificial neural networks are developed.

Experiments of range of real-world problems solving are carried out. Effectiveness of the proposed semantic annotation models and methods application is shown on their basis.

Key words: semantic annotation, artificial neural networks, learning methods, the probability belonging, multilayered architecture.

Размещено на Allbest.ru

...

Подобные документы

  • Навчання штучних нейронних мереж, особливості їх використання для вирішення практичних завдань. Рецепторна структура сприйняття інформації. Перцептрон як модель розпізнавання. Задача моделювання штучної нейронної мережі з розпаралелюванням процесів.

    дипломная работа [2,8 M], добавлен 24.07.2013

  • Характеристика інструментів MatLab - пакету прикладних програм для числового аналізу. Основні функції та можливості програмного комплексу. Скриптова мова програмування. Побудова моделі штучної нейронної мережі за допомогою команди NNTool та її тестування.

    лабораторная работа [215,8 K], добавлен 11.06.2015

  • Специфіка застосування нейронних мереж. Огляд програмних засобів, що використовують нейронні мережі. Побудова загальної моделі згорткової нейронної мережі. Реалізація нейромережного модулю розпізнавання символів на прикладі номерних знаків автомобілів.

    дипломная работа [3,4 M], добавлен 15.03.2022

  • Загальні відомості про текстовий процесор, інтерфейс програми та інсталяція, елементи керування і налаштування панелі швидкого доступу. Робота з документами, введення тексту та відкриття файлів, створення документів, захист і збереження текстових файлів.

    дипломная работа [11,6 M], добавлен 26.05.2012

  • Загальні факти про комп’ютерні ігри. Розгляд основ розробки програмного (джерельного) коду, контенту (малюнки, моделі, музика) та ігрових механік гри "Три стакани". Правила використанням засобів WinAPI. Створення математичної моделі алгоритму програми.

    курсовая работа [405,6 K], добавлен 09.06.2015

  • Ознайомлення із загальною структурою системи автоматичного розпізнавання мовлення. Визначення особливостей нейронних мереж. Дослідження та характеристика процесу побудови системи розпізнавання мовлення. Вивчення специфіки прихованої моделі Маркова.

    дипломная работа [1,1 M], добавлен 25.07.2022

  • Суть, значення і види наукової обробки документів. Обов'язкова державна реєстрація книжкових пам'яток. Інформаційно-пошукові системи, їх види. Опис змісту документа за допомогою дескрипторів. Анотування і реферування як вид інформаційної діяльності.

    курсовая работа [44,7 K], добавлен 22.11.2010

  • Застосування нейронних мереж при вирішенні різних технічних проблем. Архітектура штучних нейронних мереж. Дослідження штучного інтелекту. Гіпотеза символьних систем. Представлення за допомогою символів. Синтаксичний та семантичний аналіз розуміння мови.

    курсовая работа [985,8 K], добавлен 14.01.2010

  • Проблема порушення авторських прав в Інтернеті. Системи та сервіси пошуку плагіату. Захист електронних видань від плагіату в Інтернеті. Алгоритми аналізу, подання і порівняння текстової інформації. Вибір методу пошуку текстових документів з запозиченнями.

    магистерская работа [1,0 M], добавлен 14.06.2013

  • Теоретичні основи та приклади економічних задач лінійного програмування. Розробка математичної моделі задачі (запис цільової функції і системи обмежень) і програмного забезпечення її вирішення за допомогою "Пошуку рішень" в Excel симплекс-методом.

    курсовая работа [993,9 K], добавлен 10.12.2010

  • Характеристика особливостей побудови біологічних та штучних нейронних мереж. Вивчення їх активіаційних функцій: порогової бінарної, лінійної обмеженої, гіперболічного тангенса. Персептрони і зародження штучних нейромереж. Багатошарові нейронні мережі.

    реферат [1,2 M], добавлен 11.06.2010

  • Аналіз відомих підходів до проектування баз даних. Ієрархічна, мережева та реляційна моделі представлення даних, їх особливості. Концептуальне проектування: приклад документів, побудова ER-діаграми, модель "сутність-зв'язок". Побудова фізичної моделі.

    курсовая работа [541,5 K], добавлен 29.01.2013

  • Топології нейронної мережі та їх застосування, варіанти вибору архітектури мереж, число проміжних шарів і число елементів, архітектури мереж користувачів. Мережі для задач з багатьма класами, операція додавання матриці втрат, багатошаровий перцептрон.

    контрольная работа [227,3 K], добавлен 21.06.2011

  • Формалізація моделі виробничої діяльності підприємства. Рішення за допомогою Excel. Алгоритм розрахунку моделі. Побудова моделі рішення за допомогою "С++". Знаходження оптимальної програми функціонування підприємства. Розробка коду програми.

    контрольная работа [720,1 K], добавлен 12.06.2015

  • Часовий ряд як сукупність значень будь-якого показника за декілька послідовних моментів або періодів часу. Знайомство з методами для прогнозування часового ряду за допомогою штучних нейронних мереж. Розгляд головних задач дослідження часового ряду.

    контрольная работа [1,1 M], добавлен 14.09.2014

  • Аналіз відомих підходів до проектування баз даних. Моделі "сутність-зв'язок". Ієрархічна, мережева та реляційна моделі представлення даних. Організація обмежень посилальної цілісності. Нормалізація відносин. Властивості колонок таблиць фізичної моделі.

    курсовая работа [417,6 K], добавлен 01.02.2013

  • Основні можливості створення та редагування документів в текстовому редакторі Microsoft Word. Вставка спеціальних символів, табуляція, створення списків, колонок та буквиці за допомогою програми. Особливості та правила оформлення текстових документів.

    курсовая работа [795,8 K], добавлен 06.07.2011

  • Робота з текстовим редактором Word для створення документів, що містять текст, маркіровані та нумеровані списки, малюнки, схеми, таблиці, графіки. Використання "художніх" шрифтів, об'єктів WordArt, автофігур. Етапи створення структурованих документів.

    лабораторная работа [326,6 K], добавлен 21.12.2011

  • Microsoft Word – текстовий редактор для створення і редагування текстових документів. Листи і факси, записки і звіти, публікації і web-сторінки - далеко не повний перелік документів, з якими користувач може працювати за допомогою Microsoft Word.

    курсовая работа [95,9 K], добавлен 18.05.2008

  • Порядок створення нового документа в текстовому редакторі. Виділення окремих елементів документу( слова, рядка, тощо). Використання програми Блокнот. Переваги редактора Google Documents. Значення та можливості створення документів та текстових редакторів.

    презентация [434,9 K], добавлен 17.05.2019

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.