Разработка средств автоматизации расширения онтологии на основе данных интернет-источников

Анализ существующих алгоритмов расширения онтологии. Обоснование необходимости пополнения существующей онтологии, анализ основных методов пополнения онтологии: вручную, интеграция двух существующих онтологий и автоматическое пополнение онтологии.

Рубрика Экономико-математическое моделирование
Вид дипломная работа
Язык русский
Дата добавления 28.10.2019
Размер файла 1,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Было проведено проектирование данного алгоритма для последующей реализации его в разрабатываемой системе. Наглядное представление работы алгоритма описано диаграммой нотации «Процесс». Для реализации данного алгоритма в разрабатываемой системе была подробно описана структура посредством псевдокода.

Для анализа текста был рассмотрен текущий источник данных для поиска информации по пользовательскому запросу. Выяснилось, что новостной раздел Google изменился и в настоящий момент предоставляет короткую аннотацию статьи, что не позволяет провести подробный анализ текста. В результате анализа источников данных было решено изменить используемый новостной источник и вести работу с сайтом РБК.

Учитывая особенности разрабатываемой системы, отдельно были рассмотрены возможности интегрирования спроектированного алгоритма в разрабатываемую систему.

Были изучены инструменты, позволяющие реализовать алгоритм автоматического пополнения онтологии. В данной работе используются язык программирования JavaScript и WebStorm IDE, поскольку разработка системы мониторинга глобальных процессов прошлого года велась с использованием данных инструментов. Для парсинга данных также используется библиотека NightMare, для SPARQL-запросов - библиотека SPARQL.js. Отдельно была внедрена библиотека для поиска ключевых слов в текстах - retext-keywords. Был разработан алгоритм поиска часто встречаемых ключевых слов в онтологии и проверка наличия данных слов в онтологии.

Разработка алгоритма автоматического пополнения онтологии позволит поддерживать используемую онтологию в актуальном состоянии, благодаря чему система предоставляет пользователю более подробную информацию о процессе.

Библиографический список

Вохминцева Т.В. Именование: нравственно-ценностные аспекты / Т.В. Вохнинцева, А.Е. Зимбули // Общество. Среда. Развитие (Terra Humana). 2014. № 33 (4). C. 135-138.

Ланин В.В. Мониторинг глобальных процессов на основе данных из интернет-новостей / В.В. Ланин, И.М. Шаляева, А.Ю. Скурихина. Пермь: Издательство Пермского государственного национального исследовательского университета, 2017. С. 67-70.

Липкин Ю.Г. Обзор современных поисковых систем: архитектура, инструменты поиска /Ю.Г. Липкин // Врач и информационные технологии. 2009. C. 40-44.

Шаляева И.М. Мониторинг экологических катастроф и их последствий на основе Internet-новостей / И.М. Шаляева. Таганрог: Издательство ЮФУ, 2016. С. 116-123.

Шаляева И.М. О проекте разработки системы мониторинга глобальных процессов на основе Интернет-новостей / И.М. Шаляева, В.В. Ланин, Л.Н. Лядова. Таганрог: Издательство ЮФУ, 2016. С. 166-170.

Hong J.L. Deep web data extraction / J.L. Hong // Systems Man and Cybernetics (SMC). 2010.

Shalyaeva I. Ontology-Driven System for Monitoring Global Processes on Basis of Internet News / I. Shalyaeva, V. Lanin, L. Lyadova // 11th IEEE International Conference on Application of Information and Communication Technologies (AICT), 2017. С. 385-389.

Simon-Nagy G. Ontology Extension for Personalized Accessible Indoor Navigation / G. Simon-Nagy, R. Fleiner // Springer International Publishing, 2018. С. 281-288.

StackOverflow Developer Survey Results [Электронный ресурс]. URL: https://insights.stackoverflow.com/survey/2018 (дата обращения: 03.03.2019).

Lanin V. Intelligent search and automatic document classification and cataloging based on ontology approach / V. Lanin, L. Lyadova // Information Theories & Applications. 2007. (14). C. 25-29.

Zhang D. Ontology Extension Based on Axiomatic Cognitive Model for Ontology Learning / D. Zhang // IEEE International Conference on Computer and Communications. 2016. С. 825-829.

Zhou Y. The Research of Concept Extraction in Ontology Extension Based on Extended Association Rules / Y. Zhou, L. Zhang, and S. Niu // Proceedings of ICOACS. 2016. С. 111-114.

РБК [Электронный ресурс]. URL: https://www.rbc.ru/ (дата обращения: 12.03.2019).

Техноблог [Электронный ресурс]. URL: https://teknoblog.ru/ (дата обращения: 12.03.2019).

Forbes [Электронный ресурс]. URL: https://www.forbes.ru/ (дата обращения: 12.03.2019).

Nighmare [Электронный ресурс]. URL: https://github.com/segmentio/nightmare (дата обращения: 11.03.2018).

Node.js [Электронный ресурс]. URL: https://nodejs.org/en/ (дата обращения: 10.03.2018).

Node-rake [Электронный ресурс]. URL: https://github.com/waseem18/node-rake/ (дата обращения: 25.03.2019).

NPM [Электронный ресурс]. URL: https://www.npmjs.com/ (дата обращения: 10.03.2018).

RapidMiner [Электронный ресурс]. URL: https://rapidminer.com/ (дата обращения: 10.02.2018).

REGNUM [Электронный ресурс]. URL: https://regnum.ru/ (дата обращения: 12.03.2019).

Retext-keywords [Электронный ресурс]. URL: https://github.com/retextjs/retext-keywords (дата обращения: 25.03.2019).

SPARQL.js [Электронный ресурс]. URL: https://github.com/RubenVerborgh/SPARQL.js/ (дата обращения: 11.03.2018).

Visual Studio [Электронный ресурс]. URL: https://www.visualstudio.com/ (дата обращения: 05.03.2018).

WebStorm [Электронный ресурс]. URL: https://www.jetbrains.com/webstorm/ (дата обращения: 05.03.2018).

World Wide Web Consortium (W3C) [Электронный ресурс]. URL: https://www.w3.org/ (дата обращения: 12.03.2019).

Размещено на Allbest.ru

...

Подобные документы

  • Обоснование решений в конфликтных ситуациях. Теория игр и статистических решений. Оценка эффективности проекта по критерию ожидаемой среднегодовой прибыли. Определение результирующего ранжирования критериев оценки вариантов приобретения автомобиля.

    контрольная работа [99,9 K], добавлен 21.03.2014

  • Разработка и исследование эконометрических методов с учетом специфики экономических данных и в соответствии с потребностями экономической науки и практики. Применение эконометрических методов и моделей для статистического анализа экономических данных.

    реферат [43,1 K], добавлен 10.01.2009

  • Подходы к оценке стоимости финансовых активов в рамках линейной и нелинейной парадигмы. Анализ фрактальных свойств американского фондового рынка. Разработка методики расчета параметров модели Веге-Изинга, построенной на основе гипотезы когерентных рынков.

    дипломная работа [2,3 M], добавлен 13.12.2010

  • Изучение методов моделирования и анализа панельных данных. Построение ABC-XYZ классификации среди данных широкой номенклатуры по товарным запасам торгового предприятия. Виды исходных данных и построение на их основе модели регрессии по панельным данным.

    курсовая работа [363,2 K], добавлен 23.02.2015

  • Изучение существующих исследований по постановке загадки премии по акциям и способам ее решения. Расчет коэффициента неприятия риска и сравнение его значения для США и России. Построение модели с учетом привычки агента и применение к ней метода GMM.

    дипломная работа [1,3 M], добавлен 08.02.2017

  • Графический и содержательный анализ данных об объеме рынка бытовой техники на основе методов прогнозирования: сравнение прогнозных и реальных значений, оценка адекватности и точности модели. Построение прогноза на год и расчет прогнозируемого дохода.

    курсовая работа [245,2 K], добавлен 29.04.2011

  • Показатели наличия и структуры основных средств, виды их оценки. Показатели состояния и динамики основных производственных фондов. Показатели использования основных средств. Статистический анализ динамики использования основных средств. Индекс Струмилина.

    курсовая работа [88,1 K], добавлен 25.02.2013

  • Анализ рентабельности активов как отношения чистой прибыли к среднему значению совокупных активов. Вертикальный анализ актива бухгалтерского баланса ПАО "ВЕРОФАРМ". Тестирование существующих моделей ROA на выборке российских фармацевтических компаний.

    дипломная работа [728,1 K], добавлен 09.09.2016

  • Освоение методики организации и проведения выборочного наблюдения; статистических методов и методов компьютерной обработки информации; методов оценки параметров генеральной совокупности на основе выборочных данных. Проверка статистических гипотез.

    лабораторная работа [258,1 K], добавлен 13.05.2010

  • Исследование детерминированной модели управления запасами без дефицита. Примеры ее реализации. Поиск пополнения и расхода запасов, при которой функция затрат принимает минимальное значение. Информационные технологии для моделирования экономической задачи.

    курсовая работа [2,0 M], добавлен 01.06.2010

  • Автоматизация производства как основа развития современной промышленности, генеральное направление технического прогресса, ее цели и задачи, выбор и обоснование метода. Определение организационно-штатной структуры предприятия, план его автоматизации.

    курсовая работа [180,7 K], добавлен 28.01.2014

  • Построение структурно-функциональной диаграммы функционирования предприятия "AS IS". Анализ существующей модели функционирования предприятия и выявление недостатков. Построение структурно-функциональной диаграммы функционирования предприятия "TO BE".

    курсовая работа [1,1 M], добавлен 21.01.2015

  • Систематизация существующих методов и моделей управления портфельными инвестициями. Ограничения их использования в условиях экономики России на фондовом рынке. Рыночные риски при инвестировании оборотного капитала в закупку материальных ресурсов.

    автореферат [75,3 K], добавлен 24.12.2009

  • Архитектура интегрированных информационных систем ARIS как методология моделирования бизнес-процессов. Преимущества и недостатки существующих аналогов. Выбор и обоснование типов диаграмм, используемых для описания бизнес-процесса средствами ARIS.

    дипломная работа [1,8 M], добавлен 03.12.2014

  • Понятие, состав и структура основных фондов. Показатели износа и годности основных средств. Амортизационные отчисления: понятие, цели, задачи. Экономико-статистический анализ наличия и состояния основных фондов организаций Волгоградской области.

    контрольная работа [29,8 K], добавлен 07.06.2015

  • Количественное обоснование управленческих решений по улучшению состояния экономических процессов методом математических моделей. Анализ оптимального решения задачи линейного программирования на чувствительность. Понятие многопараметрической оптимизации.

    курсовая работа [4,2 M], добавлен 20.04.2015

  • Рассмотрение процедуры регрессионного анализа на основе данных (цена продажи и жилая площадь) о 23 объектах недвижимости. Расчет параметров уравнения линейной регрессии и проверка его адекватности исследуемому процессу (используя приложение MS Exсel).

    лабораторная работа [1,2 M], добавлен 13.03.2014

  • Планирование выплаты кредита "постнуменрандо" (равными долями). Разработка финансовых решений по срокам и объемам выплат денежных средств. Выполнение двух лабораторных работ с помощью электронных таблиц Excel. Подбор самого экономичного варианта обучения.

    контрольная работа [18,1 K], добавлен 04.11.2009

  • Классификационные принципы методов прогнозирования: фактографические, комбинированные и экспертные. Разработка приёмов статистического наблюдения и анализа данных. Практическое применение методов прогнозирования на примере метода наименьших квадратов.

    курсовая работа [77,5 K], добавлен 21.07.2013

  • Обоснование целесообразности применения статистических данных в анализе устойчивого развития региона. Сбор, обработка статистических данных по основным секторам Кемеровской области. Оценка их полноты и качества. Принципы построения математической модели.

    дипломная работа [2,6 M], добавлен 30.05.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.