Разработка средств автоматизации расширения онтологии на основе данных интернет-источников
Анализ существующих алгоритмов расширения онтологии. Обоснование необходимости пополнения существующей онтологии, анализ основных методов пополнения онтологии: вручную, интеграция двух существующих онтологий и автоматическое пополнение онтологии.
Рубрика | Экономико-математическое моделирование |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 28.10.2019 |
Размер файла | 1,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Было проведено проектирование данного алгоритма для последующей реализации его в разрабатываемой системе. Наглядное представление работы алгоритма описано диаграммой нотации «Процесс». Для реализации данного алгоритма в разрабатываемой системе была подробно описана структура посредством псевдокода.
Для анализа текста был рассмотрен текущий источник данных для поиска информации по пользовательскому запросу. Выяснилось, что новостной раздел Google изменился и в настоящий момент предоставляет короткую аннотацию статьи, что не позволяет провести подробный анализ текста. В результате анализа источников данных было решено изменить используемый новостной источник и вести работу с сайтом РБК.
Учитывая особенности разрабатываемой системы, отдельно были рассмотрены возможности интегрирования спроектированного алгоритма в разрабатываемую систему.
Были изучены инструменты, позволяющие реализовать алгоритм автоматического пополнения онтологии. В данной работе используются язык программирования JavaScript и WebStorm IDE, поскольку разработка системы мониторинга глобальных процессов прошлого года велась с использованием данных инструментов. Для парсинга данных также используется библиотека NightMare, для SPARQL-запросов - библиотека SPARQL.js. Отдельно была внедрена библиотека для поиска ключевых слов в текстах - retext-keywords. Был разработан алгоритм поиска часто встречаемых ключевых слов в онтологии и проверка наличия данных слов в онтологии.
Разработка алгоритма автоматического пополнения онтологии позволит поддерживать используемую онтологию в актуальном состоянии, благодаря чему система предоставляет пользователю более подробную информацию о процессе.
Библиографический список
Вохминцева Т.В. Именование: нравственно-ценностные аспекты / Т.В. Вохнинцева, А.Е. Зимбули // Общество. Среда. Развитие (Terra Humana). 2014. № 33 (4). C. 135-138.
Ланин В.В. Мониторинг глобальных процессов на основе данных из интернет-новостей / В.В. Ланин, И.М. Шаляева, А.Ю. Скурихина. Пермь: Издательство Пермского государственного национального исследовательского университета, 2017. С. 67-70.
Липкин Ю.Г. Обзор современных поисковых систем: архитектура, инструменты поиска /Ю.Г. Липкин // Врач и информационные технологии. 2009. C. 40-44.
Шаляева И.М. Мониторинг экологических катастроф и их последствий на основе Internet-новостей / И.М. Шаляева. Таганрог: Издательство ЮФУ, 2016. С. 116-123.
Шаляева И.М. О проекте разработки системы мониторинга глобальных процессов на основе Интернет-новостей / И.М. Шаляева, В.В. Ланин, Л.Н. Лядова. Таганрог: Издательство ЮФУ, 2016. С. 166-170.
Hong J.L. Deep web data extraction / J.L. Hong // Systems Man and Cybernetics (SMC). 2010.
Shalyaeva I. Ontology-Driven System for Monitoring Global Processes on Basis of Internet News / I. Shalyaeva, V. Lanin, L. Lyadova // 11th IEEE International Conference on Application of Information and Communication Technologies (AICT), 2017. С. 385-389.
Simon-Nagy G. Ontology Extension for Personalized Accessible Indoor Navigation / G. Simon-Nagy, R. Fleiner // Springer International Publishing, 2018. С. 281-288.
StackOverflow Developer Survey Results [Электронный ресурс]. URL: https://insights.stackoverflow.com/survey/2018 (дата обращения: 03.03.2019).
Lanin V. Intelligent search and automatic document classification and cataloging based on ontology approach / V. Lanin, L. Lyadova // Information Theories & Applications. 2007. (14). C. 25-29.
Zhang D. Ontology Extension Based on Axiomatic Cognitive Model for Ontology Learning / D. Zhang // IEEE International Conference on Computer and Communications. 2016. С. 825-829.
Zhou Y. The Research of Concept Extraction in Ontology Extension Based on Extended Association Rules / Y. Zhou, L. Zhang, and S. Niu // Proceedings of ICOACS. 2016. С. 111-114.
РБК [Электронный ресурс]. URL: https://www.rbc.ru/ (дата обращения: 12.03.2019).
Техноблог [Электронный ресурс]. URL: https://teknoblog.ru/ (дата обращения: 12.03.2019).
Forbes [Электронный ресурс]. URL: https://www.forbes.ru/ (дата обращения: 12.03.2019).
Nighmare [Электронный ресурс]. URL: https://github.com/segmentio/nightmare (дата обращения: 11.03.2018).
Node.js [Электронный ресурс]. URL: https://nodejs.org/en/ (дата обращения: 10.03.2018).
Node-rake [Электронный ресурс]. URL: https://github.com/waseem18/node-rake/ (дата обращения: 25.03.2019).
NPM [Электронный ресурс]. URL: https://www.npmjs.com/ (дата обращения: 10.03.2018).
RapidMiner [Электронный ресурс]. URL: https://rapidminer.com/ (дата обращения: 10.02.2018).
REGNUM [Электронный ресурс]. URL: https://regnum.ru/ (дата обращения: 12.03.2019).
Retext-keywords [Электронный ресурс]. URL: https://github.com/retextjs/retext-keywords (дата обращения: 25.03.2019).
SPARQL.js [Электронный ресурс]. URL: https://github.com/RubenVerborgh/SPARQL.js/ (дата обращения: 11.03.2018).
Visual Studio [Электронный ресурс]. URL: https://www.visualstudio.com/ (дата обращения: 05.03.2018).
WebStorm [Электронный ресурс]. URL: https://www.jetbrains.com/webstorm/ (дата обращения: 05.03.2018).
World Wide Web Consortium (W3C) [Электронный ресурс]. URL: https://www.w3.org/ (дата обращения: 12.03.2019).
Размещено на Allbest.ru
...Подобные документы
Обоснование решений в конфликтных ситуациях. Теория игр и статистических решений. Оценка эффективности проекта по критерию ожидаемой среднегодовой прибыли. Определение результирующего ранжирования критериев оценки вариантов приобретения автомобиля.
контрольная работа [99,9 K], добавлен 21.03.2014Разработка и исследование эконометрических методов с учетом специфики экономических данных и в соответствии с потребностями экономической науки и практики. Применение эконометрических методов и моделей для статистического анализа экономических данных.
реферат [43,1 K], добавлен 10.01.2009Подходы к оценке стоимости финансовых активов в рамках линейной и нелинейной парадигмы. Анализ фрактальных свойств американского фондового рынка. Разработка методики расчета параметров модели Веге-Изинга, построенной на основе гипотезы когерентных рынков.
дипломная работа [2,3 M], добавлен 13.12.2010Изучение методов моделирования и анализа панельных данных. Построение ABC-XYZ классификации среди данных широкой номенклатуры по товарным запасам торгового предприятия. Виды исходных данных и построение на их основе модели регрессии по панельным данным.
курсовая работа [363,2 K], добавлен 23.02.2015Изучение существующих исследований по постановке загадки премии по акциям и способам ее решения. Расчет коэффициента неприятия риска и сравнение его значения для США и России. Построение модели с учетом привычки агента и применение к ней метода GMM.
дипломная работа [1,3 M], добавлен 08.02.2017Графический и содержательный анализ данных об объеме рынка бытовой техники на основе методов прогнозирования: сравнение прогнозных и реальных значений, оценка адекватности и точности модели. Построение прогноза на год и расчет прогнозируемого дохода.
курсовая работа [245,2 K], добавлен 29.04.2011Показатели наличия и структуры основных средств, виды их оценки. Показатели состояния и динамики основных производственных фондов. Показатели использования основных средств. Статистический анализ динамики использования основных средств. Индекс Струмилина.
курсовая работа [88,1 K], добавлен 25.02.2013Анализ рентабельности активов как отношения чистой прибыли к среднему значению совокупных активов. Вертикальный анализ актива бухгалтерского баланса ПАО "ВЕРОФАРМ". Тестирование существующих моделей ROA на выборке российских фармацевтических компаний.
дипломная работа [728,1 K], добавлен 09.09.2016Освоение методики организации и проведения выборочного наблюдения; статистических методов и методов компьютерной обработки информации; методов оценки параметров генеральной совокупности на основе выборочных данных. Проверка статистических гипотез.
лабораторная работа [258,1 K], добавлен 13.05.2010Исследование детерминированной модели управления запасами без дефицита. Примеры ее реализации. Поиск пополнения и расхода запасов, при которой функция затрат принимает минимальное значение. Информационные технологии для моделирования экономической задачи.
курсовая работа [2,0 M], добавлен 01.06.2010Автоматизация производства как основа развития современной промышленности, генеральное направление технического прогресса, ее цели и задачи, выбор и обоснование метода. Определение организационно-штатной структуры предприятия, план его автоматизации.
курсовая работа [180,7 K], добавлен 28.01.2014Построение структурно-функциональной диаграммы функционирования предприятия "AS IS". Анализ существующей модели функционирования предприятия и выявление недостатков. Построение структурно-функциональной диаграммы функционирования предприятия "TO BE".
курсовая работа [1,1 M], добавлен 21.01.2015Систематизация существующих методов и моделей управления портфельными инвестициями. Ограничения их использования в условиях экономики России на фондовом рынке. Рыночные риски при инвестировании оборотного капитала в закупку материальных ресурсов.
автореферат [75,3 K], добавлен 24.12.2009Архитектура интегрированных информационных систем ARIS как методология моделирования бизнес-процессов. Преимущества и недостатки существующих аналогов. Выбор и обоснование типов диаграмм, используемых для описания бизнес-процесса средствами ARIS.
дипломная работа [1,8 M], добавлен 03.12.2014Понятие, состав и структура основных фондов. Показатели износа и годности основных средств. Амортизационные отчисления: понятие, цели, задачи. Экономико-статистический анализ наличия и состояния основных фондов организаций Волгоградской области.
контрольная работа [29,8 K], добавлен 07.06.2015Количественное обоснование управленческих решений по улучшению состояния экономических процессов методом математических моделей. Анализ оптимального решения задачи линейного программирования на чувствительность. Понятие многопараметрической оптимизации.
курсовая работа [4,2 M], добавлен 20.04.2015Рассмотрение процедуры регрессионного анализа на основе данных (цена продажи и жилая площадь) о 23 объектах недвижимости. Расчет параметров уравнения линейной регрессии и проверка его адекватности исследуемому процессу (используя приложение MS Exсel).
лабораторная работа [1,2 M], добавлен 13.03.2014Планирование выплаты кредита "постнуменрандо" (равными долями). Разработка финансовых решений по срокам и объемам выплат денежных средств. Выполнение двух лабораторных работ с помощью электронных таблиц Excel. Подбор самого экономичного варианта обучения.
контрольная работа [18,1 K], добавлен 04.11.2009Классификационные принципы методов прогнозирования: фактографические, комбинированные и экспертные. Разработка приёмов статистического наблюдения и анализа данных. Практическое применение методов прогнозирования на примере метода наименьших квадратов.
курсовая работа [77,5 K], добавлен 21.07.2013Обоснование целесообразности применения статистических данных в анализе устойчивого развития региона. Сбор, обработка статистических данных по основным секторам Кемеровской области. Оценка их полноты и качества. Принципы построения математической модели.
дипломная работа [2,6 M], добавлен 30.05.2013