Использование онтологий в работе с полнотекстовыми базами данных
Поиск и работа с полнотекстовыми неструктурированными базами данных, заранее не подготовленными для поиска, как с коллекциями текстовых документов в научной области. Понятие онтологии, соотношение смыслов поиска и языковых слов, используемых в запросе.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 10.05.2022 |
Размер файла | 27,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Использование онтологий в работе с полнотекстовыми базами данных
Н.С. Бажанов1
1 Новосибирская государственная консерватория им. М.И. Глинки, Новосибирск, Российская Федерация
Аннотация
онтология поиск база данных текстовый документ
В статье рассматривается поиск и работа с полнотекстовыми неструктурированными базами данных, заранее не подготовленными для поиска, которые представляют собой коллекцию текстовых документов в одной научной области. Наибольший объем содержания статьи раскрывает технологический контекст полнотекстового поиска, рассматриваются и анализируются те взаимосвязанные в системе поиска структуры, которые влияют на результат поиска информации. В качестве инструмента, организующего такой поиск, избраны онтологические описания. Понятие онтологии используется в прикладном, а не в философском значении, как спецификация сущности вещей. Важной стороной онтологий является «концептуализация» предметного знания, вне учета которого полнотекстовой поиск будет всегда ограничен. Фактически задача поиска в больших полнотекстовых базах данных создать такое взаимодействие компьютерных алгоритмов и интеллекта исследователя, которое перевело бы поиск из простых, разовых, законченных действий в непрерывное наполнение сложного, составного знания о научной проблеме. В статье анализируется соотношение смыслов поиска и языковых слов, используемых в запросе. Разделение понятий смысл и слово придает поиску более совершенную форму, выводя на первое и ведущее место смыслы поиска посредством ведомых вербальных форм. Также рассматриваются важные свойства поиска: концентрация найденных смыслов, новизна искомого знания, замкнутость и открытость результатов. На основании изучения особенностей работы и поиска в полнотекстовых базах данных автор приходит к следующим выводам. Возможности поиска и работы с полнотекстовыми базами данных никогда не используются полностью. Совершенствование информационно-поисковой системы всегда актуально. Чем более концентрированы в полнотекстовой базе данных научные смыслы и одна тематика дисциплины, тем больше возможностей ее функционирования в виде базы знаний и экспертной системы. Поиск в полнотекстовой базе данных представляет собой открытую систему: одновременно снимая одни вопросы, он добавляет новые, тем самым делая поиск непрерывным «интеллектуально-системным» познанием научной проблемы.
Ключевые слова: поиск в полнотекстовых базах данных, онтологии поиска, смысл и слово, экспертные системы, базы знаний.
Abstract
USING ONTOLOGIES WORKING WITH FULL-TEXT DATABASES
N.S. Bazhanov1
1 Glinka Novosibirsk State Conservatoire, Novosibirsk, Russian Federation
The article deals with searching and working with full-text unstructured databases that are not prepared in advance for search, which are a collection of text documents in a single scientific field. The largest volume of the article's content reveals the technological context of full-text search, and examines and analyzes those interrelated structures in the search system that affect the result of information search. Ontological descriptions are chosen as a tool for organizing such a search. The concept of ontology is used in an applied, rather than in a philosophical sense, as a specification of the essence of things. An important aspect of ontologies is the "conceptualization" of subject knowledge, without which full-text search will always be limited. In fact, the task of searching in large full-text databases is to create an interaction between computer algorithms and the investigator's intelligence that would translate the search from simple, one-time, legitimate actions into a continuous filling of complex, composite knowledge about a scientific problem. The article analyzes the relationship between search meanings and language words used in the query. The separation of the concepts of meaning and word gives the search a more perfect form, bringing the search meanings to the first and leading place through the guided verbal forms. Important properties of the search are also considered: the concentration of the found meanings, the novelty of the sought knowledge, the closeness and openness of the results. Based on the study of the features of work and search in full-text databases, the author comes to the following conclusions. Search and full- text database capabilities are never fully used. Improving the information retrieval system is always relevant. The more scientific meanings and one subject of a discipline are concentrated in a full-text database, the more opportunities it has for functioning as a knowledge base and expert system. Search in a full-text database is an open system: simultaneously removing some questions, it adds new ones, thereby making the search a continuous "intellectual-system" knowledge of a scientific problem.
Keywords: search in full-text databases, search ontologies, meaning and word, expert systems, knowledge bases.
Наиболее продуктивным направлением в компьютерных технологиях научной деятельности является использование различных баз данных и поисковых систем на их основе. На развитие систем текстового поиска оказали влияние разработки полнотекстовых (full-text system) баз данных и поисковых систем. В настоящее время перспективные разработки в рассматриваемой области концентрируются вокруг авторитетной международной конференции по текстовому поиску TREC (Техt Retrieval Со^егепсе https:// trec.nist.gov), учрежденной в 1992 г. в США Американским национальным институтом по стандартам и технологиям (NIST https://www. nist.gov).
Полнотекстовые базы данных (ПБД) - признанный во всем мире источник важной и актуальной информации (Шабурова Н., 2006; Сафина Г., 2005). ПБД включают в себя полные тексты электронных версий книг, журнальных статей, реферативных обзоров по конкретной научной проблематике и т.п. Такие тексты, как правило, отвечают критерию законченности и соответствуют атрибутам жанров, в которых существуют: статья, реферат, книга, доклад, цитаты, выписки.
Очень часто ПБД целиком состоят из так называемой неструктурированной информации. Неструктурированная база данных наполнена информацией, которая заранее не упорядочена, не имеет структуры, не разделена на стандартные части. В сравнении с дорогостоящими библиотечными системами и подготовленными базами данных здесь файлы даны «как есть», все вместе - имя автора, название, сам текст, литература, и возможные ключевые слова. Все компоненты могут быть в одном файле, а сами текстовые файлы могут быть разных форматов. Иногда такие базы данных называются «мешок текстов». Преимущество таких баз данных заключено в простоте их создания путем слияния небольших корпоративных архивов.
При наличии большой коллекции текстов в компьютерных форматах возникает заманчивая задача, при написании научной статьи использовать не 10-20 книг, а огромную библиотеку полнотекстовых источников численностью в сотни и тысячи книг, собранных в одной предметной области. Корпус текстов в предметной области мыслится как взаимосвязанное целое, организованное в логике предмета. Тогда можно найти новое знание, которое содержится в столь огромной библиотеке текстов, но не может быть обнаружено человеком без помощи компьютера. В обобщенном плане, в компьютерных технологиях работы с текстами основная проблема заключается в том, как сделать поиск наиболее полным, как с помощью слов найти наибольшее количество искомых смыслов.
Проблема. Научно-информационный потенциал большой коллекции полнотекстовых документов, собранных в одной тематике, настолько значителен, что никогда не используется полностью. В ПБД в явном или скрытом виде может содержаться новое знание. Новое знание образуют смысловые отношения из разных книг, документов. В известных научных источниках остаются не выявленными кросс-связи суждений, т.е. высказывания, разделенные между собой значительными фрагментами текста. Генеративный смысловой потенциал имеют кон- кордации внутри терминологического аппарата научной проблемы. В такой коллекции документов не может быть только нового знания, полученного экспериментальными методами и еще не опубликованного в научных изданиях. Исходя из подобного представления свойств ПБД, возникает актуальная задача совершенствования информационно-поисковой системы до функционального уровня решения перечисленных проблем.
Для того чтобы использование ПБД было эффективным, необходимо часть интеллектуальной обработки информации передать компьютеру, т.е. автоматизировать. Подобные задачи относятся к методологии использования машинной обработки текстов, а также являются специфическим продолжением идеологии больших данных (big data1).
Однако для передачи компьютеру части рутинной работы по анализу текста, действия необходимо было алгоритмизировать и создать специальные компьютерные программы2. Так, частотное распределение слов (встречаемость) в тексте и его структурах приобретало смысл только после того, как из текста были исключены предлоги (наиболее часто употребимые) и другие незначимые слова. Любой запрос на поиск ключевых слов должен был проходить морфологическую обработку, которая учитывала все встречающиеся в языке словоформы. Нужно было учитывать при поиске информации синонимические варианты существования одного и того же смысла. Местоимения необходимо было соотносить с предыдущими собственными именами (так называемое разрешение кореференций - coreference resolution) и т.п. Возникла компьютерная лингвистика - современная область технологического знания, призванная в поисках и работе со смыслами преодолеть особенности организации слов в языке и любом тексте.
Следующим препятствием при интеллектуальном анализе текстов оказалась сама предметная область знания. Для того чтобы формальные алгоритмы автоматизированной обработки начали работать с большими коллекциями текстов, необходимо было учесть «мыслимый за кадром», внетекстовой, смысловой и содержательный контексты. Оказалось необходимым выделить понятия из текста и представить их системные значения в терминологическом аппарате. Кроме того, что термины взаимосвязаны между собой, они еще имеют некоторую модификацию смыслов в зависимости от использования в различных научных дисциплинах. Так появились онтологии3- концептуализации
предметного знания4 (Кузнецов О., 2010; Мёдова А., 2016). В большинстве подобных работ концептуализация понимается как введение онтологических представлений в массив эмпирических данных, обеспечивающее теоретическую организацию материала и схематизацию связей понятий. Сегодня это направление считается дальнейшим продолжением и развитием системной методологии, столь популярной в науке второй половины XX в. (Bertalanffy L., 1968). Перспективным направлением совершенствования работы с ПБД оказалось применение в качестве инструмента поиска онтологий (Пальчунов Д., 2008).
Для формирования простейших онтологий в виде классификаций были построены графические редакторы, которые упрощают работу с такими онтологиями и делают их более наглядными. К ним относятся редакторы онтологий: PROTЙGЙ, Ontolingua, Chimaera.
Термин «онтология» стал использоваться в нескольких значениях. Работы в области философии продолжали обсуждать онтологию как учение «о бытии всего сущего, о его сущности и всеобщих принципах организации» (Яскевич Я., 2006). Второе направление называло онтологиями искусственные, наиболее полные описания значения элементов обобщенных систем. В отличие от методологии общей теории систем в «онтологиях» предполагалась возможность раскрытия спецификации сущности вещей.
В методологию науки понятие «онтологии» вел Томас Грубер (Thomas Robert «Tom» Gruber (род. 1959) американский компьютерный ученый). В прикладном значении понятие онтологии стало применяться как «точная спецификация некоторой предметной области» (Некипелов Н., 2010, с. 39). «Онтология предметной области рассматривается как пара - сигнатура из множества ключевых понятий предметной области и множество аналитических предложений, истинных в данной предметной области. Это множество аналитических предложений определяет смысл (значение) ключевых понятий предметной области» (Пальчунов Д., 2008, с. 3-4). Онтологии стали активно применяться в системах извлечения нового знания, получили новый импульс развития в больших полнотекстовых неструктурированных базах данных.
«В сфере искусственного интеллекта онтология - это дисциплина, связанная с построением специфической системы понятий, которая описывает определенную предметную область. Содержание понятий отражается с помощью концептов. Формально в онтологии концепт отождествляется с объектом (классом), имеющим связи с другими классами. Класс определяется как множество экземпляров с общими свойствами и содержит описание собственно экземпляров и их свойств» (Кузнецов О., 2010, с. 762).
В отличие от естественнонаучных дисциплин музыкознание еще только приступает к освоению технологий интеллектуальной обработки текстов и применению методологии онтологического подхода.
Онтология поиска в ПБД касается сущностей самого поиска. Ключевыми являются вопросы - каким образом человек находил раньше и находит теперь (вместе с компьютером) необходимые фрагменты текста с заданным смыслом? Можно ли назвать поиском некоторые сложные виды работы с ПБД, когда исследователь пытается обнаружить скрытые взаимосвязи, как проявление системного знания по предмету? Так мы подходим к ответу на вопрос: Чем отличается работа с ПБД, от поиска в ПБД? Такое отличие определяется содержанием пунктов 3-10 (см. перечисление ниже). Можно представить следующую классификацию общения исследователя с ПБД:
1. Поиск простого совпадения;
2. Поиск совпадения с учетом морфологии (возможных словоформ);
3. Поиск корреляций (от лат. еогге1аНо соотношение, взаимосвязь), например по удаленности слов друг от друга в тексте;
4. Поиск корреляций по частотному распределению слов;
5. Поиск терминов;
6. Поиск утверждений / отрицаний;
7. Поиск логических имен;
8. Поиск логических действий;
9. Поиск методологических установок и приемов;
10. Поиск выводов и заключений.
Следовательно, потребность в информации уже разделяется на различные функционально-логические единицы. Очевидны потребность в литературе по теме исследования, фактах, понятиях, терминах, категориях, суждениях, умозаключениях, взаимосвязях и выводах, и наконец, поиск неизвестных и непредполагаемых свойств текста, когда логические, статистические5 предметные закономерности о тексте предоставляет компьютерная программа.
В алгоритмах консультации и работы с элементами искусственного интеллекта каждый последующий цикл запросов зависит от результатов предыдущего совместного действия человека и компьютерной программы поиска. В этом случае задействованными в работе оказываются и научная гипотеза, и формирование концепции, и верификация суждений, утверждений и выводов. При такой постановке проблемы становится понятным, что поиск информации не разовая конечная функция, а непрерывная, постоянная технология интерактивной компьютерной работы с научными текстами (Бажанов Н.. 2016, с. 91).
Слово и смысл. Информация и смысл. Один и тот же смысл может быть выражен множеством словесных сочетаний. Основная проблема полнотекстового поиска и анализа состоит в том, чтобы несколькими запросами «вытащить» из текста наиболее полный объем искомого смысла. Эта проблема владения словами, синонимами, т.е. задача лингвистическая и литературно-содержательная. Поскольку слово мыслится как символ несущий смысл, становится понятным выход технологий работы с ПБД на семантику текста. Так для компьютерных технологий поиска значимы лингвистика и семантика текста. Модель языка смысл <-> текст была разработана И.А. Мельчуком, советским, канадским лингвистом (1974).
Именно в философии компьютерных технологий обострились и были подчеркнуты еще раз конфликты между смыслом и словом. Поскольку в компьютерных технологиях происходило дальнейшее отчуждение слов от смыслов, (знака от значения), конфликт слово <-> смысл оказался выражен предельно ярко. Обнаружилось, что в большинстве ситуаций поиска пользователи ищут невербальные смыслы, которые выражены словами на разных языках и всегда неточно. «Символ говорит о том, что смысл одного мира лежит в другом мире, что из другого мира подается знак о смысле» (Бердяев Н., 1994, с. 50). Оказалось, что человек в компьютерных технологиях создал великую модель окружающего мира, в которой, в конечном виде, на мониторе электронные уровни единички и нолика выглядят для человека как смыслы. Для того чтобы это было так, работают сотни тысяч специалистов различных направлений культуры.
Следствием множественных отношений между словом и смыслом является использование в работе с БД и в поиске тезаурусов. Как правило, они связаны с терминологическим аппаратом предметной области и приводят хотя бы в приблизительное соответствие слова и смыслы. Все перечисленные выше соотношения слов и искомых смыслов необходимо учитывать при составлении запроса на поиск в ПБД.
Итак, в поиске информации в ПБД запрос осуществляется в словах, а ищем мы смыслы. По этой причине любой набор ключевых слов на поиск документа или цитат из него всегда неадекватен смысловому содержанию поиска. С этих позиций существует ущербность любого словесного выражения смысла. В научных текстах всегда актуальным остается семантический и лингвистический анализ терминологического аппарата.
Важным качеством ПБД является степень концентрации отраслевого знания в экспертной6 системе. Известный парадокс знания гласит, чем меньше область, в которой сконцентрировано знание, и чем больше массив такого знания, тем выше потребительская стоимость такой системы. Это современная модификация известного тезиса о векторе развития научного знания «все большее о все меньшем».
О форме смысла. При описании онтологий мы сталкиваемся с проблемами адекватности передачи смыслов посредством слов и в виде текста научного издания. Оказывается, что традиционные печатные, полиграфические формы фиксации и передачи некоторых системных смыслов не подходят для адекватно го представления их на бумаге. Хуже всего удается передать смыслы соотношений между частями целого. Передача смысла соотношения «каждый с каждым» приводит к фиксации в виде таблицы только бинарных соотношений. Многомерные описательные таблицы (матрицы) занимают гигантские печатные площади, таблицы вложений содержат большие пустующие места, даже простые многомерные графические схемы отношений и взаимосвязей становятся «нечитабельны» из-за плотности изображения элементов и связей между ними. В электронных изданиях возможны более адекватные формы передачи сложных смыслов, за счет гиперссылок и системы закладок.
Так, важнейшее последствие применения онтологий - вопрос о форме выражения смыслов. Наследование компьютерными технологиями «бумажной» двухмерной логики выражения приобретает существенное негативное ограничение для передачи многомерной природы смыслов.
Концентрация смыслов в ПБД. По концентрации знания в найденном документе результатом поиска могут быть:
1. Упоминание;
2. Суждение;
3. Обсуждение (несколько суждений в сопоставлении);
4. Тема части документа с анализом и выводами (гипотеза или концепция);
5. Документ, целиком посвященный одной научной проблеме;
6. Подборка документов об одной научной проблеме.
Из найденных упоминаний о том, что ищешь, научной концепции не «сошьешь». Должен быть расширенный результат со множеством детализированных смыслов, на тему поиска в виде ряда статей, а еще лучше монографий. Кроме того, в таком результате поиска должны быть полностью представлены атрибуты научного решения проблемы: постановка задачи, методология решения, исходная база научной литературы, основная аналитическая часть, выводы, описание ограничений и т.д. Именно в такой своей форме ПБД начинает работать как эксперт консультант по научной проблеме.
Научная новизна и поиск в ПБД.
Методологически интересным представляется соотношение новизны научной информации и технологии полнотекстового поиска. Естественно, человек ищет то, что знает, поскольку формулирует ключевые слова поиска. Однако тем самым априори снижается новизна искомого знания. Следовательно, самым продуктивным для новизны знания будет ситуация, когда пользователь, хотя бы частично, не предполагает результат поиска. Поиск смыслов в тексте должен быть организован так, чтобы результат поиска был значительно больше ожидания исследователя.
Внесение элемента неопределенности оказывается важным условием поиска информации с наибольшим уровнем новизны. Новизна информации возникает только на основе нового алгоритма поиска. Тем самым, казалось бы, простой вопрос об информационной потребности приобретает философско-методологический характер.
«Люди будут искать то, что они знают, обращаясь к документальным репозитариям. Однако они вообще не будут или просто не смогут выразить запросом то, чего они не знают, даже имея доступ к собранию документов» (Ландэ Д., 2003), заметил Джим Нисбет, вице-президент компании Яешю, которая является одним из ведущих производителей систем добычи данных. Утверждение Джима Нисбета представляется излишне категоричным и касается крайних проявлений соотношения информационной потребности и запроса на поиск. Информационная потребность для поиска в ПБД никогда не принимает состояние «полного знания» или «полного незнания», потребность всегда состоит из некоторого сочетания пропорций того и другого. Результат именно полнотекстового поиска, одновременно снимая одни вопросы, добавляет новые, тем самым делает поиск не прерывным«интеллектуально системным» познанием научной проблемы.
Научная новизна результата поиска может быть представлена новой критикой научной концепции, понятийного или логического каркаса знания. Это самая сложная часть добычи знания, зависящая от таланта исследователя, его изощренности в постановке проблемы, в искусстве вопрошания и технологии поиска.
«Вид эффективного анализа текста - Text Mining - используя вычислительные мощности, должен выявить отношения, которые могут приводить к добыче новых знаний пользователем» (Ландэ Д., 2003).
Речь идет об отношениях между понятиями и терминами.
Развитием работы с ПБД принято считать частоту употребления «слова-понятия» в тексте. Из гигантских текстовых массивов вытаскиваются фрагменты с наиболее частым употреблением заданного ключевого слова и увязанные, на основе частотного распределения, сопутствующие слова. Здесь конкордация смыслов основного и сопутствующих слов тем больше, чем чаще они встречаются во фрагменте текста.
Другой принцип выявления кон- кордации смыслов - позиционный. Считается, чем ближе слова расположены друг к другу, чем меньше слов между ними, тем конкордация смыслов выше. Близость позиций «слов-понятий» в тексте, в пределах предложения, фразы, абзаца, считается проявлением взаимосвязи между ними. Тем самым находится контекст понятия, его окружение, более полный список терминологического аппарата. Тогда исследователь может обнаружить и интерпретировать взаимосвязь сущностей, которую раньше не замечал. В этом случае интеллектуальные технологии поиска раскрывают новые взаимосвязи смыслов.
Выводы
Ресурсы и возможности поиска в ПБД никогда не используются в полной мере возможностей. Расширение и совершенствование информационно-поисковой системы всегда актуально.
Онтологии поиска представляют собой наиболее современные и развитые способы описания, систематизации и обобщения поисковых систем.
Из общей онтологии поиска можно выделить лингвистическую часть и часть поиска, учитывающую особенности предметной области.
Лингвистика поиска должна всегда принимать во внимание первичность искомых смыслов по отношению к их вербальному выражению в виде запроса.
Чем более концентрированы в ПБД научные смыслы и одна тематика дисциплины, тем больше возможностей ее функционирования в виде базы знаний и экспертной системы.
Поиск в ПБД представляет собой открытую систему, одновременно снимая одни вопросы, он добавляет новые, делая поиск непрерывным «интеллектуально-системным» познанием научной проблемы.
Примечания
1 Big data - огромные коллекции документов или базы данных, тематически сконцентрированные в одной области знания.
2 В качестве примера следует упомянуть мощные поисковые программы: Dtsearch(www.dtsearch.com); Searchinform Desktop (www.searchinform.com).
3 Относительно предметных онтологий всегда остается определенный скепсис. Насколько изоморфны сущности вещей, чтобы их разнообразие свести к ограниченному количеству онтологических схем.
4 Проблемы онтологии музыки: Коллектив. моногр. М.: ГИИ, 2018. 400 с.
5 Инструменты статистического анализа текста. ИКЬ: http://textanalysis.rU/2 (дата обращения: 26.07.2020).
6 Общепринято деление ПБД на фактографические (фактологические), документальные и экспертные системы. В фактографических ПБД хранятся однозначные сведения, отвечающие на вопрос где, когда, кто, как называется и т.д. В документальных ПБД содержатся неоднозначные сведения, - статьи, подборки, коллекции документов по теме. Экспертные системы на основе ПБД работают как научные консультанты по данной проблеме или дисциплине, так как содержат документы, написанные экспертами в данной области знания.
ЛИТЕРАТУРА
1. Бажанов Н.С. О системе поиска информации в текстах исторического музыкознания // Вестник Томского государственного университета. Культурология и искусствоведение. 2016. № 1. С. 83-93.
2. Бердяев Н.А. Философия свободного духа. М.: Республика, 1994. 479 с.
3. Кузнецов О.П., Суховеров В.С., Шипилина Л.Б. Онтология как систематизация научных знаний: структура, семантика, задачи // Труды конференции «Технические и программные средства систем управления, контроля и измерения». М., 2010. С. 762-773.
4. Ландэ Д. Глубинный анализ тестов. Технология эффективного анализа текстовых данных. 2003. иБЬ: http://dwl.kiev.ua/art/dz/ index.html (дата обращения: 26.07.2020).
5. Мёдова А.А. Онтология времен музыки: физическое и астрономическое время в музыкальном произведении // Философские науки. 2016. № 5. С. 110-123.
REFERENCES
1. Bazhanov, N.S. (2016), “About the system of information search in texts of historical musicology”, Vestnik Tomskogo gosudarstvennogo universiteta. Kul'turologiya i iskusstvovedenie [Bulletin of Tomsk State University. Cultural studies and art history], № 1, pp. 83-93. (in Russ.)
2. Berdyaev, N.A. (1994), Filosofiya svobodnogo dukha [Philosophy of the free spirit], Respublika, Moscow, 479 p. (in Russ.)
3. Bertalanffy, L. von. (1968), General System theory: Foundations, Development, Applications, 1st ed., George Braziller, lnc., N. Y., 289 p. (in Eng.)
4. Kuznetsov, O.P., Sukhoverov, V.S., Shipilina, L.B. (2010), “Ontology as a systematization of scientific knowledge: structure, semantics, tasks”, Trudy konferentsii “Tekhnicheskie i programmnye sredstva sistem upravleniya, kontrolya i izmereniya” [Works of the conference
5. Мельчук И.А. Опыт теории лингвистических моделей «Смысл ^ Текст». М., 1974. 370 с.
6. Некипелов Н., Шахиди А. Онтология анализа данных // Антология онтологии: Электронная подборка научных статей / сост. Н.М. Боргест. Самара, 2010.
7. Пальчунов Д.Е. Решение задачи поиска информации на основе онтологий // Бизнес-информатика. 2008. № 1. С. 3-13.
8. Сафина Г. Создание и использование полнотекстовых баз данных в учебном процессе вуза // Вестник Казанского государственного университета культуры и искусств. 2005. № 3. С. 214-215.
9. Шабурова Н.Н., Анализ использования полнотекстовых баз данных в информационно-библиотечном обслуживании научных исследований // Библиосфера. 2006. № 2. С. 7-12.
10. Яскевич Я.С., Лукашевич В.К. Философия и методология науки: Учеб. пособие для магистрантов и аспирантов. Минск: БГЭУ, 2006, С. 33.
11. Bertalanffy L. von. General System theory: Foundations, Development, Applications. 1st ed. N. Y.: George Braziller, lnc., 1968. 289 p.
12. “Technical and Software Tools for Control, Control and Measurement Systems”], Moscow, pp. 762-773. (in Russ.)
13. Lande, D. (2003), Glubinnyi analiz testov. Tekhnologiya effektivnogo analiza tekstovykh dannykh [Deep text analysis. Technology for effective text data analysis], available at: http:// dwl.kiev.ua/art/dz/index.html (accessed 26 July 2020). (in Russ.)
14. Melchuk, I.A. (1999), Opyt teorii lingvisticheskikh modelei “Smysl ^ Tekst” [Experience of the theory of linguistic models "Meaning ^ Text"], Moscow, 370 p. (in Russ.)
15. Myodova, A.A. (2016), “Ontology of the times of music: physical and astronomical time in a musical work”, Filosofskie nauki [Philosophical Sciences], no. 5, pp. 110-123. (in Russ.)
16. Nekipelov, N., Shahidi, A. (2010), “Ontology ofdata analysis”,Antologiya ontologii,
17. Ehlektronnaya podborka nauchnykh statei [Anthology of ontology, Electronic collection of scientific articles], Samara. (in Russ.)
18. Palchunov, D.E. (2008), “Solving the problem of searching for information based on ontology”, Biznes-informatika [Business informatics], no. 1, pp. 3-13. (in Russ.)
19. Safina, G. (2005), “Creation and use of full-text databases in the educational process oftheuniversity”, Vestnik Kazanskogo
20. gosudarstvennogo universiteta kul'tury i iskusstv [Bulletin of the Kazan State University of Culture and Arts], no. 3, pp. 214-215. (in Russ.)
21. Shaburova, N.N. (2006), “Analysis of the use of full-text databases in information and library services of scientific research”, Bibliosfera [Bibliosphere], no. 2, pp. 7-12. (in Russ.)
22. Yaskevich, Ya.S., Lukashevich, V.K. (2006), Filosofiya i metodologiya nauki [Philosophy and methodology of science], BGEU, Minsk. (in Russ.)
Размещено на Allbest.ru
...Подобные документы
Особенности управления информацией в экономике. Понятие и функции системы управления базами данных, использование стандартного реляционного языка запросов. Средства организации баз данных и работа с ними. Системы управления базами данных в экономике.
контрольная работа [19,9 K], добавлен 16.11.2010Характеристика основных патентных баз данных, используемых при проведении патентно-информационного поиска в Интернете. Стратегия патентного поиска и системы патентной классификации. Использование логических операторов и ключевых слов при поиске.
презентация [1,9 M], добавлен 15.09.2011Теоретические сведения и основные понятия баз данных. Системы управления базами данных: состав, структура, безопасность, режимы работы, объекты. Работа с базами данных в OpenOffice.Org BASE: создание таблиц, связей, запросов с помощью мастера запросов.
курсовая работа [3,2 M], добавлен 28.04.2011Система управления базами данных как составная часть автоматизированного банка данных. Структура и функции системы управления базами данных. Классификация СУБД по способу доступа к базе данных. Язык SQL в системах управления базами данных, СУБД Microsoft.
реферат [46,4 K], добавлен 01.11.2009Обоснование выбора метода извлечения ключевых слов. Анализ предметной области, проектирование информационной системы поиска релевантных документов. Реализация запросов к электронным библиотекам. Реализация интерфейса системы поиска релевантных документов.
дипломная работа [1,1 M], добавлен 21.09.2016Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.
лекция [15,5 K], добавлен 19.08.2013Организация хранения данных. Система управления базами данных. Поиск информации, обзор существующих поисковых систем. Особенности работы поискового движка. Использование индексов в поисковых системах. Особенности поиска различных видов информации.
курсовая работа [4,6 M], добавлен 14.05.2014Современные информационные технологии обработки данных, автоматизированного офиса и баз данных, сетевые интернет-технологии. Работа с системой управления базами данных (СУБД) MS Access, связанными списками MS Excel, текстовым редактором MS Word.
методичка [5,6 M], добавлен 01.07.2014Алгоритмы обработки массивов данных. Система управления базами данных. Реляционная модель данных. Представление информации в виде таблицы. Система управления базами данных реляционного типа. Графический многооконный интерфейс.
контрольная работа [2,8 M], добавлен 07.01.2007Понятие и назначение, принципы построения и внутренняя структура системы управления базами данных, их функциональные особенности и возможности, критерии оценки эффективности. Языковые и программные средства. Использование SQL, типы и модели данных.
презентация [677,3 K], добавлен 18.03.2015Устройства внешней памяти. Система управления базами данных. Создание, ведение и совместное использование баз данных многими пользователями. Понятие системы программирования. Страницы доступа к данным. Макросы и модули. Монопольный режим работы.
реферат [27,5 K], добавлен 10.01.2011Автоматизация сбора и обработки данных. Основы, таблицы и средства для работы с базами данных. Инструментальные средства и компоненты. Технология создания приложения. Работа с псевдонимами и со связанными таблицами. Система управления базами данных.
методичка [1,5 M], добавлен 06.07.2009Характеристика программного продукта Microsoft Outlook 2000. Принципы работы с редактором электронных таблиц Microsoft Excel и текстового редактора Microsoft Word. Методические указания при работе с СУБД Access. Анализ системы управления базами данных.
контрольная работа [116,3 K], добавлен 13.11.2010Понятие "база данных", общая классификация. Мировой рынок систем управления базами данных по итогам 2007 года. Oracle: общее понятие, функции. Технология Active Data Guard. Опции Total Recall. Сравнение масштабируемости. Сравнение работы кластеров.
курсовая работа [676,0 K], добавлен 19.05.2015Оценка качества поисковых систем. Индексирование по ключевым словам. Внутренние представления запросов и документов на информационно-поисковом языке. Способы улучшения поиска при помощи тезаурусов и онтологий. Ранжированный поиск (vector-space model).
лекция [31,5 K], добавлен 19.10.2013Построение онтологии предметной области для анализа глобальных процессов на основе информации, получаемой из новостных лент. Средства разработки онтологий, используемых для поиска событий, фактов, извлечённых из СМИ; моделирование экономических рисков.
курсовая работа [3,4 M], добавлен 27.08.2017Характеристика категорий современных баз данных. Исследование особенностей централизованных и распределенных баз данных. Классификация систем управления базами данных по видам программ и применению. Управление буферами оперативной памяти и транзакциями.
курсовая работа [45,2 K], добавлен 10.03.2016Классификация баз данных. Использование пакета прикладных программ. Основные функции всех систем управления базами данных. Настольная система управления базами данных реляционного типа Microsoft Access. Хранение и извлечение электронных данных.
курсовая работа [962,4 K], добавлен 23.04.2013Приложения, позволяющие работать со списками и базами данных. MS Access - классическая система управления базами данных. Понятие списков и данных, особенности их создания в среде MS Office. Расчёт исходящих остатков данных в табличном процессоре MS Excel.
курсовая работа [1,2 M], добавлен 25.04.2013Хранение и обработка данных. Компоненты системы баз данных. Физическая структура данных. Создание таблиц в MS Access. Загрузка данных, запросы к базе данных. Разработка информационной системы с применением системы управления базами данных MS Access.
курсовая работа [694,0 K], добавлен 17.12.2016