Информационная поддержка учебно-научной базы знаний для подготовки кадров в области биотехнологии

Описание методики построения моделей-прототипов для создания проблемно ориентированных баз знаний. Иерархическое описание взаимосвязи процессов после получения первичной выборки статей до обращения к системе поддержки принятия решения пользователем.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 30.04.2018
Размер файла 505,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Информационная поддержка учебно-научной базы знаний для подготовки кадров в области биотехнологии

ассистент Столбов Л.А.

аспирант Корнюшко В.Ф.

доктор технических наук, профессор Николаева О.М.

Аннотация

В настоящее время разработано очень много баз данных и, основанных на них баз знаний, в различных областях знаний. Они могут представлять из себя хранилища, содержащие как статьи по различным тематикам, так и базы, содержащие свойства, характеристики и взаимосвязи в исследуемой области знания. На основе ассоциативного метода и методологии IDEF0 приведена методика построения моделей-прототипов для создания проблемно ориентированных баз знаний. Приведено формализованное иерархическое описание взаимосвязи процессов после получения первичной выборки статей до непосредственного обращения к системе поддержки принятия решения пользователем.

Ключевые слова: ассоциативный метод, проблемно ориентированные базы знаний, информационные модели.

Abstract

Currently various fields of knowledge databases are developed. They can contain articles on various topics and or properties, characteristics and relationships of the investigated field of knowledge. A feature of the construction of such knowledge bases is that a universal knowledge base and algorithms of their processing can be hosted in cloud servers. Construction of models-prototypes for the creation of problem-oriented knowledge bases on the basis of the associative method and the IDEF0 methodology the methodology is considered. A formalized hierarchical description of the relationship between processes after receiving the initial sample of articles to the decision support system appeal by the user is given.

Keywords: associative method, problem-oriented knowledge base, information models.

В последнее десятилетие возрастающий объем научной информации и технологии передачи информации активно изменяют образовательную среду и создают новые правила обработки научных данных, используемых в последующих работах. На данный момент существует огромное количество информации, посвященное различным областям знаний. Основная доля этой информации приходится на публикуемые статьи, хранящиеся в крупных базах данных таких (например, базы данных издательства Elsevier и тд). При возрастающем количестве статей и диверсификации областей применения тех или иных знаний, требуется все большее количество времени для отбора и систематизации требуемой информации. Таким образом, без комплекса автоматических средств обработки и систематизации данных не представляется возможным в полной мере овладеть предметной областью [1, 2].

Задача, такой систематизации данных после их получения и до обработки соответствующей системой поддержки принятия решения, формулируется следующим образом: При наличии ряда объектов, принадлежащих к предопределенному набору классов и обладающими предопределенным набором величин измерения этих объектов, идентифицировать или задать класс родства каждого из этих объектов с помощью подходящего анализа их величин измерения (признаков)[3].

Важной проблемой при создании информационной поддержки разрабатываемой проблемно ориентированной базы знаний является использование экспертов для обработки информации на отдельных этапах ее построения.

Ассоциативный метод. Метод поиска технических решений обосновываются на применении в творческом процессе семантических свойств понятий путем использования аналогий их вторичных смысловых оттенков. Основными источниками для генерирования новых идей служат ассоциации, метафоры и случайно выбраны понятия. На семантическом уровне лингвистическая информация характеризуется попарной сочетаемостью корневых основ.

Запоминание числа прохождений траекторией точек многомерного пространства, с последующим применением порогового преобразования, позволяет выявлять фрагменты траектории заданной частоты появления, которые составляют словари событий входной информации заданной частоты встречаемости . Для лингвистической информации это, например, словари флективных морфем, корневых основ, синтаксических групп. Выявленные таким образом лингвистические единицы в дальнейшем можно использовать для обработки текстовой информации. Словарь флективных морфем можно использовать для морфологического анализа, словарь корневых основ - для выявления ключевых понятий в тексте и формирования однородной (ассоциативной) семантической сети. Каждому члену последовательности n соответствует точка , с соответствующими координатами, а всей последовательности А, соответсвует последовательность точек В , с траекторией

(1)

Где F - отображение в многомерное сигнальное пространство.

В общем случае среди n -членных фрагментов информационной последовательности может встретиться n -членный фрагмент последовательности:

(2)

И траектория в этом случае обратится к следующей вершине. В этой точке возможно более одного продолжения траектории. Для двоичной последовательности продолжений может быть не более двух.

Ассоциативность преобразования F позволяет сохранить топологию структуры преобразуемой информации. Действительно, одинаковые фрагменты последовательности преобразуются в одну и ту же траекторию, разные - в разные траектории[4].

При этом ассоциативная связь между двумя соединениями оценивается в зависимости от количества совпадений между соответствующими библиографическими списками.Попарные ассоциативные связи для каждой пары соединениймогут быть вычислены по формуле:

(3)

где m и n - количество статей в библиографических профилях одного и другого соединения[5].

Информационные модели экспертно-алгоритмической системы сбора и обработки данных. Для построения ВЭБ-программного комплекса семантического анализа и сжатия информации для построения проблемно-ориентированных баз знаний из универсальных использован метод информационного моделирования. При этом для построения функциональных информационных моделей использвана методология IDEF0. Как правило, моделирование средствами IDEF0 является первым этапом изучения любой системы[6].

В общем случае концептуальная модель построения проблемно-ориентированной базы данных из универсальной имеет вид: (Рис. 1):

прототип база знание пользователь

Рис. 1. Контекстная диаграмма А0 функциональной модели

Следующим этапом информационного моделирования системы является ее иерархическая декомпозиция.

Формирование исходных данных. Проблема информационного моделирования рассмотрена на конкретном примере построения проблемно-ориентированной базы данных в области биомедицины и медицинской химии. Необходимым условием для формирования исходных данных является наличие контролируемого словаря. Контролируемый словарь может содержать названия сущностей, относящихся к конкретной предметной области. Для рассматриваемого примера-это наименования различных белков или их субъединиц, генов, химических реакций, заболеваний и др. В случае создания базы данных биомедицины и медицинской химии в контролируемый словарь наиболее целесообразно использовать наименования химических соединений в виде номера CAS и/или названия по ИЮПАК, что возможно при загрузке из системы PubChem вместе с синонимичными вариантами [7]. На этапе формирования входных данных формируется и детализируется поисковый запрос, а также готовятся файлы, необходимые для дальнейшей загрузки.

Обработка входных данных в случае размещение базы данных на стационарных машинах будет включать в себя следующие основные этапы: обогащение перечня терминов, создание целевой и фоновой выборки, создание и обработка промежуточной базы данных (Рис. 2).

Рис. 2. Декомпозиция «обработка входных данных»

При размещении базы данных в интернете или создании веб программного комплекса целесообразно на этом этапе подключить модули, характерные для системы поддержки принятия решения. В данном случае речь идет о N2S (name-to-structure) алгоритмы для представления соединений в форме графов и алгоритмы предсказания свойств соединений.

Для информационного наполнения базы данных используются библиографические сведения о свойствах и характеристиках химических соединений. На первой стадии проектирования базы данных используется семантическое моделирование. При этом в терминах семантической модели производится концептуальная схема базы данных, которая затем вручную преобразуется к реляционной (или какой-либо другой) схеме. Этот процесс выполняется под управлением методик, в которых достаточно четко оговорены все этапы такого преобразования. Таким образом при данных условиях, для проблемно ориентированной базы знаний строится следующая диаграмма потоков данных (рис. 3), которая служит информационной основой построения реляционной проблемно-ориентированной базы данных по библиографическим ссылкам в области биомедицины и медицинской химии.

На следующем этапе проводится проверка качества построенной проблемно-ориентированной базы данных путем применения ее для решения задач анализа информации и задач прогнозирования. Для проверки качества полученных результатов могут быть использованы критерии качественной, феноменологической оценки решения или известные статистические методы [8-9].

Рис.3. Диаграмма потоков данных

Выводы

1. Рассмотрена методика семантического подхода к выборке библиографической информации из универсальных баз знаний. Для рационального использования всего объема данных по требуемой научной тематике целесообразно использовать проблемно - ориентированную базу данных.

2. Показана возможность эффективного применения ВЭБ-программных алгоритмов для анализа и обработки данных.

3. Разработан комплекс информационных моделей, позволяющий на основе применения ассоциативного метода и экспертно-алгоритмической системы сбора и обработки данных проводить реинтеграцию универсальных баз знаний для построения проблемно-ориентированных баз библиографической информации в области медицинской химии и биотехнологии.

Литература

1. Угольникова О. А., Демич Ю. А., Лисица А. В., Кистанова В. Ю., Корнюшко В.Ф., Арчаков А.И., Швец В.И. Использование ассоциативного анализа для обработки научных публикаций в области систем доставки лекарств. // Вестник МИТХТ, 2010, т.V, № 2, с. 91-96.

2. Mario Aldape-Pйrez, Cornelio Yбсez-Mбrquez, Oscar Camacho-Nieto, Itzamб Lуpez-Yбсez, Amadeo-Josй Argьelles-CruzCollaborative learning based on associative models: Application to pattern classification in medical datasets//Computers in Human Behavior, 2014

3. Duda, R. O., Hart, P. E., & Stork, D. G. Pattern classification (2nd ed.) // New York: Wiley (2001).

4. Харламов А. А. Когнитивный подход к анализу текстов в технологии автоматического смыслового анализа текстов TEXTANALYST

5. Rogers DJ, Tanimoto TT. A Computer Program for Classifying Plants //Science, 1960, 132, 1115-1118.

6. Угольникова О. А. и соавт. Алгоритмический подход к группированию активных соединений с использованием ассоциативного библиометрического анализа // Алгоритмы, методы и системы обработки данных: сборник научных статей. 2009. Выпуск 14. с. 184-190.

7. Маклаков С.В. Создание информационных систем с AllFusion Modeling Suite. // М.: “ДИАЛОГ-МИФИ”,2005. - 432 с.

8. Коннолли Т., Бегг К. Базы данных. Проектирование, реализация и сопровождение. Теория и практика - Database Systems: A Practical Approach to Design, Implementation, and Management Third Edition. // 3-е изд. -- М.: «Вильямс», 2003. -- С. 1436.

9. Pedersen T.B., Jensen C.S., Dyreson C.E. A Foundation for Capturing and Querying Complex Multidimensional Data. // Information Systems. 2001. v. 26, № 5, p.45-55.

Размещено на Allbest.ru

...

Подобные документы

  • Анализ процессов диагностики повреждений трубопровода. Разработка модели продукционной базы знаний: обзор методов представления знаний, описание создания базы знаний и разработки механизма логического вывода. Экономическое обоснование концепции проекта.

    дипломная работа [3,0 M], добавлен 16.04.2017

  • Разработка концептуальной и логической моделей базы данных "Отдела кадров (института)". Примеры построения запросов для получения данных по различным критериям выборки, описание получения отчетных документов. Формы для ввода и редактирования данных.

    курсовая работа [1,8 M], добавлен 16.12.2015

  • Основные модели представления знаний. Системы поддержки принятия решений. Диаграмма UseCase. Разработка базы данных на основе трех моделей: продукционные правила, семантическая сеть, фреймовая модель. Программная реализация системы принятия решений.

    курсовая работа [715,1 K], добавлен 14.05.2014

  • Построение графа связей фактов и определение структуры базы знаний. Описание функций инициализации и констатации фактов, входных и выходных данных. Операции, направленные на занесение фактов и действий в базу знаний. Итоговое представление базы знаний.

    курсовая работа [176,9 K], добавлен 13.11.2012

  • Построение баз знаний для семантической сети. Цели создания и язык представления онтологий. Структура исследований в области многоагентных интеллектуальных информационных систем, архитектура агента. Экономическое обоснование разработки базы знаний.

    дипломная работа [1,6 M], добавлен 29.09.2013

  • База знаний - структурированная информация из области знаний для использования кибернетическим устройством (человеком). Классификация, структура, формат представления знаний, интеллектуальные системы поиска информации. Базы знаний на примере языка Пролог.

    презентация [51,3 K], добавлен 17.10.2013

  • Классификация систем поддержки принятия решений. Сравнительный анализ методик для оценки рисков розничного кредитования. Структура системы поддержки принятия решений, формирование начальной базы знаний. Проектирование базы данных информационной системы.

    дипломная работа [1,9 M], добавлен 10.07.2017

  • Проектирование системы принятия решения для аттестации знаний абитуриента на основе тестирования. Особенности создания базы данных и плана перевозок с минимизацией затрат. Разработка информационно-логической модели предметной области "Книга" с атрибутами.

    курсовая работа [7,9 M], добавлен 10.10.2012

  • Рассмотрение понятия и истории возникновения систем поддержки принятия решения. Приспособленность информационных систем к задачам повседневной управленческой деятельности. Понятие термина "интеллектуальный анализ данных". Методика извлечения знаний.

    реферат [79,8 K], добавлен 14.04.2015

  • Методы решения проблем, возникающих на стадиях и этапах процесса принятия решений, их реализация в информационных системах поддержки принятия решений (СППР). Назначение СППР, история их эволюции и характеристика. Основные типы СППР, области их применения.

    реферат [389,3 K], добавлен 22.11.2016

  • Разработка экспертной системы по выбору языка программирования, отвечающего критериям разработчика: представление базы знаний; выбор и обоснование механизма вывода решения. Программа формирования основного меню, реализация механизма выработки решения.

    курсовая работа [2,5 M], добавлен 15.08.2012

  • Принципы составления простейших логических программ на примере баз знаний "Родственные отношения". Составление ориентированного графа без циклов, решения алгебраических уравнений с легко воспринимаемой внутренней логикой. Алгоритмы и листинги программ.

    лабораторная работа [50,5 K], добавлен 24.01.2014

  • Обзор автоматизированных систем обучения и контроля знаний. Психологические механизмы усвоения знаний. Принципы создания тестирующей программы. Разработка универсальной схемы построения теста и вычисления оценок специалистов по неразрушающему контролю.

    дипломная работа [1,7 M], добавлен 24.09.2013

  • Проблема представления знаний в компьютерных системах – одна из основных проблем в области искусственного интеллекта. Исследование различных моделей представления знаний. Определения их понятия. Разработка операции над знаниями в логической модели.

    курсовая работа [51,9 K], добавлен 18.02.2011

  • Разработка методов дихотомической оценки нечетких моделей знаний операторов информационной системы о государственных и муниципальных платежах. Механизмы и принципы управления базами нечетких моделей знаний операторов, методика и этапы их идентификации.

    диссертация [2,0 M], добавлен 30.01.2014

  • Разработка, составление и отладка программного модуля "База знаний" средствами программы Quick Sales. Описание схемы базы: возможности редактирования, удаления и добавления данных. Текст программы и контрольный пример поиска через панель управления.

    курсовая работа [519,0 K], добавлен 26.01.2013

  • Понятие базы знаний для управления метаданными. Особенности баз знаний интеллектуальной системы. Языки, используемые для разработки интеллектуальных информационных систем. Классические задачи, решаемые с помощью машинного обучения и сферы их применения.

    реферат [16,9 K], добавлен 07.03.2010

  • Анализ моделей и средств построения игровой компьютерной среды предметной области. Разработка алгоритмов построения игровой компьютерной среды. Отладка и экспериментальное тестирование компьютерной игры "Представление знаний в информационных системах".

    дипломная работа [2,9 M], добавлен 12.08.2017

  • Разработка базы данных для предметной области "Подразделения предприятия – Рабочие помещения". Описание используемых данных, предметной области и результатной информации. Создание запросов, форм и отчетов в базе данных. Описание построения диаграмм.

    курсовая работа [5,6 M], добавлен 24.07.2014

  • Классы и группы моделей представления знаний. Состав продукционной системы. Классификация моделей представления знаний. Программные средства для реализации семантических сетей. Участок сети причинно-следственных связей. Достоинства продукционной модели.

    презентация [380,4 K], добавлен 14.08.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.