Разработка программной системы для метода извлечения знаний "Мысли вслух"

Характеристика этапов на пути к получению компьютерной реализации метода извлечения знаний "Мысли вслух". Основные трудности при протоколировании "мыслей вслух". Результат обработки программой неразборчивого или не имеющего содержания сообщения.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 24.02.2019
Размер файла 6,3 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Разработка программной системы для метода извлечения знаний "Мысли вслух"

Цейтлина Н.Е., Зайцева Т.В.

В данной работе были подробно описаны все этапы, которые необходимо реализовать на пути к получению программной системы - компьютерной реализации метода извлечения знаний «Мысли вслух». В дальнейшем данное приложение может быть использовано для оценки утверждений экспертов и их компетентности.

Ключевые слова: метод извлечения знаний, “Мысли вслух”.

In this paper, all the steps that need to be implemented on the way to obtaining a software system - the computer implementation of the method of extracting knowledge "Thoughts out loud" - were described in detail. In the future, this application can be used to assess the statements of experts and their competence. мысль вслух протоколирование компьютерный

Key words: method of knowledge extraction, "Thoughts aloud".

Данная работа посвящена разработке программной системы для метода извлечения знаний «Мысли вслух».

Актуальность данной работы заключается в возможности изучить структуру метода извлечения знаний «Мысли вслух», данную предметную область, попытаться ее структурировать, разработать приложение, автоматизирующее составленную формализованную методологию. Также данная работа актуальна, так как может быть использована в извлечении знаний эксперта по выбранной предметной области, позволяя определить каким образом эксперт пришел к тому или иному решению относительно поставленной задачи.

Практическая значимость полученных результатов заключается в возможности быстрого получения результатов вычислений метода извлечения знаний «Мысли вслух» и вывода по ним. Так как расчеты всех количественных значений метода извлечения знаний бывают затруднительными из-за большого количества математических операций, а выводы иногда трудно сделать из-за отсутствия наглядности результатов, пользователь часто может допускать ошибки, учитывая человеческий фактор. Учитывая вышеприведенное, имеет смысл реализовать программное средство, производящее все расчеты количественных значений и делающее выводы на основе результатов расчетов.

Объектом данной работы является анализ протоколов "мыслей вслух". Предметом данной работы является извлечение знаний методом анализа протоколов "мыслей вслух".

Для достижения поставленной цели необходимо знать предметную область, составить формализованную методику, реализовать по ней программное средство.

Протоколирование "мыслей вслух" заключается в том, что эксперта-специалиста просят не просто прокомментировать свои действия и решения, но и объяснить, как это решение было найдено, т.е. продемонстрировать всю цепочку рассуждений. Во время рассуждений специалиста все его слова, весь "поток сознания" протоколируется; при этом отмечаются даже паузы и междометия. Иногда этот метод называют "вербальные (словесные) отчеты".

Вопрос об использовании диктофонов является спорным, поскольку запись иногда действует на специалиста парализующе, разрушая атмосферу доверительности, которая может и должна возникать при непосредственном общении.

Основная трудность при протоколировании "мыслей вслух" состоит в том, что человеку принципиально сложно объяснить, как он думает. Существуют экспериментальные психологические доказательства того факта, что люди не всегда в состоянии достоверно описывать мыслительные процессы. Кроме того, некоторые знания, хранящиеся в невербальной форме, вообще слабо коррелируют с их словесным описанием.

Расшифровку полученных протоколов аналитик проводит самостоятельно с коррекциями на следующих сеансах извлечения знаний. Удачно проведенное протоколирование "мыслей вслух" - один из наиболее эффективных методов, поскольку в нем эксперт может проявить себя максимально ярко, он ничем не скован, свободен в потоке собственных умозаключений и рассуждений.

Метод "мысли вслух" требует от аналитика тех же умений, что и метод наблюдений. Обычно "мысли вслух" дополняются потом одним из активных методов для реализации обратной связи.

Для извлечения знаний из эксперта в данной работе выбран метод анализа протоколов «мыслей вслух», так как данный метод позволяет понять каким образом эксперт пришел к данному решению, выстроить логическую цепочку его рассуждений.

В данной работе формализация происходит за счет выбора ключевых слов в высказываниях эксперта и построении на их основе логической цепочки, которая является основополагающей структурой образа мышления и состава методов принятия решений конкретного эксперта. Необходимо производить запрос данных от эксперта до тех пор, пока не будет получено достаточно ключевых слов на основе высказываний эксперта для составления удовлетворяющей принципу адекватности логической цепочки. Таким образом можно получить достаточно подробные алгоритмы работы в данной предметной области или достаточно подробное обоснование почему конкретный эксперт сформулировал имеющееся изначальное мнение по тому или иному вопросу или какой-либо задаче выбора, классификации или обозначенной проблеме.

В первую очередь происходит получение начальной гипотезы от эксперта, которая и будет являться его основным высказыванием, так как все дальнейшие его высказывания будут использоваться в качестве пояснения первоначального высказывания. Далее производится семантический анализ текста гипотезы, с его помощью оценивается текст, как набор семантических конструкций. После семантического анализа гипотезы представляется возможность выбрать ключевые слова и среди них выбрать главное слово относительно которого, эксперт должен дать пояснение своей гипотезе. Далее работает цикл до того момента как система не соберет достаточных сведений для построения логической цепочки. Данный цикл заключается в следующем: происходит запрос эксперту на пояснение выше сказанного, это может быть гипотеза или предыдущее пояснение, затем эксперт высказывает системе свое объяснение, после чего производится семантический анализ текста пояснения, после которого исполняется поиск ключевого слова методом аналогичным для первоначальной гипотезы.

Данное программное обеспечение было создано на языке программирования высокого уровня Python в качестве бота в мессенджере Telegram, в процессе разработки использовался фреймворк для распознавания речи Yandex SpeechKit, в качестве СУБД использовалась нереляционная СУБД MongoDB. Следует подробнее описать данный стек технологий.

Гипотезы, аргументы и логические цепочки экспертов хранятся в коллекциях в базе данных.

Рисунок 1 - База данных системы

Обработка голосовых сообщений, посылаемых боту происходит за счет слушателей событий, представленных в API. Получая такое голосовое сообщение программа передает его в соответствующий метод, где в первую очередь происходит преобразование аудиоданных в текстовые данные, затем с помощью семантического анализа происходит выбор ключевых слов, запись их в коллекции и на основании всех этих данных бот просит пользователя прокомментировать свои высказывания. Сохранение в базу данных происходит только в конце диалога, так как необходимо, чтобы записываемые высказывания были объединены в одну группу для построения отчета. Основной программный код приведен в приложении.

Полноценный набор из гипотезы и пояснений приведен ниже.

Капучино - лучший выбор.

Пояснения:

Этот напиток содержит молочные компоненты

А также сиропы

Например мятный или карамельный

Результат ввода гипотезы представлен на рисунке 2.

Рисунок 2 - Результат ввода гипотезы

Результат первого пояснения представлен на рисунке 3.

Рисунок 3 - Результат ввода первого пояснения

Результат ввода второго пояснения представлен на рисунке 4.

Рисунок 4 - Результат ввода второго пояснения

Результат ввода третьего пояснения и полученная логическая цепочка представлены на рисунке 5.

Рисунок 5 - Результат третьего пояснения и полученная логическая цепочка.

Получив несколько мнений экспертов можно сформировать полноценный отчет. Его можно получить отправив команду “/report” и ключевое слово, по которому необходим отчет. Пример отчета представлен на рисунке 6.

Рисунок 6 - Пример отчета

Результат обработки программой неразборчивого или не имеющего содержания сообщения представлен на рисунке 7.

Рисунок 7 - Результат обработки не имеющего смысла сообщения

Если было введено сообщение, которое невозможно распознать, то сеанс работы с экспертом однозначно завершается.

В данной работе были подробно описаны все этапы, которые необходимо реализовать на пути к получению программной системы - компьютерной реализации метода извлечения знаний «Мысли вслух». В дальнейшем данное приложение может быть использовано для оценки утверждений экспертов и их компетентности. В итоге было получено программное средство, выполняющее поставленные задачи, цель была достигнута.

Список использованных источников

1. Аверкин, А.Н. Толковый словарь по искусственному интеллекту / А.Н. Аверкин, М.Г. Гаазе-Рапопорт, Д.А. Поспелов - М.: Радио и связь, 1992.

2. Попов, Э.В. Искусственный интеллект: В 3 кн. Кн 1. Системы общения и экспертные системы: Справочник / Э.В. Попов - М.: Радио и связь, 2012.

3. Осипов, Г. С. Приобретение знаний интеллектуальными системами / Г.С. Осипов - М.: Наука, 1997.

4. Осуга, С. Обработка знаний: Пер. с яп / С. Осуга - М.: Мир, 1989.

5. Попов, Э.В. Экспертные системы / Э.В. Попов - М: Наука,

1987. - 288 с.

6. Хейес-Рот, Ф. Построение экспертных систем: Пер. с англ. / Под ред. Ф. Хейес-Рота, Д. Уотермена, Д. Лената. - М.: Мир, 2012.

Размещено на Allbest.ru

...

Подобные документы

  • Понятие информационных систем и принципы их проектирования. Изучение различных методов извлечения знаний, построение оптимальной информационной системы Data Mining, позволяющей разбивать набор данных, представленных реляционными базами данных на кластеры.

    аттестационная работа [4,7 M], добавлен 14.06.2010

  • Гибкая технологии извлечения знаний из нейронных сетей, настраиваемой с учетом предпочтений пользователя. Тестирование, пробная эксплуатация и разработка новой версии программных средств, реализующих данную технологию. Индивидуальные пространства смыслов.

    дипломная работа [336,3 K], добавлен 07.06.2008

  • Использование информационных технологий в учебном процессе. Тестирование как средство контроля знаний. Разработка компьютерной системы тестирования знаний. Описание языка программирования. Вредные факторы воздействия компьютера на здоровье человека.

    дипломная работа [562,2 K], добавлен 06.06.2014

  • Описание метода обработки "Выделение контурных линий" и особенностей его применения и программной реализации. Способы увеличения контрастности. Значение правильного подбора формы гистограммы для качества компьютерной обработки растрового изображения.

    курсовая работа [940,2 K], добавлен 24.06.2013

  • История развития программирования от 50-х годов ХХ века до сегодняшних дней. Характеристика понятия и основных задач программной инженерии как отрасли компьютерной науки. Ядро профессиональных знаний SWEBOK. Свод знаний по управлению проектами PMI PMBOK.

    презентация [86,8 K], добавлен 14.08.2013

  • Структура контрольно-оценочной деятельности. Разработка набора инструментальных средств поддержки тестового контроля знаний. Расчет затрат на разработку программной системы с использованием постархитектурной модели COCOMO II. Нормирование шума и вибрации.

    дипломная работа [5,4 M], добавлен 21.11.2012

  • База знаний - структурированная информация из области знаний для использования кибернетическим устройством (человеком). Классификация, структура, формат представления знаний, интеллектуальные системы поиска информации. Базы знаний на примере языка Пролог.

    презентация [51,3 K], добавлен 17.10.2013

  • Data Mining как процесс поддержки принятия решений, основанный на поиске в данных скрытых закономерностей (шаблонов информации). Его закономерности и этапы реализации, история разработки данной технологии, оценка преимуществ и недостатков, возможности.

    эссе [36,8 K], добавлен 17.12.2014

  • Определения знаний и приобретения знаний человеком. Виды знаний и способы их представления. Приобретение и извлечение знаний. Визуальное проектирование баз знаний как инструмент обучения. Программное обеспечение для проведения лабораторных работ.

    дипломная работа [960,9 K], добавлен 12.12.2008

  • Анализ процессов диагностики повреждений трубопровода. Разработка модели продукционной базы знаний: обзор методов представления знаний, описание создания базы знаний и разработки механизма логического вывода. Экономическое обоснование концепции проекта.

    дипломная работа [3,0 M], добавлен 16.04.2017

  • Разработка и внедрение автоматизированного комплекса проверки знаний, позволяющего производить одновременный контроль знаний до 127 рабочих мест. Система сбора и обработки информации на основе локальной микросети на базе микропроцессорных контроллеров.

    курсовая работа [37,2 K], добавлен 23.12.2012

  • Проблема представления знаний. Представление декларативных знаний как данных, наделенных семантикой. Представление процедурных знаний как отношений между элементами модели, в том числе в виде процедур и функций. Представление правил обработки фактов.

    курсовая работа [33,1 K], добавлен 21.07.2012

  • Анализ моделей и средств построения игровой компьютерной среды предметной области. Разработка алгоритмов построения игровой компьютерной среды. Отладка и экспериментальное тестирование компьютерной игры "Представление знаний в информационных системах".

    дипломная работа [2,9 M], добавлен 12.08.2017

  • Обоснование выбора метода извлечения ключевых слов. Анализ предметной области, проектирование информационной системы поиска релевантных документов. Реализация запросов к электронным библиотекам. Реализация интерфейса системы поиска релевантных документов.

    дипломная работа [1,1 M], добавлен 21.09.2016

  • Обоснование необходимости систем компьютерного тестирования. Выбор среды программирования. Специфика сферы логистики. Организация программной среды аудита знаний. Используемые элементы среды программирования. Разработка алгоритма работы программы аудита.

    дипломная работа [809,9 K], добавлен 07.01.2017

  • Исследование алгоритмов и характеристик существующих программных систем аналогов для проверки знаний: Aму Life Test Gold, SunRav TestOfficePro. Разработка архитектуры программной системы. Проверка программы в нормальных условиях, руководство пользователя.

    курсовая работа [2,5 M], добавлен 17.06.2012

  • Программные системы искусственного интеллекта, экспертные системы как их разновидность. Автоматизированное формирование баз знаний в формате CLIPS на основе анализа баз данных СУБД Cache. Программные средства и технологии. Описание программной системы.

    дипломная работа [5,1 M], добавлен 25.05.2012

  • Особенности метода неопределенных множителей Лагранжа, градиентного метода и метода перебора и динамического программирования. Конструирование алгоритма решения задачи. Структурная схема алгоритма сценария диалога и описание его программной реализации.

    курсовая работа [1010,4 K], добавлен 10.08.2014

  • Фреймовые модели представления знаний. Разработка структуры фреймов для реализации экспертной системы. Разработка экспертной системы с фреймовой моделью представления знаний. Редактирование базы фактов кандидатов и описание режима консультации.

    курсовая работа [1,3 M], добавлен 13.10.2012

  • Классы и группы моделей представления знаний. Состав продукционной системы. Классификация моделей представления знаний. Программные средства для реализации семантических сетей. Участок сети причинно-следственных связей. Достоинства продукционной модели.

    презентация [380,4 K], добавлен 14.08.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.