Методика автоматизированного формирования тестовых материалов при онтологическом подходе к оценке знаний обучаемых

Оценка знаний в сфере профессионального обучения. Описание процесса формирования тестовых заданий. Структура обеспечивающих средств для реализации и внедрения предлагаемых новшеств. Анализ технического, информационного и программного обеспечения.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 08.10.2018
Размер файла 3,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МИНИСТЕРСТВО ОБРАЗОВАНИЯ И НАУКИ РФ

ФГБОУ ВО

«САМАРСКИЙ ГОСУДАРСТВЕННЫЙ АРХИТЕКТУРНО-СТРОИТЕЛЬНЫЙ УНИВЕРСИТЕТ»

Кафедра информационных и развивающих образовательных систем и технологий

ПОЯСНИТЕЛЬНАЯ ЗАПИСКА

на тему: «Методика автоматизированного формирования тестовых материалов при онтологическом подходе к оценке знаний обучаемых»

Студента

Пузанкова Н.М.

Самара 2016 г

РЕФЕРАТ

Выпускная квалификационная работа.

Пояснительная записка: 97 с., 18 рис., 11 табл., 32 источника, 4 приложения.

ИНФОРМАЦИОННЫЕ СИСТЕМЫ, ТЕСТИРОВАНИЕ, АВТОМАТИЗАЦИЯ, ОБРАЗОВАТЕЛЬНЫЕ СИСТЕМЫ, ПРЕДСТАВЛЕНИЕ ЗНАНИЙ, ОНТОЛОГИЯ, УНИФИЦИРОВАННАЯ ФРЕЙМОВАЯ СТРУКТУРА, КОНТРОЛЬ УСПЕВАЕМОСТИ.

Объектом проектирования является автоматизированная система создания тестового материала при онтологическом подходе к оценке знаний обучаемых.

Цель работы - создания методики автоматизированного процесса разработки тестового материала для учебных заведений при промежуточном и итоговом тестировании учащихся.

Разработано информационное и программное обеспечение системы по методологии UML. В качестве средства представления знаний об онтологии предметной области используется унифицированная фреймовая структура данных.

Предложены эффективные и инновационные методики автоматизированной разработки тестового материала, позволяющие снять задачу по созданию тестового материала с преподавателя.

Выполнено технико-экономическое обоснование проекта и результаты внедрения.

СОДЕРЖАНИЕ

ВВЕДЕНИЕ

1. ПОСТАНОВКА ПРОБЛЕМЫ

1.1 Оценка знаний в сфере профессионального обучения

1.2 Сравнительный анализ методов оценки знаний

1.3 Цели выпускной квалификационной работы

1.4 Новые идеи автоматизации оценки знаний

1.5 Задачи выпускной квалификационной работы

1.6 Актуальность, новизна, практическая значимость выпускной квалификационной работы

1.7 Используемые методы и подходы

2. ФОРМУЛИРОВАНИЕ, ОБОСНОВАНИЕ И ФОРМАЛИЗОВАННОЕ ОПИСАНИЕ ПРЕДЛАГАЕМЫХ НОВШЕСТВ

2.1 Обоснование предлагаемых новых конкурентноспособных идей

2.2 Технология формализованного описания предлагаемых новшеств

2.3 Описание метода формирования тестовых заданий

2.4 Формализованное описание процесса формирования тестовых заданий

2.5 Структура обеспечивающих средств для реализации и внедрения предлагаемых новшеств

2.6 Бизнес-план разработки и реализации предлагаемых новшеств

3. РАЗРАБОТКА ИНФОРМАЦИОННОЙ СИСТЕМЫ ТЕСТИРОВАНИЯ ЗНАНИЙ

3.1 Математическое обеспечение

3.2 Проектно-конструкторская документация

3.3 Техническое обеспечение

3.4 Информационное обеспечение

3.5 Программное обеспечение

3.6 Кадровое обеспечение

3.7 Методическое обеспечение

3.8 Материалы направленные на распространение и воспроизведение знаний, необходимых для практической реализации предлагаемых новшеств

4. ИССЛЕДОВАНИЕ ЭФФЕКТИВНОСТИ ИНФОРМАЦИОННОЙ СИСТЕМЫ ТЕСТИРОВАНИЯ ЗНАНИЙ В ПРОЦЕССЕ ВНЕДРЕНИЯ

4.1 Описание объекта внедрения

4.2 Описание хода внедрения

4.3 Описание результатов внедрения

4.4 Анализ результатов и вывод

5. ОПЫТ И РЕЗУЛЬТАТЫ ТВОРЧЕСКОЙ АКТИВНОСТИ В ПЕРИОД ОБУЧЕНИЯ

5.1 Сведения о деятельности возглавляемого научного микроколлектива

5.2 Сведения о трудовой деятельности

5.3 Наиболее значимые профессиональные сертификаты

5.4 Перечень публикаций

5.5 Перечень участия в конференциях

5.6 Перечень выполненных в период обучения курсовых работ и проектов

5.7 Портфолио

ЗАКЛЮЧЕНИЕ

СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

ПРИЛОЖЕНИЕ

ВВЕДЕНИЕ

В современном мире остро стоит вопрос оценки качества обучения как во время обучения, для промежуточной аттестации, так и после окончания обучения для итоговой аттестации. Имеется множество форм и методов оценки знаний обучаемых, применяющиеся в зависимости от задач обучения, уровня учебного заведения, подготовки и профессионализма преподавателя. Самое большое распространение, как для промежуточного контроля, так и для итоговой аттестации получила тестовая форма оценки знаний обучаемых. Все больше учителей находят этот способ удобным, в связи с простотой проведения тестирований, а также быстротой проверки полученных результатов путем сверки ответов учеников с ключами теста.

Тестирование обрело популярность и распространение также на федеральном уровне. ГИА или основной государственный экзамен - это основной обязательный вид экзамена в 9 классе средней школы в России, также использует тестовую форму контроля знаний и служит для контроля знаний, полученных учащимися за 9 лет, а также для приёма в учреждения среднего профессионального образования (колледжи и техникумы) [1]. ЕГЭ или единый государственный экзамен, также использующий тестовую форму контроля знаний, служит одновременно выпускным экзаменом из школы и вступительным экзаменом в вузы [2]. Но именно такое распространение тестирования открыло новые проблемы и вызовы. При проведении единого государственного экзамена на всей территории России применяются однотипные задания и единые методы оценки качества выполнения работ.

Количество вариантов тестовых заданий ограниченно, что не позволяет сделать тестирование всех учащихся России честным. Зачастую тестовые задания попадают в общественный доступ еще до начала самых первых экзаменов на востоке страны. Несмотря на кажущуюся проблематичность, на самом деле это не является проблемой тестирования, а лишь следствием.

Сама же проблема процесса тестирования - это трудоемкость подготовки качественного тестового материала, достаточного для предоставления адекватного количество вариантов тестовых заданий.

Поэтому целью работы является создание методики автоматизированного формирования тестовых материалов и информационной системы, позволяющей заполнять знания предметной области и формировать вопросы для тестовых заданий. Автоматизация процесса создания тестовых вопросов позволит проводить тестирование знаний большого числа обучаемых с достаточным для этого разнообразием вариантов тестовых заданий.

Методика автоматизации создания тестовых материалов включает в себя описание представления исходных знаний предметной области, формы и типы вопросов разрабатываемых для формирования тестовых заданий, алгоритмы автоматизированного построения тестовых вопросов на основании исходных знаний предметной области и рекомендации по использованию информационной системы.

В работе используются онтологические методы представления исходных данных. Для автоматизированной разработки тестовых заданий используются методы программной инженерии, логики предикатов и теории графов.

Новизна научной работы заключается в инновационном подходе к решению представленной проблемы автоматизации процесса формирования тестовых материалов.

В качестве представления исходных знаний предметной области используется унифицированная фреймовая структура данных, выгодно отличающаяся от других форм представления данных при онтологическом подходе. Была разработана методика формирования тестовых материалов с описанием типов и форм представления вопросов. Специально для автоматизированного формирования вопросов описанной формы и типа на основании представленных в виде УФС знаний предметной области был разработан алгоритм генерации тестовых вопросов. Отличительными особенностями такой системы является возможность представления исходных данных любой предметной области и получение большого количества вариантов тестовых заданий на основании исходных знаний.

Практическая значимость работы заключается в возможности использования разработанной информационной системы в различных сферах деятельности, как либо связанных с контролем и оценкой знаний. Хорошее методическое сопровождения также предоставляет возможность для расширения функционала информационной системы как со стороны проведения тестирования (создание и разработка модулей проведения тестирования и анализа полученных результатов), так и со стороны перевода исходных знаний сырого формата (лекций, учебников, методических указаний) в унифицированную фреймовую структуру данных.

Основные результаты работы докладывались на внутри вузовской конференции СГАСУ ФИСТ и на международной практической конференции «Перспективные информационные технологии 2016». Имеются публикации в сборниках трудов конференций ПИТ-2015, ПИТ-2016, научной конференции СГАСУ 2015[3,4].

Работа состоит из введения, пяти глав, заключения и списка литературы.

Первая глава является вводной и посвящена исследованию и систематизации подходов к решению проблемы представления и оценки знаний. В разделе 1.1 рассматривается анализ области оценки знаний и направления ее развития. В 1.2 сравниваются существующие подходы и методы разрешения выявленных проблем развития области. В разделе 1.3 ставятся цели выпускной квалификационной работы. В 1.4 формулируются предлагаемые новые идеи в области теории и практики информационных систем и технологий, способствующих решению выявленных проблем развития. В разделе 1.5 формулируются задачи выпускной квалификационной работы, решение которых необходимо для достижения цели. В разделе 1.6 представлена актуальность, новизна и практическая значимость выпускной квалификационной работы. В 1.7 дается краткая характеристика используемых в ВКР методов.

Вторая глава содержит формулирование, обоснование и формализованное описание предлагаемых новшеств. В разделе 2.1 формулируются и обосновываются предлагаемые новые конкурентоспособные идеи в области теории и практики информационных технологий и систем для решения поставленной проблемы. Раздел 2.2 описывает профессиональные технологии используемые для формализованного описания предлагаемых новшеств. В разделе 2.3 содержится описание используемых в ВКР методов. Раздел 2.4 содержит формализованное описание предлагаемых новшеств. А раздел 2.5 показывает структуру обеспечивающих средств для реализации и внедрения предлагаемых новшеств. В разделе 2.6 представлен бизнес-план разработки и реализации предлагаемых новшеств.

Третья глава описывает разработку некоторых элементов обеспечения и реализации предлагаемых новшеств. В разделе 3.1 представлено описание математического обеспечения ВКР. Раздел 3.2 содержит проектно-конструкторскую документацию. 3.3 включает техническое обеспечение ВКР. Раздел 3.4 - информационное обеспечение. В разделе 3.5 находится описание программного обеспечения. А раздел 3.6 содержит информацию о кадровом обеспечении. Раздел 3.7 описывает методическое обеспечение. В разделе 3.8 указаны материалы, направленные на распространение и воспроизведение знаний необходимых для практической реализации предлагаемых новшеств.

Четвертая глава содержит исследование эффективности предлагаемых новшеств в процессе внедрения. Раздел 4.1 описывает объект внедрения. 4.2 содержит описание самого хода внедрения. В разделе 4.3 описаны результаты внедрения. Раздел 4.4 содержит анализ и выводы о внедрении.

Пятая глава анализирует опыт и результаты творческой активности студента в период обучения. Раздел 5.1 содержит сведения о деятельности возглавляемого научного микроколлектива. 5.2 представляет сведения о трудовой деятельности. В разделе 5.3 указаны наиболее значимые профессиональные сертификаты. Раздел 5.4 содержит перечень публикаций. А раздел 5.5 перечень участия в конференциях. В разделе 5.6 перечислены выполненные в период обучения курсовые работы и проекты. Раздел 5.7 представляет портфолио.

В заключении перечисляются основные результаты выпускной квалификационной работы.

1. ПОСТАНОВКА ПРОБЛЕМЫ

1.1 Оценка знаний в сфере профессионального обучения

Слово «тест» в переводе с английского означает «задача, испытание». Тестирование -- это целенаправленное, равное для всех испытуемых обследование, проводимое в строго контролируемых условиях. Такая проверка позволяет объективно оценивать характеристики и результаты обучения, воспитания, развития учащихся, рассматривать параметры педагогического процесса. От других способов проверки тестирование отличается точностью, простотой, доступностью, возможностью автоматизации. Само тестирование -- далеко не новый, но до современной истории России мало применяемый в отечественной педагогике метод исследования. Еще в 80-90-е гг. XIX в. исследователи начали изучать индивидуальные различия людей. Это привело к возникновению так называемого испытательного эксперимента -- исследования с помощью тестов (А. Дальтон, А. Кеттел и др.). Применение тестов послужило толчком для развития психометрического метода, основы которого были заложены Б. Анри и А. Бине [5]. Измерение школьных успехов, интеллектуального развития, степени сформированности многих других качеств с помощью тестов стало неотъемлемой частью широкой учебно-воспитательной практики. В наше время тестирование знаний -- это востребованный инструмент, выполняющий диагностическую, обучающую и воспитательную функцию, который используется повсеместно и не ограничивается образовательными учреждениями.

По сравнению с другими формами контроля знаний тестирование имеет свои преимущества и недостатки.

Преимущества:

- Тестирование является более качественным и объективным способом оценивания, его объективность достигается путем стандартизации процедуры проведения, проверки показателей качества заданий и тестов целиком.

- тестирование -- более справедливый метод, оно ставит всех учащихся в равные условия, как в процессе контроля, так и в процессе оценки, практически исключая субъективизм преподавателя. По данным английской ассоциации NEAB, занимающейся итоговой аттестацией учащихся Великобритании, тестирование позволяет снизить количество апелляций более чем в три раза, сделать процедуру оценивания одинаковой для всех учащихся вне зависимости от места проживания, типа и вида образовательного учреждения, в котором занимаются учащиеся;

- тесты это более объёмный инструмент, поскольку тестирование может включать в себя задания по всем темам курса, в то время как на устный экзамен обычно выносится 2-4 темы, а на письменный -- 3-5. Это позволяет выявить знания учащегося по всему курсу, исключив элемент случайности при вытаскивании билета. При помощи тестирования можно установить уровень знаний учащегося по предмету в целом и по отдельным его разделам;

- тест это более точный инструмент, так, например, шкала оценивания теста из 20 вопросов, состоит из 20 делений, в то время, как обычная шкала оценки знаний -- только из четырёх;

- тестирование более эффективно с экономической точки зрения. Основные затраты при тестировании приходятся на разработку качественного инструментария, то есть имеют разовый характер. Затраты же на проведение теста значительно ниже, чем при письменном или устном контроле. Проведение тестирования и контроль результатов в группе из 30 человек занимает полтора два часа, устный или письменный экзамен -- не менее четырёх часов;

- тестирование -- это более мягкий инструмент, они ставят всех учащихся в равные условия, используя единую процедуру и единые критерии оценки, что приводит к снижению предэкзаменационных нервных напряжений.

Недостатки:

- разработка качественного тестового инструментария -- длительный, трудоемкий и дорогостоящий процесс. Стандартные наборы тестов для большинства дисциплин ещё не разработаны, а разработанные обычно имеют очень низкое качество;

- данные, получаемые преподавателем в результате тестирования, хотя и включают в себя информацию о пробелах в знаниях по конкретным разделам, но не позволяют судить о причинах этих пробелов;

- тест не позволяет проверять и оценивать высокие, продуктивные уровни знаний, связанные с творчеством, то есть вероятностные, абстрактные и методологические знания;

- широта охвата тем в тестировании имеет и обратную сторону. Учащийся при тестировании, в отличие от устного или письменного экзамена, не имеет достаточно времени для сколько-нибудь глубокого анализа темы;

- обеспечение объективности и справедливости теста требует принятия специальных мер по обеспечению конфиденциальности тестовых заданий. При повторном применении теста желательно внесение в задания изменений;

- в тестировании присутствует элемент случайности. Например, учащийся, не ответивший на простой вопрос, может дать правильный ответ на более сложный. Причиной этого может быть, как случайная ошибка в первом вопросе, так и угадывание ответа во втором. Это искажает результаты теста и приводит к необходимости учета вероятностной составляющей при их анализе[6].

Как видно из списка недостатков педагогического тестирования наиболее трудоемкой задачей является создание банка тестовых вопросов. Кроме того, что оно производится вручную, составитель выполняет задачу на основе тех знаний, которыми обладает лично составитель тестов или на основании материалов, которыми он владеет и располагает. И при этом разработка качественного тестового инструментария является достаточно трудоемким процессом [7,8].

Пятибалльная система оценивания не является мировой общепринятой системой. В большинстве стран мира действует более широкая шкала оценок - от 6 (Польша) до 100-балльной (Япония). С недавнего времени в школах Украины введена 12-балльная система оценивания. Отличником считается школьник, который учится на «10», «11» и «12». Учащийся, оканчивающий школу с такими оценками, награждается золотой медалью. В Латвии учеников оценивают по 10-балльной системе. Успехи учеников по каждому курсу регулярно оцениваются на письменном или устном зачёте. Если знаний, умений практически нет или проверочная работа не сдана без уважительной причины, то выставляется 0 баллов. Для педагогов 10 - балльная система по сравнению с 5 - балльной даёт больше возможностей показать нюансы в его учебной деятельности, а промежуточное положение «почти хорошо» призывает ученика постараться, чтобы получить «хорошо», почти «посредственно» предупреждает о возможности скатиться вниз, показывает, что ученик находиться в критическом состоянии. Такая оценка является более сильным мотивационным стимулом, чем 5 - балльная система, не говоря о большей точности 10 -балльной системы. Такая же система действует и в Молдавии. Во Франции учатся по 20-балльной шкале. При этом высшая оценка, как правило - 18 баллов. Французы твердо уверены, что 20 может получить лишь Господь Бог, а 19 - господин учитель. Высший пилотаж - заработать 14 - 16 баллов. Большинство французских «хорошистов» получают от 10 до 12 - 14 баллов. В Германии принята 5-балльная система оценок. Правда, оценки ставятся в обратном порядке. Наивысшая оценка - 1, самая плохая - 5. Напоминает спортивные разряды.

В финской школе к традиционным числовым методам оценивания (7-ми бальная шкала оценок - от 4-х до 10) сегодня прибавляются устные методы. В устной оценке числовые показатели заменяются словами «превосходно», «хорошо», «удовлетворительно», что, по мнению финских педагогов, поддерживает положительный образ ученика. В Великобритании, например, вообще принята не отметочная, а словесная оценка работы ученика, что позволяет дать более полную и развернутую характеристику школьника. Именно это в последующем помогает не совершать ребенку ошибок.

Форма оценивания выглядит так: Фамилия, имя ученика. Учебный предмет. Дата заполнения. Характеризуемый период времени (1, 4 или 12 недель). Общая характеристика успеваемости ученика по предмету - развёрнутое мнение учителя[9].

Несмотря на все кажущееся разнообразие систем оценки знаний обучающихся подход остается неизменным. Оценка знаний обучаемых о конкретной области предмета, проводимая в устной или письменной форме, затем выражается в одной общей оценке с градацией от «неудовлетворительно» к «отлично». Эта оценка не раскрывает целый ряд важных с точки зрения контроля обучения параметров:

- знание или незнание конкретных понятий и связей;

- объем имеющихся знаний по конкретной области;

- уровень понимания пройденного материала;

- умение применять имеющиеся знания при решении практических задач и т.д.

Общая оценка знаний является недостаточно информативной, а получение более подробной информацией стандартными средствами - трудоемким и затратным процессом.

Суммируя все вышесказанное можно выявить следующие основные проблемы развития тестирования как способа оценки знаний обучаемых:

- трудоемкость составления тестовых заданий;

- необходимость в ручном поддержании актуальности тестовых заданий;

- сложность в составлении достаточного количества разнообразных тестовых заданий при тестировании большого числа обучаемых;

- отсутствие единого подхода к формированию онтологии предметной области.

1.2 Сравнительный анализ методов оценки знаний

Существует множество различных решений указанных проблем, как по отдельности, так и комплексно. Для начала рассмотрим основные подходы и методы оценки знаний обучаемых не ограничиваясь тестированием.

Неформальные способы: Письменное размышление - когда студенту после прохождения материала или урока предлагается написать отзыв о полученных за этот период знаниях. Опрос в различных его формах. Проверка понимания - когда преподаватель выполняет определенные действия для получения отклика от студентов, и повторения материала если требуется. “Оберточные” активности, используемые для помощи студенту в развитии навыков самоконтроля в процессе обучения.

Формальные способы: Внутриклассовые активности - организация работы студентов в группах, в парах, для решения поставленных перед ними задач, обмена знаниями и развития коммуникативных навыков. Тестирование - как средство оценки основных знаний. Обучающие модули - разбиение предмета на модули с контролем и оцениванием каждого отдельного модуля. Проекты - работы команд студентов выдаются в виде проектов на внешнюю оценку.

Суммарные или итоговые способы: Экзамены, выпускные работы и портфолио[10].

Сейчас наибольшее распространение имеют средства автоматизации тестирования для получения более подробной информации о знаниях обучаемого. В рамках создания средств автоматизированного тестирования знаний возникает задача перевода исходных знаний из формы представления понятной человеку (лекции, методички, презентации, учебники, статьи) в форму понятную машине. Перспективным подходом представления знаний является онтологический[11]. В различных системах используются разные формы представления онтологий знаний, такие как OWL или фреймовая среда [12].

Возьмем основные средства используемые для решения поставленных задач и разделим их на две категории.

Неонтологические средства:

- Cardiac Tutor

- СДО Стимул

- START

Онтологические средства:

- AutoTutor

- IBM Watson

В таблице 1представленосравнениеинформационной системы разрабатываемой в рамках ВКР и ее аналогов.

Таблица 1 - Сравнение аналогов

Функция

AutoTutor

CardiacTutor

СДО Стимул

START

IBM Watson

ИС ВКР

Обработка естественного языка

+

+

Работа с онтологией предметной области

+

+

+

Генерация вопросов

+

+

Проведение тестирования

+

+

+

+

+

Анализ ответов

+

+

+

+

AutoTutor. Это интеллектуальная обучающая система разработанная в Институте Интеллектуальных Систем Университета Мемфис. Система симулирует диалог преподавателя со студентом. Студент используя определенные лексические формы может производить общение с ИС[13].

CardiacTutor. Это система представляет собой симуляцию сердечных проблем, которые должны быть решены студентами используя определенную последовательность шагов. Система предоставляет советы и голосовое сопровождение. На выходе система представляет отчет о работе студента [14].

СДО Стимул - это комплексное многофункциональное решение для управления дистанционным обучением[15]. Основными целями внедрения СДО являются:

- повышение качества общего образовательного процесса за счет использования информационных технологий;

- увеличение охвата обучаемой аудитории и сокращение издержек на проведение мониторинга знаний за счет использования технологий дистанционного обучения;

- повышение управляемости учебного процесса посредством СДО: обеспечение непрерывного мониторинга со стороны преподавателей и администрации;

- сокращение рутинной нагрузки на преподавателей;

- повышение качества и сокращение временных затрат на проверку знаний.

Система тестирования START. Позволяет создавать или загружать тест из файла. Проводить удаленное тестирование. Перемешивать задания. Ограничивать выборку вопросов, время и попытки. Предоставляет автоматическую проверку[16].

IBM Watson -- одна из первых когнитивных систем в мире. Эта система умеет очень многое, благодаря чему возможности Watson используются во многих сферах -- от кулинарии до предсказания аварий в населенных пунктах. В общем-то, большинство возможностей Watson не являются чем-то уникальным, но в комплексе все эти возможности представляют собой весьма мощный инструмент для решения разнообразных вопросов[17]. Система работает в таком порядке:

1. Получив вопрос, Watson выполняет его синтаксический анализ, чтобы выделить основные особенности вопроса.

2. Система генерирует ряд гипотез, просматривая корпус в поисках фраз, которые с некоторой долей вероятности могут содержать необходимый ответ. Для того чтобы вести эффективный поиск в потоках неструктурированной информации, нужны совершенно другие вычислительные возможности, их называют когнитивными системами.

3. Система выполняет глубокое сравнение языка вопроса и языка каждого из возможных вариантов ответа, применяя различные алгоритмы логического вывода.

4. Каждый алгоритм логического вывода выставляет одну или несколько оценок, показывающих, в какой степени возможный ответ следует из вопроса, в той области, которая рассматривается данным алгоритмом.

5. Каждой полученной оценке затем присваивается весовой коэффициент по статистической модели, которая фиксирует, насколько успешно справился алгоритм с выявлением логических связей между двумя аналогичными фразами из этой области в “период обучения” Watson. Эта статистическая модель может быть использована впоследствии для определения общего уровня уверенности системы Watson в том, что возможный вариант ответа следует из вопроса.

6. Watson повторяет процесс для каждого возможного варианта ответа до тех пор, пока не найдет ответы, которые будут иметь больше шансов оказаться правильными, чем остальные.

В таблице 2 рассмотрим дополнительные характеристики онтологическихсистем.

Таблица 2 - Характеристики онтологических систем

AutoTutor

IBM Watson

ИС ВКР

Условия лицензирования

Не представлены

Зависят от услуг

Apache License, Version 2.0[18]

Стоимость использования

Не представлена

80$ в месяц на одного пользователя с ограничениями использования

Индивидуальная плата за услуги внедрения и методическое обеспечение

Страна производитель

США

США

Россия

Необходимые мощности

Сервер

Суперкомпьютер

Сервер

IBMWATSON состоит из 90 серверов IBM p750, каждый из которых оснащён четырьмя восьми ядерными процессорами архитектуры POWER7.Суммарный объём оперативной памяти -- более 15 терабайт. Система имела доступ к 200 млн страниц структурированной и неструктурированной информации объёмом в 4 терабайта, включая полный текст Википедии[19].

С учетом этих характеристик - основным средством решения выявленных проблем является система AutoTutor, к недостаткам которой относится имеющаяся база тестовых заданий, лишь пополняемая и обновляемая на основании работы с пользователем, а также непрозрачные условия использования и лицензирования системы.

На рисунке 1 представлен экран работы с системой AutoTutor работающей под операционной системой Windows.

На рисунке 2 представлен скриншот работы модуля IBMWatsonAnalyticsв виде веб приложения. Он является лишь одним из множества дополнительных модулей основной системы. Основная их цель -использование мощностей основного модуля, но предоставление удобных в использовании инструментов, настроенных под конкретную потребность пользователя.

Рисунок 1

Рисунок 2 - Система IBM Watson

На основании сравнения можно судить, что разрабатываемая информационная система может конкурировать с системой AutoTutorв плане функциональности и решения выявленных проблем, благодаря использованию УФС и четких методических указаний к использованию. Также что система выигрывает у конкурентов по условиям лицензирования (сама информационная система распространяется как бесплатное и открытое ПО) и прозрачности услуг по внедрению и использованию. Еще одним весомым преимуществом является то, что система является национальной разработкой.

1.3 Цели выпускной квалификационной работы

В ходе анализа предметной области оценки знаний были выявлены две основные проблемы тестирования: трудоемкость создания качественного тестового материала и сложность обновления, актуализации и исправления ошибок в большом объеме тестовых заданий.

Анализ существующих систем тестирования знаний выявил, что всем им свойственны - необходимость в хранении и поддержании банка тестовых заданий и сложные схемы использования, лицензирования и расширения существующих программных продуктов.

После проведенного исследования следует выделить основную цель выпускной квалификационной работы.

Целью ВКР является разработка методики автоматизированного формирования тестовых материалов при онтологическом подходе к оценке знаний обучаемых, а также создание комплекса информационных систем позволяющего:

- строить онтологию знаний предметной области в виде унифицированной фреймовой структуры данных;

- на основании онтологии предметной области составлять набор тестовых материалов для проведения тестирования;

- выводить подготовленные тестовые материалы в форме, подходящей для проведения тестирования знаний учащихся.

1.4 Новые идеи автоматизации оценки знаний

Выпускная квалификационная работа выполняется по инновационному виду деятельности. Такой вид ВКР имеет благодаря формированию и реализации новых конкурентоспособных идей. В работе выделяются методы решения выявленных проблем оценки знаний, а также разрабатывается информационная система, реализующая эти методы. В качестве новых идей автоматизации оценки знаний обучаемых стоит отметить:

1. Формирование двух новых конкурентоспособных идей, участвующих в решении нетрадиционных задач:

a) автоматизированное формирование тестовых вопросов (исходя из онтологии предметной области тестирования), в то время как большинство аналогичных систем оценки знаний предполагают формирования вопросов из неструктурированных и сырых материалов или предварительное заполнение банков заданий заранее подготовленными вопросами;

b) применение фреймов для построения и хранения онтологий знаний - по сравнению с обычными средствами представления онтологий (owl и прочие), предоставляют единообразие описания семантических сетей, и упрощает их автоматизированную обработку в условиях неопределенности относительно оцениваемых знаний.

2. Разработка новых методов решения традиционных задач за счет хранения базы знаний в виде фреймовой структуры данных, а также генерации тестовых заданий при каждом прохождении оценки обучаемыми, такой подход конкурирует с двумя существующими подходами:

a) хранение готового банка тестовых заданий, что ограничивает количество возможных комбинаций вопросов и как итог, количество уникальных тестовых заданий. Также требует ручного формирования всех тестовых вопросов;

b) генерация тестовых заданий из исходных, необработанных материалов (лекций, конспектов, электронных методических материалов) - снижает качество генерируемых тестовых вопросов, не защищает от ошибок при распознании и работе с исходными материалами, не позволяет в полной мере раскрыть возможности машинного обучения.

Все эти идеи и предлагаемые решения позволяют говорить об инновационном характере выпускной квалификационной работы, а также высокой конкурентно способности итоговой информационной системы.

1.5 Задачи выпускной квалификационной работы

Основными задачами выпускной квалификационной работы, необходимыми для достижения поставленной цели автоматизации формирования тестовых заданий в процессе оценки знаний обучаемых, являются:

- сравнительный анализ системы и ее аналогов;

- сопровождение функционального тестирования системы;

- сопровождение разработки пользовательской документации системы;

- выявление требований к функциям системы;

- формализация и документирование требований к функциям системы;

- разработка разделов проектной документации, описывающих работу функций системы;

- анализ требований к системе и подсистеме;

- сопровождение предварительного тестирования системы и подсистемы;

- разработка концепции системы;

- разработка технико-коммерческого предложения и участие в его защите;

- разработка методик выполнения аналитических работ.

- основные функции, реализуемые в ходе выполнения ВКР:

- автоматизированное формирование тестовых вопросов (исходя из онтологии предметной области тестирования);

- применение фреймов для построения и хранения онтологий знаний.

1.6 Актуальность, новизна, практическая значимость выпускной квалификационной работы

Анализ области ИС оценки знаний показал, что в настоящее время недостаточно полно решены проблемы оценки знаний обучаемых. При повсеместном распространении тестирования как средства оценки знаний обучаемых, а соответственно все больших масштабах проводимых тестирований и большем количестве участников тестирования, процесс формирования тестовых заданий почти не претерпел значительных изменений. Разве что добавлялись и совершенствовались способы хранения и распространения тестовых заданий, для поддержания их актуальности и недопущении утечек. Основные процессы, подвергающиеся автоматизации это проведение тестирований и анализ результатов. Таким образом, актуальной задачей становится создания средств автоматизированной оценки знаний, уже со стороны процесса формирования тестовых заданий.

Если рассматривать существующие системы, реализующие подобный функционал, то в настоящее время мы видим все больше и больше информационных систем работающих в формате вопрос-ответ между человеком и вычислительной машиной, но акцент во всех этих системах ставится на получении ответов от машины. Для задач оценки знаний обучаемых нужно посмотреть под полностью противоположным углом и научить машину задать вопросы для оценки знаний человека. Современные аналоги позволяют выполнять подобные задачи с помощью банка готовых вопросов. Информационные системы знают, что спросить и автоматизации подвергается только процесс задания вопроса, но не его подготовки, которая ложится на плечи человека. Современные потребности в предоставлении большого числа разнообразных тестовых заданий требуют иного подхода к проведению оценки знаний обучаемых и подразумевают автоматизацию процесса подготовки вопросов в комплексе с автоматизацией процессов последующих проведения тестирования и анализа полученных результатов. Как уже было рассмотрено при сравнении существующих подходов к решению поставленной задачи, еще не было сформировано ни одной системы, являющейся полностью пригодной и удобной для решения поставленных проблем и выполнению целей и задач, указанных в рамках этой выпускной квалификационной работы.

Соответственно разработка методики и информационной системы, решающей эти задачи, является актуальной и целесообразной.

1.7 Используемые методы и подходы

В данном разделе рассмотрены основные методы и подходы, используемые в выпускной квалификационной работе для решения указанных проблем, достижения поставленных целей и выполнения перечисленных задач.

Основные методы по работе с данными, используемые в ВКР:

- проблема автоматизации процесса генерации тестового материала решается на основе метода представления данных через онтологии исходных знаний предметной области [20];

- представление исходной онтологии знаний предметной области происходит в форме унифицированной фреймовой структуры данных;

- логика предикатов и операции с ними используются для формирования тестовых вопросов различных форм и типов[21];

- используется теория графов для работы с иерархиями и связями понятий в унифицированной фреймовой структуре данных [22].

Подробнее стоит рассмотреть уже упомянутую много раз, но нигде подробно не описанную унифицированную фреймовую структуру данных.

Понятие (класс объектов) онтологии представлено фреймом-прототипом, имеющим уникальный идентификатор, и следующие слоты:

- имя фрейма;

- адрес хранения;

- синонимы;

- суперкласс обобщения;

- подклассы обобщения;

- состав (агрегация):

- агрегат верхнего уровня;

- мультимедийная информация;

- характеристики (свойства);

- ассоциации (логические связи горизонтального уровня);

- соединения (физические связи);

- комментарий.

Фреймы-экземпляры (объекты) создаются путём заполнения части или всех слотов конкретными значениями определённого типа.

УФС поддерживает все основные свойства и понятия распространённых языков онтологий (UML, OWL), но, в отличие от них, реализуется непосредственно в любой объектно-ориентированной среде программирования с использованием небольшой библиотеки дополнительных классов, не требуя каких-либо особых промежуточных программных средств и преобразований. В то же время переход от онтологий в форматах UML , OWL и других к УФС при необходимости может быть автоматизирован, но эта задача выходит за рамки данной работы. Ниже в таблице 3 представлено сравнение различных форматов представления онтологий.

Таблица 3 - Сравнение форматов представления онтологий

UML

OWL

УФС

Класс (Class)

Класс (Class)

Фрейм-прототип

Объект(Object)

Индивид(Individual)

Фрейм-экземпляр

Обобщение(Generalization)

Суперкласс(inverse subClassOf)

Фрейм-обобщение

Специализация(Specialization)

Подкласс(subClassOf)

Подфрейм (прямой фрейм-потомок в обобщении)

Ассоциация(Association)

Свойство-объект(ObjectProperty)

Фрейм логической(ассоциативной) связи между фреймами

Агрегация(Aggregation)

Указывается комментарием

Фрейм-агрегат

Композиция(Composition)

Указывается комментарием

Фрейм-агрегат с ограничением

Частьагрегации(Part of Aggregation)

Указывается комментарием

Фрейм состава фрейма-агрегата(прямой потомок в агрегации)

Указывается именем ассоциации или комментарием

Указывается комментарием

Фрейм физической связи(соединения) между фреймами

Атрибут(Attribute)

Свойство-значение(DatatypeProperty)

Слот фрейма

Множественность(Multiplicity)

Мин/Макс кардинальность(Min/MaxCardinality)

Слот «Множественность» фрейма логической или физической связи

Пакет(Package)

Онтология(Ontology)

База знаний

Исходные знания, представленные в виде фреймовой базы знаний, состоящей из фреймов, их связей и свойств, формируют онтологию знаний, на основании которой информационная система составляет вопросы для тестовых заданий. Подробное описание работы с УФС, алгоритмы по работе с онтологиями знаний и примеры с детальным описанием приведены в следующей главе.

2. ФОРМУЛИРОВАНИЕ, ОБОСНОВАНИЕ И ФОРМАЛИЗОВАННОЕ ОПИСАНИЕ ПРЕДЛАГАЕМЫХ НОВШЕСТВ

2.1 Обоснование предлагаемых новых конкурентноспособных идей

В качестве двух основных конкурентоспособных идей выпускной квалификационной работы представлены:

- использование унифицированной фреймовой структуры данных для представления онтологии исходных знаний предметной области, которая позволяет представить информацию в универсальном виде независимо от специализации или направленности;

- генерация тестовых заданий для каждого тестирования, по сравнению с хранением готовых тестовых заданий дает разнообразие вариантов тестов, а применение метрик для оценки качества сгенерированных заданий позволяет раз от раза генерировать все более качественный тестовый материал.

Рассмотрим каждую идею подробнее.

Использование унифицированной фреймовой структуры данных для формирования онтологии знаний предметной области, кроме универсальности по отношению к предметной области исходных знаний, также предоставляет универсальность в отношении к хранению информации (реляционные или документно-ориентированные базы данных), представлению данных (текстовая, графическая или иерархическая форма отображения), а также обработки данных - как в форме фреймов, так и в представлении XML, JSON, так и в конкретной реализации в зависимости от потребностей и предметной области. УФС также дает потенциал в возможностях автоматизации перевода исходных знаний из необработанного вида (лекций, методических указаний, учебников) в формат онтологий понятный машине.

Отказ от хранения тестовых вопросов и их повторного использования помимо большей вариативности при составлении тестов, дает преимущество при внесении изменений в онтологию исходных знаний. Поскольку вопросы формируются на основании онтологий при каждом тестировании, то они всегда содержат актуальные на текущий момент данные и знания. Обновление и поддержание актуальности тестовых заданий отдельно от исходных знаний не требуется. Также это исключает возможность нечестного использования информационной системы, для заблаговременного получения списка возможных вопросов и подготовки по этому списку, а не по исходным знаниям из лекций и других материалов.

На основании всего перечисленного можно смело утверждать что предлагаемые идеи имеют веское обоснование и являются конкурентоспособными, а значит делают и всю работу актуальной и готовой к конкуренции в области систем оценки знаний обучаемых.

2.2 Технология формализованного описания предлагаемых новшеств

Для формализованного описания методики формирования тестовых заданий используется UML стандарт версии 2.5[23].

Описание методика приводится в виде диаграммы деятельности, на которой показано разложение некоторой деятельности на её составные части. Под деятельностью понимается спецификация исполняемого поведения в виде координированного последовательного и параллельного выполнения подчинённых элементов -- вложенных видов деятельности и отдельных действий, соединённых между собой потоками, которые идут от выходов одного узла ко входам другого. Диаграммы деятельности используются при моделировании бизнес-процессов, технологических процессов, последовательных и параллельных вычислений.

Диаграмма деятельности (activitydiagram)-диаграмма, на которой показывается поведение системы в виде последовательности действий (action), деятельностей (activity) и условий их выполнения.

По своей семантике эта диаграмма соответствует схеме алгоритма или схеме программы по ГОСТ 19.701 [24], если сопоставить символу действия (деятельности) символ процесса. Однако, в UMLмогут быть использованы дополнительные символы (объекты и потоки объектов, специальные действия, события, маркеры, хранилища данных и другие), которые позволяют отобразить алгоритм работы системы в стиле сетей Петри [25]или языков моделирования бизнес-процессов типа BPMN[26].

Кроме того, в отличие от традиционного вертикального расположения диаграмма деятельности изображается в горизонтальном расположении и может использовать группировки действий в виде «плавательных дорожек» (swimlanes).

Понятия «действие» и «деятельность» схожи с теми, что представлены в диаграмме состояний. Поскольку основной смысл состояния заключался в сохранении системой выполнения некоторого условия (инварианта), например, условия исполнения некоторой деятельности, то саму диаграмму последовательной смены деятельностей можно рассматривать как частный случай диаграммы состояний. В UMLдля обозначения узла деятельности в диаграмме активности используется символ состояния, показанные на рисунке 3.

Рисунок 3- Узлы деятельности и связь между ними

Стрелка (дуга деятельности) показывает поток управления - передачу управления от одной деятельности к другой. Второй тип узла - узел объекта - изображается прямоугольником, как это показано на рисунке 4.

Рисунок 4- Узлы деятельности и объекта и связь между ними

Здесь стрелки показывают поток объектов деятельности - передачу объекта от одной деятельности к другой (используется как дополнительная информация).

Символы фиктивных начальных и конечных узлов деятельности по обозначениям соответствуют фиктивным начальным и конечным состояниям диаграммы состояний:

2.3 Описание метода формирования тестовых заданий

Вопросы, формируемые для тестов, различаются по форме самого вопроса (открытая форма - F1, форма утверждения - F2 или закрытая форма - F3)[27] и по объектам, к которым они относятся (к связи, к экземпляру или к фрейму-прототипу (классу)).

- первый тип вопросов, T1, относится к экземпляру сущности и значению для одного из атрибутов этой сущности(UML 1.0 был выпущен в ____ году);

- второй тип вопросов, T2, ставится к отношению наследования между двумя объектами(К какому классу языков программирования относится язык Java);

- третий тип вопросов, T3, относится к связи (логической или физической) между двумя объектами (На диаграмме вариантов использования ____________ актеры);

- четвертый тип вопросов, T4, относится к объекту, соединенному с изначальным объектом логической или физической связью ( _________ является последней фазой жизненного цикла ИС).

Информационная система позволяет создавать и редактировать онтологию предметной области, заданную формулой (1):

,(1)

где X - множество концептов, представленных в виде фреймов;

R - множество отношений между ними;

E- множество оценок.

-предусмотренная градация от совершенно нового для обучаемого знания - 0, до уже закрепленного тестированием знания - 4.

В зависимости от типа вопроса различается и методика его автоматизированного создания. Для первых двух типов вопросов используется выражение суждений на языке логики предикатов [28]. Для остальных типов вопросов требуется использование теории графов. Рассмотрим формирование вопроса по каждому типу в виде формализованного описания.

Входными параметрами является онтология предметной области O, тип требуемого вопроса T, его форма F и сложность N, которая, в свою очередь, определяется дополнительными параметрами: комплексность и число переменных предиката; геодезическое расстояние в графе; уровень узла в дереве иерархии. На время генерации тестового задания система хранит три множества:

- D<X> - множество опрошенных понятий;

- D<S> - множество опрошенных характеристик;

- D<R> - множество опрошенных связей.

Первым этапом является случайный выбор понятия предметной области x и проверка на принадлежность , пока не будет найдено не протестированное понятие, которое затем заносится в D<X>.

Далее идет разделение действий в зависимости от типов вопросов T.

1. Если , выбирается случайная характеристика s и проверяется принадлежность , пока не будет найдена не протестированная характеристика, которая заносится в D<S>, а ее значение - в v1. Создается предикат вида:, такой, что P(x,s,v1) = 1.

a. Если F==F1, то возвращается P(prop, obj, val), x, s, v1.

b. Если F==F2, находится альтернативный ответ v2 и возвращается P(prop, obj, val), x, s, v1, v2.

c. Иначе находится три альтернативных ответа v2, v3, v4 и возвращается P(prop, obj, val), x, s, v1, v2, v3, v4.

2. Если T==T2, выбирается суперкласс, находящийся на N уровней выше x - y. Создается предикат вида: такой, что P(x,y)=1.

a. Если F==F1, то возвращается P(child, parent), x, y.

b. Если F==F2, то находится альтернативное понятие x1 и возвращается P(child, parent), x, y, x1.

c. Если F==F3, то находится три альтернативных понятия x1,x2,x3 и возвращается P(child, parent), x, y, x1, x2, x3.

3. Если , то выбирается случайная связь r и проверяется ее принадлежность , пока не будет найдена не протестированная связь, которая заносится в D<R>. Принимая u = x и, определяя вторую вершину, получаем ребро r = {u, v}. Составляется предикат вида , такой что P(u, v, r) = 1.

a. Если F==F1, то возвращается , u, v, r.

b. Если F==F2

i. Если T==T3, то находится альтернативное понятие v1 и возвращается , u, v, r, v1.

ii. Если T==T4, то находится альтернативная связь r1 и возвращается , u, v, r, r1.

c. Если F==F3

i. Если T==T3, то находится три альтернативных понятия v1, v2, v3 и возвращается , u, v, r, v1, v2, v3.

ii. Если T==T4, то находим три альтернативных связи r1, r2, r3 и возвращается , u, v, r, r1, r2, r3.

По созданным предикатам формулируются вопросы теста в естественно-языковой форме.

2.4 Формализованное описание процесса формирования тестовых заданий

При создании методологии автоматизации процесса тестирования знаний при онтологическом подходе к оценке знаний обучаемых возникла проблема создания алгоритма, удовлетворяющего следующим требованиям:

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.