Лингвистическая модель обучаемого
Понятие, классификация и сравнительный анализ моделей обучаемого. Принципы формирования лингвистической модели. Основные подходы к представлению текстов для компьютерной обработки. Разработка и лингвистической модели обучаемого в виде базы данных.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 19.03.2017 |
Размер файла | 1,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
РЕФЕРАТ
МОДЕЛЬ ОБУЧАЕМОГО, ЛИНГВИСТИЧЕСКАЯ МОДЕЛЬ ОБУЧАЕМОГО, СТУДЕНТ, ЛИЧНОСТНЫЕ ХАРАКТЕРИСТИКИ, ИЗУЧАЕМЫЕ ДИСЦИПЛИНЫ, ОЦЕНКИ, ИНТЕРЕСЫ, ИНТЕРЕНЕТ, WEB-СТРАНИЦА, ОЦЕНКА ИНТЕРЕСОВ, МАШИННАЯ ОБРАБОТКА ТЕКСТОВ, МЕТОД ОПОРНЫХ ВЕКТОРОВ.
В работе рассмотрены основные виды моделей обучаемого, предложена собственная лингвистическая модель обучаемого. Данная модель позволяет оценить знания и интересы студентов. Подробно рассмотрены принципы формирования каждого компоненты модели. Основной упор делается на выявление интересов студентов. Предложен способ оценки интересов студента, путем обработки информации о посещаемых им WEB-страницах. Найдены и реализованы алгоритмы машинного анализа текстовой информации. Написано программное обеспечение по сбору и отправки WEB-ссылок, посещаемых студентом. Так же написано программное обеспечение по приему и обработки собранных WEB-ссылок. Итоговая модель реализована в виде базы данных, позволяющей получить информацию об оценках и интересах студентов по различным дисциплинам. Визуализация данной информации представлена в виде WEB-сайта, состоящего из: главной страницы с информацией о цели данного проекта и ссылкой на скачивание программы по сбору WEB-ссылок; страницы авторизации для преподавателей и студентов; личного кабинета, где преподаватель сможет посмотреть информации обо всех студентах, а студент информации о собственных результатах.
СОДЕРЖАНИЕ
- Словарь сокращений и специальных терминов
- Введение
- 1. Теоретическая часть
- 1.1 Обзор существующих моделей обучаемого
- 1.1.1 Понятие модели обучаемого
- 1.1.2 Классификация моделей обучаемого
- 1.1.2.1 Фиксирующие модели обучаемого
- 1.1.2.2 Имитационные модели обучаемого
- 1.1.3 Сравнительный анализ моделей обучаемого
- 1.2. Выбор модели «обучаемого»
- 1.2.1 Актуальность и новизна
- 1.2.2 Понятие лингвистической модели
- 1.2.3 Метод выявления интересов «обучаемого»
- 1.2.4 Структура Лингвистической модели обучаемого
- 1.3. Принципы формирования лингвистической модели
- 1.3.1 Основные подходы к представлению текстов для компьютерной обработки
- 1.3.2 Морфологический анализ текста
- 1.3.2.1 Алгоритм свертки терминов
- 1.3.3. Векторное представление текста
- 1.3.4 Методы машинного обучения
- 1.3.4.1 Метод опорных векторов
- 1.3.5 Выводы по предложенной модели
- 2. Практическая часть
- 2.1 Постановка задачи
- 2.2 Необходимые сведения
- 2.2.1 Сетевые топологии
- 2.2.2 Адресация в IP-сетях
- 2.2.2.1 Порты компьютерных сетей
- 2.2.2.2 Стек протоколов TCP/IP
- 2.2.2.3 Протокол HTTP
- 2.2.2.4 Служба DNS
- 2.2.3 SOAP - протокол
- 2.2.4 Службы - Windows
- 2.3 Программная реализация
- 2.3.1 Реализация лингвистической модели в виде базы данных
- 2.3.2 Построение обучающей модели
- 2.3.3. Реализация клиентской части
- 2.3.4 Реализация серверной части
- 3. Экономическая часть
- 3.1 Введение
- 3.2 Расчет затрат на разработку продукта
- 3.2.1 Материальные затраты
- 3.2.2 Оплата труда
- 3.2.3 Социальные отчисления
- 3.2.4 Амортизационные отчисления
- 3.2.5 Накладные расходы
- 3.2.6 Прочие расходы
- 3.3 Итоговые затраты на создание продукта
- 3.4 Определение цены продукта
- 3.5 Расчет экономической эффективности продукта
- 3.6 Выводы
- 4. Охрана труда
- 4.1 Введение
- 4.2 Визуальные параметры
- 4.3 Излучения и поля
- 4.3.1 Ионизирующее излучение
- 4.3.2 Электромагнитное излучение
- 4.3.3 Электростатическое поле
- 4.3.4 Другие излучения
- 4.4 Стандарты
- 4.5 Заключение
- Заключение
- Список используемых источников
СЛОВАРЬ СОКРАЩЕНИЙ И СПЕЦИАЛЬНЫХ ТЕРМИНОВ
ИТ - информационные технологии.
МО - модель обучаемого.
ИОС - интеллектуальная обучающая система.
ЛМО - лингвистическая модель обучаемого.
СУБД - система управления базами данных.
БД - база данных.
ЕЯ - естественный язык.
SVM - метод опорных векторов (Support Vector Machines).
HTTP - сетевой протокол передачи данных (HyperText Transfer Protocol - протокол передачи гипертекста).
SOAP - протокол обмена структурированными сообщениями в распределенной вычислительной среде (Simple Object Access Protocol - простой протокол доступа к объектам).
WEB-сервер - сервер принимающий HTTP-запросы от клиентов и выдающий им HTTP-ответы.
WEB-сервис - идентифицируемая WEB-адресом программная система со стандартизированными интерфейсами.
WEB-клиент - браузер пользователя.
TCP - один из основных протоколов передачи данных Интернета (Transmission Control Protocol - протокол управления передачей).
IP - маршрутизируемый протокол сетевого уровня (Internet Protocol - межсетевой протокол).
DNS -компьютерная распределенная система для получения информации о доменах (Domain Name System - система доменных имен).
Домен - область, единица структуры.
Доменное имя - символьное имя, помогающее находить адреса WEB-серверов.
ВВЕДЕНИЕ
Подбор молодых специалистов решается, как правило, общением работодателя с кандидатом даже при наличии резюме. В результате общения у работодателя формируется модель будущего работника. Возникает вопрос, актуальный для современных информационных технологий (ИТ) о привлечении компьютеров для (частичного) решения этой и подобных задач.
Формированием модели собеседника, клиента, … занимаются такие компании как Google, Mail, Yandex, в поисковых системах которых учитываются поисковые запросы и при следующем запросе предлагаются варианты связанные с предыдущим запросом. Но эти компании идут дальше. Так в Google принимается попытка дополнить модель кругом знакомых и их интересов.
В данной работе я предлагаю лингвистическую модель, как некоторый аналог словарного запаса обучаемого. Этот словарный запас классифицирован по предметам (обязательный словарный запас, как общий для группы обучаемых) и личный - по интересам. Для получения личного словарного запаса предлагается анализ деятельности обучаемого по результатам его общения в интернете. На первом этапе реализации предложено оценить «близость» полученных слов с посещаемых WEB-страниц с обязательным словарным запасом. Это вносит в модель обучаемого характеристику «заинтересованность по читаемым предметам».
Такая модель позволит:
· работодателю - подобрать специалиста
· кафедре - получить дополнительные объективные сведения о студенте.
модель обучаемый лингвистический текст компьютерный
1. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ
1.1 Обзор существующих моделей обучаемого
1.1.1 Понятие модели обучаемого
Под моделью обучаемого подразумевают некое представление системы об обучаемом, которое позволяет приспосабливать ее возможности к потребностям пользователя.
На практике модель обучаемого представляет собой совокупность характеристик обучаемого, измеряемых во время работы системы с обучаемым и определяющей степень усвоения им знаний по изучаемой предметной области, а также методов обработки этого набора.
Модель обучаемого является одной из важнейших подсистем любой интеллектуальной обучающей системы, она может служить ядром ИОС, центральным инструментом для адаптации всех компонентов системы под потребности конкретного пользователя.
Модель обучаемого должна удовлетворять следующие требования:
· валидность - система должна учитывать те индивидуальные особенности учащихся, которые существенны для достижения намеченных учебных целей;
· адекватность - система должна обеспечивать соответствие модели обучаемого самому обучаемому;
· динамичность - модель обучаемого должна уточнятся по мере накопления данных о нем.
На основе изложенного выше, можно выделить основные функции:
· оценка уровня знаний обучаемого;
· диагностика ошибок обучаемого, выявление недостающих или ошибочных знаний, приведших к возникновению ошибки;
· адекватное отображение индивидуальных особенностей обучаемого, существенно влияющих на учебный процесс (форму подачи, уровень сложности материала).
Модель обучаемого, как правило, рассматривается в одном из двух значений:
· модель текущего состояния знаний и умений индивидуального обучаемого;
· «идеальная» модель знаний об обучаемом, включающая знания о предметной области, типичных ошибках и когнитивных механизмах.
Первая интерпретация соответствует подсистеме тестирования знаний обучаемого. Вторая - подсистеме диагностики знаний (определения ошибок и корректировки учебного процесса).
Модель обучаемого, как правило, включает знания:
· о цели обучения (т.е. изучаемой предметной области);
· об уровне глубины и полноты владения знаниями и/или умениями, относящимися к изучаемому предмету;
· об общих характеристиках обучаемого (возраст, пол, скорость реакции, способность к абстрактному мышлению, уровень образования, специальность и пр.);
· об истории взаимодействия ИОС и обучаемого, а так же о правилах изменения его модели по результатам этого взаимодействия;
· об особенностях подачи учебных материалов и выбора контрольных заданий и вопросов.
Моделирование пользователя можно определить как адаптацию поведения системы в процессе взаимодействия с ним в соответствии с теми предположениями, которые делает система, основываясь на собранной о пользователе информации. Процесс моделирования обучаемого в общем случае состоит из следующих этапов:
· Первоначальная модель обучаемого включает в себя требования к предварительным знаниям и умениям обучаемого, которые задаются на этапе настройки ИОС и в процессе предварительного тестирования обучаемого.
· На основании общей модели предметной области формируется задача, предоставляемая обучаемому для решения.
· На основе анализа решения задачи, предоставленного обучаемым, путём выявления и диагностирования характерных ошибок в решении, формируется его частичная модель.
· Полученная частичная модель комбинируется с текущей моделью, образуя новую модель обучаемого.
1.1.2 Классификация моделей обучаемого
По способу получения модели обучаемого делят на явные и неявные. В первом случае подразумевается, что система в явном виде запрашивает у пользователя информацию, необходимую для создания и обновления модели. Во втором случае система ненавязчиво и незаметно для пользователя конструирует его модель, делая предположения и выводы на основе взаимодействия обучаемого с системой.
По степени специализации модели делят на общие и индивидуальные. Первые предполагают наличие одной общей модели для всех пользователей системы и используются в случае работы с однородной группой пользователей. Вторые принимают во внимание индивидуальные особенности отдельного пользователя.
По временной протяженности различают долгосрочные и краткосрочные модели обучаемого. Особенностью долгосрочных моделей является сохранение информации о пользователе от одного сеанса до другого, в то время как краткосрочные модели действуют в пределах одного сеанса работы пользователя с системой. Следует отметить, что структура модели в обоих случаях может не отличаться, однако долгосрочные индивидуальные модели, на основании более длительного опыта работы с пользователем, могут строить более точное отображение знаний и умений обучаемого в общем.
По способу использования традиционно модели делят на фиксирующие (или декларативные, дескриптивные), и имитационные (или процедурные). Первые представляют собой набор величин, характеризующих состояние знаний и умений обучаемого - своего рода база данных, содержащая информацию о знаниях пользователя. Вторые же воссоздают представление обучаемого об изучаемой предметной области и его механизмы решения задач для проверки и интерпретации его ответа.
Рисунок 1.1.2.1
1.1.2.1 Фиксирующие модели обучаемого
Стереотипная модель. Достаточно простой разновидностью моделей фиксирующего типа является стереотипная модель. В такой модели выбирается набор характеристик (критериев), отражающих индивидуальность пользователя, и по значениям этих критериев учащиеся разбиваются на классы - стереотипы. К примеру, в традиционном образовании с пятибалльной системой оценивания можно выделить стереотипы «двоечник», «хорошист», «отличник». Величина критерия для конкретного учащегося определяется при помощи некоторой оценочной функции, которая строится в связи со знаниями предметной области. Когда по всем критериям достигнут переход к значениям, соответствующим какому-то стереотипу, система относит обучаемого к этому стереотипу.
Модель стереотипов, как правило, строится по одному из четырёх сценариев:
· многоуровневая, или луковая модель, в которой содержимое стереотипов упорядочено в отношении линейных подмножеств - представитель каждого следующего уровня обладает знаниями всех предыдущих;
· латуковая модель - имеется стереотип-ядро, общий для всех остальных стереотипов, каждый из которых может быть независимым друг от друга;
· многоядерная латуковая модель - обобщение латуковой модели, в которой может присутствовать несколько ядер, являющихся пересечением нескольких стереотипов;
· ориентированный ациклический граф - многоядерная модель, расширенная тем, что общности из двух и более ядер также сжимаются в ядро; результат представляет собой иерархическую структуру стереотипов (на рисунке направленными рёбрами обозначено отношение включения стереотипов).
Рисунок 1.1.2.1.1
Стереотипная модель является способом комбинирования общей и индивидуальной модели обучаемого, соотнося индивидуальные особенности обучаемого с определённым классом, стереотипом, на основании чего система может неявным образом получать дополнительные данные о пользователе даже без прямого взаимодействия с ним, на основе опыта взаимодействия с другими обучаемыми, представляющими тот же стереотип. Модели этого типа могут давать хорошие результаты, в зависимости от целей моделирования, однако для обучения в чистом виде они применяются редко. Целесообразно использовать их в случаях, когда требуется быстрая, но не обязательно точная оценка пользователя.
Оверлейные модели. Среди моделей фиксирующего типа наиболее распространёнными являются оверлейные, или перекрывающие модели. Они названы так потому, что в них модель ученика является в некотором смысле подмножеством (перекрытием) модели эксперта-предметника. Такие модели хорошо зарекомендовали себя при обучении понятиям, хотя оказались недостаточно эффективны при обучении умениям.
Векторная оверлейная модель. Простейшим вариантом оверлейной модели обучаемого является векторная. В ней каждому изучаемому понятию или умению ставится в соответствие элемент, принимающий значение «знает/не знает» или «умеет/не умеет». В более общем случае элементы могут принимать значения по определенной дискретной шкале (например, пятибалльная система оценивания) или из определённого интервала (например, интервал от 0 до 1). Значение элемента может быть проинтерпретировано и как оценка, и как вероятность или нечёткая величина, характеризующая знание системы о владении обучаемым данным концептом (понятием или умением). Характеристики обычно разделяют по уровню, например, на общие (интегрированные) и текущие (отражающие усвоение текущего материала). За счёт этого содержание модели получается многоуровневым: на высшем уровне можно проследить глобальные характеристики знаний (например, оценку за весь курс обучения); на более низких уровнях хранится информация о более локальных знаниях (темах, отдельных понятиях).
Часто помимо непосредственного значения характеристикам, определяющим знание обучаемого данного концепта, приписывают атрибуты: «чтение» (определяет, изучал ли обучаемый данный концепт) и «готовность для чтения» (определяет, имеет ли обучаемый достаточно предварительных знаний для изучения данного концепта).
Преимуществом такой модели является её простота, однако она не отображает когнитивных процессов и методов решения задач обучаемого; кроме того, она никак не отображает связи между понятиями и/или умениями.
Сетевая оверлейная модель. Более гибкой формой фиксирующей модели является сетевая. В ней понятия и умения представляются узлами графа, а дуги этого графа представляют отношения между ними. Каждому узлу и дуге графа соответствует величина (или набор величин), отображающая степень владения обучаемым данным понятием или умением. Очевидным преимуществом данной модели перед предыдущей является способность отображения взаимосвязей между понятиями, что даёт возможность лучшей диагностики ошибок пользователя, а также индуктивного определения знаний, необходимых пользователю.
Генетический граф. Расширением оверлейной сетевой модели, призванным повысить эффективность диагностики при обучении умениям, является так называемый генетический граф. Узлы такого графа представляют факты, правила и процедуры, а дуги являются отношениями, такими как:
· обобщение: С' является обобщением С, если определение С' получается из определения С заменой некоторой константы на переменную;
· конкретизация - отношение, обратное к обобщению;
· аналогия: С' является аналогией С, если существует отображение констант из определения С' в константы из определения С;
· уточнение: С' является уточнением С, если С' содержит дополнительное свойство, применимое к подмножеству данных, используемых в С;
· упрощение - отношение, обратное к уточнению;
· отклонение: С' является отклонением от С, если действие С' имеет ту же цель, но не приводит к успеху;
· коррекция - отношение, обратное к отклонению.
Генетический граф, в отличие от сетевой модели, содержит не только знания и умения эксперта, но и различные обобщения, конкретизации и отклонения от правил, применяемых экспертом. Кроме того, при помощи отношения «уточнение» он может описать возможные пути развития умений обучаемого.
Еще одним недостатком оверлейных моделей является отсутствие разграничения знаний, которые пользователь ещё не приобрёл, и знаний, которые ещё не были ему представлены. Не берутся также в расчёт неправильные представления и заблуждения, имевшиеся у пользователя изначально или приобретённые им в ходе обучения.
Разностная модель. Разностная (дифференциальная, обратная оверлейная) модель обращается к этим вопросам, разделяя знание на то, которое было продемонстрировано пользователю и то, которым пользователь не обладает.
В данной модели оверлейная модель применяется к знанию, уже представленному пользователю. Ответы обучаемого анализируются и сравниваются со знаниями эксперта, которые применялись для решения данной задачи. На основе различий в этих знаниях строится модель обучаемого. Таким образом, модель позволяет учесть не только отсутствие знаний у обучаемого, но и неправильное использование знаний, которыми он уже овладел.
Фиксирующие модели обучаемого, в особенности оверлейные модели, наиболее часто берут за основу при создании различных ИОС ввиду их простоты и отсутствия ограничений на предметную область и способы приобретения знаний, а так же способы решения задач пользователем.
1.1.2.2 Имитационные модели обучаемого
Основным недостатком всех фиксирующих (декларативных) моделей является отсутствие прямой возможности представления умений, когнитивных механизмов и способов решения задач обучаемым. Ошибка в ходе решения задачи интерпретируется лишь как недостаток знания по сравнению с экспертом, при этом имеется достаточно слабая возможность определения причины ошибки или неверных предпосылок, приведших к неправильному ходу решения задачи. Чтобы восполнить этот недостаток, рассматривают модели, имитирующие знания и способы (процедуры) решения задач обучаемого, с тем, чтобы диагностировать ошибки в этих процедурах и корректировать учебный процесс соответствующим образом.
Пертурбационные модели. Пертурбационными моделями обучаемого, называются модели, принимающие во внимание знания, которыми обладает пользователь, но которые не представлены в модели знания эксперта предметной области. Важной предпосылкой построения таких моделей является идентификация причин расхождения знаний эксперта и знаний обучаемого. Среди таких причин могут быть: недостаток знаний у обучаемого, наличие ошибочных знаний, неправильное применение имеющихся знаний, ошибки невнимательности или же умышленно допущенные ошибки.
Модель ошибок. В имитационных моделях знания обучаемого представляются в виде структур данных, а его умения - в виде процедур и механизма их интерпретации. Если задать множество элементарных операций, необходимых для решения определённого класса задач, то умение обучаемого можно представить в виде алгоритма, состоящего из последовательности таких элементарных операций. Если алгоритм представить графом, узлы которого являются этапами решения задачи, а дуги - элементарными операциями, то решение конкретной задачи соответствует пути на таком графе.
Если в описанном выше графе заменить одну операцию (дугу) на другую, то все пути, включающие эту дугу, будут давать неверные решения, моделируя ошибочное поведение обучаемого. За счёт выявления таких дуг появляется возможность определения шага, на котором обучаемый допустил ошибку, диагностирования её причины и коррекции решения учащегося. Такую модель обучаемого называют моделью ошибок.
Модель фальшправил. Развитием модели ошибок является модель фальшправил, или модель Слимана. В этой модели в ходе экспериментов с обучаемыми определяется набор ошибочных элементарных операций (фальшправил), которые затем используются для диагностирования причины ошибки пользователя в решении задачи. Определяя предполагаемое место возникновения ошибки, система применяет к нему фальшправила, пытаясь сымитировать ошибочное поведение обучаемого.
Переборная модель. Устраняя очевидный недостаток модели ошибок - отсутствие предположения о допускании обучаемым ошибок при выполнении элементарных операций, - модель фальшправил тем не менее не в силах объяснить причины возникновения таких ошибок - фальшправил. Кроме того, набор фальшправил составляется исключительно ручным путём, в ходе экспериментов с обучаемыми, что является трудоёмким процессом, не гарантирующим качество результата.
Объяснить причину возникновения ошибки можно с помощью переборной модели, умеющей прослеживать все возможные пути решения задачи. Знания в этой модели представлены в виде генетического графа, отражающего не только связи в предметной области, но и поведение обучаемого. На каждом шаге система подбирает из всех возможных единственную модель путём добавления правильных или неправильных процедур, выполненных учеником. Если же неверный шаг ученика не зафиксирован в библиотеке фальшправил, система после анализа пытается её пополнить новым фальшправилом.
Выводимые модели обучаемого.
Восстановительная модель. Восстановительная модель позволяет отойти от библиотеки ошибок, созданной вручную. Обучающая система строит модель обучаемого, восстанавливая путь от конечного результата к началу при помощи индукционных правил. При этом предполагается, что ученик не делает ошибок при выполнении элементарных операторов, но может неправильно их применять. На каждом шаге анализа решения обучаемого определяется, какие условия были применены на предыдущем шаге решения и к какой процедуре, чтобы получить текущую.
У восстановительной модели и у переборной модели есть очевидный недостаток - большие затраты времени на поиск нужных процедур, поскольку здесь мы сталкиваемся с полнопереборными задачами.
Модель ограничений. Последняя из рассматриваемых моделей - модель ограничений. Она позволяет конструировать модель обучаемого в знакомых ему терминах. Для каждого изучаемого понятия в данной модели фиксируется наиболее конкретная (нижнее ограничение) и наиболее общая (верхнее ограничение) его форма. Эти ограничения, словно рамки, обозначающие понимание обучаемым данного понятия, расширяются по мере решения обучаемым все новых и новых задач. При этом новое нижнее/верхнее ограничение для понятия индуктивно выводится из действий обучаемого, выполняемых в ходе решения задач.
Модель представляется достаточно реалистичной, поскольку основывается на предположении о том, что учитель не знает точного состояния знаний обучаемого, а принимает решения на основе некоторой аппроксимации этого состояния. В то же время очевидны ограничения, накладываемые на структуру представления изучаемой предметной области.
Также эта модель в чистом виде не предусматривает обучение умениям и диагностику ошибок при применении приобретённых умений.
1.1.3 Сравнительный анализ моделей обучаемого
Е.Е. Буль в своей статье «Сравнительный анализ моделей обучаемого» провел исследования по рассмотренным выше моделям, сравнил их между собой и выявил самые распространенные из них.
Он установил, что на сегодняшний день наиболее широко используются векторные и сетевые модели «обучаемого». Результаты показаны на рисунке 1.1.3.1
Рисунок 1.1.3.1
Как говорилось ранее, векторные модели включают такие составляющие, как умения и навыки студента по конкретным дисциплинам, необходимым для достижения ранее определенной цели. В сетевых моделях информация о студенте отображается, как правило, с помощью графа знаний, вершины которого соответствуют квантам учебной информации, а дуги показывают отношения между ними.
После сравнительного анализа рассматриваемых моделей Е.Е. Буль приходит к выводу о том, что существующие модели обучаемого не учитывают всю информацию о студенте, необходимую для наиболее эффективной организации учебного процесса.
После того, как нами были рассмотрены и изучены все эти модели, мы пришли к тому же выводу. Они все оценивают знания студентов, но не более. И отличаются между собой подходами именно к оценки этих знаний. Другие же характеристики обучаемого в них не учитываются.
Поэтому Е. Е. Буль в свой статье проводит анализ модели обучаемого также с точки зрения используемых параметров, которые позволят отобразить необходимую информацию об обучаемом. Основное внимание он уделяет таким факторам, как:
Уровень знаний.
Психологические характеристики (тип личности, ориентация и др.).
Скорость/стиль обучения (усвоения, изучения).
Выполнение заданий.
Способность обучения (очень внимательный, средне, мало).
Уровень умений и навыков.
Метод/стратегия обучения.
Структура курса.
Результаты исследований показаны на рисунке 1.1.3.2 (столбцы соответствуют ранее перечисленным параметрам).
Рисунок 1.1.3.2
Поскольку одна из основных целей обучения - это научить студента использовать предоставленную информацию для решения конкретных задач или ситуаций, а базой для этого служат полученные знания, то такой параметр, как "уровень знаний" включен во все модели студента. С точки зрения усвоения и освоения предметной области не менее важным является уровень навыков и умений, однако моделей, которые учитывают этот параметр, достаточно мало (порядка 19% из исследованных).
На сегодняшний день часто встречаются сетевые модели, которые отображают структуру курса. Этот параметр один из наиболее распространенных - используется приблизительно в 37% систем.
Исследования показывают, что на результат учебного процесса влияют различные характеристики, при этом некоторые из них отображаются при помощи нескольких составляющих (например, уровень знаний можно разбить по дисциплинам, а также на начальные и текущие знания). По этой причине структура модели обучаемого не является однотипной, а будет содержать такие виды, как:
вектор (текущие знания, опыт, психологические характеристики),
граф или сеть (структура курса),
скаляр (стратегия, метод обучения).
Структура комплексной модели обучаемого
Графически такую модель можно отобразить, как показано на рисунке 1.1.3.3. Для наиболее эффективной организации учебного процесса целесообразно учитывать различную информацию о студенте, т.е. при разработке системы включать также модель обучаемого. Большинство из доступных на сегодняшний день моделей составляют покрывающие - векторные и сетевые (графы знаний). Однако, они не отображают всю необходимую информацию.
Рисунок 1.1.3.3.
Для этой цели наиболее удобным представляется использование смешанной структуры модели студента. Основной задачей для будущих исследований является разработка и реализация такой комплексной модели в системах компьютерного обучения.
1.2 Выбор модели «обучаемого»
1.2.1 Актуальность и новизна
На текущий день существует достаточно много различных моделей обучаемого. Главное их отличие между собой - это способ оценки знаний «обучаемого». Одни модели просто оценивают знания, другие же пытаются сымитировать работу самого обучаемого, что позволяет не только оценить его знания, но и проанализировать его ошибки. Все эти модели, в основном, применяются в компьютерных обучающих системах и имитируют, в некотором роде, работу преподавателя.
Но ни одна из этих моделей не позволяет рассмотреть «обучаемого» как личность. Ведь единственной характеристикой «обучаемого» в них выступают оценки. Никоим образом в них не учитывается, такая важнейшая характеристика, как интересы «обучаемого».
В сформированной нами Лингвистической модели в первую очередь мы делаем упор именно на интересы «обучаемого», не забывая также и про его оценки. Методы выявления интересов обучаемого также имеют нестандартный подход. Они основаны не на опросах и наблюдениях, а на анализе интернет-сайтов, которые он посещает. Ведь интернет на данный момент является неотъемлемой частью нашей жизни.
Раньше люди искали информацию в книгах, для чего ходили в библиотеки, покупали газеты, слушали радио и смотрели телевизор. Да, это не ушло полностью из нашей жизни, но сейчас те же книги доступны в интернете, у каждой газеты есть свой сайт, у каждого телевизионного канала так же есть своя страничка в интернете. Даже у большинства магазинов есть электронный формат. Все интересующую нас информацию мы в первую очередь ищем в интернете, что позволяет нам сделать выводы о том, что посещаемые нами сайты в значительной степени отражают наши интересы.
Такая модель весьма актуальна в наши дни. Она будет интересна, преподавателям для выявления научного потенциала студентов, психологам и психоаналитикам, работодателям для подбора будущих специалистов.
В рамках данной дипломной работы мы рассматриваем именно заинтересованность работодателей в такой модели. Она позволит сократить время при поиске необходимого кандидата, поможет найти именно тех, кто заинтересован в том или ином вопросе. Ведь оценки в аттестате весьма неоднозначная характеристика, студент может иметь хорошую оценку по предмету, но не быть в нем заинтересован. А может, наоборот, заинтересоваться данным предметом, уже после его прохождения в институте. Наша модель позволит выявить степень заинтересованности студента в конкретном предмете.
1.2.2 Понятие лингвистической модели
В предложенной модели, как говорилось ранее, упор делается именно на интересы обучаемого, как на одну из важнейших характеристик его как личности. При этом саму модель было решено назвать «лингвистической». Какова причина?
При формировании данной модели возник ряд вопросов:
· Что характеризует интеллект человека?
· Что отражает его интересы?
· Как это выявить?
Ответом на эти вопросы оказались «слова», которыми пользуется человек на протяжении всей своей жизни. Т. е. его словарный запас. В течении нашей жизни он постоянно увеличивается. В детстве, когда мы учимся говорить, мы получаем некий стандартный запас слов, необходимый для общения. Он практически одинаков у всех людей.
Затем появляются различия в нашем словарном запасе. Они возникают по разным причинам. Это зависит от профессии, возраста, образования, общего культурного уровня, места жительства (город, деревня), личных качеств, вкусов и интересов. Вкусы и интересы играют одну из главных ролей. Ведь куда пойти учится, какую выбрать профессию опять же зависит от того, что интересно человеку.
Следовательно, словарный запас человека является характеристикой его интересов. Конечно, тут речь идет скорее о пассивном словарном запасе, нежели об активном. Потому что в активный словарный запас входят те слова, которыми он пользуется для выражения своих мыслей и чувств. Если же человек какие-то слова не употребляет, но узнаёт в тексте, понимает, то речь идет о пассивном словарном запасе. К пассивной лексике относятся слова специального употребления, архаизмы, неологизмы, диалектизмы, многие заимствования.
В качестве примера, по современным оценкам словарный запас учащегося первого класса средней школы составляет 2000 слов. Человек с высшим образованием знает порядка 10 тыс. слов. Словарный запас великого русского поэта А. С. Пушкина составляет больше 20 тыс. слов. А у Вильяма Шекспира порядка 15 тыс. слов.
Таким образом, что бы оценить интересы нашего «обучаемого», мы решили в первую очередь обратить внимание на его словарный запас. Поэтому и в основу названия модели положено слово «лингвистика» - наука о языке. А язык в свою очередь состоит из слов.
1.2.3 Метод выявления интересов «обучаемого»
После того, как мы выяснили, что является характеристикой интересов нашего «обучаемого», возник вопрос о том, как выяснить его пассивный словарный запас?
Во время обучения в институте, студенты сильно увеличивают свой словарный запас, за счет пройденных ими дисциплин. Поэтому в первую очередь было решено выявить именно эту часть словарного запаса, ведь она будет одинакова для всех обучаемых.
Для этого необходимо рассмотреть все изучаемые дисциплины и выявить для каждой ее основные определения и словосочетания. После этого для каждой дисциплины сформировать словарь слов, который будет ее характеризовать. Совокупность таких словарей и составит словарный запас, который студенты получат по окончанию института.
После этого возник вопрос о том, как выяснить интересы студента. Для этой цели было решено использовать его персональный компьютер.
Как же выяснить интересы человека, имея в распоряжении лишь его компьютер? Можно проанализировать, например, какие программы он использует, но гораздо интересней проанализировать то, чем он интересуется в интернете. Ведь все что нас интересует, сегодня, мы ищем в первую очередь именно там.
Принцип анализа страницы будет происходить путем разбивания текста этой страницы на слова, их индексации и формирования некоего словаря, характеризующего рассматриваемую страницу.
Но как выявить ее смысл не использую при этом человека? Это довольно сложная задача. В какой-то степени она относится к задачам искусственного интеллекта, которые реализовать довольно сложно.
Мы же решили пойти по другому пути - пути сравнения полученных словарей страниц со словарями на различные темы, которые формируются заранее. При достаточно большом совпадении двух словарей можно говорить о том, что рассматриваемая страница относится к такой-то из известных нам тем.
Охватить все темы не возможно. Но вполне реально, например, узнать какими из изучаемых дисциплин студент интересуется, а какими нет. Все словари, характеризующие изучаемые дисциплины, сформировать вполне реально. Остается лишь анализировать посещаемые студентом страницы и проверять их на соответствия изучаемым дисциплинам. Анализирую получаемую статистику и динамику ее изменения, можно делать выводы о том, какие дисциплины интересны тому или иному студенту.
Таким же образом можно выявлять различные интересы, просто необходимо заранее подготовить их характеристические словари. А проводя анализ словарей страниц не соответствующих запросам, можно составлять новые словари интересов. Можно выявлять закономерности и основные темы, которыми сегодня интересуются студенты.
В данной работе, по причине ее новизны и ограниченного времени на тестирование системы, мы рассматриваем лишь те интересы студентов, которые связаны непосредственно с изучаемыми ими дисциплинами.
1.2.4 Структура Лингвистической модели обучаемого
Что бы сформировать структуру Лингвистической МО было рассмотрено множество различных моделей. Так же был рассмотрен сравнительный анализ этих моделей, предложенный Е.Е. Булем. Он же предложил и наиболее полную структуру модели «обучаемого». Проанализировав ее компоненты, было решено использовать следующую структуру Лингвистической МО:
Размещено на http://www.allbest.ru
Рисунок 1.2.4.1
Описание компонентов Лингвистической МО:
Изучаемые дисциплины - названия изучаемых студентом дисциплин и коллекции текстов, характеризующие эти дисциплины.
Словарь терминов - базы данных слов, которые характеризуют изучаемые дисциплины, т.е. термины, которые студент усваивает за время обучения. (Формируется путем обработки текстов из компонента «Изучаемые дисциплины»)
Оценки «обучаемого» - оценки студента по изучаемым дисциплинам.
Интересы «обучаемого» - в рамках данной работы интересы ограничены изучаемыми дисциплинами, т.е. какие из изучаемых дисциплин интересны студенту.
1.3 Принципы формирования лингвистической модели
Предлагается реализовать модель в виде реляционной базы данных: общая и индивидуальная части. Общая часть включает следующие компоненты:
· «Изучаемые дисциплины» - список изучаемых дисциплин и коллекции текстов по каждой из дисциплин, в настоящий момент это календарные планы и различные лекции по этим дисциплинам.
· «Словарь терминов» - словарь, который формируются путем обработки перечисленных выше текстов. Общий для всех дисциплин.
Индивидуальная часть - это:
· «Оценки обучаемого» по изучаемым дисциплинам. Информация для этого компонента берется на кафедре (по мере их поступления) или в деканате.
· «Показатель интересов» по изучаемым дисциплинам.
Показатель интересов - это численная оценка степени заинтересованности обучаемого в дисциплине. Формирование происходит путем вычисления количества посещаемых сайтов близких по тематике изучаемых дисциплин.
Для выявления тематики посещаемых сайтов разработано специальное программное обеспечение, в котором используются методы машинного обучения и классификации текстов. Сначала программный компонент проходит обучение. Процесс обучения производиться на базе специальных выборок по различным темам (предметам обучения в соответствии с программой института) на основе подобранных выборок строиться модель классификации смысловых данных. На базе модели классификации будет производиться рубрикация текстов WEB - страницв, посещаемых студентами. Для построения модели классификации на первом этапе используется общая часть лингвистической модели. Для обучения и классификации смысловой информации используется метод опорных векторов. Классификация производиться на основе статистической дисперсии слов в тексте и вероятности принадлежащей к одной из дисциплин участвующих в обучении. Это позволит из всех, посещаемых студентом сайтов, выявить только те, которые относятся к изучаемым им дисциплинам и соответственно узнать, какие дисциплины в действительности интересны студенту. Далее подробно рассмотрен метод машинного обучения на базе метода опорных векторов.
1.3.1 Основные подходы к представлению текстов для компьютерной обработки
Первым этапом решения задачи автоматической классификации текстов является преобразование документов, имеющих вид последовательности символов, к виду, пригодному для алгоритмов машинного обучения в соответствии с задачей классификации. Обычно алгоритмы машинного обучения имеют дело с векторами в пространстве (называемом также пространством признаков). Отображение документов в пространство признаков также используется и методами, основанными на знаниях.
Вторым этапом является построение классифицирующей функции при помощи обучения на примерах.
Качество рубрицирования зависит и от того, как документы будут преобразованы в векторное представление, и от алгоритма, который будет применен на втором этапе. При этом важно отметить, что методы преобразования текста в вектор специфичны для задачи классификации текстов и могут зависеть от коллекции документов, типа текста (простой, структурированный) и языка документа. Методы машинного обучения, применяемые на втором этапе, не являются специфичными для задачи классификации текстов и применяются также в других областях, например, для задач распознавания образов.
Рассмотрим классический подход для отображения текста в вектор, используемый многими системами автоматической классификации текстов. Этот метод основывается на предположении о том, что категория, к которой относится данный документ, зависит от относительной частоты слов, входящих в текст. Это предположение, конечно, является упрощением. Существуют примеры систем, которые учитывают более сложные факторы: порядок слов в тексте, структура текста, содержащего разметку.
Базовый метод отображения текста в вектор заключается в том, что каждому слову, которое встречается в каком-либо документе, соответствует определенная координата в пространстве признаков. Для слова, встречающегося в документе, значение соответствующей координаты положительно и пропорционально частоте слова в документе. Для слова, которое не встречается в документе, значение соответствующей координаты равно нулю.
Есть несколько причин, по которым следует стремиться уменьшить размер пространства признаков. Во-первых, учет всех встреченных в документах слов приводит к слишком большой размерности пространства, хотя многие слова слабо влияют на результаты рубрицирования (либо вообще не влияют). Высокая размерность пространства признаков может приводить к высокой вычислительной погрешности и низкой скорости работы алгоритмов обучения. Во-вторых, отображение нескольких близких по значению слов в одну координату может улучшить результаты рубрицирования. Например, различные морфологические формы слова следует считать эквивалентными.
Опишем основные приемы, применяемые для преобразования текстов в векторы пространства признаков.
1.3.2 Морфологический анализ текста
Для того чтобы объединять различные морфологические формы слова в одну координату пространства признаков, каждое слово исходного текста приводится к своей нормализованной форме (лемме). Для английского языка обычно применяется процедура нормализации слов, которая заключается в отсечении окончания слова (stemming). Для русского языка процедура нормализации слов является более сложной. Для этого в данной работе предлагается алгоритм свертки терминов.
1.3.2.1 Алгоритм свертки терминов
Традиционный подход распознавания слов предполагает выделение корня путем отделения аффиксов, формирование начальной формы корня (по значениям аффиксов), сравнение полученного с имеющимися шаблонами (словарем). Это моделирует действия человека, занимает достаточно много ресурсов ПК, что в итоге увеличивает время реакции. Возможно, этот подход оправдан в работах по исследованию ЕЯ, но в технических системах задержки времени ответа на не прикладную задачу недопустимы. "Ручное" выделение корня (реализованное в некоторых СУБД) сокращает алгоритм, но вносит определенные неудобства в работе. Использование шаблонов на все возможные формы слов (также используется в некоторых СУБД) весьма неэффективно из-за возрастающего объема информации.
В данной работе в основу морфологического анализа положена идея распознавания слов по их усечению. Она основана на том, что человек правильно воспринимает информацию в условиях слабой слышимости, помех и т.п. Считается, что слово в такой ситуации может быть распознано по его некоторому усечению. При этом значимыми звуками являются согласные, гласные же выступают только для связки. Правильно воспринимается слова и в случае их несогласованности в предложении - понимаем же мы ребенка или иностранца при неправильном построении ими высказываний.
Для формирования усечения предлагается следующий алгоритм: начиная со второго символа отбрасываются все гласные и последняя согласная, полученная информация сжимается (удаляются пробелы). Запись полученная по этому алгоритму и есть свёртка термина, которая служит эталоном для сравнения слов, для чего записывается в словарь. Назовем его словарем терминов. Получая свёртку от анализируемого слова и сравнивая её с имеющимися записями в словаре можно делать вывод о "знании" или "незнании" слова. Например, для слов система и анализ, свёртки будут соответственно ССТ и АНЛ. Но свёртка ССТ будет получена и от слова состав. Назовём эту ситуацию алгоритмической синонимией. Таким образом, несложный алгоритм обеспечивает распознавание слова, причём оно записывается в словарь в той грамматической форме, в которой оно встретилось в первый раз. Он позволяет распознавать слово в большинстве его словоформ, что позволяет значительно сократить объем словаря.
1.3.3 Векторное представление текста.
Одним из общепринятых подходов машинного представления текстов является сопоставление тексту вектора признаков, также называемых весами признаков. В самом простом случае каждая координата такого вектора соответствует частоте встречаемости одного из слов всей коллекции в этом тексте (, term frequency). Объединение всех таких векторов в единую таблицу приводит нас к прямоугольной матрице размером , где - количество слов в коллекции (размерность пространства), а - число документов. Такое представление называется Vector Space Model (VSM). Обычно эта матрица получается очень разреженой.
Описанная выше величина , однако, несет не полную частотную информацию, характеризующую слово. Для увеличения информативности ее можно умножать на - обратную документную частоту, вычисляемую, например, по формуле:
где - общее число документов в коллекции, а - число документов, в которых встречается данное слово. Кроме того, каждую документа можно нормировать на максимальное значение данного слова по всем документам, чтобы нивелировать влияние длины документа на этот параметр
Выбор весов признаков существенно влияет на качество рубрицирования. Одной из лучших формул вычисления весов, на основании статьи [6], является
Где - вес i-го слова, - частота встречаемости i-го слова в данном документе, - логарифм отношения количества всех документов в коллекции к количеству документов, в которых встречается i-е слово.
Такой выбор формулы можно обосновать теоретически следующими соображениями:
1. Чем чаще слово встречается в документе, тем оно важней. Этот факт учитывает множитель
2. Если слово встречается во многих или во всех документах, то это слово не может являться существенным критерием принадлежности документа рубрике и его вес следует понизить. Наоборот, если слово встречается в малом количестве документов, то его вес следует повысить. Множитель учитывает это соображение и соответствует весу слова ("контрастности") в данной коллекции документов .
3. Для того чтобы учесть различную длину текстов документов в коллекции, веса слов документов следует нормализовать. В формуле (1) веса нормализуются так, чтобы сумма квадратов весов каждого документа была равна 1.
В некоторых случаях для вычисления веса слова в тексте привлекается также дополнительная информация. Например, можно учитывать информацию о структуре текста и словам, встреченным в заголовке, присваивать больший вес.
Даже после приведения всех слов документа к нормализованной форме, полученное пространство признаков имеет очень большую размерность (десятки тысяч). Эту размерность можно существенно уменьшить без ухудшения качества рубрицирования, если выкинуть слова, слабо влияющие на результаты рубрицирования.
Во-первых, обычно из списка признаков удаляют так называемые "стоп-слова" -- предлоги, союзы и т.п. Это не сильно сокращает размерность пространства признаков (список стоп-слов составляется вручную и обычно является небольшим). Но зато удаление стоп-слов обычно улучшает качество рубрицирования за счет удаления информационного шума.
Во-вторых, из списка признаков можно удалить слишком редко встречающиеся слова.
1.3.4 Методы машинного обучения
Важным этапом при решении задачи классификации текстов является выбор метода машинного обучения, который будет применяться к векторному представлению документов.
Методы классификации объектов, основанные на обучении, впервые введены в рассмотрение в 1960-е годы. В настоящее время разработано множество методов машинного обучения, которые применяются при решении широкого круга задач. Многие из них применимы для решения задач классификации текстов. Существуют следующие методы машинного обучения для задач классификации текстов:
· метод Байеса
· метод k-ближайших соседей
· Rocchio classifier
· Нейронные сети
· Деревья решений
· Построение булевых функций
· Метод опорных векторов (SVM (Support Vector Machines))
На основании данных из статьи [6] был выбран метод опорных векторов, т.к. он имеет неоспоримые преимущества перед остальными методами машинного обучения.
1.3.4.1 Метод опорных векторов
Метод опорных векторов (Support Vector Machines, SVM) разработан В. Вапником на основе принципа структурной минимизации риска -- одновременного контроля количества ошибок классификации на множестве для обучения и «степени обобщения» обнаруженных зависимостей.
В наиболее простом случае задача бинарной классификации с помощью метода опорных векторов состоит в построении оптимальной разделяющей гиперплоскости в пространстве признаков высокой размерности. Оптимальность здесь понимается в смысле минимизации верхней оценки вероятности ошибки классификации.
Пусть дана выборка:
где - набор признаков для i-го документа, а - бинарная оценка принадлежности этого документа к одному из классов. Тогда вектор , получаемый из выражения
при наложении на него условия для гиперплоскости
назовем вектором весов.
Линейный случай. Обычно, заранее неизвестно, обладают ли документы свойством линейной разделимости, однако во многих задачах по классификации текстов считается, что они все же линейно разделимы. В этом случае линейный метод SVM сводится к поиску такой гиперплоскости, что сумма расстояний от ближайших к ней (сверху и снизу) точек максимальна среди всех разделяющих гиперплоскостей, расположенных на равных от них расстоянии. Это квадратичная задача оптимизации лагранжиана.
Решение уравнения для выглядит так:
Пусть лагранжиан (4) достигает максимума по при в точке , тогда решение задачи поиска оптимальной гиперплоскости имеет вид:
при этом свободный член равен
Нужные нам решения должны дополнительно удовлетворять условиям Каруша-Куна-Таккера, которые являются необходимым условием оптимальности задачи нелинейного программирования:
из которых следует, что может выполняться только для тех i, для которых , т.е. для тех векторов, которые лежат на гиперплоскостях . Эти векторы называются опорными.
...Подобные документы
Разработка алгоритмов и программных средств поддержки взаимодействия компетентностно-ориентированных моделей в обучающих ИЭС (АТ-ТЕХНОЛОГИЯ). Анализ функциональных возможностей базовой версии компонента выявления текущего уровня компетенций обучаемого.
отчет по практике [1,6 M], добавлен 28.04.2015Нечеткая лингвистическая переменная. Конструктивное описание лингвистической переменной. Структура управляющей логики в виде вычислений с откатами. Наиболее заметные тенденции в истории развития языка программирования Prolog, основные элементы синтаксиса.
контрольная работа [38,8 K], добавлен 17.05.2011Понятие базы данных, модели данных. Классификация баз данных. Системы управления базами данных. Этапы, подходы к проектированию базы данных. Разработка базы данных, которая позволит автоматизировать ведение документации, необходимой для деятельности ДЮСШ.
курсовая работа [1,7 M], добавлен 04.06.2015Понятие базы данных, ее архитектура. Классификация баз данных. Основные модели данных. Примеры структурированных и неструктурированных данных. Достоинства и недостатки архитектуры файл-сервер. Иерархическая модель данных. Виды индексов, нормализация.
презентация [1,4 M], добавлен 06.08.2014Модели данных как формальный аппарат для описания информационных потребностей пользователей. Структура информационной базы. Типы взаимосвязей. Разработка логической структуры базы для хранения данных о пяти поставщиках. Детализация реляционной модели.
презентация [28,9 K], добавлен 07.12.2013Особенности разработки инфологической модели и создание структуры реляционной базы данных. Основы проектирования базы данных. Разработка таблиц, форм, запросов для вывода информации о соответствующей модели. Работа с базами данных и их объектами.
курсовая работа [981,4 K], добавлен 05.11.2011Сущность и характеристика типов моделей данных: иерархическая, сетевая и реляционная. Базовые понятия реляционной модели данных. Атрибуты, схема отношения базы данных. Условия целостности данных. Связи между таблицами. Общие представления о модели данных.
курсовая работа [36,1 K], добавлен 29.01.2011Семантическое моделирование данных. Основные понятия модели Entity-Relationship. Построение инфологической модели в виде диаграммы "Таблица-связь". Проектирование физической модели базы данных. Разработка формы заставки, главной, вторичных кнопочных форм.
курсовая работа [1,5 M], добавлен 26.06.2012Понятие базы данных. Классификация баз данных и системы управления. Подходы к проектированию и модели. Разработка базы данных для школьного врача, которая позволит автоматизировать ведение документации, необходимой для учета состояния здоровья учащихся.
дипломная работа [3,8 M], добавлен 03.10.2013Построение информационной модели наиболее высокого уровня абстракции. Вид и содержание концептуальной модели базы данных. Установление связей между типами сущностей. Спецификация всех объектов, входящих в модель. Средства обеспечения целостности данных.
курсовая работа [2,6 M], добавлен 12.12.2011Понятие информации, автоматизированных информационных систем и банка данных. Общая характеристика описательной модели предметной области, концептуальной модели и реляционной модели данных. Анализ принципов построения и этапы проектирования базы данных.
курсовая работа [1,7 M], добавлен 18.01.2012Анализ существующих алгоритмов обработки информации человеком и современных моделей памяти. Разработка алгоритмов и математической модели ассоциативного мышления. Имитационная модель обработки информации. Компьютерный эксперимент по тестированию модели.
курсовая работа [2,3 M], добавлен 19.11.2014Модель данных как совокупность структур данных и операций их обработки. Иерархическая, сетевая и реляционная модели данных, их основные преимущества и недостатки. Операции над данными, определенные для каждой из моделей, ограничения целостности.
реферат [128,4 K], добавлен 16.02.2012Учет книжного фонда библиотеки. Разработка концептуальной модели данных. Составление спецификации атрибутов и связей, генерация в системе PowerDesigner физической модели по концептуальной модели. Создание скрипта создания базы данных для СУБД FireBird.
контрольная работа [784,2 K], добавлен 10.04.2014Виды языков программирования, их функциональные особенности и отличительные признаки, сферы практического применения. Язык для работы с базами данных SQL. Синтез компьютерной модели спроектированной базы данных, оценка ее эффективности и значение.
контрольная работа [365,4 K], добавлен 24.02.2015Этапы создания и разработки базы данных. Построение модели предметной области. Разработка даталогической и физической моделей данных, способы обработки данных о сотрудниках организации. Проектирование приложений пользователя. Создание кнопочной формы.
курсовая работа [2,1 M], добавлен 14.02.2011Иерархическая модель данных. Основные элементы сетевой модели данных. Требования заказчика. Разработка автоматизированной системы управления "Преподаватели". Описание этапов разработки. Установка связей между таблицами. Резервирование базы данных в SQL.
курсовая работа [1,3 M], добавлен 10.02.2014Системный анализ и анализ требований к базе данных. Концептуальная и инфологическая модель предметной области. Типы атрибутов в логической модели базы. Физическая модель проектируемой базы данных в методологии IDEF1X. Требования к пользователям системы.
курсовая работа [2,3 M], добавлен 21.11.2013Обзор моделей анализа и синтеза модульных систем обработки данных. Модели и методы решения задач дискретного программирования при проектировании. Декомпозиция прикладных задач и документов систем обработки данных на этапе технического проектирования.
диссертация [423,1 K], добавлен 07.12.2010Методика и основные этапы проектирования логической и физической модели базы данных. Реализация спроектированной модели в системе управления базами данных, принципы создания и апробация специального клиентского приложения для работы данной программы.
курсовая работа [1,3 M], добавлен 27.06.2013