Использование анализа данных в средней школе для рекомендации выбора дальнейшего и текущего направлений обучения

Исследования поведения учителей и учащихся при работе с применение информационных технологий и методов машинного обучения. Предсказание итогового результата. Структура "умной" образовательной системы, построенной на применении информационных технологий.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 23.09.2018
Размер файла 2,4 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

[Введите текст]

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ

ВЫСШЕГО ОБРАЗОВАНИЯ

«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ

«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»

Факультет бизнеса и менеджмента

Власов Владимир Павлович

Использование анализа данных в средней школе для рекомендации выбора дальнейшего и текущего направлений обучения

Выпускная квалификационная работа

по направлению подготовки 38.03.05 Бизнес-информатика

образовательная программа «Бизнес-информатика»

Москва, 2018

Оглавление

Введение

Глава 1. Практика применения анализа данных в образовании

1.1 Использование анализа данных для исследования обучения при традиционной концепции

1.2 Исследования поведения учителей и учащихся при работе с применение информационных технологий с применением методов машинного обучения

1.3 Предсказание итогового результата и выявление групп риска среди учащихся при помощи анализа данных

1.4 Анализ шаблонов работы с учебными материалами

Выводы по 1 главе

Глава 2. Применение методов анализа данных для рекомендации текущей и последующей образовательной траектории

2.1 Концепция исследования

2.2 Этапы и результаты исследования

Выводы по 2 главе

Глава 3. Структура «умной» образовательной системы, построенной на применении информационных технологий

Выводы по 3 главе

Заключение

Список литературы

Приложения

Введение

На данный момент в России сложилась тенденция к увеличению количества различных проектов по внедрению информационных технологий в школьное образование, таких как, например, Московская электронная школа [3]. При этом следует отметить, что несмотря на крупные вливания в данную сферу не происходит коренных изменений в самой концепции образовательной системы. Одним из таких изменений могло бы быть создание государственной системы управлением обучением, включающей в себя модуль рекомендаций курсов для онлайн-обучения внутри системы, а также специальностей и вузов, где можно будет продолжить получение образования. Данная работа основывается на проверке возможности построения такой системы на основании данных полученных при помощи анкетирования.

Актуальность. Развитие информационных технологий оказывает огромное влияние на все виды деятельности, в том числе и образование. Однако на данный момент как школьное, так и высшее образования не используют все возможности, которые приносят с собой Интернет и компьютеры. Одними из таких возможностей является реализация концепции blendedlearningи анализ деятельности учащихся через использование машинного обучения.

Образовательный анализ данных, является крайне полезным инструментом, который может решить множество задач при внедрении в учебные заведения любого уровня. К этим задачам можно отнести кластеризацию учащихся и педагогов для выявления зависимостей и связей между ними, оценку качества образования, оценку риска получения учащимся неудовлетворительной оценки, автоматическое построение рекомендаций ресурсов и материалов для лучшего усвоения программы.

Одним из важных вопросов для многих учащихся в школе, является выбор траектории обучения и в данном вопросе рекомендательные системы в связке с выбором формальных онлайн и смешанных курсов могли бы оказать положительное влияние на ситуацию. Реализованная система, может позволить не только проходить курсы онлайн, но и будет советовать, какие из них стоит пройти тому или иному учащемуся, что позволит качественно работать с системой и еще больше персонализировать образование.

Однако встает следующий вопрос: «можно ли организовать рекомендательную систему в данном случае на основании записей об оценках и деятельности учащегося в и вне рамок подобной системы? Будут ли ее предсказания ценными для учащегося?». Для получения ответов на данные вопросы в рамках исследования должна быть создана и проверена тестовая версия подобной системы.

Более того, анализ моделей, полученных в рамках системы могут позволить автоматически создавать портрет типового учащегося, который хочет работать с той или иной сферой знаний, что полезно с педагогической точки зрения.

Новизна исследования. Несмотря на то, что в западных периодических изданиях зачастую возникают материалы, посвященные анализу образовательных данных, в Российской Федерации данная тема изучена достаточно мало. Более того, основываясь на анализе литературы по данной теме, можно сказать, что рекомендации в формальном образовании практически не развиты и в качестве объекта берут медиа-ресурсы, а не курсы в целом. Рекомендательные системы в образовании развиты только в массовых открытых онлайн курсах на крупных ресурсах, таких как eDXили Coursera. При этом они основываются на иных, нежели школьные оценки и деятельность учащегося переменных.

Данное исследование является объединением этих трех областей. Во-первых, оно ставит свое задачей исследование именно российских образовательных данных, которые могут отличаться ввиду культурных и социальных факторов. Во-вторых, ставится вопрос о возможности рекомендаций курсов в рамках формальной образовательной системы.

Цель исследования. Создание и апробация статистической значимости модели рекомендательной системы на основании данных из российских школ.

Задачи исследования.

Проанализировать практику применения анализа данных в образовании.

Сбор данных об успеваемости и внеклассной активности учащихся и выпускников российских школ.

Создание и тестирование модели с учетом полученных данных и методов машинного обучения.

Описание концепции обучения при которой возможна успешная реализация данной модели

Методы исследования. Анализ, классификация, анкетирование, математическое моделирование.

Содержание работы по главам.

Во введении обосновывается актуальность работы, приводятся цель, задачи методы и гипотеза исследования содержание работы.

В главе 1 описывается практика применения образовательного анализа данных. В западной академической практику существует большое количество публикаций, посвященных применению машинного обучения для создания моделей так или иначе относящихся к образованию. Среди таких исследований можно выделить анализ традиционной концепции обучения, изучение поведения педагогов и учащихся для оценки качества преподавания, создание моделей для предсказания итогового результата и выявления студентов в «группах риска», изучения моделей использования электронных учебных материалов.

В главе 2 описано исследование, которое состоит из сбора образовательных данных, их анализу и тестированию получившейся в ходе работы модели. Для исследования использовались 4 метода классификации: логистическая регрессия с «l1»-нормализацией и три метода, основанных на применение теоремы Байеса (основанные на распределениях Гаусса, Бернулли и мультиноминальном). Далее после оценки моделей при помощи показателя AUC-ROCscore было принято решение отказаться от работы с моделью, основанной на распределении Гаусса, так как она показала наихудший результат. Наилучший результат для модели рекомендации курсов показала логистическая регрессия; все модели, при сравнении со взвешенной случайной показали статистически значимое преимущество с p-value = 0,001. Для модели построенной для рекомендации направления дальнейшего обучения лучше себя проявил метод с использованием мультиноминального распределения; p-value составил 0,01.

В главе 3 приводится и анализируется концепция образования при которой возможна успешная реализация данной рекомендательной системы. На данный момент в большинстве школ РФ уже выполнен переход к образовательной к образовательной концепции, использующей «электронный журнал» или «электронный дневник», однако более эффективным использованием современных технологий являлась бы система объединяющая электронный дневник, систему с применением методов машинного обучения и модуль для прохождения курсов через сеть Интернет. Данная концепция позволила бы сократить нагрузку на преподавателей, повысить качество и персонализацию обучения, улучшить точность отчетов и увеличить знания о потребностях учащихся и проблемах в современном образовании.

В заключении делаются выводы по проведенной работе.

В приложениях находятся листинги программ, использованных для проведения исследования и таблица корреляций, полученная по результатам исследования.

Глава 1. Практика применения анализа данных в образовании

Современный образовательный процесс, как и многие другие, генерирует огромное количество данных, которые могут быть использованы для создания исследований, посвященным различным его аспектам. Данный факт достаточно очевиден при использовании для обучения онлайн платформ, однако и обучение по при традиционном, личном взаимодействии на данный момент способно генерировать достаточный объем подобных данных для проведения анализа при помощи методов машинного обучения. К таким данным относятся учебные планы, записи об успеваемости, информация об общении учащихся и учителей посредством обмена сообщениями по электронной почте или на форумах. Полученные данные являются крайне важными для анализа процесса обучения в современной школе, улучшения и развития образовательного процесса [27].

Сейчас в Российской Федерации реализуется множество проектов по внедрению технологий в образование, но ля того чтобы они работали с полной отдачей необходимо создать систему автоматической и, что более важно, постоянной оценки процесса обучения. Для этого необходимо наблюдать за самыми различными его аспектами: деятельностью уровень взаимодействия педагога и учащегося, направления использования мультимедийного оборудования, качество управления процессом. Однако с ростом количества внедренных технологий увеличивается и количество данных, которые могут быть собраны в рамках процесса для последующего анализа, что с одной стороны, делает задачу все более важной, с другой стороны, улучшает качество моделей, которые могут быть при помощи подобного анализа построены[8].

Вопросы использования образовательного анализа данных сильно интересуют исследователей многих стран. Работы, посвященные данной теме можно разделить на четыре группы: оценка использования электронных средств при традиционной концепции обучения, анализ действий педагогов и учащихся, выявление групп риска среди учащихся и исследование работы с различными медийными источниками.

1.1 Использование анализа данных для исследования обучения при традиционной концепции

Работы, отнесенные к данной сфере связаны с анализом традиционного обучения (личного общения педагога с группой учащихся) при использовании электронных средств. В данном виде исследований можно выделить три вида целей: облегчение взаимодействия между главными действующими лицами (педагоги, учащиеся, администрация); создание моделей для автоматической оценки деятельности педагога; создание моделей для оценки итогового качества полученного образования.

Так некоторые исследователи сосредоточились на оценке того как влияют технологии на образование. Примером этого можно назвать семантический анализ форумов и блогов, посвященных образовательным платформам [33]. В данном случае исследователи при помощи трех различных методов семантического анализа (InformationGain, MutualInformation, CHIstatistics)создали специальную модель, которая определяет является ли данная запись позитивно или негативно окрашенной. Она может быть полезна для оценки того, как пользователи реагируют на новую технологию в образовании и упростить оценку ее качества.

Также к этому классу исследований можно отнести те, цель которых разделение учащихся на различные группы в зависимости от того, как быстро и качественно они могут проходить курсы. Например, исследование 152 индийских школьников показало возможность разделения на эти группы при помощи различных методов (нейронные сети, NaпveBayes, SMO и другие), а также выделило основные факторы, влияющие на то будет учащийся скорее успевать или нет (так в рамках индийской старшей школы к ним относятся, в первую очередь, доступ к сети Интернет и компьютеру дома)[25].

Также существуют исследования, посвященные анализу связей между поведением учащихся при прохождении курсов и их итоговому результату. Так при помощи данных о том, когда и за каким компьютером в аудитории сидел студент была проверена гипотеза о том, что частые перемещения по аудитории коррелируют с итоговым результатом и/или полом учащегося.Данное исследование показало, что учащиеся, редко меняющие сове рабочее место в аудитории, чаще получают хорошие оценки по тестам. При этом зачастую оценка меняется в худшую сторону при смене места. При этом девушки менее склонны к смене места (77% редко меняющих место среди девушек против 50% среди студентов мужского пола)[30].

1.2 Исследования поведения учителей и учащихся при работе с применение информационных технологий с применением методов машинного обучения

В данной группе исследований основной целью является оценка того, как те или иные действия педагогов влияют на процесс обучения. Это важно для создания между учителем и учащимся согласованности действий необходимой для эффективного обучения. Основными целями данных работ является: выявление поведения учащихся и педагогов, которые возникают при их взаимодействии; установление зависимостей между опытом педагога и качеством получаемого образования; улучшение методологий и образовательных планов.

Одним из важных направлений исследований является оценка качества учебного процесса через данные о педагоге. Так, например, китайское исследование данных, полученных при помощи опроса 1000 учащихся на языковых курсах для взрослых, при использовании метода построения деревьев решений с нечеткой логикой показало, что должность преподавателя (профессор, доцент, лектор или научный ассистент) является индикатором качество обучения - более высокий титул положительно коррелирует с качеством учебного процесса; преподаватели женского пола являются более предпочтительными, если речь идет о тех, кто находится на более низких должностях; возраст, семейное положение и образование оказывают достаточно незначительное влияние на качество обучения [19].

Другим направлением изучения является построение правил ассоциации и применение правил ассоциации для выявления сильных и слабых сторон каждого преподавателя, а также понимания ключевых факторов, позволяющих достичь высокого качества образования [17].

В качестве объекта для подобного исследования может выступать не только преподаватель, но и учащиеся. Существуют различные модели для оценки качества образовательного процесса, через данные о действиях студентов. Многие исследователи занимаются выявлением шаблонов поведения учащихся для помощи в оценке уровня знаний и улучшения понимания потребностей учащихся.

Так в одном из исследований, посвящённых данной тематике, при помощи методов машинного обучения была построена система итоговой оценки в реальном времени уровня успеваемости учащегося на основании оценок за промежуточные тесты, уровень вовлеченности в процесс обучения,степень концентрации и другие факторы. Данная система показала себя успешной в создании для учащихся комфортной учебной среды, повысила успеваемость учащихся и облегчила работу для педагога[9].

Другие исследования сконцентрированы на анализе того, как ведут себя различные группы учащихся. Например, в одном из исследований для анализа паттернов поведения учащихся был применен анализ графов переходов между материалами курса в электронной среде. Так на рисунке 1 можно увидеть разницу между хорошо и плохо успевающими студентами[31].

Рисунок 1 - Графы использования материалов в образовательной среде студентами с высокой и низкой успеваемостью

Достаточно заметно, что студенты с худшей успеваемостью чаще выполняют тестовые задания, тогда как учащиеся с лучшими оценками ориентируются в первую очередь на основные материалы курса. Так же был проведен анализ того как первокурсники используют данную систему (на предыдущем рисунке представлены результаты для студентов находящихся на втором году обучения). На рисунке 2 можно увидеть граф поведения первокурсников и созданный при помощи анализа карты сайта граф кротчайших путей.

Рисунок 2 - Граф поведения первокурсников (слева) и граф кротчайших для сайта путей (справа)

По результатам анализа второго графа ученые сделали вывод, что студенты первого курса в среднем показывают более длинные пути при переходе от одной ссылки от другой, а их перемещения между страницами гораздо более хаотичны. При этом они заметили довольно сильную связь между шаблонами поведения отстающих на первом и втором курсе, что может быть использовано для лучшего понимания причин плохой успеваемости.

Также существуют исследования, призванные сравнить успешность разных концепций обучения. Так для учащихся в пятом классе было создана специальное ПО, которое предполагало три варианта изучения одной темы (построение компьютерной модели экосистемы). В первом случае учащемуся предлагалось обучить систему при помощи создания специальной карты связи, а потом протестировать ее; во втором случае требовалось так же обучать систему, но по ходу решения задачи она давала подсказки для решения полученной задачи; в третьем случае не требовалось обучать систему, а подсказок ученик получал больше, чем во втором [7].

После восьмимесячного перерыва данное задание было задано всем группам во второй раз без возможности получить какую-либо обратную связь или подсказку по ходу работы. Далее был проведен сравнительный анализ показателей успешности освоения системы разными группами и построены цепи Маркова переходов между различными типами действами при построении модели.

Рисунок 3 - Цепи Маркова для сравнения шаблонов поведения учащихся разных групп при первом и втором выполнениях работы

Результаты исследования показали, что в данном случае наилучшей моделью оказалась вторая, а наихудшей третья. При этом анализ цепей Маркова показал, что учащиеся из первых групп уделяют больше времени к анализу системы, которую им требуется построить. Студенты же третьей группы больше склонны к тому чтобы сразу после тестирования перейти к изменению системы.

В рамках данной группы исследований, в целом, работы можно разделить на те, которые изучают связи между демографическими показателями учащихся и педагогов, и поиском поведенческих шаблонов через данные о событиях, которые происходили во время обучения. И те, и другие исследования являются важными для оценки качества образования и составления эффективных учебных планом, однако второй направление является более перспективным (несмотря на трудность сбора данных).

1.3 Предсказание итогового результата и выявление групп риска среди учащихся при помощи анализа данных

Достаточно большая часть исследований в рамках образовательного анализа данных посвящена выявлению среди учащихся так называемых «групп риска», то есть тех, кто в случае формальных курсов с достаточно большой вероятностью может получить неудовлетворительную оценку, а в случае онлайн курсов - неполучение финального сертификата. Данные исследования направлены на то, чтобы выявить тех учащихся, к которым нужно проявить дополнительное внимание педагогам или организациям, осуществляющим данный образовательный процесс.

Одним из примеров подобного исследования является анализ 300 учащихся национального университета Тайваня [18].В данной работе команда ученых строило систему по предсказанию того сдаст учащийся или нет финальный экзамен на основании следующих данных:

количество входов в LMS;

время проведенное в системе,

среднее время проведенное в рамках одной сессии;

общее время просмотра материалов;

количество просмотренных материалов;

среднее время просмотра материала;

общее время просмотра материалов (по категориям);

количество просмотренных материалов (по категориям);

среднее время просмотра материала (по категориям);

доля времени отведенное на чтение материалов по каждой категории;

количество заданий сданных после заданного срока;

количество не сданных заданий;

доля сообщений на форуме;

количество сообщений на форуме.

На основании данных переменных было построены деревья решений, при этом стоит заметить, что они достаточно сильно отличались так, как были построены на разных методологиях. После анализа эффективности и статистической значимости моделей было выяснено, что деревья построенные при помощи методов C4.5 и CART показали себя лучше, чем дерево построенное методомLGR. При итоговой проверке первые две модели показали точность в районе 90-95%. Так же исследователи выделили те переменные, которые оказывают наибольшее влияние на модель. Так самым важными оказались количество входов в систему, время чтения документов по категориям и среднее время, проведенное пользователем в системе за время одной сессии. Наименее же важными для количество задержанных и пропущенных домашних заданий, а также переменные связанные с участием пользователя в общении на форуме.

Стоит отметить, что в следующем году исследователи внедрили данную систему, которая отслеживала показатели для учащихся на тех же предметах студентов. Данная программа оказалось достаточно полезной как для учащихся, так и для преподавателей (по результатам проведенного среди них опроса).

Другим примером работы в данной области является анализ канадско-австралийскими учеными данных о 118 студентов университета Британской Колумбии, полученных через LMS Blackboard Vista. В этом исследовании сначала был проведен корреляционный анализ, выявивший переменные, с помощью которых можно построить прогноз об успеваемости учащегося (таблица 1)[23].

Таблица 1 - Переменные, показавшие высокие результаты при корреляционном анализе

Переменная

r

p

Количество опубликованных сообщений в дискуссиях

0,52

0,00

Количество посещений системы

0,40

0,00

Время проведенное в сети

0,34

0,00

Количество просмотренных файлов

0,33

0,00

Количество выполненных заданий

0,31

0,00

Количество начатых заданий

0,31

0,00

Количество ответов на сообщения других пользователей в дискуссиях

0,30

0,00

Количество отправленных электронных писем

0,28

0,00

Количество отправленных заданий

0,26

0,00

Количество прочитанных сообщений в дискуссиях

0,25

0,00

Количество переходов по ссылкам

0,25

0,00

Количество открытых дискуссий

0,24

0,01

Количество прочитанных электронных писем

0,22

0,01

Далее была простроена модель логистической регрессии, показавшая точность в 73% (что не является достаточно высоким результатом, так-как его можно было бы добиться и построением случайной модели), а также проведен анализ графа общения пользователей посредством LMS, показавший то, что люди, находящиеся в его центре (те, к кому чаще пишут сообщения), чаще получают положительные оценки.

Следует отметить, что работы, посвященные данной теме, используют большое количество различных моделей и достаточно часто используются на крупных образовательных онлайн сервисах для предотвращения оттока посетителей. Данная тема является одной из самых популярных и изученных рамках образовательного анализа данных. Для изучения данного вопроса, например:

неоднократно строились деревья решений [18] [20];

предсказывались результаты на основе демографических данных поступивших студентов [23] [16];

создавались модели поиска ортогональной базы решений и нечеткой логики [11].

1.4 Анализ шаблонов работы с учебными материалами

Наиболее ярким результатом внедрения информационных технологий в образование является использование в нем различных электронных учебных материалов. К ним относятся различные мультимедийные источники, которые доступны учащимся посредством сети Интернет. Следовательно, для того чтобы понять, как обеспечить наиболее эффективное использование данных источников, необходимо провести множество исследований поведения учащихся при их использовании.

Следует отметить, что во многом исследования в данной группе ограничиваются концепциями систем, которые могли бы быть предложены для анализа. Так, некоторые исследователи предполагают, что одним из наиболее важных модулей в LMS должна быть система машинного обучения, которая будет предоставлять персональные рекомендации учебных материалов на основании анализа поведения учащихся при помощи выученных логических правил [14]. Для построения и оценки подобных систем предлагается использовать правил ассоциаций и коллаборативной фильтрации [15].

Однако существуют и различные работы, направленные на выявление паттернов работы с LMS. Для этого подходят методы машинного обучения без учителя, например, различные виды кластеризации. Так при одном из исследований студентов третьего курса факультета компьютерныхнаук выделили три типа поведения учащихся при работе с LMS: постоянно работающие с системой пользователи, редко использующие, и периодически много работающие с системой. Данные кластеры были получены на основании данных о частоте входов, времени проведенном в системе, времени проведенном при просмотре материалов различных типов (видео, презентации, тексты), времени работы с домашними заданиями [22].

Данное исследование показало, что:

непостоянно, но много использующие систему студенты, в первую очередь, работают с презентациями;

постоянно использующие систему более ориентированы на просмотр видеоматериалов с лекциями, а редко использующие смотрят видео с лекций гораздо меньше студентов в других кластерах;

в целом студенты в первом и втором кластерах проводят аналогичное время в системе, третья группа проводит в системе гораздо меньше времени;

первая и третья группы показывают сравнительно равные результаты прохождения курса, лучшие чем у редко использующих систему учащихся;

учащиеся постоянно использующие систему более мотивированы к прохождению курса.

Кластеризация может проходить и на более высоком уровне. Важным для создания будущих связей между студентов и рекомендуемым ресурсом или курсом является понимание не только поведения самих студентов, но и того к какому поведению располагает сам ресурс. Для этого может проведен анализ курсов на основании данных из систем управления курсами и управления образованием. Первая является источником данных о самих курсах: времени проведения, преподавательском и ученическом составе; вторая является источником поведенческих данных людей, участвовавших в курсе: их действия с материалами, общение в рамках системы и так далее. Подобное исследование проведенное на основании данных о более чем 2000 курсов позволило выделить следующие кластеры курсов [32]:

Communicationor Collaboration - при прохождении данных курсов студенты активно пользовались LMS для общения и организации групповой работы;

Deliveryor Discussion - в данном случае студенты использовали LMS для обсуждения и отправки преподавателям заданий курса;

Sharingor Submission - в рамках курсов этого кластера LMS использовалась лишь для обмена работами и их сдачи на проверку;

Inactiveor Immature - при проведении курсов данного типа LMS практически не использовалась.

Подобные исследования важны для понимания такого, как лучше всего организовать процесс обучения. С одной стороны, их сравнение позволяет выявить наиболее качественные типы курсов, с другой стороны разным студентам могут подходить разные по типу использования LMSкурсы (что важно при построении рекомендательных систем). Более того, курсы разных типов связаны с различиями в параметрах моделей для предсказания итогового результата учащегося: так в первой группе более важными являются показатели количества заданных вопросов и времени до ответа преподавателю; во второй группе - просмотра материалов и посещения дискуссий; в третьей - количество сообщений, написанных на форуме, и отправленных на проверку заданий.

Выводы по 1 главе

Таким образом, на данный момент существует множество исследований различных данных учащихся на всех ступенях образования. Наиболее интересуют исследователей следующие темы:

автоматическая оценка качества образования;

выявление шаблонов поведения учащихся;

предсказание итоговых оценок и выявление учащихся, которые с большой вероятностью получения неудовлетворительной оценки.

Для решения данных задач используются различные методы машинного обучения, такие как: правила ассоциации и нечеткой логики, построение деревьев решений, создание нейронных сетей, разные виды регрессий, методы NaпveBayes. Для получения параметров и оценки качества моделей используются данные об успеваемости, демографические сведения, данные о пользовании системой (параметры входа и выхода из нее, времени просмотра тех или иных материалов и так далее). Многие из этих моделей являются достаточно качественными для практического использования с целью улучшения и персонализации образования.

Глава 2. Применение методов анализа данных для рекомендации текущей и последующей образовательной траектории

2.1 Концепция исследования

Исследование образовательных данных состоит из следующих этапов:

Сбор данных об успеваемости и внеклассной активности учащихся и выпускников российских школ.

Обработка полученного массива данных и перевод переменных в категориальный и числовой вид;

Создание моделей классификации «один против остальных»;

Выбор наиболее качественных видов моделей;

Создание модели рекомендательной системы, при помощи.

Оценка коэффициентов при помощи лассо-регрессии

На этапе сбора данных может быть использовано две разных стратегии.

Первая стратегия - автоматический сбор данных через системы типа «электронный дневник» или системы управлением образования (LMS). Данный вариант является предпочтительным так как он позволяет собирать наиболее точную информацию, которая не будет сильно искажена из-за человеческого фактора. В данном случае в LMS должны заноситься не только оценки, но и данные об онлайн-курсах ученика, его успехах в олимпиадах и внеклассной активности.

Вторая стратегия - опрос людей, которые учатся или учились в школе. Для этого должен быть создан опрос, который позволит опросить большое количество респондентов, при этом не отнимая у них очень много времени (что важно для увеличения количества респондентов). Опрос помогает обойти закрытость учреждений среднего образования, которые зачастую не готовы выдать данные из-за закона о защите персональных данных. Следовательно, для данной работы пришлось воспользоваться вторым вариантом, однако в случае развёртывания системы данные должны собираться и обрабатываться автоматически.

Второй этап исследования состоит из анализа получившегося объема данных и его переформирования в пригодный для машинного обучения формат. Во-первых, все ответы, написанные текстовом виде, должны быть переформированы в числовой формат. Так для вопросов с возможностью нескольких одновременных вариантов ответа должен быть создан вектор длинной в количество всех вариантов ответа на вопрос. Каждое число вектора является либо нулем, либо единицей. В случае вопросов с выбором одного варианта ответа можно оставить одну переменную, однако каждый вариант ответа перевести в числовой формат в заранее выбранном диапазоне.

Третий этап создания модели состоит из создания моделей классификации. Существует две стратегии классификации при наличии более, чем двух классов. Первая создание моделей «один против одного». Если существует три возможных класса, то создается три модели, которые вычисляют вероятности принадлежит этот объект первому или второму классу, первому или третьему, второму или третьему. Вторая - модели «один против остальных». В таком случае создаются модели, отвечающие на вопрос «какова вероятность, что этот объект принадлежит первому классу, а не к другим; второму, а не другим…». При выполнении данного исследования было принято решение использовать модели «один против всех»[13].

Данное решение позволяет решить несколько проблем. Во-первых, рекомендательная система может и должна опираться на ассоциацию одних компонентов выбора и других. Так, если пользователи системы зачастую берут один предмет с другим, система должны быть в состоянии это засечь. Использование всех переменных в таком случае возможно только при использовании модели «один против всех». Во-вторых, из-за того, что объект может принадлежать одновременно двум классам это отрицательно влияет на точность модели. В-третьих, создание моделей «один против одного» существенно усложняет систему и по ней будет труднее вывести итоговое предсказание.

Каждая созданная модель «один против всех» является функцией. Для решения данной задачи было выбрано четыре варианта подобных функций.

Первой является логистическая регрессия, которая довольно часто используется для классификации любых данных. Данный метод основан на логистической функции (формула 1)[10].

Формула 1. Логистическая функция от z

Логистическая функция (рисунок 4) обладает несколькими полезными для решения проблемы классификации свойствами. Во-первых, при стремлении xк минус бесконечности она стремиться к нулю, а при стремлении xк плюс бесконечности - к единице. Во-вторых, она является непрерывной и не убывает на всей области определения. Благодаря этому она является функцией распределения вероятности, а метод линейной регрессии в качестве результата выдает вероятность нахождения объекта в целевом классе.

Рисунок 4 - График логистической функции

В качестве переменной в функции используется произведение вектора параметров на вектор переменных объектов. Далее идет оптимизация вектора параметров для минимизации значения функции потерь. Данную функцию можно увидеть в формуле 2, где n- количество объектов в обучающей выборки, i-номер объекта в выборки, y- реальное значение переменной предсказываемого класса, аy с крышкой - вероятность данного класса, посчитанное моделью.

Формула 2.Функция потерь для логистической регрессии

Следует заметить, что для решения данной задачи логистическая регрессия была использована с “l1”-нормализацией, что означает, что к функции потерь прибавлялось произведение параметра л на модуль вектора параметров модели. Данная нормализация является важной для уменьшения переобучения модели.

Три другие функции относятся к методам семейства NaпveBayes. Данные методы основаны на применении теоремы Байеса (формула 3) [28].

Формула 3. Общая форма теоремы Байеса

При это модель делает предположение о независимости всех переменных друг от друга (формула 4).

Формула 4. Математическая формулировка независимости переменных.

Благодаря этому предположению формула 3 может быть упрошена и приведена к следующему виду (формула 5):

Формула 5. Упрощенная формула Байеса для независимых переменных.

Так как  является постоянным для каждого объекта можно воспользоваться следующим правилом классификации:

Формула 6. Правило классификации для методов NaпveBayes

Несмотря на достаточно серьезное упрощение модели на этапе предположения о независимости всех переменных, данные методы показывают крайне высокую точность для решения очень многих задач реального мира.Более того данный метод позволяет этим зависимостям, наслаиваясь друг на друга, уменьшать итоговую ошибку классификатора. Эти методы наиболее часто используется при большом количестве переменных и маленьком объеме выборке, что соответствует задачи в данном исследовании [34].

Отличия между тремя методами в данной группе лежат в некоторых предположениях о структуре данных. Гауссовый метод предполагает, что все переменные распределены нормально, а параметры  и  в формуле 7 подбираются при помощи метода максимального правдоподобия.

Формула 7. Распределения Гаусса для переменных

Мультиноминальный метод предполагает следующее распределение для каждой переменной:

Формула 8. Распределение для переменных при мультиноминальном методе

В формуле 8 - количество раз, когда i-ая переменная встречается при классе y, а - количество всех случаев для данного класса. Параметр б служит для нормализации вероятностей и предотвращение появления нулевых вероятностей. Для работы использовался показатель бравный 1, что называется сглаживание Лапласа. Данный метод зачастую используется классификации текстов, однако текущая проблема достаточно похожа на решение подобной проблемы, так как многие переменные представлены в бинарном виде (как и во многих случаях работы с текстом).

Третий метод предполагает, что каждая переменная распределена в соответствии с биноминальным распределением (формула 9). При этом их общее распределение является многомерным распределением Бернулли [6].

Формула 9. Биноминальное распределение

В данном случаем правило выбора класса (формула 10) обладает, в отличии от мультиноминального, возможностью «замечать» отсутствие переменной при выдаче предсказания, когда второй из представленных методов просто игнорирует это отсутствие.

Формула 10. Правило выбора для метода Бернулли

Для всех трех методов оптимизируется функция логистических потерь (формула 2). Однако более важным для сравнения качества предсказаний является подсчетпоказателя AUC-ROCscore(площадь под кривой рабочей характеристики приемника). Рабочей характеристикой приемника называется график, где по шкале абсцисс находится доля неправильно предсказанных объектов класса к общему количеству предсказанных объектов другого класса, а по шкале ординат доля правильно предсказанных объектов целевого класса к общему количеству данного класса. Данные значения вычисляются для каждой границы между классами. Чем больше площадь, находящаяся под данной кривой тем лучше проявляет себя получившаяся модель[29].

На следующем этапе проводится создание рекомендательного модуля, который при помощи моделей одного типа предсказывает вероятности для каждого объекта. После берется n самых больших показателей и переводятся в список из nрекомендуемых предметов. Точность модели определяется как доля людей, для которых хоть один объект (предмет или специальность), указанный при прохождении опроса,находится в списке n рекомендуемых объектов.

Для проверки гипотезы исследования о том, что данная модель будет статистически значимой, производится сравнение со случаем, когда nобъектов для рекомендации выбирается случайно. Так как выборка является достаточно неравномерной (доли объектов в ней сильно отличаются), случайный выбор является взвешенным - вероятность, что ni принадлежит множеству случайно «рекомендованных» равна доле людей, которые выбрали данный объект. Каждый объект может присутствовать в выборке только один раз. В соответствии с центральной предельной теоремой [1] строится доверительный интервал для вероятности случайной «рекомендации». В случае, если вероятность, полученная при использовании модели, попадает в доверительный интервал для случайной «рекомендации», данная модель также является случайной и не может быть использована для работы.

Отдельно для каждого случая рассчитывалась модель с «l1»-нормализацией (или лассо-регрессия) с высоким показателем л. При подобном использовании модели веса при переменных зачастую стремятся, к нулю и благодаря этому можно выделить наиболее значимые для модели переменные [12].

2.2 Этапы и результаты исследования

На первом этапе исследования был создан анонимный опрос в сети Интернет, с целью с одной стороны выявить то, какие предметы выбрали бы они, если бы обучались в данной системе, их оценки в школе по основным предметам, участие в олимпиадах и внеклассной активности. Далее этот опрос был переделан в массив данных, содержащий числовые и бинарные показатели на основании, которых можно сделать прогнозы о том, какие предметы они бы выбрали для изучения. В конце работы была построена и проверена простая рекомендательная модель.

Первым этапом работы является создание опроса при помощи сети Интернет. Опрос состоит из трех частей (таблица 2): о том на специальность какого типа респондент хочет поступить или поступил и какие предметы он бы выбрал для онлайн изучения на базовом или продвинутом уровне; об оценках учащегося в школе по основным предметам; о том, участвовал ли респондент в олимпиадах различного уровня и внеклассных мероприятиях.

Таблица 2 - Части проведенного опроса

Часть опроса

Список вопросов

1

«Я поступил (или хотел бы поступить) на направление связанное с...»

«Если бы я мог проходить на базовой основе школьный предмет онлайн и при этом отказаться от обучения по нему в школе, то это были бы следующие предметы...»

«Если бы я мог проходить на продвинутой основе (частично с вузовской программой) школьный предмет онлайн и при этом отказаться от обучения по нему в школе, то это были бы следующие предметы...»

«Основная причина почему я стал бы учиться онлайн»

2

12 типовых вопросов про уровень оценок в средней школе

3

3 вопроса про участие в окружном, областном и финальных этапах Всероссийской олимпиады школьников по разным предметам, вопрос об участии в олимпиадах проводимыми высшими учебными заведениями и вопрос об участии во внеклассной активности.

Первая часть опроса служит для создания переменных, которые с одной стороны важны для построения прогноза, с другой стороны являются теми целевыми переменными, которые должны быть предсказаны системой для каждого отдельного пользователя. Первый вопрос ставит своей целью узнать дальнейшее направление обучения респондента. Полученные из него переменные являются целевыми для системы в целом. Второй и третий вопрос являются более узкими и предлагают составить свой список предметов, которые человек хотел бы проходить на базовом или продвинутом уровне. Оба эти списка потом будут переработаны в бинарные категориальные переменные для последующего анализа.

Вторая часть опроса служит для того, чтобы узнать какие оценки были у респондента в школе. Для удобства пользователя он указывает лишь наиболее подходящий для его случая вариант, который варьируется от неудовлетворительных оценок до отличных. Всего есть 5 вариантов ответов на каждый вопрос. Список предметов (алгебра, геометрия, русский, литература, история, иностранный язык, физика, химия, география, обществознание, биология, информатика) соответствует тому, какие предметы предлагаются для изучения онлайн на базовой и продвинутой основе.

Третья часть опроса создана для того, чтобы ознакомиться с внеклассными и олимпиадными успехами респондента в школе. Здесь список предметов несколько меняется: алгебра и геометрия объединены в математику. В качестве внеклассной активности предполагаются участие в спортивных и общественных мероприятиях, а также волонтерская деятельность.

Далее, полученный массив данных перерабатывается при помощи программы в формат, который более удобен для построение математических моделей. Программа, написана на языке python3.5 с использованием библиотекpandasи random и программной среды JupyterNotebook. Текст программы полностью представлен в приложении 1.

В приведенной программе стоит отметить два важных момента. Во-первых, после изменения ответы пользователей представлены категориальными бинарными переменными, что позволяет с легкостью использовать их для создания прогнозов.

Во-вторых, ответы пользователей по поводу их школьных оценок представлены как числовые переменные, примерно равные ожидаемому среднему баллу по предмету. Так, в случае, если респондент отвечал на вопрос об оценке «только пятерки», программа переведет этот ответ в случайное значение от 4,7 до 5,0. Это сделано для большей схожести с теми данными, которые могут автоматически собираться в школе.

В конце программы массив полученных данных сохраняется. Всего он содержит 99 различных переменных, которые могут служить для составления предсказаний.

В первую очередь опишем набор данных при помощи стандартных статистических показателей. Всего опрос содержит ответы 252 респондентов. Каждому из них соответствует 96 категориальных и численных переменных.

Перед тем, как перейти к описанию самих переменных, посмотрим то, как респонденты отвечали на вопрос «какова основная причина, из-за который они стали бы брать онлайн курсы вместо обычных школьных». Только лишь 16 процентов опрошенных посчитали, что они не стали бы учиться онлайн в рамках подобной системы. В сумме около 40 процентов респондентов связали желание учиться онлайн с недостаточным качеством преподавания, объема программы или возможностями для подготовки к ЕГЭ. Больше 30 процентов говорят о том, что подобная система позволила бы им оставить больше свободного времени, которое они могли бы направить на другую деятельность. 10 процентов говорят о том, что для них наиболее важной является возможность изменить свой распорядок дня и позже вставать.

Теперь перейдем к описанию того, какими получились значения численных и категориальных переменных. Первой группой таких переменных являются оценки. Все средние значения находятся в диапазоне от 4 до 4,7 баллов. Судя по данной выборке наилучшие оценки школьники получают по литературе, иностранному и русскому языкам (около 4,6 баллов); наихудшие по химии и физике (около 4,15 баллов) и алгебре и геометрии (4,27 балла), стоит заметить, что этим предметам соответствует и наивысшая дисперсия, что может свидетельствовать о том, что в отличии от других эти предметы либо по разному преподаются в разных школах, либо наиболее по разному даются учащимся.

Далее переходим к первому типу категориальных переменных - поступление в вузы. Всего в опросе можно было выбрать из 7 направлений специальностей. Больше всего (36%) опрошенных находятся на гуманитарных специальностях, на втором месте экономические (29%). Меньше всего принадлежит к педагогическим, медицинским и естественно-научным (около 8% каждый).

Все предметы, доступные для выбора, можно было выбрать как в базовом, так и в продвинутом варианте. Среди базовых предметов наиболее популярными оказались география (44%), информатика (38%), история (31%), биология, химия и физика (около 27%). Наименее популярными базовыми предметами оказались русский и иностранный языки (около 10%). Предметы продвинутого изучения распределились следующим образом: явным лидером является иностранный язык (46%), на втором месте алгебра (28%); меньше всего у географии (7%), биологии и химии (по 10%); остальные предметы находятся в районе 15-20%. Базовыми предметами среди опрошенных хотят заниматься несколько чаще, чем продвинутыми (83% против 78%).

Следует заметить, что среди опрошенных очень высокий процент людей, которые принимали участие в олимпиадах. 12% участвовали в финальном этапе Всероссийской школьной олимпиады. Наиболее популярными являются олимпиады по иностранному языку, русскому, математике, литературе и обществознанию. 17% респондентов занимались волонтерской деятельностью, 43% спорта, 64% - общественной деятельностью.

На основании полученных данных был проведен анализ. Программу для его проведения и тестирования можно увидеть в приложении 2. В дополнение к уже использовавшимся в предыдущей программе библиотекам были использованы sklearn, numpy, mathи scipy.

Были использованы и протестированы следующие модели:

Логистическая регрессия с «l1»-нормализацией;

Три вида методов типа NaпveBayes;

Регрессия типа Лассо (для оценки значимости переменных).

Из них для дальнейшего использования были выбраны логистическая регрессия, мультиноминальный и Бернулевский NaпveBayes. Во-первых, все три эти модели показали себя практически одинаково эффективными на основании подсчета AUC-score. Во-вторых они подходят для дальнейших предсказаний, так как обладают возможностью показывать не только предсказание, но и его вероятность.

Далее полученная система должна была выдать k предсказаний для пользователя. Попытка выдать предсказание считалась успешной, если среди этих предсказаний было хоть одно верное. Данный результат сравнивался с тем, как при данном kвела себя случайная модель. Доверительный интервал дан для p-value = 0,001. Результаты проведенного исследования можно увидеть в таблице 3.

Таблица 3 - Точность разных моделей для предсказания предпочтений учащегося по выбору курсов для онлайн обучения

k

Доверительный интервал

Логистическая регрессия

MultinomialNB

BernoulliNB

1

(0.14, 0.41)

0.736

0.66

0.601

2

(0.308, 0.591)

0.881

0.786

0.786

3

(0.431, 0.707)

0.894

0.883

0.854

4

(0.512, 0.79)

0.934

0.922

0.902

5

(0.591, 0.841)

0.974

0.941

0.941

Как можно видеть из данной таблицы все три модели постоянно находятся выше доверительного интервала случайной модели, что свидетельствует о том, что все они являются значимыми с достаточно большой вероятностью. При этом и другие показатели модели говорят о том, что она может быть использована для создания рекомендательной системы. Так в среднем при k=5 более чем 2,5 прогноза являются точными, что позволяет утверждать, что пользователь с достаточно высокой вероятностью может воспользоваться системой для получения прогноза.

Другая рекомендательная модель была построена для выявления того на какую специальность человек поступил или хотел бы поступить в дальнейшем. Для нее доверительный интервал был построен с p-value=0.01. Так как всего предполагалось, 7 вариантов ответа на данный вопрос, были протестированы только первые четыре варианта модели (от одного до четырех лучших). Результаты проведенного исследования можно увидеть в таблице 4.

Таблица 4 - Точность разных моделей для предсказания предпочтений учащегося по выбору будущей специальности

k

Доверительный интервал

Логистическая регрессия

MultinomialNB

BernoulliNB

1

(0.161, 0.416)

0.428

0.523

0.492

2

(0.339, 0.602)

0.662

0.711

0.656

3

(0.466, 0.723)

0.753

0.82

0.796

4

(0.564, 0.801)

0.87

0.875

0.859

Стоит отметить, что несмотря на то, что модель является статистически значимой при выбранном p-value она показала себя несколько хуже, чем первая, построенная для предсказания выбираемых предметов для онлайн обучения. Это может быть связано с тем, что из-за особенностей опроса в одни группы было объединено слишком большое количество специальностей, которые достаточно сильно различаются. Однако, несмотря на это рекомендательная система все же имеет возможность выводить в списке первых трех рекомендаций верные направления для около 80% учащихся.

Также был проведен анализ важности показателей для модели. Для этого была создана регрессия типа Лассо, которая выгодна тем, что обнуляет наименее важные для предсказания коэффициенты. Важно отметить, что сравнивать здесь имеет смысл категориальные переменные отдельно от численных из-за разницы в «шкале измерений». Наименее важными переменными оказались данные по финальному туру олимпиады и олимпиад проводимых вузами. Возможно это связано с размерами выборки и результаты при ее увеличении могли бы быть иными. Они заняли места с 86 по 68. Впрочем некоторые олимпиады проявили себя лучше. Так принятие участие в региональном этапе олимпиады по математике находится на 22 месте. Наибольшим значением обладают значения того брал или нет респондент другие предметы. Они расположены с 1 по 31 место. Среди оценок по предметам наиболее важными для предсказания являются оценки по геометрии, русскому и географии. Наименее важными по истории, физике и химии.

...

Подобные документы

  • Понятие географических информационных технологий. Современное состояние уровня и направлений развития ГИС в лесной отрасли. Обоснование выбора системы дистанционного обучения. Возможности СДО Moodle. Создание базы данных. Проверка настроек веб-сервера.

    диссертация [1,2 M], добавлен 02.11.2015

  • Теоретические аспекты некоторых областей информационных технологий: программы обработки данных, глобальная сеть Internet. Характеристика методов использования информационных технологий в различных областях бизнеса, опасностей и сложностей в их применении.

    реферат [1,4 M], добавлен 11.04.2010

  • Информационные технологии: понятие и виды. Использование интернет-технологий в работе администрации Карасунского округа г. Краснодара. Рекомендации по улучшению качества использования информационных технологий в работе муниципального образования.

    дипломная работа [1,3 M], добавлен 02.02.2015

  • Понятие информационных технологий, этапы их развития, составляющие и основные виды. Особенности информационных технологий обработки данных и экспертных систем. Методология использования информационной технологии. Преимущества компьютерных технологий.

    курсовая работа [46,4 K], добавлен 16.09.2011

  • Основные черты современных информационных технологий и компьютерной обработки информации. Структура экономической системы с позиции кибернетики. Ключевые функции системы управления: планирование, учет, анализ. Классификация информационных технологий.

    контрольная работа [45,9 K], добавлен 04.10.2011

  • Теоритические аспекты информационных технологий на предприятиях. Системы, используемые в информационных технологиях. Особенности применения информационных технологий в маркетинговой деятельности. Влияние информационных технологий на туристическую отрасль.

    курсовая работа [498,9 K], добавлен 29.10.2014

  • Компьютерные обучающие системы. Принципы новых информационных технологий обучения. Типы обучающих программ. Активизация обучения. Компьютерное тестирование. Перспективные исследования в области компьютерного обучения. Интернет-технологии, мультимедиа.

    контрольная работа [60,3 K], добавлен 10.09.2008

  • Основные свойства информационных технологий в экономике. Классификация, главные компоненты и структурная схема информационных технологий. Системные и инструментальные средства. Особенности взаимодействие информационных технологий с внешней средой.

    презентация [217,3 K], добавлен 22.01.2011

  • Направления развития информационных технологий в сфере социальной защиты населения. Особенности деятельности УСЗН Администрации Усть-Катавского городского округа. Анализ существующих информационных технологий в УСЗН и рекомендации по их совершенствованию.

    дипломная работа [101,7 K], добавлен 24.01.2013

  • Определение сущности, функций, задач и видов информационных технологий. Характеристика информационных технологий обработки данных, управления, автоматизированного офиса и поддержки принятия решений. Анализ современных видов информационного обслуживания.

    презентация [866,0 K], добавлен 30.11.2014

  • Информатика как единство науки и технологии, этапы ее развития и инструментарий. Классификация видов информационных технологий и их применение. Модели информационных процессов и структура программных продуктов. Объектно-ориентированное проектирование.

    курс лекций [1,6 M], добавлен 12.12.2011

  • Основные характеристики и принцип новой информационной технологии. Соотношение информационных технологий и информационных систем. Назначение и характеристика процесса накопления данных, состав моделей. Виды базовых информационных технологий, их структура.

    курс лекций [410,5 K], добавлен 28.05.2010

  • Понятие, виды и принципы информационных технологий. Педагогические цели и методические возможности использования информационных технологий в обучении музыке. Классификация педагогических программных средств. Тенденции развития музыкальной педагогики.

    реферат [221,8 K], добавлен 16.12.2010

  • Основные черты современных информационных технологий. Цель применения информационных технологий - снижение трудоемкости использования информационных ресурсов. Использованные программные средства для разработки информационной системы для продажи книг.

    курсовая работа [1,2 M], добавлен 27.06.2014

  • Информационные технологии и системы. Связь организаций и информационных систем. Интегрированная система управления промышленными предприятиями. Возможности информационных технологий в бизнесе, их влияние на организацию и роль менеджеров в этом процессе.

    курсовая работа [147,7 K], добавлен 07.05.2012

  • Понятие "информационных технологий" с точки зрения права, их разновидности, свойства, главные компоненты организации. Актуальные вопросы и методика, принципы функционирования информационных технологий в правоохранительных органах на современном этапе.

    дипломная работа [76,0 K], добавлен 10.05.2011

  • Роль структуры управления в информационной системе. Примеры информационных систем. Структура и классификация информационных систем. Информационные технологии. Этапы развития информационных технологий. Виды информационных технологий.

    курсовая работа [578,4 K], добавлен 17.06.2003

  • Компьютер как средство обучения. Классификация учебно-программных средств. Роль интерактивных технологий в обучении школьников. Эффективное управление познавательной деятельностью учащихся первой ступени обучения с помощью интерактивной доски Smart.

    курсовая работа [856,7 K], добавлен 10.02.2012

  • Реализация "облачных" технологий в корпоративных информационных системах. Применение "облачных" технологий на РУП "Белоруснефть". Пуско-наладочные работы, установка и запуск облачного сервиса, начальное конфигурирование и предложения по масштабированию.

    курсовая работа [2,9 M], добавлен 24.07.2014

  • Анализ показателей оценки эффективности информационных систем и технологий. Расчет трудовых и стоимостных показателей и показателей достоверности информации, разработка программы для ускорения методов обработки данных. Интерфейс и листинг приложения.

    дипломная работа [1,2 M], добавлен 14.01.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.