Применение методов кластерного анализа при реализации персонализации онлайн-обучения
Методы кластерного анализа, которые в условиях онлайн-обучения позволяют проводить обработку больших объемов данных (о слушателях, курсах, процессе обучения) и на их основе реализовать различные алгоритмы персонализации. Нечёткий алгоритм Fuzzy C-Means.
Рубрика | Педагогика |
Вид | статья |
Язык | русский |
Дата добавления | 21.12.2019 |
Размер файла | 121,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru//
Применение методов кластерного анализа при реализации персонализации онлайн-обучения
Запорожко В.В., канд. пед. Наук
Одним из направлений дальнейшего развития цифровых образовательных технологий является персонализация процесса обучения в онлайн-среде. В силу этого учет таких дидактических принципов, как индивидуализация, дифференциация процесса обучения, гибкость, вариативность, а также адаптивность содержания онлайн-курса, является существенной необходимостью. В рамках данной статьи рассмотрены методы кластерного анализа, которые в условиях онлайн-обучения позволяют проводить обработку больших объемов данных (о слушателях, курсах, процессе обучения) и на их основе реализовать различные алгоритмы (сценарии) персонализации.
Под кластерным анализом (кластеризацией) понимают процедуру упорядочивания объектов в сравнительно однородные классы на основе попарного сравнения этих объектов по предварительно определенным и измеренным критериям. Цель кластерного анализа состоит в разбиение на группы схожих объектов для исследования данных из кластерной структуры. Кластером называются объекты, объединенные в одну группу, которая может рассматриваться как самостоятельная единица, обладающая определёнными свойствами [3]. Объекты в каждом кластере должны быть максимально схожи между собой и отличаться от объектов в других кластерах. В метрическом пространстве «схожесть» обычно определяют через расстояние.
Обобщенный алгоритм кластерного анализа включает пять этапов [2]:
1. Представление исходных данных в виде матрицы.
2. Определение сходства объектов.
3. Выбор метода объединения объектов в кластеры.
4. Определение оптимального числа кластеров.
5. Интерпретация кластеров и качества разбиения.
Проведенный анализ литературы позволил выделить ряд преимуществ кластерного анализа перед другими методами кластеризации данных. Во-первых, не накладываются ограничения на вид группируемых объектов, что дает возможность рассматривать произвольное множество данных разного типа. Во-вторых, позволяет производить разделение объектов не по одному, а по целому набору признаков, что обеспечивает разбиение более точно. В-третьих, многие алгоритмы способны самостоятельно (на основе машинного обучения) определять число кластеров, на которое рекомендуется разбить данные, а также выделить основные характеристики полученных кластеров.
Однако кластерный анализ имеет и ряд недостатков. Во-первых, может выдавать неустойчивые кластеры. Во-вторых, реализует индивидуализацию методов исследования от частного к общему, что чревато антинаучными выводами. В-третьих, используются разные критерии объединений объектов в кластеры, в следствии чего могут меняться результаты.
Приведем примеры некоторых задач кластерного анализа при реализации персонализации онлайн-обучения.
1. Разделение обучающихся на отдельные группы (кластеры) со схожими результатами освоения конкретного модуля (раздела) курса. Содержание онлайн-курса должно адаптироваться к потребностям текущих групп, что обеспечивает параллельное обучение слушателей со существенно отличающимися образовательными возможностями и способностями.
2. Дифференцирование слушателей на отдельные группы в зависимости от преобладающего стиля обучения для дальнейшего адаптивного подбора формы представления содержания онлайн-курса.
3. Группировка онлайн-курсов по ряду признаков для динамического формирования индивидуальной образовательной траектории (адаптивного плана обучения) каждого слушателя в отдельности.
4. Дифференцирование слушателей онлайн-курса на обобщенные группы для организации целенаправленной коллаборативной работы, например, по выполнению разноуровневых оценочных заданий или совместных проектов.
5. Классификация учебных объектов онлайн-курса для дальнейшей генерации системы персональных (индивидуальных) пошаговых рекомендаций по освоению дополнительных наиболее подходящих для конкретного слушателя материалов теоретической и практической направленности.
6. Разделение тестовых заданий, включенных в онлайн-курс, на группы по уровням сложности и трудности их выполнения для последующей реализации алгоритма адаптивного тестирования.
7. Разбиение электронного образовательного контента онлайн-курса по тематическим группам с целью реализации адаптивного поиска информации.
Решению задач данного класса может поспособствовать обзор методов кластерного анализа. Единой точки зрения на классификацию методов кластерного анализа не существует. На рисунке 1 приведена обобщенная классификация методов кластеризации, характерная для большинства прикладных задач [1].
Рисунок 1 - Классификация методов кластеризации
Суть методов иерархической кластеризации состоит в последовательном объединении меньших кластеров в большие или разделении больших кластеров на меньшие [5]. В зависимости от того, какое действие выполняется над кластерами, объединение или разделение, иерархические методы делятся на агломеративные и дивизионные соответственно.
Агломеративные методы (от слова agglomerate - собирать) представляют собой последовательное объединение исходных элементов в группы и уменьшение числа кластеров. В начале кластеризации все объекты являются отдельными кластерами. Далее наиболее похожие объекты объединяются в кластер и продолжается до тех пор, пока все объекты не будут составлять один кластер [4].
Дивизионный метод (от слова division - разделять) является в некоторой степени противоположным агломеративному и характеризуется последовательным разделением исходного кластера, состоящего из всех элементов, и увеличением числа кластеров. В начале кластеризации все объекты входят в один кластер, который на последующих шагах делится на меньшие кластеры, в результате чего образуется последовательность расщепляющих групп.
Неиерархическая кластеризация в свою очередь подразделяется на четкие и нечеткие методы.
Четкие методы кластеризации разбивают исходное множество объектов на некоторое количество непересекающихся подмножеств. При этом любой элемент из исходного множества принадлежит только одному кластеру.
Нечеткие методы кластеризации позволяют одному и тому же объекту принадлежать одновременно нескольким кластерам, но в разной мере. Нечеткая кластеризация во многих случаях более «естественна», чем четкая, например, для объектов, расположенных на границе кластеров.
Приведем обзор ряда исследований, связанных с применение различных методов кластерного анализа при реализации персонализации онлайн-обучения.
Исследователь П.Д. Антоненко из США и его коллеги считают [6], что кластерный анализ обладает огромным потенциалом для анализа огромных объемов данных журналов (логов) веб-сервера, чтобы обнаружить наиболее успешные стратегии решения задач в процессе онлайн-обучения. Применяя метод Уорда (Ward's method), ими были получены однородные группы обучающихся на основе трех ключевых признаков: (а) доля времени, затрачиваемого на выполнение письменных заданий (анализ проблемы, генерацию решения и рефлексию на предлагаемое решение), (б) на посещение соответствующих ресурсов для решения проблемы, и (в) на посещение нерелевантных ресурсов. Данный метод относится к иерархическим агломеративных методам. Первоначально каждый кластер состоял из одного объекта. Сначала объединялись два ближайших кластера. Для них определялись средние значения каждого признака и рассчитывалась сумма квадратов отклонений. В дальнейшем объединялись те кластеры, которые давали наименьшее приращение суммы квадратов расстояний объектов до центра кластера, получаемого в результате их объединения. Метод Уорда успешно применялся при объединение близко расположенных кластеров. В результате были выделены четыре кластера, в состав которых входят обучающиеся с различными стратегиями решения задач.
Ученые из Хорватии [7] предложили модель интеллектуальной системы онлайн-обучения. Кластерный анализ использовался ими для получения образовательной аналитики - визуализации данных о прогрессе обучения студентов и их активности. С помощью метода k-средних, относящегося к дивизионным иерархическим методам, были получены однородные группы обучающихся, сходных по эффективности обучения - успешности освоения учебных модулей. Данный метод стремится минимизировать суммарное квадратичное отклонение точек кластеров от центров этих кластеров. В отличие от иерархических методов, которые не требуют указания числа разбиваемых кластеров, для метода k-средних необходимо иметь предположение о наиболее вероятном количестве кластеров. Анализ проводился путём сравнения объектов кластеров, исходя из следующих признаков: общее время, потраченное на обучение к проценту освоенных учебных модулей; эффективность завершенных учебных модулей; эффективность незавершенных учебных модулей, в которых минимальное количество вопросов не было отвечено; эффективность незавершенных учебных модулей, в которых минимальное количество вопросов было отвечено и др.
Коллектив авторов из Индии [8] применили нечеткую кластеризацию для эффективной интеллектуальной доставки электронного образовательного контента в соответствии с образовательными потребностями и предпочтениями студента онлайн-курса. По мнению исследователей, доставка контента не должна иметь статической структуры, а должна быть достаточно гибкой, динамической, осуществляться в соответствии с четырьмя разными стилями обучения, которые могут меняться со временем (показателем того, насколько студент учится и любит учиться). Все учебные объекты, составляющие электронный образовательный контент курса, взаимосвязаны и могут быть сгруппированы в два и более кластера (например, использованы в двух или более темах).
Нечёткий алгоритм Fuzzy C-Means подразумевает, что каждый из объектов не входит однозначно в какой-либо кластер, а принадлежит всем кластерам с различными степенями принадлежности, принимающие значения из интервала [0, 1]. Например, при нечёткой кластеризации учебный объект LO1 относится к кластеру K1 (теме 1) с принадлежностью 0.9, к кластеру K2 (теме 2) - с принадлежностью 0.06 и к кластеру К3 (теме 3) - с принадлежностью 0.04. Так при чёткой кластеризации учебный объект LO1 был бы отнесён только к кластеру K1, что привело к исключению возможности его повторного использования в курсе при изучении другой темы. Таким образом, учебные объекты были сгруппированы с помощью нечеткой кластеризации и доставлены определенной группе обучающихся.
Таким образом, нами были рассмотрены методы кластерного анализа, используемые при реализации персонализации онлайн-обучения. Однако возникает вопрос: какой алгоритм кластеризации выбрать в конкретной ситуации? Так как кластерный анализ может выдавать существенно разные результаты решения для одних и тех же данных, то, во-первых, каждый этап применения метода должен иметь отдельное обоснование и описание. А во-вторых, при решении задач интеллектуального анализа данных рекомендуется использовать моделирование случайных величин методом Монте-Карла. В данном случае исследователь может создать искусственный набор данных с известной (заранее определенной) структурой групп, а затем проверить эффективность каждого метода кластеризации в обнаружение и восстановление данных известных групп.
Исследование выполнено при финансовой поддержке РФФИ в рамках научного проекта № 18-37-00400.
кластерный анализ онлайн обучение
Список литературы
Нейский, И.М. Классификация и сравнение методов кластеризации / И.М. Нейский // Интеллектуальные технологии и системы: сборник учебно-методических работ и статей аспирантов и студентов. - М.: НОК «CLAIM», 2006. - Выпуск 8. - С. 130-142.
Мандель, И.Д. Кластерный анализ / И.Д. Мандель. - М.: Финансы и статистика, 1988. - 176 с.
Наследов, А.Д. Математические методы психологического исследования: анализ и интерпретация данных / А.Д. Наследов. - Санкт-Петербург: Речь, 2007. - 392 с.
Чубукова, И.А. Интеллектуальный анализ данных Data Mining / И.А. Чубукова. - М.: Бином, 2008. - 384 с.
Размещено на Allbest.ru
...Подобные документы
Технологии модернизации обучения на основе активизации и интенсификации деятельности студентов. Классификация форм активного обучения. Применение интерактивных, знаково-контекстных, частично-поисковых методов обучения как образовательных инноваций.
реферат [796,6 K], добавлен 15.06.2015Методы обучения, их реализация в учебном процессе. Разработка уроков с применением методов обучения, их реализация в процессе преподавания "Технологии" 8 класса. История дидактики и классификации методов обучения. Исследовательский метод обучения.
контрольная работа [23,2 K], добавлен 08.03.2009Психолого-педагогические особенности учащихся подросткового возраста. Методы обучения и их зависимость от целей и содержания образования. Характеристика словесных методов обучения и возможности их применения в процессе обучения истории в основной школе.
курсовая работа [45,3 K], добавлен 19.02.2013Теоретические основы применения активных методов обучения в процессе подготовки специалистов в ВУЗе с целью повышения эффективности их обучения. Анализ видов и форм организации обучения с использованием активных методов на примере ЗАБГГПУ г. Чита.
курсовая работа [43,3 K], добавлен 07.05.2011Определение методов обучения и их реализация в учебном процессе, педагогические технологии. Частично-поисковый (эвристический) метод обучения. Разработка уроков с применением методов обучения и их реализация в процессе преподавания "Технологии".
контрольная работа [23,6 K], добавлен 06.03.2009Необходимость в изменении содержания обучения на основе принципов метапредметности как условие достижения высокого качества образования. Анализ технологий и методик обучения, способствующих формированию метапредметных результатов; развивающее обучение.
статья [101,0 K], добавлен 21.10.2010Методы обучения как педагогическая категория. Проблемные методы в структуре обучения как взаимодействия обучающего и обучающихся. Особенности использования проблемных методов в процессе обучения иностранному языку с целью повышения активности учащихся.
курсовая работа [89,9 K], добавлен 09.10.2013Классификация методов обучения по уровню активности учащихся, источнику получения знаний, дидактической цели, характеру познавательной деятельности учащихся, на основе целостного подхода к процессу обучения. Активные и интенсивные методы обучения.
реферат [17,3 K], добавлен 01.08.2010Понятие "метод обучения" как одно из коренных в педагогике. Необходимость взаимосвязи процессов учения и преподавания. Классификация методов обучения. Применение и совершенствование методов трудового обучения. Методы работы преподавателя и мастера.
реферат [302,6 K], добавлен 16.10.2010Психолого-педагогические основы формирования познавательных интересов школьников посредством активных методов обучения. Характеристика понятий "интерес", "познавательный интерес", "активные методы обучения". Различные виды активных методов обучения.
дипломная работа [339,7 K], добавлен 10.06.2015Понятие и сущность методов обучения, их роль. Общая характеристика отдельных видов методов обучения и анализ условий эффективного выбора и применения тех или иных методов обучения учащихся. Особенности словесных, наглядных и практических методов.
контрольная работа [29,6 K], добавлен 13.05.2013Педагогические цели профессионального обучения. Сущность и этапы проблемного обучения. Алгоритм создания проблемной ситуации в процессе теоретического обучения. Проблемное обучение в профессионально-техническом образовании и его основные методы.
курсовая работа [42,5 K], добавлен 22.02.2012Определение методов обучения и их реализация в учебном процессе. Разработка уроков с применением методов обучения и их реализация в процессе преподавания "Технологии" 8 класса. Способы упорядоченной взаимосвязанной деятельности преподавателя и учащихся.
контрольная работа [23,3 K], добавлен 10.03.2009Сущность приемов и методов обучения. Наиболее распространенная классификация и группы методов обучения во вспомогательной школе. Формы изложения учебного материала. Значение темпа речи учителя в процессе беседы. Роль технических средств обучения.
реферат [21,6 K], добавлен 30.06.2010Сущность и классификация интерактивных методов обучения. Применение на уроках методов, предназначенных для организации индивидуальной и групповой мыследеятельности. Исследование влияния активных методов обучения на уровень профессиональных знаний.
дипломная работа [232,9 K], добавлен 15.08.2014Дидактическая концепция обучения на основе компьютерных технологий. Классификация электронных средств учебного назначения. Использование мультимедиа курсов в учебном процессе. Дистанционное обучения в системе непрерывного профессионального образования.
контрольная работа [46,9 K], добавлен 27.11.2008Сущность процесса обучения. Цели, функции и специфика обучения. Структура процесса обучения, характеристика структурных компонентов. Методы обучения, их классификация. Формы организации обучения.
курсовая работа [24,3 K], добавлен 05.11.2005Специфика методики обучения иностранному языку на средней ступени. Цели и задачи обучения иностранному языку. Различные виды упражнений как ведущие средства обучения на средней ступени. Активные методы обучения и их реализация на средней ступени.
курсовая работа [60,1 K], добавлен 20.03.2011Метод наглядного обучения как важный компонент процесса обучения. Классификация методов наглядного обучения, применяемых на уроке географии. Требования к плоскостным образным наглядным методам обучения. Характеристика мультимедийных технологий обучения.
дипломная работа [753,6 K], добавлен 16.11.2015Характеристика методики обучения истории: предмет, задачи, компоненты, методы научного исследования. Закономерности обучения истории в целях повышения эффективности и качества знаний. Изучение педагогических методов в процессе школьного обучения истории.
реферат [128,3 K], добавлен 19.01.2010