Характеристика методів розв'язання задачі класифікації в інтелектуальному аналізі даних навчальних программ

Інформаційні системи як невід'ємна частина навчання. Знайомство з головними методами розв'язання задачі класифікації в інтелектуальному аналізі даних навчальних програм. Характеристика особливостей прогнозування поведінки студентів та стилів навчання.

Рубрика Педагогика
Вид статья
Язык украинский
Дата добавления 05.04.2020
Размер файла 157,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Характеристика методів розв'язання задачі класифікації в інтелектуальному аналізі даних навчальних программ

Досліджено публікації останніх років у галузі інтелектуального аналізу даних навчальних програм. Кількість досліджень у цій галузі зростає, проте здебільшого це однотипні дослідження, що використовують однакові вибірки даних. Розроблено критерії, відповідно до яких було отримано вибірку з публікаціями для проведення аналізу використання методів інтелектуального аналізу даних навчальних програм. Найбільше досліджень у галузі Інтелектуального Аналізу Даних у навчанні стосуються вирішення задачі кластеризації, класифікації та асоціації.

Для створення вибірки до уваги обрано дослідження з використанням методів та алгоритмів, що вирішують задачу класифікації. Вибірка статей включає дослідження, що аналізують продуктивність методів класифікації та представляють результати та порівняння показників. За результатом аналізу вибрано алгоритми, що показують найкращі результати продуктивності серед інших алгоритмів з вибірки. Згідно із встановленими критеріями, кожна публікація повинна вирішувати конкретну наукову задачу. У цій галузі методи інтелектуального аналізу даних отримують застосування для вирішення різних прикладних задач у навчальному процесі. Відповідно до контексту та типу прикладної задачі залежить вибір конкретного методу та точність вибраних алгоритмів. Тому категоризація прикладних завдань дає змогу отримувати якісніші підходи до розв'язання наукової задачі. Встановлено категорії проблематики, яких стосуються найбільше наукових досліджень з використанням методів класифікації.

У сучасних умовах використання інформаційних технологій значно покращують якість навчального процесу. Водночас основним завданням будь якого навчального закладу є високі оцінки учасників навчання. Беручи до уваги різноманітні стилі та методи навчання, поведінку студентів та різноманітні підходи до викладання не можна однозначно стверджувати, що саме інформаційні технології мають прямий вплив на остаточні результати навчання. Впровадження технологій дає змогу значно розширити інструментарій, методи навчання, урізноманітнити спосіб доставки знань. Також інформаційні системи допомагають якісно управляти навчальним процесом. Впродовж останнього десятиліття інформаційні системи стали невід'ємною частиною навчання та нерозривно інтегровані в процеси прийняття рішень у будь-яких навчальних закладах.

Унаслідок використання будь-яких інформаційних систем нагромаджується велика кількість даних. Структура на склад таких даних може бути найрізноманітнішою. Системи зберігають інформацію про активність студентів, вподобання, засоби комунікації, певні персональні дані тощо. Ці дані можуть бути об'єктом для аналізу та можуть бути використані для прогнозування успішності, створення індивідуальних навчальних планів, визначення та поведінки студента та стилю навчання, створення моделей мотивації. З таких наборів даних можливо виявити певні шаблони та закономірності. Таку задачу розв'язують за допомогою Інтелектуального Аналізу Даних (англ. Data Mining, ІАД) - процесу видобутку знань з даних. ІАД - це міждисциплінарна галузь, що використовує різні методи та алгоритми для розв'язання задач кластеризації, класифікації, асоціації, прогнозування. Залежно від моделей, що використовуються, задачі можуть бути прогнозуючими або дескриптивними. Пошуком закономірностей та знань у даних, що генеруються різноманітними системами, що інтегровані в навчальний процес, займається більш вузька галузь, що похідна від ІАД - Інтелектуальний Аналіз Даних Навчального Процесу (англ. Educational Data Mining). Методи та моделі, розроблені в межах цієї галузі, дають змогу краще розуміти поведінку студентів та прогнозувати їхню успішність.

Прогнозування поведінки студентів та стилів навчання є одним із найвагоміших завдань у навчальному процесі, таким як і прогнозування успішності. Розв'язання такої задачі дає змогу гнучкіше керувати індивідуальними навчальними планами. Різноманітні чинники мають вплив на успішність та стиль навчання, такі як: вік, стать, освіта батьків, економічні чинники. Вирішення задачі класифікації під час процесу ІАД дає змогу викладачу індивідуально підходити до потреб конкретного студента, що приводить до вищих фінальних результатів та значно підвищує мотивацію під час навчання.

Методи задачі класифікації є найпопулярнішими в

інтелектуальному аналізі даних навчального процесу згідно з аналізом наукових досліджень останніх років (Bishop, 2006).

Метою цього дослідження є:

Дослідити останні публікації в галузі Educational Data Mining.

Створити вибірку публікацій, що включають дослідження з використанням методів, що розв'язують задачу класифікації.

• Визначити, які конкретні задачі вирішують автори за допомогою методів класифікації в цих дослідженнях.

• Дослідити вибрані авторами методи у вибірці публікацій та визначити методи з найкращими показниками продуктивності.

Аналіз літературних джерел. Кількість статей, що стосуються дослідження у цій галузі, щороку збільшується (Singh, 2017), що свідчить про зростаючий інтерес та великі можливості застосування інтелектуального аналізу даних задля покращення процесу навчання. Водночас існує багато досліджень поточного стану галузі та огляд літературних джерел з аналізом вже опублікованих досліджень. Більшість досліджень зосереджені на таких запитаннях:

• Знаходження визначальних чинників, які мають вплив на успішність у навчальному процесі.

• Пошук оптимальних методів та алгоритмів для прогнозування успішності.

• Визначення точності та продуктивності вибраних методів та підходів.

З використанням методів інтелектуального аналізу даних прогностичне моделювання зазвичай використовують у прогнозуванні успішності студентів. Загалом кількість досліджень у сфері інтелектуального аналізу даних у освітніх програмах швидко зростає, а також збільшується різноманітність використовуваних методів (Hellas et al., 2018). Відповідно в дослідженні (Muthuk- rishnan et al., 2017) було розглянуто методи, що використовують для створення моделей, та прогнозування успішності. Ці методи було поділено на 4 категорії: дерево прийняття рішень, регресію, кластеризацію та всі решта.

У дослідженні (Manjarres et al., 2018) було проаналізовано понад 100 публікацій і встановлено, що, розпочинаючи з 2010 р., значний інтерес у дослідженнях приділено аналізу причин відрахувань з навчальних програм та побудови прогностичних моделей. В одному з останніх оглядів публікацій було класифіковано чинники, що брались до уваги найчастіше в дослідженні причин відрахувань: персональні, академічні, економічні, соціальні та інституційні. І найбільш досліджуваними є персональні чинники, такі як: вік, стать, національність (Alban et al., 2019).

Проте традиційні алгоритми та підходи інтелектуального аналізу даних не можуть бути безпосередньо застосовані до вирішення проблем у навчальному процесі, оскільки вони можуть мати специфічну мету та функцію. Це означає, що спочатку повинен бути застосований алгоритм попереднього оброблення і тільки тоді можуть бути застосовані деякі специфічні методи аналізу даних. Одним із таких алгоритмів попередньої обробки є кластеризація (Dutt et al., 2017). Систематичні огляди літератури підтверджують загальну тенденцію у використанні методів лінійної регресії та класифікації, які є найбільш популярними до використання в різноманітних дослідженнях (Hellas et al., 2018). Проте все ще залишаються запитання до якості досліджень зосереджених у проблематиці прогнозування успішності. Тільки 33 % досліджень мають чітку постановку задачі й тільки 8 % досліджень перевіряли результати в декількох наборах даних навчальних програм (Hellas et al., 2018).

Метод дослідження. Більшість наукових робіт, що використовують методи класифікації у своїх дослідженнях, можна поділити за такими категоріями:

• дослідження швидкодії вибраних методів та алгоритмів;

• дослідження чинників, що впливають на вирішення певної проблеми;

• нові методи, що можна застосовувати в задачі класифікації. Для більш якісного аналізу наукових робіт було вибрано статті, що досліджують швидкодію методів та алгоритмів, які розв'язують задачі класифікації. Було проаналізовано вибірку з більше, ніж 100 статей, та вибрано 20 публікацій, що були опубліковані впродовж останніх 5-7 років, та які підпадали під критерії вибірки. Основними критеріями вибірки були:

• чітка постановка наукової задачі з окресленою проблемою;

• використання алгоритмів класифікації;

• продемонстровані результати продуктивності вибраних методів.

Оскільки дуже часто автори використовують у дослідженні декілька алгоритмів, до уваги брали тільки перші 4 алгоритми з найкращим показником точності в конкретній публікації. Також, беручи до уваги результати інших публікацій на тему літературних оглядів (Hellas et al., 2018), у вибірку попадали тільки ті дослідження, що використовували унікальну неповторювану вибірку даних.

Результати дослідження. У табл. 1 наведено список завдань, що вирішували автори за допомогою методів класифікації.

Як видно з табл. 2, найчастіше в цій вибірці досліджень використовували методи J48 та Naive Bayes. Загалом у вибірці статей було проаналізовано 19 алгоритмів. Достовірність отриматих математичних моделей автори досліджень здебільшого оцінювали методом перехресної перевірки (10-fold cross-validation).

Середні значення точності кожного з алгоритмів представлено у табл. 3. Середню цифру обраховували без урахування мінімального та максимального значень.

На рисунку зображено значення точності тих алгоритмів та методів, які трапляються в більше ніж 5 статтях. Ці значення точніші, оскільки значення точності має велику залежність від вибраних даних, тому для коректнішого аналізу потрібно враховувати більшу кількість статей.

навчання інформаційний задача

Відповідно до проаналізованих результатів з вибірки статей, алгоритмами з найбільшою точністю є Logistic, Multilayer Perceptron, Support Vector Machines (Functions-based algorithms), та Random Forest (Trees-ba- sed algorithms), точність яких перевищує 80 %. Водночас потрібно зазначити, що алгоритми, які найчастіше використовували в дослідженнях, не показали високих результатів продуктивності. Проте велика залежність існує від мети дослідження та від конкретної вибірки даних. Наприклад, метод Logistic Regression показує різні результати точності в дослідженнях, де метою було дослідити можливості прогнозування успішного завершення навчання (Bucos et al., 2018), та прогнозування відрахування з навчання (Jovanovic et al., 2012). Конкретна вибірка даних може містити різноманітні чинники, що тим чи іншим чином впливають на точність дослідження. Наприклад, під час прогнозування значень фінальних оцінок використовують чинник участі та активності студентів у форумах та дискусіях (Marbouti et al., 2016). Автор дослідження (Luhaybi et al., 2018) також звертає увагу на великий вплив контексту та мети на остаточні результати.

Висновки

навчання інформаційний задача

У цьому дослідженні проаналізовано 120 публікацій, та за заданими критеріями було вибрано 21 публікацію, опублікованих за останні 5-7 років, де автори досліджують різноманітні методи, що вико-ристовуються для розв'язання задачі класифікації в галузі інтелектуального аналізу даних навчальних програм. Було визначено 4 алгоритми, що отримали найкращі середні показники продуктивності в цих дослідженнях. Встановлено, що найвищі показники продуктивності отримали алгоритми Logistic Regression та Support Vector Machines. Результати продуктивності методу KNN є найнижчими. Всі дані наведено в табличних та графічному представленні.

Перелік використаних джерел

1.Abu-Oda, Ghadeer S., & Alaa M. El-Halees. (2015). Data mining in higher education: university student dropout case study. Data mining in higher education: university student dropout case study, 5(1), 13-19.

2.Agarwal, Sonali, Pandey, G. N., & Tiwari, M. D. (2012). Data mining in education: data classification and decision tree approach. International Journal of e-Education, e-Business, e-Management and e-Learning, 2(2), 140-145.

3.Al Luhaybi, Mashael, Tucker, Allan, & Yousefi, Leila. (2018). The Prediction of Student Failure Using Classification Methods. A Case study, 79-90. https://doi.org/10.5121/csit.2018.80506 Alban, Mayra, & David Mauricio. (2019). Predicting University Dropout through Data Mining: A Systematic Literature. Indian Journal of Science and Technology, 12, 4-9.

Размещено на Allbest.ru

...

Подобные документы

  • Поняття та основні елементи математичної задачі. Особливості сюжетних текстових задач. Усвідомлення змісту задачі, її аналіз і відшукання плану. Культура запису розв'язання. Мета використання ілюстрацій. Перевірка та розгляд інших способів розв'язання.

    реферат [20,7 K], добавлен 17.11.2009

  • Сутність і роль задач у початковому курсі математики, їх функції та критерії розбору за роками. Аналіз системи задач на рух і методика формування в учнів навичок їх розв’язання. Організація та зміст експериментального дослідження, його ефективність.

    дипломная работа [680,0 K], добавлен 13.11.2009

  • Теореми та ознаки подільності натуральних чисел. Обґрунтування вимог до математичної підготовки учнів, розробка методики викладу теми "Подільність чисел". Приклади розв’язування вправ, а також задачі без розв’язання для самостійного розв’язування.

    курсовая работа [239,2 K], добавлен 02.09.2011

  • Особливості впливу активних методів навчання на формування позитивної мотивації студентів вищих навчальних закладів. Характеристика місця і сутності змагальних методів навчання у системі активних методів навчання при вивченні курсу "Політична економія".

    курсовая работа [42,1 K], добавлен 30.01.2010

  • Психолого-педагогічні основи та методика використання диференційованого підходу. Враховування навчальних можливостей учнів. Характеристика основних видів диференційованого навчання. Організація, зміст, аналіз ефективності експериментального дослідження.

    дипломная работа [1,2 M], добавлен 07.11.2009

  • Діяльність педагога і студентів у різних видах навчання. Традиційна організація навчального процесу. Проблемне, програмоване та модульно-розвиваюче навчання. Принципи та умови створення навчальних програм та технологічних схем навчальних модулів.

    курсовая работа [40,4 K], добавлен 22.01.2011

  • Суть проблемного навчання. Типи проблемних ситуацій. Формулювання навчальних проблем. Створення проблемних ситуацій. Система проблемних завдань на уроках праці. Розв'язання навальних проблем. Специфіка уроків сільськогосподарської праці в школі.

    лекция [142,1 K], добавлен 20.07.2011

  • Диференційовано-групова форма організації навчання у початкових класах. Методика формування умінь і навичок при розв'язанні задачі на знаходження суми і остачі. Особливість роботи над простими задачами на знаходження добутку як суми однакових доданків.

    реферат [758,9 K], добавлен 16.11.2009

  • Методика проведення уроку-подорожі, в якому заплановано знайомство із класом плазунів, навчання розв'язувати задачі на рух, визначення відстані за відомими швидкістю і часом, вироблення з паперу способом оригамі тваринки.Застосування наочності на уроці.

    разработка урока [1,2 M], добавлен 21.10.2011

  • Шляхи оптимізації процесу навчання, керування пізнавальною діяльністю учнів в ході одержання ними знань, в процесі їх засвоєння. Сутність методу програмованого навчання та задачі, які він вирішує. Дидактична, довідкова інформація, необхідна для навчання.

    реферат [116,3 K], добавлен 17.10.2010

  • Психолого-педагогічні основи формування вмінь розв'язувати задачі. Види простих задач. Формування вмінь розв'язувати задачі на знаходження невідомого компонента. Задачі на знаходження невідомого, доданка, зменшуваного та від'ємника за допомогою рівнянь.

    дипломная работа [3,7 M], добавлен 12.11.2009

  • Сутність та структура проблемного навчання у сучасній школі. Підтримання і розвиток пізнавального інтересу до навчання. Знання, уміння і навички як категорії вираження цілей навчання. Характеристики особистості як категорії вираження цілей навчання.

    курсовая работа [57,8 K], добавлен 26.05.2008

  • Сутність поняття "гра" у психолого-педагогічній літературі. Основні підходи щодо класифікації методів навчання. Вплив методів ігрового навчання на пізнавальну активність студентів. Методика проведення гри з дисципліни "Історія земельних відносин".

    курсовая работа [67,6 K], добавлен 29.09.2010

  • Поняття мотивації та мотиви навчання. Опис процедури проведення дослідження особливостей мотивації студентів та використаних методик. Особливості формування позитивних навчальних мотивів, особистих якостей майбутнього спеціаліста та дійових цілей.

    курсовая работа [85,9 K], добавлен 15.12.2011

  • Самостійна робота студента як основний засіб оволодіння навчальним матеріалом у час, вільний від обов’язкових навчальних занять. Знайомство з головними особливостями організації самостійної роботи студентів у вищих навчальних закладах, аналіз проблем.

    курсовая работа [44,7 K], добавлен 17.12.2014

  • Сутність диференційованого навчання математики в початковій школі. Творча робота над задачею, як вид диференціації. Методика використання диференційованого підходу при навчанні розв’язуванню складених задач. Диференціація, як засіб вдосконалення методики.

    дипломная работа [124,5 K], добавлен 20.10.2009

  • Дослідження сутності та класифікації інтерактивних методів навчання. Особливості дискусійних (діалог, групова дискусія, розбір ситуацій з практики); ігрових (дидактичні творчі, ділові, рольові, організаційно-діяльнісні ігри); тренінгових методів навчання.

    реферат [28,1 K], добавлен 09.06.2010

  • Закономірності та принципи навчання в вищих навчальних закладах. Ефективні методи комунікації викладача та студентів. Передумови ефективності навчальної роботи студентів. Оптимальний вибір методів навчання з метою підвищення ефективності процесу навчання.

    реферат [61,0 K], добавлен 05.03.2013

  • Сутність і зміст циклових навчальних дисциплін на основі технології моделюючого навчання. Специфіка формування мети в рамках технології проблемного навчання. Аналіз особливостей технології програмованого навчання. Перспективи індивідуалізації навчання.

    реферат [20,7 K], добавлен 04.06.2010

  • Зміст навчання технічно обдарованих студентів у ВНЗ Німеччини за збагаченими навчальними планами і програмами. Досвід використання стратегії прискорення німецьких ВНЗ щодо організації навчання. Умови ефективного запозичення німецької позитивної практики.

    автореферат [77,6 K], добавлен 04.04.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.