Методичний підхід до групового експертного оцінювання рівня іншомовної комунікативної компетентності

Розглядаються питання, пов’язані із застосуванням методичного підходу до групового експертного оцінювання рівня сформованості іншомовної комунікативної компетентності слухача ВНЗ. Розгляд питання узгодженості думок групи експертів під час тестування.

Рубрика Педагогика
Вид статья
Язык украинский
Дата добавления 06.03.2018
Размер файла 181,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

МЕТОДИЧНИЙ ПІДХІД ДО ГРУПОВОГО ЕКСПЕРТНОГО ОЦІНЮВАННЯ РІВНЯ ІНШОМОВНОЇ КОМУНІКАТИВНОЇ КОМПЕТЕНТНОСТІ

Застело О.В.

У статті розглядаються питання, пов'язані із застосуванням методичного підходу до групового експертного оцінювання рівня сформованості іншомовної комунікативної компетентності слухача ВНЗ за результатами тестування з іноземної мови. Важливим аспектом є розгляд питання узгодженості думок групи експертів з визначенням компетентності кожного з них та з урахуванням наявності аномальних вимірів (оцінок екзаменатора) під час тестування.

Ключові слова: експертне оцінювання, метод медіани Кемені, узгодженість групи експертів, метод ранжування, аномальні виміри (викиди).

Застело О.В. Методический подход к групповому экспертному оцениванию уровня иноязычной коммуникативной компетентности. В статье рассматривается метод определения интегральной оценки уровня сформированности иноязычной коммуникативной компетентности слушателей группой экспертов в процессе комплексного тестирования по иностранному языку. Важным аспектом является рассмотрение вопроса согласованности мнений экспертов с определением компетентности каждого из них и с учетом аномальных измерений (оценок экзаменатора) в ходе тестирования.

Ключевые слова: экспертное оценивание, метод медианы Кемени, согласованность группы экспертов, метод ранжирования, аномальные измерения (выбросы).

Zastelo O. V. Systematic approach to the evaluation of the level of foreign language communicative competence by the group of experts. In this article the method of determining the integral evaluation of the foreign communicative competence level of students by a group of experts in the process of comprehensive testing in a foreign language. An important aspect is the consideration of the expert opinion consistency in order to define the competence of each of them, taking into account outliers (examiner's assessment) during testing.

Key words: expert evaluation, Kemeny's median method, the consistency of the expert group, ranking method, outliers.

Завдання, пов'язані з удосконаленням системи підготовки та атестації слухачів, є актуальними для ВНЗ в Україні та світі. Якісне оцінювання рівня сформованості іншомовної комунікативної компетентності слухачів (ІКК) є кваліфікаційною характеристикою, що засвідчує готовність фахівця до виконання професійних завдань певного рівня складності. Саме тому впровадження сучасних систем оброблення результатів комплексного тестування слухачів з метою підвищення об'єктивності оцінювання рівня сформованості ІКК є важливим для контролю за перебігом навчального процесу.

У сучасних системах контролю широко використовується метод експертного оцінювання з подальшим ранжуванням результатів тестування слухачів з іноземних мов. Виникає проблема вибору певного методу оброблення думок експертів для оцінювання рівня сформованості ІКК слухача ВНЗ за результатами тестування, а також методу оцінювання об'єктивності експертів.

Проблема інформатизації освіти в Україні разом із впровадженням інформаційно-комунікаційних технологій з метою удосконалення управління освітою розглядається В. Ю. Биковим [2], А. М. Гуржієм, О. М. Спіріним, Ю. В. Триусом та іншими дослідниками. Питання теорії та практики експертного оцінювання, а також використання методу ранжування в експертному оцінюванні дістали висвітлення у працях багатьох дослідників, зокрема В. С. Аванесова [1], О. І. Орлова [5], О. І. Мухіна [4], О. І. Субетто [6], В. С. Черепанова [7], С. П. Хабарова [8] та інших.

Проте інтегроване застосування деяких математично-статистичних методів з їхніми програмними реалізаціями для оброблення групових експертних оцінок рівня сформованості ІКК слухачів за результатами комплексного тестування потребує додаткового дослідження.

Метою цієї статті є обґрунтувати методичний підхід, що передбачає підвищення достовірності групової оцінки на основі застосування методів оброблення експертних оцінок та аномальних вимірів (викидів), що реалізовані у статистичному програмному продукті AtteStat, під час групового експертного оцінювання з ранжуванням рівня сформованості ІКК слухача ВНЗ за результатами комплексного тестування.

Для досягнення цієї мети слід оцінити надійність і переваги запропонованого підходу, що реалізує зазначені методи оброблення за допомогою сучасних статистичних програмних засобів.

Ефективність початкових етапів розробки методики оцінювання результатів тестування слухачів визначається формуванням авторитетної групи експертів та отриманні від них якісних оцінок, що є основою будь- якої методики. Організація проведення експертами інтуїтивно-логічного аналізу проблемної галузі з кількісним оцінюванням сформульованих ними суджень становить зміст процесу виявлення знань від експертів.

Кожен з етапів роботи групи експертів під час тестування (екзамену) з іноземної мови можливо формалізувати лише частково. Істотна частина міркувань проводиться на якісному рівні, як це прийнято в гуманітарних науках. Одна з причин полягає в тому, що прагнення до зайвої формалізації і математизації призводить до штучного внесення визначеності там, де її немає по суті, або до використання громіздкого математичного апарату. Так, міркування на словесному рівні вважаються доказовими в більшості ситуацій.

Під час проведення експертизи у навчальному процесі найчастіше використовуються методи вимірювання, які дозволяють розмістити об'єкти на порядковій (інтервальній) шкалі: ранжування, парне порівняння, безпосереднє оцінювання. Ранжування - це процедура упорядкування об'єктів (слухачів) за ступенем їх впливу на результат, вона виконується експертом під час виявлення його знань (ІКК). У результаті експерт складає упорядковану послідовність:

о1>о2>.„>о„">

груповий експертний оцінювання тестування

Найбільш преференційному об'єкту надають ранг 1, другому - ранг 2 і так далі. Зручність використання зв'язних рангів полягає в тому, що сума рангів п об'єктів дорівнює сумі натуральних чисел від 1 до п, і будь-яка комбінація зв'язних рангів не змінює цю суму, що значно спрощує обробку результатів ранжування при груповому експертному оцінюванні.

Ці методи мають різноманітні якості, але призводять до близьких результатів. Тому вибір методу ранжування або парного порівняння пропонується робити за кількістю об'єктів, які треба оцінити, та за малою різницею між ними. Через те, що мала різниця не є чіткою фізичною величиною, за критерій вибору пропонується обрати кількість об'єктів, які треба оцінити (к). Якщо кількість об'єктів, що ранжуються п < к, варто застосовувати метод ранжування. Якщо п > к, тоді варто застосовувати метод парного порівняння. До того ж к не має бути більше 20, а ця процедура є найбільш надійною, коли к>10.

Результати оцінювання є об'єктивними, якщо вони не залежать від обраної одиниці вимірювання, тобто коли вони є інваріативними відносно припустимого перетворення шкали.

Існують вимоги до аналізу даних, виміряних за шкалою певного типу, коли результати не повинні змінюватися за припустимого перетворення шкали вимірювання цих даних. У процесі оцінювання необхідно обчислити думки експертів, виміряні за порядковою шкалою.

Наприклад, Y], Y2,...,Yn - це сукупність балів, які експерти виставили одному слухачеві за результатами тестування, а Z], Z2,...,Zn - другому слухачеві. Необхідно порівняти ці сукупності. Найпростіший спосіб - це за середніми значеннями.

Французький математик О. Коші запропонував загальне поняття середньої величини: середньою величиною є будь-яка функція f(X], X2,...,Xn), така, що за всіх можливих значень аргументів значення цієї функції не менше, ніж мінімальне серед чисел X], X2,...,Xn, і не більше, ніж максимальне серед цих чисел. Усі вищезазначені види середніх є середніми за Коші. За допустимого перетворення шкали значення середньої величини відповідно змінюється. Але загальні результати, для якого слухача середній бал більше, а для якого - менше, мають залишатися незмінними, відповідно до вимог щодо інваріантності результатів як основної вимоги теорії вимірювання. Необхідно знайти такий вид величин, результат порівняння яких буде стійким відносно допустимих перетворень шкали.

Можна дослідити оброблення думок експертів, відображених на порядковій шкалі. Нині є розповсюдженими експертні оцінювання, коли експерти мають виставити бали слухачам, потім обчислюють середні бали і розглядають їх у якості інтегральних оцінок. Дуже часто у якості інтегральної оцінки застосовують середнє арифметичне. Проте цей метод не є коректним, оскільки бали виміряні за порядковою шкалою. Тому доцільно використовувати метод медіани рангів [3; 4]. За допомогою математичної теорії, розвинутої О.І. Орловим [6], на порядковій шкалі раціонально використовувати лише члени варіаційного ряду (порядкові статистики), зокрема, медіану.

Медіаною Кемені для вибірки, що складається з бінарних відносин, називається емпіричне середнє, побудоване за допомогою відстані Кемені. Бінарні відносини, зокрема впорядкування, часто використовуються для відображення думок експертів. Тоді відстань Кемені вимірює близькість думок експертів, а медіана Кемені дозволяє знаходити підсумкову усереднену думку комісії експертів. Медіана застосовується для даних, виміряних за порядковою шкалою, оскільки вони є членами варіаційного ряду, і належить до нечислових статистик, де недоцільне застосування методів, заснованих на усередненні. Медіана стійка за малої кількості тестів і малої кількості експертів.

На наступному прикладі, типовому для тестування з ІМ, розглядається застосування методу ранжування на основі медіани Кемені, коли чотири експерти розташовують результати виконання декількох тестів окремим слухачем за рангами (оцінками), як наведено у табл. 1. Оцінки виставлено за чотирибальною шкалою, що використовується у ВНЗ, де 5 балів - «відмінно» - 1-й ранг, 4 бали - «добре» - 2-й ранг, 3 бали - «задовільно» - 3-й ранг, 2 бали - «незадовільно» - 4-й ранг відповідно.

Таблиця 1

Бали слухача, виставлені експертами за тестування

Т,

Т2

Тз

Т4

Експерт 1

4

4

3

4

Експерт 2

3

5

4

4

Експерт 3

5

4

3

4

Експерт 4

2

3

4

3

Більш наочним є графічне відображення результатів тестування. Для цього будується багатогранник (рис. 1), система координат утворюється результатами тестування, тобто результати виконання слухачем 4 тестів утворюють 4-х мірний простір. На осях координат відмічено бали, що певний експерт надав відповіді слухача. Отже, думка експерта - це точка у просторі результатів тестування. Найвіддаленіша від центру вершина вказує на найбільш ненадійну думку і таким чином характеризує відповідного експерта.

Рис. 1. Багатогранник думок експертів за результатами тестування

Застосовуючи метод медіани Кемені, обчислити значення - відстань (норму) між двома векторами (думками i-го та j-го експертів) можна за допомогою найбільш уживаної манхетенської норми.

Отже, відстань думок за манхетенською нормою є сума різниць (за абсолютною величиною) думок двох експертів щодо результатів тестування слухача. Так, у матриці (табл. 1) відстань між думками 1 -го та 2-го експертів становитиме:

r12 = |4 - 3| + |4 - 5| + |3 - 4| + |4 - 4| = 1 + 1 + 1 + 0 = 3

Ці величини відображено у таблиці 2 (матриці відстаней). Обчислюються значення R - результат експертизи, Rt - відстань від i-го експерта до всіх інших експертів, що є сумою відстаней між думкою цього експерта і решти експертів.

Таблиця 2

Розрахунок відстаней Кемені між думками експертів

Експерт 1

Експерт 2

Експерт 3

Експерт 4

Ri

Експерт 1

0

Г12

Г13

r14

0 + r 12 + r13 + r14 = R1

Експерт 2

Г21

0

r23

r24

r 21 + 0 + r 23 + r 24 = R2

Експерт 3

Г31

r32

0

r34

r31 + r 32 + 0 + r 34 = R3

Експерт 4

Г41

Г42

r43

0

r 41 + r 42 + r 43 + 0 = R4

min(R1, R2, R3, R4)

Серед обчислених сумарних відстаней знаходиться мінімум з-поміж Ri. Думка відповідного i-го експерта є середнім і оголошується результатом експертизи. Результат розрахунків відстані Кемені для оцінювання чотирма експертами результатів виконання чотирьох тестів одним слухачем наведено у табл. 3. Очевидно, що у 1-го експерта найменша відстань від думок інших, тому його думка оголошується результатом експертизи. Таким чином, за результатами виконання тестів 1, 2 і 4 слухач отримав 2-й ранг, а за результатами виконання тесту 2 - 3-й ранг.

Таблиця 3

Результат розрахунків значень відстаней Кемені між думками експертів

Експерт 1

Експерт 2

Експерт 3

Експерт 4

Ri

Експерт 1

0

3

1

5

9

Експерт 2

3

0

4

4

11

Експерт 3

1

4

0

6

11

Експерт 4

5

4

6

0

15

Якщо геометрично відобразити наведені результати (рис. 2), то можна побачити, що думка обраного 1-го експерта знаходиться ближче до центру багатогранника, який утворюється за результатами обчислення відстані між думками експертів.

Рис. 2. Багатогранник відстані між думками експертів за результатами тестування Проблема підбору об'єктивних експертів є однією з найбільш складних у теорії і практиці експертних

досліджень. Коли експертів мало, тоді результат експертизи суттєво залежить від компетентності осіб, що увійшли до складу групи. Тому слушно провести опитування і експертів та отримати їхні думки ri, обчислити результати експертизи R і оцінити об'єктивність кожного члена експертної групи за такою формулою [4]:

d ( ri,R )

Z d (r, R)

де аі - коефіцієнт об'єктивності експерта; rt - думка і-го експерта; R - результат експертизи (середня думка), обчислене у вищезазначені способи; d(ri, R) - відстань від думки і-го експерта до середньої думки R; n - кількість експертів;

Об'єктивність кожного експерта обчислюється на прикладі вище наведеної табл. 1, з урахуванням результатів експертизи (табл. 4). Така таблиця заповнюється за результатами тестування для кожного слухача.

Таблиця 4

Матриця думок експертів і результат експертизи

Ті

Т2

Тз

Т4

Експерт 1

4

4

3

4

Експерт 2

3

5

4

4

Експерт 3

5

4

3

4

Експерт 4

2

3

4

3

Результат експертизи

4

4

3

4

Відстань d(rb R) від думки і-го експерта до результату (середньої думки R):

d(rh R) = |4 - 4| + |4 - 4| + |3 - 3| + |4 - 4| = 0;

d(r2, R) = |4 - 3| + |4 - 5| + |3 - 4| + |4 - 4| = 3;

d(r3, R) = |4 - 5| + |4 - 4| + |3 - 3| + |4 - 4| = 1;

d(r4, R) = |4 - 2| + |4 - 3| + |3 - 4| + |4 - 3| = 5.

Z d (r, R ) = 0 + 3 +1 + 5 = 9

i=1

а1 = 1 - 0/9 = 1; а2 = 1 - 3/9 = 0.67; а3 = 1 - 1/9 = 0.89; щ = 1 - 5/9 = 0.44.

Отже, найбільш об'єктивним виявився експерт 1, а найменш об'єктивним - експерт 4 (рис. 3). Так само, як і за методом медіани Кемені, думку 1 -го експерта було обрано за результат експертизи, тоді як думку четвертого експерта було відображено (рис. 2) на периферії багатогранника думок експертів.

Рис. 3. Діаграма об єктивності експертів

Після проведення кількох експериментів із різними результатами групового експертного оцінювання результатів комплексних тестів з ІМ постала необхідність у прийнятті рішення щодо методу наступного оброблення отриманих даних.

Як-то, думку 4-го експерта, що різко виділяється з нормально розподіленої вибірки, у математичній статистиці називають викидом. Існують спеціальні методи, що дозволяють належним чином обробити ці викиди, засновані на критеріях виключення мінімального (максимального) спостереження. Величина статистики критерію порівнюється з критичним значенням, точний розподіл якого задається відповідною формулою. Якщо величина статистики більша за критичне значення, приймається рішення про виключення викиду з аналізу. Хоча можлива ситуація, коли слід знайти причину такого викиду.

За наявності таких аномальних відхилень вважаємо за доцільне застосовувати метод медіани Кемені, якщо таких викидів немає, тоді достатньо застосувати арифметичне усереднення. Рекомендуємо відкинути думки експертів з малим значенням а і обчислити результат без їх урахування. Якщо ж певний експерт систематично виявляється необ'єктивним, слід виключити його зі складу експертної групи.

Загальна структура підходу до групового експертного оцінювання рівня сформованості ІКК слухачів за результатами комплексного тестування з використанням методу медіани Кемені з урахуванням наявності викидів та оцінюванням об'єктивності кожного з групи експертів, представлена на рис. 4.

За результатами оцінювання наявності викидів у думках групи експертів приймається рішення щодо подальшого їх оброблення за методом медіани Кемені або за методом усереднювання. Оброблення за першим методом виконується тільки після обчислення узгодженості групи в цілому (контролюється перевищенням значення коефіцієнта конкордації заданого порогу), склад якої за необхідністю коректується на основі розрахунку об'єктивності кожного з експертів.

Рис. 4. Структура запропонованого підходу до групового експертного оцінювання

Вищезазначена процедура ранжування проводиться стосовно кожного слухача за результатами виконання ним комплексного тесту, що дозволяє підвищити точність оцінювання рівня сформованості ІКК групи слухачів.

Для зручного обчислення медіани Кемені, тобто результатів експертного оцінювання, оцінювання наявності викидів та узгодженості групи експертів, ми пропонуємо використовувати програму аналізу даних AtteStat, яка призначена для професійного статистичного оброблення даних у різних галузях діяльності. Вона виконана у вигляді надбудови до популярних електронних таблиць Microsoft Excel під управлінням операційної системи Microsoft Windows.

За визначенням медіана Кемені знаходиться лише серед ранжувань, заданих матрицею опитування, що аналізується. Розв'язанням, таким чином, буде ранжування, зроблене одним з експертів, при цьому програма додатково вказує номер цього експерта.

Перш ніж застосовувати певний метод оброблення викидів, варто переконатися, що він відповідає шкалі вимірювання вхідних даних, у нашому випадку - кількісній шкалі. Програма AtteStat не виключає викиди, а звертає на них увагу шляхом виділення. Тоді особа, що обробляє результати тестування, оцінює, чи ці дані є викидом, чи варто проігнорувати висновки програми, чи необхідно пояснити ці значення або відкинути їх.

Завдяки програмному забезпеченню AtteStat обробляємо викиди за допомогою методів, що засновані на критерії Смірнова-Грабса, критерії Диксона, які розроблено спеціально для оброблення малих вибірок (від 3 до 30) і задля виключення одного викиду (min або max).

Таким чином, методично правильне врахування впливу зазначених чинників під час оброблення групових експертних оцінок за виконання комплексного тестування з іноземної мови забезпечує підвищення достовірності результатів оцінювання рівня сформованості ІКК слухачів.

Проведені дослідження існуючих математично-статистичних методів вирішення поставленого у статті завдання, а саме підвищення достовірності визначення рангових оцінок слухачів і відбору компетентних експертів забезпечують обґрунтування запропонованого методичного підходу оцінювання рівня сформованості ІКК слухачів, який органічно поєднує реалізацію методів оброблення експертних оцінок та оброблення викидів на базі сучасного спеціалізованого програмного рішення.

Оскільки оцінки медіани робастні - стійкі та нечутливі до різних відхилень у вибірці, то її оцінювання є пріоритетними за наявності викидів. Отже, завдяки робастності, медіана Кемені є саме таким підходом, що спрямований на зниження впливу навіть невеликого числа викидів на результат оцінювання рівня сформованості ІКК слухачів.

Методично вірне застосування математично обґрунтованих обчислень результатів комплексного тестування з іноземної мови за сукупністю оцінок від групи експертів із застосуванням методу медіани Кемені з урахуванням наявності аномальних вимірів за допомогою програмної надбудови AtteStat підвищує їхню достовірність і дозволяє оцінити компетентність кожного з експертів та узгодженість групи в цілому.

Незважаючи на те, що вже сьогодні запропоноване рішення може бути інструментом удосконалення управління процесом навчання іноземним мовам у ВНЗ України, задля отримання більш якісного результату треба додатково розглянути питання вдосконалення методу медіани Кемені, що вимагає подальших методологічних досліджень і практичної перевірки у визначеному напрямі.

ЛІТЕРАТУРА

1. Аванесов В. С. Научные проблемы тестового контроля знаний / В. С. Аванесов. - М. : ИЦПКПС, 1994. - 135 с.

2. Биков В. Ю. Сучасні завдання інформатизації освіти [Електронний ресурс] / В. Ю. Биков // Інформаційні технологій і засоби навчання. - 2010. - № 1(15). - Режим доступу : http://www.nbuv.gov.ua/e-joumals/ITZN/em15/emg.html

3. Кемени Дж. Кибернетическое моделирование: Некоторые приложения / Дж. Кемени, Дж. Снелл. - М. : Советское радио, 1972. - 192 с.

4. Мухин О. И. Моделирование систем [Електронний ресурс] / О. И. Мухин. - Режим доступа : http://stratum.ac.ru/textbooks/modelir/lection36.html

5. Орлов А. И. Экспертные оценки. Учебное пособие / А. И.Орлов. - М. : Экзамен, 2002. - 31 с.

6. Субетто А. И. Квалитология образования / А. И. Субетто. - СПб.; М. : ИЦПКПС, 2000. - 220 с.

7. Хабаров С. П. Экспертные системы [Електронний ресурс] / С. П. Хабаров. - Режим доступа : http: //www. habarov. spb.ru/new_es/index. html

8. Черепанов В. С. Экспертные оценки в педагогических исследованиях / В. С. Черепанов. - М. : Педагогика, 1989. - 152 с.

Размещено на Allbest.ru

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.