Забезпечення валідності и надійності тестів протягом життєвого циклу
Аналіз проблем валідності й надійності тестових питань і відповідей, з якими стикається автор при створенні тесту для контролю знань за інформаційно-комунікативних технологій. Життєвий цикл тестових завдань від початку й до кінця, його особливості.
Рубрика | Педагогика |
Вид | статья |
Язык | украинский |
Дата добавления | 09.01.2019 |
Размер файла | 21,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
УДК: 378. 091. 26: 004
Забезпечення валідності и надійності тестів протягом життєвого циклу
В.О. Жулаєва
Резюме
тестовий контроль комунікативний завдання
Стаття присвячена проблемам валідності й надійності тестових питань і відповідей, з якими стикається автор при створенні тесту для контролю знань за інформаційно-комунікативних технологій. Життєвий цикл тестових завдань розглядається від початку й до кінця на прикладі втіленої інформаційної системи «Logit».
Ключові слова: тест, валідність, надійність, життєвий цикл, питання, відповіді.
Резюме
Статья посвящена проблемам валидности и надежности тестовых вопросов и ответов, с которыми сталкивается автор при создании теста для контроля знаний с помощью информационно-коммуникативных технологий. Жизненный цикл тестовых заданий рассматривается от начала и до конца на примере воплощенной информационной системы «Logit».
Ключевые слова: тест, валидность, надежность, жизненный цикл, вопросы, ответы.
The summary
This article deals with the problems of test's questions and answers validity and reliability witch faced by when the author creates the test for controlling knowledge in the information and communication technologies. The tests' life cycle considered from the beginning to the end on the example of embodied information system «Logit».
Key words: test's validity, reliability, life cycle, questions, answers.
Постановка проблеми. Інформаційне суспільство на сучасному етапі перебудови освітнього простору а Україні, вимагає нових підходів до засобів діагностики отриманих знань в процесі навчання. Західноєвропейські країни, а на сам перед США давно й достатньо успішно використовують практику тестового контролю в закладах освіти. Наша країна в цьому сенсі має не багатого досвіду, тому в освітньому просторі дана тема є актуальною.
Якщо розглянути нормативне підґрунтя цього питання, то можливо зробити висновок, що законодавча база досить ретельно описала в нормативних документах засобів діагностики якості освіти. З 2008 року МОН України запровадило по закінченню шкіл зовнішнє незалежне оцінювання, що дає можливість говорити про очевидні переваги тестового контролю, ніж звичний нам іспит.
З квітня 1993 року Україна приєдналася до міжнародного проекту, Темпус, що спрямований на вдосконалення управління закладами освіти, оновлення чи розробку нових навчальних програм і підвищення кваліфікації викладачів, особливо у таких дисциплінах, як економіка, іноземні мови, суспільні науки, європейські студії й право.[1]
Програма Темпус - це програма зовнішньої допомоги Європейського Союзу. Її метою є сприяння в модернізації системи вищої освіти у країнах-партнерах (країнах-сусідах) ЄС через активізацію співпраці між вищими навчальними закладами держав-членів ЄС та країн- партнерів. Програма Темпус надає фінансування з метою заохочення взаємодії та збалансованого співробітництва між вищими навчальним закладами у країнах-партнерах та в країнах-членах Європейського Союзу. [1]
Координаторами проекту “Освітні вимірювання адаптовані до стандартів ЄС” в Україні є три праведні вузи - Національний педагогічний університет ім. М.П. Драгоманова, Кіровоградський педагогічний університет ім. В. Винниченка., Ніжинський державний університет ім. М. Гоголя. [1]
Результатом їх праці стала низка розробок в галузі освітніх вимірювань й тестового контролю. Розвиток інформаційно-комунікаційних, зокрема WEB - орієнтованих технологій потребують розгляду проблеми забезпечення валідності й надійності тестів у цьому контексті.
Багато фахівців і навчальних закладів розробляють, за допомогою сучасних інформаційних технологій, свою систему для перевірки знань. Наповнення інтернет ресурсів тестовими завданнями, загалом непогане явище бо надає можливість вибрати різні тести з різних дисциплін, однак, оцінити якісні характеристики таких тестів досить важко, тому що про валідність чи надійність тестових завдань дуже рідко хто згадує.
Метою дослідження є аналіз можливостей для забезпечення валідності й надійності тестів у WEB сервісі протягом життєвого циклу тесту.
Аналіз останніх досліджень. Питаннями валідності й надійності тестів займалися багато дослідників. Можна вважати, що ці питання виникли разом з першими кроками становлення тестології як науки. Першими дослідниками були англійський психолог Френсіс Гальтон, американській психолог Дж. Кеттелл, американський психолог и педагог Едвард Торндайк та інші видатні науковці. В сучасному світі питання валідності й надійності також дуже актуальні ним займаються: Д. Аллахвердієва, А. Анастазі, С. Урбіна, М. Єрмакова, Л. Андреєва, В. Куклін, В. Мешалкін, В. Наводнов, Б. Савельєв, А. Майоров, Є. Міхайличев, І.Підласий, А. Саміловський та інші.
Виклад основного матеріалу. Термін “валідність” походить від англійського слова valid -- перекладаєтьсяя, як обґрунтований, дійсний, придатний, цей термін використовують для загальної характеристики тесту в аспекті відповідності меті та вимогам оцінювання.
Валідність - комплексна характеристика, яку визначають як параметрами інструменту й процедури вимірювання, так і властивостями ознаки, яку діагностують. Критерій валідності встановлює сферу дійсності, для якої метод дає статистично достовірні результати. [2]
1. Змістовна валідність характеризується на скільки тестове завдання відповідає змісту програми, яку вивчають протягом звітного періоду, чи відповідають данні, які запропоновані змісту підручника, або набору ситуацій та інше. Сучасні дослідники вважають, що змістовна валідність поділяється на концептуальну й програмну. Концептуальна валідність перевіряє тестове завдання на змістовність, структуру й термінологію матеріалу, який вивчається. Вона може бути реалізована завдяки повної систематизації навчальних програм за підтримки держави. Концептуальна й програмна валідність відображають теоретичну основу тестових завдань. Важливим критерієм тестових вимірювань який відображає доцільність, тобто значну роль тесту є очевидна валідність. Очевидна валідність визначається завдяки назві тестового завдання, або інструкції до цього тесту, яке дозволяє зняти негативне відношення тестувальника до завдання.
2. Конструктивна валідність відображає теоретичні аспекти курсу, тобто вимірюється ступінь відображення у тестовому завданні ключові елементи засвоєного матеріалу. Вона може бути виявлена за допомогою аналізу змістовності тестів, об'єкти тестування та характер запропонованих завдань.
3. Критеріальна валідність дає загальну оцінку якості запропонованих тестів, для дисциплін таких, як математика, фізика, хімія, креслення. За думкою дослідників, критеріальна валідність контролює рівень досягнень отриманих шляхом незалежного оцінювання.
4. Поверхнева валідність визначає тестове завдання шляхом поверхневого ознайомлення зі змістом тесту.
5. Порівняльна валідність використовується лише у випадках коли новий інструмент для діагностики, якісно відрізняється від того, яким користуються зараз. Тобто його властивості дають більш широкі й повні можливості визначення результату ніж поточний.
6. Поточна валідність визначає ступінь відставання студентів від прогнозованого рівня засвоєння навчальної дисципліни. Тому можливо говорити про те, що дана валідність відображає рубіжний контроль засвоєних знань з навчальної дисципліни. Прогнозованість засвоєння матеріалу, виходить з попереднього контроль знань, який тримали на початку вивчення запропонованого матеріалу.
7. Узагальнююча валідність дає змогу оцінити збалансованість тестового завдання, тобто змістовної частини й кількісної частини, яка відображає всі змістовні елементи. Таким чином, можна сказати, що узагальнююча валідність дає нам змогу оцінити ступінь збігу між різними показниками, які виявляються при проходженні двох різних тестових завдань. [2, 3]
Розглянувши основні критерії валідності тестових завдань, можливо зробити висновок, що валідність вимірюється лише експериментальним шляхом за допомогою дослідної групи, яка разом з експертами визначає дидактичні методи запропонованих тестових завдань. Проте, важливо не тільки вимірювати не тільки вимірювати валідність, але головне, на етапі розробки забезпечити її. Проблема валідності прямо визначає ефективність тесту. Виявлення факту не валідності у кінці розробки фактично перекреслює всю виконану роботу. Тому на етапі розробки слід передбачити можливі заходи забезпечення валідності.
Надійним тест вважається, коли багаторазове проведення тих самих тестових завдань з урахуванням умовно однакових умов дають результат без значних відхилень. Якщо тест проводити багато разів, то середнє значення буде характеристикою «істинної» величини параметра. Найбільш часто проводиться оцінка ретестовой надійності. Чим тісніше корелюють результати початкового і повторного (зазвичай відстроченого на кілька місяців) проведення тесту, тим він надійніший.
Передбачається, що існує необмежена кількість завдань, які можуть «працювати» при вимірюванні. Тест є лише вибіркою завдань з їх генеральної сукупності. В ідеалі можна створити скільки завгодно еквівалентних форм тесту, тому визначення надійності тесту можна провести шляхом кореляції паралельних форм або еквівалентних рівних частин, отриманих шляхом розщеплення тестового завдання на дві частини. Оскільки в реальному тесті число завдань обмежене (не більше 100), то оцінка надійності тесту завжди приблизна. Надійність тестових завдань зазвичай перевіряється за допомогою коефіцієнта кореляції К. Пірсона, тобто за допомогою статистичних показників. Якщо коефіцієнт кореляції результатів становить не менше 0,75, то тест вважається статистично надійним. [5]
Розмаїття характеристик і показників надійності тесту таке ж значне, як і розмаїття умов, що можуть впливати на результат тесту. Однак найбільш відомими на практиці застосування набули тільки характеристики надійності: об'єктивність, надійність застосованих методик, відносна стабільність запропонованих завдань.
Розглянемо, як поділяються можливості та вимоги до забезпечення й визначення валідності й надійності тесту протягом його життєвого циклу.
Термін “життєвий цикл” використовується в різних наукових областях. Цей термін запозичений із таких наук, як - біологія, психологія, інформатика, маркетинг та на виробництві. Життєвий цикл має лише часовий вимір, тобто життя тесту розпочинається з моменту прийняття рішення про створення самого завдання й закінчується коли завдання повністю вилучається з експлуатації, мається на увазі не зміні в тексті або доповнення нових питань. [4]
З нашого погляду життєвий цикл сучасного тесту складається з наступних етапів:
1. Ідея тесту; з грецької слово “ідея” перекладається як початок. Перший етап створення тесту починається з анотації, визначення тематики завдання, яка мета й ціль тестування, на яку аудиторію розраховується завдання. Всі ці питання вирішуються автором тесту на цьому рівні. З точки зору забезпечення валідності на цьому етапі необхідно чітко визначити категорію респондентів (учні сьомого класу, студенти першого курсу гуманітарного напрямку та інші.). Визначається предмет чи дисципліна загалом, або обмежена галузь діяльності, ставиться мета контролю, тобто атестація, поточний контроль знань, контроль самостійної роботи та інші види контролю. Застосування тесту без відповідності заданим вище параметрам призведе до невалідності. Однак причина буде не у самому тесті, а в його невірному, не цільовому застосуванні.
2. Розробка структури тесту; другий етап створення тестового завдання передбачає вирішення таких питань, як визначення розділів, що містить завдання, написання анотацій до розділів. Цей етап вводиться також автором тесту. Виконання даного проміжку на етапі створення тесту, можливий лише на специфікації попереднього етапу.
3. Рецензування тесту; третій етап створення тестового завдання вже переходить до рецензента. Рецензент може бути один або декілька, на цьому етапі визначається поверхнева валідність тестового завдання. Ключовий етап для забезпечення валідності. Оцінка й бачення автора можуть бути суб'єктивними й обмеженими власним баченням і досвідом. Сторонній погляд рецензента має зняти ці обмеження.
4. Підготовка розділів тестового завдання; автором тесту проходить наповнення визначених розділів питаннями й відповідями. Для більш повної перевірки знань пропонується від 30 до 50 питань у одному розділі.
5. Рецензування розділів; на останньому робочому етапі рецензентом або групою рецензентів визначається змістовна валідність тестових питань й запропонованих відповідей. Питання повинні цілком покривати матеріал, який вивчається не виходячи за його межі. Водночас питання повинні мати різну складність. Ця частина дуже трудомістка для рецензента, тому що оцінювач повинен розглядати тест очима фахівця й респондента. Головна увага при цьому приділяється однозначності запитання й відповідей. Респондент має швидко й однозначно зрозуміти текст та запропоновані варіанти відповідей.
6. Випробування розділів; на цьому етапі життєвий цикл тесту переходить до наступної стадії “draft”. Запропоновані тестові завдання проходять апробацію на експериментальній групі.
7. Оцінювання питань; на цьому етапі автор проводить розрахунок профілів кожного питання, де визначається складність й диференційована здатність питань. За цими даними можливо чисельно оцінити валідність й надійність тесту. Проте це вже швидше за все підсумок ніж спонукання до дії. Зазвичай встановлення факту невалідностей чи ненадійності тесту свідчить про неналежну увагу до цих параметрів на попередніх етапах. За нашими оцінками трудомісткість виправлень ситуації можливо складати від 30% до 100% початкових затрат. В подальшому можливо уточнення отриманих оцінок на більших вибірках.
8. Тестування; наступний рівень тестового завдання “recommended”. На цьому етапі учитель з учнями проводять тестування попередньо сформованих тестів. Проводяться індивідуальні й групові тестування з реєстрацією результатів.
9. Уточнення оцінок питань; автор тесту розраховує профілі з урахуванням робочих результатів отриманого тестування.
10. Визначення рейтингу тесту; менеджером тесту проходить підрахунок активності використання тесту й проходить оцінка надійності.
Запропоновані етапи життєвого циклу тестового завдання переважно реалізовані при створенні інформаційній системі підтримки тестового контролю “Logit”, адреса сайту: http://logit.kdpu.edu.ua/. При цьому питанням валідності й надійності з боку автора приділено особливу увагу. Також забезпечено належний сервіс рецензування й контролю за цим процесом.
Висновки
В практичному аспекті розробки дидактичних тестів особливу увагу слід приділяти забезпеченню валідності й надійності саме на попередніх етапах створення тесту. Забезпечення валідності й надійності тестових завдань слід розглядати в процесах життєвого циклу. Надважливим інструментом забезпечення цих параметрів є процес рецензування питань й відповідей в процесі створення тестових завдань.
Виявлення невалідності або ненадійності тесту на останніх етапах створення призводить до значних витрат, які можуть перевищувати вартість початкової розробки. Всі зазначені ідеї, зокрема рецензування й контролю було втілено при розробці інформаційної системи “Logit”.
Література
1. Національний Темпус-офіс в Україні. Офіційна сторінка [Електронний ресурс]. - / Режим доступу: http://www.tempus.org.ua/uk/tempus.html. - Назва з екрану.
2. Луценко О.Л. Лекція № 6 з дисципліни «психодіагностика». Валідність тесту.
Факторизація тесту / О.Л. Луценко. - [Електронний ресурс]. - Режим доступу: http://dspace.univer.kharkov.ua/bitstream/123456789
/1291/2/%D0%9B%D0%B5%D0%BA%D1%86%D0%B8%D1%8F%20%D0%9F%D0%94% 20%E2% 84%966% 20%D1%83%D0%BA%D1%80.pdf. - Назва з екрану.
3. Портал знань[Електроннийресурс].- Режим доступу:
http://www.znannya.org/?view=concept:463. - Назва з екрану.
4. Поняття життєвого циклу інформаційної системи [Електронний ресурс]. - Режим
доступу:http://www.virtual.ks.ua/essays-term-papers-and-diplomas/347-the-concept-of-life-
cycle-information-system.html. - Назва з екрану.
5. Коновалова М. Д. Експериментальна психологія: конспект лекцій / М. Д. Коновалова. -
Електронний ресурс.- Режим доступу: http://co.zapitai.com.ua/text/15221/index-
1.html?page=20. - Назва з екрану.
Одержано редакцією 27.12.2013 р.
Размещено на Allbest.ru
...Подобные документы
Вимоги до комплекту тестових завдань. Види тестів, вимоги щодо їх проведення, рекомендації з результатів тестування. Прийоми тестового контролю знань та вмінь учнів. Педагогічний тест. Вимоги до комплекту тестових завдань. Приклади завданнь для тестів.
доклад [14,4 K], добавлен 20.09.2008Методи контролю знань студентів і випускників вищих навчальних закладів. Систематизація змісту тестового іспиту. Узагальнення технічних дефектів тестових завдань. Розробка тесту успішності з дисципліни "Механізація і автоматизація сільського виробництва".
дипломная работа [865,9 K], добавлен 29.09.2010Поняття педагогічної тестології, її сутність і особливості, предмет і методи вивчення. Головна мета та методика використання тестів у навчальному процесі. Класифікація тестів, їх різновиди, відмінні риси. Основні принципи добору змісті тестових завдань.
курсовая работа [34,9 K], добавлен 07.04.2009Дидактичні принципи контролю знань, умінь та навичок студентів, його види і форми. Функції контролю, педагогічні вимоги до нього. Система тестового контролю студентів. Розробка тестових завдань з дисципліни "Основи сільськогосподарської екології".
курсовая работа [80,9 K], добавлен 17.01.2014Висвітлення питання, пов’язаного з місцем тестування в сучасному світі. Визначення даних, які можна отримати за допомогою тестів. Дослідження існуючих форм тестових завдань і вимог до них, а також розгляд принципів композиції завдань у тестовій формі.
статья [22,7 K], добавлен 18.12.2017Сутність тестів як засобу контролю. Психологічні особливості учнів та їх готовність до виконання тестових завдань. Порівняльний аналіз граматичних тем у підручнику з англійської мови та вимог до граматики у тестах зовнішнього незалежного оцінювання.
курсовая работа [40,5 K], добавлен 20.03.2011Викладацькі тести - метод формуючого оцінювання, на основі якого визначається готовність розпочинати навчальний процес. Оцінка валідності за змістом - фактор, що вимагає скрупульозного логічного аналізу відповідності тестових завдань і цілей курсу.
статья [14,2 K], добавлен 31.08.2017Застосування тестових технологій на уроці хімії як методу педагогічної діагностики. Основні критерії тестування: валідність, надійність, ефективність, складність. Розробка тестових завдань для контролю засвоєння теми "Хімічні реакції" у шкільному курсі.
курсовая работа [32,8 K], добавлен 13.12.2013Роль проведення оцінки та контролю якості навчання в сучасній системі освіти. Практичне застосування тестування. Класифікація та види тестів, принципи створення тестових завдань, їх основні переваги та недоліки. Суть зовнішнього незалежного оцінювання.
реферат [35,5 K], добавлен 20.06.2012Роль якості тестових завдань, глибини охоплення ними програми практичної та теоретичної медицини. Вплив залучення лікарів-інтернів до самостійного створення тестових завдань за структурою аналогічною ліцензійним на підвищення якості складання іспиту.
статья [20,8 K], добавлен 27.08.2017Теоретичні аспекти використання тестового контролю у вивченні іноземної мови. Загальне поняття про контроль та тести, як засіб контролю. Види та форми контролю. Особливості тестового контролю. Зразки структури тестових завдань, критерії їх оцінювання.
курсовая работа [24,8 K], добавлен 19.09.2019Загальне поняття про контроль та тести як засіб контролю, особливості їх проведення та головні вимоги. Вивчення змісту зразків структури тестових завдань, основні принципи та методика їх оцінювання, цілі та значення в процесі викладанні іноземної мови.
курсовая работа [32,2 K], добавлен 09.01.2014Загальні вимоги до тестів, їх властивості та структуризація. Принципи відбору змісту тестового матеріалу. Методика та принципи складання тестів. Використання автоматизованого контролю знань на уроках англійської мови. Суттєвість оцінки складності тестів.
курсовая работа [114,3 K], добавлен 13.04.2012Контроль знань та його результат. Основні вимоги до завдань тестів у вищій школі. Переваги перевірки знань студентів за тестами. Недоліки використання тестової перевірки знань студентів. Пропозиції щодо використання тестування у навчальному процесі.
контрольная работа [19,4 K], добавлен 11.01.2011Основні поняття контролю знань та навчальних досягнень учнів, його сутність, види та функції. Методи, форми організації і педагогічні вимоги до контролю та оцінювання знань учнів. Ефективність тестового контролю як сучасної форми контролю знань учнів.
курсовая работа [53,4 K], добавлен 23.12.2015Впровадження новітніх освітніх технологій в навчальному процесі. Розробка механізмів саморозвитку особистості. Вдосконалення інформаційної підготовки вчителя фізкультури. Застосування тестових комп’ютерних програм та презентації під час проведення занять.
статья [21,6 K], добавлен 15.01.2018Логічні операції над предикатами. Рівносильні формули. Приклади розв’язання практичних завдань до підрозділів модуля логіки предикатів. Тестові завдання для контролю знань і вмінь з модуля. Організація та методика проведення тестування з математики.
дипломная работа [651,4 K], добавлен 26.10.2013Поняття і зміст тестового контролю знань школярів. Характеристика тестового контролю як педагогічної проблеми і засобу оптимізації учбового процесу. Індивідуальність, об'єктивність і системність як основні дидактичні принципи побудови контрольних тестів.
контрольная работа [26,2 K], добавлен 10.10.2014Тест як один із засобів контролю вивчення іноземної мови. Проблеми тестового контролю у процесі навчання. Розробка завдань для контролю аудіювання в 3-му класі та тематичної атестації по темі «Школа» в 5-му класі. Особливості методики складання тестів.
курсовая работа [73,7 K], добавлен 02.04.2009Аналіз питань навчання іноземних мов, зокрема усного мовлення. Дослідження поняття "прогалин" у спілкуванні та способи їх заповнення. Опис труднощів, з якими стикається вчитель, навчаючи усного мовлення. Ефективний моніторинг і контроль за мовленням.
статья [21,4 K], добавлен 24.04.2018