Основные шкалы измерений. Критерии оценивания педагогических экспериментов
Элементы теории измерений. Шкалы измерений, допустимые преобразования. Применение шкал и измерений в педагогических исследованиях. Статистическая проверка статистических гипотез. Проверка гипотезы о независимости оценки "5" в аттестате об окончании школы.
Рубрика | Педагогика |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 11.06.2017 |
Размер файла | 566,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Гипотезы
Н0: Распределение взглядов Агафьи Тихоновны между женихами не
отличается от равномерного распределения.
Н1: Распределение взглядов Агафьи Тихоновны между женихами отличается от равномерного распределения. Теперь нам нужно определить теоретическую частоту взгляда при равномерном распределении. Если бы все взгляды невесты распределялись равномерно между 4-мя женихами, то, по-видимому, каждый из них получил бы по ј всех взглядов.
Переведем эти рассуждения на более формализованный язык. Теоретическая частота при сопоставлении эмпирического распределения с равномерным определяется по формуле:
fтеор=n/k
где n - количество наблюдений;
k - количество разрядов признака.
В нашем случае признак - взгляд невесты, направленный на кого-либо из женихов; количество разрядов признака - 4 направления взгляда, по количеству женихов; количество наблюдений - 32.
Итак, в нашем случае: f =32/4=8
Теперь мы будем сравнивать с этой теоретической частотой все эмпирические частоты.
Рис.4. Сопоставление эмпирических частот взгляда Агафьи Тихоновны на каждого из женихов (столбики гистограммы) с теоретической частотой (горизонтальная планка); темной штриховкой отмечены области расхождений между эмпирическими и теоретическими частотами.
На Рис.4 сопоставления эмпирических частот с теоретической представлены графически. Похоже, что области расхождений достаточно значительны, и Никанор Иванович явно опережает других женихов. Иван Павлович еще может на что-то надеяться, но для Ивана Кузьмича и Балтазара Балтазарыча отставка, по-видимому, неизбежна.
Однако для того, чтобы доказать неравномерность полученного эмпирического распределения, нам необходимо произвести точные расчеты. В методе они производятся с точностью до сотых, а иногда и до тысячных долей единицы.
Расчеты будем производить в таблице по алгоритму.
Расчет критерия
1. Занести в таблицу наименования разрядов и соответствующие им эмпирические частоты (первый столбец).
2. Рядом с каждой эмпирической частотой записать теоретическую частоту (второй столбец).
Подсчитать разности между эмпирической и теоретической частотой по каждому разряду (строке) и записать их в третий столбец.
Определить число степеней свободы по формуле: v=k-l
где k - количество разрядов признака.
Если V=l, внести поправку на "непрерывность".
5. Возвести в квадрат полученные разности и занести их в четвертый столбец.
Разделить полученные квадраты разностей на теоретическую частоту и записать результаты в пятый столбец.
Просуммировать значения пятого столбца. Полученную сумму обозначить как эмп
Определить по таблице критические значения для данного числа степеней свободы v.
Если эмп меньше критического значения, расхождения между распределениями статистически недостоверны.
Если эмп равно критическому значению или превышает его, расхождения между распределениями статистически достоверны.
Все вычисления для данного случая отражены в Табл.5.
Таблица 5 Расчет критерия при сопоставлении эмпирического распределения взгляда Агафьи Тихоновны между женихами с равномерным распределением
Разряды - женихи |
Эмпирическая частота взгляда (fзj) |
Теоретическая частота (fт) |
(fзj* fт) |
(fзj* fт) 2 |
(fзj* fт) 2/ fт |
||
1 |
Никанор Иванович |
14 |
8 |
+6 |
36 |
4,500 |
|
2 |
Иван Кузьмич |
5 |
8 |
-3 |
9 |
1,125 |
|
4 5 |
Иван Павлович Балтаэар Балтазарыч |
8 5 |
8 8 |
0 3 |
0 9 |
0 1,125 |
|
Суммы |
32 |
32 |
0 |
54 |
6, 750 |
Может показаться, что удобнее суммировать все возведенные в квадрат разности между эмпирическими и теоретическими частотами, а затем уже эту сумму разделить на fт. В данном случае это возможно, так как fт для всех разрядов одинакова. Однако позже мы увидим, что так бывает далеко не всегда. Нужно быть внимательными или, экономя свое внимание, просто взять за правило всякий раз вычислять (fзj - fт) 2/ fт до суммирования.
Необходимо также всякий раз убеждаться в том, что сумма разностей между эмпирическими и теоретической частотами (сумма по третьему столбцу) равна 0. Если это равенство не соблюдается, это означает, что в подсчете частот или разностей допущена ошибка. Необходимо найти и устранить ее прежде чем переходить к дальнейшим расчетам.
Алгоритм вычислений, таким образом, выражается формулой:
где
fзj - эмпирическая частота по j-тому разряду признака;
fт - теоретическая частота;
j - порядковый номер разряда;
k - количество разрядов признака.
В данном случае:
Для того, чтобы установить критические значения , нам нужно определить число степеней свободы V по формуле: v=k-l
где k - количество разрядов. В нашем случае V=4-1=3. По таблице определяем:
7,815 (p < 0,05)
кр
11,345 (р < 0,01)
Построим "ось значимости". Ясно, что чем больше отклонения эмпирических частот от теоретической, тем больше будет величинаПоэтому зона значимости располагается справа, а зона незначимости - слева.
эмп <кр
К сожалению, на основании этих данных тетушка не сможет дать Агафье Тихоновне обоснованного ответа:
Ответ: Н0 принимается. Распределение взгляда Агафьи Тихоновны между женихами не отличается от равномерного распределения.
§ 4. Критерий знаков
При анализе результатов измерения непрерывной переменной иногда полезно сгруппировать результаты в несколько равных групп. Например, чтобы получить четыре равные группы, необходимо иметь значения, делящие исходные данные по 25% в каждой группе. Существуют три такие значения (точки деления), которые называются квартилями (quartile), при этом средняя из них также называется медианой (см. рисунок). Аналогично, можно использовать два тертиля (tertile), чтобы разбить данные на три группы, четыре квинтиля (quintile), чтобы разбить их на пять групп, и так далее. Общий термин для таких точек раздела - квбнтили. Другие термины, которые часто употребляются - децили (decile), которые делят данные на 10 частей, и центили (centile), которые делят данные на 100 частей (их также называют процентилями). Значения типа квартилей могут быть выражены через центили; например, самый левый квартиль равен 25ому центилю, а медиана - 50ому центилю.
Наиболее общее заблуждение - это использование терминов тертили, квартили, квинтили, и т.д., не для обозначения точек отсечки, а для групп данных, полученных таким образом. Однако правильное их название: третья часть, четверть, пятая часть, и так далее.
Ниже рассмотрим некоторые общие приложения квантилей.
Описание данных. Среднее значение и стандартное отклонение часто используются для описания совокупности наблюдений. Однако, когда данные имеют несимметричное (негауссово) распределение, как на рисунке, тогда предпочтительно указывать медиану и два внешних центиля, например 10й и 90й. Иногда используют первый и третий квартили (25ый и 75й центили). Медиана - очень полезная итоговая статистика, когда некоторые из значений не были реально измерены - например, вышли за диапазон измеряющего оборудования. Медиана часто используется при анализе данных по выживанию, когда для некоторых подопытных особей это время может быть неизвестным.
Доверительный интервал и центили. Особый вид описания данных - определение доверительного интервала (диапазона ожидаемых значений).95%й доверительный интервал определяется отсечением по 2.5% данных с каждого конца распределения. (Эти значения часто справедливо называют 2.5 и 97.5ым центилями, хотя и не совсем корректно делить центили пополам). Доверительный интервал широко используется в клинической химии. Точно также на номограммах для оценки роста и размера человека обычно изображены центили. Граничные центили иногда определяют исходя из нормального распределения, при этом каждое новое наблюдение может быть помещено в определенный центиль.
Анализ непрерывных переменных. Непрерывные переменные, например концентрацию холестерола или дыхательный объем легких, в статистических исследованиях часто также делят на несколько диапазонов. Для этой цели обычно используют квантили, чтобы во всех группах было равное число измерений. При такой группировке часть информации теряется, но появляется возможность представить данные в более простом виде, например, в виде таблиц. Чем меньше групп, тем больше информации теряется. В регрессионном анализе непрерывные независимые переменные иногда делят по амплитуде на две или более групп. Это слегка усложняет анализ, но позволяет избежать предположения о линейном соотношении между двумя анализируемыми величинами. Однако, такой подход ведет к модели, в которой вероятность изменяется скачками при некоторых значениях переменной, а не равномерно увеличивается.
Вычисление квантилей. Вычисление центилей и других квантилей не настолько просто, как может показаться. Данные должны быть упорядочены от 1 до n в порядке возрастания. Kй центиль получается вычислением величины q=k* (n+1) /100 и ее последующей интерполяцией между двумя ближайшими к q значениями данных (бо'льшим и меньшим). Например, для 5ого центиля выборки из 145 наблюдений мы имеем q=5*146/100=7.3 Таким образом, 5-ый центиль находится на 3/10 расстояния от 7го к 8му упорядоченному наблюдениям. Если значения этих данных равны 11.4 и 14.9 соответственно, то искомый центиль равен 12.45. Доверительные интервалы могут быть построены для любого квантиля.
Критерий предназначен для сравнения состояния некоторого свойства у членов двух зависимых выборок на основе измерений, сделанных по шкале не ниже порядковой.
Данные. Будем считать, что случайная переменная Х характеризует состояние некоторого свойства в рассматриваемой совокупности объектов при первичном измерении данного свойства, случайная величина Y характеризует состояние этого же свойства в той же совокупности объектов при вторичном измерении.
Имеется две серии наблюдений
x1,x2. xi. xN; (13)
y1, y2. yi. yN; (14)
над случайными переменными о и з, полученные при рассмотрении двух зависимых выборок. На их основе составлено N пар вида (xi, yi), где xi, yi - результаты двукратного измерения одного и того же свойства у одного и того же объекта.
В педагогических исследованиях объектами изучения могут служить учащиеся, учителя, администрация школ. При этом xi, yi могут быть, например балловыми оценками, выставленными учителем за двукратное выполнение одной и той же или различных работ одной и той же группой учащихся до и после применения некоторого педагогического средства.
Элементы каждой пары xi, yi сравниваются между собой по величине, и паре присваивается знак "+", если xi<yi, знак " -", если xi>yi, и "0", если xi=yi. Установление соотношения "больше" ("меньше") между двумя измерениями возможно, если эти измерения сделаны хотя бы по шкале порядка. Следовательно, знаковый критерий непригоден в случае измерений по шкале наименований.
Возьмём случайные выборки:
о1,о2. о i. о N; (15) з1,з 2. з i. з N; (16)
Допущения. Для применения знакового критерия необходимо выполнение следующих требований:
1. Выборки случайные;
2. Выборки зависимые;
3. Пары (о i, з i) взаимно независимы, то есть члены выборки, никак не влияют друг на друга (в педагогических исследованиях выполнение этого требования равносильно, например, исключению возможности консультаций и списывания членами выборок ответов друг у друга)
4. Изучаемое свойство объектов распределено непрерывно в обеих совокупностях, из которых сделаны выборки;
5. Шкала измерений должна быть не ниже порядковой.
Гипотезы. Предположим, что законы распределения случайных величин X и Y одинаковы. Тогда выполняется также и такое равенство
P (о i < з i) = P (о i > з i) для всех пар (о i, з i), (17)
которое означает, что вероятность того, что первое измерение (xi) в паре (xi,yi) меньше второго измерения (yi), равна вероятности того, что первое измерение в паре больше второго, для всех N пар. Справедливость этого равенства и проверяется с помощью знакового критерия. Таким образом, нулевая гипотеза будет иметь вид
H0: P (о i>з I) = P (о i<з I) для всех i.
При использовании знакового критерия в качестве альтернативной гипотезы выбирается гипотеза
H1: P (о i>з I) ? P (о i<з I) для всех i.
Если гипотеза H1 справедлива, то отсюда следует, что законы распределения величин X и Y различны, то есть состояния изучаемого свойства существенно различны в одной и той же совокупности при первичном и вторичном измерениях этого свойства. Справедливость нулевой гипотезы интерпретируется следующим образом: в состоянии изучаемого свойства нет значимых различий при первичном и вторичном измерениях.
Статистика критерия. Для проверки гипотез с помощью знакового критерия на основе наблюдений подсчитывается значение величины T, называемой статистикой критерия. Значение T определяется следующим образом.
Допустим, что из N пар (xi, yi) нашлось несколько пар, в которых значения xi и yi равны. Такие пары обозначаются знаком "0" и при подсчёте и при подсчёте значения величины T не учитываются. Предположим, что за вычетом из числа N пар, обозначенных знаком "0", осталось всего n пар. Среди оставшихся пар подсчитываем число пар, обозначенных знаком "+" (то есть те пары, в которых xi<yi). Значение величины T равно числу пар со знаком "+".
Правило принятия решения. Пусть число пар, в которых xi ? yi, равно n и б - принятый уровень значимости. Рассмотрим правила принятия решений при проверке разного вида гипотез.
1. Двусторонний критерий. Проводится проверка гипотезы
H0: P (о i>з I) = P (о i<з I) для всех i
при альтернативе
H1: P (о i>з I) ? P (о i<з I) для всех i.
Для n?100 составлена специальная таблица, в которой для каждого значения n даны критические значения tб и n - tб статистики T для разных уровней значимости б.
При данном значении n гипотеза H0 отклоняется на уровне значимости б, если для наблюдаемого значения T справедливо одно из неравенств T<tб или T>n - tб.
2. Односторонний критерий. В тех случаях, когда имеются достаточные основания предполагать, что результаты второго измерения изучаемого свойства у одних и тех же объектов - yi имеют тенденцию превышать (или наоборот, быть меньше) результаты первичного измерения - xi, вместо двустороннего критерия используется односторонний критерий.
А. Для случая, когда xi имеют тенденцию превышать yi, проводится проверка гипотезы
H0: P (о i>з I) P (о i<з I) для всех i
при альтернативе
H1: P (о i>з I) < P (о i<з I) для всех i.
Для n?100 может быть использована та же таблица, что и для двустороннего критерия. H0 отклоняется на уровне значимости б, указанном для одностороннего критерия, если наблюдаемое значение T<tб.
Б. В том случае, когда yi имеет тенденцию превышать по значению xi, проводится проверка гипотезы
H0: P (о i>з I) ? P (о i<з I) для всех i
при альтернативе
H1: P (о i>з I) > P (о i<з I) для всех i.
H0 отклоняется на уровне значимости б, если наблюдаемое значение
T>n - tб,
где значение n - tб определяется из таблицы.
Таблица критических значений знакового критерия основана на биномиальном распределении.
Для достаточно больших значений n биномиальное распределение можно приближённо заменить (аппроксимировать) нормальным.
В случае двустороннего критерия tб определяется по формуле
(18)
где - квантиль нормального распределения, определяемый для вероятности . H0 отклоняется на уровне значимости б, если наблюдаемое значение T<tб или T>n-tб.
В случае одностороннего критерия tб определяется по формуле
(18)
где - квантиль нормального распределения, определяемый для вероятности б.
Пример использования знакового критерия.
Учащиеся выполняли контрольную работу, направленную на проверку усвоения некоторого понятия. Пятнадцати учащимся, 7 из которых получили отметку "2" и 8 - отметку "3", было затем предложено программированное пособие, составленное с целью формирования данного понятия у учащихся с низким уровнем обучаемости. После изучения пособия учащиеся снова выполняли ту же контрольную работу, которая оценивалась по пятибалльной системе.
Данный эксперимент проводился с целью проверки эффективности программированного пособия как средства повышения знаний слабых учащихся путём самообразования. Результаты двукратного выполнения работы учащимися представляют измерения по шкале порядка (пятибалльная шкала) такого качества, как усвоение некоторого понятия. В этих условиях возможно применения знакового критерии для выявления тенденции изменения состояния знаний учащихся после изучения пособия, так как выполняются все допущения этого критерия.
Результаты двукратного выполнения работы (в баллах) 15 учащимися представим в виде таблицы.
Таблица 6
Учащийся (№) |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
|
Первое выполнение |
2 |
2 |
2 |
2 |
2 |
3 |
3 |
3 |
3 |
3 |
2 |
2 |
3 |
3 |
3 |
|
Второе выполнение |
2 |
3 |
1 |
4 |
3 |
2 |
3 |
4 |
4 |
3 |
4 |
3 |
2 |
4 |
4 |
|
Знак разности отметок |
0 |
- |
- |
+ |
+ |
- |
0 |
+ |
+ |
0 |
+ |
+ |
- |
+ |
+ |
Проверяется гипотеза H0: состояние знаний учащихся не повысилось после изучения пособия - при альтернативе H1: состояние знаний учащихся повысилось после изучения пособия.
В соответствии с содержанием гипотез следует применить односторонний знаковый критерий. Подсчитаем значение статистики критерия Т, равное числу положительных разностей отметок, полученных учащимися. Согласно данным Т=10. Из 15 пар в 3 случаях разность измерений равна нулю, следовательно, остаётся только 12 пар, то есть n=12.
Для определения критических значений статистики критерия n-tб используем таблицу, так как n<100. Для уровня значимости б=0,05 при n=12 значение n-tб=9. Следовательно, выполняется неравенство Tнаблюдаемое> n-tб. Поэтому в соответствии с правилом принятия решения нулевая гипотеза отклоняется на уровне значимости б=0,05 и принимается альтернативная гипотеза, что позволяет сделать вывод об улучшении знаний учащихся после самостоятельного изучения пособия.
§ 5. Критерий Вилкоксона-Манна-Уитни
Данный критерий оперирует не с абсолютными значениями элементов двух выборок, а с результатами их парных сравнений. Например, существенно, что учащийся Петров решил больше задач, чем учащийся Иванов, а на сколько больше - не важно.
Возьмём две выборки {xi}, i=1. N и {yj }, j=1. M и для каждого элемента первой выборки xi, i=1. N, определим число ai элементов второй выборки, которые превосходят его по своему значению (то есть число таких yj, что yj >xi). этих чисел по всем N членам первой выборки называется эмпирическим значением критерия Манна-Уитни и обозначается U= Определим эмпирическое значение критерия Вилкоксона:
(19)
Алгоритм определения достоверности совпадений и различий для экспериментальных данных, измеренных в шкале отношений, с помощью критерия Вилкоксона-Манна-Уитни заключается в следующем:
Вычислить для сравниваемых выборок Wэмп - эмпирическое значение критерия Вилкоксона по формуле (19).
Сравнить это значение с критическим значением Wэмп=1,96 если Wэмп<1.96, то сделать вывод: "характеристики сравниваемых выборок совпадают с уровнем значимости 0,05", если Wэмп >1,96 то сделать вывод "достоверность различий характеристик сравниваемых выборок составляет 95%".
В качестве примера применим алгоритм для числа правильно решенных задач в контрольной и экспериментальной группе до начала эксперимента. В таблице приведены результаты экспериментальной группы (второй столбец), и контрольной группы (пятый столбец), а также для каждого члена экспериментальной группы подсчитано число членов контрольной группы, решивших строго большее (чем он) число задач (третий столбец). Например, в таблице серым цветом в пятом столбце отмечены члены контрольной группы, правильно решивших строго большее число задач, чем первый член (то есть i= 1) экспериментальной группы, который правильно решил 12 задач. Значит х1=12 и число таких yi, что yi> xi (то есть число затемненных ячеек) равно 16. Следовательно, ai=16. Аналогично заполняются остальные строки третьего столбца.
i |
xi |
ai |
j |
yj |
|
1 |
12 |
16 |
1 |
15 |
|
2 |
11 |
18 |
2 |
13 |
|
3 |
15 |
7 |
3 |
11 |
|
4 |
17 |
5 |
4 |
18 |
|
5 |
18 |
3 |
5 |
10 |
|
6 |
6 |
28 |
6 |
8 |
|
7 |
8 |
23 |
7 |
20 |
|
8 |
10 |
21 |
8 |
7 |
|
9 |
16 |
5 |
9 |
8 |
|
10 |
12 |
16 |
10 |
12 |
|
11 |
15 |
7 |
11 |
15 |
|
12 |
14 |
11 |
12 |
16 |
|
13 |
19 |
1 |
13 |
13 |
|
14 |
13 |
13 |
14 |
14 |
|
15 |
19 |
1 |
15 |
14 |
|
16 |
12 |
16 |
16 |
19 |
|
17 |
11 |
18 |
17 |
7 |
|
18 |
16 |
5 |
18 |
8 |
|
19 |
12 |
16 |
19 |
11 |
|
20 |
8 |
23 |
20 |
12 |
|
21 |
13 |
13 |
21 |
15 |
|
22 |
7 |
26 |
22 |
16 |
|
23 |
15 |
7 |
23 |
13 |
|
24 |
8 |
23 |
24 |
5 |
|
25 |
9 |
22 |
25 |
11 |
|
26 |
19 |
||||
27 |
18 |
||||
28 |
9 |
||||
29 |
6 |
||||
30 |
15 |
Сумма всех 25 чисел в третьем столбце дает эмпирическое значение критерия Манна-Уитни U = 344. Вычисляем по формуле (19) значение Wэмп = 0,52 < 1,96. Следовательно, гипотеза о том, что сравниваемые выборки совпадают, принимаются на уровне значимости 0,05.
Теперь аналогичным образом (построив таблицу, аналогичную предыдущей, и вычислив эмпирическое значения критерия Вилкоксона) сравним числа правильно решённых задач в контрольной и экспериментальной группе после окончания эксперимента. Эмпирическое значения критерия Манна-Уитни в этом случае равно 223 Вычислим по формуле (19) значение Wэмп= 2,57>1,96. Следовательно, достоверность различий сравниваемых выборок составляет 95%.
Итак, начальные (до начала эксперимента) состояния экспериментальной и контрольной группы совпадают, а конечные (после эксперимента) - различаются. Следовательно, можно сделать вывод, что эффект изменений обусловлен именно применением экспериментальной методики обучения.
§ 6. Проверка гипотезы о независимости оценки 5 в аттестате об окончании средней школы и на вступительных экзаменов на факультет МИФ НГПУ в 2006 году
Был проведён опрос студентов, поступивших в 2006 году на факультет МИФ НГПУ по специальности "Математика". Каждому студенту предлагалось указать оценки из аттестата по алгебре и по геометрии, а также оценку полученную им на вступительном экзамене.
а) Если сумма оценок по алгебре и геометрии оказывалась не ниже 9, то полагалось, что абитуриент имел в школе оценку 5 по математике. Если же сумма оценок по алгебре и геометрии оказывалась не ниже 7, то полагалось, что абитуриент имел в школе оценку 4 по математике В результате были получены следующие данные.
№ |
Оценка на вступительном экзамене |
Оценка из аттестата |
№ |
Оценка на вступительном экзамене |
Оценка из аттестата |
||
1 |
3 |
4 |
34 |
5 |
4 |
||
2 |
3 |
4 |
35 |
5 |
4 |
||
3 |
3 |
4 |
36 |
5 |
4 |
||
4 |
3 |
4 |
37 |
5 |
5 |
||
5 |
3 |
4 |
38 |
5 |
5 |
||
6 |
3 |
4 |
39 |
5 |
5 |
||
7 |
3 |
5 |
40 |
5 |
5 |
||
8 |
3 |
5 |
41 |
5 |
5 |
||
9 |
3 |
5 |
42 |
5 |
5 |
||
10 |
3 |
5 |
43 |
5 |
5 |
||
11 |
3 |
5 |
44 |
5 |
5 |
||
12 |
3 |
5 |
45 |
5 |
5 |
||
13 |
3 |
5 |
46 |
5 |
5 |
||
14 |
4 |
3 |
47 |
5 |
5 |
||
15 |
4 |
4 |
48 |
5 |
5 |
||
16 |
4 |
4 |
49 |
5 |
5 |
||
17 |
4 |
4 |
50 |
5 |
5 |
||
18 |
4 |
4 |
51 |
5 |
5 |
||
19 |
4 |
4 |
52 |
5 |
5 |
||
20 |
4 |
4 |
53 |
5 |
5 |
||
21 |
4 |
4 |
54 |
5 |
5 |
||
22 |
4 |
5 |
55 |
5 |
5 |
||
23 |
4 |
5 |
56 |
5 |
5 |
||
24 |
4 |
5 |
57 |
5 |
5 |
||
25 |
4 |
5 |
58 |
5 |
5 |
||
26 |
4 |
5 |
59 |
5 |
5 |
||
27 |
4 |
5 |
|||||
28 |
4 |
5 |
|||||
29 |
4 |
5 |
|||||
30 |
4 |
5 |
|||||
31 |
4 |
5 |
|||||
32 |
4 |
5 |
|||||
33 |
4 |
5 |
Уровень значимости б возьмём равным 0,05
Однако не следует считать результаты данного эксперимента статистически верными, так как размер выборки недостаточно велик (n=59)
За основную гипотезу примем
Н0: оценка 5 из аттестата об окончании средней школы и оценка 5 на вступительных экзаменов на ФМИФ в 2006 году независимы.
Гипотезу противоположную гипотезе Н0, обозначим H1.
Применим для проверки нулевой гипотезы статистику Фишера-Пирсона с поправкой Йейтса.
Пусть о-оценка на вступительном экзамене, з-это оценка из аттестата.
Составим таблицу сопряжённости признаков:
о |
з |
|||
?5 |
5 |
|||
?5 |
14 |
19 |
n1. =33 |
|
5 |
3 |
23 |
n2. =26 |
|
n.1=17 |
n.2=42 |
N=59 |
В данном случае число степеней свободы k= (2-1) * (2-1) =1
В данном случае (о, з) =
(о, з) =6,763
(о, з) критическое=3,8.
набл (о, з) > (о, з) критическое
Таким образом, нулевая гипотеза отклоняется и принимается альтернативная гипотеза Н1.
б) Будем считать что у абитуриента была оценка 5 по математике в школе, только в том случае если у него была оценка 5 по алгебре.
Гипотезы Н0 и Н1и б, (о, з) критическое оставим без изменений.
Составим таблицу сопряжённости признаков:
о |
з |
|||
?5 |
5 |
|||
?5 |
16 |
17 |
n1. =33 |
|
5 |
4 |
22 |
n2. =26 |
|
n.1=20 |
n.2=39 |
N=59 |
Число степеней свободы k= (2-1) * (2-1) =2
(о, з) =
набл (о, з) > (о, з) критическое
Таким образом, нулевая гипотеза отклоняется и принимается альтернативная гипотеза Н1.
в) Будем считать что у абитуриента была оценка 5 по математике в школе, только в том случае если у него были оценка 5 по алгебре.
Гипотезы Н0 и Н1и б, (о, з) критическое оставим без изменений.
Составим таблицу сопряжённости признаков:
о |
з |
|||
?5 |
5 |
|||
?5 |
19 |
4 |
n1. =23 |
|
5 |
14 |
22 |
n2. =36 |
|
n.1=23 |
n.2=26 |
N=59 |
Число степеней свободы k= (2-1) * (2-1) =2
(о, з) =
набл (о, з) > (о, з) критическое
Таким образом, нулевая гипотеза отклоняется и принимается альтернативная гипотеза Н1.
в) Будем считать что у абитуриента была оценка 5 по математике в школе, только в том случае если у него была оценка 5 по геометрии.
Гипотезы Н0 и Н1и б, (о, з) критическое оставим без изменений.
Составим таблицу сопряжённости признаков:
о |
з |
|||
?5 |
5 |
|||
?5 |
17 |
3 |
n1. =20 |
|
5 |
16 |
23 |
n2. =39 |
|
n.1=33 |
n.2=26 |
N=59 |
Число степеней свободы k= (2-1) * (2-1) =2
(о, з) =
набл (о, з) > (о, з) критическое
Таким образом, нулевая гипотеза отклоняется и принимается альтернативная гипотеза Н1
г) Будем считать что у абитуриента была оценка 5 по математике в школе, только в том случае если у него была оценка 5 по геометрии и оценка 5 по алгебре.
Гипотезы Н0 и Н1и б, (о, з) критическое оставим без изменений.
Составим таблицу сопряжённости признаков:
о |
з |
|||
?5 |
5 |
|||
?5 |
19 |
4 |
n1. =20 |
|
5 |
14 |
22 |
n2. =39 |
|
n.1=33 |
n.2=26 |
N=59 |
Число степеней свободы k= (2-1) * (2-1) =2
(о, з) =
набл (о, з) > (о, з) критическое
Таким образом, нулевая гипотеза отклоняется и принимается альтернативная гипотеза Н1
Литература
1. Новиков Д.А. Статистические методы в педагогических исследованиях (типовые случаи). М: МЗ-Пресс, 2004. - 67 с.
2. Сидоренко Е.В. Методы математической обработки в психологии. - СПб.: ООО "Речь", 2003. - 350 с., ил.
3. Грабарь М.И., Краснянская К. А, Применение математической статистики в педагогических исследованиях: Непараметрические методы. М: Педагогика, 1977. - 136 с.
4. Гласс Д., Стэнли Д. Статистические методы в педагогике и психологии. М.: Прогресс, 1976. - 495 с.
5. Солодовников А.С. Теория вероятностей: Учебное пособие для студентов педагогических институтов по матем. спец. - М.: Просвещение, 1983.207 с.
6. Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. пособие для вузов. - Изд.7-е, стер. - М.: Высш шк., 2001. - 479 с: ил.
Приложение
Случайной величиной, связанной с данным опытом, называется величина, которая при каждом осуществлении опыта принимает то или иное числовое значение из области допустимых значений, заранее неизвестно какое именно.
Два события называются независимыми, если вероятность их совмещения равна произведению вероятностей этих событий; в противном случае события называют зависимыми.
Две случайные дискретные величины о и з называются зависимыми, если p (о=хi,з=yj) =p (о=хj) *p (з=yj) для любых возможных значений хi и yj случайных величин о и з.
Биномиальным законом называют распределение вероятностей, определяемое формулой Бернулли: Рп (к) = , где р - вероятность удачи, q=1-р, к - число удач в n испытаниях.
В случае стандартного нормального распределения плотность распределения имеет следующий вид: (Рис.5)
Нормальное распределение (Рис.5)
Математическим ожидание дискретной случайной о величины называют сумму произведений всех её значений на их вероятности:
Дисперсия
Среднее квадратическое отклонение
Пусть оi (i=1,2,., п) - нормальные независимые случайные величины, причём математическое ожидание каждой из них равно нулю, а среднее квадратическое отклонение - единице. Тогда сумма квадратов этих величин
распределена по закону с n степенями свободы.
Размещено на Allbest.ru
...Подобные документы
Характеристика объективности, надежности (релиабильности) и валидности - основных критериев оценки качества измерений в педагогической диагностике. Понятие, значение и признаки наблюдения за поведением школьника. Причины возникновения ошибок в референции.
лекция [49,1 K], добавлен 04.12.2011Исследование основных этапов проведения экспериментов. Характеристика особенностей лабораторных и производственных экспериментальных исследований. Обоснование и выбор средств измерений. Проверка теоретических положений и подтверждение рабочей гипотезы.
презентация [55,4 K], добавлен 22.08.2015Среди методов педагогических исследований одно из главных мест занимает педагогический эксперимент, одной из составных частей которого является формулирование, выдвижение и проверка гипотез. Представление о видах и методах педагогических исследований.
реферат [18,9 K], добавлен 19.02.2008Педагогическое тестирование в России и за рубежом. Исторические предпосылки современного тестирования в отечественном образовании. Классификация видов педагогических тестов, предтестовых заданий и требования к ним. Инновационные формы тестовых заданий.
курсовая работа [110,2 K], добавлен 28.10.2008Основные комплексы педагогических методов исследования. Основные требования при проведении наблюдения, его недостатки. Классификация педагогических экспериментов, их значение. Понятие и разновидности тестирования. Социологические методы исследования.
реферат [15,5 K], добавлен 25.04.2009Основные виды педагогических тестов и формы тестовых заданий. Эмпирическая проверка и статистическая обработка результатов. Принципы отбора и критерии оценки содержания теста. Соотношение формы задания и вида проверяемых знаний, умений, навыков.
лекция [79,8 K], добавлен 10.05.2009Научно-теоретические аспекты моделирования в социально-педагогических исследованиях. Анализ специфики и существенных признаков понятий модели и моделирования в контексте социально-педагогических иследований. Характеристика основных типов моделей.
реферат [28,9 K], добавлен 09.01.2012Основные этапы становления и развития педагогических взглядов С. Френе. Сущность и анализ содержания педагогических идей С. Френе. Роль и значение идей С. Френе для современной школы и педагогики. Реализация идей С. Френе в школьном образовании России.
курсовая работа [49,4 K], добавлен 29.07.2010Статистические связи (корреляции) между педагогическими факторами. Определение величины и характера корреляции. Причинные и следственные коррелирующие факторы. Ранговая корреляция Спирмена, значения ее коэффициентов. Непараметрические критерии различия.
реферат [65,9 K], добавлен 12.11.2009Методы педагогического контроля. Тест как средство измерений знаний. Формы тестовых заданий, методы и приемы их использования. Разработка контролируемых вопросов по теме. Проведение формирующего эксперимента и статистическая обработка его результатов.
дипломная работа [72,6 K], добавлен 01.06.2013Основные характеристики, особенности и классификация педагогических технологий. Исторический аспект создания педагогических мастерских. Этапы работы мастерской. Опыт реализации французской технологии педагогических мастерских в начальных классах.
курсовая работа [76,7 K], добавлен 04.07.2010Сущность понятия "воспитание". Воспитание как естественный путь развития ребенка в теории, выдвинутой Ж.-Ж. Руссо. Демократические преобразования в обществе и возникновение гуманистической модели образования. Формирование нравственной самостоятельности.
статья [23,7 K], добавлен 14.06.2013Компьютер как инструмент педагогического исследования. Конструирование логики педагогического исследования. Построение основной гипотезы исследования. Фиксация данных педагогического исследования. Автоматизация процесса анкетирования и тестирования.
реферат [23,9 K], добавлен 10.12.2012Основные качества новых современных педагогических технологий. Психологические теории как основа некоторых педагогических технологий. Использование элементов модульной технологии и рейтинговой оценки знаний при дифференциации в обучении математике.
дипломная работа [60,9 K], добавлен 11.01.2011Понятие игровых педагогических технологий, их классификация, структура, алгоритмы применения. Методика использования игровых педагогических технологий в учебном процессе в условиях школы-интерната для обучающихся с ограниченными возможностями здоровья.
дипломная работа [193,7 K], добавлен 09.04.2019Анализ феномена самооценки в психолого-педагогических исследованиях. Игра-драматизация как средство формирования адекватной самооценки у детей старшего дошкольного возраста с нарушением слуха. Понятие игровой деятельности в педагогических исследованиях.
дипломная работа [289,2 K], добавлен 28.11.2013Понятие педагогических способностей и методы их развития, оценка места и значения в успешной деятельности педагога. Эмпирическое исследование педагогических способностей студентов педагогических специальностей на современном этапе, формирование выводов.
курсовая работа [39,6 K], добавлен 31.05.2010Основные положения педагогической концепции Л.Н. Толстого. История создания Яснополянской школы. Использование педагогических идей Л.Н. Толстого в современной начальной школе. Использование методов и приемов работы писателя в обучении и воспитании.
дипломная работа [1,2 M], добавлен 07.09.2017Сущность педагогических способностей. Соотношение понятий: способности, гениальность и талант. Структура педагогических способностей. Взаимосвязь педагогической деятельности, педагогического общения и личности учителя. Педагогические игры и тренинги.
контрольная работа [58,7 K], добавлен 31.01.2011Определения понятия "педагогическая цель" в научной литературе. Важность постановки педагогических целей в педагогическом процессе. Способы систематизации видов педагогических целей. Актуальные проблемы профессиональной педагогики в современных условиях.
контрольная работа [29,6 K], добавлен 09.11.2010