Математическая статистика
Основные задачи математической статистики и ее применение в психолого-педагогических науках. Шкалирование, виды шкал. Программные продукты для обработки информации. Выявление различий в уровне исследуемого признака. Факторный и кластерный анализ.
Рубрика | Математика |
Вид | курс лекций |
Язык | русский |
Дата добавления | 02.10.2014 |
Размер файла | 4,0 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Из графика видно "правило 3у".
Действительно в интервал (-3у, +3у) попадает 99,7% выборки. Иными словами, то, что выходит за пределы указанного интервала нами может не рассматриваться.
На практике психолог-исследователь может рассчитывать параметры любого распределения, если единицы, которые он использовал при измерении, признаются разумными в научном сообществе.
5. Статистические гипотезы
Полученные в экспериментах выборочные данные всегда ограничены и носят в значительной мере случайный характер. Именно поэтому для анализа таких данных и используется математическая статистика, позволяющая обобщать закономерности, полученные на выборке, и распространять их на всю генеральную совокупность.
Формулирование гипотез систематизирует предположения исследователя и представляет их в четком и лаконичном виде. Благодаря гипотезам исследователь не теряет путеводной нити в процессе расчетов и ему легко понять после их окончания, что, собственно, он обнаружил.
Подчеркнем еще раз, что полученные в результате эксперимента на какой-либо выборке данные служат основанием для суждения о генеральной совокупности. Однако в силу действия случайных вероятностных причин оценка параметров генеральной совокупности, сделанная на основании экспериментальных (выборочных) данных всегда будет сопровождаться погрешностью, и поэтому подобного рода оценки должны рассматриваться как предположительные, а не как окончательные утверждения Подобные предположения о свойствах и параметрах генеральной совокупности получили название статистических гипотез.
Статистические гипотезы подразделяются на нулевые и альтернативные, направленные и ненаправленные.
Нулевая гипотеза - это гипотеза об отсутствии различий.
Она обозначается как Hо называется нулевой потому, что содержит число 0:
X1--Х2=0,
где X1, X2 - сопоставляемые значения признаков.
Нулевая гипотеза - это то, что мы хотим опровергнуть, если перед нами стоит задача доказать значимость различий.
Альтернативная гипотеза - это гипотеза о значимости различий.
Она обозначается как Н1. Альтернативная гипотеза - это то, что мы хотим доказать, поэтому иногда ее называют экспериментальной или конкурирующей гипотезой.
Бывают задачи, когда мы хотим доказать как раз незначимость различий, то есть подтвердить нулевую гипотезу. Например, если нам нужно убедиться, что разные испытуемые получают хотя и различные, но уравновешенные по трудности задания, результаты будут одинаковыми. Или что экспериментальная и контрольная выборки не различаются между собой по каким-то значимым характеристикам. Однако чаще нам все-таки требуется доказать значимость различий, ибо они более информативны для нас в поиске нового. Нулевая и альтернативная гипотезы могут быть направленными и ненаправленными.
Направленные гипотезы
H0: X1 не превышает Х2
H1: X1 превышает Х2
Ненаправленные гипотезы H0; X1 не отличается от Х2 H1: X1 отличается от Х2
Если вы заметили, что в одной из групп индивидуальные значения испытуемых по какому-либо признаку, например по социальной смелости, выше, а в другой ниже, то для проверки значимости этих различий нам необходимо сформулировать направленные гипотезы.
Если мы хотим доказать, что в группе А под влиянием каких-то экспериментальных воздействии произошли более выраженные изменения, чем в группе Б, то нам тоже необходимо сформулировать направленные гипотезы.
Если же мы хотим доказать, что различаются формы распределения признака в группе А и Б, то формулируются ненаправленные гипотезы.
При описании каждого критерия даны формулировки гипотез, которые он помогает нам проверить.
Построим схему - классификацию статистических гипотез.
Рис. 13. Статистические гипотезы
Проверка гипотез осуществляется с помощью критериев статистической оценки различий.
Статистические критерии
Статистический критерий - это решающее правило, обеспечивающее надежное поведение, то есть принятие истинной и отклонение ложной гипотезы с высокой вероятностью.
Статистические критерии обозначают также метод расчета определенного числа и само это число.
Когда мы говорим, что достоверность различий определялась по критерию ч2, то имеем в виду, что использовали метод ч 2 для расчета определенного числа.
Когда мы говорим, далее, что ч 2 = 12,676, то имеем в виду определенное число, рассчитанное, например, по методу ч2. Это число обозначается как эмпирическое значение критерия.
По соотношению эмпирического и критического значений критерия мы можем судить о том, подтверждается ли или опровергается нулевая гипотеза. Например, если ч 2эмп > ч 2кр., то Н0 отвергается.
В большинстве случаев для того, чтобы мы признали различия значимыми, необходимо, чтобы эмпирическое значение критерия превышало критическое, хотя есть критерии (например, критерий Манна-Уитни или критерий знаков), в которых мы должны придерживаться противоположного правила.
Эти правила оговариваются в описании каждого из представленных в руководстве критериев.
В некоторых случаях расчетная формула критерия включает в себя количество наблюдений в исследуемой выборке, обозначаемое как п. В этом случае эмпирическое значение критерия одновременно является тестом для проверки статистических гипотез.
Как уже отмечалось, при компьютерной обработке мы сразу получаем уровни статистической значимости, выраженные в интервале от 0 до 1,0. При этом полученные результаты корреспондируют с осями значимостиЮ приведенными ниже.
В случае ручной обработки во всех пособиях по математическим методам и математической статистике приведен ряд таблиц применительно к конкретным критериям. В этом случае по специальной таблице мы определяем, какому уровню статистической значимости различий соответствует данная эмпирическая величина. Примером такого критерия является критерий ц*, вычисляемый на основе углового преобразования Фишера.
В большинстве случаев, однако, одно и то же эмпирическое значение критерия может оказаться значимым или незначимым в зависимости от количества наблюдений в исследуемой выборке (n) или от так называемого количества степеней свободы, которое обозначается как н или как df.
Число степеней свободы V равно числу классов вариационного ряда минус число условий, при которых он был сформирован. К числу таких условий относятся объем выборки (n), средние и дисперсии.
Если мы расклассифицировали наблюдения по классам какой-либо номинативной шкалы и подсчитали количество наблюдений в каждой ячейке классификации, то мы получаем так называемый частотный вариационный ряд. Единственное условие, которое соблюдается при его формировании - объем выборки п. Допустим, у нас 3 класса: "Умеет работать на компьютере - умеет выполнять лишь определенные операции - не умеет работать на компьютере". Выборка состоит из 50 человек. Если в первый класс отнесены 20 испытуемых, во второй - тоже 20, то в третьем классе должны оказаться все остальные 10 испытуемых. Мы ограничены одним условием - объемом выборки. Поэтому даже если мы потеряли данные о том, сколько человек не умеют работать на компьютере, мы можем определить это, зная, что в первом и втором классах - по 20 испытуемых. Мы не свободны в определении количества испытуемых в третьем- разряде, "свобода" простирается только на первые две ячейки классификации:
V = c-l = 3- 1 = 2
Аналогичным образом, если бы у нас была классификация из 10 разрядов, то мы были бы свободны только в 9 из них, если бы у нас было 100 классов - то в 99 из них и т. д.
Способы более сложного подсчета числа степеней свободы при двухмерных классификациях приведены в разделах, посвященных критерию ч2 и дисперсионному анализу.
Зная п и/или число степеней свободы, мы по специальным таблицам можем определить критические значения критерия и сопоставить с ними полученное эмпирическое значение. Обычно это записывается так: "при n=22 критические значения критерия составляют ..." или "при v=2 критические значения критерия составляют ..." и т.п.
Критерии делятся на параметрические и непараметрические.
Параметрические критерии
Критерии, включающие в формулу расчета параметры распределения, то есть средние и дисперсии (t-критерий Стьюдента, критерий F и др.).
Непараметрические критерии
Критерии, не включающие в формулу расчета параметров распределения и основанные на оперировании частотами или рангами (критерий Q Розенбаума, критерий Т Вилкоксона и др.)
И те, и другие критерии имеют свои преимущества и недостатки. На основании нескольких руководств можно составить таблицу, позволяющую оценить возможности и ограничения тех и других.
Возможности и ограничения параметрических и непараметрических критериев
Параметрические критерии
1. Позволяют прямо оценить различия в средних, полученных в двух выборках (t - критерий Стьюдента).
Позволяют прямо оценить различия в дисперсиях (критерий Фишера).
Позволяют выявить тенденции изменения признака при переходе от условия к условию (дисперсионный однофакторный анализ), но лишь при условии нормального распределения признака.
Позволяют оценить взаимодействие двух и более факторов в их влиянии на изменения признака (двухфакторный дисперсионный анализ).
Экспериментальные данные должны отвечать двум, а иногда трем, условиям:
а) значения признака измерены по интервальной шкале;
б) распределение признака является нормальным;
в) в дисперсионном анализе должно соблюдаться требование равенства дисперсий в ячейках комплекса.
Математические расчеты довольно сложны.
Если условия, перечисленные в п.5, выполняются, параметрические критерии оказываются несколько более мощными, чем непараметрические.
Непараметрические критерии
1. Позволяют оценить лишь средние тенденции, например, ответить на вопрос, чаще ли в выборке А встречаются более высокие, а в выборке Б - более низкие значения признака (критерии Q, U, ц* и др.).
2. Позволяют оценить лишь различия в диапазонах вариативности признака (критерий ц*).
3. Позволяют выявить тенденции изменения признака при переходе от условия к условию при любом распределении признака (критерии тенденций L и S).
4. Эта возможность отсутствует.
5. Экспериментальные данные могут не отвечать ни одному из этих условий:
а) значения признака могут быть представлены в любой шкале, начиная от шкалы наименований;
б) распределение признака может быть любым и совпадение его с каким-либо теоретическим законом распределения необязательно и не нуждается в проверке;
в) требование равенства дисперсий отсутствует.
6. Математические расчеты по большей части просты и занимают мало времени (за исключением критериев ч2 и л). 7.Если условия, перечисленные в п. 5, не выполняются, непараметрические критерии оказываются более мощными, чем параметрические, так как они менее чувствительны к "засорениям".
Непараметрические критерии лишены всех этих ограничений и не требуют таких длительных и сложных расчетов. По сравнению с параметрическими критериями они ограничены лишь в одном - с их помощью невозможно оценить взаимодействие двух или более условий или факторов, влияющих на изменение признака. Эту задачу может решить только дисперсионный двухфакторный анализ.
Учитывая это, в настоящее руководство включены в основном непараметрические статистические критерии. В сумме они охватывают большую часть возможных задач сопоставления данных.
Уровни статистической значимости
Уровень значимости - это вероятность того, что мы сочли различия существенными, а они на самом деле случайны.
Когда мы указываем, что различия достоверны на 5%-ом уровне значимости, или при р<0,05, то мы имеем виду, что вероятность того, что они все-таки недостоверны, составляет 0,05.
Когда мы указываем, что различия достоверны на 1%-ом уровне значимости, или при р<0,01, то мы имеем в виду, что вероятность того, что они все-таки недостоверны, составляет 0,01.
Если перевести все это на более формализованный язык, то уровень значимости - это вероятность отклонения нулевой гипотезы, в то время как она верна.
Ошибка, состоящая в той, что мы отклонили нулевую гипотезу, в то время как она верна, называется ошибкой 1 рода. (См. Табл. 3)
Табл. 3. Нулевая и альтернативные гипотезы и возможные состояния проверки
Вероятность такой ошибки обычно обозначается как б. В сущности, мы должны были бы указывать в скобках не р<0,05 или р<0,01, а б<0,05 или б<0,01.
Если вероятность ошибки - это б, то вероятность правильного решения: 1--б. Чем меньше б, тем больше вероятность правильного решения.
Исторически сложилось так, что в психологии принято считать низшим уровнем статистической значимости 5%-ый уровень (р?0,05): достаточным - 1%-ый уровень (р?0,01) и высшим 0,1%-ый уровень (р?0,001), поэтому в таблицах критических значений обычно приводятся значения критериев, соответствующих уровням статистической значимости р?0,05 и р?0,01, иногда - р?0,001. Для некоторых критериев в таблицах указан точный уровень значимости их разных эмпирических значений. Например, для ц*=1,56 р=О,06.
До тех пор, однако, пока уровень статистической значимости не достигнет р=0,05, мы еще не имеем права отклонить нулевую гипотезу. Мы будем придерживаться следующего правила отклонения гипотезы об отсутствии различий (Но) и принятия гипотезы о статистической достоверности различий (Н1).
Правило отклонения Hо и принятия H1
Если эмпирическое значение критерия равняется критическому значению, соответствующему р?0,05 или превышает его, то H0 отклоняется, но мы еще не можем определенно принять H1.
Если эмпирическое значение критерия равняется критическому значению, соответствующему р?0,01 или превышает его, то H0 отклоняется и принимается Н1.
Исключения: критерий знаков G, критерий Т Вилкоксона и критерий U Манна-Уитни. Для них устанавливаются обратные соотношения.
Рис. 14. Пример "оси значимости" для критерия Q Розенбаума.
Критические значения критерия обозначены как Qо,о5 и Q0,01, эмпирическое значение критерия как Qэмп. Оно заключено в эллипс.
Вправо от критического значения Q0,01 простирается "зона значимости" - сюда попадают эмпирические значения, превышающие Q 0,01 и, следовательно, безусловно, значимые.
Влево от критического значения Q 0,05, простирается "зона незначимости", - сюда попадают эмпирические значения Q, которые ниже Q 0,05, и, следовательно, безусловно незначимы.
Мы видим, что Q0,05=6; Q0,01=9; Qэмп.=8;
Эмпирическое значение критерия попадает в область между Q0,05 и Q0,01. Это зона "неопределенности": мы уже можем отклонить гипотезу о недостоверности различий (Н0), но еще не можем принять гипотезы об их достоверности (H1).
Практически, однако, исследователь может считать достоверными уже те различия, которые не попадают в зону незначимости, заявив, что они достоверны при р<0,05, или указав точный уровень значимости полученного эмпирического значения критерия, например: р=0,02. С помощью стандартных таблиц, которые есть во всех учебниках по математическим методам это можно сделать по отношению к критериям Н Крускала-Уоллиса, ч2r Фридмана, L Пейджа, ц* Фишера.
Уровень статистической значимости или критические значения критериев определяются по-разному при проверке направленных и ненаправленных статистических гипотез.
При направленной статистической гипотезе используется односторонний критерий, при ненаправленной гипотезе - двусторонний критерий. Двусторонний критерий более строг, поскольку он проверяет различия в обе стороны, и поэтому то эмпирическое значение критерия, которое ранее соответствовало уровню значимости р<0,05, теперь соответствует лишь уровню р<0,10.
Нам не придется всякий раз самостоятельно решать, использует ли он односторонний или двухсторонний критерий. Таблицы критических значений критериев подобраны таким образом, что направленным гипотезам соответствует односторонний, а ненаправленным - двусторонний критерий, и приведенные значения удовлетворяют тем требованиям, которые предъявляются к каждому из них. Исследователю необходимо лишь следить за тем, чтобы его гипотезы совпадали по смыслу и по форме с гипотезами, предлагаемыми в описании каждого из критериев.
Мощность критериев
Мощность критерия - это его способность выявлять различия, если они есть. Иными словами, это его способность отклонить нулевую гипотезу об отсутствии различий, если она неверна.
Ошибка, состоящая в том, что мы приняли нулевую гипотезу, в то время как она неверна, называется ошибкой II рода.
Вероятность такой ошибки обозначается как в. Мощность критерия - это его способность не допустить ошибку II рода, поэтому:
Мощность=1--в
Мощность критерия определяется эмпирическим путем. Одни и те же задачи могут быть решены с помощью разных критериев, при этом обнаруживается, что некоторые критерии позволяют выявить различия там, где другие оказываются неспособными это сделать, или выявляют более высокий уровень значимости различий. Возникает вопрос: а зачем же тогда использовать менее мощные критерии? Дело в том, что основанием для выбора критерия может быть не только мощность, но и другие его характеристики, а именно:
а) простота;
б) более широкий диапазон использования (например, по отношению к данным, определенным по номинативной шкале, или по отношению к большим n);
в) применимость по отношению к неравным по объему выборкам;
г) большая информативность результатов.
Отметим, что при компьютерной обработке нам, как правило, представляют на выбор ряд критериев (например: критерий знаков, критерий Вилкоксона, критерий Мак-Немары - при этом, по умолчанию указан критерий Вилкоксона).
Классификация задач и методов их решения
Множество задач психологического исследования предполагает те или иные сопоставления. Мы сопоставляем группы испытуемых по какому-либо признаку, чтобы выявить различия между ними по этому признаку. Мы сопоставляем то, что было "до" с тем, что стало "после" наших экспериментальных или любых иных воздействий, чтобы определить эффективность этих воздействий. Мы сопоставляем эмпирическое распределение значений признака с каким-либо теоретическим законом распределения или два эмпирических распределения между собой, с тем, чтобы доказать неслучайность выбора альтернатив или различия в форме распределений.
Мы, далее, можем сопоставлять два признака, измеренные на одной и той же выборке испытуемых, для того, чтобы установить степень согласованности их изменений, их сопряженность, корреляцию между ними.
Наконец, мы можем сопоставлять индивидуальные значения, полученные при разных комбинациях каких-либо существенных условий, с тем, чтобы выявить характер взаимодействия этих условий в их влиянии на индивидуальные значения признака.
Именно эти задачи позволяет решить тот набор методов, который предлагается настоящим руководством. Все эти методы могут быть использованы при так называемой "ручной" обработке данных.
Принятие решения о выборе метода математической обработки
Если данные уже получены, то вам предлагается следующий алгоритм определения задачи и метода.
Принятие решения о задаче и методе обработки на стадии, когда данные уже получены
Определить, какая из задач стоит в вашем исследовании.
Определить, каковы условия решения вашей задачи, например, сколько выборок обследовано или на какое количество групп вы можете разделить обследованную выборку.
Если вы еще находитесь на стадии планирования исследования, то лучшее заранее подобрать математическую модель, которую вы будете в дальнейшем использовать. Особенно необходимо планирование в тех случаях, когда в перспективе предполагается использование критериев тенденций или (в еще большей степени) дисперсионного анализа. В этом случае алгоритм принятия решения таков.
Алгоритм
Принятие решения о задаче и методе обработка на стадии планирования исследования
Определите, какая модель вам кажется наиболее подходящей для доказательства ваших научных предположений.
Внимательно ознакомьтесь с описанием метода, примерами и задачами для самостоятельного решения, которые к нему прилагаются.
Если вы убедились, что это то, что вам нужно, вернитесь к разделу "Ограничения критерия" и решите, сможете ли вы собрать данные, которые будут отвечать этим ограничениям (большие объемы выборок, наличие не скольких выборок, монотонно различающихся по какому-либо признаку, например, по возрасту и т.п.).
Проводите исследование, а затем обрабатывайте полученные данные по заранее выбранному алгоритму, если вам удалось выполнить ограничения.
В описании каждого критерия сохраняется следующая последовательность изложения:
назначение критерия;
описание критерия;
гипотезы, которые он позволяет проверить;
графическое представление критерия;
ограничения критерия;
пример или примеры.
Кроме того, для каждого критерия может быть создан алгоритм расчетов.
Если критерий сразу удобнее рассчитывать по алгоритму, то он приводится в разделе "Пример"; если алгоритм легче можно воспринять уже после рассмотрения примера, то он приводится в конце параграфа, соответствующего данному критерию.
6. Выявление различий в уровне исследуемого признака
Обоснование задачи сопоставления и сравнения
Очень часто перед исследователем в психологии стоит задача выявления различий между двумя, тремя и более выборками испытуемых. Это может быть, например, задача определения психологических особенностей хронически больных детей по сравнению со здоровыми, юных правонарушителей по сравнению с законопослушными сверстниками или различий между работниками государственных предприятий и частных фирм, между людьми разной национальности или разной культуры и, наконец, между людьми разного возраста в методе "поперечных срезов".
Иногда по выявленным в исследовании статистически достоверным различиям формируется "групповой профиль" или "усредненный портрет" человека той или иной профессии, статуса, соматического заболевания и др.
В последние годы все чаще встает задача выявления психологического портрета специалиста новых профессий: "успешного менеджера", "успешного политика", "успешного торгового представителя", "успешного коммерческого директора" и др. Такого рода исследования не всегда подразумевают участие двух или более выборок. Иногда обследуется одна, но достаточно представительная выборка численностью не менее 60 человек, а затем внутри, этой выборки выделяются группы более и менее успешных специалистов, и их данные по исследованным переменным сопоставляются между собой. В самом простом случае критерием для разделения выборки на "успешных" и "неуспешных-" будет средняя величина по показателю успешности. Однако такое деление является довольно грубым: лица, получившие близкие оценки по успешности, могут оказаться в противоположных группах, а лица, заметно различающиеся по оценкам успешности, - в одной и той же группе. Это может исказить результаты сопоставления групп или, по крайней мере, сделать различия между группами менее заметными.
Чтобы избежать этого, можно попробовать выделить группы "успешных" и "неуспешных" специалистов более строго, включая в первую из них только тех, чьи значения превышают среднюю величину не менее чем на 1/4 стандартного отклонения, а во вторую группу - только тех, чьи значения не менее чем на 1/4 стандартного отклонения ниже средней величины. При этом все, кто оказывается в зоне средних величин, М±1/4у, выпадают из дальнейших сопоставлений. Если распределение близко к нормальному, то выпадет примерно 19,8% испытуемых. Если распределение отличается от нормального, то таких испытуемых может быть и больше. Чтобы избежать потерь, можно сопоставлять не две, а три группы испытуемых: с высокой, средней и низкой профессиональной успешностью.
Рис. 15. Схематическое изображение процесса разделения выборки на группы с низкой, средней и высокой профессиональной успешностью.
На Рис.1 представлена схема разделения выборки на группы с низкой, средней и высокой профессиональной успешностью по критерию отклонения значений от средней величины на 1/2 стандартного отклонения. При таком строгом критерии в "среднюю" группу попадают (при нормальном распределении) около 38,2% всех испытуемых, а в крайних группах оказывается по 30,9% испытуемых.
Чем меньше испытуемых оказывается в группах, тем меньше у нас возможностей для выявления достоверных различий, так как критические значения большинства критериев при малых n строже, чем при больших n.
Таким образом, при нестрогом разделении испытуемых на группы мы теряем в точности, а при строгом - в количестве испытуемых.
При решении задач выявления различий в уровневых показателях следует помнить, что "усредненный профиль успешного специалиста" должен рассматриваться скорее как исследовательский результат, позволяющий сформулировать гипотезы для дальнейших исследований, а не как основание для профессионального отбора. Тому есть две причины.
Во-первых, ни у одного из успешных специалистов может не наблюдаться "усредненный профиль" - он, в сущности, является отвлеченным обобщением;
во-вторых, в профессиональной деятельности наличие собственного индивидуального стиля важнее соответствия "средне групповому" профилю. Недостаток в тех качествах, которые могут казаться важными, компенсируется другими качествами. У каждого успешного специалиста его психологические свойства создают неповторимый ансамбль, который при усреднении данных теряется.
Р.Б. Кеттелл, учитывая это, предлагал при исследовании профессиональной успешности включать в рассмотрение индивидуальные профили выдающихся представителей той или иной профессии.
Сопоставление уровневых показателей в разных выборках может быть необходимой частью комплексных диагностических, учебных, психо коррекционных и иных программ. Оно помогает нам обратить внимание на те особенности обследованных выборок, которые должны быть учтены и использованы при адаптации программ к данной группе в процессе их конкретного воплощения.
Критерии, которые рассматриваются в данной главе, предполагают, что мы сопоставляем так называемые независимые выборки, то есть две или более выборки, состоящие из разных испытуемых. Тот испытуемый, который входит в одну выборку, уже не может входить в другую. В противоположность этому, если мы обследуем одну и ту же выборку испытуемых, несколько раз подвергая её аналогичным измерениям ("замерам"), то перед нами - так называемые связанные, или зависимые, выборки данных. Сопоставление 2-х или более замеров, полученных на одной и той же выборке, рассматривается в Теме 4.
Решение о выборе того или иного критерия принимается на основе того, сколько выборок сопоставляется и каков их объем.
Q - критерий Розенбаума
Назначение критерия
Критерий используется для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. В каждой из выборок должно быть не менее 11 испытуемых.
Описание критерия
Это очень простой непараметрический критерий, который позволяет быстро оценить различия между двумя выборками по какому-либо признаку. Однако если критерий Q не выявляет достоверных различий, это еще не означает, что их действительно нет.
В этом случае стоит применить критерий ц* Фишера. Если же Q-критерии выявляет достоверные различия между выборками с уровнем значимости р<0,01, можно ограничиться только им и избежать трудностей применения других критериев.
Критерий применяется в тех случаях, когда данные представлены по крайней мере в порядковой шкале. Признак должен варьировать в каком-то диапазоне значений, иначе сопоставления с помощью Q -критерия просто невозможны. Например, если у нас только 3 значения признака, 1, 2 и 3, - нам очень трудно будет установить различия. Метод Розенбаума требует, следовательно, достаточно тонко измеренных признаков.
Применение критерия начинаем с того, что упорядочиваем значения признака в обеих выборках по нарастанию (или убыванию) признака. Лучше всего, если данные каждого испытуемого представлены на отдельной карточке. Тогда ничего не стоит упорядочить два ряда значении по интересующему нас признаку, раскладывая карточки на столе. Так мы сразу увидим, совпадают ли диапазоны значений, и если нет, то насколько один ряд значений "выше" (S1), а второй - "ниже" (S2).
Для того, чтобы не запутаться, в этом и во многих других критериях рекомендуется первым рядом (выборкой, группой) считать тот ряд, где значения выше, а вторым рядом - тот, где значения ниже.
Гипотезы
Н0: Уровень признака в выборке 1 не превышает уровня признака в выборке 2.
H1: Уровень признака в выборке 1 превышает уровень признака в выборке 2.
Графическое представление критерия Q
На Рис. 16. представлены три варианта соотношения рядов значений в двух выборках. В варианте (а) все значения первого ряда выше всех значений второго ряда. Различия, безусловно, достоверны, при соблюдении условия, что n1,n2 > 11.
В варианте (б), напротив, оба ряда находятся на одном и том же уровне: различия недостоверны. В варианте (в) ряды частично перекрещиваются, но все же первый ряд оказывается гораздо выше второго. Достаточно ли велики зоны S1 и S2, в сумме составляющие Q, можно определить по Таблице, в которой приведены критические значения Q для разных n. Чем величина Q больше, тем более достоверные различия мы сможем констатировать.
Рис. 16. Возможные соотношения рядов значений в двух выборках:
*S1 - зона значений 1-го ряда, которые выше максимального значения 2-го ряда;
*S2 - зона значений второго ряда, которые меньше минимального значения 1-го ряда;
*штриховкой отмечены перекрещивающиеся зоны двух рядов
Ограничения критерия Q
1. В каждой из сопоставляемых выборок должно быть не менее 11 наблюдений.
При этом объемы выборок должны примерно совпадать. Е.В. Гублером указываются следующие правила:
а) если в обеих выборках меньше 50 наблюдений, то абсолютная величина разности между n1 и n2 не должна быть больше 10 наблюдений;
б) если в каждой из выборок больше 51 наблюдения, но меньше 100, то абсолютная величина разности между n1 и n2 не должна быть больше 20 наблюдений;
в) если в каждой из выборок больше 100 наблюдений, то допускается, чтобы одна из выборок была больше другой не более чем в 1,5-2 раза.
2. Диапазоны разброса значений в двух выборках должны не совпадать между собой, в противном случае применение критерия бессмысленно. Между тем, возможны случаи, когда диапазоны разброса значений совпадают, но, вследствие разносторонней асимметрии двух распределений, различия в средних величинах признаков существенны (Рис. 17,18).
Рис. 17. Вариант соотношения распределений признака в двух выборках, при котором критерий Q беспомощен
Рис. 18. Вариант соотношения распределений признака в двух выборках, при котором критерий Q может быть мощным.
Пример
У предполагаемых участников психологического эксперимента, моделирующего деятельность воздушного диспетчера, был измерен уровень вербального и невербального интеллекта с помощью методики Д. Векслера. Было обследовано 26 юношей в возрасте от 18 до 24 лет (средний возраст 20,5 лет). 14 из них были студентами физического факультета, а 12 - студентами психологического факультета Ленинградского университета (Сидоренко Е.В., 1978). Показатели вербального интеллекта представлены в Табл. 4.
Можно ли утверждать, что одна из групп превосходит другую по уровню вербального интеллекта?
Таблица 4
Индивидуальные значения вербального интеллекта в выборках студентов физического (n1=14) и психологического (п2 =12) факультетов
Студенты физики |
Студенты психолог |
|||||
Код имени |
Показатели вербального интеллекта |
Код имени |
Показатель вербального интеллекта |
|||
испытуемого |
испытуемого |
|||||
1. |
И.А |
132 |
1. |
Н.Т. |
126 |
|
2. |
К.А. |
134 |
2. |
О.В. |
127 |
|
3. |
К.Е. |
124 |
3. |
Е.В. |
132 |
|
4. |
П.А. |
132 |
4. |
Ф.О. |
120 |
|
5. |
С.А. |
135 |
5. |
И.Н. |
119 |
|
6. |
СтЛ. |
132 |
6. |
И.Ч. |
126 |
|
7. |
Т.А. |
131 |
7. |
И.8. |
120 |
|
8. |
Ф.А. |
132 |
8. |
КО. |
123 |
|
9. |
Ч.И. |
121 |
9. |
Р.Р. |
120 |
|
10. |
Ц.А. |
127 |
10. |
Р.И. |
116 |
|
11. |
См.А. |
136 |
11. |
O.K. |
123 |
|
12. |
КАн. |
129 |
12. |
Н.К. |
115 |
|
13. |
Б.Л. |
136 |
||||
14. |
Ф.В. |
136 |
Упорядочим значения в обеих выборках, а затем сформулируем гипотезы:
H0: Студенты-физики не превосходят студентов-психологов по уровню вербального интеллекта.
H1: Студенты-физики превосходят студентов-психологов по уровню вербального интеллекта.
р а при Q9Mn<Q
мы
1(p
Таблица 5
Упорядоченные по убыванию вербального интеллекта ряды
индивидуальных значении в двух студенческих выборках
1 ряд - студенты-физики |
2 ряд - студенты-психологи |
||||||||
1 |
См.А |
136 |
S1 |
||||||
2 |
Б.Л. |
136 |
|||||||
3 |
Ф.В. |
136 |
|||||||
4 |
С.А. |
135 |
|||||||
5 |
К.А. |
134 |
|||||||
6 |
И.К. |
132 |
1 |
Е.В. |
132 |
||||
7 |
П.А. |
132 |
|||||||
8 |
Ст.А. |
132 |
|||||||
9 |
Ф.А. |
132 |
|||||||
10 |
Т.А. |
131 |
|||||||
11 |
К.Ан. |
129 |
|||||||
12 |
Ц.А. |
127 |
2 |
О.В. |
127 |
||||
3 |
Н.Т. |
126 |
|||||||
4 |
И.Ч. |
126 |
|||||||
13 |
К.Е. |
124 |
|||||||
5 |
К.О. |
123 |
|||||||
6 |
О.К. |
123 |
|||||||
14 |
Ч.И. |
121 |
|||||||
S2 |
7 |
Ф.О. |
120 |
||||||
8 |
И.В. |
120 |
|||||||
9 |
Р.Р. |
120 |
|||||||
10 |
И.Н. |
119 |
|||||||
11 |
Р.И. |
116 |
|||||||
12 |
Н.К. |
115 |
Как видно из Табл. 5, мы правильно обозначили ряды: первый, тот, что "выше" - ряд физиков, а второй, тот, что "ниже" - ряд психологов.
По Табл. 5 определяем количество значений первого ряда, которые больше максимального значения второго ряда: S1=5.
Теперь определяем количество значений второго ряда, которые меньше минимального значения первого ряда: S2=6.
Вычисляем Qэмп по формуле:
Qэмп = S1 + S2 = 5+6 =11
По Табл. определяем критические значения Q для n1=14, n2=12:
Qкр=
Ясно, что чем больше расхождения между выборками, тем больше величина Q. Н0 отклоняется при Qэмп ?Qкр, а при Qэмп < Qкр мы будем вынуждены принять Н0.
Qэмп > Qкр (p?0.01)
Ответ: H0 отклоняется.
Принимается H1. Студенты-физики превосходят студентов-психологов по уровню вербального интеллекта (р<0,01). Отметим, что в тех случаях, когда эмпирическая величина критерия оказывается на границе зоны незначимости, мы имеем право утверждать лишь, что различия достоверны при р<0,05, если же оно оказывается между двумя критическими значениями, то мы можем утверждать, что р< 0,05.
Если эмпирическое значение критерия оказывается на границе, мы можем утверждать, что р< 0,01, если оно попадает в зону значимости, мы можем утверждать, что р< 0,01.
Поскольку уровень значимости выявленных различий достаточно высок (р<0,01), мы могли бы на этом остановиться. Однако если исследователь сам психолог, а не физик, вряд ли он на этом остановится. Он может попробовать сопоставить выборки по уровню невербального интеллекта, поскольку именно невербальный интеллект определяет уровень интеллекта в целом и степень его организованности.
Мы вернемся к этому примеру при рассмотрении критерия Манна-Уитни и попытаемся ответить на вопрос о соотношении уровней невербального интеллекта в двух выборках. Быть может, психологи еще окажутся в более высоком ряду!
Алгоритм
Подсчет критерия Q Розенбаума
Проверить, выполняются ли ограничения: n1, n2 ? 11, n1 ? n2
Упорядочить значения отдельно в каждой выборке по степени возрастания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше, а выборкой 2 - ту, где значения предположительно ниже.
Определить самое высокое (максимальное) значение в выборке 2.
Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину как S1.
Определить самое низкое (минимальное) значение в выборке 1.
Подсчитать количество значений в выборке 2, которые ниже минимального значения выборки 1. Обозначить полученную величину как S2.
Подсчитать эмпирическое значение Q по формуле:
Q=S1+S2.
По Табл. Для критерия Розенбаума определить критические значения Q для данных n1, и n2. Если Qэмп равно Q0,05 или превышает его, Н0 отвергается.
При n1, n2 >26 сопоставить полученное эмпирическое значение с Qкр =8 (р?0,05) и QKp=10(p?0,01). Если Qэмп превышает или по крайней мере равняется Qкр=8, H0 отвергается.
U - критерий Манна-Уитнн
Назначение критерия
Критерий предназначен для оценки различий между двумя выборками по уровню какого-либо признака, количественно измеренного. Он позволяет выявлять различия между малыми выборками, когда n1,n2 ?3 или n1=2, n2?5. И является более мощным, чем критерий Розенбаума.
Описание критерия
Существует несколько способов использования критерия и несколько вариантов таблиц критических значений, соответствующих этим способам.
Этот метод определяет, достаточно ли мала зона перекрещивающихся значений между двумя рядами. Мы помним, что 1-м рядом (выборкой, группой) мы называем тот ряд значений, в котором значения, по предварительной оценке, выше, а 2-м рядом - тот, где они предположительно ниже.
Чем меньше область перекрещивающихся значений, тем более вероятно, что различия достоверны. Иногда эти различия называют различиями в расположении двух выборок.
Эмпирическое значение критерия U отражает то, насколько велика зона совпадения между рядами. Поэтому чем меньше Uэмп, тем более вероятно, что различия достоверны.
Гипотезы
H0: Уровень признака в группе 2 не ниже уровня признака в группе 1.
H1: Уровень признака в группе 2 ниже уровня признака в группе 1.
Графическое представление критерия U
На Рис. 19. представлены три из множества возможных вариантов соотношения двух рядов значений.
В варианте (а) второй ряд ниже первого, и ряды почти не перекрещиваются. Область наложения слишком мала, чтобы скрадывать различия между рядами. Есть шанс, что различия между ними достоверны. Точно определить это мы сможем с помощью критерия U.
В варианте (б) второй ряд тоже ниже первого, но и область перекрещивающихся значений у двух рядов достаточно обширна. Она может еще не достигать критической величины, когда различия придется признать несущественными. Но так ли это, можно определить только путем точного подсчета критерия U.
В варианте (в) второй ряд ниже первого, но область наложения настолько обширна, что различия между рядами скрадываются.
Рис. 19. Возможные варианты соотношении рядов значений в двух выборках; штриховкой обозначены зоны наложения
Ограничения критерия U
1. В каждой выборке должно быть не менее 3 наблюдении:
n1,n2 ?3; допускается, чтобы в одной выборке было 2 наблюдения, но тогда во второй их должно быть не менее 5.
2. В каждой выборке должно быть не более 60 наблюдений; Однако уже при n1,n2 >20 ранжирование становится достаточно трудоемким (что при компьютерной обработке не является критичным).
Пример
Вернемся к результатам обследования студентов физического и психологического факультетов Ленинградского университета с помощью методики Д. Векслера для измерения вербального и невербального интеллекта. С помощью критерия Q Розенбаума мы в предыдущем параграфе смогли с высоким уровнем значимости определить, что уровень вербального интеллекта в выборке студентов физического факультета выше. Попытаемся установить теперь, воспроизводится ли этот результат при сопоставлении выборок по уровню невербального интеллекта. Данные приведены в Табл. 3.
Можно ли утверждать, что одна из выборок превосходит другую по уровню невербального интеллекта?
Таблица 6
Индивидуальные значения невербального интеллекта в выборках студентов физического (n1 =14) и психологического (n2=12) факультетов
Студенты физики |
Студенты психолог |
|||||
Код имени |
Показатели невербального интеллекта |
Код имени |
Показатель невербального |
|||
испытуемого |
испытуемого |
интеллекта |
||||
1. |
И.А |
111 |
1. |
Н.Т. |
113 |
|
2. |
К.А. |
104 |
2. |
О.В. |
107 |
|
3. |
К.Е. |
107 |
3. |
Е.В. |
123 |
|
4. |
П.А. |
90 |
4. |
Ф.О. |
122 |
|
5. |
С.А. |
115 |
5. |
И.Н. |
117 |
|
6. |
СтЛ. |
107 |
6. |
И.Ч. |
112 |
|
7. |
Т.А. |
106 |
7. |
И.8. |
105 |
|
8. |
Ф.А. |
107 |
8. |
КО. |
108 |
|
9. |
Ч.И. |
95 |
9. |
Р.Р. |
111 |
|
10. |
Ц.А. |
116 |
10. |
Р.И. |
114 |
|
11. |
См.А. |
127 |
11. |
O.K. |
102 |
|
12. |
КАн. |
115 |
12. |
Н.К. |
104 |
|
13. |
Б.Л. |
102 |
||||
14. |
Ф.В. |
99 |
Критерий U требует тщательности и внимания. Прежде всего, необходимо помнить правила ранжирования.
Правила ранжирования
1. Меньшему значению начисляется меньший ранг.
Наименьшему значению начисляется ранг 1.
Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. Например, если п=7, то наибольшее значение получит ранг 7, за возможным исключением для тех случаев, которые предусмотрены правилом 2.
2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны.
Например, 3 наименьших значения равны 10 секундам. Если бы мы измеряли время более точно, то эти значения могли бы различаться и составляли бы, скажем, 10,2 сек; 10,5 сек; 10,7 сек. В этом случае они получили бы ранги, соответственно, 1, 2 и 3. Но поскольку полученные нами значения равны, каждое из них получает средний ранг:
Допустим, следующие 2 значения равны 12 сек. Они должны были бы получить ранги 4 и 5, но, поскольку они равны, то получают средний ранг:
и т.д.
3. Общая сумма рангов должка совпадать с расчетной, которая определяется по формуле:
где N - общее количество ранжируемых наблюдений (значений).
Несовпадение реальной и расчётной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. Прежде чем продолжить работу, необходимо найти ошибку и устранить её.
При компьютерной обработке данные использования критерия Манна-Уитни не вызывают трудностей.
После обработки данных можно сформулировать гипотезы:
H0: Группа студентов-психологов не превосходит группу студентов-физиков по уровню невербального интеллекта.
H1: Группа студентов-психологов превосходит группу студентов-физиков по уровню невербального интеллекта.
В соответствии со следующим шагом алгоритма определяем эмпирическую величину U:
Поскольку в нашем случае n1 не равно n2 подсчитаем эмпирическую величину U и для второй ранговой суммы (165), подставляя в формулу соответствующее ей пх:
Мы помним, что критерий U является одним из двух исключений из общего правила принятия решения о достоверности различий, а именно, мы можем констатировать достоверные различия, если
Построим "ось значимости".
Рисунок 20
Uэмп >Uкр
Ответ: Н0 принимается. Группа студентов-психологов не превосходит группы студентов-физиков по уровню невербального интеллекта.
Обратим внимание на то, что для данного случая критерий Q Розенбаума неприменим, так как размах вариативности в группе физиков шире, чем в группе психологов: и самое высокое, и самое низкое значение невербального интеллекта приходится на группу физиков.
Н - критерий Крускала-Уоллиса
Назначение критерия
Критерий предназначен для оценки различий одновременно между тремя, четырьмя и т.д. выборками по уровню какого-либо признака.
Он позволяет установить, что уровень признака изменяется при переходе от группы к группе, но не указывает на направление этих изменений.
Описание критерия
Критерий Н иногда рассматривается как непараметрический аналог метода дисперсионного однофакторного анализа для несвязных.
Данный критерий является продолжением критерия U на большее, чем 2, количество сопоставляемых выборок. Все индивидуальные значения ранжируются так, как если бы это была одна большая выборка. Затем все индивидуальные значения возвращаются в свои первоначальные выборки, и мы подсчитываем суммы полученных ими рангов отдельно по каждой выборке. Если различия между выборками случайны, суммы рангов не будут различаться сколько-нибудь существенно, так как высокие и низкие ранги равномерно распределятся между выборками. Но если в одной из выборок будут преобладать низкие значения рангов, в другой - высокие, а в третьей - средние, то критерий Н позволит установить эти различия.
Гипотезы
H0: Между выборками 1, 2, 3 и т.д. существуют лишь случайные различия по уровню исследуемого признака.
H1: Между выборками 1, 2, 3 и т.д. существуют неслучайные различия по уровню исследуемого признака.
Графическое представление критерия Н
Критерий Н оценивает общую сумму перекрещивающихся зон при сопоставлении всех обследованных выборок. Если суммарная область наложения мала (Рис. 20 (а)), то различия достоверны; если она достигает определенной критической величины и превосходит ее (Рис. 20 (б)), то различия между выборками оказываются недостоверными.
Рис. 21. Возможные варианты соотношения рядов значений в трех выборках; штриховкой отмечены зоны наложения
Ограничения критерия Н
При сопоставлении 3-х выборок допускается, чтобы в одной из них n=3, а двух других п=2. Но при таких численных составах выборок мы сможем установить различия лишь на низшем уровне значимости (Р?0,05).
Для того, чтобы оказалось возможным диагностировать различия на более высоком уровнем значимости (р?0,01), необходимо, чтобы в каждой выборке было не менее 3 наблюдений, или чтобы по крайней мере в одной из них было 4 наблюдения, а в двух других - по 2; при этом неважно, в какой именно выборке сколько испытуемых, а важно соотношение 4:2:2.
Критические значения критерия Н и соответствующие им уровни значимости приведены в Табл. IV Приложения 1. Таблица предусмотрена только для трех выборок и (n1, n2, n3)?5.
При большем количестве выборок и испытуемых в каждой выборке необходимо пользоваться Таблицей критических значений критерия ч2, поскольку критерий Крускала-Уоллиса асимптотически приближается к распределению ч 2 (Носенко И.А., 1981; J. Greene, M. DOlivera, 1982).
Количество степеней свободы при этом определяется по формуле:
v=c-l
где с - количество сопоставляемых выборок.
3. При множественном сопоставлении выборок достоверные различия между какой-либо конкретной парой (или парами) их могут оказаться стертыми. Это ограничение можно преодолеть, если провести все возможные попарные сопоставления, число которых будет равняться Ѕ*[c*(c-1)]*1. Для таких попарных сопоставлений используется, естественно, критерий для двух выборок, например U или ц*.
Пример
В эксперименте по исследованию интеллектуальной настойчивости (Е.В. Сидоренко, 1984) 22 испытуемым предъявлялись сначала разрешимые четырехбуквенные, пятибуквенные и шестибуквенные анаграммы, а затем неразрешимые анаграммы, время работы над которыми не ограничивалось. Эксперимент проводился индивидуально с каждым испытуемым. Использовалось 4 комплекта анаграмм. У исследователя возникло впечатление, что над некоторыми неразрешимыми анаграммами испытуемые продолжали работать дольше, чем над другими, и, возможно, необходимо будет делать поправку на то, какая именно неразрешимая анаграмма предъявлялась тому или иному испытуемому. Показатели длительности попыток в решении неразрешимых анаграмм представлены в Табл. 2.5. Все испытуемые были юношами-студентами технического вуза в возрасте от 20 до 22 лет.
Можно ли утверждать, что длительность попыток решения каждой из 4 неразрешимых анаграмм примерно одинакова?
Таблица 7
Показатели длительности попыток решения 4 неразрешимых анаграмм в секундах (N=22)
Группа 1: анаграмма |
Группа 2: анаграмма |
Группа 3: анаграмма |
Группа 4: анаграмма |
||
ФОЛИТОН (n1=4) |
КАМУСТО (n2=8) |
СНЕРАКО (n3=6) |
ГРУТОСИЛ (n4=4) |
||
1 |
145 |
145 |
128 |
60 |
|
2 |
194 |
210 |
283 |
2361 |
|
3 |
731 |
236 |
469 |
2416 |
|
4 |
1200 |
385 |
482 |
3600 |
|
5 |
720 |
1678 |
|||
б |
848 |
2081 |
|||
7 |
905 |
||||
8 |
1080 |
||||
Сум-мы |
2270 |
4549 |
5121 |
8437 |
|
Сред-ние |
568 |
566 |
854 |
2109 |
Сформулируем гипотезы.
Н0: 4 группы испытуемых, получившие разные неразрешимые анаграммы, не различаются по длительности попыток их решения.
H1: 4 группы испытуемых, получившие разные неразрешимые анаграммы, различаются по длительности попыток их решения.
Теперь познакомимся с алгоритмом расчетов.
Алгоритм
Подсчет критерия Н Крускала-Уоллиса
Перенести все показатели испытуемых на индивидуальные карточки.
Пометить карточки испытуемых группы 1 определенным цветом, например, красным, карточки испытуемых группы 2 - синим, карточки испытуемых групп 3 и 4 - соответственно, зеленым к желтым цветом и т. д. (Можно использовать, естественно, и любые другие обозначения.)
Разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой группе относятся карточки, как если бы мы работали с одной объединенной выборкой.
Проранжкровать значения на карточках, приписывая меньшему значению меньший ранг. Надписать на каждой карточке ее ранг. Общее количество рангов будет равняться количеству испытуемых в объединенной выборке.
Вновь разложить карточки по группам, ориентируясь на цветные или другие принятые обозначения.
Подсчитать суммы рангов отдельно по каждой группе. Проверить совпадение общей суммы рангов с расчетной.
Подсчитать значение критерия Н по формуле:
где N- общее количество испытуемых в объединенной выборке;
п - количество испытуемых в каждой группе;
Т- суммы рангов по каждой группе.
8а. При количестве групп с=3, n1,n2,n3 ?5, определить критические значения и соответствующий им уровень значимости по Табл.
Если Нэмп равен или превышает критическое значение H0,05 H0 отвергается.
'с - количество выборок.
8б. При количестве групп с>3 или количестве испытуемых n1,n2,n3 ?5 определить критические значения ч2 по Таблице.
Если Нэмп равен или превышает критическое значение ч2, Но отвергается.
S - критерий тенденций Джонкира
Назначение критерия S
Критерий S предназначен для выявления тенденций изменения признака при переходе от выборки к выборке при сопоставлении трех и более выборок.
Описание критерия S
Критерий S позволяет нам упорядочить обследованные выборки по какому-либо признаку, например, по креативности, фрустрацноннон толерантности, гибкости и т.п.
Мы сможем утверждать, что на перво...
Подобные документы
Основные этапы обработки данных натуральных наблюдений методом математической статистики. Оценка полученных результатов, их использование при принятии управленческих решений в области охраны природы и природопользования. Проверка статистических гипотез.
практическая работа [132,1 K], добавлен 24.05.2013Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.
курсовая работа [215,1 K], добавлен 13.12.2014Основные методы формализованного описания и анализа случайных явлений, обработки и анализа результатов физических и численных экспериментов теории вероятности. Основные понятия и аксиомы теории вероятности. Базовые понятия математической статистики.
курс лекций [1,1 M], добавлен 08.04.2011Предмет, методы и понятия математической статистики, ее взаимосвязь с теорией вероятности. Основные понятия выборочного метода. Характеристика эмпирической функции распределения. Понятие гистограммы, принцип ее построения. Выборочное распределение.
учебное пособие [279,6 K], добавлен 24.04.2009Теория вероятности, понятие вероятности события и её классификация. Понятие комбинаторики и её основные правила. Теоремы умножения вероятностей. Понятие и виды случайных величин. Задачи математической статистики. Расчёт коэффициента корреляции.
шпаргалка [945,2 K], добавлен 18.06.2012Программа курса, основные понятия и формулы теории вероятностей, их обоснование и значение. Место и роль математической статистики в дисциплине. Примеры и разъяснения по решению самых распространенных задач по различным темам данных учебных дисциплин.
методичка [574,5 K], добавлен 15.01.2010Числовые характеристики выборки. Статистический ряд и функция распределения. Понятие и графическое представление статистической совокупности. Метод наибольшего правдоподобия для нахождения плотности распределения. Применение метода наименьших квадратов.
контрольная работа [62,6 K], добавлен 20.02.2011Понятие, происхождение и предмет статистики с точки зрения современной науки и практики; стадии и методы статистического исследования, математическая составляющая. Метод главных компонент, его применение. Закон больших чисел, парадокс сэра Гиффена.
курсовая работа [955,2 K], добавлен 17.05.2012Оценки параметров распределения, наиболее важные распределения, применяемые в математической статистике: нормальное распределение, распределения Пирсона, Стьюдента, Фишера. Факторное пространство, формулирование цели эксперимента и выбор откликов.
реферат [105,5 K], добавлен 01.01.2011Правила выполнения и оформления контрольных работ для заочного отделения. Задания и примеры решения задач по математической статистике и теории вероятности. Таблицы справочных данных распределений, плотность стандартного нормального распределения.
методичка [250,6 K], добавлен 29.11.2009Что такое абсолютные и относительные величины. Применение абсолютной и относительной величины в статистике. Прикладные варианты использования методов математической статистики в различных случаях решения задач. Опыт построения статистических таблиц.
контрольная работа [39,6 K], добавлен 12.12.2009Предмет, методы и задачи социально-экономической статистики - система показателей, основные группировки и классификации. Статистическое изучение численности населения, источники статистической информации о населении. Уравнение демографического баланса.
шпаргалка [516,4 K], добавлен 06.04.2008Исследование методики математической обработки многократно усеченной информации. Особенности графического изображения опытной информации. Определение среднего значения показателя надежности, абсолютной характеристики рассеивания и коэффициента вариации.
курсовая работа [116,1 K], добавлен 16.01.2014Значение математической статистики для анализа закономерностей массовых явлений. Основные теоретические выкладки корреляционного анализа. Применение его инструментария в контексте металлургической промышленности в среде программного средства Statistica 6.
реферат [261,4 K], добавлен 03.08.2014Предмет и метод математической статистики. Распределение непрерывной случайной величины с точки зрения теории вероятности на примере логарифмически-нормального распределения. Расчет корреляции величин и нахождение линейной зависимости случайных величин.
курсовая работа [988,5 K], добавлен 19.01.2011Частота встречаемости зарубежных и отечественных фильмов на сайте Megogo.net. Теоретическое описание фильмов сайта. Популярность "отечественных" фильмов. Сравнение размаха количества просмотренных фильмов отечественного и зарубежного производства.
курсовая работа [239,3 K], добавлен 08.12.2015Формы, виды и способы статистического наблюдения. Виды группировок, их интервал и частота. Структура ряда динамики. Абсолютные и относительные статистические величины. Представление выборки в виде статистического ряда. Точечное и интервальное оценивание.
курс лекций [1,1 M], добавлен 29.11.2013Словесная, математическая постановка исходной задачи. Исследование математической задачи на корректность. Применение метода экспертных оценок и парных сравнений основных объективных, субъективных факторов, послуживших причиной к поступлению учиться в МАИ.
курсовая работа [145,1 K], добавлен 19.12.2009Классификация случайных событий. Функция распределения. Числовые характеристики дискретных случайных величин. Закон равномерного распределения вероятностей. Распределение Стьюдента. Задачи математической статистики. Оценки параметров совокупности.
лекция [387,7 K], добавлен 12.12.2011Методы регистрации, описания и анализа статистических экспериментальных данных, получаемых в результате наблюдения массовых случайных явлений. Обзор задач математической статистики. Закон распределения случайной величины. Проверка правдоподобия гипотез.
презентация [113,3 K], добавлен 01.11.2013