Расчёт величины эффекта при применении непараметрических критериев сравнения выборок в психологических исследованиях с использованием программы R
Изучение методики расчёта величины эффекта при использовании распространённых непараметрических критериев сравнения выборок. Рассмотрение ограниченности применимости уровня статистической значимости. Описание преимуществ системы статистического анализа R.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 29.07.2017 |
Размер файла | 19,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Расчёт величины эффекта при применении непараметрических критериев сравнения выборок в психологических исследованиях с использованием программы R
И.В. Куприянов
Южный федеральный университет, Ростов-на-Дону
Аннотация: Рассматривается актуальность применения методов расчёта величины эффекта при проведении статистического анализа результатов психологических исследований и ограниченность применимости уровня статистической значимости; приводятся методики расчёта величины эффекта при использовании распространённых непараметрических критериев сравнения выборок и реализация этих методик с помощью функций для системы статистического анализа R. Отмечаются преимущества системы R по сравнению с другими пакетами для статистической обработки и возможность использования её в образовательном процессе.
Ключевые слова: величина эффекта, непараметрическая статистика, ранговые критерии, критерий Манна-Уитни, критерий Уилкоксона, критерий Краскала-Уоллиса, критерий Фридмана, математическая статистика, система статистического анализа R.
Уровень статистической значимости p, представляющий собой вероятность получить имеющийся или более сильно выраженный результат эмпирического исследования в случае, если верна нулевая гипотеза H0, давно и широко используется для подтверждения достоверности проведённого психологического исследования. Однако в то же время всё более очевидной становится ограниченность этого показателя и невозможность использовать одну лишь статистическую значимость для выводов о таких характеристиках, как воспроизводимость результатов исследования или степень выраженности изучаемого явления. Уделение излишнего внимания статистической значимости и некорректное использование этого показателя в научных, в том числе психологических исследованиях, рассматривалось во многих работах, среди которых можно выделить часто цитируемую статью Дж. Коэна "The Earth Is Round (p<.05)", отмечавшего, в частности, что метод проверки значимости нулевой гипотезы не только не способствовал развитию психологии как науки, но и серьёзно тормозил его[1].
В противовес этому всё большее внимание уделяется практической или научной значимости, которая может быть измерена таким показателем, как величина эффекта, т.е. количественная характеристика степени выраженности наблюдаемого в эксперименте эффекта или силы взаимосвязи изучаемых явлений. С другой стороны, величина эффекта может рассматриваться как характеристика соответствия теоретической модели изучаемого явления данным эксперимента или наблюдения (например, при проведении дисперсионного или регрессионного анализа)[2].
Существуют разные подходы к расчёту величины эффекта в зависимости от выбранной методики статистической обработки результатов исследований. Так, ещё в 1924 году Р. Фишером было предложено использование показателя величины эффекта з2 (эта-квадрат, отношение объяснённой межгрупповыми различиями дисперсии к общей дисперсии выборки) при дисперсионном анализе[2].
Всё больше научных журналов, в т.ч. и психологических, требуют указания величины эффекта в публикуемых статьях. Методика расчёта величины эффекта является, таким образом, актуальным вопросом психологических исследований.[2,3]. При этом в таких популярных статистических программах, как SPSS и STATISTICA, расчёт величины эффекта для многих методик не предусмотрен.
Для проведения расчёта величины эффекта в связи с этим предлагается использовать свободно распространяемую среду статистической обработки R, имеющую ряд преимуществ по сравнению с другими статистическими программами [4]. К числу таких преимуществ можно отнести лицензию программы, допускающую её свободное и бесплатное распространение, наличие многочисленной литературы, в том числе на русском языке [5, 6]. Ещё одним преимуществом является лёгкость создания и применения пользовательских функций. Всё это делает возможным выбор компьютерного пакета R в качестве средства для обучения будущих психологов методам статистической обработки данных, что позволит развить их компьютерные навыки и обучить применению на практике современных методов статистического анализа научных данных, в то же время избавив от необходимости ручных математических вычислений, повысить профессиональную компетентность выпускников психологических факультетов[7].
Одной из наиболее обычных задач в психологии является задача сравнения двух или нескольких выборок, для чего широко используются непараметрические или ранговые критерии, не накладывающие ограничений на характер распределения данных [8]. В связи с этим для расчёта величины эффекта при применении этих критериев сравнения выборок нами были созданы следующие пользовательские функции для среды R:
Две независимые выборки. При сравнении двух независимых выборок и использовании критерия Манна-Уитни (известного также как критерий Уилкоксона-Манна-Уитни, критерий суммы рангов Уилкоксона) величина эффекта может быть рассчитана по методу Х. Вендта как показатель рангово-бисериальной корреляции [9]. Для реализации этого метода используется функция:
u.mann.whitney.effect.size <- function (x, y) {
test <- wilcox.test (x, y, paired=FALSE)
attributes (test$statistic) <- NULL
n1 <- length (x); n2 <- length (y)
w2 <- n1*n2-test$statistic
u <- min (test$statistic, w2)
effect <- 1-2*u/(n1*n2)
c (U=u, "Rank-biserial r"=effect)
}
Аргументами этой функции являются два числовых вектора (выборки), а результатом вычисления -- значение критерия Манна-Уитни U и величина эффекта r, принимающая значения от 0 (полное отсутствие эффекта) до 1 (максимальная выраженность эффекта).
Две зависимые выборки. Для сравнения двух зависимых выборок используется T-критерий Уилкоксона, а величина эффекта может быть рассчитана по формуле Д. Керби [10]. Реализующая эти вычисления функция:
t.wilcox.effect.size <- function (x, y) {
test <- wilcox.test (x, y, paired=TRUE); diff <- c(x-y)
attributes (test$statistic) <- NULL
diff <- diff [diff!=0]
n <- length (diff)
ranksum <- n*(n+1)/2
statistic2 <- ranksum - test$statistic
W <- test$statistic - statistic2
effect <- test$statistic/ranksum - statistic2/ranksum
c (T=min (test$statistic, statistic2), W=W, "r rank correlation"=effect)
}
Аргументы: два числовых вектора (выборки) одинакового размера. Результатом являются значения критерия T и W и величина эффекта r.
Более двух независимых выборок. Используемый в этой ситуации непараметрический критерий Краскала-Уоллиса может быть рассмотрен как непараметрический аналог дисперсионного анализа (ANOVA), и для расчёта величины эффекта могут быть использованы аналогичные используемым в дисперсионном анализе коэффициенты з2 и е2 (эта-квадрат и эпсилон-квадрат)[3]. Функция R:
kruskal.test.effect.size <- function (x, g) {
data.list <- split (x, g)
test <- kruskal.test (data.list)
k <- length (data.list)
n <- length (x)
attributes (test$statistic) <- NULL
eta.squared <- (test$statistic-k+1)/(n-k)
epsilon.squared <- test$statistic/((n^2-1)/(n+1))
c (H=test$statistic, "Eta squared"=eta.squared, "Epsilon squared"=epsilon.squared)
}
Аргументы: числовой вектор (переменная) x, содержащий данные всех исследуемых выборок; равный ему по длине фактор (группирующая переменная) g, содержащий названия выборок, к которым относятся соответствующие наблюдения. Результаты: значение критерия Краскала-Уоллиса H, значение коэффициентов з2 и е2.
Более двух зависимых выборок. В качестве критерия сравнения выборок в такой ситуации обычно используется критерий ч2 Фридмана, а в качестве показателя величины эффекта можно использовать коэффициент конкордации W Кендалла [3], что реализовано в функции:
friedman.test.w.kendall <- function (x,...) {
if (is.matrix(x)) {
test.data <- x } else {
test.data <- cbind (x,...)}
test <- friedman.test (test.data)
attributes (test$statistic) <- NULL
n <- nrow (test.data); k <- ncol (test.data)
w <- test$statistic / (n*(k-1))
c ("Chi squared"=test$statistic, "Kendall's W"=w)
}
Аргументы: матрица, содержащая выборки с данными, либо отдельные числовые векторы (выборки) с данными одинаковой длины. Результат: значение критерия Фридмана и значение коэффициента W Кендалла.
Приведённый код функций может быть непосредственно выполнен в среде R путём простого копирования текста, после чего функции могут быть использованы так же, как и стандартные функции языка R, и применяться как в научной деятельности, так и при обучении студентов.
выборка статистический значимость непараметрический
Литература
Cohen, J., 1994. The Earth Is Round (p<.05). American Psychologist, 49(12): pp. 997-1003.
Thompson, B., 2013. Overview of Traditional/Classical Statistical Approaches. The Oxford Handbook of Quantitative Methods. Volume 2: Statistical Analysis, New York: Oxford University Press, pp: 7-25.
Tomczak, M. and E. Tomczak, 2014. The Need to Report Effect Size Estimates Revisited. An Overview of Some Recommended Measures of Effect Size. Trends in Sport Sciences, 21(1): pp.19-25.
Куприянов И.В. Использование свободно распространяемого программного обеспечения при обучении студентов-психологов методам статистической обработки данных // Современные информационные технологии: тенденции и перспективы развития. Материалы конференции. Ростов-на-Дону: 2014. С. 245-247.
Мастицкий С.Э., Шитиков В.К. Статистический анализ и визуализация данных с помощью R. - Электронная книга // R: Анализ и визуализация данных URL: r-analytics.blogspot.ru/2014/12/r.html
Наглядная статистика. Используем R! / Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г., М.: ДМК Пресс, 2014. 298 с.
Нестерова А.В. Применение компьютерных технологий при обучении студентов математике // Инженерный вестник Дона, 2013, №2 URL: ivdon.ru/ru/magazine/archive/n3y2013/1956
Власов М.А. Статистический анализ выборок курсов валют с помощью ранговых критериев // Инженерный вестник Дона, 2013, №2 URL: ivdon.ru/ru/magazine/archive/n2y2013/1658
Wendt, H.W., 1972. Dealing with a common problem in Social science: A simplified rank-biserial coefficient of correlation based on the U statistic. European Journal of Social Psychology, 2(4): pp. 463-465.
Kerby, D.S., 2014. The simple difference formula: An approach to teaching nonparametric correlation. Innovative Teaching, 3(1). Date Views 17.05.2016 URL: amsciepub.com/doi/pdf/10.2466/11.IT.3.1.
Размещено на Allbest.ru
...Подобные документы
Генерирование выборок, имеющих нормальный закон распределения, и определение для них математического ожидания и дисперсии. Нахождение значения критерия Фишера, сравнивнение его с критическим. Проведение однофакторного дисперсионного анализа выборок.
лабораторная работа [291,0 K], добавлен 19.02.2014Ознакомление с основами программного пакета Statistica. Описание статистики и графики. Группировка данных, корреляции, методы множественной регрессии. Рассмотрение набора непараметрических статистик. Реализация дисперсионного и ковариационного анализа.
контрольная работа [544,5 K], добавлен 09.06.2015Изучение непараметрических моделей коллективного типа в задаче прогнозирования временных зависимостей. Анализ исследования и восстановления показателей преступности от следственных мероприятий. Описания руководства программиста информационной системы.
дипломная работа [3,6 M], добавлен 25.09.2011Описание параметрических и непараметрических методов штрафных функций в области нелинейного программирования. Решение задачи с использованием множителей Лагранжа. Непрерывность, гладкость, выпуклость, простота вычисления значения функции и производных.
курсовая работа [114,8 K], добавлен 25.11.2011Определение критериев для сравнения методик управления требованиями. Особенности создания заказного программного обеспечения. Разработка показателей эффективности процессов управления требованиями. Оценка текущих процессов реализации проектов компании.
дипломная работа [1,7 M], добавлен 31.10.2016Описание состава реляционной базы данных как системы связанной информации, сохраняемой в двумерных таблицах. Основные функции CMS и изучение структуры сервера MySQL. Разработка системы выборок данных по товарам для интернет-магазина, таблицы покупателей.
курсовая работа [2,0 M], добавлен 21.04.2015Принципы реализации программы проверки статистических гипотез с использованием t-критерия Стьюдента, ее общий алгоритм. Особенности применения двухвыборочного критерия для независимых выборок. Функциональные модели решения задачи для различных функций.
курсовая работа [644,2 K], добавлен 25.01.2010Создаваемые программные средства. Значительные капитальные затраты на приобретение, освоение ПС. Классификация программных средств ВТ. Расчет капитальных затрат, экономии основных видов ресурсов в связи с использованием нового ПС, экономического эффекта.
реферат [41,5 K], добавлен 09.12.2008Создание и уровни реализации облачных вычислений. Достоинства и недостатки использования облачных технологий в организации единого информационного пространства. Оценка важности критериев методом "Попарного сравнения", "Тепловых карт", "Экспертных оценок".
дипломная работа [1,3 M], добавлен 08.04.2014Разработка программы на языке Visual Basic для расчёта составной конструкции системы двух тел. Написание программы для расчёта реакций составной конструкции при шарнирной и скользящей заделке. Исследование зависимости реакции опоры от направления силы.
курсовая работа [34,5 K], добавлен 16.09.2010Изучение основных преимуществ современных информационных систем. Осуществление коммерческой деятельности в среде Интернет. Предназначение программной системы. Модель взаимодействия с клиентами портала. Оценка эффекта от проекта электронной торговли.
презентация [480,7 K], добавлен 26.05.2015Вертикальное и горизонтальное описание бизнес-процессов. Документация к бизнес-процессу "Заказ продуктов". Подсистема "Учёт продуктов", основные её задачи. Заказ продуктов, приходная накладная. Расчет затрат на разработку системы, экономического эффекта.
курсовая работа [2,1 M], добавлен 25.05.2012Содержание термина "планирование эксперимента". Сущность метода наименьших квадратов. Разработка программы анализа статистической оценки качества проектируемой системы: составление и графическое представление алгоритма решения, листинг программы.
курсовая работа [4,1 M], добавлен 16.09.2011Понятие и специфика автоматизированных систем. Описание методики разработки программы для автоматизации. Ее тестирование и отладка. Внедрение АС в работу предприятия. Расчет экономического эффекта от разработки и реализации программного продукта.
дипломная работа [1,4 M], добавлен 23.06.2015Обоснование необходимости разработки виртуального магазина. Описание форм программы. Требования к аппаратному и программному обеспечению. Тестирование и выявление ошибок. Область применения программы. Расчет экономического эффекта проекта. Охрана труда.
дипломная работа [1,7 M], добавлен 20.12.2012- Разработка серверной части информационной системы для сопровождения процесса выдачи заработной платы
Построение use case диаграммы. Проектирование базы данных. Концептуальная модели 1-уровня (диаграмма последовательности действий). Мапирование реляционной модели в метамодель. Логическая реализация метамодели. Скрипты, заполнение таблиц, создание выборок.
курсовая работа [1,4 M], добавлен 28.12.2011 Создание методов, оценивающих информационное содержание накопленных массивов наблюдений, проверка внутренней однородности. Пример кластерного анализа, основанного на использовании "цепочечного эффекта" для формирования однородных групп наблюдений.
презентация [6,0 M], добавлен 31.03.2011Схема алгоритма работы устройства сравнения трех чисел, структурная, функциональная и принципиальная схемы. Оценка параметров устройства. Схемы задержки и сброса по питанию, комбинационная схема определения среднего числа. Построение временной диаграммы.
курсовая работа [205,0 K], добавлен 24.06.2013Методы исследования устойчивости нелинейной следящей системы. Разработка алгоритмического и программного обеспечения автоматизированной системы с использованием инструментальных средств ПЭВМ. Проверка эффективности проекта путем сравнения результатов.
дипломная работа [568,7 K], добавлен 30.04.2011Функциональная схема и алгоритм работы устройства. Техническое обоснование выбора серии ИМС. Состав и описание работы узлов устройства. Расчёт необходимых сопротивлений резисторов, потребляемой мощности и тока. Построение и анализ временных диаграмм.
курсовая работа [311,7 K], добавлен 19.05.2011