Расчёт величины эффекта при применении непараметрических критериев сравнения выборок в психологических исследованиях с использованием программы R

Изучение методики расчёта величины эффекта при использовании распространённых непараметрических критериев сравнения выборок. Рассмотрение ограниченности применимости уровня статистической значимости. Описание преимуществ системы статистического анализа R.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 29.07.2017
Размер файла 19,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Расчёт величины эффекта при применении непараметрических критериев сравнения выборок в психологических исследованиях с использованием программы R

И.В. Куприянов

Южный федеральный университет, Ростов-на-Дону

Аннотация: Рассматривается актуальность применения методов расчёта величины эффекта при проведении статистического анализа результатов психологических исследований и ограниченность применимости уровня статистической значимости; приводятся методики расчёта величины эффекта при использовании распространённых непараметрических критериев сравнения выборок и реализация этих методик с помощью функций для системы статистического анализа R. Отмечаются преимущества системы R по сравнению с другими пакетами для статистической обработки и возможность использования её в образовательном процессе.

Ключевые слова: величина эффекта, непараметрическая статистика, ранговые критерии, критерий Манна-Уитни, критерий Уилкоксона, критерий Краскала-Уоллиса, критерий Фридмана, математическая статистика, система статистического анализа R.

Уровень статистической значимости p, представляющий собой вероятность получить имеющийся или более сильно выраженный результат эмпирического исследования в случае, если верна нулевая гипотеза H0, давно и широко используется для подтверждения достоверности проведённого психологического исследования. Однако в то же время всё более очевидной становится ограниченность этого показателя и невозможность использовать одну лишь статистическую значимость для выводов о таких характеристиках, как воспроизводимость результатов исследования или степень выраженности изучаемого явления. Уделение излишнего внимания статистической значимости и некорректное использование этого показателя в научных, в том числе психологических исследованиях, рассматривалось во многих работах, среди которых можно выделить часто цитируемую статью Дж. Коэна "The Earth Is Round (p<.05)", отмечавшего, в частности, что метод проверки значимости нулевой гипотезы не только не способствовал развитию психологии как науки, но и серьёзно тормозил его[1].

В противовес этому всё большее внимание уделяется практической или научной значимости, которая может быть измерена таким показателем, как величина эффекта, т.е. количественная характеристика степени выраженности наблюдаемого в эксперименте эффекта или силы взаимосвязи изучаемых явлений. С другой стороны, величина эффекта может рассматриваться как характеристика соответствия теоретической модели изучаемого явления данным эксперимента или наблюдения (например, при проведении дисперсионного или регрессионного анализа)[2].

Существуют разные подходы к расчёту величины эффекта в зависимости от выбранной методики статистической обработки результатов исследований. Так, ещё в 1924 году Р. Фишером было предложено использование показателя величины эффекта з2 (эта-квадрат, отношение объяснённой межгрупповыми различиями дисперсии к общей дисперсии выборки) при дисперсионном анализе[2].

Всё больше научных журналов, в т.ч. и психологических, требуют указания величины эффекта в публикуемых статьях. Методика расчёта величины эффекта является, таким образом, актуальным вопросом психологических исследований.[2,3]. При этом в таких популярных статистических программах, как SPSS и STATISTICA, расчёт величины эффекта для многих методик не предусмотрен.

Для проведения расчёта величины эффекта в связи с этим предлагается использовать свободно распространяемую среду статистической обработки R, имеющую ряд преимуществ по сравнению с другими статистическими программами [4]. К числу таких преимуществ можно отнести лицензию программы, допускающую её свободное и бесплатное распространение, наличие многочисленной литературы, в том числе на русском языке [5, 6]. Ещё одним преимуществом является лёгкость создания и применения пользовательских функций. Всё это делает возможным выбор компьютерного пакета R в качестве средства для обучения будущих психологов методам статистической обработки данных, что позволит развить их компьютерные навыки и обучить применению на практике современных методов статистического анализа научных данных, в то же время избавив от необходимости ручных математических вычислений, повысить профессиональную компетентность выпускников психологических факультетов[7].

Одной из наиболее обычных задач в психологии является задача сравнения двух или нескольких выборок, для чего широко используются непараметрические или ранговые критерии, не накладывающие ограничений на характер распределения данных [8]. В связи с этим для расчёта величины эффекта при применении этих критериев сравнения выборок нами были созданы следующие пользовательские функции для среды R:

Две независимые выборки. При сравнении двух независимых выборок и использовании критерия Манна-Уитни (известного также как критерий Уилкоксона-Манна-Уитни, критерий суммы рангов Уилкоксона) величина эффекта может быть рассчитана по методу Х. Вендта как показатель рангово-бисериальной корреляции [9]. Для реализации этого метода используется функция:

u.mann.whitney.effect.size <- function (x, y) {

test <- wilcox.test (x, y, paired=FALSE)

attributes (test$statistic) <- NULL

n1 <- length (x); n2 <- length (y)

w2 <- n1*n2-test$statistic

u <- min (test$statistic, w2)

effect <- 1-2*u/(n1*n2)

c (U=u, "Rank-biserial r"=effect)

}

Аргументами этой функции являются два числовых вектора (выборки), а результатом вычисления -- значение критерия Манна-Уитни U и величина эффекта r, принимающая значения от 0 (полное отсутствие эффекта) до 1 (максимальная выраженность эффекта).

Две зависимые выборки. Для сравнения двух зависимых выборок используется T-критерий Уилкоксона, а величина эффекта может быть рассчитана по формуле Д. Керби [10]. Реализующая эти вычисления функция:

t.wilcox.effect.size <- function (x, y) {

test <- wilcox.test (x, y, paired=TRUE); diff <- c(x-y)

attributes (test$statistic) <- NULL

diff <- diff [diff!=0]

n <- length (diff)

ranksum <- n*(n+1)/2

statistic2 <- ranksum - test$statistic

W <- test$statistic - statistic2

effect <- test$statistic/ranksum - statistic2/ranksum

c (T=min (test$statistic, statistic2), W=W, "r rank correlation"=effect)

}

Аргументы: два числовых вектора (выборки) одинакового размера. Результатом являются значения критерия T и W и величина эффекта r.

Более двух независимых выборок. Используемый в этой ситуации непараметрический критерий Краскала-Уоллиса может быть рассмотрен как непараметрический аналог дисперсионного анализа (ANOVA), и для расчёта величины эффекта могут быть использованы аналогичные используемым в дисперсионном анализе коэффициенты з2 и е2 (эта-квадрат и эпсилон-квадрат)[3]. Функция R:

kruskal.test.effect.size <- function (x, g) {

data.list <- split (x, g)

test <- kruskal.test (data.list)

k <- length (data.list)

n <- length (x)

attributes (test$statistic) <- NULL

eta.squared <- (test$statistic-k+1)/(n-k)

epsilon.squared <- test$statistic/((n^2-1)/(n+1))

c (H=test$statistic, "Eta squared"=eta.squared, "Epsilon squared"=epsilon.squared)

}

Аргументы: числовой вектор (переменная) x, содержащий данные всех исследуемых выборок; равный ему по длине фактор (группирующая переменная) g, содержащий названия выборок, к которым относятся соответствующие наблюдения. Результаты: значение критерия Краскала-Уоллиса H, значение коэффициентов з2 и е2.

Более двух зависимых выборок. В качестве критерия сравнения выборок в такой ситуации обычно используется критерий ч2 Фридмана, а в качестве показателя величины эффекта можно использовать коэффициент конкордации W Кендалла [3], что реализовано в функции:

friedman.test.w.kendall <- function (x,...) {

if (is.matrix(x)) {

test.data <- x } else {

test.data <- cbind (x,...)}

test <- friedman.test (test.data)

attributes (test$statistic) <- NULL

n <- nrow (test.data); k <- ncol (test.data)

w <- test$statistic / (n*(k-1))

c ("Chi squared"=test$statistic, "Kendall's W"=w)

}

Аргументы: матрица, содержащая выборки с данными, либо отдельные числовые векторы (выборки) с данными одинаковой длины. Результат: значение критерия Фридмана и значение коэффициента W Кендалла.

Приведённый код функций может быть непосредственно выполнен в среде R путём простого копирования текста, после чего функции могут быть использованы так же, как и стандартные функции языка R, и применяться как в научной деятельности, так и при обучении студентов.

выборка статистический значимость непараметрический

Литература

Cohen, J., 1994. The Earth Is Round (p<.05). American Psychologist, 49(12): pp. 997-1003.

Thompson, B., 2013. Overview of Traditional/Classical Statistical Approaches. The Oxford Handbook of Quantitative Methods. Volume 2: Statistical Analysis, New York: Oxford University Press, pp: 7-25.

Tomczak, M. and E. Tomczak, 2014. The Need to Report Effect Size Estimates Revisited. An Overview of Some Recommended Measures of Effect Size. Trends in Sport Sciences, 21(1): pp.19-25.

Куприянов И.В. Использование свободно распространяемого программного обеспечения при обучении студентов-психологов методам статистической обработки данных // Современные информационные технологии: тенденции и перспективы развития. Материалы конференции. Ростов-на-Дону: 2014. С. 245-247.

Мастицкий С.Э., Шитиков В.К. Статистический анализ и визуализация данных с помощью R. - Электронная книга // R: Анализ и визуализация данных URL: r-analytics.blogspot.ru/2014/12/r.html

Наглядная статистика. Используем R! / Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г., М.: ДМК Пресс, 2014. 298 с.

Нестерова А.В. Применение компьютерных технологий при обучении студентов математике // Инженерный вестник Дона, 2013, №2 URL: ivdon.ru/ru/magazine/archive/n3y2013/1956

Власов М.А. Статистический анализ выборок курсов валют с помощью ранговых критериев // Инженерный вестник Дона, 2013, №2 URL: ivdon.ru/ru/magazine/archive/n2y2013/1658

Wendt, H.W., 1972. Dealing with a common problem in Social science: A simplified rank-biserial coefficient of correlation based on the U statistic. European Journal of Social Psychology, 2(4): pp. 463-465.

Kerby, D.S., 2014. The simple difference formula: An approach to teaching nonparametric correlation. Innovative Teaching, 3(1). Date Views 17.05.2016 URL: amsciepub.com/doi/pdf/10.2466/11.IT.3.1.

Размещено на Allbest.ru

...

Подобные документы

  • Генерирование выборок, имеющих нормальный закон распределения, и определение для них математического ожидания и дисперсии. Нахождение значения критерия Фишера, сравнивнение его с критическим. Проведение однофакторного дисперсионного анализа выборок.

    лабораторная работа [291,0 K], добавлен 19.02.2014

  • Ознакомление с основами программного пакета Statistica. Описание статистики и графики. Группировка данных, корреляции, методы множественной регрессии. Рассмотрение набора непараметрических статистик. Реализация дисперсионного и ковариационного анализа.

    контрольная работа [544,5 K], добавлен 09.06.2015

  • Изучение непараметрических моделей коллективного типа в задаче прогнозирования временных зависимостей. Анализ исследования и восстановления показателей преступности от следственных мероприятий. Описания руководства программиста информационной системы.

    дипломная работа [3,6 M], добавлен 25.09.2011

  • Описание параметрических и непараметрических методов штрафных функций в области нелинейного программирования. Решение задачи с использованием множителей Лагранжа. Непрерывность, гладкость, выпуклость, простота вычисления значения функции и производных.

    курсовая работа [114,8 K], добавлен 25.11.2011

  • Определение критериев для сравнения методик управления требованиями. Особенности создания заказного программного обеспечения. Разработка показателей эффективности процессов управления требованиями. Оценка текущих процессов реализации проектов компании.

    дипломная работа [1,7 M], добавлен 31.10.2016

  • Описание состава реляционной базы данных как системы связанной информации, сохраняемой в двумерных таблицах. Основные функции CMS и изучение структуры сервера MySQL. Разработка системы выборок данных по товарам для интернет-магазина, таблицы покупателей.

    курсовая работа [2,0 M], добавлен 21.04.2015

  • Принципы реализации программы проверки статистических гипотез с использованием t-критерия Стьюдента, ее общий алгоритм. Особенности применения двухвыборочного критерия для независимых выборок. Функциональные модели решения задачи для различных функций.

    курсовая работа [644,2 K], добавлен 25.01.2010

  • Создаваемые программные средства. Значительные капитальные затраты на приобретение, освоение ПС. Классификация программных средств ВТ. Расчет капитальных затрат, экономии основных видов ресурсов в связи с использованием нового ПС, экономического эффекта.

    реферат [41,5 K], добавлен 09.12.2008

  • Создание и уровни реализации облачных вычислений. Достоинства и недостатки использования облачных технологий в организации единого информационного пространства. Оценка важности критериев методом "Попарного сравнения", "Тепловых карт", "Экспертных оценок".

    дипломная работа [1,3 M], добавлен 08.04.2014

  • Разработка программы на языке Visual Basic для расчёта составной конструкции системы двух тел. Написание программы для расчёта реакций составной конструкции при шарнирной и скользящей заделке. Исследование зависимости реакции опоры от направления силы.

    курсовая работа [34,5 K], добавлен 16.09.2010

  • Изучение основных преимуществ современных информационных систем. Осуществление коммерческой деятельности в среде Интернет. Предназначение программной системы. Модель взаимодействия с клиентами портала. Оценка эффекта от проекта электронной торговли.

    презентация [480,7 K], добавлен 26.05.2015

  • Вертикальное и горизонтальное описание бизнес-процессов. Документация к бизнес-процессу "Заказ продуктов". Подсистема "Учёт продуктов", основные её задачи. Заказ продуктов, приходная накладная. Расчет затрат на разработку системы, экономического эффекта.

    курсовая работа [2,1 M], добавлен 25.05.2012

  • Содержание термина "планирование эксперимента". Сущность метода наименьших квадратов. Разработка программы анализа статистической оценки качества проектируемой системы: составление и графическое представление алгоритма решения, листинг программы.

    курсовая работа [4,1 M], добавлен 16.09.2011

  • Понятие и специфика автоматизированных систем. Описание методики разработки программы для автоматизации. Ее тестирование и отладка. Внедрение АС в работу предприятия. Расчет экономического эффекта от разработки и реализации программного продукта.

    дипломная работа [1,4 M], добавлен 23.06.2015

  • Обоснование необходимости разработки виртуального магазина. Описание форм программы. Требования к аппаратному и программному обеспечению. Тестирование и выявление ошибок. Область применения программы. Расчет экономического эффекта проекта. Охрана труда.

    дипломная работа [1,7 M], добавлен 20.12.2012

  • Построение use case диаграммы. Проектирование базы данных. Концептуальная модели 1-уровня (диаграмма последовательности действий). Мапирование реляционной модели в метамодель. Логическая реализация метамодели. Скрипты, заполнение таблиц, создание выборок.

    курсовая работа [1,4 M], добавлен 28.12.2011

  • Создание методов, оценивающих информационное содержание накопленных массивов наблюдений, проверка внутренней однородности. Пример кластерного анализа, основанного на использовании "цепочечного эффекта" для формирования однородных групп наблюдений.

    презентация [6,0 M], добавлен 31.03.2011

  • Схема алгоритма работы устройства сравнения трех чисел, структурная, функциональная и принципиальная схемы. Оценка параметров устройства. Схемы задержки и сброса по питанию, комбинационная схема определения среднего числа. Построение временной диаграммы.

    курсовая работа [205,0 K], добавлен 24.06.2013

  • Методы исследования устойчивости нелинейной следящей системы. Разработка алгоритмического и программного обеспечения автоматизированной системы с использованием инструментальных средств ПЭВМ. Проверка эффективности проекта путем сравнения результатов.

    дипломная работа [568,7 K], добавлен 30.04.2011

  • Функциональная схема и алгоритм работы устройства. Техническое обоснование выбора серии ИМС. Состав и описание работы узлов устройства. Расчёт необходимых сопротивлений резисторов, потребляемой мощности и тока. Построение и анализ временных диаграмм.

    курсовая работа [311,7 K], добавлен 19.05.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.