Элементы статистических исследований

Генеральная и выборочная совокупности, формы представления эмпирических распределений. Статистический анализ выборочных совокупностей, необходимых для решения ряда задач в области физической культуры и спорта. Пример исследования корреляции и регрессии.

Рубрика Математика
Вид методичка
Язык русский
Дата добавления 09.06.2014
Размер файла 297,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Для сгруппированных данных формула для вычисления эксцесса имеет следующий вид:

.

В нашем примере:

Ex=[4 (13,375-14,5331)4+8 (14,045-14,5331)4+10 (14,715-14,5331)4+

5 (15,385-14,5331)4+2 (16,055-14,5331)4]/[29•0,73984] - 3= -0,66.

Рис. 10. Островершинное и плосковершинное распределения

Отрицательное значение эксцесса свидетельствует о наличии тенденции к плосковершинности у рассматриваемого эмпирического распределения.

2 Исследование корреляции и регрессия

Задание. Даны результаты экспериментального исследования двух признаков. Исследовать, существует ли взаимосвязь между этими признаками. Сравнить вариацию двух обследуемых признаков. Если между двумя наборами данных существует связь, то построить линию регрессии. Рассчитать коэффициент ранговой корреляции Спирмена.

2.1 Общие сведения

2.1.1 Виды взаимосвязи

Исследования в области физической культуры и спорта носят, как правило, комплексный характер, при котором изучается не одна характеристика обследуемого объекта, а целая совокупность показателей. В ряде случаев между исследуемыми показателями обнаруживается взаимосвязь. Существует два вида взаимосвязи - функциональная и статистическая.

Функциональной называется взаимосвязь, при которой каждому значению одного показателя соответствует строго определенное значение другого. Например, средняя скорость V движения автомобиля на расстояние S связана со временем движения t: .

Статистической взаимосвязью называется взаимосвязь, при которой одному значению первого показателя может соответствовать несколько значений второго показателя. В качестве примера можно привести зависимость веса человека от его роста. Одному значению роста может соответствовать несколько значений веса.

Среди статистических зависимостей наибольший интерес представляют корреляционные. Корреляционная зависимость заключается в том, что средняя величина одного показателя (Y) изменяется в зависимости от значения другого (X).

Для изучения взаимосвязей используются корреляционный и регрессионный анализ. Корреляционный анализ состоит в определении степени связи между двумя случайными величинами (Y и X). Основной задачей корреляционного анализа является определение формы, направленности и тесноты взаимосвязи. При исследования корреляции используются графический и аналитический подходы.

Графический анализ начинается с построения корреляционного поля. Корреляционное поле (или диаграмма рассеяния) является графической зависимостью между результатами измерений двух признаков. Для ее построения исходные данные наносят на график, отображая каждую пару значений (xi,yi) в виде точки с координатами xi и yi в прямоугольной системе координат.

2.1.2 Форма зависимости

Визуальный анализ корреляционного поля позволяет сделать предположение о форме взаимосвязи двух исследуемых показателей. По форме взаимосвязи корреляционные зависимости принято разделять на линейные (см. рис. 11) и нелинейные (см. рис. 12).

Рис 11. Линейная статистическая связь

Рис 12. Нелинейная статистическая связь

При линейной зависимости огибающая корреляционного поля близка к эллипсу. Линейная взаимосвязь двух случайных величин состоит в том, что при увеличении одной случайной величины другая случайная величина имеет тенденцию возрастать (или убывать) по линейному закону.

Выявление формы статистической зависимости необходимо для выбора метода оценки тесноты (силы) взаимосвязи.

2.1.3 Направленность взаимосвязи

Направленность является положительной, если увеличение значения одного признака приводит к увеличению значения второго (см. рис. 13).

Рис 13. Положительная направленность

2

Размещено на http://www.allbest.ru/

Рис 14. Отрицательная направленность

Направленность является отрицательной, если увеличение значения одного признака приводит к уменьшению значения второго (см. рис. 14).

Зависимости, имеющие положительные или отрицательные направленности, называются монотонными.

Таким образом, любая монотонная зависимость характеризуется направленностью, которая может быть положительной, или отрицательной.

Зависимость может и не иметь направленности.

2.1.4 Теснота (сила) взаимосвязи

Теснота взаимосвязи может быть оценена качественно по ширине корреляционного поля - чем меньше его ширина, тем больше теснота и сильнее зависимость.

Количественная оценка тесноты взаимосвязи двух случайных величин осуществляется с помощью коэффициента корреляции. Вид коэффициента корреляции и, следовательно, алгоритм его вычисления зависят от шкалы, в которой производятся измерения изучаемых показателей и от формы зависимости.

Принято различать следующие типы шкал: номинальная, порядковая (ординальная), интервальная, относительная (шкала отношения). В соответствии с этими типами шкал существует четыре типа переменных: номинальные, порядковые (ординальные), интервальные и относительные.

Номинальная шкала (или шкала наименований) используются только для качественной классификации. Свойства, характеризуемые с помощью этой шкалы, могут быть измерены только в терминах принадлежности к некоторым, существенно различным классам. Упорядочить эти классы невозможно. Примерами номинальных переменных являются пол, национальность, принадлежность к какому-либо виду спорта. Иногда номинальные переменные называют категориальными. Использование чисел в шкале наименований играет роль ярлыков, позволяющих различать изучаемые объекты. Например, номера игроков в команде.

Шкала порядка позволяет упорядочить (ранжировать) исследуемые объекты, указав какие из них в большей или меньшей степени обладают качеством, выраженным данной переменной. В тоже время она не позволяет определить “на сколько больше” или “на сколько меньше”. Примером порядковой переменной является место, занятое спортсменом на соревновании. Номер места позволяет сказать, какой спортсмен сильнее, а какой слабее, но не показывает “на сколько сильнее” или “на сколько слабее”.

Шкала интервалов позволяет не только упорядочивать исследуемые объекты, но и численно выразить и сравнить различия между ними. Особенностью интервальной шкалы является то, что точка отсчета (т.е. нулевая точка) может быть выбрана произвольно. Примерами интервальных переменных является температура, измеренная в градусах Фаренгейта или Цельсия, суставной угол. Шкала интервалов позволяет определить, на сколько одно измеренное значение больше (меньше) другого, но не дает возможности установить во сколько раз больше (или меньше).

Шкала отношений очень похожа на шкалу интервалов, но отличается от нее тем, что положение начала отсчета (точки абсолютного нуля) строго определено. Фиксирование точки отсчета дает возможность определять, во сколько раз одно измеренное значение больше (или меньше) другого. Примерами использования шкал отношений являются измерения времени прохождения дистанции или пространства (длины дистанции, прыжка).

Значение коэффициента корреляции может изменяться в диапазоне от -1 до +1:

.

Абсолютное значение коэффициента корреляции показывает силу взаимосвязи. Чем меньше его абсолютное значение, тем слабее связь. Если он равен нулю, то связь вообще отсутствует. Чем больше значение модуля коэффициента корреляции, тем сильнее связь и тем меньше разброс в значениях yi при каждом фиксированном значении xi. Знак коэффициента корреляции определяет направленность взаимосвязи: минус - отрицательная, плюс - положительная (см. рис. 15).

2

Размещено на http://www.allbest.ru/

2

Размещено на http://www.allbest.ru/

2

Размещено на http://www.allbest.ru/

2

Размещено на http://www.allbest.ru/

2

Размещено на http://www.allbest.ru/

2

Размещено на http://www.allbest.ru/

2

Размещено на http://www.allbest.ru/

2

Размещено на http://www.allbest.ru/

2

Размещено на http://www.allbest.ru/

2

Размещено на http://www.allbest.ru/

2

Размещено на http://www.allbest.ru/

Рис.15. Корреляционные поля при различных значениях коэффициента корреляции

При проведении исследований в области спорта принята следующая классификация взаимосвязей по значению коэффициента корреляции (см. таблицу 5)

Таблица 5

Интерпретация значений коэффициент корреляции

1

функциональная зависимость

2

сильная статистическая взаимосвязь

3

средняя статистическая взаимосвязь

4

слабая статистическая взаимосвязь

5

очень слабая статистическая взаимосвязь

6

корреляции нет

В ряде случаев тесноту взаимосвязи определяют на основании коэффициента детерминации. Коэффициент детерминации равен квадрату коэффициента корреляции, выраженному в процентах:

2.1.5 Коэффициент корреляции Бравэ-Пирсона

Коэффициент корреляции Браве-Пирсона применим в том случае, если измерение значений исследуемых признаков производятся в шкале отношений или интервалов и форма зависимости является линейной. Коэффициент корреляции характеризует только линейную взаимосвязь (степень ее тесноты). Линейная взаимосвязь двух случайных величин состоит в том, что при увеличении одной случайной величины другая случайная величина имеет тенденцию возрастать (убывать) по линейному закону.

Для вычисления коэффициента корреляции Браве-Пирсона используется формула:

,

.

статистический совокупность распределение регрессия

где и - средние, а и стандартные отклонения, рассчитанные по двум выборкам.

Рассчитанный коэффициент корреляции является выборочным, так как он определен для ограниченной совокупности, являющейся выборкой из генеральной совокупности. Поэтому делать вывод о существовании корреляции в генеральной совокупности только исходя из его значения, особенно если его модуль не очень близок к 1, преждевременно. Необходимо проверить статистическую значимость обнаруженной корреляции. Определение статистической значимости коэффициента корреляции осуществляется с помощью критерия Стьюдента. Основные этапы проверки гипотезы о достоверности коэффициента корреляции заключаются в следующем.

1. Задаются уровнем значимости б. В области физкультуры и спорта принято использовать уровень значимости б=0,05.

2. Формулируют гипотезы, которые в дальнейшем необходимо принять или отклонить. Н0: r=0 (в генеральной совокупности корреляции нет, а отличие от нуля выборочного коэффициента корреляции связано со случайными факторами). Н1: r?0 (в генеральной совокупности корреляция есть).

3. Рассчитывают эмпирическое значение t критерия Стьюдента

4. По специальной таблице определяют критическое значение критерия tкр для числа степеней свободы =n-2 и уровня статистической значимости б (см. таблицу 1 Приложения).

5. Сравнивают эмпирическое значение критерия с критическим. Если tэмп tкр, то полученный коэффициент корреляции достоверен, и между исследуемыми показателями существует статистическая связь с вероятностью q=1-б. Если же tэмп < tкр, то полученный коэффициент корреляции недостоверен, и между исследуемыми показателями нет взаимосвязи.

Существует и более простой способ проверки статистической значимости коэффициента корреляции. Он основан на использовании специальных таблиц критических значений коэффициента корреляции (см. таблицу 2 Приложения). Вычисленный коэффициент корреляции сравнивают с критическим значением rкр для объема выборки n и уровня значимости б. Если , то принимается гипотеза H0 и делается вывод об отсутствии значимой корреляции. Если же оказывается, что , то гипотеза H0 отклоняется и принимается гипотеза H1, согласно которой значение коэффициента корреляции в генеральной совокупности статистически значимо отличается от нуля на уровне значимости б.

2.1.6 Коэффициент ранговой корреляции rs Спирмена

В случаях, если измерения исследуемых признаков проводятся в шкале порядка, или же форма взаимосвязи отличается от линейной, исследование взаимосвязи между двумя случайными величинами осуществляется с помощь ранговых коэффициентов корреляции. Рассмотрим коэффициент ранговой корреляции Спирмена. При его вычислении необходимо ранжировать (упорядочить) варианты выборки. Ранжированием называется группировка экспериментальных данных в определенном порядке, либо по возрастанию, либо по убыванию.

Проведение операции ранжирования осуществляется по следующему алгоритму:

1. Меньшему значению начисляется меньший ранг. Наибольшему значению начисляется ранг, соответствующий количеству ранжируемых значений. Наименьшему значению начисляется ранг равный 1. Например, если n=7, то наибольшее значение получит ранг под номером 7, за исключением случаев, которые предусмотрены вторым правилом.

2. Если несколько значений равны, то им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны. В качестве примера рассмотрим упорядоченную по возрастанию выборку, состоящую из 7 элементов: 22, 23, 25, 25, 25, 28, 30. Значения 22 и 23 встречаются по одному разу, поэтому их ранги соответственно равны R22=1, а R23=2. Значение 25 встречается 3 раза. Если бы эти значения не повторялись, то их ранги были бы равными 3, 4, 5. Поэтому их ранг R25 равен среднему арифметическому 3, 4 и 5: . Значения 28 и 30 не повторяются, поэтому их ранги соответственно равны R28=6, а R30=7. Окончательно имеем следующее соответствие:

элемент выборки

22

23

25

25

25

28

30

его ранг

1

2

4

4

4

6

7

3. Общая сумма рангов должна совпадать с расчетной, которая определяется по формуле:

,

где n - общее количество ранжируемых значений.

Несовпадение реальной и расчетной сумм рангов будет свидетельствовать об ошибке, допущенной при начислении рангов или их суммировании. В этом случае необходимо найти и исправить ошибку.

Коэффициент ранговой корреляции Спирмена является методом, позволяющим определить силу и направленность взаимосвязи между двумя признаками или двумя иерархиями признаков. Применение коэффициента ранговой корреляции имеет ряд ограничений:

а) Предполагаемая корреляционная зависимость должна носить монотонный характер.

б) Объем каждой из выборок должен быть больше или равен 5. Для определения верхней границы выборки пользуются таблицами критических значений (Таблица 3 Приложения). Максимальное значение n в таблице - 40.

в) При проведении анализа вероятна возможность возникновения большого количества одинаковых рангов. В этом случае, необходимо вносить поправку. Наиболее благоприятным является случай когда, обе изучаемые выборки представляют собой две последовательности несовпадающих значений.

Для проведения корреляционного анализа исследователь должен располагать двумя выборками, которые могут быть ранжированы, например:

- два признака, измеренные в одной и той же группе испытуемых;

- две индивидуальные иерархии признаков, выявленные у двух испытуемых по одному и тому же набору признаков;

- две групповые иерархии признаков;

- индивидуальная и групповая иерархии признаков.

Расчет начинаем с ранжирования изучаемых показателей отдельно по каждому из признаков.

Проведем анализ случая с двумя признаками, измеренными в одной и той же группе испытуемых. Сначала ранжируют индивидуальные значения по первому признаку, полученные разными испытуемыми, а затем индивидуальные значения по второму признаку. Если меньшим рангам одного показателя соответствуют меньшие ранги другого показателя, а большим рангам одного показателя соответствуют большие ранги другого показателя, то два признака связаны положительно. Если же большим рангам одного показателя соответствуют меньшие ранги другого показателя, то два признака связаны отрицательно. Для нахождения rs, определяем разности между рангами (d) по каждому испытуемому. Чем меньше разности между рангами, тем ближе коэффициент ранговой корреляции rs будет к «+1». Если взаимосвязь отсутствует, то между ними не будет никакого соответствия, следовательно rs окажется близким к нулю. Чем больше разности между рангами испытуемых по двум переменным, тем ближе к «-1» будет значение коэффициента rs. Таким образом, коэффициент ранговой корреляции Спирмена является мерой любой монотонной зависимости между двумя исследуемыми признаками.

Рассмотрим случай с двумя индивидуальными иерархиями признаков, выявленными у двух испытуемых по одному и тому же набору признаков. В данной ситуации ранжируют индивидуальные значения, полученные каждым из двух испытуемым по определенной совокупности признаков. Признаку с самым низким значением необходимо присвоить первый ранг; признаку с более высоким значением - второй ранг и т.д. Следует обратить особое внимание на то, чтобы все признаки были измерены в одних и тех же единицах. Например, невозможно ранжировать показатели, если они выражены в различных по «цене» баллах, поскольку невозможно определить, какой из факторов будет занимать первое место по выраженности, пока все значения не будут приведены к единой шкале. Если признаки, имеющие низкие ранги у одного из испытуемых так же имеют низкие ранги у другого, и наоборот, то индивидуальные иерархии связаны положительно.

В случае с двумя групповыми иерархиями признаков, ранжируют средне-групповые значения, полученные в двух группах испытуемых по одинаковому для исследуемых групп, набору признаков. Далее следует придерживаемся алгоритма, приведенного в предыдущих случаях.

Проведем анализ случая с индивидуальной и групповой иерархией признаков. Начинают с того, что ранжируют отдельно индивидуальные значения испытуемого и средне-групповые значения по тому же набору признаков, которые получены, при исключении того испытуемого, который не участвует в средне-групповой иерархии, так как с ней будет сопоставляться его индивидуальная иерархия. Ранговая корреляция позволяет оценить степень согласованности индивидуальной и групповой иерархии признаков.

Рассмотрим, как определяется значимость коэффициента корреляции в перечисленных выше случаях. В случае с двумя признаками она будет определяться объемом выборки. В случае с двумя индивидуальными иерархиями признаков значимость зависит от количества признаков, входящих в иерархию. В двух последних случаях значимость обуславливается числом изучаемых признаков, а не численностью групп. Таким образом, значимость rs во всех случаях определяется числом ранжированных значений n.

При проверке статистической значимости rs пользуются таблицами критических значений коэффициента ранговой корреляции, составленных для различных количеств ранжируемых значений и разных уровней значимости. Если абсолютная величина rs, достигает критического значения или превышает его, то корреляция достоверна.

При рассмотрении первого варианта (случай с двумя признаками, измеренными в одной и той же группе испытуемых) возможны следующие гипотезы.

Н0: Корреляция между переменными x и y не отличается от нуля.

Н1: Корреляция между переменными x и y достоверно отличается от нуля.

Если мы работаем с любым из трех оставшихся случаев, то необходимо выдвинуть другую пару гипотез:

Н0: Корреляция между иерархиями x и y не отличается от нуля.

Н1: Корреляция между иерархиями x и y достоверно отличается от нуля.

Последовательность действий при вычислении коэффициента ранговой корреляции Спирмена rs такова.

- Определить, какие два признака или две иерархии признаков будут участвовать в сопоставлении как переменные x и y.

- Ранжировать значения переменной x, начисляя ранг 1 наименьшему значению, в соответствии с правилами ранжирования. Поместить ранги в первую колонку таблицы по порядку номеров испытуемых или признаков.

- Ранжировать значения переменной y. Поместить ранги во вторую колонку таблицы по порядку номеров испытуемых или признаков.

- Вычислить разности d между рангами x и y по каждой строке таблицы. Результаты поместить в следующую колонку таблицы.

- Вычислить квадраты разностей (d2). Полученные значения поместить в четвертую колонку таблицы.

- Вычислить сумму квадратов разностей ? d2.

- При возникновении одинаковых рангов вычислить поправки:

где tx - объем каждой группы одинаковых рангов в выборке x;

ty - объем каждой группы одинаковых рангов в выборке y.

- Вычислить коэффициент ранговой корреляции в зависимости от наличия или отсутствия одинаковых рангов. При отсутствии одинаковых рангов коэффициент ранговой корреляции rs рассчитать по формуле:

При наличии одинаковых рангов коэффициент ранговой корреляции rs рассчитать по формуле:

где ?d2 - сумма квадратов разностей между рангами;

Tx и Ty - поправки на одинаковые ранги;

n - количество испытуемых или признаков, участвовавших в ранжировании.

- Определить по таблице 3 Приложения критические значения rs, для данного количества испытуемых n. Достоверное отличие от нуля коэффициента корреляции будет наблюдаться при условии, если rs не меньше критического значения.

2.1.7 Регрессия

Регрессией называется зависимость среднего значения одной случайной величины Y от значений других исследуемых величин Xi.

Регрессионный анализ устанавливает форму зависимости между случайной величиной Y и значениями одной или нескольких переменных, причем значения эти величин считаются точно заданными. Такая зависимость определяется уравнением регрессии.

Основной этап регрессионного анализа заключается в выборе подходящей регрессионной модели, т.е. математического выражения, связывающего значения зависимой случайной величины Y и значение независимой величины X.

В простейшем случае предполагается линейная зависимость, выраженная уравнением

.

b называют коэффициентом регрессии, а a - свободным членом уравнения регрессии. Параметр а является ординатой точки пересечения прямой с осью ординат, а параметр b - тангенсом угла наклона прямой относительно оси абсцисс.

Регрессия, выраженная таким уравнением, называется простой линейной регрессией. Она описывает зависимость только от одной контролируемой переменной.

Значения а и b вычисляются с помощью метода наименьших квадратов по формулам:

;

.

Мерой точности предсказания значений случайной величины Y по заданным значениям величины X является стандартное отклонение значений yi от регрессионной прямой, которое по-иному называется стандартной ошибкой предсказания. Стандартная ошибка предсказания вычисляется с помощью следующего соотношения:

.

Если провести две прямые, отстоящие от регрессионной прямой на расстояние ±Syx, то они ограничат область около прямой регрессии, в которую с вероятностью 0,7 попадают экспериментальные значения yi. Это означает, что приблизительно 70% всех значений yi находятся в этой области.

Поскольку вычисляемый по данным исследования коэффициент регрессии является выборочным, то следует проверить его статистическую значимость. Сформулируем статистические гипотезы. Н0 - для рассматриваемой генеральной совокупности нет статистически значимого коэффициента регрессии. Н1 - полученный коэффициент регрессии является статистически значимым. Нулевая гипотеза Н0 проверяется с помощью t-критерия Стьюдента, эмпирическое значение которого вычисляется с помощью соотношения

.

Вычисленное эмпирическое значение критерия сравнивается с критическим (см. таблицу 1 Приложения) для числа степеней свободы н=n-2 и уровне значимости б. Если tэмп tкр, то гипотеза Н0 отклоняется и делается вывод о значимости линейной регрессии на уровне значимости б. Если же оказывается, что tэмп < tкр, то принимается гипотеза Н0.

2.2 Пример исследования корреляции и регрессии

Пример. В соревнованиях по десятиборью участвовали 20 спортсменов. Результаты, показанные ими в метании диска и толкании ядра, приведены в таблице 6.

Таблица 6

Результаты метания диска и толкания ядра

i

xi,

метание

диска

(м)

yi,

толкание ядра

(м)

1

40,9

13,84

2

49,47

16,51

3

45,44

15,83

4

45,64

16,47

5

43,76

13,40

6

36,08

13,45

7

33,92

13,88

8

40,22

15,06

9

39,47

14,68

10

38,38

13,97

11

38,68

13,70

12

47,14

14,68

13

36,47

12,85

14

39,03

14,84

15

46,3

15,65

16

33,47

12,27

17

44,97

14,97

18

38,83

13,99

19

42,68

15,03

20

30,79

11,77

Исследовать, существует ли связь между результатами, показанными спортсменами в метании диска и результатами в толкании ядра. Сравнить вариацию двух обследуемых признаков. Если между двумя наборами данных существует связь, то построить линию регрессии.

Построим корреляционное поле, откладывая в прямоугольной системе координат по оси OX результаты, показанные в метании диска, а по оси OY - результаты, показанные в толкании ядра (см. рис. 16). Проведем огибающую для нанесенных точек.

Рис. 16. Корреляционное поле

Как видно из рассмотрения рисунка, огибающая имеет форму, близкую к эллипсу. Это позволяет предположить, что два набора данных связаны между собой линейной связью. Из рис. 6 видно, что увеличение значения результата, показанного в метании диска, приводит к увеличению значения результата, показанного в толкании ядра. Следовательно, предполагаемая связь является положительной. Поскольку связь линейная, а измерения значений исследуемых признаков производятся в шкале отношений, то для оценки ее силы можно воспользоваться коэффициентом корреляции Браве-Пирсона

.

Для определения коэффициента корреляции Браве-Пирсона воспользуемся вспомогательной таблицей. Построим таблицу, содержащую 8 столбцов и 23 строки (см. таблицу 6). В первом столбце разместим номера результатов (или спортсменов). Во втором и третьем столбцах - результаты, показанные спортсменами в метании диска (xi) и толкании ядра (yi).

Таблица 6

Определение коэффициента корреляции

1

2

3

4

5

6

7

8

i

xi

yi

1

40,9

13,84

0,318

-0,502

-0,159636

0,101124

0,252004

2

49,47

16,51

8,888

2,168

19,269184

78,996544

4,700224

3

45,44

15,83

4,858

1,488

7,228704

23,600164

2,214144

4

45,64

16,47

5,058

2,128

10,763424

25,583364

4,528384

5

43,76

13,40

3,178

-0,942

-2,993676

10,099684

0,887364

6

36,08

13,45

-4,502

-0,892

4,015784

20,268004

0,795664

7

33,92

13,88

-6,662

-0,462

3,077844

44,382244

0,213444

8

40,22

15,06

-0,362

0,718

-0,259916

0,131044

0,515524

9

39,47

14,68

-1,112

0,338

-0,375856

1,236544

0,114244

10

38,38

13,97

-2,202

-0,372

0,819144

4,848804

0,138384

11

38,68

13,70

-1,902

-0,642

1,221084

3,617604

0,412164

12

47,14

14,68

6,558

0,338

2,216604

43,007364

0,114244

13

36,47

12,85

-4,112

-1,492

6,135104

16,908544

2,226064

14

39,03

14,84

-1,552

0,498

-0,772896

2,408704

0,248004

15

46,3

15,65

5,718

1,308

7,479144

32,695524

1,710864

16

33,47

12,27

-7,112

-2,072

14,736064

50,580544

4,293184

17

44,97

14,97

4,388

0,628

2,755664

19,254544

0,394384

18

38,83

13,99

-1,752

-0,352

0,616704

3,069504

0,123904

19

42,68

15,03

2,098

0,688

1,443424

4,401604

0,473344

20

30,79

11,77

-9,792

-2,572

25,185024

95,883264

6,615184

Сумма

811,64

286,84

0

0

102,40092

481,0747

30,97072

Вычислим суммы значений xi и yi и занесем их в соответствующие клетки строки «Сумма» (последняя строка таблицы) столбцов 2 и 3:

;

.

Рассчитаем средние значения признаков xi и yi:

;

.

В клетках столбца 4 вычислим разность значений результатов метания диска xi и их среднего значения : , а в клетках столбца 5 - аналогичную разность для толкания ядра . Суммы элементов этих столбцов должны быть равны нулю, поскольку сумма отклонений значений признака от среднего значения равна нулю.

В столбце 6 подсчитаем произведения отклонений двух исследуемых признаков от их средних значений ()(). В столбце 7 вычислим квадраты отклонений результатов метания диска от среднего их значения - ()2, а в столбце 8 - квадраты отклонений результатов толкания ядра от их среднего значения - ()2. Подсчитаем соответствующие суммы и занесем результаты в последнюю строку таблицы:

;

;

.

Используя полученные значения вспомогательных сумм, вычислим значение коэффициента корреляции Браве-Пирсона:

.

Коэффициент корреляции лежит в интервале , поэтому можно сделать предположение о том, что между результатами, показанными спортсменами в метании диска, и результатами, показанными ими в толкании ядра, существует линейная положительная сильная статистическая взаимосвязь.

Коэффициент детерминации в рассматриваемом случае равен

.

Таким образом, 70% взаимосвязи между двумя наборами данных объясняется их взаимовлиянием. Остальная часть вариации обусловлена воздействием других неучтенных причин.

Для обоснования статистической значимости полученного коэффициента корреляции воспользуемся двусторонним критерием. Сформулируем статистические гипотезы. Н0 - в генеральной совокупности корреляция отсутствует, а отличие от нуля выборочного коэффициента корреляции связано со случайностью выборки. Н1 - в генеральной совокупности существует взаимосвязь между двумя исследуемыми признаками. Зададимся уровнем статистической значимости б=0,05. Соответствующее ему критическое значение коэффициента корреляции для объема выборки n=20 равно rкр=0,468 (см. таблицу 2 Приложения). Так как значение выборочного коэффициента корреляции превосходит значение критического для заданного уровня значимости, то делаем вывод о статистической значимости коэффициента корреляции на уровне значимости 0,05. Между результатами, показанными спортсменами в метании диска, и результатами, показанными ими в толкании ядра, существует значимая положительная взаимосвязь.

Обоснуем статистическую значимость коэффициента корреляции иным способом. Он используется тогда, когда таблицы критических значений коэффициента корреляции оказались по каким-либо причинам недоступными. В том случае для проверки статистической значимости применяется t-критерий Стьюдента, таблицы критических значений которого гораздо доступнее. Сами формулировки статистических гипотез Н0 и Н1 остаются без изменений. Вычислим эмпирическое значение t-критерия :

.

Сопоставим полученное значение с критическим значением критерия для числа степеней свободы и уровня значимости б=0,05. Критическое значение определяется с помощью специальных таблиц (см. таблицу 1 Приложения). В рассматриваемом случае оно равно =2,101. Поскольку эмпирическое значение критерия оказалось больше критического, то можно сделать вывод о том, что на уровне значимости 0,05 коэффициент корреляции является статистически значимым.

Для сравнения вариативности исследуемых признаков вычислим коэффициенты вариации. Предварительно, использую значения сумм столбцов 7 и 8 таблицы 3, необходимо вычислить дисперсии и стандартные отклонения:

Подсчитаем коэффициенты вариации двух признаков:

;

.

Поскольку коэффициент вариации у результатов в метании диска больше, чем у результатов в толкании ядра, то этот признак варьирует сильнее. Следует отметить, что в рассматриваемом случае различия в варьировании признаков не велики.

Определим значения коэффициентов регрессии. Для этого воспользуемся вспомогательной таблицей 7.

Таблица 7

Определение коэффициентов регрессии

1

2

3

4

5

6

i

xi

yi

xi2

xiyi

yi2

1

40,9

13,84

1672,81

566,056

191,5456

2

49,47

16,51

2447,2809

816,7497

272,5801

3

45,44

15,83

2064,7936

719,3152

250,5889

4

45,64

16,47

2083,0096

751,6908

271,2609

5

43,76

13,40

1914,9376

586,384

179,56

6

36,08

13,45

1301,7664

485,276

180,9025

7

33,92

13,88

1150,5664

470,8096

192,6544

8

40,22

15,06

1617,6484

605,7132

226,8036

9

39,47

14,68

1557,8809

579,4196

215,5024

10

38,38

13,97

1473,0244

536,1686

195,1609

11

38,68

13,70

1496,1424

529,916

187,69

12

47,14

14,68

2222,1796

692,0152

215,5024

13

36,47

12,85

1330,0609

468,6395

165,1225

14

39,03

14,84

1523,3409

579,2052

220,2256

15

46,3

15,65

2143,69

724,595

244,9225

16

33,47

12,27

1120,2409

410,6769

150,5529

17

44,97

14,97

2022,3009

673,2009

224,1009

18

38,83

13,99

1507,7689

543,2317

195,7201

19

42,68

15,03

1821,5824

641,4804

225,9009

20

30,79

11,77

948,0241

362,3983

138,5329

Сумма

811,64

286,84

33419,0492

11742,9418

4144,8300

Первые три столбца совпадают с соответствующими столбцами таблицы 6. В столбце 4 таблицы 7 вычислим квадраты значений результатов метания диска , в столбце 5 произведения двух исследуемых признаков . В последней строке таблицы подсчитаем соответствующие суммы:

;

.

Вычислим коэффициент регрессии:

;

.

Рассчитаем значение свободного члена уравнения регрессии

.

Таким образом, уравнение регрессии имеет вид:

.

Определим стандартную ошибку предсказания. Для этого в столбце 6 таблицы 3 вычислим квадраты значений результатов толкания ядра и занесем их сумму в последнюю строку:

.

Используя полученные результаты, вычислим стандартную ошибку предсказания:

Стандартная ошибка предсказания является характеристикой точности предсказания значений случайной величины y по известным значениям случайной величины x. Зона, ограниченная двумя прямыми, отстоящими от регрессионной прямой на расстояние ±0.7, является областью, в которую с вероятностью 0,7 попадают экспериментальные значения yi. Это означает, что приблизительно 70% всех значений yi находятся в этой области.

Проверим статистическую значимость полученного коэффициента регрессии. Сформулируем статистические гипотезы. Н0 - для рассматриваемой генеральной совокупности нет статистически значимого коэффициента регрессии. Н1 - полученный коэффициента регрессии является статистически значимым. Нулевая гипотеза проверяется с помощью t-критерия Стьюдента, эмпирическое значение которого вычисляется с помощью соотношения

Зададимся уровнем статистической значимости б=0,05. Соответствующее ему критическое значение для объема выборки n=20 и числа степеней н=n-2=20-2=18 равно tкр=2,101 (см. таблицу 1 Приложения). Сравним эмпирическое значение t-критерия с критическим для выбранного уровня значимости. tэмп > tкр (tэмп > 2,101), поэтому коэффициент регрессии b=0,213 является статистически значимым на уровне статистической значимости б=0,05.

Рассмотрим исследование взаимосвязи признаков с помощью коэффициента ранговой корреляции Спирмена.

Пример. В ходе тренировок группа спортсменов из 20 человек выполняют упражнения «подъем-разгибом» и «отмах в стойку». Результаты, зафиксированные при выполнении этих упражнений, приведены в таблице 8. Число выполнений упражнения «подъем-разгибом» каждым спортсменом приведено во второй колонке таблицы 8 обозначено x. Число выполнений упражнения «отмах в стойку» приведено в третьей колонке таблицы 8 и обозначено y. Исследовать зависимость между результатами выполнения упражнения «отмах в стойку» и результатами выполнения упражнения «подъем-разгибом».

Таблица 8

Вычисление коэффициента ранговой корреляции Спирмена

1

2

3

4

5

6

7

i

xi

yi

RXi

RYi

di

di2

1

20

10

19,5

19

0,5

0,25

2

15

7

10

12,5

-2,5

6,25

3

18

9

16

17,5

-1,5

2,25

4

19

8

18

15,5

2,5

6,25

5

17

5

14

7,5

6,5

42,25

6

10

3

1,5

3,5

-2

4

7

15

7

10

12,5

-2,5

6,25

8

13

5

7

7,5

-0,5

0,25

9

11

3

3,5

3,5

0

0

10

10

3

1,5

3,5

-2

4

11

13

6

7

9,5

-2,5

6,25

12

18

8

16

15,5

0,5

0,25

13

11

3

3,5

3,5

0

0

14

12

4

5

6

-1

1

15

16

6

12,5

9,5

3

9

16

16

7

12,5

12,5

0

0

17

20

11

19,5

20

-0,5

0,25

18

13

2

7

1

6

36

19

15

7

10

12,5

-2,5

6,25

20

18

9

16

17,5

-1,5

2,25

Сумма

210

210

0

133

Построим корреляционное поле, откладывая по оси X декартовой системы координат результаты выполнения упражнения «подъем-разгибом», а по оси Y - соответствующие им результаты выполнения упражнения «отмах в стойку» (см. рис. 17).

Как видно из рассмотрения рисунка, увеличение значения одного признака, приводит к увеличению значения второго. Это позволяет предположить, что два набора данных связаны положительной связью. Поскольку предполагаемая связь является монотонной, то для оценки ее силы можно воспользоваться коэффициентом ранговой корреляции Спирмена.

Рис. 17. Корреляционное поле

Вычислим ранги RXi и RYi значений исследуемых данных и занесем полученные результаты в 4 и 5 колонки таблицы 5.

Вычислим разности рангов RXi и RYi. Полученные данные обозначим di и занесем в шестую колонку. Сумма разностей равна нулю, что может быть использовано для проверки корректности вычислений.

Определим квадраты разностей рангов и суммируем их (). Результат записываем в нижней строке таблицы.

Поскольку как среди результатов выполнения упражнения «подъем-разгибом», так и среди результатов выполнения упражнения «отмах в стойку» есть совпадающие значения, то вычислим поправочные коэффициенты. Среди результатов выполнения упражнения «подъем-разгибом» есть 7 групп совпадающих значений - по два раза встречается значения 10, 11, 16, 20 и по три раза встречается значения 13, 15, 18. Поэтому . Среди результатов выполнения упражнения «подъем-разгибом» по два раза встречаются значения 5, 6, 8, 9 и по четыре раза встречаются значения 3, 7, поэтому .

Подставим полученные значения в формулу для вычисления коэффициента корреляции Спирмена: .

Определим статистическую достоверность полученного коэффициента корреляции. Для n=20 и уровня значимости б=0,05 критическое значение rsкр=0,45 (см. таблицу 3 Приложения).

Поскольку полученное значение rs превосходит критическое rsкр, то можно сделать вывод о статистически значимой положительной корреляции между результатами выполнения упражнения «отмах в стойку» и результатами выполнения упражнения «подъем-разгибом» (p<0,05).

Список литературы

Основная

1. Высшая математика и математическая статистика : учебное пособие для вузов/ под общ. ред. Г. И. Попова. - М.: Физическая культура, 2007. - 368 с.

2. Конюхов В.Г., Конюхова Г.П. Основы выборочного метода исследования. - М.: РИО РГУФК, 2005. - 43 с.

3. Основы математической статистики : учебное пособие для институтов физической культуры / под общ. ред. В. С. Иванова. - М.: Физкультура и спорт, 1990. - 176 с.

4. Селиванова Т.Г. Учебное пособие для студентов РГАФК. - М.: С.Принт, 1999. - 87с.

5. Спортивная метрология: учебник для институтов физической культуры / под ред. В. М. Зациорского. - М.: Физкультура и спорт, 1982. - 256 с.

Дополнительная

1. Вентцель Е.С. Теория вероятностей. - М.: Наука, 1969. - 564с.

2. Гмурман В. Е. Теория вероятностей и математическая статистика. - М.: Высшая школа, 2006. - 479c.

3. Ивченко Г.И., Медведев Ю.Я. Математическая статистика. - М.: Высшая школа, 1994. - 328с.

4. Колемаев В.А., Калинина В.Н. Теория вероятностей и математическая статистика. - М.: Инфра-м, 1997. - 302с.

5. Селиванова Т.Г. Программа дисциплины «Математика» федерального компонента цикла ЕН ГОС по направлению 521900 «Физическая культура», по специальности 022300 «Физическая культура и спорт». - М.: РИО РГУФК, 2002.

Приложение. Статистические таблицы

Таблица 1

Критические значения t-критерия Стьюдента

...

Число степеней свободы н

Уровень значимости для двусторонней критической области

0,1

0,05

0,01

0,005

0,001

2

2,9200

4,3027

9,9250

14,0892

31,5998

4

2,1318

2,7765

4,6041

5,5975

8,6101

6

1,9432

2,4469

3,7074

4,3168

5,9587

8

1,8595

2,3060

3,3554

3,8325

5,0414

10

1,8125

2,2281

3,1693

3,5814

4,5868

12

1,7823

2,1788

3,0545

3,4284

4,3178

14

1,7613

2,1448

2,9768

3,3257

4,1403

16

1,7459

2,1199

2,9208

3,2520

4,0149

18

1,7341

2,1009

2,8784

3,1966

3,9217

20

1,7247

2,0860

2,8453

3,1534

3,8496

22

1,7171

2,0739

2,8188

3,1188

3,7922

24

1,7109

2,0639

2,7970

3,0905

3,7454

26

1,7056

2,0555

2,7787

3,0669

3,7067

28

1,7011

2,0484

2,7633

3,0470

3,6739

30

1,6973

2,0423

2,7500

3,0298

3,6460

32

1,6939

2,0369

2,7385

3,0149

3,6218

34

1,6909

2,0322

2,7284

3,0020

3,6007

36

1,6883

2,0281

2,7195

2,9905

3,5821

38

1,6860

2,0244

2,7116

2,9803

3,5657

40

1,6839

2,0211

2,7045

2,9712

3,5510

50

1,6759

2,0086

2,6778

2,9370

3,4960

60

1,6706

2,0003

2,6603

2,9146

3,4602


Подобные документы

  • Согласование выборочных распределений. Отбор статистических данных с помощью таблицы случайных чисел. Расчет числовых характеристик распределения выборочных частот. Проверка предположения, что распределение генеральной совокупности является нормальным.

    курсовая работа [276,6 K], добавлен 19.01.2016

  • Математическая статистика как наука, методы ее изучения, история становления и развития, новейшие направления исследований. Порядок и этапы статистической обработки экспериментальных данных. Установление законов распределения выборочных совокупностей.

    курсовая работа [122,3 K], добавлен 09.08.2009

  • Математическая статистика как наука о математических методах систематизации статистических данных, ее показатели. Составление интегральных статистических распределений выборочной совокупности, построение гистограмм. Вычисление точечных оценок параметров.

    курсовая работа [241,3 K], добавлен 10.04.2011

  • Понятие и виды статистических рядов распределения, основные формы их представления. Расчет и анализ показателей, характеризующих центральную тенденцию, вариацию, структуру и форму ряда распределения. Проведение сглаживания эмпирического распределения.

    курсовая работа [698,3 K], добавлен 07.06.2011

  • Математические методы систематизации и использования статистических данных для научных и практических выводов. Закон распределения дискретной случайной величины. Понятие генеральной совокупности. Задачи статистических наблюдений. Выборочное распределение.

    реферат [332,8 K], добавлен 10.12.2010

  • Числовые характеристики для статистических распределений. Построение интервального вариационного ряда, многоугольника частостей, графика выборочной функции распределения и определения среднего значения выборки и выборочной дисперсии двумя способами.

    презентация [140,3 K], добавлен 01.11.2013

  • Описание способов нахождения коэффициентов регрессии модели полнофакторного эксперимента. Проверка многофакторных статистических гипотез на однородность ряда дисперсий, значимость и устойчивость математических коэффициентов множественной корреляции.

    контрольная работа [1,2 M], добавлен 05.08.2010

  • Определение вероятности наступления события по формуле Бернулли. Построение эмпирической функции распределения и гистограммы для случайной величины. Вычисление коэффициента корреляции, получение уравнения регрессии. Пример решения задачи симплекс-методом.

    контрольная работа [547,6 K], добавлен 02.02.2012

  • Обработка и анализ статистической информации. Выборочная теория; интервальные оценки и графическое представление параметров распределения. Точечные оценки характеристик положения и мер изменчивости. Корреляционная зависимость; уравнение регрессии.

    курсовая работа [1023,9 K], добавлен 21.03.2015

  • Алгебраический расчет плотности случайных величин, математических ожиданий, дисперсии и коэффициента корреляции. Распределение вероятностей одномерной случайной величины. Составление выборочных уравнений прямой регрессии, основанное на исходных данных.

    задача [143,4 K], добавлен 31.01.2011

  • Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.

    задача [409,0 K], добавлен 17.10.2012

  • Построение теоретико-вероятностной модели исследуемого явления случайной величины математическими выводами. Реализация выборки статистической моделью, описывающей серию опытов. Точечная (выборочная) оценка неизвестного параметра и кривая регрессии.

    курсовая работа [311,7 K], добавлен 10.04.2011

  • Cтатистический анализ зависимости давления. Построение диаграммы рассеивания и корреляционной таблицы. Вычисление параметров для уравнений линейной и параболической регрессии, выборочных параметров. Проверка гипотезы о нормальном распределении признака.

    курсовая работа [613,3 K], добавлен 24.10.2012

  • Применение математических и статистических методов в процессе бурения. Нахождение среднеарифметической выборки, среднеквадратического отклонения, дисперсии, корреляции. Оценка влияния двух реагентов на предельное напряжение сдвига бурового раствора.

    курсовая работа [378,6 K], добавлен 05.12.2011

  • Основные понятия, которые касаются центральной предельной теоремы для независимых одинаково распределенных случайных величин и проверки статистических гипотез. Анализ сходимости последовательностей случайных величин и вероятностных распределений.

    курсовая работа [582,0 K], добавлен 13.11.2012

  • Статистический подход к измерению правовой информации. Графический метод решения задач линейного программирования. Методика решения задач линейного программирования графическим методом. Количество информации как мера неопределенности состояния системы.

    контрольная работа [79,4 K], добавлен 04.06.2010

  • История возникновения уравнений, понятие их решения и виды упрощения. Анализ способов решения ряда занимательных задач с помощью уравнений. Обращение Аль-Хорезми с уравнениями как с рычажными весами. Параметры и переменные, область определения и корень.

    реферат [38,0 K], добавлен 01.03.2012

  • Понятие вариационного ряда, статистического распределения. Эмпирическая функция и основные характеристики математического ожидания выборочной дисперсии. Точечные и интервальные оценки распределений. Теория гипотез - аналог теории доверительных интервалов.

    контрольная работа [172,9 K], добавлен 22.11.2013

  • Понятие математической статистики как науки о математических методах систематизации и использования статистических данных для научных и практических выводов. Точечные оценки параметров статистических распределений. Анализ вычисления средних величин.

    курсовая работа [215,1 K], добавлен 13.12.2014

  • Статическая проверка статистических гипотез. Ошибки первого и второго рода. Числовые характеристики случайной величины, распределенной по биномиальному закону. Проверка гипотезы о биномиальном распределении генеральной совокупности по критерию Пирсона.

    курсовая работа [674,3 K], добавлен 03.05.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.