Методика вычисления, область применения и оценка достоверности линейной и ранговой корреляции

Теоретические основы вычисления и использования коэффициентов линейной и ранговой корреляции. Методы оценки достоверности в анализе данных при статистических исследованиях в медицине. Область применения методов расчета линейной и ранговой корреляции.

Рубрика Медицина
Вид контрольная работа
Язык русский
Дата добавления 20.11.2014
Размер файла 91,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Тема работы / вариант: Вариант 19. Методика вычисления, область применения и оценка достоверности линейной и ранговой корреляции

Дисциплина: Медицинская статистика

понедельник, 15 февраля 2016 г., 11:02:32

Содержание

  • Введение
  • 1. Методика вычисления, область применения и оценка достоверности линейной и ранговой корреляции
    • 1.1 Методика вычисления и оценка достоверности линейной корреляции
    • 1.2 Методика вычисленияя и оценка достоверности ранговой корреляции
    • 1.3 Область применения линейной и ранговой корреляции
  • 2. Задача
  • Заключение
  • Список использованных источников

Введение

Актуализируя тему исследования необходимо отметить то, что коэффициенты линейной и ранговой корреляции несут важную информацию о соответствии фактическим статистическим данным. Потому, при линейной форме уравнения применяется показатель тесноты связи, называемый линейным коэффициентом корреляции. Для непараметрических моделей применяется коэффициент раноговой корреляции, называемый коэффициентом Спирмена

Цель работы изучить основы вычисления и использования коэффициентов линейной и ранговой корреляции, область применения и методы расчета стандартизованных показателей, и методов оценки достоверности результатов статистических исследований в медицине.

Для достижения поставленной цели решим следующие задачи:

1) Изучить теоретические основы вычисления и использования коэффициентов линейной и ранговой корреляции.

2) Познакомиться с методами оценки достоверности в анализе данных при статистических исследованиях в медицине.

3) На практике применить полученные знания и выполнить задачу.

Объектом исследования являются коэффициенты линейной и парной корреляции, а предметом - методика вычислениями оценка достоверности линейной и ранговой корреляции.

линейный корреляция статистический медицина

1. Методика вычисления, область применения и оценка достоверности линейной и ранговой корреляции

1.1 Методика вычисления и оценка достоверности линейной корреляции

Социально-экономические явления представляют собой результат одновременного воздействия большого числа причин. Следовательно, при изучении этих явлений необходимо выявлять главные, основные причины, абстрагируясь от второстепенных. При изучении конкретных зависимостей одни признаки выступают в качестве факторов, обуславливающих изменение других признаков. Признаки этой группы называются факторными, а признаки, которые являются результатом влияния этих факторов, называются результативными. Связи между явлениями и их признаками классифицируются по степени тесноты связи, направлению и аналитическому выражению.

В статистике различают функциональную связь и стохастическую зависимость. Функциональной называют такую связь, при которой определенному значению факторного признака соответствует одно и только одно значение результативного признака. Если причинная зависимость проявляется не в каждом отдельном случае, а в общем, среднем при большом числе наблюдений, то такая зависимость называется стохастической.

Частным случаем стохастической связи является корреляционная связь, при которой изменение среднего значения результативного признака обусловлено изменением факторных признаков.

При изучении связи экономических показателей используют различного вида уравнения прямолинейной связи, в том числе уравнение линейной функции:

(1)

Оценка параметров уравнений регрессии осуществляется методом наименьших квадратов (МНК), в основе которого лежит предположение о независимости наблюдений исследуемой совокупности. Сущность МНК заключается в нахождении параметров модели, при которых минимизируется сумма квадратов отклонений эмпирических (фактических) значений результативного признака от теоретических, полученных по выбранному уравнению регрессии.

- для уравнения прямой.(2)

Рассмотрим расчет параметров однофакторной линейной модели. Внимание к линейным связям объясняется ограниченной вариацией переменных и тем, что в большинстве случаев нелинейные формы связи для выполнения расчетов преобразуют (путем логарифмирования или замены переменных) в линейную форму.

Уравнение однофакторной линейной корреляционной связи имеет вид (1): .

Система нормальных уравнений для нахождения параметров линейной регрессии методом наименьших квадратов имеет вид:

,(3)

где n - объем исследуемой совокупности.

В уравнениях регрессии параметр a0 показывает усредненное влияние на результативный признак неучтенных (не выделенных для исследования) факторов; параметр a1 (в уравнении параболы и a2) - коэффициент регрессии показывает, насколько изменяется в среднем значение результативного признака при увеличении факторного на единицу собственного измерения.

Можно воспользоваться готовыми формулами нахождения параметров:

(4)

(5)

Определив значения a0, a1 и подставив их в уравнение связи , находим значения yx, зависящие только от заданного значения x.

Для практического использования моделей регрессии большое значение имеет их адекватность, т.е. соответствие фактическим статистическим данным. Потому, при линейной форме уравнения применяется показатель тесноты связи, называемый линейным коэффициентом корреляции. Для практических вычислений при малом числе наблюдений (n<30) его удобнее исчислять по следующей формуле:

.(6)

Линейный коэффициент корреляции принимает значения от -1 до +1. Отрицательные значения указывают на обратную связь, положительные - на прямую. При r=0 связь отсутствует. Чем ближе коэффициент корреляции по абсолютной величине к 1, тем теснее связь между признаками. При r=±1 связь функциональная.

По степени тесноты связи различают количественные критерии оценки тесноты связи. Оценка линейного коэффициента корреляции может быть произведена по таблице 1.

Таблица 1 - Количественные критерии оценки тесноты связи

Величина коэффициента корреляции

Характер связи

| ± 0,01| - |± 0,15|

Отсутствие связи

| ± 0,16| - |± 0,20|

Плохая связь

| ± 0,21| - | ± 0,30|

Слабая связь

| ± 0,31| - | ± 0,40|

Умеренная связь

| ± 0,41| - | ± 0,60|

Средняя связь

| ± 0,61| - | ± 0,80|

Высокая связь

| ± 0,81| - | ± 0,90|

Очень высокая связь

| ± 0,91| - | ± 1,00|

Полная связь

Квадрат линейного коэффициента корреляции r2 называется линейным коэффициентом детерминации, его числовое значение всегда заключено в пределах от 0 до 1.

Факт совпадений и несовпадений значений теоретического корреляционного отношения з и линейного коэффициента корреляции r используется для оценки формы связи. Если значения з и r совпадают, можно сделать вывод о наличии прямолинейной связи. Несовпадение этих величин свидетельствует, что связь между изучаемыми признаками не линейная, а криволинейная.

Показатели тесноты связи, исчисленные по данным сравнительно небольшой статистической совокупности, могут искажаться действием случайных причин. Это вызывает необходимость проверки их существенности, дающей возможность распространять выводы по результатам выборки на генеральную совокупность.

Для оценки значимости коэффициента корреляции r используют t - критерий Стьюдента. При линейной однофакторной связи t - критерий можно рассчитать по формуле:

,(7)

где n-2 - число степеней свободы при заданном уровне значимости б и объеме выборки n.

Полученное значение tрасч сравнивают с табличным значением t - критерия (для б=0,05 и 0,01). Если tрасч>tтабл, то коэффициент корреляции признается значимым.

После проверки адекватности, установления точности и надежности построенной модели, ее необходимо проанализировать. Из уравнения регрессии следует, что при изменении факторного признака x на единицу результативный признак изменится на параметр a1.

Для удобства интерпретации параметра a1 используют коэффициент эластичности. Он показывает средние изменения результативного признака при изменении факторного признака на 1%, %:

.(8)

Имеет смысл вычислить остатки , характеризующие отклонение i-x наблюдений от значений, которые следует ожидать в среднем.

1.2 Методика вычисленияя и оценка достоверности ранговой корреляции

Коэффициент ранговой корреляции Спирмена - это непараметрический метод.

Практический расчет коэффициента ранговой корреляции Спирмена включает следующие этапы:

1) Сопоставать каждому из признаков их порядковый номер (ранг) по возрастанию (или убыванию).

2) Определить разности рангов каждой пары сопоставляемых значений.

3) Возвести в квадрат каждую разность и суммировать полученные результаты.

4) Вычислить коэффициент корреляции рангов по формуле:.

,(9)

где - сумма квадратов разностей рангов, а - число парных наблюдений.

При использовании коэффициента ранговой корреляции условно оценивают тесноту связи между признаками, считая значения коэффициента равные 0,3 и менее, показателями слабой тесноты связи; значения более 0,4, но менее 0,7 - показателями умеренной тесноты связи, а значения 0,7 и более - показателями высокой тесноты связи.

1.3 Область применения линейной и ранговой корреляции

Коэффициент линейной корреляции - важный показатель показывающий взаимосвязь между двумя наборами данных. Коэффициент линейной корреляции может принимать значения от -1 до 1. Отрицательный коэффициент линейной корреляции показывает, что данные взаимосвязанно расходятся, при возрастании значений одних из них значения другой убывают, положительный - что данные взаимосвязанно растут, 0 и близкие значения говорят о том, что данные не связаны друг с другом. Следует помнить, что коэффициент линейной корреляции неисключительный математический показатель, который может не иметь никаких связей с реальной ситуацией, так же возможна ситуация, когда 2 набора данных не связаны между собой, но сильно коррелируют через третий набор (т.н. условная корреляция) и т.д.

Коэффициент ранговой корреляции Спирмена - это непараметрический метод, который используется с целью статистического изучения связи между явлениями. В этом случае определяется фактическая степень параллелизма между двумя количественными рядами изучаемых признаков и дается оценка тесноты установленной связи с помощью количественно выраженного коэффициента.

Коэффицент ранговой корреляции целесообразно применять при наличии небольшого количества наблюдений. Данный метод может быть использован не только для количественно выраженных данных, но также и в случаях, когда регистрируемые значения определяются описательными признаками различной интенсивности.

2. Задача

На основании данных таблицы требуется определить зависимость цветного показателя (ряд х) от величины эритроцитов (ряд у):

Таблица 2 - Исходные данные

х в ед.

у в %

0,91

78

0,92

79

0,95

80

0,93

81

0,91

82

0,98

83

0,99

84

0,95

82

0,98

85

1,05

86

Решение:

Составим таблицу вспомогательных величин:

Таблица 3 - Вспомогательные величины

№ п/п

Значение признаков

Отклонение

Квадраты отклонений

Произведение отклонений

X

Y

1

0,91

78

-0,05

-4,00

0,00

16,00

0,19

2

0,92

79

-0,04

-3,00

0,00

9,00

0,11

3

0,95

80

-0,01

-2,00

0,00

4,00

0,01

4

0,93

81

-0,03

-1,00

0,00

1,00

0,03

5

0,91

82

-0,05

0,00

0,00

0,00

0,00

6

0,98

83

0,02

1,00

0,00

1,00

0,02

7

0,99

84

0,03

2,00

0,00

4,00

0,07

8

0,95

82

-0,01

0,00

0,00

0,00

0,00

9

0,98

85

0,02

3,00

0,00

9,00

0,07

10

1,05

86

0,09

4,00

0,01

16,00

0,37

Сумма

9,6

820,0

0,02

60,00

0,87

Ср.знач. и

0,96

82,00

Среднее число цветного показателя

(ед);

среднее число величины эритроцитов

(%),

где: n - число сопряженных пар. Используя данные вспомогательной таблицы, рассчитывают коэффициент корреляции:

Стандартная ошибка коэффициента корреляции:

Коэффициент детерминации: dxy = r2Ч100% = 0,8512 Ч100% = 72,46%

Фактическое значение критерия существенности определяют по формуле:

Теоретическое значение t05 для (n-2=8): t05 = 2,31.

Т.к. tr? tтеор, корреляционная связь признается существенной и определим коэффициент регрессии:

Ошибка коэффициента регрессии:

Критерий существенности регрессии:

На основании полученных данных находим уравнение линейной регрессии:

По уравнению регрессии рассчитаем средние теоретические значения Y для экстремальных (минимального и максимального) значения X и построим теоретическую линию регрессии (рис.1).

Для Xmin = 0,9 (ед); Ymin = 49,97 Ч 0,9 + 34,18 = 79,7 (%)

Для Xmax = 1,1 (ед); Ymax = 49,97 Ч 1,1 + 34,18 = 86,6 (%)

Рисунок 1 - Теоретическая линия регрессии зависимости цветного показателя (ряд х) от величины эритроцитов (ряд у)

Результаты: 1. Между цветным показателем и количеством эритроцитов в крови существует сильная по тесноте и прямая по направлению взаимосвязь (r = 0,851).

2. В 72,46% случаев (из 100) цветной показатель обусловлен и зависит от количества эритроцитов, а в 27,54% случаев от других факторов (dxy = 72,46%).

Заключение

Статистические исследования социально-экономических явлений и процессов опираются на числовые данные, полученные в конкретных условиях места и времени. Результаты статистического наблюдения оценивают прежде всего с помощью коэффициентов корреляции, которые служат основой для дальнейшего анализа статистических показателей на следующих этапах статистического исследования.

Коэффициент линейной корреляции был предложен как инструмент, с помощью которого можно проверить гипотезу о зависимости и измерить силу зависимости двух переменных.

Для углубленного анализа качественных признаков общетвенного здоровья и деятельности учреждений здравоохранения, а также деятельности медицинского работника используется коэффициент ранговой корреляции для которых можно указать порядок, т.е. они сравнимы по принципу "больше-меньше" или "лучше-хуже". Они применяются для изучения совокупности, которая характеризуется, главным образом качественными признаками.

На закреплении практических навыков была решена задача на определение зависимость цветного показателя (ряд х) от величины эритроцитов (ряд у).

Список использованных источников

1. Демина А.И. Статистика: учебник/ А.И. Демина, О.П. Мамченко, Ю.И. Растова. - Барнаул: Изд-во Алт. Ун-та, 2005.

2. Лисицын Ю.П. Общественное здоровье и здравоохранение. Учебник для вузов. - М.: ГЭОТАР-МЕД, 2007. - 512 с.

3. Мерков А.М., Поляков Л.Е. Санитарная статистика. - М.:АСТ, 2007. - 637 с.

4. Общая теория статистик: учеб./ И.И. Елисеева И.И., Юзбашев М.М.; под ред. Елисеевой И.И. - М.: Финансы и статистика, 2004. - 656 с.: ил.

5. Ряузов Н.Н. Общая теория статистики: Учебник для вузов 3-е издание, перераб. и доп. - М.: Финансы и статистика, 1980. - 344 с.

Размещено на Allbest.ru

...

Подобные документы

  • Средняя величина – количественная обобщающая характеристика однородной совокупности с изменяющимся варьирующим признаком. Виды средних величин и методы их вычисления. Оценка достоверности статистических показателей. Оценка физического развития населения.

    курсовая работа [23,6 K], добавлен 10.11.2013

  • Задержки роста у детей как важнейшая проблема в детской эндокринологии. Дифференциальная диагностика различных вариантов нанизма. Дефицит гормона роста. Особенности определения уровня инсулиноподобного фактора в крови. Коэффициент линейной корреляции.

    презентация [1,9 M], добавлен 20.02.2015

  • Сахарный диабет, его типы и причины возникновения. Статистическая оценка и анализ показателей уровня заболеваемости сахарным диабетом с помощью пакета STATISTIСA. Анализ корреляции и лаговой корреляции, построение множественной регрессионной модели.

    курсовая работа [1000,6 K], добавлен 07.06.2008

  • Наиболее известные методы голодания, область применения, процедуры. Заболевания, при которых голодание недопустимо. Комбинации продолжительности разгрузочного и восстановительного периодов. Методика голодания по Г. Шелтону, П. Бреггу и Войтовичу.

    реферат [40,4 K], добавлен 16.06.2014

  • Алгоритм вычисления параметров взвешенного вариационного ряда. Статистическая оценка достоверности результатов медико-статистического исследования это ряд этапов, а точность результатов зависит от отдельных этапов. Величина ошибки репрезентативности.

    методичка [69,7 K], добавлен 19.04.2009

  • Статистика в медико-биологическом исследовании, выбор метода анализа в соответствии с типом распределения данных. Анализ времени жизни в ППО Statistica, сравнение коэффициентов корреляции. Порядок осуществления проверки типа распределения данных.

    реферат [1,2 M], добавлен 03.06.2011

  • Область применения титана в медицине и его свойства. Механическое поведение тканей организма и имплантатов из никелида титана. Имплантаты и антибактериальные препараты. Биодеградирующие материалы и общие представления о биосовместимых веществах.

    курсовая работа [1,4 M], добавлен 18.01.2013

  • Физические основы применения лазерной техники в медицине. Типы лазеров, принципы действия. Механизм взаимодействия лазерного излучения с биотканями. Перспективные лазерные методы в медицине и биологии. Серийно выпускаемая медицинская лазерная аппаратура.

    реферат [8,0 M], добавлен 30.08.2009

  • Изучение истории развития туберкулинодиагностики. Использование и область применения туберкулиной пробы Пирке, Коха и градуированной пробы Карпиловского-Гринчара. Цель применения, постановки и оценка результатов пробы Манту. Вираж туберкулиновой пробы.

    презентация [852,3 K], добавлен 09.09.2015

  • Диагностические возможности рентгеновских методов исследования суставов и костей: рентгенографии, линейной и компьютерной томографии, артрографии, фистулографии. Принцип и назначение магнитно-резонансной томографии, сонографии, радионуклеидного метода.

    презентация [580,7 K], добавлен 19.10.2014

  • Анализ данных о хмеле обыкновенном, перспективы его использования в медицине и фармации. Ботаническая характеристика хмеля, его химический состав. Особенности применения хмеля в медицине. Основные лекарственные средства, токсичность и побочное действие.

    курсовая работа [207,3 K], добавлен 13.04.2019

  • Общая характеристика лекарственных растений, содержащих сапонины и определение их вида, строения и свойств содержащихся в них. Правила заготовки лекарственных растений, содержащих сапонины, характеристика лекарственного сырья и область его применения.

    курсовая работа [2,3 M], добавлен 08.12.2012

  • Описание и свойства биоматериалов Аллоплант, процесс производства и сферы его практического применения. Оценка основных преимуществ и недостатков данного препарата, перспективы распространения и использования его на будущем фармацевтическом рынке.

    реферат [36,1 K], добавлен 07.10.2013

  • История криоцервации и витрификации, физическое обоснование данных процессов, их основные этапы и значение. История формирования и развития принципов проведения криоцервации и витрификации, обоснование и условия их применения в современной медицине.

    контрольная работа [35,4 K], добавлен 12.12.2014

  • Сущность и отличительные особенности статистического исследования, требования к нему, используемые методы и приемы. Интерпретация и оценка полученных результатов. Типы наблюдений и принципы их реализации. Классификация опросов и анализ их эффективности.

    презентация [256,1 K], добавлен 18.12.2014

  • Криотерапия - полезный холод для красоты и здоровья. Особенности лечебного действия холода. Виды процедур (общая, локальная и частная). Криомассаж лица и волосистой части головы. Область применения криосауны. Показания для применения электрофореза.

    презентация [2,3 M], добавлен 06.02.2014

  • Сущность и область применения ядерной медицины. Предназначение и возможности компьютерной томографии. Методы исследования в рентгенодиагностике. Конструкция и описание рентгеновских аппаратов. Краткое описание и особенности современных рентгенаппаратов.

    лабораторная работа [1,9 M], добавлен 05.12.2010

  • Змеиный яд, его физические и химические свойства, особенности применения в медицине. Получение пантов из пятнистого оленя. Основные свойства мускуса и амбры, специфика и сферы его применения. Использование пиявок и бодяги в медицине и косметологии.

    курсовая работа [2,8 M], добавлен 22.01.2013

  • Понятие медицинской статистики. Виды средних величин, область их применения. Вариационный ряд, методика его построения и характеристика. Вычисление средней арифметической (простой и взвешенной, по способу моментов). Использование коэффициента вариации.

    реферат [79,0 K], добавлен 08.09.2015

  • Проявления количественных взаимосвязанностей между признаками. Основные понятия корреляционного анализа. Коэффициент парной корреляции и ранговый коэффициент. Определение тесноты связи между качественными признаками. Зависимость между методами лечения.

    методичка [61,2 K], добавлен 15.04.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.