Медицинская статистика
Группировка количественных признаков явления путем составления вариационных рядов. Оценка достоверности результата статистического исследования. Изучение взаимосвязи между признаками: корреляция и регрессия. Их распределение в статистической совокупности.
Рубрика | Медицина |
Вид | учебное пособие |
Язык | русский |
Дата добавления | 03.03.2018 |
Размер файла | 142,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Обратный метод применяется когда у исследователя нет сведений о числе наблюдений, но имеются сведения о структуре явления.
Так как в социально-гигиенических и клинических исследованиях мы имеет все интересующие нас данные, как об объеме совокупности, так и структуре явления, то обычно применяется прямой метод стандартизации, предусматривающий возможность вычисления общих и погрупповых интенсивных, а также стандартизованных показателей.
Прямой метод стандартизации состоит их 5-ти этапов:
1 этап - расчет общих и специальных интенсивных показателей для двух сравниваемых совокупностей;
2 этап - выбор и расчет стандарта
3 этап - вычисление ожидаемых чисел относительно стандарта
4 этап - вычисление стандартизованных показателей,
5 этап - сравнение стандартизованных показателей с интенсивными, выводы.
Пример: На основе приведенных данных сделайте заключение о влиянии состава больных на показатель летальности в двух больницах.
Распределение больных и умерших по двум больницам
Отделение |
Больница А |
Больница Б |
|||
Число прошедших больных |
Число умерших больных |
Число прошедших больных |
Число умерших больных |
||
Терапевтическое |
600 |
30 |
200 |
12 |
|
Хирургическое |
300 |
6 |
700 |
21 |
|
Инфекционное |
100 |
4 |
100 |
5 |
|
ВСЕГО |
1000 |
40 |
1000 |
38 |
Так как нам необходимо сделать заключение о влиянии состава больных на показатель летальности, то необходимо рассчитать стандартизованные показатели. Нам известны сведения о числе больных (объем совокупности) и структуре явления (распределение больных по отделениям), поэтому мы можем воспользоваться прямым методом стандартизации.
Ход вычисления:
1 этап - вычисление интенсивных показателей. В данном случае мы рассчитываем показатель общей летальности и по отделениям в двух больницах.
Больница А Больница Б
Для терапевтического отделения
600 - 30 200 - 12
100 - Х 100 - Х
Х = 30 х 100 / 600 = 5% Х = 12 х 100 / 200 = 6%
Для хирургического отделения
300 - 6 700 - 21
100 - Х 100 - Х
Х = 6 х 100 / 300 = 2% Х = 21 х 100 / 700 = 3%
Для инфекционного отделения
100 - 4 100 - 5
Х = 4% Х = 5%
Общий показатель летальности
1000 - 40 1000 - 38
100 - Х 100 - Х
Х = 4% Х = 3,8%
Показатели летальности в сравниваемых больницах (в %)
Отделение |
Больница А |
Больница Б |
|
Терапевтическое |
5,0 |
6,0 |
|
Хирургическое |
2,0 |
3,0 |
|
инфекционное |
4,0 |
5,0 |
|
Общий показатель |
4,0 |
3,8 |
При сравнении показателя летальности в 2-х больницах по каждому отделению видно, что летальность в отделениях больницы Б выше, чем в больнице А, а общий показатель летальности для всей больницы А выше, чем в больнице Б.
Чем же объяснить такое различие?
Возможно, это зависит от неоднородности состава прошедших больных по отделениям. В больнице Б больше хирургических больных, у которых летальность наименьшая. В больнице А больше терапевтических больных, у которых летальность выше, по сравнению с хирургическими больными. Поэтому необходимо показать какова была бы летальность в обеих больницах, если бы число прошедших больных по отделениям было бы одинаковым. Для этого необходимо выбрать стандарт и рассчитать стандартизованные показатели относительно него.
2 этап - выбор и расчет стандарта.
За стандарт можно принять сумму или полусумму сравниваемых совокупностей, одну из сравниваемых совокупностей, или любую отвлеченную совокупность.
В нашем примере за стандарт берем полусумму прошедших больных по отделениям больниц А и Б
Расчет стандарта:
Всего по двум больницам полусумма больных составляет 1000 человек.
1. (1000 + 1000) / 2 = 1000
2.Терапевтическое отделение
(600 + 200) / 2 = 400
3. Хирургическое отделение
(300 + 700) / 2 = 500
4. Инфекционное отделение
(100 + 100) / 2 = 100
5. ВСЕГО
400 + 500 + 100 = 1000
Далее вычисляем ожидаемые числа относительно данного стандарта исходя из интенсивных показателей.
3 этап - вычисление стандартизованных показателей, т.е. ожидаемых показателей летальности по стандарту.
Терапевтическое отделение
В терапевтическом отделении больницы А летальность составила 5%, т.е. из 100 больных умерло 5. Сколько умерло бы, если число прошедших больных составляло 400 (стандарт)?
Составляем пропорцию: 100 - 5
400 - Х
Х = 400 х 5 / 100 = 20
Аналогично рассчитывается для терапевтического отделения больницы Б.
100 - 6
400 - Х
Х = 400 х 6 / 100 = 24
Хирургическое отделение
В хирургическом отделении больницы А летальность составила 4%, т.е. из 100 больных умерло 2. Сколько умерло бы, если число прошедших больных составляло 500 (стандарт)?
Составляем пропорцию: 100 - 2
500 - Х
Х = 500 х 2 / 100 = 10
Аналогично рассчитывается для инфекционного отделения больницы Б.
100 - 3
500 - Х
Х = 500 х 3 / 100 = 15
Инфекционное отделение
В инфекционном отделении больницы А летальность составила 4%, т.е. из 100 больных умерло 4. Сколько умерло бы, если число прошедших больных составляло 100 (стандарт)?
Составляем пропорцию: 100 - 4, Х = 4
Аналогично рассчитывается для инфекционного отделения больницы Б.
100 - 5, Х = 5
Все результаты получаются в абсолютных числах.
Ожидаемые числа умерших в больнице А и Б (в абсолютных числах)
Отделения |
Ожидаемые числа умерших в больнице А |
Ожидаемые числа умерших в больнице Б |
|
терапевтическое |
20 |
24 |
|
хирургическое |
10 |
15 |
|
инфекционное |
4 |
5 |
|
ВСЕГО |
34 = (20+10+4) |
44 = (24+15+15) |
4 этап - вычисление стандартизованных показателей
Согласно нашим расчетам в целом по больнице А умерло бы 34 человека из 1000 (стандарт), соответственно на 100 больных показатель летальности составит:
1000 - 34
100 - Х
Х = 34 х 100 / 1000 = 3,4%
В больнице Б умерло бы 44 на 1000, соответственно 100 показатель составит:
1000 - 44
Х - 100
Х = 44 х 100 / 1000 = 4,4%
5 этап - сравнение стандартизованных показателей с интенсивными и выводы
Для этого полученные данные необходимо представить в виде таблицы
Показатели |
Больница А |
Больница Б |
Результаты сравнения |
|
Стандартизованные |
3,4% |
4,4% |
А < Б |
|
Общие интенсивные |
4% |
3,8% |
А > Б |
Вывод: сравнение стандартизованных показателей летальности в больницах А и Б, позволяет сделать заключение, что при одинаковом составе прошедших больных летальность была бы выше в больнице Б, чем в А.
При сравнении общих интенсивных показателей летальности результаты были противоположными (в А > Б) в связи с чем, что на общие интенсивные показатели оказал влияние различный состав прошедших больных по отделениям. Более высокий показатель летальности в больнице А объясняется преобладанием в ней больных терапевтического профиля, имеющих самую высокую летальность, а более низкий показатель летальности в больнице Б обусловлен преобладанием в ней больных хирургического профиля, имеющих самую низкую летальность.
СРЕДНИЕ ВЕЛИЧИНЫ
В научных экспериментальных и клинических исследованиях для оценки общей ситуации, сравнения общих уровней в различных статистических группах находят широкое применение средние величины.
Средняя величина - это, величина, которая одним числом характеризует всю совокупность в целом. Средняя величина - есть обобщение качественно однородных, но количественно отличающихся друг от друга величин. Средняя величина как бы выражает то общее, что характерно для признака в данной совокупности, но отличается друг от друга по своей величине.
При использовании средних величин надо соблюдать два важнейших условия:
средняя величина должна быть рассчитана на основе качественно однородных статистических групп.
Для отражения характерного размера изучаемого признака средние величины должны быть вычислены на массовых материалах, т.е. в совокупности должно быть достаточно большое число наблюдений.
Группировка количественных признаков изучаемого явления производится путем составления вариационных рядов.
Вариационный ряд - это ряд числовых значений изучаемого признака, отличающихся друг от друга по своей величине и расположенных в ранговом порядке (убывающем или возрастающем).
Характеристиками вариационного ряда являются:
Варианта (V) - числовое значение изучаемого признака,
частота (P) - повторяемость каждой варианты (частота встречаемости каждой варианты).
Общее число наблюдений (n), равное сумме частот - (P).
Вариационный ряд может быть простым, сгруппированным и интервальным.
В простом вариационном ряду каждая варианта встречается только один раз и составляется обычно при малом числе наблюдений <30
В сгруппированном вариационном ряду - варианты с одинаковой частотой встречаемости объединяются в группы, он составляется обычно при большом числе наблюдений >30. Но также может составляться и при числе наблюдений меньше 30.
При большом числе наблюдений (более 100) для облегчения расчетов и экономии времени составляется интервальный вариационный ряд.
При составлении интервального вариационного ряда необходимо:
1.определить количество групп в ряду, которое будет зависеть от числа наблюдений, чем больше наблюдений, тем больше групп. Группы вариант должны располагаться в определенном порядке (в восходящем или нисходящем). Количество групп определяется произвольно самим исследователем. Для удобства вычисления количество групп не должно превышать 10-12, при любом значении n.
2. Определить интервал между группами (i) используя формулу:
i = Vmax - V min / число групп
3.Определить границы и середину каждой группы.
4. Распределить изучаемую совокупность по группам.
Например: имеются данные о росте 56 студенток (n) 1 курса медицинского института 160, 158, 160, 163, 162, 170, 166, 165, 164, 170, 170, 168, 169, 175, 178 и т.д.
Определяем количество групп. У нас будет 7 групп, Vmax - 178, V min - 158, следовательно, интервал i = 178 - 158 / 7 = 2,7 или приравниваем к 3.
Составляем интервальный вариационный ряд:
Распределение студентов в зависимости от роста
Рост (в см) |
Число студенток |
Середина группы вариант |
|
158-160 |
4 |
159 |
|
161-163 |
6 |
162 |
|
164-166 |
21 |
165 |
|
167-169 |
11 |
168 |
|
170-172 |
9 |
171 |
|
173-175 |
4 |
174 |
|
176-178 |
1 |
177 |
При составлении интервального ряда необходимо учесть, что интервалы в группах должны быть одинаковыми.
Таким образом, средняя величина является обобщающей характеристикой количественных признаков совокупности и рассчитывается из вариационных рядов.
В санитарной статистике различают следующие виды средних величин:
1. мода (Мо)
2. медиана (Ме)
3. средняя арифметическая (М).
Средняя величина имеет следующие свойства:
занимает среднее положение.
имеет абстрактный характер
сумма отклонений всех вариант от условной средней величины равна нулю
средняя величина скрывает изменчивость признака и рассеянность вариационного ряда.
Мода - варианта, которая чаще других встречается в совокупности.
Медиана - варианта, занимающая в вариационном ряду срединное положение. Эта варианта делит вариационный ряд на две равные части. Для определения меридианы необходимо найти середину ряда. При нечетном числе вариант за медиану принимают варианту, имеющую срединное положение. При четном числе вариант за медиану принимают среднюю величину двух центральных вариант.
При сгруппированном вариационном ряде медиана вычисляется по специальной формуле.
Средняя арифметическая величина бывает простой, взвешенной и средней арифметической, рассчитанной по способу моментов.
Простая средняя арифметическая величина рассчитывается из простого вариационного ряда, в котором варианты встречаются только один раз и n <30. Средняя арифметическая простая вычисляется по формуле:
М = У V / n, где
У - знак суммы
V - варианты
n - число наблюдений
Например: измерен пульс у 9 человек: 65,60,61,75,70,76,62,68,63.
Составляем вариационный ряд:
V |
P |
|
60 |
1 |
|
61 |
1 |
|
62 |
1 |
|
63 |
1 |
|
65 |
1 |
|
68 |
1 |
|
70 |
1 |
|
75 |
1 |
|
76 |
1 |
|
9 |
Так как каждая варианта встречается только один раз, то вычисляем простую среднюю арифметическую величину:
М = У V / n
В среднем получаем М = (60+61+62+63+65+68+70+75+76) / 9 = 600 / 9 = 66,7 ударов в минуту
Средняя арифметическая взвешенная вычисляется, когда варианты встречаются по несколько раз и число наблюдений меньше 30.
М = У V х P / n, где
У - знак суммы
V - варианты
Р - частота встречаемости вариант
n - число наблюдений
Например: измерен вес 120 девятилетних мальчиков: 24, 21, 28, 30, 32, 32, 35, 35, 30, 30, 24, 25, 36, 37, 38, 31, 29 и т.д.
Так как варианты встречаются по несколько раз, то целесообразно провести вычисление взвешенной средней арифметической величины путем составления сгруппированного вариационного ряда.
V |
P |
VP |
|
21 |
1 |
21 |
|
22 |
1 |
22 |
|
23 |
2 |
46 |
|
24 |
3 |
72 |
|
25 |
4 |
100 |
|
26 |
8 |
208 |
|
27 |
14 |
378 |
|
28 |
26 |
728 |
|
29 |
28 |
696 |
|
30 |
15 |
450 |
|
31 |
9 |
279 |
|
32 |
4 |
128 |
|
33 |
2 |
66 |
|
34 |
1 |
34 |
|
35 |
2 |
70 |
|
36 |
1 |
36 |
|
37 |
2 |
74 |
|
38 |
1 |
38 |
|
Итого |
124 |
3446 |
Для вычисления взвешенной средней арифметической величины применяется формула: М = У V х P / n
Сначала мы перемножаем все варианты на соответствующую частоту наблюдения, находим сумму множителей, а затем дели на число наблюдений, в итоге получаем:
М = 3446 / 124 = 27,7 кг, т.е. средний вес девятилетних мальчиков, составляет 27,7 кг.
В тех случаях, когда варианты представлены большими числами (масса тела новорожденных, количество эритроцитов, лейкоцитов) или число наблюдений, выражено сотнями или тысячами, взвешенная средняя арифметическая вычисляется по способу моментов:
М = Мо + У (d х P) / n, где
Мо - условная средняя величина, обычно это мода
d - отклонение каждой варианты от условной средней
Р - частота встречаемости вариант
n - число наблюдений
Выражение У (d х P) / n называется моментом первой степени и показывает, на сколько отличается условная средняя величина от истинной средней.
Пример вычисления средней арифметической величины способом моментов:
Например: Измерен вес 120 девятилетних мальчиков: 24, 21, 28, 30, 32, 32, 35, 35, 30, 30, 24, 25, 36, 37, 38, 31, 29 и т.д.
Составляем вариационный ряд
V |
P |
d |
dP |
d2 |
d2P |
|
21 |
1 |
-8 |
- 8 |
64 |
64 |
|
22 |
1 |
-7 |
- 7 |
49 |
49 |
|
23 |
2 |
-6 |
- 12 |
36 |
72 |
|
24 |
3 |
-5 |
- 15 |
25 |
75 |
|
25 |
4 |
-4 |
- 16 |
16 |
64 |
|
26 |
8 |
-3 |
- 24 |
9 |
72 |
|
27 |
14 |
-2 |
- 28 |
4 |
56 |
|
28 |
26 |
-1 |
- 26 |
1 |
26 |
|
29 |
28 |
0 |
0 |
0 |
0 |
|
30 |
15 |
+1 |
+15 |
1 |
15 |
|
31 |
9 |
+2 |
+18 |
4 |
36 |
|
32 |
4 |
+3 |
+12 |
9 |
36 |
|
33 |
2 |
+4 |
+8 |
16 |
32 |
|
34 |
1 |
+5 |
+5 |
25 |
25 |
|
35 |
2 |
+6 |
+12 |
36 |
72 |
|
36 |
1 |
+7 |
+7 |
49 |
49 |
|
37 |
2 |
+8 |
+16 |
64 |
128 |
|
38 |
1 |
+9 |
+9 |
81 |
81 |
|
Итого |
У = 124 |
У = - 34 |
У = 952 |
Для расчета средней арифметической величины способом моментов мы вначале определяем условную среднюю величину, чаще всего это мода или величина, которая встречается в вариационном ряду наибольшее количество раз. В нашем примере это «29», так как это величина встречается 28 раз.
Затем определяем отклонение каждой варианты от моды. d - определяется по следующей формуле: V - Мо.
Таким образом, получаем, для 1-ой варианты это 21 - 29 = - 8,
для 2-ой варианты это 22 - 29 = - 7 и т.д.
Затем чисто арифметически находим произведение d х Р, d2 и d2P.
Подставляя полученные значения в формулу М = Мо + У (d х P) / n,
получаем: М = 29 + (-34) / 124 = 29 - 0,27 = 28,73
Внутреннюю структуру совокупности характеризует среднее квадратическое отклонение G (сигма), которая вычисляется по нижеследующим формулам:
1. для простой средней арифметической величины:
G = + SQR У d2 / n
2. для взвешенной средней арифметической величины:
G = + SQR У d2 х Р/ n
3. для средней арифметической величины, рассчитанной по способу моментов:
G = + SQR У d2 х Р/ n - (У d х Р / n)2
В статистике G - также называется моментом второй степени и используется для:
характеристики нормы и патологии. Для этого определяют предел или интервал между средней арифметической величиной и средним квадратическим отклонением.
Формула - средние данные (нормы) М + 1G
- данные выше средних М + 2G
- данные ниже средних М - 2G
- высокие данные М + 3G
- низкие данные М - 3G
Все значения, которые находятся за пределами 3G, являются патологическими.
2. для определения концентрированности вариационного ряда. Для этого применяется следующее уравнение:
М + 1G - 68,3% ;
М + 2G - 95,5%;
М + 3G - 99,0%.
То есть, если при М + 1G вокруг средней величины сконцентрировано 68,3% единиц наблюдения;
при М + 2G - 95,5% единиц наблюдения;
при М + 3G - 99,0% единиц наблюдения, то вариационный ряд является концентрированным. В противном случае составленный нами вариационный ряд будет рассеянным.
Рассчитаем концентрированность вариационного ряда для нашего последнего примера.
Для начала определим значение G. Так как средняя арифметическая величина рассчитана способом моментов, то G будет рассчитана по формуле:
G = + SQR У d2 х Р/ n - (У d х Р / n)2
В нашем примере G = + SQR 952/ 124 - (-34 / 124)2 = + 2,8
Всего число наблюдений (n) у нас = 124, М = 28,73 кг, G = + 2,8.
Находим интервал М + 1 G, т.е. 28,73 + 2,8. У нас получается интервал от 25,93 (28,73 - 2,8) до 31,53 (28,73 + 2,8). При этом все число наблюдений равно 100%, а число наблюдений в данном интервале - Х.
Отсюда составляем пропорцию: 124 - 100%
104 - Х ,
Х = 104 х 100 / 124 = 83,9%.
Вывод: для того, чтобы вариационный ряд был концентрированным в интервале М + 1 G должно располагаться не менее 68,3% единиц наблюдения, у нас получилось 83,9%. Значит, наш вариационный ряд является концентрированным.
ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ
Оценить достоверность результатов исследования это, значит, узнать, с какой вероятностью можно перенести результаты, полученные на выборочной совокупности, на всю генеральную совокупность.
Оценка достоверности необходима для того, чтобы по выборочной совокупности можно было судить о генеральной совокупности. Однако при этом надо знать несколько мы ошибаемся, взяв для изучения определенный объем (часть генеральной совокупности).
Для оценки достоверности результатов исследования необходимо:
1. вычислить ошибку репрезентативности (m)
2. определить доверительные границы
3. оценить достоверность одного показателя или разности показателей.
В отличие от ошибок методических, арифметических и логических ошибки репрезентативности не могут быть устранены, если не осуществлен переход на генеральное исследование. Например: если мы делим буханку хлеба на части, то, сколько бы мы не старались добиться точности все равно ошибка будет допущена, так как эта ошибка является независимой от исследователя. Однако ошибка может быть сведена к достаточно малой величине путем увеличения числа наблюдений (n) выборочного исследования.
Ошибка репрезентативности вычисляется по следующим формулам:
Ошибка репрезентативности относительной величины вычисляется по формуле:
mp = SQR P x q / n
где: Р - относительная величина (показатель)
n - число наблюдений
q - величина, обратная показателю, вычисляемая следующим образом:
а) если показатель Р выражен в процентах, то q = 100 - P
б) если показатель Р выражен в промиллях (%о), то q = 1000 - P
в) если показатель Р выражен в продецемиллях (%оо), то q = 10000 - P и т.д.
Ошибка репрезентативности средней арифметической величины вычисляется по формуле:
mм = G / SQR n
где: М - средняя арифметическая величина
G - среднее квадратическое отклонение
n - число наблюдений
При числе наблюдений меньше 30, в формулах расчета ошибок репрезентативности в знаменатель вводится поправочный коэффициент 1, поэтому формулы приобретают следующий вид:
mp = SQR P x q / n-1 или mм = G / SQR n-1
Исходя из вышесказанного каждая средняя или относительная величина, полученная на выборочной совокупности должна быть, представлена со своей ошибкой репрезентативности.
По величине ошибок определяют доверительные границы.
Доверительные границы - границы средних (или относительных) величин, выход за пределы которых вследствие случайных колебаний имеет незначительную вероятность. Доверительные границы выражаются следующими формулами:
Р ген = Рвыб + t x mp или Мген = Мвыб + t x mм
Где: Мген - значение средней величины, Рген - значение относительной величины, полученных при изучении генеральной совокупности;
Мвыб и Р выб - значение средней или относительной величины для выборочной совокупности;
mp и mм - ошибки репрезентативности выборочных показателей;
t - доверительный критерий Стъюдента (который устанавливает при планировании исследования).
Следовательно, определение доверительных границ есть определение крайних значений минимального и максимального значений для средней или относительной величины. Критерий достоверности, доверительный коэффициент (t) избирается исследователем исходя из необходимости получения результата с определенной степенью точности. Его величина зависит от числа наблюдений в данной выборочной совокупности, определяется по специальным таблицам. Данный критерий определяется по специальным таблицам. Согласно табличным данным, при t = 1 достоверность полученных данных составляет 68,3%, при t = 2 достоверность полученных данных составляет 95,5%, при t = 3 достоверность полученных данных составляет 99,0%,
Вероятность безошибочного прогноза - это вероятность, с которой можно утверждать, что в генеральной совокупности средняя или относительная величина будет находится в определенных пределах.
Достоверность одного показателя определяется соответственно по формулам:
Для относительной величины: t = Р / mp > 3
Для средней величины: t = М / mм > 3
Это означает, что если величина показателя больше своей ошибки в три и более раза, то вычисленный показатель достоверен и мы можем по нему судить о всей генеральной совокупности.
В медицине и биологии часто приходится сравнивать результаты исследований, полученные в разных группах. Например, сравнивают среднюю частоту пульса, давления, дыхания, длительность лечения в опытной и контрольной группах. При их сравнении оценивается не только полученные данные, но и достоверность разности показателей.
Достоверность разности показателей, вычисленных при выборочном исследовании означает, что вывод о их различии может быть перенесен на соответствующие генеральные совокупности. Достоверность разности сравниваемых величин оценивается следующими формулами:
Для относительных величин: t = Р1 - Р2 / SQR m12 + m22 > 2
Для средних величин: t = М1 - М2 / SQR m12 + m22 > 2
Где: М1, М2, Р1, Р2 - величины, полученные при выборочных исследований
m1 и m2 - их средние ошибки
t - критерий достоверности
Разность двух величин достоверна с вероятностью безошибочного прогноза на 95,5% при критерии достоверности t = 2. Для медико-биологических исследований эта степень вероятности вполне достаточна. Если же t < 2 степень вероятности безошибочного прогноза менее 95% при этом нельзя с достаточной уверенностью утверждать, что различия между этими величинами достоверны. В этом случае необходимо увеличить объем изучаемой совокупности. Если при увеличении числа наблюдений разность остается недостоверной, то можно сказать, что между сравниваемыми величинами нет различий.
Пример: у студентов медиков исследовали частоту пульса (в минуту) до и после сдачи экзамена. Частота пульса до экзамена составила М1 = 94,2 удара в минуту, m1 = + 3,9 удара в минуту; после экзамена М2 = 82,0 удара в минуту,
m2 + 4,1 удара в минуту.
По формуле определяем достоверность разности показателей (t).
t = М1 - М2 / SQR m12 + m22 > 2
t = 94,2 - 82 / SQR 3,92 + 4,12 = 12,2 / SQR 15,21 + 16,81 = 12,2 / 5,7 = 2,1
В данном случае разность между двумя средними величинами более 2, что позволяет с вероятностью безошибочного прогноза более чем на 95% утверждать, что эта разность достоверна и экзамен является фактором, действительно действующим на нервно-психическое состояние, что выражается в увеличении частоты пульса.
ИЗУЧЕНИЕ ВЗАИМОСВЯЗИ МЕЖДУ ПРИЗНАКАМИ. КОРРЕЛЯЦИЯ И РЕГРЕССИЯ
Корреляция - латинское слово, означающее взаимосвязь, взаимозависимость. Различают функциональную и корреляционную связь между признаками или явлениями.
При функциональной связи каждой отдельной величине соответствует определенная взаимосвязанная с ней другая величина, т.е. изменение одной величины строго ведет к изменению другой величины на определенное значение. Например: с изменением радиуса меняется площадь круга, или с увеличением температуры нагрева увеличивается объем тела и т.д.
При корреляционной связи одной величине соответствует несколько других, варьирующих значений взаимосвязанного признака или явления. Примером корреляционной связи может служить зависимость веса тела от роста. Если измерить вес группы детей одинакового роста, то величина веса у них будет различна, и варьировать в определенных пределах, так как на величину веса влияет не только рост человека, а также питание, состояние здоровья, нервно-психическое состояние и т.д.
Для измерения и оценки связи необходимо вычислить коэффициент корреляции, который дает представление о размере и характере связи между явлениями или признаками.
По характеру связь между признаками или явлениями может быть прямой и обратной.
При прямой связи - изменение одного признака ведет к изменению взаимосвязанного с ним другого признака в одном и том же направлении.
Например: с увеличением роста ребенка увеличивается его вес. Прямая связь обозначается знаком плюс (+).
При обратной связи - с изменением одного признака в одном направлении взаимосвязанный с ним другой признак изменяется в противоположенном направлении. Например, с увеличением эффективности проводимых профилактических прививок, число инфекционных заболеваний уменьшается; или с увеличением температуры воздуха, уменьшается число бронхитов. Коэффициент корреляции, характеризующий обратную связь, обозначается знаком (-).
Размер связи колеблется от + 1 до 0.
По величине коэффициента корреляции различают полную, сильную, среднюю, слабую связь и отсутствие связи.
Размер связи представлен в таблице.
Размер связи |
Прямая связь (+) |
Обратная связь (-) |
|
Полная (функциональная) |
+ 1 |
- 1 |
|
Сильная |
(+ 0,7) - (+ 1) |
(- 1) - (- 0,7) |
|
Средняя |
(+ 0,3) - (+ 0,69) |
(- 0,3) - (- 0,69) |
|
Слабая |
0 - (+ 0,29) |
(- 0,29) - 0 |
|
Отсутствие связи |
0 |
0 |
В статистике существует несколько методов определения коэффициента корреляции. В частности, к ним относятся:
1. метод рангов (метод Спирмена)
2. метод квадратов (метод Пирсона).
Метод Спирмена или метод ранговой корреляции - является наиболее простым методом определения связи, но менее точным. Этот способ применяется при:
небольшом числе наблюдений, т.е. не более 30 парных величин
когда нет необходимости в точных расчетах измерения размера связи, а нужды лишь ориентировочные данные,
когда один из признаков или оба выражены качественными характеристиками.
Коэффициент корреляции в данном случае определяется по формуле:
с = 1 - 6 У d2 / n (n2 - 1)
Где : с - коэффициент ранговой корреляции
n - число парных членов, признаков
d - разность рангов
У - знак суммы
1 и 6 - постоянные числа
Например: определите характер и размер связи между стажем работы ткачих и понижением слуха у них.
Стаж работы (Х) |
Понижение слуха в 100% (У) |
ранги |
Разность рангов |
|||
Х |
У |
d (Х-У) |
d2 |
|||
До 1 года |
1,0 |
1 |
1 |
0 |
0 |
|
1 - 4 года |
6,0 |
2 |
2 |
0 |
0 |
|
5 - 9 лет |
10,0 |
3 |
4 |
- 1 |
1 |
|
10 - 14 лет |
8,0 |
4 |
3 |
+1 |
1 |
|
15 - 19 лет |
15,0 |
5 |
6 |
- 1 |
1 |
|
20 - 24 лет |
12,0 |
6 |
5 |
+1 |
1 |
|
25 - 29 лет |
15,0 |
7 |
6 |
+1 |
1 |
|
30 и более |
20,0 |
8 |
7 |
0 |
0 |
|
Итого |
5 |
Расположить значения в ранговом порядке - это значить определить их месторасположение в порядке убывания или возрастания.
d = Х - У или разность между рангами
Коэффициент корреляции рассчитываем по формуле:
с = 1 - 6 У d2 / n (n2 - 1)
с = 1 - 6 х 5 / 8 х (64 - 1) = 1 - 30 / 504 = 1 - 0,06 = + 0,94
Вывод: Коэффициент корреляции + 0,94, указывает на прямую сильную связь, т.е. с увеличением стажа работы увеличивает показатель снижения слуха у ткачих.
Метод квадратов или метод Пирсона применяется в тех случаях, когда:
число парных вариант не превышает 30
при необходимости определения более точного размера связи
если признаки имеют только количественное выражение
Коэффициент корреляции методом Пирсона вычисляется по формуле:
r = У dx x dy / SQR У dx2 x У dy2
где dx и dy - отклонение вариант от своих средних величин
r - коэффициент корреляции
Например: определить характер и размер связи между максимальным и минимальным давлением у лиц в возрасте от 25 до 45 лет.
Максимальное давление (Х) |
Минимальное давление (У) |
dx |
dy |
dx2 |
dy2 |
dx x dy |
|
126 |
76 |
-5 |
-18 |
25 |
324 |
+90 |
|
126 |
81 |
-5 |
-13 |
25 |
169 |
+65 |
|
129 |
81 |
-2 |
-13 |
4 |
169 |
+26 |
|
126 |
94 |
-5 |
+0 |
25 |
0 |
0 |
|
136 |
96 |
+5 |
+2 |
25 |
4 |
+10 |
|
136 |
101 |
+5 |
+7 |
25 |
49 |
+35 |
|
136 |
101 |
+5 |
+7 |
25 |
49 |
+35 |
|
130 |
102 |
-1 |
+8 |
1 |
64 |
-8 |
|
131 |
102 |
0 |
+8 |
0 |
64 |
0 |
|
135 |
104 |
+4 |
+10 |
16 |
100 |
+40 |
|
У = 1311 |
У = 938 |
У = 171 |
У = 992 |
У = +293 |
n = 10
Последовательность вычисления:
Находим простую среднюю арифметическую величину для вариационного ряда Х и У, т.е. Мх и Му
Мх = сумма всех значений вариационного ряда Х / число наблюдений
Мх = У Vx / n , т.е. Мх = 1311 / 10= 131,1; для облегчения дальнейших
расчетов полученное значение можно округлить до 131;
Му = сумма всех значений вариационного ряда У / число наблюдений
Му = У Vу / n , т.е. Му = 938 / 10= 93,8; для облегчения дальнейших
расчетов полученное значение можно округлить до 94;
2. Определяем отклонение - d по формуле:
dx = Vx - Mx; dy = Vy - My
d = 126 - 131,1 = - 5,1 и т.д.
3. Возводим отклонение в квадрат
4. Находим сумму квадратов
5. Находим произведение отклонений
6. Вычисляем коэффициент корреляции
r = + 293 / SQR 171 x 992= +0,71
7. Вывод коэффициент корреляции +0,71 указывает на прямую и сильную связь между уровнем максимального и минимального давления.
Для того, чтобы определить на сколько результат полученный, при выборочном исследовании отличается от результата, полученного при сплошном исследовании (генеральной совокупности) необходимо вычислить ошибку репрезентативности коэффициента корреляции (mr)
mr = SQR 1 - r2 / n - 2
Для нашего примера ошибка будет равна: mr = SQR 1 - (0,71)2 / 10 - 2 = 0,25
Таким образом, коэффициент корреляции указывает на направление и силу взаимосвязи.
РЕГРЕССИЯ
Коэффициент корреляции указывает лишь на направление и силу связи между двумя переменными величинами, но не дает возможности судить о том, как количественно меняются величины одного по мере изменения другого признака. Ответ на этот вопрос дает метод расчета коэффициента регрессии.
Регрессия - это функция, позволяющая по величине одного коррелируемого (связанного) признака определить средние величины другого признака. С помощью регрессии можно определить, на какую величину изменится одна величина при изменении другой величины на единицу.
Коэффициент регрессии определяется по формуле:
R = r х Gy / Gx;
где G - среднее квадратическое отклонение признаков,
r - коэффициент корреляции
На основе предыдущего примера из таблицы вычислим G
Как показано в таблице, нами составлен простой вариационный ряд, поэтому среднее квадратическое отклонение будет определяться по формуле:
G = SQR E d2 / n - 1, т.к. число наблюдений меньше 30, то в знаменатель введена поправка 1.
Gx = 171 / 10 - 1= ± 4,4 Gy = SQR 992 / 10 - 1 = ± 10,5
Отсюда вытекает, что R = 0,71 x 10,5 / 4,4 = 1,7
Следовательно, при изменении максимального артериального давления
на 1 мм.рт.ст. минимальное давление увеличивается в среднем на 1,7 мм.рт.ст.
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ
Боярский А.Я. Общая теория статистики. - М. - 1977. - 460 с.
Искандаров Т.И., Маматкулов Б. Санитария-статистик ва ижтимоий-гигиеник тадкикот услублари. - Ташкент. - 1994. - 200 с.
Мерков А.М., Поляков Л.Е. Санитарная статистика. - Л. - 1974. - 432 с.
Серенко А.Ф., Ермакова В.В. Социальная гигиена и организация здравоохранения. - М. - 1984. - 562 с.
Шиган Е.Н. Статистические методы и вычислительная техника в социально-гигиенических исследованиях. - М. - 1977. - 250 с.
Размещено на Allbest.ru
...Подобные документы
Проявления количественных взаимосвязанностей между признаками. Основные понятия корреляционного анализа. Коэффициент парной корреляции и ранговый коэффициент. Определение тесноты связи между качественными признаками. Зависимость между методами лечения.
методичка [61,2 K], добавлен 15.04.2009Основы медицинской статистики. Методы отбора единиц наблюдения и сбора статистической информации. Организация (этапы) статистического исследования. Число единиц наблюдения и учетные признаки. Высокая заболеваемость гастритом у студентов-старшекурсников.
методичка [39,1 K], добавлен 20.03.2009Алгоритм вычисления параметров взвешенного вариационного ряда. Статистическая оценка достоверности результатов медико-статистического исследования это ряд этапов, а точность результатов зависит от отдельных этапов. Величина ошибки репрезентативности.
методичка [69,7 K], добавлен 19.04.2009Организация работы отделения медицинской статистики Областного противотуберкулёзного диспансера, нормативные и учетные документы, регламентирующие его деятельность. Статистический анализ основных количественных и качественных показателей работы ЛПУ.
отчет по практике [78,3 K], добавлен 19.07.2010Статистика состояния здоровья населения. Методы изучения общественного здоровья и общей заболеваемости. Организация специального учета важнейших неэпидемических заболеваний и методика изучения заболеваемости с временной утратой трудоспособности.
контрольная работа [24,6 K], добавлен 02.07.2013Средняя величина – количественная обобщающая характеристика однородной совокупности с изменяющимся варьирующим признаком. Виды средних величин и методы их вычисления. Оценка достоверности статистических показателей. Оценка физического развития населения.
курсовая работа [23,6 K], добавлен 10.11.2013Задачи генетики. Краткая история развития представлений о наследственности. Опыты Менделя. Дискретное наследование признаков. Моно- и дигибридное скрещивание. Взаимодействие генов. Наследование количественных признаков. Предшественники Г. Менделя.
презентация [3,7 M], добавлен 14.04.2014Медицинская статистика, как область науки и практическая деятельность, направленная на сохранение и укрепление здоровья людей, предупреждение и лечение болезней. Методы сбора информации, ее обработки и анализа, имеющиеся в арсенале медицинской статистики.
презентация [1,8 M], добавлен 24.03.2016Объекты судебно-медицинской экспертизы (живые лица, трупы, вещественные доказательства). Поздние трупные явления. Судебно-медицинская характеристика огнестрельных повреждений, их различие в зависимости от расстояния, с которого был произведен выстрел.
контрольная работа [17,1 K], добавлен 04.07.2010История становления государственной статистики в РФ. Организация работы медицинского учреждения. Социальный портрет кадрового состава и особенности работы информационно-статистического отделения. Медицинские статистические показатели и их определение.
дипломная работа [213,6 K], добавлен 25.11.2011Оказание доврачебной помощи пострадавшим. Определение понятия "реанимационные мероприятия" и описание признаков терминального состояния. Формулирование алгоритма действий и оценка эффективности сердечно-легочной реанимации, анализирование осложнений.
курсовая работа [58,2 K], добавлен 18.03.2015Сон как одно из главных средств восстановления работоспособности. Изучение явления сна, причины возникновения бессонницы. Функциональные расстройства сна, поведение анализаторов во время сна. Средства усыпляющего воздействия, воздействие ароматов на сон.
реферат [25,5 K], добавлен 12.03.2010Изучение признаков отморожения, химических ожогов (кислотами, щелочами, фосфором) и отравления (сероводородом, хлором, СО, этиловым спиртом). Симптоматические проявления синдрома длительного сдавливания. Первая медицинская помощь при несчастных случаях.
контрольная работа [27,5 K], добавлен 09.02.2010Характеристика вирусных гепатитов с фекально-оральным механизмом передачи и передающихся половым и парентеральным путем. Оценка состояния обмена билирубина, активности ферментов и щелочной фосфатазы в сыворотке крови. Корреляция биохимических показателей.
дипломная работа [219,5 K], добавлен 13.01.2015Особенности анатомической классификации кровотечений, алгоритм действий при оказании первой медицинской помощи. Анализ различий между артериальным и венозным кровотечением. Основные способы временной остановки кровотечения. Правила наложения жгута.
реферат [350,1 K], добавлен 07.02.2015Правила и порядок осмотра пострадавшего в ЧС мирного и военного времени. Определение признаков жизни, смерти, клинической смерти. Психология толпы и правила поведения спасателей, способы удаления паникеров. Виды медицинской помощи. Медицинская сортировка.
презентация [430,3 K], добавлен 14.02.2011Классификация и клинические разновидности аномалий зубных рядов в трансверзальном направлении. Сужение и расширение зубных рядов в различные возрастные периоды. Особенности диагностики и лечения данных патологий, применяемые принципы и методики.
презентация [2,4 M], добавлен 10.04.2013Понятие и сущность травматической болезни, характеристика патогенеза. Медицинская помощь пострадавшему на месте происшествия. Организационно-тактические мероприятия на месте ДТП. Способы перпеноски пострадавшего, изучение коррекции гермодинамики.
презентация [3,3 M], добавлен 16.03.2023Характеристика клинических разновидностей аномалий зубных рядов в сагиттальном и вертикальном направлениях. Особенности стоматологического лечения укорочения и удлинения зубных рядов. Типичные формы зубных дуг при различных видах аномалии окклюзии.
презентация [1,2 M], добавлен 10.04.2013Предубойная и послеубойная диагностика отравлений животных. Отбор проб для лабораторного исследования от туш и органов животных, убитых с признаками отравления. Санитарная оценка мяса и субпродуктов при отравлении животных различными ядовитыми веществами.
курсовая работа [23,4 K], добавлен 03.07.2009