Основные понятия и определения биостатистики
Особенности применения биостатистики в практической деятельности врача. Анализ медико-биологических данных на основе их графического представления. Теория проверки статистических гипотез. Оценка чувствительности и специфичности диагностических тестов.
Рубрика | Медицина |
Вид | учебное пособие |
Язык | русский |
Дата добавления | 07.09.2016 |
Размер файла | 2,4 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Доверительный интервал для разности генеральных средних двух зависимых групп
При сравнении одних и тех же объектов «до» и «после» оценивается средняя разность значений признака, измеренного «до» и «после», а также среднеквадратическое отклонение этих разностей sd .
Доверительный интервал генеральной средней разности лежит в пределах
от до
где tб - критическое значение двустороннего t-критерия Стъюдента для заданного б и (п-1) степеней свободы.
Интерпретация.
· Если доверительный интервал для средней разности включает в себя ноль, то принимается нулевая гипотеза о равенстве двух генеральных средних.
· Верхний и нижний предел доверительного интервала для разности может быть использован для клинической оценки разности двух средних.
Пример. В группе из 6 человек изучалось влияние пробежки на ЧСС (уд/мин). В результате опыта получилось 2 вариационных ряда ЧСС: первый - до пробежки, второй - после пробежки:
До пробежки, уд/мин. |
65 |
75 |
68 |
80 |
75 |
62 |
|
После пробежки, уд/мин. |
77 |
82 |
65 |
9 |
85 |
75 |
|
Разница, уд/мин. |
12 |
7 |
-3 |
10 |
10 |
13 |
Доверительный интервал относительных показателей
Относительная частота р встречаемости того или иного признака - т.е. доля объектов с данным признаком среди всех обследуемых объектов, найденная по выборке объемом n отражает генеральную долю с некоторой ошибкой. Доверительный интервал для доли лежит в пределах
от до
Доверительный интервал разности двух генеральных долей имеет следующее выражение
где tб - критическое значение двустороннего t-критерия Стъюдента для заданного б и (п1+ п2-1) степеней свободы.
Пример. Согласно выборочным исследованиям доля курящих среди женщин составляет 10%. Насколько точно определена эта доля, можно ли отнести эти данные на всю генеральную совокупность?
всего опрошено женщин |
доля курящих |
нижний предел 95% ДИ |
верхний предел 95% ДИ |
|
1020 |
10% |
8,2% |
11,8% |
|
Доверительный интервал для доли неширокий, можно говорить о достаточной точности результатов: с вероятностью 95% доля курящих в генеральной совокупности женщин составляет от 8,2% до 11,8%
Пример. Выборочные исследования показали, что доля инфекционных заболеваний в общей структуре заболеваемости в одном регионе составляет 20%, в другом - 37%, с разницей в 17%. Необходимо проверить, действительно ли эта разница существует, или она носит случайный характер, и насколько эти результаты существенны с точки зрения общественного здравоохранения.
Непараметрические критерии проверки статистических гипотез
Проблема. При испытании нового лекарственного препарата на лабораторных мышах было проведено взвешивание после месячного приема. В эксперименте изучались две группы мышей: опытная (n1=9), которой давали новый препарат и контрольная, принимавшая плацебо (n2=11).
Были получены следующие данные по весу (г)
Опытная гр. |
80 |
76 |
75 |
64 |
70 |
68 |
72 |
79 |
83 |
|||
Контрольная гр. |
70 |
78 |
60 |
80 |
62 |
68 |
73 |
60 |
71 |
66 |
69 |
Так как эти данные выборочные, то для выяснения этого вопроса можно было бы найти средние значения веса и сравнить по критерию Стъюдента. Но, вспомним, что основным условием применения t - критерия является нормальное распределение признака. В нашем случае распределение веса неизвестно и проверить его нельзя из-за ограниченности объема выборки.
Еще один проблемный случай. Как правило, имеющийся дефицит гемодиализной помощи не позволяет уделять должного внимания проблеме лечения терминальной хронической почечной недостаточности у пожилых лиц. Для выяснения действительно ли существует такая проблема, было решено сравнить возрастной состав лиц, лечившихся гемодиализом в странах с развитой экономикой и развивающихся странах. Случайным образом были сформированы выборки таких больных (n1=7, n2=8) в двух странах с различным уровнем развития, и определен возрастной состав.
Исследуемый признак - возраст - является качественным ординальным, для него нельзя вычислить ни среднее значение, ни дисперсию, нельзя определить распределение.
В случае если распределение случайной величины неизвестно, а также если изучаемые признаки являются качественными ординальными, то для проверки гипотезы о принадлежности двух сравниваемых выборок одной генеральной совокупности может применяться и целый ряд непараметрических критериев, среди которых важное место занимают так называемые ранговые критерии. Применение этих критериев основано на ранжировании членов сравниваемых групп. При этом сравниваются не сами члены ранжированного ряда, а их порядковые номера или ранги.
Вспомним, что выбор критерия определяется также тем, являются ли сравниваемые выборки зависимыми или независимыми.
СЛУЧАЙ 1. Выборки независимы.
Весьма распространенным непараметрическим критерием является U-критерий Манна-Уитни. Рассмотрим расчет этого критерия на примере второго проблемного случая.
Сформулируем гипотезы:
Н(0): Возрастной состав лиц, получающих лечение гемодиализом, не зависит от уровня экономического развития страны
Н(1): Возрастной состав лиц, получающих лечение гемодиализом, не одинаков в странах с различным экономическим уровнем (ненаправленная гипотеза)
Выберем уровень значимости б=0,01
Вычислим значение U-критерия по следующему алгоритму
• Объединим все значения обеих выборок в один ранжированный ряд
№ |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
|
1гр |
Р |
ПД |
Ю |
Ю |
В |
В |
ПЖ |
||||||||
2гр |
Р |
Р |
Р |
Ю |
В |
В |
ПЖ |
||||||||
ранг |
2,5 |
2,5 |
2,5 |
2,5 |
5 |
7 |
7 |
7 |
10,5 |
10,5 |
10,5 |
10,5 |
14 |
14 |
• Каждому элементу этого ряда присвоим ранг, при этом, если несколько элементов ряда совпадают по величине, то каждому присваивается ранг, равный среднему арифметическому их номеров
• Для каждой выборки находятся суммы рангов
R1 = 2,5+5+7+7+10,5+10,5+14=56,5
R2 =2,5+2,5+2,5+7+10,5+10,5+14+14=63,5
• Рассчитываются статистики:
где i=1,2 номера выборок
U1 = 56,5 - 7 * 8/2 =28,5
U2= 63,5 -8*9/2 = 27,5
Для проверки правильности расчетов можно использовать следующее соотношение
В качестве критерия выбираем наименьшую из двух сумм Uвыч = 27,5 и сравниваем ее с табличным значением для nl =7, n2 = 8 и уровня значимости б=0,01 Uкрит = 6 (Приложение 3, двусторонний тест).
• Если Uвыч > Uкрит то принимается Н(0)
• Если Uвыч ? Uкрит то принимается Н(1)
В нашей задаче вычисленное значение критерия больше табличного, поэтому принимается нулевая гипотеза, и различия в возрастном составе между группами считаются статистически незначимыми (нет аргументов отвергнуть нулевую гипотезу).
Но окончательно принять нулевую гипотезу мы пока еще не можем, возможно, мы обнаружим различия, если увеличим объем выборки и применим параметрический критерий. Но этот вопрос относится уже к проблемам планирования эксперимента.
СЛУЧАЙ 2. Выборки зависимы.
Проблема. Необходимо определить влияет ли новый препарат на содержание холестерина в плазме крови. С этой целью препарат был испытан на десяти кроликах. В результате получены следующие данные
Концентрация холестерина |
|||||||||||
«До», ммоль/л |
6,3 |
7 |
6,8 |
5,6 |
4,8 |
7,2 |
6,2 |
5 |
8,1 |
7,9 |
|
«После», ммоль/л |
4,8 |
4,6 |
3,3 |
5,6 |
6,3 |
5,1 |
4,7 |
6,3 |
5,5 |
6,2 |
Исследуемый признак количественный, закон распределения для которого неизвестен и его нельзя оценить вследствие малой выборки, а выборки являются зависимыми (попарно связанными). В таком случае можно использовать непараметрический Т-критерий Уилкоксона.
Выдвигаем гипотезы:
Н(0): В генеральной совокупности содержание холестерина в плазме крови после приема препарата не изменяется, или «препарат не влияет на содержание холестерина в плазме крови», или «две выборки извлечены из одной генеральной совокупности»
Н(1): В генеральной совокупности содержание холестерина в плазме крови после приема препарата изменяется (ненаправленная гипотеза)-
Выберем уровень значимости б = 0,05
Т-критерий Уилкоксона вычисляется по следующему алгоритму
· Вычисляются попарные разницы значений «до» и «после»
Концентрация холестерина |
|||||||||||
«До», ммоль/л |
6,3 |
7 |
6,8 |
5,6 |
4,8 |
7,2 |
6,2 |
5 |
8,1 |
7,9 |
|
«После», ммоль/л |
4,8 |
4,6 |
3,3 |
5,6 |
6,3 |
5,1 |
4,7 |
6,3 |
5,5 |
6,2 |
|
Разница, ммоль/л |
1,5 |
2,4 |
3,5 |
0 |
-1,5 |
2,1 |
1,5 |
-1,3 |
2,6 |
1,7 |
|
Ранжир. ряд |
0 |
-1,3 |
-1,4 |
1,5 |
-1,5 |
1,5 |
1,7 |
2,4 |
2,6 |
3,5 |
|
Ранги |
1 |
2 |
3 |
3 |
3 |
4 |
5 |
6 |
7 |
||
Т+ |
28 |
||||||||||
Т- |
6 |
· Попарные разницы, кроме нулевых, без учета знака ранжируются в один ряд
· Разницам, кроме нулевых, присваиваются ранги, при чем одинаковым по модулю величинам присваивают одинаковый ранг
· Отдельно вычисляют сумму рангов положительных (Т+) и отрицательных разностей (Т-),
Т+ = 3+3+4+5+6+7=28
Т- = 1+2+3=6
· Меньшую из двух таких сумм без учета знака выбирают в качестве критерия:
Твыч = 6
Табличное значение для уровня значимости б = 0,05 и числа пар наблюдений п=10 (двусторонний критерий, Приложение 4):
Ткрит = 9
· Если Твыч > Ткрит то Н(0)
· Если Твыч ? Ткрит то Н(1)
В нашем случае вычисленное значение критерия меньше табличного и принимается альтернативная гипотеза.
Вывод: Содержание холестерина в плазме крови после приема препарата изменяется с вероятностью не менее 95%.
Анализ качественных признаков. Таблицы сопряженности
Проблема. В ходе наблюдения за беременными, страдающими преэклапсией (эклампсия -- это наиболее тяжелая форма токсикоза беременных) было отмечено, что на ранних сроках беременности выраженное ожирение у них регистрировалось чаще, чем в целом в популяции. Возможно, это только впечатление отдельного врача, но поскольку это осложнение беременности слишком грозно, чтобы пренебрегать любыми возможностями предсказать и предотвратить его, все-таки необходимо проверить, является ли выраженное ожирение фактором риска возникновения преэклампсии, и если да, то насколько серьезно (клинически значимо) оно увеличивает этот риск в отношении отдельно взятой пациентки. Для этого необходимо проанализировать частоту встречаемости ожирения, возможно среди женщин с преэклампсией эта патология регистрируется чаще, чем среди тех, кто не имеет этого грозного осложнения беременности.
Существует множество признаков, различных явлений и вещей, измерение которых затруднено или вовсе невозможно. Например, как измерить признак «вид патологии» или «профессия», а как сравнить эти признаки для получения статистического представления о профессиональной заболеваемости?
В этих случаях изучается распространенность признаков, частота встречаемости признаков (доля объектов с интересующим нас признаком) в различных выборках, оценивается взаимосвязь частоты встречаемости одного признака с частотой встречаемости другого признака.
Для этого используются таблицы сопряженности. Столбцы этой таблицы обозначают градации одного признака, строки - градации другого признака. В каждой ячейке записывается число случаев с сопряженными признаками.
Наиболее простой случай таблица 2х2 (исследуется частота совместного распространения двух признака, каждый из которых имеет две градации). Еще их называют четырехпольными таблицами.
В общем случае Н(0) формулируется следующим образом:
· в генеральных совокупностях доля объектов с интересующими нас признаками одинакова
· или частота встречаемости одного признака не зависит от частоты встречаемости другого признака
· или какой-либо фактор не влияет на частоту встречаемости признака (признаков)
СЛУЧАЙ 1. Выборки независимые
Предположим, что у нас есть два качественных признака, характеризующие обследованных лиц. Занесем эти данные в таблицу сопряженности
Первый признак (первая градация) |
Первый признак (вторая градация) |
Всего |
||
Второй признак (первая градация) |
Частота встречаемости a |
Частота встречаемости b |
a +b |
|
Второй признак (вторая градация) |
Частота встречаемости c |
Частота встречаемости d |
с+d |
|
n1=a+c |
n2=b+d |
n =a+b+c+d |
Критерий хи-квадрат Пирсона вычисляется по формуле
Но для таблицы 2х2 более точные результаты дает критерий с поправкой Йетса
Его критическое значение находится для заданного уровня значимости б и числа степеней свободы f=(n-1)(m-1), где n и m число строк и число столбцов в таблице сопряженности.
Если то Н(0) принимается,
В случае принимается Н(1)
Когда число наблюдений невелико и в клетках таблицы встречается частота меньше 5, критерий хи-квадрат неприменим и для проверки гипотез используется точный критерий Фишера. Процедура вычисления этого критерия достаточно трудоемка и в этом случае лучше воспользоваться компьютерными программами статанализа.
По таблице сопряженности можно вычислить меру связи между двумя качественными признаками - ею является коэффициент ассоциации Юла Q (аналог коэффициента корреляции)
Q лежит в пределах от 0 до 1. Близкий к единице коэффициент свидетельствует о сильной связи между признаками. При равенстве его нулю - связь отсутствует.
Аналогично используется коэффициент фи-квадрат (ц2)
Таблицы сопряженности могут иметь и более сложный вид, когда каждый признак имеет более двух градаций. Нулевая гипотеза заключается в отсутствии связи между этими признаками. Ниже приведен пример подобного случая - нужно выяснить есть ли взаимосвязь между профессией и обращаемостью к врачу.
профессия |
всего |
|||||
обращаемость к врачу |
строители |
шахтеры |
учителя |
госслужащие |
||
до 3 в год |
21 |
26 |
19 |
17 |
83 |
|
от 4 до 6 в год |
9 |
15 |
12 |
6 |
42 |
|
более 6 в год |
7 |
8 |
6 |
4 |
25 |
|
всего |
37 |
49 |
37 |
27 |
150 |
Анализ таких таблиц также предпочтительно проводить с использованием компьютерных программ.
СЛУЧАЙ 2. Выборки зависимые
Проблема. Острые респираторные вирусные инфекции (ОРВИ) являются серьезной проблемой здравоохранения во многих регионах мира в связи с их широкой распространенностью и наносимым ими значительным социально - экономическим ущербом. Исследования показали, что у 92-94 % детей, страдающих частыми респираторно-вирусными заболеваниями, имел место дисбактериоз кишечника. Наличие дисбаланса нормофлоры, снижая антиинфекционную резистентность организма ребенка, не только сопровождает, но и влияет на частоту и характер течения острой респираторной инфекции у детей, способствуя развитию осложнений, что и позволяет считать терапевтическое и профилактическое применение биологических препаратов целесообразным и патогенетически обоснованным.
Стояла задача изучить эффективность пробиотика метаболитного типа в комплексной терапии у детей при осложненной смешанной респираторной вирусной инфекции и его влияние на микробиоценоз кишечника. В исследовании приняли участие 32 больных в возрасте от 1 мес. до 13 лет со среднетяжелыми и тяжелыми осложненными формами ОРВИ. Были получены следующие данные.
Название микроорганизмов |
Уровень микроорганизмов |
Частота нарушений микрофлоры кишечника |
||
до лечения % |
после лечения % |
|||
Lactobacillus |
< 106 |
43,8 |
15,6 |
Над одними и теми же объектами проводятся два наблюдения: «до» и после. (прием лекарства, обучение, внушение и т.д.)
Подсчитывается сколько раз данное свойство встречается:
• и «до» и «после», (+,+)
• только «до» (+,-)
• только «после» (-,+)
• ни «до» ни «после» (-,-)
Признак «после» |
|||
Признак «до» |
Вторая градация «после» (-) |
Первая градация «после» (+) |
|
Первая градация «до» (+) |
A Число изменений от (+) к (-) |
b Число сохранивших (+) |
|
Вторая градация «до» (-) |
C Число сохранивших (-) |
D Число изменений от (-) к (+) |
Н(0) -частота встречаемости градаций признака после воздействия фактора не изменилось
Критерием для проверки нулевой гипотезы является хи-квадрат Макнемара
Если то Н(0) принимается,
Еслито принимаем Н(1)
В задаче с эффективностью пробиотика составим следующую таблицу сопряженности для зависимых выборок. В ячейку a запишем число лиц, у которых был обнаружен дисбактериоз до лечения, но не обнаружен после (28,2% или 9 человек из 32). В ячейку b - число лиц, которым лечение не помогло (15,6% или 5 человек), в ячейку с - долю лиц, у которых как не было дисбактериоза, так и нет (56,2% или 18 человек), и в ячейку d - долю лиц, у которых после лечения вдруг он обнаружился (в нашем случае таких не было).
Определим 95%ДИ для разности долей, он составляет от 12,5до 43,7%. Доверительный интервал достаточно широкий, т.е. доля лиц с положительны эффектом от лечения определена неточно, что может быть связано с недостаточным объемом выборки. Однако, даже нижний предел ДИ свидетельствует о клиническом эффекте от применения препарата.
Оценка факторов риска
Таблица сопряженности часто используется для оценки риска и шансов неблагоприятного исхода в связи с каким-либо фактором (например, риска возникновения рака легких у курящих).
Риском называется вероятность возникновения неблагоприятного исхода, и, как всякая вероятность, она принимает значения в интервале от 0 (риск отсутствует) до 1 (неблагоприятный исход наступит наверняка). В качестве неблагоприятного исхода может рассматриваться болезнь, смерть, определенное осложнение, нежелательная беременность и т.д.
Относительный риск (ОР) (relative risk) - это отношение частоты события в той части выборки, где фактор действует, к частоте в части выборки, где фактор не действует. Относительный риск показывает силу связи между воздействием и заболеванием.
Неблагоприятный исход |
Благоприятный исход |
Всего |
||
Группа, подвергшаяся воздействию фактора |
Частота встречаемости a |
Частота встречаемости b |
a +b |
|
Группа, не подвергавшаяся воздействию фактора |
Частота встречаемости c |
Частота встречаемости d |
с+d |
|
n1=a+c |
n2=b+d |
n =a+b+c+d |
Шанс - отношение вероятности того, что событие произойдет, к вероятности того, что событие не произойдет.
Интерпретация
- если Шанс=1, то вероятность наступления события равна вероятности того, что событие не произойдёт;
- если Шанс >1, то вероятность наступления события больше вероятности того, что событие не произойдёт;
- если Шанс <1, то вероятность наступления события меньше вероятности того, что событие не произойдёт.
Отношение шансов (ОШ) (odds ratio) - отношение шансов неблагоприятного события в группе, подвергшейся воздействию фактора, к шансам неблагоприятного события в другой группе, или отношение шансов того, что событие произойдет, к шансам того, что событие не произойдет.
Отношение шансов используется для представления результатов мета-анализов и исследований случай-контроль. Значения ОШ от 0 до 1 соответствуют снижению риска неблагоприятного исхода при действии фактора, более 1 - его увеличению. ОШ равное 1 означает отсутствие эффекта от действия фактора.
Оценка чувствительности и специфичности диагностических тестов
Еще одна сфера применения таблицы сопряженности - сравнение двух диагностических тестов. На их основе можно оценить специфичность и чувствительность нового метода.
Чувствительность (Se) - это доля действительно болеющих людей в обследованной популяции, которые по результатам теста выявляются как больные. Чувствительность - это мера вероятности того, что любой случай болезни (состояния) будет идентифицирован с помощью теста. В клинике тест с высокой чувствительностью полезен для исключения диагноза, если результат отрицателен.
Специфичность (Sp) - это доля тех, у которых тест отрицателен, среди всех людей, не имеющих болезни (состояния). Это мера вероятности правильной идентификации людей, не имеющих болезни, с помощью теста. В клинике тест с высокой специфичностью полезен для включения диагноза в число возможных в случае положительного результата.
Чувствительность и специфичность нового метода определяется относительно другого, общепринятого, который обладает высокой точностью, но имеет другие недостатки - побочные эффекты, дороговизну, недоступность и т.д. Этот другой метод называют «золотым стандартом».
Результат нового диагностического теста |
Результаты «золотого стандарта» |
||
положительный |
отрицательный |
||
положительный |
ИП число истинно положительных результатов нового теста (больные, выявленные с помощью теста) |
ЛП число ложноположительных результатов нового теста (здоровые, имеющие положительный результат теста) |
|
отрицательный |
ЛО число ложноотрицательных результатов нового теста (больные, не выявленные с помощью теста) |
ИО число истинно отрицательных результатов нового теста (здоровые, имеющие отрицательный результат теста) |
Чувствительность
Специфичность
Специфичность и чувствительность теста являются выборочными характеристиками, не являются абсолютными и неизменными и зависят от объема выборки. Поэтому полезно определять стандартную ошибку и доверительный интервал для этих величин.
Оценка прогностического значения диагностических тестов
Аналогичные таблицы возникают и при оценке прогностического значения теста. Предположим нам необходимо оценить способность некоторого теста прогнозировать заболевание.
После этого определим на основании этого показателя:
число истинно-положительных прогнозов (ИП) - число больных, у которых согласно значению данного теста могло быть предсказано заболевание и которые действительно болеют;
число ложноположительных (ЛП) прогнозов (согласно значению данного показателя предсказывается болезнь, но пациент оказался здоров);
число ложноотрицательных (ЛО) прогнозов (согласно значению данного показателя предсказывается, что пациент здоров, но на самом деле он болеет); число истинно отрицательных (ИО) прогнозов (больной должен был быть здоровым и он действительно здоров).
Таблица
Прогноз на основании некоторого теста |
Исход заболевания |
||
неблагоприятный |
благоприятный |
||
неблагоприятный |
ИП (a)число истинно положительных прогнозов |
ЛП (b)число ложноположительных прогнозов |
|
благоприятный |
ЛО (c)число ложноотрицательных прогнозов |
ИО (d)число истинно отрицательных прогнозов |
Для прогностического теста можно определить чувствительность и специфичность, а также распространенность (prevalence), которая определяется как отношение числа лиц с наличием заболевания (или любого другого состояния) ко всей исследуемой популяции:
Прогностическая ценность положительного результата (positive predictive value) - вероятность наличия заболевания при положительном (патологическом) результате теста:
Отношение правдоподобия (likelihood ratio) для положительного результата показывает во сколько раз вероятность положительного результата теста у больных больше, чем у здоровых
Отношение правдоподобия для отрицательного результата показывает во сколько раз вероятность отрицательного теста у больных больше, чем у здоровых
Диагностическая эффективность теста выражается процентным отношением истинных (и положительных, и отрицательных) результатов теста к общему числу полученных результатов.
Пример. Диагноз стрептококковой ангины основывается преимущественно на данных клинической картины и фарингоскопии. Из лабораторных исследований применяют бактериологическое - обнаружение в посевах слизи из ротоглотки Я-гемолитического стрептококка группы А. Рассмотрим диагностическую ценность лабораторного анализа по результатам исследования, которые сведены в таблицу 2Ч2.
Клинический диагноз стрептококковой ангины |
всего |
||||
присутствует |
осутствует |
||||
Я-гемолитический стрептококк в посеве мазка |
да |
ИП(a)27 |
ЛП(b)35 |
62 |
|
нет |
ЛО(c)10 |
ИО(d)77 |
87 |
||
всего |
37 |
112 |
149 |
Однофакторный дисперсионный анализ
Проблема. Результаты консервативного лечения аневризм, осложненных внутричерепной гематомой (ВЧГ), неудовлетворительные - летальность составляет 50-85%. До настоящего времени существуют различия в хирургической тактике при разрывах артериальных аневризм, осложненных ВЧГ. Сложность выбора тактики обусловлена сочетанием гематомы с выраженным ангиоспазмом, риском повторного кровотечения из аневризмы у тяжелых больных, различной оценкой симптомов компрессии и дислокации мозга, трудностью выделения доминирующей причины тяжелого состояния при сочетании гематомы с вентрикулярным кровоизлиянием, ишемией мозга. Оценка влияния различных факторов на результаты хирургического лечения позволит определить тактику ведения больных с аневризмами в сочетании с внутричерепными гематомами, выявить причины неблагоприятных исходов хирургического лечения и прогнозировать исход операции. В связи с этим одной из задач является определение зависимости срока госпитализации от тяжести состояния пациентов при поступлении, оцениваемой по шкале Hunt-Hess.
Поставленную задачу можно сформулировать следующим образом: определить влияние многоуровневого фактора на случайную величину. Рассмотрим более простой случай - влияние рациона питания на привес животных. Было проведено исследование на 4 группах животных: первая группа потребляла обычный рацион, вторая - питалась только макаронами, третья - мясом, четвертая - овощами. Изучаемым фактором является рацион питания, который имеет четыре уровня, случайная величина - это привес животных. Нужно определить есть ли разница хотя бы между двумя средними в этих группах.
Прежде чем приступить к решению данной задачи, вспомним, что дисперсия является характеристикой разброса случайной величины относительно среднего.
В идеале, внутри каждой группы вес животных должен бы быть одинаковым, так как они питаются одинаковым рационом (например, все едят овощи). В реальности внутри групп будет наблюдаться разброс в привесе, в связи с тем, что кроме рациона на вес животных влияют другие факторы: особенности обмена веществ, поведенческих реакций, стрессоустойчивость и др. Эти факторы, которые мы будем называть неучтенными факторами, приводят к появлению внутригрупповой дисперсии Dвнутргр.
Средние по группам также имеют разброс (относительно общей средней), который объясняется влиянием изучаемого фактора - разных рационов. Это приводит к появлению межгрупповой дисперсии Dмежгр.
Рассмотрим случай, приведенный на рисунке 22. Видно, что внутри групп разброс показателя веса больше, чем разброс средних значений по группам. Можно предположить, что вес животных в этих группах не сильно зависит от рациона питания, а на него больше влияют неучтенные в данном исследовании факторы.
Рисунок 22
Другой случай представлен на рисунке 23.
В этом случае средние значения имеют больший разброс, чем данные внутри каждой группы. Показатели веса в различных группах расположились обособленно - можно сделать предположение, что рацион питания влияет на вес животных больше, чем неучтенные факторы.
Рисунок 23
Таким образом, чтобы оценить влияние многоуровневого фактора на какую-то величину, необходимо сопоставить межгрупповую и внутригрупповую дисперсии. Межгрупповая дисперсия вносится изучаемым фактором, внутригрупповая дисперсия вносится какими-то другими (неучтенными) факторами.
Если то фактор не влияет
Если то фактор влияет
Если то неопределенность
Мы бы воспользовались этим правилом, если бы нам была доступна генеральная совокупность, но выборочные данные, в том числе выборочные дисперсии, ошибочны и в этом случае необходимо прибегнуть к теории проверки статистических гипотез.
Выдвигаем Н(0) - фактор не влияет на изучаемый признак
Задаемся уровнем значимости б
Вычисляем выборочную внутригрупповую дисперсию, как среднее значение дисперсий по группам
Где - дисперсия показателя в каждой из k групп
И выборочную межгрупповую дисперсию как отклонение средних в каждой группе от общей средней
ni -количество объектов в i -той группе
- общая средняя
Вычисляем критерий Фишера
Сравниваем с для заданного б и числа степеней свободы
где k - число групп, n-общее количество объектов обследования
Если вычисленное значение критерия Фишера меньше критического, то Н(0) принимается и делается вывод, что фактор не влияет на исследуемый показатель. В противном случае принимается Н(1).
Вернемся к задаче влияния тяжести состояния пациентов при поступлении на срок госпитализации (по данным из таблицы).
Выдвинем гипотезы:
Н(0): срок лечения в стационаре не зависит от тяжести состояния пациента при госпитализации.
Н(1): срок лечения в стационаре зависит от тяжести состояния пациента при госпитализации
Таблица
Тяжесть состояния по Hunt-Hess |
II степень |
III степень |
IV степень |
k=3 |
|
№пациента |
Срок лечения, дни |
||||
1 |
43 |
58 |
96 |
||
2 |
48 |
64 |
120 |
||
3 |
28 |
78 |
100 |
||
4 |
41 |
64 |
98 |
||
5 |
35 |
49 |
82 |
||
ni |
5 |
5 |
5 |
n=15 |
|
39 |
62,6 |
99,2 |
66,9 |
||
59,5 |
111,8 |
185,2 |
У=356,5 |
Линейная корреляция
Проблема. Атеросклероз - системное заболевание, поражающее артерии эластического (аорта и ее ветви) и мышечно-эластического (артерии сердца, головного мозга и др.) типов. Атеросклероз является ведущей причиной заболеваемости и смертности во многих развитых странах. В диагностике цереброваскулярных заболеваний в настоящее время превалируют ультразвуковые методы исследования, используемые для оценки кровотока в крупных и средних сосудах головы и шеи. В частности, ультразвуковое дуплексное сканирование позволяет достоверно определять скорость движения крови по сосудам, выявлять участки сужения (стеноза просвета) артерий головного мозга, участки с нарушенным кровотоком. Этот метод - один из самых достоверных в диагностике атеросклероза сосудов головного мозга. В свою очередь, одним из наиболее информативных ранних маркеров атеросклероза является увеличение толщины комплекса интима-медиа (КИМ) в общей сонной артерии. В связи с этим стояла задача изучения взаимосвязей между показателями кровотока в церебральных артериях и функцией эндотелия при атеросклерозе сосудов головного мозга. Обратимся к диаграмме на рисунке 24, на которой представлены значения роста и веса 14 испытуемых, отложенные на соответствующих осях, а на их пересечении поставлены точки. Эта диаграмма носит название диаграммы рассеяния. Из нее видно, что при увеличении роста вес также увеличивается, хотя это бывает не всегда - из практики мы знаем, что встречаются маленькие полные и высокие худые люди. Но общая тенденция все же такая, и мы можем даже провести воображаемую линию, по которой происходят изменения. То есть между ростом и весом имеется определенная связь - изменение роста приводит к изменению веса, и эта связь носит линейный характер.
Рисунок 24
Степень выраженности связи между случайными величинами отражает понятие корреляция. Количественно взаимосвязь между случайными величинами определяет коэффициент корреляции - r.
• Коэффициент корреляции лежит в пределах -1 ? r ? 1.
• Если r> 0, то связь прямая - с увеличением значений одной величины другая также в среднем возрастает.
• Если r < 0, то связь обратная - с увеличением величины Х1 соответствующие им значения X2 в среднем также уменьшаются.
Значения линейного коэффициента корреляции и характер связи
r = -1 |
обратно пропорциональная |
|
-1< r < -0,7 |
обратная сильная |
|
-0,7 ? r ? -0,5 |
обратная средняя |
|
-0,5 < r < 0 |
обратная слабая |
|
r = 0 |
отсутствует |
|
0 < r < + 0,5 |
прямая слабая |
|
+0,5 ? r ? +0,7 |
прямая средняя |
|
+ 0,7< r < + 1 |
прямая сильная |
|
r = +1 |
прямо пропорциональная |
Оценить корреляцию между признаками можно и по диаграмме рассеяния. Чем ближе точки на графике к прямой линии, тем больше коэффициент корреляции. При прямой связи воображаемая линия направлена слева на право вверх, при обратной - слева на право вниз. В случае r = ±1 все точки диаграммы лежат на одной прямой линии - значит одна величина на сто процентов зависит от другой.
Надо помнить, что корреляция выражает лишь математическую связь и, опираясь только на него, нельзя делать выводы о причинно-следственных отношениях. Например, может получиться высокий коэффициент корреляции между массой тела и знанием биостатистики, однако вряд ли одно является следствием другого, возможно оба признака меняются под воздействием третьего - возраста человека.
В статистике используются параметрические и непараметрические коэффициенты корреляции. Для двух количественных случайных величин Х1 и Х2 (n -объем каждой выборки), если они нормально распределены, их линейную взаимосвязь можно вычислить используя параметрический коэффициент корреляции Пирсона
Одной из задач корреляционного анализа является проверка коэффициента корреляции на значимость. Дело в том, что выборочный коэффициент корреляции отличается от генерального, т.е. имеет определенную ошибку. При этом не исключена возможность, что взаимосвязь между величинами вовсе отсутствует. Поэтому требуется проверка нулевой гипотезы о равенстве нулю генерального коэффициента корреляции Н(0): r=0
Проверяется гипотеза по критерию Стъюдента:
Критическое значение критерия находится по таблице для заданного уровня значимости б и числа степеней свободы f=n-2 (Приложение 2).
Если ¦ tвыч¦? tкрит то принимается Н(1) и делается вывод, что между величинами существует значимая корреляция.
Если¦ tвыч¦< tкрит то принимается Н(0) и делается вывод о независимости исследуемых величин (коэффициент корреляции незначим).
Полезно также вычислять величину r2 (в %). Она показывает, какая доля изменчивости одной величины объясняется влиянием другой величины.
Коэффициент корреляции рангов К. Спирмена
Если
• закон распределения случайной величины неизвестен или он не соответствует нормальному
• имеем дело с неколичественными данными (например, номинальными величинами)
• выборка мала
то используется коэффициент корреляции рангов К. Спирмена
где di -- разность между рангами сопряженных признаков, n -- число парных членов ряда.
При расстановке рангов необходимо учитывать, что равным по значению величинам присваивается ранг равный среднему арифметическому их номеров в ранжированном ряду.
При полной связи ранги признаков совпадут, и разность между ними будет равна 0, соответственно коэффициент корреляции будет равен 1. Если же признаки варьируются независимо, коэффициент корреляции получится равным 0
Для проверки гипотезы о значимости коэффициента корреляции Спирмена можно воспользоваться таблицей критических значений. Если вычисленный коэффициент корреляции превышает табличное значение, то связь между величинами признается статистически значимой.
Вернемся к проблеме взаимосвязи показателей кровотока в церебральных артериях и функцией эндотелия при атеросклерозе сосудов головного мозга. У 8 пациентов с помощью ультразвукового доплеровского сканирования брахиоцефальных артерий измерялась линейная скорость кровотока (ЛСК, см/с) и с использованием фотоплетизмографического метода оценивался индекс жесткости (SI, мс), отражающий вязко-эластичные свойства проводящих артерий, аорты. Результаты приведены в таблице. Поскольку распределение признаков неизвестно, рассчитывался коэффициент корреляции Спирмена.
Таблица
ранги |
1 |
5 |
2 |
4 |
3 |
6 |
7 |
8 |
||
ЛСК, см/с |
28,2 |
32,6 |
29,8 |
31,5 |
30,3 |
33,9 |
35,1 |
36,7 |
||
SI, мс |
8,2 |
7,4 |
8,1 |
7,9 |
7,6 |
6,9 |
7,1 |
6,9 |
||
ранги |
8 |
4 |
7 |
6 |
5 |
1,5 |
3 |
1,5 |
||
di |
-7 |
1 |
-5 |
-2 |
-2 |
4,5 |
4 |
6,5 |
||
di2 |
49 |
1 |
25 |
4 |
4 |
20,25 |
16 |
42,25 |
?=161,5 |
Линейная регрессия
Проблема. В настоящий момент имеет место всё более широкое использование бронхологических методик в пульмонологии, в т.ч. и в группе соматически тяжёлых больных с выраженной бронхообструкцией и тяжёлой дыхательной недостаточностью. Небольшое количество работ посвящено оценке изменений сатурации кислорода SaO2 (насыщение крови кислородом, выраженное в %) под влиянием проведения фибробронхоскопии, причём это касается, прежде всего, постбронхоскопического периода. Во всех случаях отмечалось снижение резервов оксигенации после бронхологического вмешательства. Вместе с тем изучению динамики SaO2 непосредственно во время проведения бронхологического вмешательства почти не уделяется внимания.
В ходе проведённых исследований выявлено, что зависимость SaО2 (y) от времени проведения ФБС (ф) определяется в виде суммы двух функций:
y(ф) = y1(ф) + y2(ф).
Функция y1(ф) отражает линейную составляющую и функция y2(ф) - периодическую составляющую. Предметом настоящего рассмотрения стала линейная составляющая функциональной зависимости SaО2 от времени проведения ФБС.
Вернемся к графику, который показывает зависимость между ростом и весом. Мы уже оговорили, что между этими величинами существует связь и эта связь линейная. А теперь попытаемся вывести некоторую функцию (математическое правило), которая позволяла бы определять, хотя бы приблизительно, изменение веса при изменении роста.
Регрессия - это функция, связывающая зависимую величину y с независимой величиной x. Она показывает, как в среднем изменяется y при изменениях x. Из математики нам известны различные функции: линейная, квадратичная, экспоненциальная, тригонометрические и т.д. Простейшей функцией является линейная, график этой функции изображен на рисунке 26. Уравнение линейной регрессии имеет вид
где - зависимая переменная, x - независимая переменная, b0 и b1 - постоянные коэффициенты
Основная задача регрессионного анализа найти постоянные коэффициенты b0 и b1 и оценить их статистическую значимость. Дело в том, что через точки на диаграмме рассеяния можно провести сколь угодно много прямых линий (вывести множество функций), все они будут отличаться друг от друга коэффициентами b0 и b1. Необходимо выбрать из них такую, которая наилучшим образом описывает связь между y и x. Одним из способов сделать это - применить метод наименьших квадратов (МНК).
Как уже отмечалось, уравнение регрессии показывает, как в среднем меняется y, т.е. конкретные его значения, полученные в опыте, и рассчитанные по уравнению могут не совпадать - есть некоторая ошибка. Из рисунка 27 видно, что для одних значений y эта ошибка меньше, для других - больше.
Рисунок 27
Суть МНК в том, чтобы вывести такое уравнение регрессии, для которого сумма квадратов всех ошибок была бы наименьшей. После некоторых математических выкладок, которые мы здесь приводить не будем, можно получить, что такое уравнение имеет следующие коэффициенты b1и b0.
Уравнение регрессии фактически является математической моделью взаимосвязи двух случайных величин. Качество этой модели, т.е. насколько хорошо она отражает эту связь, можно оценить с помощью коэффициента детерминации R2, который равен квадрату коэффициента корреляции между величинами (Ч100 %). Он показывает, сколько процентов исходных (выборочных) данных вписывается в полученную модель, или какой процент изменчивости y объясняется влиянием x. Уравнение регрессии, как правило, используются для прогноза, т.е. по нему, зная величину x, можно вычислить возможное значение y. При этом вы должны быть уверены, что общая тенденция развития явления сохранится за пределами наблюдений. В противном случае прогноз можно осуществлять только в пределах наблюдаемых значений x.
Предположим мы прогнозируем некоторое значение у при заданном х=х0. Тогда доверительный интервал для прогноза составляет
где - среднеквадратичное отклонение у вследствие ошибок модели, t-критерий Стъюдента для заданного б и f=n-2
Решим задачу прогноза сатурации кислорода SaO2 через 200 сек после начала ФБС.
SaО2 = -0,05ф+87,5=-0,05Ч200+87,5=77,5 %
Для расчета доверительного интервала дополним таблицу
i |
xi |
yi |
()2 |
||||
1 |
30 |
86 |
18225 |
86 |
0 |
0 |
|
2 |
60 |
82 |
11025 |
84,5 |
-2,5 |
6,25 |
|
3 |
90 |
84 |
5625 |
83 |
1 |
1 |
|
4 |
120 |
80 |
2025 |
81,5 |
-1,5 |
2,25 |
|
5 |
150 |
82 |
225 |
80 |
2 |
4 |
|
6 |
180 |
78 |
225 |
78,5 |
-0,5 |
0,25 |
|
7 |
210 |
80 |
2025 |
77 |
3 |
9 |
|
8 |
240 |
75 |
5625 |
75,5 |
-0,5 |
0,25 |
|
9 |
270 |
73 |
11025 |
74 |
-1 |
1 |
|
10 |
300 |
70 |
18225 |
72,5 |
-2,5 |
6,25 |
|
165 |
79 |
?=74250 |
У=30,25 |
Если независимых переменных много x1, x2, x3, x4, т.д., то возможно построение уравнение множественной линейной регрессии
Например, САД зависит от возраста, ИМТ, рациона питания и т.д. (см. таблицу).
r= 0,6 R2=0 ,36 F(4,433)=60,3 p=0,000 |
|||||
Коэффициенты bi |
Ст. ошибка коэффициента |
t -Стъюдента |
p-уровень |
||
признак |
|||||
свободн. член |
-16,5 |
11,12 |
-1,48 |
0,139 |
|
ЛПВП |
2,5 |
2,20 |
1,16 |
0,247 |
|
Возр |
0,3 |
0,12 |
2,47 |
0,014 |
|
Холест. |
3,2 |
0,69 |
4,57 |
0,000 |
|
ИМТ |
5,5 |
0,39 |
14,18 |
0,000 |
Уравнение регрессии имеет вид
В данном примере коэффициент множественной корреляции равен 0,6, т.е. модель объясняет до 36% вариаций систолического артериального давления. Она является статистически значимой (т.е. не случайной). Если судить по p-уровню, то САД зависит от возраста, содержания холестерина в крови и от индекса массы тела. Связь с уровнем липидов не подтверждается. В таблице ниже приведены частные коэффициенты корреляции отдельных признаков с САД, а также оценка их статистической значимости. Самая сильная связь наблюдается с индексом массы тела (r= 0,563), с возрастом и уровнем холестерина связь слабая, а с ЛПВП - статистически незначимая.
Таблица
признак |
Частная корреляция |
t -Стъюдента |
p-уровень |
|
ЛПВП |
0,056 |
1,16 |
0,247 |
|
Возр |
0,118 |
2,47 |
0,014 |
|
Холест |
0,214 |
4,57 |
0,000 |
|
ИМТ |
0,563 |
14,18 |
0,000 |
Перед использованием множественной регрессии проверьте соблюдение некоторых условий:
- зависимая величина является количественной непрерывной, а независимые - могут быть количественными или ординальными
- независимые величины не должны сильно коррелировать между собой, в этом случае нужно отобрать один наиболее значимый признак
- число наблюдений должно примерно в 10 раз превосходить число анализируемых признаков
Если взаимосвязь между величинами имеет более сложный характер, чем линейный, то возможны нелинейные модели, например такого вида
Для анализа таких моделей также существуют статистические методы, однако для их освоения требуются специальные математические знания. Описание этих методов можно найти в специальной литературе.
Анализ выживаемости
Проблема. Одной из сложных задач в лечении больных злокачественными лимфопролиферативными заболеваниями кожи является решение вопроса о целесообразности применения специфической химиотерапии. В настоящее время растут требования к доказательствам эффективности лечения заболевания. Поэтому в качестве аргументов «за» и «против» при подборе конкретного метода терапии важно использовать не только сведения о его эффективности в достижении ремиссии, но и имеющуюся информацию о влиянии лечения на отдалённый прогноз заболевания, в том числе на общую выживаемость пациентов и выживаемость от конкретного заболевания.
С целью изучения влияния цитостатической терапии на выживаемость больных ГМ было проведено ретроспективное статистическое исследование отдаленных результатов лечения при помощи анализа выживаемости методом Каплана-Мейера.
Анализ выживаемости - статистический анализ, разработанный для изучения, оценки и сравнения времени, прошедшего до наступления некоторого события ...
Подобные документы
Статистика в медико-биологическом исследовании, выбор метода анализа в соответствии с типом распределения данных. Анализ времени жизни в ППО Statistica, сравнение коэффициентов корреляции. Порядок осуществления проверки типа распределения данных.
реферат [1,2 M], добавлен 03.06.2011Система методов медико-биологических исследований. Электрофизиологические, фотометрические методы. Основные группы медицинских электронных приборов и аппаратов. Структурная схема съема, передачи и регистрации медико-биологической информации.
реферат [26,3 K], добавлен 11.12.2008Изучение влияния современного программного обеспечения на сбор и анализ статистических данных в учреждении здравоохранения. Преимущества и недостатки современной версии программного обеспечения в сравнении с предыдущей версией на базе Сиверской больницы.
курсовая работа [71,7 K], добавлен 10.03.2015История клинических исследований XX века. Понятие и виды медико-биологических исследований. Морально-этические проблемы взаимоотношение врача и испытуемого. Основные принципы проведения испытаний и экспериментов. Правила опубликования результатов.
реферат [25,1 K], добавлен 26.02.2015Элементы теории вероятности в диагностической и лечебной работе врача-лечебника. Значение опыта и анализ его исходов: случайные события, вероятность, относительная частота события, закон больших чисел. Статистические функции и законы распределения.
реферат [266,5 K], добавлен 25.12.2015Разновидности общего процесса реабилитации, ее современные принципы. Уровни медико-биологических и психосоциальных последствий болезни или травмы, которые учитываются при проведении медицинской реабилитации. Осуществление подготовки врача-реабилитолога.
реферат [43,0 K], добавлен 08.06.2011Развитие физиотерапии как науки. Действие лечебных физических факторов на определенные органы и системы организма. Истоки формирования представлений о специфичности в физиотерапии. Причины реакций органов и тканей. Направленность действия на орган.
реферат [27,5 K], добавлен 23.08.2013Роль врача в организации первичной медико-санитарной помощи, формировании здорового образа жизни, в первичной профилактике распространенных неинфекционных заболеваний. Описание коммуникативных навыков в работе врача амбулаторно-поликлинической практики.
презентация [67,6 K], добавлен 30.10.2011Механизм реакций, сопровождающихся свечением живых организмов, видимым простым глазом. Использование активированной хемилюминесценции и биолюминесценции как инструмента в медико-биологических исследованиях сыворотки крови, мочи, ликвора и слюны.
курсовая работа [252,3 K], добавлен 25.10.2011Предмет, цель и основные задачи гигиены и гигиенической практики; некоторые аспекты терминологии в ее области. Роль отдельных видов профилактики в повышении уровня здоровья населения. Изучение деонтологических принципов в деятельности врача-гигиениста.
лекция [87,2 K], добавлен 11.03.2012Обязанности врача-генетика. Основная цель профилактики наследственных заболеваний. Методы пренатальной диагностики состояния плода. Биопсия хориона, методика проведения. Задачи медико-генетического консультирования. Комплекс преконцепционной профилактики.
доклад [26,7 K], добавлен 11.12.2011Понятие чувствительности как способности организма воспринимать раздражение из внешней и внутренней среды. Характеристика рецепции, функции анализаторов. Основные виды рецепторов. Клиническая классификация чувствительности, особенности ее сложных видов.
презентация [5,2 M], добавлен 26.04.2015Децентрализация лабораторных анализов и основные тенденции развития иммуноанализа. Агглютинационные тесты для определения антигена и антитела. Принцип иммунофильтрации для определения hCG. Ферментативная иммунохроматография для диагностики на дому.
реферат [591,1 K], добавлен 06.08.2009Лечебно-профилактическая работа врача-фтизиатра противотуберкулезного диспансера Канавинского района. Анализ статистических показателей среди впервые выявленных больных туберкулезом. Эффективность лечения больных деструктивным и бациллярным туберкулезом.
отчет по практике [40,5 K], добавлен 05.04.2012Основные задачи и направления работы кабинета инфекционных заболеваний. Роль врача в деятельности кабинета. Принцип преемственности и взаимосвязи. Структура заболеваемости гепатитом С. Гепатит С, как медико-социальная проблема. Реабилитация больных.
контрольная работа [76,4 K], добавлен 19.11.2013Требования, предъявляемые к материалам для медико-биологического применения. Проблема биологической совместимости, реакция организма на токсическое воздействие. Воздействие материалов на человека, роль стерилизации. Углеродные материалы в медицине.
реферат [32,9 K], добавлен 26.02.2012Основные задачи и направления работы в исследуемом санатории, его функции и оценка эффективности. Оценка роли врача-пульмонолога, его основные права и обязанности, сфера профессиональной деятельности. Принцип преемственности и взаимосвязи в отделении.
отчет по практике [33,7 K], добавлен 19.11.2013Организационная структура Медико–санитарной части № 118 Федерального медико-биологического агентства. Основные виды деятельности учреждения. Проведение целевых медицинских осмотров. Внедрение в практику работы новых методов диагностики и лечения.
отчет по практике [30,3 K], добавлен 11.12.2012Понятие биомедицинской инженерии как разработки и применения технических устройств для биологических и медицинских исследований. Применение современных электрокардиографов при обследовании пациента. Основные достижения в области биомедицинской инженерии.
презентация [5,8 M], добавлен 16.07.2014Понятие и виды лидерства. Значение профессиональных и лидерских качеств врача для возникновения положительных психологических отношений и доверия между медработниками и больными. Главные черты эффективных лидеров. Стратегии врача на руководящей должности.
презентация [409,0 K], добавлен 24.04.2014