Проблемы измерения и выявления потенциально значимых факторов здоровья

Исследование влияния факторов здоровья на продолжительность безработицы. Постановка задачи анализа выживаемости, обзор моделей. Проблемы измерения и выявление потенциально значимых факторов здоровья. Связь между безработицей и уровнем смертности.

Рубрика Экономика и экономическая теория
Вид дипломная работа
Язык русский
Дата добавления 11.02.2017
Размер файла 1,4 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

2.2 Определение безработицы

Существует несколько широко принятых определений безработицы, но чаще всего обращаются к двум из них: определению, утвержденному Международной Организацией Труда (МОТ) и менее строгому «no job» определению.

Согласно определению МОТ безработный индивид должен отвечать следующим требованиям:

· не работать;

· хотеть найти работу;

· активно ее искать.

База данных PSID позволяет спокойно выделить индивидов, отвечающих данным требованиям. Так, еще в вопросе о текущем статусе на рынке труда есть ответ «Не имею работы, но ищу ее», по которому можно отобрать индивидов, отвечающих первым двум критериям. Важно отметить, что категория МОТ позволяет включать студентов в группу безработных, однако вопросник составлен таким образом, что студенты рассматриваются отдельно (категория «студент» в ответе на вопрос о текущем статусе занятости). Так, в данном исследовании студент рассматривается как безработный только если он указал дату начала и конца, или только начала периода безработицы в течение двухлетнего периода между опросами. Категория «Не имею работы, но ищу ее» так же позволяет нам с относительной уверенностью сказать, что короткие периоды безработицы (как правило, длящиеся меньше месяца) не связаны со сменой места работы, так как в таком случае респондент уже не ищет работу, а меняет ее место, что отражается в категории «другое».

Что касается активного поиска работы, то респондентов спрашивают: «Были ли в 201* году моменты, когда Вы были безработным и активно искали работу? Если да, то когда (в каких месяцах)?». Теперь из группы людей, которые не имею работы, но желают найти ее, мы выделяем тех, кто ответил положительно на последний вопрос и получаем выборку безработных по стандартам МОТ. Многие исследователи указывают на то, что определение МОТ является слишком строгим. В таблице 2.1 приведены официальные данные по уровню безработицы и рассчитанные на базе опросника PSID. В целом рассчитанные уровни безработицы по критериям МОТ даже несколько превышают официальные уровни.

Таблица 2.1. Уровень безработицы в США в период в 2009, 2011 и 2013 гг.

Год

Официальный УБ

УБ по МОТ

2009

9,6

10,2

2011

9,0

10,5

2013

7,4

9,5

Другое часто рассматриваемое исследователями определение безработицы «no job» позволяет считать безработными людей, желающих найти работу, но разочаровавшимися в ее поиске. Данное определение также было предложено МОТ для случаев, когда рынок труда нестабилен, что больше характерно для стран с переходной экономикой. Для исследования на данных США мы прибегаем к первому более строгому определению безработицы. Так, из совокупных данных опроса для нашего исследования мы получили 2396 наблюдений, 1452 из которых - цензурированные.

2.3 Построение длительности периода безработицы

После определения, является ли индивид безработным, необходимо рассчитать для него продолжительность безработицы. Данные панельного исследования домохозяйств (PSID) устроены таким образом, что для каждого календарного месяца на протяжении всего исследуемого периода существует единичное наблюдение для каждого респондента. Каждому респонденту задавался вопрос «Были ли в прошлом/позапрошлом году моменты, когда Вы не имели работы, но активно ее искали? - январь/февр/март/и.т.д.» - всего 12 бинарных переменных, которые предоставляют исследователю информацию о статусе занятости респондента помесячно, как отражено на графике ниже.

Рис. 2.1. Построение длительности периода безработицы (E - индивид в состоянии занятости, U - безработицы.

Источник: (Upward, 1999)

Кроме того, респондентам задаются также следующие вопросы: «Сколько дней, недель и месяцев Вы были или остаетесь безработным?», так что, переведя эти переменные к одной шкале (количество дней) и просуммировав, можно получить достаточно точное значение продолжительности безработицы. Большинство респондентов не указывает продолжительность безработицы вплоть до дней, но это и не так важно, ведь не стоит ожидать, что человек будет помнить точную дату начала безработицы, если, к примеру, является безработным полгода. В таком случае мы бы сталкивались скорее с поддельной точностью.

2.4 Проблемы измерения и выявления потенциально значимых факторов здоровья

Для выполнения задач исследования необходимо количественное измерение состояния здоровья. Однако характерной особенностью термина «здоровье» является как раз невозможность проведения объективное целостной оценки, т.е. не существует метода, который бы с высокой долей точности определял бы реальный уровень здоровья индивида. Так как запас здоровья трудно измерить, остается полагаться на один из двух возможных способов характеристики здоровья: первый - собственное представление человека о состоянии здоровья и второе - наличие/отсутствие каких-либо заболеваний.

Д. Курие и Б. Мадриан (Currie & Madrian, 1999) в своем исследовании отмечают, что идеальный показатель здоровья должен включать как реальную возможность работать ввиду ограничений по здоровью, так и желание работать. На практике же в большинстве опросов встречаются следующие показатели:

1) самооценка здоровья (как правило, оценивается по пятибалльной таблице: от очень плохого здоровья до очень хорошего).

2) наличие каких-либо физических и ментальных ограничений в работе;

3) наличие ограничений в быту (к примеру, неспособности самостоятельно есть или вставать с кровати и т.д.);

4) наличие каких-либо заболеваний (наиболее часто встречаемые: артрит/хронические заболевания/проблемы дыхательных путей и т.д.);

5) использование медицинской помощи;

6) наличие проблем с алкоголем;

7) индекс массы тела.

Все показатели, помимо пятого, достаточно хорошо представлены или могут быть рассчитаны на базе опросника PSID. Отметим некоторые особенности (преимущества, недостатки) использования некоторых групп показателей здоровья.

Такая переменная как самооценка здоровья, с одной стороны, может объективно отражать статус здоровья, поскольку в него включаются ненаблюдаемые и трудноизмеримые факторы вроде общего самочувствия человека, восприятие человеком тех или иных заболеваний/патологий (некоторые люди, к примеру, легче адаптируются к физическим ограничениям, легче переносят те или иные заболевания). Однако Д. Курие и Б. Мадриан (Currie & Madrian, 1999) отмечают, что использование данного показателя может повлечь за собой неслучайную ошибку измерения. Дело в том, что индивиды, вынужденные по тем или иным причинам работать меньше положенного или вообще покинуть состав рабочей силы, возможно будут занижать свой уровень здоровья. Причиной этому может послужить стремление оправдать неучастие или ограниченное участие на рынке труда. Помимо этого, авторы утверждают, что самооценка здоровья также формируется за счет такого фактора, как частота обращения за медицинской помощью. Практически неоспоримо, что частота визитов к доктору в большой степени зависит от уровня дохода, образования, а также наличия страховки. В связи с этим, более образованные, обеспеченные индивиды, а также индивиды со страховкой, будут скорее хуже оценивать собственное здоровье. Что касается переоценки, то «нет здоровых людей, есть недообследованные», и как раз от степени этого недообследования зависит переоценка собственного здоровья. Целый ряд работ был посвящен оценке расхождений между заявленным уровнем здоровья и состоянием по медицинским показателям (Idler & Benyamini, 1997; Mossey & Shapiro, 1982). Все указанные исследования показали, что заявленный уровень здоровья сильно коррелирует с состоянием по медицинским показателям. Полученные результаты могут быть объяснены следующим образом: эффект занижения собственной оценки здоровья скорее всего нивелируется эффектом завышения от недостаточного обследования, поэтому оценка здоровья в целом является даже более адекватной мерой, чем другие объективные показатели (Bound, 1989). Таким образом, мы полагаемся на результаты многочисленных эмпирических исследований и включаем данный показатель в анализ.

Глава 3. Эмпирические оценки влияния здоровья на продолжительность безработицы

3.1 Предварительное оценивание

Для оценки наличия связи между безработицей и здоровьем, сравним показатели уровня здоровья в группах безработных и занятых.

Таблица 3.1. Факторы здоровья в группах занятых и безработных (в % от общей численности группы).

Переменная

Занятые*

Безработные**

Повышенное давление

23,7

22,1

Астма

10,3

13,8

Заболевания дыхательных путей

2,8

5,1

Диабет

6,7

7

Артрит

8,6

7,6

Психические расстройства

0,4

0,7

Рак

3

1,9

Нервные расстройства

6,1

14,2

Хронические заболевания

10,6

13,1

Самооценка здоровья: отличное

21,1

18,3

Самооценка здоровья: хорошее

38,7

27,9

Самооценка здоровья: среднее

29,8

32,9

Самооценка здоровья: плохое

8,95

17,5

Самооценка здоровья: очень плохое

1,1

3,06

Количество наблюдений

5567

1440

*занятые - индивиды, которые были заняты на протяжении всего периода с января 2009 по декабрь 2012.

** безработные - респонденты, которые хотя бы раз были безработными в период с января 2009 по декабрь 2012

Поскольку группы занятых и безработных содержат разное количество наблюдений, то сравнивать их непосредственно между собой нельзя - лучше провести тест на равенство долей признака в двух выборках (Z-тест), хотя уже только по данным таблицы можно ожидать, что в группе безработных будет больше людей с каким-либо заболеванием, чем в группе занятых. Нулевая гипотеза теста состоит в том, что доли признака в двух выборках одинаковы. Тест показал, что в целом по восьми признакам из представленных 14 на 5% уровне значимости имеется значимая разница между двумя группами, это: астма, заболевания дыхательных путей, проблемы с обучаемостью, рак, нервные расстройства и хронические заболевания, состояние здоровья: хорошее, плохое и очень плохое. Таким образом, предварительный анализ показал, что мы имеем полное основание предполагать, что в группах занятых и безработных средний уровень здоровья отличается.

Представляет интерес распределение времени пребывания в состоянии безработицы. Напомним, что в данном исследовании не все респонденты на момент опроса нашли работу, поэтому данные наблюдения являются цензурированными. В таблице 3.2. представлены некоторые описательные статистики по ключевым переменным.

Таблица 3.2. Описательные статистики по ключевым переменным

Переменная

Наблюдений

Среднее

Станд. отклонение

Мин

Макс

Продолжительность безработицы (недель)

2396

46.83264

34.83949

0

104

Наступление события

2396

.60601

.4887347

0

1

Возраст

2396

35.48623

11.65282

18

65

Женщина

2396

.515025

.4998785

0

1

Видно, что около 61% респондентов нашли работу до момента проведения опроса. Оставшиеся 39% наблюдений цензурированные. Средняя продолжительность безработицы составляет примерно 47 недель, что равняется почти году. Это довольно удручающая статистика, ведь в исследование не включаются индивиды, разочаровавшиеся в поиске работы, а только те, кто действительно хочет найти работу. Однако важно понимать, что данное значение длительности нельзя считать оценкой для генерального среднего из-за наличия цензурированных данных, т.е. в действительности продолжительность безработицы может оказаться даже больше. Описательная статистика с учетом цензурирования представлена ниже.

Таблица 3.3. Описательная статистика по обучающей выборке

Survival time

Time at risk

Incidence rate

subjects

25%

50%

75%

total

112211

.0129399

2396

22

65

104

Так, 25% респондентов нашли работу в течение примерно пяти месяцев, а 50% - уже в течение года и двух месяцев. Показатель incidence rate (уровень «заболеваемости») говорит о том, что в среднем за неделю из 1000 человек безработных 13 человек находят работу. В нашей выборке суммарное время наблюдения за 2396 респондентами составило 112211 недель, а число прекращений - 112211*0,0129399=1452.

3.2 Оценка кривых выживания для разных групп респондентов с помощью метода Каплана-Мейера

Для начала оценим общую кривую выживания для всех респондентов.

Рис. 3.1. Оценка Каплана-Мейера для общей выборки

Согласно графику, вероятность остаться безработным после двух месяцев с момента увольнения составляет примерно 80 процентов, после пяти месяцев - 75 процентов. Лишь только через год индивид снова найдет работу с вероятностью 50 процентов. В целом форма кривой выживания очень близка к линейной функции, а значит, нет такого момента времени, где большая часть респондентов находила бы работу.

На графике ниже показана мгновенная функция риска. В первые пять месяцев (20 недель) риск найти работу достаточно велик, но затем он падает и начинает расти только после года поиска работы (52 недель). Полученные результаты соотносятся с нашими ожиданиями: мы считаем, что первые несколько месяцев люди ищут работу наиболее активно, и если не находят, то несколько разочаровываются в поиске и снижают темпы активности. Тем не менее, пребывать слишком долго в состоянии безработицы многим «невыгодно», поэтому через какое-то время они возобновляют поиски работы и/или соглашаются на более низкооплачиваемые позиции.

Рис. 3.2. Сглаженная оценка функции риска

На следующем графике представлены кривые выживания отдельно для мужчин и женщин. Вероятность найти работу для женщин незначительно выше для любого заданного момента времени, чем для мужчин. Log-rank критерий для сравнения двух кривых выживаемости показал, что различия среди двух групп неслучайны (p-value = 0,000). Возможное объяснение тому, что женщины с большей долей вероятности найдут новую работу, состоит в том, что в целом женщины зарабатывают меньше, и поэтому могут согласиться работать за более низкую зарплату (см. таблицу 3.4). Кроме того, нельзя забывать о возможном психологическом эффекте - в целом женщины менее амбициозны, чем мужчины. Предположение о примерно равном количестве цензурированных и нецензурированных наблюдений в подвыборках выполняется (доля цензурированных наблюдений составляет 47 и 49,8 процентов для женщин и мужчин соответственно).

Рис. 3.3. Оценка Каплана-Мейера для мужчин и женщин

Таблица 3.4. Средний доход мужчин и женщин

Женщина

Среднее

p25

p50

p75

0

15120,26

1

7500

18900

1

10395

0

5200

15000

По всей выборке

12321.2

0

6200

16000

Построим кривые выживания для разных возрастных групп (рис 3.4). В целом можно сделать вывод, что получившиеся различия связаны с количеством лет трудового стажа. Так, наибольшая вероятность найти работу наблюдается у людей в возрасте от 46 до 55 лет, возможно потому, что они имеют большой опыт работы, и им еще не так скоро до пенсии, чего не скажешь о молодежи. Молодые люди в возрасте от 18 до 25 лет сталкиваются с наименьшей вероятностью трудоустроиться, чем все остальные люди трудоспособного возраста (различия значимы согласно log-rank тесту: ). Предположение о примерно равном количестве цензурированных и нецензурированных наблюдений в подвыборках выполняется.

Рис. 3.4. Оценка Каплана-Мейера для возрастных групп

Посмотрим также, сильно ли разнится разница в кривых выживания в зависимости от цвета кожи. Несмотря на то, что вероятность стать занятым разнится не так сильно среди групп, для темнокожих она несколько ниже (Log-rank критерий показал, что разница между группами значима: p-value=0,0009). Доля цензурированных наблюдений составляет 44% и 38% для темнокожих и светлокожих соответственно, что соответствует требованиям.

Рис. 3.5. Оценка Каплана-Мейера по цвету кожи

3.3 Оценка влияния здоровья на продолжительность безработицы с помощью регрессионных моделей

Цель данной части работы состоит в разработке модели длительности периода безработицы, где время до нового трудоустройства (spells) связано с набором объясняющих переменных.

В работе X упоминалось, что нежелательно включать в модель одни факторы здоровья, поскольку не хватает оснований утверждать, что они останутся значимыми при включении в модель других групп объясняющих переменных. В связи с этим, мы включаем различные социально-экономические характеристики респондентов в анализ.

Общая выборка, полученная из данных двух волн, содержит 2396 наблюдений, для 1452 из которых наступило интересующее событие - устройство на работу. Наименьшее время пребывания в состоянии безработицы на момент первого наблюдения за респондентом равно нулю, т.е. отсутствует усечение слева, ведь все респонденты наблюдались с момента потери работы. Наибольшая длительность безработицы составляет 104 недели или 2 года.

Таблица 3.5. Описательные характеристики общей выборки.

2396

total obs.

0

exclusions

2396

obs. remaining, representing

1452

failures in single record/single failure data

112211

total analysis time at risk, at risk from t =

0

earliest observed entry t =

0

last observed exit t =

104

Поскольку в исследовании предполагается сравнение прогнозной силы непараметрической модели Кокса с различными параметрическими, выборка разбивается случайным образом на две 2 части: тестовую и контрольную. Тестовая часть выборки содержит 60% от общего числа наблюдений, контрольная - остальные 40%.

Непараметрическая регрессия Кокса

На тестовой части выборки построена лучшая спецификация регрессии Кокса (см. таблицу 3.7). По умолчанию для оценки коэффициентов для совпадающих моментов прекращения пакет Stata использует приближение Бреслоу. Однако согласно Хосмеру и Лемешоу (Hosmer Jr & Lemeshow, 1999), приближение Эфрона является более точным. Проверим это на утверждение на практике.

Таблица 3.6. Коэффициенты при переменных для разных приближений к функции частичного правдоподобия.

Возраст

Цвет кожи

Коэффициент

Станд.ош.

Коэффициент

Станд.ош.

Метод частичного правдоподобия

-.0122502

.0033499

-.3812392

.0777654

Приближение Эфрона

-.0112665

.0031841

-.3625454

.0745102

Приближение Бреслоу

-.011141

.0031902

-.3501925

.0745261

Результаты, показанные в таблице 3.6, подтверждают тот факт, что оценки, полученные с помощью приближения Эфрона для совпадающих моментов прекращения, более близки, нежели чем оценки Бреслоу, к точному дискретному методу расчета функции частичного правдоподобия. Оценки Бреслоу отличаются от оценок точного дискретного метода на 8,1 - 9,1 процента, а оценки Эфрона - на 4,9 - 8 процентов. Несмотря на то, что в целом оценки Бреслоу и Эфрона достаточно близки, мы отдаем предпочтение оценкам Эфрона как более точным. Ниже приведены результаты оценивания модели Кокса с использованием приближения Эфрона для общей тестовой выборки, а так же отдельно для мужчин и женщин.

Таблица 3.7. Регрессии Кокса для общей выборки и по полу респондента.

Общая выборка

Женщины

Мужчины

b/se

p

b/se

p

b/se

p

Не женат/не замужем

-.3399398

0.000***

-.358106

0.000***

-.3008351

0.007**

(.0737912)

(.0998659)

(.1109665)

Женщина

.4094592

0.000***

.0736315

Возраст

-.0168312

0.000***

-.0116978

0.005**

-.0182203

0.000***

(.0032153)

(.0041525)

(.0050123)

Цвет кожи

-.3509022

0.000***

-.513005

0.000***

(.0715551)

(.0982155)

Дети до 6 лет

.2260001

0.002**

.2060777

0.034*

.2850221

0.010*

(.0725503)

(.0973991)

(.110676)

Вредное и опасное производство

.4802234

0.000***

.5616076

0.000***

(.0964391)

(.1144303)

Образование ниже среднего

-.511471

0.000***

-.4747871

0.000***

-.582406

0.000***

(.1000601)

(.1301224)

(.1588461)

Самооценка здоровья: плохое

-.2358851

0.021*

-.4321427

0.027*

(.1025691)

(.195097)

Промышленность

.2299889

0.013*

(.0927303)

Сфера услуг

.305273

0.003**

.2802939

0.031*

(.1016824)

(.1298624)

Регион_северо-восток

.3091925

0.007**

.3407503

0.026*

(.1144919)

(.1525844)

Professional

.3483755

0.000***

.3535574

0.008**

(.0973672)

(.1323144)

Наличие ограничений в работе

-.5058509

0.011*

(.1996552)

Регион_средний запад

-.4354316

0.003**

(.1484114)

Регион_юг

-.3044451

0.013*

(.1227197)

1411

714

697

10779.53

5350.892

4258.339

Согласно критерию отношения правдоподобия все три модели оказались значимыми, так как p-value = 0.000. Полученные направления связи в целом не противоречат здравому смыслу. Так, самое сильное негативное влияние на риск найти работу оказывает переменная «образование ниже среднего». Данный результат соответствует текущим тенденциям на рынке труда: работодатели в большинстве случаев хотят нанимать более образованных индивидов.

Мы также обнаружили, что возраст негативно влияет на риск найти работу, причем как для мужчин, так и для женщин. Это заключение согласуется с результатами эмпирических исследований (см. пункт 1.1), а также со стандартными теориями человеческого капитала, которые подчеркивают отрицательную зависимость человеческого капитала от возраста. С увеличением возраста человеческий капитал сотрудника может увеличиваться, но до определенного момента, когда фирмам становится невыгодно инвестировать в работника, зная, что он может скоро уйти на пенсию. При приближении человека к пенсионному возрасту, его человеческий капитал стремится к нулю (Носкова, 2013), поэтому такому человеку становится сложнее трудоустроиться.

В результате оценивания было обнаружено, что замужество положительно сказывается на риске найти работу, причем как для мужчин, так и для женщин. Это может объясняться наличием в семье детей, которых необходимо содержать. Кроме того, данные респонденты могут соглашаться на более низкооплачиваемую работу, чтобы прокормить семью, т.е. резервная ставка зарплаты у замужних ниже, чем у одиноких людей. Мы также обнаружили, что наличие в семье детей до 6 лет также увеличивает вероятность найти работу. Данный феномен можно объяснить той же необходимостью содержать семью, в частности, ребенка. Однако есть еще одно объяснение, которое касается женщин: возможно, работодатели считают, что вероятность женщины с ребенком уйти вновь в декретный отпуск несколько ниже, чем какой-нибудь замужней женщины без детей.

В анализ мы также включали региональные переменные. Как и ожидалось, принадлежность к определенному региону так же оказывает влияние на риск быть нетрудоустроенным. За базовую категорию брался западный регион США. Относительно него риск выйти из состава безработных в северо-восточном регионе выше в раза для обоих полов, а для женщин в 1,41 раза. Проживание на Юге или Среднем Западе США уменьшает риск найти работу для мужчин в 0,64 и 0,74 раза соответственно.

Мы обнаружили значительную гендерную асимметрию во влиянии уровня здоровья на длительность безработицы. Так, мужчины, которые оценивают состояние своего здоровья как «плохое» и указывают на наличие ограничений в работе по состоянию здоровья, имеют более низкую вероятность найти работу, чем люди с нормальным здоровьем и без ограничений в работе. Можно предположить, что мужчины чаще берутся за тяжелую работу, поэтому плохое состояние здоровья и наличие ограничений оказывают столь негативное влияние на риск покинуть группу безработных. В пользу этого обоснования свидетельствует и положительный знак перед переменной «вредное и опасное производство». Если профессия мужчины связана с тяжелым или вредным производством, то это увеличивает риск трудоустроиться в раза.

Исследование также показало, что расовая дискриминация еще имеет место на американском рынке труда. Так, риск найти работу людям с темным цветом кожи в 0,7 раза меньше.

Правильность спецификации подтверждает анализ остатков Кокса-Снелла. На рисунке 3.6 не видно значительных отступлений от линейности, значит, у нас нет оснований считать выбранную спецификацию ошибочной. Однако стоит заметить, что модель несколько завышает риск выхода из состояния безработицы.

Проверить соблюдение предположения о пропорциональности рисков можно также с помощью формального теста, описанного в п. 2.4.4. Тест подтверждает вывод, полученный при визуальном анализе. Значение говорит о том, что у нас нет оснований отвергать нулевую гипотезу о пропорциональности рисков.

Таблица 3.8. Результаты формального теста на пропорциональность рисков

chi2

df

Prob>chi2

global test

13.98

12

0.3020

Рис. 3.6. Остатки Кокса-Снелла для регрессии Кокса.

Параметрические модели Вейбулла и Гомперца

Для выбора параметрических спецификаций необходимо исследовать характер временной зависимости. Для этого построим график опорной интегральной функции риска при равенстве нулю всех регрессоров.

Рис. 3.7. Оценка опорной интегральной функции риска

График опорной интегральной функции риска свидетельствует скорее о постоянной временной зависимости, хотя возможно наличие небольшой положительной временной зависимости, что можно проверить с помощью параметрических моделей регрессии Вейбулла и Гомперца. Результаты оценивания содержатся в Приложении 2.

В результате оценивания получились примерно те же результаты, что и в спецификации Кокса: значима примерно та же группа факторов, а оценки коэффициентов при них весьма схожи. Для проверки правильности выбранных спецификаций посмотрим так же на графики остатков Кокса-Снелла.

Рис. 3.8. Остатки Кокса-СнеллаРис. 3.9. Остатки Кокса-Снелла в регрессии Вейбуллав регрессии Гомперца

Судя по графикам, модель Гомперца описывает данные намного лучше, чем модель Вейбулла, но заметно хуже, чем модель Кокса.

Оценка итоговых спецификаций и выбор наилучшей модели

Выбор наилучшей модели среди параметрических можно осуществить с помощью информационного критерия Акаике. Результаты собраны в таблицу 3.9.

Таблица 3.9. Значения AIC для регрессий Вейбулла и Гомперца.

Опорное распределение

Значение AIC

Вейбулла

3486.665

Гомперца

3425.568

Результаты согласуются с выводами, полученными с помощью визуальной оценки, - наилучшее качество подгонки обеспечивает распределение Гомперца.

Выбор между непараметрической моделью и моделью Кокса будем осуществлять путем оценивания прогнозной силы каждой из моделей. Для этого проведем сначала визуальный анализ на основе остатков Кокса-Снелла для моделей, построенных на данных тестовой выборки и с использованием коэффициентов и параметров, полученных на обучающей выборке.

Рис. 3.10 Остатки Кокса-СнеллаРис. 3.11 Остатки Кокса-Снелла для регрессии Кокса для регрессии Гомперца

Видно, что регрессия Кокса обеспечивает лучшее качество подгонки, чем регрессия Гомперца. Проведем также формальный ROC анализ. Важно отметить, что для удобства проведения анализа оценки регрессии в виде риска трудоустройства были переведены в вероятности трудоустройства.

В исследовании существует два возможных исхода: индивид нашел работу или остался безработным. На данных тестовой выборки рассчитаем предсказанные значения для моделей Кокса и Гомперца, воспользовавшись оценками коэффициентов и параметров, полученных на данных обучающей выборки, а затем рассчитаем долю верных предсказаний. Однако стоит заметить, то эта доля зависит от порога отсечения, где значения выше порога означают, что человек нашел работу, а ниже - остался безработным. Выбор оптимального порога зависит от целей исследователя, однако чаще всего порог считается оптимальным, когда чувствительность равна специфичности.

Рис. 3.12. Определение оптимальногоРис.

3.13.Определение оптимального порога для регрессии Кокса.порога для регрессии Гомперца.

Таким образом, оптимальный порог для регрессии Кокса - 0,35, а для регрессии Гомперца - 0,56.

Таблица 3.10. Доля верно предсказанных моделью значений при различных порогах отсечения.

Доля верно предсказанных значений

Порог

Кокс

Гомперц

0,1

0,590071

0,546479

0,15

0,607092

0,546479

0,2

0,62695

0,547887

0,25

0,643972

0,549296

0,3

0,683688

0,54507

0,35

0,716312

0,557746

0,4

0,71773

0,591549

0,45

0,656738

0,633803

0,5

0,6

0,652113

0,55

0,556028

0,683099

0,6

0,512057

0,680282

0,65

0,486525

0,638028

0,7

0,455319

0,560563

0,75

0,446809

0,484507

0,8

0,442553

0,457746

0,85

0,442553

0,453521

0,9

0,442553

0,453521

Согласно таблице 3.10 при пороговом значении 0,35 точность прогнозов модели Кокса даже выше, чем модели Гомперца.при его оптимальном пороге в 0,55. Данный вывод согласуется с результатами визуального теста, проведенного на данных тестовой выборки. Однако поскольку разница между моделями несильно значима, будем считать, что обе модели годятся для целей исследования.

Заключение

безработица здоровье выживаемость

Во многих исследованиях была обнаружена связь между безработицей и уровнем смертности. В развитие этой темы другие авторы указывали на негативное влияние безработицы на здоровье, пренебрегая исследованием длительностей безработицы для групп занятых и безработных. Так, если индивиды с ухудшенным здоровьем имеют большую длительность безработицы, чем здоровые люди, то можно с уверенностью сказать, что они представляют собой большинство в группе безработных. Ввиду этого, в данном исследовании была проведена оценка влияния факторов здоровья на продолжительность безработицы. В качестве базы данных выступило американское Панельное Исследование Доходов Домохозяйств (PSID).

Первой задачей исследования стал анализ теоретических подходов к влиянию здоровья на вероятность потерять работу и остаться в состоянии безработицы больше времени, чем здоровые люди. Согласно модели, плохой уровень здоровья сокращает число отработанных часов, а поскольку работодатели в целом стремятся минимизировать общее число «невыходов» на работу по причине болезни, а также издержки, связанные с выплатами по больничным листам, поиском временной замены больному сотруднику и.т.д., плохой уровень здоровья может препятствовать скорейшему трудоустройству.

Для оценки влияния факторов здоровья и некоторых других социально-экономических переменных на продолжительность безработицы нами применялись методы анализа выживаемости. Выбор пал на данную группу методов ввиду возможности включения в выборку цензурированных данных, которые в нашем случае составляют практически половину от общего числа наблюдений. Описание методов, основных предположений, лежащих в их основе, а также тестов для проверки допущений содержится в первой главе исследования. В работе применялись 4 метода анализа выживаемости: оценка Каплана-Мейера, регрессии Кокса, Вейбулла и Гомперца.

Следующий этап исследования состоял из подготовки и анализа статистических данных, т.е. построении длительности безработицы по имеющимся в опросе данным и приведения достоинств и недостатков включения тех или иных характеристик, описывающих уровень здоровья.

Завершающим этапом стало получение количественных оценок влияния факторов здоровья на продолжительность безработицы с помощью непараметрической регрессии Кокса и параметрических Вейбулла и Гомперца. На основании полученных результатов был сделан вывод о значительной гендерной асимметрии во влиянии здоровья на риск быть нетрудоустроенным. Так, было обнаружено, что плохое состояние здоровья и наличие ограничений в работе по причине здоровья негативно сказываются на риске трудоустройства для мужчин. Мы также выявили, что риск трудоустройства отрицательно зависит от возраста человека, поскольку с увеличением возраста фирмам становится все более «невыгодно» инвестировать в работника, особенно при приближении его к пенсионному возрасту. Женатые мужчины и замужние женщины имеют меньшую продолжительность безработицы, чем одинокие, а наличие в семье детей до шести лет положительно сказывается на риске трудоустройства как для мужчин, так и для женщин.

Проверка правильности спецификации каждой модели проводилась с помощью оценки остатков Кокса-Снелла. Выбор наилучшей модели среди параметрических осуществлялся с помощью информационного критерия Акаике, а среди непараметрической и параметрической - ROC метода для анализа выживаемости. В результате проверки было установлено, что две модели, Кокса и Гомперца, пригодны для целей исследования. В дальнейшем исследование может быть дополнено анализом обратной связи между здоровьем и безработицей.

Список литературы

1. Бурдяк А.Я. Применение метода Анализ наступления события (event history analysis) с помощью пакета SPSS // SPERO (Социальная политика: экспертиза, рекомендации, обзоры). 2007. № 6.

2. Носкова К.А. Оценка человеческого капитала i-го сотрудника организации // II Международная научная конференция «Актуальные вопросы экономических наук» , 2013. С. 4-8.

3. Ратникова Т.А. и др. Анализ панельных данных и данных о длительности состояний // Foresight. 2013.

4. Фурманов К., Чернышева И. Здоровье и поиск работы в России. : Litres, 2014.

5. Abraham K.G., Vodopivec M. Slovenia: A study of labor market transitions. , 1993.

6. Arrow J.O. Estimating the influence of health as a risk factor on unemployment: a survival analysis of employment durations for workers surveyed in the German Socio-Economic Panel (1984--1990) // Soc. Sci. Med. 1996. Т. 42. № 12. С. 1651-1659.

7. Bartel A., Taubman P. Health and labor market success: The role of various diseases // Rev. Econ. Stat. 1979. С. 1-8.

8. Blau D.M., Riphahn R.T. Labor force transitions of older married couples in Germany // Labour Econ. 1999. Т. 6. № 2. С. 229-252.

9. Bound J. Self-reported vs. objective measures of health in retirement models. , 1989.

Приложение

Описание основных переменных исследования

Переменная

Описание

Номер наблюдения

индивидуальный номер респондента

Семейный статус

1 - состоит в браке

2 - никогда не состоял(а) в браке

3 - вдова/вдовец

4 - в разводе

5 - живут отдельно

Не женат/не замужем

1 - если респондент не состоит в браке

Возраст

возраст респондента

Женщина

1 - если женщина

Продолжительность безработицы (недель)

количество недель безработицы

Цензурирование

0 - цензурированное наблюдение

Дети до 6 лет

1 - если в семье по крайней мере один ребенок младше 6 лет

Цвет кожи

1 - если темнокожий

Давление

1 - повышенное артериальное давление

Астма

1 - астма

Болезнь легких

1 - заболевания дыхательных путей

Диабет

1 - диабет

Артрит

1 - артрит

Рак

1 - рак

Депрессии

1 - серьезные нервные расстройства, депрессии

Хронические заболевания

1 - имеются какие-либо хронические заболевания

Индекс массы тела

1 - если индекс меньше 18,5 "недовес"

2 - нормальный вес (индекс от 18,5 до 25)

3 - имеется лишний вес (индекс от 25 до 30)

4 - ожирение (индекс больше 30)

Частота курения

0 - не курит и никогда не курил

1 - курит до одной пачки сигарет в день

2 - курит больше одной пачки сигарет в день

3 - бывший курильщик

Самооценка здоровья

собственная оценка здоровья

1 - отличное

2 - очень хорошее

3 - хорошее

4 - слабое

5 - очень слабое

Ограничения в работе

1 - имеются ограничения по здоровью, которые мешают в работе

Образование ниже среднего

1 - наивысший уровень образования: начальное или неполее среднее

Среднее образование

1 - наивысший уровень образования: полное среднее

Высшее образование

1 - наивысший уровень образования: высшее

Сезонность

1 - если работа респондента имеет сезонный характер

Профессиональная категория

1 - работа в профессиональной категории: должностные лица и администрация; правительство; др. менеджеры и администраторы; архитекторы и инженеры; образование; диагностика и лечение заболеваний

Делопроизводство

1 - делопроизводство: стенография, бухгалтерия, ведение отчетов и тд.

Сфера услуг

1 - если работа в сфере услуг

Первичная промышленность

1 - если работа в первичной промышленности: фермерство, рыбалка, охота, лесозаготовки, горнодобывающая промышленность

Промышленность

1 - работа в промышленности: производство продуктов питания, напитков; изготовление изделий из металла, пластмассы, ремонт оборудования

Вредное и опасное производство

1 - если респондент занят на вредных и тяжелых производствах

Доход

доход респондента (включая все дополнительные источники дохода)

Северо-Восток

1 - если респондент проживает в Новой Англии и Средне-Атлантических штатах

Юг

1 - если респондент проживает в Южно-Атлантических штатах, Юго-Восточном Центре и Юго-Западном Центре

Средний Запад

1 - если респондент проживает в Северо-Восточном Центре и Северо-Западном Центре.

Запад

1 - если респондент проживает в Горных и Тихоокеанских штатах

Оценки коэффициентов для регрессий Вейбулла и Гомперца

Вейбулла

Гомперца

b/se

p

b/se

p

_t

Не женат/не замужем

-.3069286

0.000***

-.316318

0.000***

(.0736585)

(.073725)

Женщина

.3545652

0.000***

.3944402

0.000***

(.0737076)

(.0737784)

Возраст

-.0174302

0.000***

-.0168512

0.000***

(.0031584)

(.0032255)

Цвет кожи

-.3428493

0.000***

-.3848379

0.000***

(.0708192)

(.0713842)

Регион_северо-восток

.2731587

0.016*

.2949994

0.010**

(.1137389)

(.114254)

Вредное и опасное производство

.4178822

0.000***

.4568347

0.000***

(.0965192)

(.0965347)

Professional

.3316496

0.001***

.3200543

0.001***

(.0969427)

(.0972045)

Индустрия

.2394753

0.009**

.2138633

0.021*

(.0921013)

(.092605)

Сервис

.2825887

0.005**

.2859145

0.005**

(.1007033)

(.1013672)

Сезонность

-.3216672

0.049*

(.1636186)

Образование ниже среднего

-.4112716

0.000***

-.4276375

0.000***

(.0987784)

(.0993392)

Дети до 6 лет

.1592017

0.027*

(.0718411)

Самооценка здоровья: плохое

-.2008021

0.050*

(.1023524)

Константа

-4.213016

0.000***

-4.283379

0.000***

(.197201)

(.1691435)

ln_p

Константа

.1003083

0.001***

(.0288777)

Гамма

Константа

.0106821

0.000***

(.0012358)

1411

1411

3486.665

3425.568

Размещено на Allbest.ru

...

Подобные документы

  • Способы измерения влияния факторов в анализе хозяйственной деятельности. Способ цепной подстановки, используемый для расчета факторов во всех типах детерминированных факторных моделей. Методика факторного анализа. Сущность статистического наблюдения.

    курсовая работа [441,9 K], добавлен 18.01.2015

  • Виды детерминированного факторного анализа. Показатели рентабельности производства на основе регрессионных моделей. Способы измерения влияния факторов в детерминированном анализе. Моделирование взаимосвязей между результативным и факторными показателями.

    курсовая работа [700,7 K], добавлен 18.05.2011

  • Cтрогая функциональная зависимость между факторными и результативным показателем. Определение влияния отдельных факторов. Приемы элиминирования. Прием пропорционального деления или долевого участия. Интегральный способ и способ логарифмирования.

    реферат [119,2 K], добавлен 25.11.2008

  • Теоретические аспекты основных факторов спроса и предложения. Формирование спроса на рынке В2С, его особенности в России. Особенности факторов спроса и предложения на примере измерения спроса кофейных зерен в России за 2015-2016. Прогноз развития рынка.

    курсовая работа [619,1 K], добавлен 16.09.2017

  • Значение категорий спроса и предложения на микро-, и макроуровне. Классическая теория потребительского спроса, теории жизненного цикла и перманентного дохода. Колебание рыночных цен, проблемы измерения факторов спроса и предложения, сдвиги кривой спроса.

    курсовая работа [80,9 K], добавлен 27.01.2010

  • Основные показатели здоровья населения. Статистический анализ основных показателей здоровья населения: методика анализа состояния и тенденций уровня смертности. Уровень средней продолжительности жизни и заболеваемость в России, его динамика и тенденции.

    курсовая работа [76,2 K], добавлен 30.11.2010

  • Современный уровень безработицы в Грузии. Основные причины безработицы в Грузии. Программа "Единая Грузия – без бедности". Способы борьбы с безработицей в Грузии. Перечень основных факторов, за счет которых можно снизить уровень безработицы в стране.

    сочинение [9,9 K], добавлен 27.07.2010

  • Изучение сущности, характерных черт и основных видов рынков факторов производства. Проблемы взаимодействия этих факторов в процессе производства и их сочетание в условиях рыночной экономики. Особенности ценообразования на рынках факторов производства.

    курсовая работа [80,7 K], добавлен 08.01.2018

  • Определение понятия "благосостояние", рассмотрение его видов, свойств и факторов, на него влияющих. Изучение истории становления теории общественного благосостояния. Анализ основных и дополнительных показателей измерения валового внутреннего продукта.

    курсовая работа [32,9 K], добавлен 14.09.2015

  • Определение уровня фондоотдачи, влияния факторов на изменение ее уровня методом цепных подстановок. Оценка разными способами влияния факторов на валовую продукцию. Расчет тесноты корреляционной связи между объемом товарооборота и оборачиваемостью запасов.

    контрольная работа [146,9 K], добавлен 28.08.2011

  • Формулирование проблемы в условиях большой неопределенности. Определение величины и влияния факторов на изменение общей суммы затрат. Расчет показателей оборачиваемости, а также определение влияния факторов на выручку методом цепных подстановок.

    контрольная работа [73,4 K], добавлен 08.03.2014

  • Понятие, значение, тенденции развития здравоохранения и его прогнозирование. Выявление статистически значимых связей уровня здоровья с факторами окружающей среды. Программа социально-экономического развития МО "Бичурский район" Республики Бурятия.

    курсовая работа [188,0 K], добавлен 16.12.2012

  • Предмет и объекты экономического анализа. Способы измерения размера и степени влияния факторов в детерминированном факторном анализе. Использование эвристических способов и классификация резервов в экономанализе. Решение практических заданий по предмету.

    контрольная работа [27,6 K], добавлен 25.01.2009

  • Методы и приемы экономического анализа, их состав, взаимосвязь и последовательность применения. Способы измерения влияния факторов в детерминированных моделях. Факторный анализ формирования прибыли от продаж и оценка запаса финансовой прочности.

    реферат [189,8 K], добавлен 21.12.2013

  • Понятие, содержание, и задачи анализа хозяйственной деятельности, способы измерения влияния факторов в анализе. Финансовая отчётность хозяйствующих субъектов. Комплексный экономический анализ эффективности использования основного и оборотного капитала.

    курс лекций [515,4 K], добавлен 23.03.2011

  • Организация аналитической работы на предприятии. Система экономической информации. Особенности микроуровневой информационной системы. Система показателей анализа хозяйственной деятельности. Способы измерения влияния факторов в детерминированном анализе.

    курсовая работа [273,5 K], добавлен 21.11.2011

  • Знакомство с основными видами факторов производства: капитал, природные ресурсы, предпринимательская деятельность. Рассмотрение особенностей выявления направлений по совершенствованию регулирования рынков факторов производства в Украине, анализ проблем.

    дипломная работа [529,5 K], добавлен 31.03.2016

  • Традиционная классификация приемов и методов экономического анализа. Характеристика традиционных способов обработки информации. Рассмотрение способов детерминированного факторного анализа и способов измерения влияния факторов в стохастическом анализе.

    курсовая работа [720,2 K], добавлен 16.05.2012

  • Понятие, причины, виды и показатели безработицы. Проблемы безработицы для человека, семьи и государства. Государственное регулирование проблем. Основные потоки рабочей и нерабочей силы. Развитие предпринимательства как условие борьбы с безработицей.

    курсовая работа [54,6 K], добавлен 20.02.2009

  • Источники информационного обеспечения анализа. Расчет влияния факторов на изменение объема товарной продукции способом цепной подстановки. Влияние факторов на выполнение плана по объему. Оценка целесообразности вложения денег в венчурный проект.

    контрольная работа [34,6 K], добавлен 16.01.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.