Сравнительный анализ методов выделения факторов в факторном анализе на примере выявления образа демократии

Социологический смысл модели факторного анализа. Сущность и специфика невзвешенного метода наименьших квадратов, описание и применение обобщенного метода наименьших квадратов. Сравнение методов выделения факторов по критерию оперирования с общностью.

Рубрика Социология и обществознание
Вид дипломная работа
Язык русский
Дата добавления 30.08.2016
Размер файла 1,1 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Такой метод выделения факторов как альфа факторинг был специально разработан для использования в психологических и образовательных измерениях. Целью данного метода является максимизация распространенного критерия проверки надежности каждого выделившегося фактора - Альфа-Кронбаха. Однако таким образом, как мы уже упоминали ранее, происходит недооценка общностей и меньший вес имеют переменные с большей общностью. Учитывая данные особенности алгоритма выделения факторов при альфа факторизации, можно согласиться с авторами книги «Handbook of Quantitative Methods for Educational Research», что использование данного метода выделения факторов релевантно только лишь при проведении психологических и образовательных исследований. Анализ образов как метод выделения факторов также был специально разработан для исследований в области психологии. Исследователи отмечают, что основным преимуществом анализа образов перед классическими методами выделения факторов является то, что факторы могут выделяться без преобразования наблюдаемых переменных. Практическое значение данного факта отражается в возможности более эффективно справляться с ситуацией большого количества наблюдаемых переменных включенных в анализ. Резюмируя все вышесказанное, альфа факторизация и анализ образов используются в исключительных случаях, когда важно понять максимально релевантное количество индикаторов, описывающих выделившийся фактор. Не случайно два данных методах используются преимущественно в психологических тестах.

2.5 Сравнение методов выделения факторов по критерию выбора оптимального количества факторов

Следующий вопрос, который волнует исследователей в вопросе выделения факторов - количество наблюдаемых переменных, которые определяют общий фактор. Есть доказательства того, что при проведении разведывательного факторного анализа более точные результаты обеспечиваются при сверхдетерминации факторов (MacCallum et al., 1999). Некоторые исследователи рекомендуют использовать от трех до пяти наблюдаемых переменных представляющих каждый общий фактор. Так, при проведении разведывательного факторного анализа исследователь должен иметь предположение о природе и количестве факторов которые он выделит. Количество наблюдаемых переменных, которые включены в анализ превышать количество предполагаемых выделенных факторов в три или пять раз [MacCallum et al., 1999]. Если разведывательный факторный анализ проводится на переменных с низкими общностями, то велика вероятность существенного искажения результатов [MacCallum et al., 1999; Velicer & Fava, 1998]. Есть ряд причин, почему общность для измеряемых величин может оказаться низкой. Одна из причин - низкая надежность собранных данных. Вторая из возможных причин - использование наблюдаемой переменной для анализа явления, к которому она не имеет прямого отношения. В этом случае следует задуматься над обоснованностью использования тех или иных наблюдаемых переменных при анализе.

Плавно переходя к теме показателей качества моделей, которые сопровождают тот или иной метод выделения факторов, можно резюмировать, что только метод максимального правдоподобия и обобщенный метод наименьших квадратов обладают встроенным набором показателей качества модели, которые выгодно выделяют его из всех имеющихся в наличии методов.

Скажем несколько слов о проблеме выделения факторов. Основная цель выделения факторов в разведовательном факторном анализе заключается в определении минимального числа общих факторов, которые удовлетворительно воспроизводят корреляции между наблюдаемыми переменными. Теоретически при отсутствии ошибок измерений, а также при выполнении принципа факторной причинности, для заданной корреляционной матрицы существует точное соответствие между минимальным числом общих факторов и рангом редуцированной корреляционной матрицы. (В редуцированной корреляционной матрице общности помещаются на главную диагональ). Из-за этого возникает задача найти критерий, с помощью которого можно было бы оценить минимально необходимое число общих факторов. Но поскольку основной критерий определения минимального числа общих факторов заключается в хорошей воспроизводимости наблюдаемых корреляций с помощью отобранных факторов, то задачу можно переформулировать следующим образом: определить правило остановки при выделении оптимального количества общих факторов. Эта задача сводится к определению момента, когда расхождение между вычисленными и наблюдаемыми корреляциями может быть приписано случайности выборки.

Существует несколько способов определить оптимальное количество факторов, которое необходимо выделить. Используя работу Timothy A. Brown «Confirmatory Factor Analysis for Applied Research» опишем основные. Правило Кайзера-Гуттмана говорит нам о том, что собственные значения факторов должны превышать значение единицы, то есть дисперсия фактора выше дисперсии одного индикатора. Критерий «каменистой осыпи» - Scree Test Кеттела основывается на визуальной проверке графика увеличения собственных значений с увеличением количества выделяемых факторов. Еще один способ определения количества выделяемых факторов - параллельный анализ, который основан на генерации факторов на основе случайных чисел и сравнение «каменистой осыпи» с эмпирическими факторами. Последний рассматриваемый нами способ - осмысленность полученных факторов посредством интерпретации величины нагрузок различных индикаторов. Стоит отметить, что все предложенные выше критерии подвержены субъективности исследователя.

Анализ теоретических источников, а также учет математического основания семи методов выделения факторов в факторном анализе подводит нас к созданию наглядной таблицы сравнительного анализа. Основаниями для сравнения послужили объем выборки, присваивание веса большей общности, присваивание веса меньшей общности, нормальность распределения выборки, наличие показателей качества в модели, а также исходное знание исследователем количества выделяемых факторов. Информация представлена в таблице ниже.

Таблица 1

Сравнительный анализ методов выделения факторов в факторном анализе

PC

PAF

ML

ULS

GLS

Альфа факторизация

Анализ образов

Требует большого объема выборки

нет

нет

да

нет

да

нет

нет

Больший вес присваивается большей общности

Веса не используются

Веса не используются

да

Веса не используются

да

нет

нет

Большее внимание уделяется низким общностям

не изменяет общности

не изменяет общности

нет

не изменяет общности

нет

да

да

Требует нормального распределения выборки

нет

нет

да

нет

нет

нет

нет

Включает в себя показатель качества модели

нет

нет

да

нет

нет

нет

нет

Хорошо подходит для проведения EFA

Только как метод сокращения размерности данных

да

да

да

да

да

да

Рекомендуется использовать для порядковых шкал

нет

нет

нет

да

нет

-

-

В основе выделения факторов только одного метода стоит вероятностный алгоритм - метода максимального правдоподобия. Остальные пять не опираются на понятие вероятности, а значит, результаты их применения не зависят от нормальности распределения первичных данных. Таким образом, мы можем сказать, что для создания алгоритма выбора оптимального метода выделения факторов при проведении факторного анализа, который будет описан ниже, нужно обладать информацией о распределении первичных данных. Стоит особенно обратить внимание на коэффициент эксцесса, так как метод максимального правдоподобия особенно чувствителен к этому показателю распределения [Timothy A. Brown, 2006]. Если говорить об общностях, то метод главных компонент, метод факторизации главной оси и невзвешенный метод наименьших квадратов не трансформируют первичные общности, то есть не изменяют латентную структуру с помощью вмешательства в часть дисперсии, которую объясняет фактор. Метод максимального правдоподобия и обобщенный метод наименьших квадратов действуют в соответствии с принципом, при котором менее точные наблюдения учитываются в меньшей степени. На практике это означает, что исследователь должен оценить степень доверия к полученным данным [MacCallum et al., 1999; Velicer & Fava, 1998]. Метод альфа факторизации и анализ образов исследователи рекомендуют использовать только в исключительных случаях при проведении измерений в психологии. Только метод максимального правдоподобия позволяет использовать строгие статистические критерии, определяющие качество модели. Остальные шесть рассматриваемых методов выделения требуют проведения субъективной оценки оптимального количества факторов.

Учитывая все вышесказанное, мы представляем алгоритм выбора оптимального метода выделения факторов в факторном анализе, который объединяет в себе как математический смысл, заложенный в каждый из методов, так и исследовательские труды, посвященные их сравнительному анализу.

Рисунок 2

Сравнительный анализ методов выделения факторов в факторном анализе

Разработанный алгоритм предполагает для начала определиться с целью использования методов выделения факторов. Если задачей исследования является только снижение размерности данных, то рекомендуется использовать метод главных компонент. При условии того, что задачей исследования является максимально полное описание фактора (такую цель обычно преследуют при анализе психологических тестов), рекомендуется использовать специально разработанные для этого методы альфа факторизации и анализа образов. Для проведения разведывательного факторного анализа, целью которого является описание факторной структуры, для начала следует определиться с типом шкалы, используемой в индикаторах. Невзвешенный метод наименьших квадратов зарекомендовал себя в работе с порядковыми шкалами. Если проверка на нормальность индикаторов, измеренных в количественных шкалах, показала, что переменные распределены нормально, то можно довериться метод максимального правдоподобия. Следует помнить, что метод максимального правдоподобия особенно чувствителен к высокому коэффициенту эксцесса. Если переменные не распределены нормально, то рекомендуется использовать метод главных осей или метод обобщенных наименьших квадратов. Каждый из них обладает преимуществами и недостатками, описанными выше, а значит, выбирать следует по ситуации.

В данной главе мы рассмотрели исследования посвященные сравнению методов выделения факторов в факторном анализе по основным критериям: необходимый объем выборки, возможность выделения слабых общностей, необходимое распределение выборки, критерии выбора оптимального количества факторов. Результатом проведенного анализа стало создание алгоритма выбора оптимального метода выделения факторов с учетом перечисленных выше критериев. В следующей главе мы перейдем к разработке методологии, позволяющей применить на практике разработанный в теоретической главе алгоритм выбора оптимального метода выделения факторов.

Глава 3. Исследование образа демократии, как возможность для проведения сравнительного анализа методов выделения факторов в факторном анализе

Третья глава посвящена применению полученного алгоритма выделения факторов на практике. Для начала мы зададим теоретическую рамку эмпирической части, затем выделим те методы выделения факторов, которые адекватны поставленным целям, а также соответствуют характеристикам выборки, используя созданный алгоритм. Следующей частью главы станет создание критериев по которым будут проводиться сравнения выбранных методов. В заключительной части главы будут описаны результаты проведенного исследования, сделаны выводы.

3.1 Теоретическая рамка эмпирического исследования

Следующей частью данной работы становится попытка применения разработанного в теоретическом блоке алгоритма выбора метода выделения факторов в факторном анализе. Во всем разнообразии возможностей изучения латентных структур в общественных науках, особенно актуальным нам представляется изучение социально-политических аспектов российского общества. Так, «демократия» является одним из наиболее часто употребляемых терминов современного политического лексикона, однако данный термин понимается абсолютно по-разному. Проведенное фондом «Общественное мнение» в 2014 году исследование посвященное изучению представления-образа демократии показало, что россияне испытывают трудности при толковании данного понятия. Анализ результатов открытого вопроса показал, что с демократией ассоциируются гласность свобода выбора, соблюдения прав человека, равноправие, уважение прав меньшинств и многие другие ценности. Обобщая все вышесказанное, изучение латентной структуры образа демократии представляется интересной задачей, в которой можно в полной мере реализовать разработанный алгоритм.

Для того чтобы сформировать гипотезы о латентной структуры образа демократии мы проводим теоретический обзор сформировавшихся подходов к пониманию демократии. Таким образом, целью данного раздела является формулировка гипотез о латентной структуре образа демократии, ведь только после интерпретации результатов факторного анализа, проведенного с помощью семи выбранных нами методов выделения, мы сможем судить об итогах проведенной работы. Будет рассмотрено четыре возможных способа конструирования образа демократии. В заключении мы предложим гипотезы о возможном распределении латентной структуры в вопросе образа демократии.

3.2 Способы конструирования образа демократии

Рассмотрим четыре различных способа конструирования образа демократии, которые сформировались непосредственно в процессе слияния нормативного и описательно-эмпирического подхода.

Во-первых, под демократией понимают то же самое, что и древние греки, т. е. такую систему правления, где народ сам осуществляет властные функции [Dahl, 2007]. Эта классическая модель демократии крайне редко получала практическую реализацию, и «чистой» формы правления, где власть принадлежала бы только одному народу, нигде в мире не существует. Однако это не исключает того факта, что люди могут давать определение демократии именно через форму непосредственного участия в свободных выборах представителей власти всех уровней, включая право на отстранение от власти тех из них, которые не оправдали доверия избирателей

Во-вторых, термин «демократия» используется для обозначения выборной формы государственно-политического устройства, которая характеризуется разделением властей в соответствие с которым одна власть сдерживает другую, исключая возможность узурпации всей полноты власти законодательной, исполнительной или судебной [Manin, 1996]. В этом значении демократия представляет собой не власть народа, а власть с согласия народа (народ - источник власти) и называется представительной, поскольку народ осуществляет свою власть не непосредственно, не прямо, а опосредованно, т. е. передает ее путем всеобщих выборов тем органам и лицам, которые выступают и действуют от его имени.

В-третьих, демократию сегодня рассматривают не только как разновидность государственно-политического устройства общества, но и как основной способ организации, упорядочения и регулирования отношений между всеми элементами социальной структуры общества по поводу их воспроизводства и удовлетворения политических интересов [Plattner, 1998]. Речь идет о политическом процессе, в котором властные государственные структуры проявляют одинаковую заботу о всех членах общества без исключения. В этом процессе велика роль властной процедуры как реального механизма осуществления принципов свободы и равенства. Так, например, конституционализм, как один из важнейших принципов демократии обеспечивает рационально-правовой характер организации и функционирования государства и равенство [Dahl, 2001] всех перед законом

В-четвертых, демократическим называют общество или общественное устройство, основанное на определенной системе ценностей (демократическом идеале) [Dahl, 2001], к которым относятся ответственность, уважение, обеспечение прав человека и меньшинств, социальная справедливость, понятая как равенство возможностей, соучастие граждан в управлении.

Итак, сконструированная теоретическая рамка позволит нам осуществить переход от результатов факторного анализа к их интерпретации, а значит поможет в определении латентной структуры образа демократии.

На данном этапе мы можем предположить, что, во-первых, образ демократии определяется через факт непосредственного участия народа в принятии политических решений. Во-вторых, образ демократии сформировался как форма государственно-политического устройства, главным принципом которой является разделение властей. В-третьих, образ демократии через осуществление принципов свободы и равенства. В-четвертых, образ демократии, воспринимаемы как система моральных ценностей (демократический идеал).

Проведенное фондом «Общественное Мнение» исследование (анализ открытого вопроса об определении демократии россиянами в 2014 году), методологические основания, заложенные в блок вопросов, посвященных изучению образа демократии European Social Survey, а также собственный анализ истории восприятия демократии политическими философами - аргументы, которые позволят в процессе интерпретации результатов факторного анализа более основательно подойти к пониманию выделившейся латентной структуре.

Перейдем к следующей части главы, а именно выбору адекватных методов выделения факторов с учетом специфики имеющихся данных.

3.3 Выбор оптимальных методов выделения факторов с учетом специфики имеющихся данных

Чтобы провести сравнение методов выделения факторов в вопросе образа-понимания демократии, было решено обратиться к академическому сравнительному исследованию, которое проводится каждые два года в большинстве стран Европы. Одна из задач ESS заключается в «изучении изменений и стабильных характеристик социальной структуры, социальных условий, а также установок и мнений населения стран Европы; анализе изменений в социальной, политической и духовной сфере», и именно поэтому Европейское социальное исследование (European Social Survey) содержит блок вопросов, посвященных изучению демократии. В контексте работы нас будут интересовать данные за 2012/2013 год.

Выбор конкретной базы был также обусловлен статистическими параметрами пригодности для проведения данного типа исследования: данные должны отвечать определенным требованиям, накладываемым процедурой факторного анализа. Применяя процедуру факторного анализа, мы предполагаем, что за наблюдаемыми переменными стоят некоторые скрытые переменные. Для их выявления необходимо, чтобы наблюдаемые переменные были индикаторами различных проявлений скрытой переменной.

Применим алгоритм выбора оптимального метода выделения факторов в случае исследования структуры образа демократии для россиян. Целью нашего исследования является определение латентной структуры образа демократии, а значит, нас будет интересовать разведывательный факторный анализ. В базе данных ЕSS используется десятибалльная шкала оценки важности признаков демократии, к которой мы относимся как к количественной. Перечислим наблюдаемые переменные, на основе который будет проводится факторный анализ.

Оцените по десятибалльной шкале, где 1 - абсолютно не важно, 10 - чрезвычайно важно, на сколько, по Вашему мнению, перечисленные ниже утверждения важны для демократии:

1. чтобы федеральные выборы проводились свободно и справедливо

2. чтобы до того, как принимать решение за кого голосовать, избиратели обсуждали политические вопросы в своем кругу

3. чтобы политические партии предлагали избирателям по-настоящему разные программы?

4. чтобы оппозиционные партии могли свободно критиковать правительство

5. чтобы средства массовой информации могли свободно критиковать правительство

6. чтобы средства массовой информации предоставляли гражданам достоверную информацию, позволяющую судить о деятельности правительства

7. чтобы права меньшинств были защищены

8. чтобы граждане страны имели решающее слово в принятии наиболее важных политических решений путем прямого голосования на референдумах?

9. чтобы суды подходили ко всем людям одинаково

10. чтобы правящие партии лишались поддержки избирателей, если плохо выполняют свою работу

11. чтобы государство защищало всех граждан от бедности...

12. чтобы правительство разъясняло свои решения избирателям?.

13. чтобы правительство предпринимало меры по уменьшению разницы в доходах между людьми

14. чтобы при принятии решений политики учитывали мнение правительств других европейских стран?

Для того чтобы проверить исходные данные будет использован критерий Колмогорова-Смирнова о принадлежности наблюдаемой выборки нормальному распределению. Результаты представлены в таблице ниже.

Таблица 3

Проверка на нормальность исходных данных

Statistic

Sig.

честные выборы

,100

,000

политические дискуссии

,097

,000

чтобы политические партии предлагали избирателям по-настоящему разные программы?

,101

,000

чтобы оппозиционные партии могли свободно критиковать правительство

,108

,000

критика государства СМИ

,112

,000

достоверная информация от СМИ

,095

,000

чтобы права меньшинств были защищены

,104

,000

возможность принятия политических решений посредством прямого голосования

,099

,000

справедливость судов

,133

,000

возможность отстранения правящих партий

,110

,000

защита государством от бедности

,131

,000

объяснение политических решений правительством

,097

,000

уменьшение доходного неравенства правительством

,121

,000

учитывание правительством мнений других стран ЕС

,159

,000

Таким образом, мы выяснили, что:

1. Во-первых, цель нашего исследования - выделить факторную структуру, исследовать латентный образ демократии для россиян.

2. Во-вторых, десятибалльная шкала оценки согласия с приведёнными выше утверждениями интерпретируется нами как количественная.

3. Наблюдаемые переменные не подчиняются закону о нормальном распределении.

Следуя алгоритму выделения факторов, мы выяснили, что в нашем случае наиболее адекватными становятся метод главных осей и обобщенный метод наименьших квадратов. Следующий этап работы - создание критериев для эмпирического сравнения и применение их на выборке European Social Survey для России в 2012 году.

3.4 Критерии для сравнения результатов применения методов выделения факторов

1) Процент объясняемой моделью дисперсии.

Суммы квадратов факторных нагрузок после извлечения [extraction sums of squared loadings]. Изначальные собственные значения и собственные значения после извлечения (приводимые в SPSS как «Extraction Sums of Squared Loadings») являются теми же самыми для РСА, однако при других методах извлечения собственные значения после извлечения будут ниже, чем изначальные. SPSS также распечатывает «Rotation Sums of Squared Loadings» (суммы квадратов нагрузок после ротации), и в этом случае даже для РСА они будут отличаться от изначальных собственных значений и собственных значений после извлечения, хотя их сумма будет той же самой.

Таким образом, та модель, процент объясняемой дисперсии которой будет выше, будет считаться лучшей.

2) Общности. Общность есть часть дисперсии признака, которую объясняют факторы. Сумму квадратов нагрузок в формуле основной модели факторного анализа называют общностью соответствующего признака xi и чем больше это значение, тем лучше описывается признак xi выделенными факторами fj.

Когда индикатор-переменная обладает низкой общностью, факторная модель не работает хорошо для этого индикатора, и возможно его следует удалить из модели или рассмотреть другую модель с иным количеством факторов. Низкие общности целого набора переменных указывают, что эти переменные мало связаны друг с другом. Однако общности должны интерпретироваться в связи с содержательной интерпретируемостью факторов. Общность .75 выглядит высокой, но модель с ее включением может оказаться бессмысленной, если фактор, на который нагружается эта переменная, не поддается интерпретации, хотя она обычно обнаруживается. Общность .25 выглядит низкой, но может быть осмысленной, если данный пункт вносит вклад в хорошо определенный фактор. То есть, критическим является не коэффициент общности сам по себе, а степень, в которой этот пункт играет роль в интерпретации данного фактора, хотя часто эта роль больше, когда общность оказывается высокой..

Резюмируя все вышесказанное, лучшей будет считаться та модель, для которой содержательная интерпретация факторов с позиции включения или не включения определенного индикатора (наблюдаемой переменной) будет более подходящей.

3) Остатки репродуцированных корреляций. [reproduced correlation residuals] или «матрица остатков корреляций» является матрицей разностей между полученными в ходе применения метода выделения факторов и реальными корреляциями. Чем ближе такие остатки к нулю (т.е., низкие или незначимые), тем выше уверенность исследователя в своем выборе числа факторов. В SPSS, в примечаниях к таблице остатков корреляций приводится процент остатков корреляций, чей уровень значимости превышает 0,05. В хорошем факторном анализе такой процент оказывается низким.

Итак, модель с меньшим процентом остатков корреляций, чей уровень значимости превышает 0,05, будет считаться лучшей.

Значения факторных нагрузок. Факторные нагрузки, также называемыми нагрузками компонентов в РСА, являются коэффициентами корреляции между переменными (рядами) и факторами (колонками). Аналогично Пирсоновскому r, квадрат факторной нагрузки является долей дисперсии, в котором индикатор-переменная объясняется данным фактором. Интерпретация факторных нагрузок. Некоторые исследователи, в особенности в эксплораторных целях, могут использовать достоточно низкий уровень 0,40 для центрального фактора и 0,25 для других факторов [Raubenheimer, 2004], [Hair et al.,1998] называют нагрузки выше 0,60 «высокими», а те, которые ниже 0,40 «низкими»». Для нашего исследования мы посчитаем какой процент факторных нагрузок можно считать «высоким» (больше 0,6), а какой процент низким (меньше 0,4). Для определения лучшей модели мы сравним процент «высоких» и «низких» нагрузок. Так или иначе, но в любом случае факторные нагрузки должны интерпретироваться в свете теории, а не на основе произвольно выбираемых уровней отсечек.

4) Результаты теста Хи-квадрат. Нулевая гипотеза - предсказанная матрица равна матрице эмпирической, поэтому большие (и значимо отличающиеся от нуля) значения хи-квадрат указывают на плохое согласие модели с данными. Обобщенный метод наименьших квадратов позволяет использовать хи-квадрат теста качества модели. Увеличивая количество факторов на 1 за каждую проверку можно проследить момент, когда будет достигнуто удовлетворительное качество согласия модели. С учетом того, что метод главных осей не подразумевает вычисления критерия Хи-квадрат для теста качества модели, то мы только обратим на него внимание в процессе анализа факторной модели методом обобщенных наименьших квадратов.

Напомним, полученных в результате использования изучаемых методов выделения факторов что в анализе участвуют 14 переменных, измеренных в десятибалльной шкале. Исследовательское допущение, принимаемое в расчет, состоит в отношении к десятибалльной шкале как к количественной: мы предполагаем, что значения шкалы представляют упорядоченные категории с осмысленной метрикой, так что уместно сравнивать расстояния между значениями.

Для начала опишем те характеристики результатов факторного анализа, которые не зависят от выбора метода выделения факторов. Прежде всего проверим, существуют ли корреляционные связи между наблюдаемыми переменными с помощью критерия Бартлетта, а также обратим внимание на критерий адекватности выборки Кайзера-Мейера-Олкина - величину, характеризующую степень применимости факторного анализа к выборке. Результаты анализа представлены в таблице 1 в приложении.

При имеющихся данных на уровне доверия 99% у нас есть основания отклонить нулевую гипотезу об отсутствии корреляционных связей между признаками. У нас есть все основания сказать, что связи между признаками демократии есть и проведение факторного анализа можно считать уместным. Критерий адекватности выборки Кайзера-Мейера-Олкина - величина, характеризующая степень применимости факторного анализа к выборке. В нашем случае критерий КМО равен 0,92, что означает отличную адекватность. Мы сможем практически полностью доверять своей модели.

Перейдем к описанию собственных значений до извлечения (initial eingenvalues) факторов. Собственное значение данного фактора измеряет дисперсию во всех переменных, которая объясняется этим фактором. Сравнение собственных значений отражает объяснительную важность факторов в отношении наблюдаемых переменных. Если фактор обладает низким собственным значением, он вносит незначительный вклад в объяснение дисперсий в переменных, и может быть проигнорирован, как мало что добавляющий к более важным факторам. Собственное значение измеряет количество вариации во всей выборке, объясняемой каждым фактором. В нашем примере потребуется 14 компонентов (факторов), чтобы объяснить 100% дисперсии данных. Первая компонента объяснят больше половины дисперсии данных, а вторая уже только 10% дисперсии остальных переменных. Естественным образом самый маленький процент объяснения приходится на последней компонент - 1,3%. Такая таблица может оказаться полезной для принятия окончательного решения о количестве выделяемых факторов.

Таблица 4

Полная объясненная дисперсия

Factor

Initial Eigenvalues

Total

% of Variance

Cumulative %

1

7,038

50,269

50,269

2

1,503

10,737

61,007

3

,882

6,302

67,308

4

,751

5,364

72,673

5

,630

4,500

77,173

6

,509

3,638

80,811

7

,473

3,379

84,189

8

,428

3,056

87,246

9

,399

2,849

90,095

10

,381

2,721

92,815

11

,332

2,369

95,184

12

,268

1,915

97,099

13

,213

1,523

98,621

14

,193

1,379

100,000

Вращение помогает представить результаты в более удобном виде и обычно облегчает интерпретацию факторов. Вращение не влияет на сумму собственных значений, однако вращение будет изменять собственные значения (и процент объясняемой дисперсии) конкретных факторов и будет изменять факторные нагрузки. Поскольку альтернативные вращения могут объяснять ту же самую дисперсию (иметь то же самое суммарное собственное значение), но приводить к различающимся факторным нагрузкам, и поскольку последние используются для понимания факторов, это означает, что в зависимости от вращения факторам могут приписываться различные смыслы - проблема, на которую часто ссылаются как на недостаток факторного анализа. Если используется факторный анализ, исследователь может пожелать поэкспериментировать с альтернативными методами вращения, чтобы посмотреть, какой из них приводит к лучше всего интерпретирующейся факторной структуре.

В нашем случае мы воспользуемся одним из самых распространенных методов вращения, используемых при проведении факторного анализа - varimax rotation.

Вращение Варимакс является ортогональным вращением факторных осей с целью максимизировать дисперсию квадратов нагрузок фактора (колонки) по всем переменным (рядам) в факторной матрице, которое обладает эффектом дифференциации оригинальных переменных по из- влеченным факторам. Содержательный смысл применение данного вращения сводится к получению матрицы нагрузок на каждый фактор таким образом, чтобы они отличались максимально возможным способом. Иными словами мы предполагаем, что полученные факторы не должны быть связаны между собой. Каждый фактор будет склонен обладать либо большими, либо небольшими нагрузками со стороны любой конкретной переменной. Вращение Варимакс обеспечивает результаты, которые позволяют настолько, насколько это возможно, связать каждую переменную с каким-то одним фактором.

Для начала разберем те методы выделения факторов, которые выделились в результате применения разработанного алгоритма и с учетом специфики проводимого исследования, а именно метод главных осей и обобщенный метод наименьших квадратов.

3.4 Результаты применения метода главных осей

Согласно критерию Кайзера, выделилось 2 компоненты, которые объясняют чуть больше 55% дисперсии.

Таблица 5

Полная объясненная дисперсия. Сумма квадратов нагрузок после ротации. Метод главных осей.

Factor

Rotation Sums of Squared Loadings

Total

% of Variance

Cumulative %

1

4,397

31,405

31,405

2

3,344

23,884

55,288

По данным показателям можно сделать вывод, что модель не является «качественной» - ею объясняется достаточно низкий процент дисперсии.

Обратим внимание на таблицу «общности», которая показывает, какая часть дисперсии каждой отдельной переменной объясняется моделью (см. Приложение, таблица 3). Хуже всего объясняется переменная «при принятии решений политики учитывали мнение правительств других европейских стран?». Она объясняется моделью только на 14%. Попытка исключить данную переменную из анализа не привела к значимому улучшению модели, процент общей объясняемой моделью дисперсии увеличился на 3%. Поэтому, не будем исключать переменную из анализа. Мы не будем исключать переменную из анализа еще и потому, что возможно именно это индикатор поможет интерпретировать выделившиеся факторы. Проанализируем таблицу с остатками корреляций (см. Приложение, таблица 5). Напомним, что чем ближе такие остатки к нулю (т.е., низкие или незначимые), тем выше уверенность исследователя в своем выборе числа факторов. Процент остатков корреляций, чей уровень превышает 0,05, равен 17%. Данный показатель интерпретируется только в контексте сравнения с альтернативной моделью, а это значит, что мы вернемся к нему, когда получим результаты факторного анализа обобщенным методом наименьших квадратов. Таким образом, выделилось 2 фактора, объясняющие 55% дисперсии наблюдаемых переменных.

Попробуем проинтерпретировать полученные факторы. Для этого обратимся к таблице «Матрица повернутых компонент».

Таблица 6

Матрица факторных нагрузок. Метод главных осей.

Factor

1

2

честные выборы

,429

,584

политические дискуссии

,156

,639

чтобы политические партии предлагали избирателям по-настоящему разные программы?

,266

,679

чтобы оппозиционные партии могли свободно критиковать правительство

,225

,794

критика государства СМИ

,320

,717

достоверная информация от СМИ

,562

,501

чтобы права меньшинств были защищены

,536

,406

возможность принятия политических решений посредством прямого голосования

,668

,405

справедливость судов

,756

,247

возможность отстранения правящих партий

,629

,303

защита государством от бедности

,863

,166

объяснение политических решений правительством

,651

,378

уменьшение доходного неравенства правительством

,827

,188

учитывание правительством мнений других стран ЕС

,308

,224

Процент факторных нагрузок больших 0,6 в первом факторе равен 42%, процент факторных нагрузок меньших 0,4 равен 35%. Процент факторных нагрузок во втором факторе больших 0,6 равен 42%, в то время как процент факторных нагрузок меньших 0,4 равен 28%.

Попробуем проинтерпретировать полученные результаты, выбрав порог для включения индикаторов в анализе на уровне 0,4. Данный выбор обусловлен тем, что в обзоре литературы было рекомендовано сверхдетерменировать фактор при проведении разведывательного факторного анализа [MacCallum et al., 1999].

Первый фактор характеризуется такими мнениями респондентов относительно образа демократии, как, честность СМИ, защита прав меньшинств, право граждан на принятия последнего слова посредством референдумов, справедливость судов, лишение поддержки правящих партий, если они плохо выполняют свою работу, защита от бедности государством, объяснение государственным аппаратом своих намерений гражданам, активные меры государства по уменьшению разница между уровнями доходов населения. Первый фактор является ключевым для людей, которые понимают демократию в первую очередь с точки зрения инструмента уменьшения неравенства среди населения. Это касается и справедливых судов и принятия государством мер по уменьшению экономического неравенства и государственной защиты от бедности. Данный фактор с точки зрения теоретической рамки относится к пониманию демократии как формы организации, упорядочивания и регулирования отношений между элементами структуры общества. Властные структуры в таком случае должны проявлять одинаковую заботу обо всех членах общества и защищать принципы свободы и равенства. Условно назовем данный фактор «Демократия - с позиции равенства». Данная характеристика подходит для всех факторных моделей вне зависимости от выбора метода выделения факторов.

Второй фактор объединяет в себе такие мнения респондентов как, честные выборы, обсуждение политических вопросов в своем кругу перед голосованием, представительство разных политических программ, возможность оппозиционных партий критиковать государство, возможность медиа критиковать государство, честность СМИ, защита прав меньшинств, прямое участие в голосовании. Вторым фактором руководствуются люди, считающие, что демократия, прежде всего, определяется оппозицией к существующей власти. Это выражается как в возможности политического плюрализма, так и в понимании СМИ как четвертой ветви власти. Возвращаясь к теоретической рамке, данный фактор может интерпретироваться с позиции определения демократии как формы государственно-политического устройства, которая характеризуется разделением властей и политикой сдерживания одной ветви власти дрогой. Подходящее название данному фактору - «Демократия с позиции плюрализма». Данная характеристика характерна для всех моделей факторного анализа кроме анализа с методом альфа факторизации и анализа с методом главных компонент.

Перейдем к анализу результатов применения факторного анализа с обобщенным методом наименьших квадратов.

3.5.Результат применения метода обобщенных наименьших квадратов

Согласно критерию Кайзера, выделилось 2 компоненты, которые объясняют чуть больше 56% дисперсии. По данным показателям можно сделать вывод, что модель не является «качественной» - ею объясняется достаточно низкий процент дисперсии.

Таблица 7

Полная объясненная дисперсия. Сумма квадратов нагрузок после ротации. Обобщенный метод наименьших квадратов.

Factor

Rotation Sums of Squared Loadings

Total

% of Variance

Cumulative %

1

4,440

31,712

31,712

2

3,404

24,318

56,029

Обратим внимание на таблицу «общности», которая показывает, какая часть дисперсии каждой отдельной переменной объясняется моделью (см. Приложение, таблица 8). Хуже всего объясняется переменная «Учитывание политиками мнения других европейских стран». Она объясняется моделью только на 18%. Попытка исключить данную переменную из анализа не привела к значимому улучшению модели, процент общей объясняемой моделью дисперсии увеличился на 4%. Поэтому, не будем исключать переменную из анализа. Проанализируем таблицу с остатками (см. Приложение, таблица 9). Напомним, что чем ближе такие остатки к нулю (т.е., низкие или незначимые), тем выше уверенность исследователя в своем выборе числа факторов. Процент остатков корреляций превышающий 0,05 равен 17%. Напомним, что данный показатель не интерпретируется сам по себе, а только с позиции сравнения с альтернативной моделью. Таким образом выделилось 2 фактора, объясняющие 56% дисперсии.

Обобщенный метод наименьших квадратов позволяет использовать метод Хи-квадрата как показатель качества модели. В нашем случае значение Хи-квадрата равно 658,02 при значимости 0,000. Значимые и большие хи-квадраты указывают на случайность значений в предсказанной матрице ковариаций, однако с учетом того, что наша выборка равна 2484 человека, то можно сказать, что результаты теста среагировали на очень большой размер выборки.

Таблица 8

Матрица факторных нагрузок.

Обобщенный метод наименьших квадратов

Factor

1

2

честные выборы

,437

,558

политические дискуссии

,169

,609

чтобы политические партии предлагали избирателям по-настоящему разные программы?

,289

,640

чтобы оппозиционные партии могли свободно критиковать правительство

,209

,840

критика государства СМИ

,297

,782

достоверная информация от СМИ

,550

,486

чтобы права меньшинств были защищены

,528

,414

чтобы граждане страны имели решающее слово в принятии наиболее важных политических решений путем прямого голосования на референдумах?

,657

,408

справедливость судов

,750

,252

возможность отстранения правящих партий

,629

,301

защита государством от бедности

,871

,170

чтобы правительство разъясняло свои решения избирателям?

,669

,370

уменьшение доходного неравенства правительством

,854

,174

учитывание правительством мнений других стран ЕС

,315

,208

Процент факторных нагрузок больших 0,6 в первом факторе равен 42%, процент факторных нагрузок меньших 0,4 равен 35%.

Процент факторных нагрузок больших 0,6 во втором факторе равен 28%, процент факторных нагрузок меньших 0,4 равен 45%.

Интерпретация факторных нагрузок для модели проведенной обобщенным методом наименьших квадратов практически не отличается от предыдущей интерпретации, проведенной для факторного анализа с применением метода главных осей. Напомним, что в результате у нас выделились два фактора, названия которых «Демократия - с позиции равенства» и «Демократия с позиции плюрализма».

Итак, мы подробно рассмотрели результаты применения двух факторных моделей, но прежде чем делать какие-либо выводы, мы рассмотрим результаты применения факторного анализа со всеми семи изучаемыми методами. Это будет сделано для того, чтобы обеспечить возможность проведения полного спектра сравнений по выбранным ранее критериям. Таким образом, следующая часть главы будет посвящена сравнительным характеристикам семи факторных моделей. Детальная информация по факторным моделям с оставшимися методами выделения факторов представлена в приложении.

3.6 Сравнительный анализ факторных моделей выполненных семью методами выделения фаткоров

Начнем сравнение с процента объясненной дисперсии после вращения для всех моделей. Данные представлены в таблице 14.

Таблица 9

Процент объяснённой дисперсии после вращения всех моделей.

Rotation Sums of Squared Loadings

PCA

60%

PAF

55%

ML

55%

ULS

55%

OLS

56%

Alpha

55%

Image

50%

Самый высокий процент объяснённой дисперсии имеет модель с методом главных компонент в качестве выделяющего факторы. Самый низкий процент объясненной дисперсии у модели, выполненной методом анализа образов. Остальные же модели показали абсолютно одинаковый результат - 55-56% процентов объясненной дисперсии.

Процент остатков корреляции, чей уровень превышает 0,05, для тестируемых моделей представлен в таблице ниже.

Таблица 10

Процент остатков корреляции больших 0,05

PCA

35%

PAF

17%

ML

15%

ULS

17%

OLS

17%

Alpha

16%

Image

-

Напомним, что матрица остатков репродуцированных корреляций помогает исследователю выявить конкретные корреляции, которые плохо воспроизводятся факторной моделью с данным числом факторов. Путем экспериментирования с разными моделями с разным числом факторов, исследователь может оценить, какая модель лучше воспроизводит корреляции, являющиеся наиболее критическими для его исследовательских целей. Чем меньше процент остатков корреляции больших 0,05 в модели, тем выше уверенность исследователя в выборе числа факторов. Метод главных компонент показал наибольший процент остатков корреляций, которые больше 0,05. Для такого метода как анализ образов высчитать остатки невозможно, так как этот метод опирается на принципиально другие положения о выделении факторов. Остальные пять методов имеют процент остатков корреляции больших 0,05 в промежутке от 15 до 17%.

Показатель качества модели Хи-квадрат встроен в алгоритм обобщенного метода наименьших квадратов и максимального правдоподобия, однако из-за большой выборки к полученному значению следует отнестись скептически. Более детально проанализируем таблицы с общностями и факторными нагрузками.

Опишем ситуацию с общностями; результаты для семи моделей представлены в таблице ниже.

Таблица 11

Общности для семи факторных моделей

PCA

PAF

ML

ULS

GLS

Alpha

Image

Свободные и честные выборы

,58

,53

,50

,53

,55

,53

,48

Политические дискуссии

,60

,43

,39

,43

,54

,45

,36

Разные политические программы

,64

,53

,48

,53

,59

,56

,45

Возможность критики государства оппозицией

,72

,68

,72

,68

,78

,66

,59

Возможность критики государства сми

,66

,62

,68

,62

,75

,58

,58

Достоверная информация из сми

,61

,57

,56

,57

,64

,56

,54

Защита прав меньшинств

,50

,45

,45

,45

,54

,46

,43

Прямое участие граждан в голосовании

,65

,61

,59

,61

,68

,60

,57

Справедливость судов

,69

,63

,62

,63

,67

,63

,58

Лишение прав правящей партии при невыполнении обязательств

,55

,49

,49

,49

,51

,49

,46

Защита государством граждан от бедности

,79

,77

,79

,77

,81

,76

,68

Разъяснение правительством своих решений

,61

,57

,58

,57

,66

,57

,54

Уменьшение правительством неравенства доходов граждан

,75

,72

,75

,72

,79

,73

,66

Учитываение политиками мнений стан ЕС

,18

,15

,14

,14

,19

,15

,14

Среднее

0,61

0,55

0,55

0,55

0,62

0,55

0,50

Для наглядности представим данную таблицу в виде графика, где значения общностей будут отсортированы по убыванию столбца с данными по модели, выполненной методом главных компонент.

Диаграмма 1

Значения общностей исследуемых моделей

На диаграмме видно, что значения общностей у моделей выполненных методом ULS и PAF практически совпадают. Обобщенный метод наименьших квадратов обеспечивает высокую оценку общностей по сравнению с остальными методами выделения факторов, в то же время как метод максимального правдоподобия показывает схожий с ним результат по каждому индикатору, только занижает общности в среднем на 0,07. Метод альфа факторизации «сглаживает» разницу между высокими и низкими общностями, такое же решение предлагает и анализ образов, с одним отличием, что image factoring занижает в среднем значения общностей в среднем на 0,09 по сравнению с alpha factoring. Полученные результаты соотносятся с результатами теоретико-методологического анализа, а именно той части, которая посвящена операциями над общностями.

Обратимся к таблице 17, в которой представлены результаты сравнения факторных нагрузок моделей.

Таблица 12

Сравнение факторных нагрузок моделей

1 фактор

2 фактор

PCA

PAF

ML

ULS

GLS

Alpha

Image

PCA

PAF

ML

ULS

GLS

Alpha

Image

Защита государством граждан от бедности

0,88

0,86

0,87

0,86

0,87

0,86

0,80

0,13

0,17

...

Подобные документы

  • Методы социологического изучения содержания публикаций. Реклама – как предмет социологического анализа. Гендерные стереотипы. Социологический анализ образа женщины в современной рекламе. Классификация методов анализа документов, и характеристика их видов.

    реферат [19,7 K], добавлен 02.12.2008

  • Специфика социологического метода. Перевод теоретического уровня исследовательской проблемы на уровень эмпирического описания и анализа. Типологизация социологических методов. Составление анкеты и способы работы с ней. Интервью: понятие и виды.

    курсовая работа [210,3 K], добавлен 16.05.2011

  • Обзор методов проведения эмпирических исследований социально-экономических и политических процессов. Особенности анализа документов как метода проведения социологических исследований. Специфика методики массового опроса, эксперимента и наблюдения.

    курсовая работа [78,7 K], добавлен 31.01.2014

  • Определение и виды эксперимента, его использование в науке. Особенности использования метода эксперимента в политических, социологических исследованиях. Применение метода эксперимента при проведении опросов о политических ориентациях жителей г. Астрахани.

    курсовая работа [49,2 K], добавлен 22.06.2015

  • Специфика социологического опроса как диалога социальных общностей. Становление познавательных возможностей метода опроса Статистическая традиция метода опроса. Качественная традиция. Взаимосвязь количественного и качественного подходов в методе опроса.

    курсовая работа [45,3 K], добавлен 20.02.2009

  • Изучение здорового образа жизни в мультфильме "Маша и медведь" с помощью контент-анализа. Мультфильм как предмет анализа визуальной социологии. История развития контент-анализа в социологических исследованиях, его основные достоинства и недостатки.

    презентация [1,6 M], добавлен 15.02.2016

  • Изучение главных особенностей наблюдения, как метода социологического исследования: сущность, виды, этапы, преимущества и недостатки. Цель мониторинга экономики образования - создания системы сбора, анализа информации, отображающей состояние этой сферы.

    курсовая работа [2,9 M], добавлен 11.01.2011

  • Особенности формирования образа городской семьи. Формы традиционной семейной жизни в России в XIX-XXI веке: сравнительная характеристика. Социологическое исследование с целью анализа факторов, влияющих на систему супружеских отношений в молодых семьях.

    курсовая работа [86,2 K], добавлен 11.07.2015

  • Характеристика методов социологических исследований (контент–анализ, опросные методы, социологическое наблюдение, кейс-стади, социологический эксперимент). Описание социологического телефонного опроса по выявлению потребности в услугах компании.

    курсовая работа [445,3 K], добавлен 12.11.2014

  • Понятие и сущность категории "образ жизни", ее составляющие. Руководители как специфическая социальная группа. Социологический анализ образа жизни современных руководителей г. Вологды. Характеристика контент-анализа печатных источников города Вологды.

    дипломная работа [835,6 K], добавлен 16.09.2017

  • Типы исследовательских стратегий и специфика процедуры исследования с помощью метода кейс-стади. Практическое применение метода и его сущность. Изучение занятости и эффективности профессионального обучения и профориентации молодежи Рязанской области.

    курсовая работа [49,7 K], добавлен 20.09.2009

  • Предмет социологии и трактовка общества в понимании французского социолога Э. Дюркгейма. Анализ концепций и идей Дюркгейма, описание правил социологического метода. Общественная солидарность и разделение труда - центральная проблема творчества Дюркгейма.

    реферат [25,6 K], добавлен 25.04.2011

  • Теоретические и практические основы использования социологических методов в связях с общественностью. Классификации методов социологического исследования. Основные направления деятельности службы PR ОАО "Мегафон". Описание проблемы, методы исследования.

    курсовая работа [74,0 K], добавлен 17.06.2011

  • Теоретическое изучение количественных методов изучения аудитории (массовые опросы, анкетирование, интервьюирование, дневники). Отличительные черты метода анализа документов. Особенности и правила применения количественных методов исследования в СМИ.

    курсовая работа [30,9 K], добавлен 20.01.2011

  • Аспекты статистического анализа обеспеченности жильем. Применение статистических методов для анализа обеспеченности жильем населения. Анализ однородности совокупности районов по коэффициенту демографической нагрузки. Корреляционно-регрессионный анализ.

    курсовая работа [259,9 K], добавлен 18.01.2009

  • Рассмотрение основных методов статистического анализа. Исследование Кунгурского муниципального района. Проведение расчетов по показателям ежегодника. Анализ демографии и социально-экономического развития данного района по результатам применения.

    курсовая работа [68,4 K], добавлен 24.06.2015

  • Основные направления применения контент-анализа как формализованного метода изучения текстовой и графической информации. Составление кодировальной матрицы для регистрации единиц анализа. Применение анализа в социально-психологических исследованиях.

    реферат [46,2 K], добавлен 09.10.2012

  • Социологический подход к концепции потребностей. Потребление в современной России: воздействие социальных, природных факторов на сервисную деятельность. Природно-географическая специфика. Состояние сферы услуг как барометр состояния современного общества.

    реферат [24,1 K], добавлен 10.02.2009

  • Рассмотрение теоретических основ молодой семьи как объекта социальной работы. Понятие анкетного опроса как метода сбора социологической информации. Анализ данных проведенного среди студентов исследования с целью выявления специфики идеальной семьи.

    курсовая работа [818,5 K], добавлен 29.06.2014

  • Функции института образования в обществе и их образовательные модели. Специфика использования метода анкетного опроса как инструмента диагностики проблем в образовательной системе Республики Беларусь. Отношение студентов к образованию в Беларуси.

    курсовая работа [106,1 K], добавлен 04.05.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.