Використання програмного забезпечення для аналізу даних при проведенні системного аналізу політичних явищ та процесів

Специфіка застосування програмного засобу "Statistica" для проведення системного аналізу в політології. Приклади практичного застосування пакету програм. Алгоритм проведення дискримінантного аналізу в рамках системного аналізу політичних явищ та процесів.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык украинский
Дата добавления 18.02.2014
Размер файла 574,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ВИКОРИСТАННЯ ПРОГРАМНОГО ЗАБЕЗПЕЧЕННЯ ДЛЯ АНАЛІЗУ ДАНИХ ПРИ ПРОВЕДЕННІ СИСТЕМНОГО АНАЛІЗУ ПОЛІТИЧНИХ ЯВИЩ ТА ПРОЦЕСІВ

Д.В. Неліпа

Без належного розуміння методів статистичного аналізу дослідник у сфері соціальних наук поводиться як сліпий, що шукає в темній кімнаті чорну кішку, якої там немає. Цю цитату двох відомих фахівців із статистики Фредеріка Е. Крокстона та Дадлі Дж. Коудена часто використовують для підкреслення важливості та доцільності оперування при проведенні системного аналізу політичних явищ та процесів не лише якісними, а й кількісними даними [1]. Важко уявити собі хоча б одну зарубіжну конференцію (а це чітко показує аналіз збірників матеріалів) без виступів політологів, висновки яких ґрунтувалися б на даних, отриманих саме за допомогою математики. Натомість, в Україні математичне моделювання і застосування технологій математики значно більше поширене у природничих та технічних науках і проникає у сферу соціальних наук, в тому числі в політологію, доволі повільно. Серед головних причин цього відсутність знань та навиків роботи із математичним інструментарієм, а також нерозуміння можливостей, які дає його використання.

Водночас, ще Іммануїл Кант наголошував, що будь-яке пізнання є науковим настільки, наскільки воно є математичним [2]. Мова математики вважається найбільш високоспеціалізованою, їй притаманна точність, однозначність та чіткість. Кількісне вираження якісних показників часто може бути значно ефективнішим та дозволити краще обґрунтувати необхідність прийняття певного політичного рішення. Це можна проілюструвати наступним прикладом. Для оцінки ефективності своїх навчальних курсів компанія "North American" у 1963 р. почала використовувати так звану кількість "студентогодин" на одного викладача з певної дисципліни. Це викликало незадоволення викладачів, які переконували, що значно важливіше та доцільніше визначати якість навчальної роботи, аніж її кількість. Проте, практика довела ефективність цієї системи. Якщо слухачі курсу були задоволені викладачем, їх кількість збільшувалась і це призводило до покращення показника "студенто-годин". Відтак, відповідальність викладача за залучення слухачів сприяла підвищенню якості навчального курсу, спонукала постійно вдосконалювати та оновлювати його [3].

Важливість володіння фахівцем-політологом необхідними вміннями та навиками роботи із математичним інструментарієм підтверджує і той факт, що навчання на кафедрах та факультетах політології в країнах не лише західної, а й східної та центральної Європи, передбачає обов'язкове вивчення основ математики та математичної статистики. При цьому, здобуваються лише ті знання, що будуть корисними для політологів, які хочуть фахово досліджувати політичні явища та процеси. Як правило, це передбачає вивчення спеціально розроблених комп'ютерних програм, які уже мають наперед закладені формули, інструменти для обробки даних, побудови графіків тощо. Ці програми дозволяють доволі ефективно працювати із кількісними даними, враховуючи як категоричні постійні (вік, стать, релігія, місце проживання тощо), так і змінні, створюючи групи даних за певними критеріями (активні виборці, багатодітні сім'ї та ін.). Вони "розуміють" і можливі взаємозв'язки між змінними. Наприклад, не порівнюватимуться показники для чоловіків (стать) та пенсіонерів (соціальна група), натомість, у разі потреби співставлятимуться відповідні дані для чоловіків та жінок (як стать впливає на активність виборців?). Тобто, досліднику достатньо вірно зібрати та ввести дані, обрати технологію їх аналізу та стежити за правильним проведенням операцій із ними. Усе інше, в тому числі, і власне підрахунки, програми здійснюють самостійно. Відтак, метою даної статті є з'ясування специфіки застосування програмного засобу "Statistica" для проведення системного аналізу в політології.

Одним із найпоширеніших програмних засобів, що використовується в рамках системного аналізу, є пакет програм "Statistica". Перша версія даної програми була випущена ще у 1991 році і з того часу вона постійно вдосконалювалась, її функції розширювалися та доповнювалися, створювалися додаткові можливості для обробки інформації [4]. Її користувачами є чимало провідних університетів, дослідницьких центрів, компаній, банків, державних установ тощо. Вона дозволяє здійснювати первинний або "розвідувальний" аналіз (визначити найбільше, найменше та середні значення тощо), виявляти та оцінювати залежності досліджуваних параметрів (регресійний аналіз), створювати класифікації об'єктів (дискримінантний, кластерний аналіз) та багато інших [5]. Насамперед, слід зауважити, що даний програмний засіб найкраще підходить для обробки статистичних даних, зведених у таблиці. Для цього в якості допоміжного інструменту найзручніше використовувати Microsoft Excel, дані з якого легко експортуються у "Statistica", або ж можна створювати відповідні таблиці у самій програмі.

Для ілюстрації можливостей практичного застосування пакету програм "Statistica" скористаємось даними, які демонструють підтримку чотирьох кандидатів у 30 регіонах (дані не відображають реальної ситуації, є випадковими та створеними лише для даного прикладу). Представимо їх у вигляді табл. 1. Для аналізу наявних тенденцій "вручну" потрібно багато часу та високою є ймовірність помилки. Тому для роботи з ними доцільно використовувати даний програмний засіб, що дозволяє зробити достатньо багато корисних висновків для кращого розуміння ситуації та планування подальших дій.

Таблиця 1. Вихідні дані

Кандидати

He підтримали жодного

1

2

3

4

Регіон 1

25,21

21,93

26,32

13,69

12,85

Регіон 2

4,03

28,29

41,00

18,86

7,82

Регіон 3

34,64

2,29

30,96

18,26

13,86

Регіон 4

25,61

25,61

11,15

12,62

25,00

Регіон 5

7,64

21,98

20,36

25,16

24,85

Регіон 6

29,02

10,65

4,16

30,97

25,20

Регіон 7

20,03

16,34

9,50

27,15

26,93

Регіон S

11,84

54,87

7,49

15,68

10,12

Регіон 9

18,22

21,84

9,45

35,29

15,20

Регіон 10

24,81

38,34

6,01

16,11

14,73

Регіон 11

19,44

41,91

10,27

13,48

14,90

Регіон 12

36,86

24,33

1,16

28,06

9,59

Регіон 13

30,12

28,96

8,77

16,86

15,28

Регіон 14

14,50

11,22

19,08

33,76

21,44

Регіон 15

24,38

27,52

16,09

7,41

24,60

Регіон 16

29,16

14,86

31,59

7,18

17,22

Регіон 17

18,48

6,79

40,93

8,98

24,83

Регіон 18

32,59

30,69

11,50

11,54

13,69

Регіон 19

21,71

23,76

31,05

15,84

7,64

Регіон 20

57,83

1,62

4,26

23,34

12,95

Регіон 21

1,30

33,82

36,15

18,94

9,79

Регіон 22

13,18

29,34

22,98

18,10

16,40

Регіон 23

21,54

21,37

20,39

15,90

20,80

Регіон 24

7,55

30,59

22,90

27,68

11,29

Регіон 25

22,34

19,34

19,97

23,39

14,96

Регіон 26

7,85

40,10

23,78

17,02

11,24

Регіон 27

14,04

24,21

21,75

22,57

17,43

Регіон 28

25,58

25,99

13,14

17,78

17,51

Регіон 29

17,53

17,79

4,49

34,98

25,20

Регіон ЗО

13,39

18,59

23,12

29,18

15,72

Приміром, для початку можна застосувати модуль первинної обробки, який дозволить отримати описові статистики (див. табл. 2). Вони відображають максимальні, мінімальні та середні значення підтримки, а також наявні відхилення, що показують рівномірність підтримки. Останній показник дозволяє виявити міру розподілення електорату по території певної держави (якщо він дорівнює 0, це означає, що кандидат в усіх областях набрав однаковий відсоток голосів; зростання його значення показує збільшення нерівномірності розподілу). При застосуванні модуля первинної обробки у програмному засобі "Statistica" з'являється таблиця даних. У нашому прикладі, аналізуючи стовбець "Стд. откл." (стандартні відхилення), можна помітити, що найбільше відхилення змінної підтримки у кандидата 2, а найменше у кандидата 4 (найменше значення в таблиці має величина, що відображає людей, які не підтримали жодного кандидата, тому при порівнянні даних різних кандидатів ми його не враховуємо). Це дозволяє зробити висновок, що підтримка кандидата 2 найбільше залежить від регіону, а підтримка кандидата 4 від цього параметра залежить найменше.

Таблиця 2. Описові статистики

Переменная

Описательные статистики

NHiion.

Среднее

Минимум

Максимум

Стд.откл.

Кандидат 1

ЗО

21,01633

1,302668

57,33161

11,39059

Кандидат 2

ЗО

23,83129

1,623343

54,86846

11,55894

Кандидат 3

ЗО

18,32524

1,158547

41,00266

11,17216

Кандидат 4

ЗО

20,19278

7,176641

35,29468

7,95632

He підтримали жодного

ЗО

16,63437

7,638191

26,92693

5,80283

Таким чином, внаслідок застосування модуля первинної обробки даних, отримуємо таблицю із необхідною інформацією. Однак, для одержання цього ж результату інколи зручніше обрати дещо інший спосіб відображення даних побудову діаграми розмаху (рис. 1). Результати будуть ідентичними, проте за допомогою діаграми розмаху вони більш наочні і легше сприймаються (це ще ефективніше, якщо кількість величин велика, наприклад 20, а не 4, як у нашому прикладі). На ній зображено середні значення показників підтримки, а також значення стандартних відхилень. З діаграми видно, що найбільше середнє значення показника підтримки у кандидата 2, а найменше у кандидата 3. Також, наприклад, дана діаграма дозволяє зробити висновок, що підтримка кандидата 4 розподілена за регіонами більш рівномірно, аніж у кандидата 3 (причиною того може бути те, що кандидат 3 не піднімає або піднімає меншою мірою ті проблеми, ставлення до яких суттєво відрізняється у різних регіонах).

Для первинного аналізу даних також можна побудувати діаграми розсіювання (рис. 2). Для цього з меню "графіка" застосовуємо команду "діаграми розсіювання". Вона відображає співвідношення підтримки та дає змогу оцінити схожість голосування громадян за різних кандидатів. Використання діаграм розсіювання доволі ефективне при проведенні системного аналізу в політології, адже вони дозволяють виявити можливі залежності між даними.

Рис. 1. Діаграма розмаху

Аналізуючи діаграми розсіювання у нашому прикладі, можна прийти до висновку, що кандидати 1 і 2 найбільшою мірою конкурують між собою (при збільшенні підтримки кандидата 1 суттєво падає підтримка кандидата 2 і навпаки). Це відображається нахилом прямої до осі координат: максимальна конкуренція тоді, коли пряма нахилена під кутом 45 і відсутня при її паралельності осі координат (див. рис. 3). Враховуючи це, а також інші важливі параметри, які у даному прикладі не беруться до уваги (результати попередніх виборів, програмні засади, на які опираються кандидати, їх ідеологічна близькість та ін.), можна отримати й інші корисні висновки, наприклад, якщо під поняттям "кандидат" ми маємо на увазі не окрему особу, а політичну партію, то можна з'ясувати, чи варто формувати коаліцію.

Прикладами іншого можливого застосування можуть бути діаграми з такими досліджуваними величинами як "вік" "% громадян", які підтримують кандидата (наприклад зведена діаграма по декількох регіонах), "дохід громадян" "кількість активних виборців" і т. д.

Рис. 2. Діаграми розсіювання

Кандидат X 0 Кандидат X

Рис. 3. Діаграми розсіювання максимальної (зліва) і мінімальної конкуренції (справа)

Таблиця 3. Вихідні дані для проведення дискримінантного аналізу

Відтак, наведені приклади демонструють, що однією із суттєвих переваг пакету програм "Statistica" є те, що він дозволяє отримати не лише кількісні дані, а й більш доступні для сприйняття та опрацювання графіки і діаграми. Цей засіб можна використовувати не лише з метою проведення попереднього (розвідувального) аналізу. Розглянемо його застосування для дискримінантного аналізу. Дискримінантний аналіз це технологія математичної статистики, що дозволяє досліднику виокремити та вивчити відмінності між двома чи більше групами об'єктів чи процесів із врахуванням одразу кількох змінних. Його можна використовувати для розробки системи моніторингу та оцінки діяльності персоналу в державних чи недержавних структурах, голосувань депутатів законодавчих органів, з'ясування економічних відмінностей між регіонами країни, передбачення поведінки виборців та ін. Головними передумовами для проведення дискримінантного аналізу є наявність двох або більше груп та можливість виміру кількох змінних для визначення схожості чи несхожості цих груп [6].

Таблиця 4. Результати аналізу дискримінантних функцій

Далі застосуємо метод дискримінантного аналізу з меню "аналіз" - опція "багатомірний розвідувальний аналіз". Отримаємо таблицю з результатами (табл. 4):

Для кращого розуміння алгоритму проведення дискримінантного аналізу в рамках системного аналізу політичних явищ та процесів наведемо приклад його практичного використання. Для цього здійснимо дослідження двох фракцій Верховної Ради України з метою визначення того, який з обраних факторів (вік, стать, попереднє місце роботи та область проживання) найкраще демонструватиме відмінності між ними. Використаємо реальні дані отримані з офіційного сайту Верховної Ради України [7].

Введемо отриману із сайту інформацію в програму "Statistica" у вигляді таблиці (табл. 3).

Для обробки зведених даних використаємо пакет статистичного аналізу "Statistica". Групуючою змінною виступатиме "фракція", а в якості факторів, що впливають на розподіл рік народження, стать, місце роботи та область проживання. Для з'ясування того, наскільки дані фактори розрізняють виокремленні нами групи (фракції), виміряємо лямбду Вілкса. Її можна визначити автоматично через уже закладену формулу в програмі "Statistica". Загалом, лямбда Вілкса може набувати значень від 0 до 1. Значення "0" свідчить про те, що за даною характеристикою групи повністю відмінні між собою, при "1" за даною властивістю різниці між групами немає.

У нашому випадку лямбда Вілкса дорівнює 0,67621, що дозволяє стверджувати, що визначені фактори мало дискримінують досліджувані дані. Подальше проведення дискримінантного аналізу дало б змогу розрахувати дискримінантну функцію, за допомогою якої можна було б по заданих значеннях віку, статі, місця роботи та проживання визначити, до якої партії належить депутат.

Оскільки головною метою даного дослідження є суто демонстрація практичного застосування дискримінантного аналізу, інші дані, які потребували б додаткового збору, не використовувалась. Однак, якщо б такий аналіз проводився з іншою ціллю, варто було б взяти до уваги ті фактори, які б значно сильніше дискримінували досліджувані дані, приміром підтримку певних законопроектів, ставлення до тих чи інших політичних проблем, рівень доходів тощо. Для цього можна розширити сферу отримання первинних даних. Приміром, розробити анкету, яку б заповнили депутати або їх помічники (наприклад, щодо позицій із тих чи інших питань), проаналізувати їх податкові декларації, звернутися до політичних партій, які вони представляють, за більш детальними біографіями кожного члена фракції. Можна, також, застосувати технологію Делфі (за відповідями експертів визначити ставлення депутатів до певних політичних проблем) або ж контент-аналіз їх виступів та промов. При проведенні реального системного дослідження усі ці та чимало інших технологій збору первинних даних допоможуть дійсно виявити відмінності між фракціями або дати відповідь на будь-яке інше питання, поставлене аналітиком.

Ефективність проведення даного аналізу значною мірою базується на використанні відповідного програмного забезпечення. Отримання цього ж результату за допомогою інших засобів, не використовуючи спеціалізоване програмне забезпечення, вимагало б доволі багато часу та й вірогідність помилки при таких складних обчисленнях доволі висока. Прикладний пакет "Statistica" значно прискорює та полегшує процес проведення системного аналізу, а також дає можливість створювати елементи візуалізації результатів, які значно покращують їх сприйняття.

Таким чином, нерозуміння суті системного аналізу поряд із відсутністю в навчальній програмі майбутніх політологів достатньої кількості математичної та логічної освіти призводить до того, що переваги системного аналізу як методу політології не використовуються в повній мірі. Поки не будуть створені можливості проходження спеціалістами у галузі соціально-політичних наук спеціальної підготовки, яка б охоплювала математику, кібернетику, основи моделювання та вивчення результатів міждисциплінарних досліджень, поширення системного аналізу в політології буде не настільки активним.

програма політологія дискримінантний

Спискок литературы

1. Croxton F.E. Applied general statistics / Frederick Emory Croxton, Dudley Johnstone Cowden. Upper Saddle River, NJ : Prentice-Hall, 1939. Р. 1.

2. Девятое Д.Х. Системный анализ / Д.Х. Девятов, И.М. Ячиков, А.П. Морозов. Магнитогорск : МГТУ им. Г. И. Носова, 2001. С. 26.

3. Чорней Н.Б. Теорія систем і системний аналіз / Н.Б. Чорней, Р.К. Чорней. К.: МАУП, 2005. С. 174.

4. Big Data Analytics, Enterprise Analytics, Data Mining Software, Statistical Analysis, Predictive Analtyics

5. Боровиков В.П. Программа STATISTICA для студентов и инженеров / В. П. Боровиков. М. : Компьютер Пресс, 2001. С. 7.

6. Klecka W. Discriminant Analysis / William Klecka. Newbury Park, CA : SAGE publications, Inc., 1980. Р. 7-8. 7. Депутатські фракції і групи

Размещено на Allbest.ru

...

Подобные документы

  • Методика проведення рентгеноструктурного аналізу та проведення повнопрофільного аналізу дифрактограм за допомогою програми PowderCell 2.4. Способи кількісного розрахунку сумішей полікристалічних складових. Налаштування параметрів меню Diffraktion.

    методичка [2,1 M], добавлен 03.10.2014

  • Системний аналіз. Розширена вхідна і вихідна функції мережі Петрі. Зображення граф мережі Петрі, дерева досяжності глибини 3. Написання програми, яка повинна шукати розширену вхідну і вихідну функції за вхідними даними і будувати дерево досяжності.

    контрольная работа [233,3 K], добавлен 14.03.2010

  • Побудова матриць попарних порівнянь альтернатив за критеріями та аспектів відносно втрат від придбання програмного забезпечення. Розробка рекомендацій щодо обрання варіанту реалізації проекту системи консолідованої інформації по методу аналізу ієрархій.

    контрольная работа [1,2 M], добавлен 20.12.2011

  • Основні положення системного аналізу, його використання. Характеристика та основні ознаки складних систем. Використання теорії графів для структурного аналізу. Графова потокова модель технологічного комплексу. Виділення внутрішніх комплексів в ТК.

    курсовая работа [88,3 K], добавлен 01.06.2010

  • Статистичний огляд ринку праці в ІТ-галузі в Україні. Математичні, економетричні методи, моделі в аналізу ІТ-ринку праці. Оцінка людського капіталу. Динаміка оплати праці за декілька останніх років. Структура вакансій розробників програмного забезпечення.

    дипломная работа [457,3 K], добавлен 12.10.2015

  • Моделювання в області системотехніки та системного аналізу. Імітація випадкових величин, використання систем масового обслуговування, дискретних і дискретно-безперервних марковських процесів, імовірнісних автоматів для моделювання складних систем.

    методичка [753,5 K], добавлен 24.04.2011

  • Визначення вимог до програмного забезпечення. Проектування архітектури програми, структури даних та інтерфейсу. Програмування графічного редактора, специфікація його класів та алгоритм роботи. Зміна архітектури редактора згідно нових вимог замовника.

    дипломная работа [1,2 M], добавлен 05.01.2014

  • Проведення аналізу функціонування систем енергозабезпечення космічних літальних апаратів. Вибір і обґрунтування структурної схеми енергопостачання наносупутника. Розробка схеми програмного забезпечення енергоживлення університетського супутника.

    дипломная работа [1,2 M], добавлен 28.04.2012

  • Методи аналізу та засоби забезпечення надійності, що використовуються при проектуванні програмного забезпечення. Основні види складності. Якісні та кількісні критерії. Ієрархічна структура. Попередження помилок. Реалізація статичної і динамічної моделей.

    реферат [128,2 K], добавлен 20.06.2015

  • Характеристика інструментів MatLab - пакету прикладних програм для числового аналізу. Основні функції та можливості програмного комплексу. Скриптова мова програмування. Побудова моделі штучної нейронної мережі за допомогою команди NNTool та її тестування.

    лабораторная работа [215,8 K], добавлен 11.06.2015

  • Принцип роботи СТО. Аналіз існуючих теоретико-практичних розробок по створенню інформаційних систем. Модель аналізу виконання робіт з ремонту й обслуговування на СТО. Розробка автоматизованої системи обробки інформації, опис програмного забезпечення.

    дипломная работа [1,3 M], добавлен 11.10.2013

  • Дослідження методів криптографічного аналізу. Властивості гарної статистики. Технічні та програмні засоби. Алгоритм програми криптографічного аналізу. Модель статичного кріптоаналізу. Аналіз зашифрованого тексту. Рекомендації щодо використання програми.

    курсовая работа [1,5 M], добавлен 05.12.2012

  • Класифікація та склад антивірусного програмного забезпечення. Методи знаходження комп'ютерних вірусів. Технології сигнатурного та імовірнісного аналізу. Можливості антивірусних програм Avast, AVG, Лабораторії Касперського, Norton AntiVirus, BitDefender.

    реферат [26,6 K], добавлен 06.04.2014

  • Основна мета інформаційних технологій. Реінжиніринг – процес постійного аналізу і впровадження поліпшення. Проект "комплексного впорядкування діяльності". Вибір програмного забезпечення. Застосування реінжинірингу та ознаки інформаційного суспільства.

    реферат [16,9 K], добавлен 22.12.2008

  • Аналіз задач, які вирішуються з використанням інформаційної системи. Вибір серверного вирішення, клієнтської частини, мережного вирішення, системного програмного забезпечення. Розробка підсистеми діагностики, керування, забезпечення безпеки даних.

    курсовая работа [1,5 M], добавлен 22.04.2011

  • Аналіз основних параметрів та функцій програми Multisim, особливості конструювання електронних схем. Створення моделі електричних кіл та проведення їх всебічного аналізу, використання програмного продукту для промислового виробництва складних пристроїв.

    лабораторная работа [270,2 K], добавлен 22.06.2011

  • Технології об'єктно-орієнтованого аналізу та проектування інформаційних систем. Історія та структура мови UML. Опис функціональної моделі засобами UML. Використання UML в проектуванні програмного забезпечення. Характеристика CASE-засобів Visual Paradigm.

    дипломная работа [7,9 M], добавлен 26.05.2012

  • Первинний опис програмного забезпечення графічний редактор. Функціональна специфікація класів. Проектування архітектури програми, структури даних та графічного інтерфейсу. Опис алгоритму природною мовою. Аналіз впливу зміни вимог на зміну архітектури.

    курсовая работа [2,4 M], добавлен 07.10.2014

  • Аналіз системи збору первинної інформації та розробка структури керуючої ЕОМ АСУ ТП. Розробка апаратного забезпечення інформаційних каналів, структури програмного забезпечення. Алгоритми системного програмного забезпечення. Опис програмних модулів.

    дипломная работа [1,9 M], добавлен 19.08.2012

  • Розробка модулю корпоративної інформаційної системи (КІС) автоматизації аналізу матеріальних ресурсів підприємства за допомогою процедур, що написані на VBA (Visual Basic for Application) для MS Access. "Автоматизація аналізу ресурсів підприємства".

    курсовая работа [573,4 K], добавлен 19.03.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.