Статистична обробка інформації в середовище Excel та SPSS
Описова статистика у програмному додатку Microsoft Excel - засіб аналізу для створення одномірного статистичного звіту, що містить інформацію про центральну тенденцію та мінливість вхідних даних. Групи вимірювань для проведення дескриптивного аналізу.
Рубрика | Экономико-математическое моделирование |
Вид | контрольная работа |
Язык | украинский |
Дата добавления | 27.02.2018 |
Размер файла | 362,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Размещено на http://www.allbest.ru
Вступ
Для аналізу масивів даних використовують велику кількість різноманітних математичних методів, що дозволяють повно і всебічно аналізувати зібрану інформацію. У сучасних соціальних науках з цією метою активно застосовуються комп'ютерні програми математико-статистичної обробки даних.
Стандартні статистичні методи обробки даних включені до складу електронних таблиць, таких як MS Excel, і у математичні пакети загального призначення, наприклад Mathсad. Але набагато більших можливостей надають спеціалізовані статистичні пакети, що застосовують найсучасніші методи математичної статистики для обробки даних. За даними Міжнародного статистичного інституту, число таких статистичних пакетів наближається до тисячі. Серед них є професійні статистичні пакети, призначені для користувачів, добре знайомих з методами математичної статистики, і є пакети, з якими можуть працювати фахівці, які не мають глибокої математичної підготовки. Серед програмних засобів останнього типу можна виділити спеціалізовані пакети, у першу чергу статистичні - Statistica, SPSS, STADIA, STATGRAPHICS, які мають великий набір статистичних функцій: факторний аналіз, регресійний аналіз, кластерний аналіз тощо. Такі програмні продукти зазвичай містять і засоби візуальної інтерпретації отриманих результатів: графіки, діаграми.
Вибір статистичного пакета для аналізу даних залежить від характеру завдань, що розглядаються, обсягу даних, які обробляються, наявного обладнання та кваліфікації користувача. При аналізі даних користувачу статистичного програмного пакета доводиться виконувати обчислення широкого спектра статистик, передавати і перетворювати дані для їхнього аналізу, а також представляти отримані результати в зручному, наочному вигляді. Тому при виборі того або іншого статистичного пакета, для порівняння пакетів, необхідно насамперед звертати увагу на такі характеристики:
* зручність роботи з пакетом, легкість його освоєння: наявність убудованої системи допомоги, довідника користувача, можливості роботи без суттєвої математичної підготовки;
* кількість статистичних методів, що застосовуються;
* зручність керування даними (експорт/імпорт даних, їхня реструктуризація);
* графічні можливості: наявність убудованого графічного редактора, можливість показу окремих елементів графіка, можливості експорту графіків.
Нижче розглянуті деякі пакети, найбільш поширені в практиці обробки даних.
1. Microsoft Excel
До складу Microsoft Excel входить набір засобів аналізу даних (так званий пакет аналізу), призначений для рішення статистичних завдань. В Microsoft Excel представлена велика кількість статистичних функцій. Деякі з них є убудованими, інші доступні тільки після установки пакета аналізу.
Засоби, які включені до пакета аналізу даних, доступні через команду Аналіз даних меню Сервіс. Якщо цієї команди немає в меню, необхідно завантажити надбудову. Надбудова - це допоміжна програма, що служить для додавання в Microsoft Office спеціальних команд або можливостей.
Дисперсійний аналіз. Існує декілька видів дисперсійного аналізу. Необхідний варіант вибирається з урахуванням числа факторів і наявних вибірок з генеральної сукупності: однофакторний дисперсійний аналіз, двофакторний дисперсійний аналіз із повтореннями, двофакторний дисперсійний аналіз без повторення.
Кореляційний і коваріаційний аналіз. Обидва види аналізу створюють таблицю (матрицю), що показує коефіцієнт кореляції або коваріаційний аналіз, відповідно, для кожної пари вимірів змінних. На відміну від коефіцієнта кореляції, масштабованого у діапазоні від -1 до +1 включно, значення коваріаційного аналізу не масштабуються.
Описова статистика. Цей засіб аналізу служить для створення одномірного статистичного звіту, що містить інформацію про центральну тенденцію й мінливість вхідних даних.
Експонентне згладжування. Застосовується для пророкування значення на основі інформації попереднього періоду, скоректованого з урахуванням погрішностей у цьому прогнозі. При аналізі використовується константа згладжування, за допомогою якої визначається ступінь впливу на прогнози погрішностей у попередньому прогнозі.
Двовибірковий F-тест для дисперсії. Застосовується для порівняння дисперсій двох генеральних сукупностей. Цей засіб надає результати порівняння нульової гіпотези про те, що дві вибірки взяті з розподілу з рівними дисперсіями, з гіпотезою, що припускає, що дисперсії різні в базовому розподілі.
Аналіз Фур'є. Призначається для рішення завдань у лінійних системах й аналізу періодичних даних на основі методу швидкого перетворення Фур'є (ШПФ). Ця процедура підтримує також зворотні перетворення, при цьому інвертування перетворених даних повертає вихідні дані.
Гістограма. Використовується для обчислення вибіркових й інтегральних частот влучення даних у задані інтервали значень. При цьому розраховуються числа влучень для заданого діапазону інтервалів.
Ковзне середнє. Ковзне середнє використовується для розрахунку значень у прогнозованому періоді на основі середнього значення змінної для певного числа попередніх періодів. Ковзне середнє, на відміну від простого середнього для всієї вибірки, містить відомості про тенденції зміни даних.
Генерація випадкових чисел. Використовується для заповнення діапазону випадковими числами, вибраними з одного або декількох розподілів. За допомогою даної процедури можна моделювати об'єкти, що мають випадкову природу по відомому розподілу ймовірностей.
Ранг і персентиль. Використовується для отримання таблиці, що містить порядковий і процентний ранги для кожного значення в наборі даних. Процедура може бути застосована для аналізу взаємного розташування даних у наборі.
Регресія. Лінійний регресійний аналіз полягає у побудові графіка для набору спостережень за допомогою методу найменших квадратів. Регресія використовується для аналізу впливу значень однієї або більше незалежних змінних на одну залежну змінну.
Вибірка. Створює вибірку з генеральної сукупності, розглядаючи вхідний діапазон як генеральну сукупність. Якщо сукупність занадто велика для обробки або побудови діаграми, можна використати представницьку вибірку. Крім того, якщо передбачається періодичність вхідних даних, то можна створити вибірку, що містить значення тільки з окремої частини циклу.
Двовибірковий t-тест Стьюдента перевіряє рівність середніх значень генеральних сукупностей по кожній вибірці. Пропонуються три форми тесту:
t-тест, що припускає збіг значень дисперсії обох генеральних сукупностей. Частіше за все аналізується та ж сама генеральна сукупність.
t-тест, що припускає розбіжність дисперсій двох генеральних сукупностей. Ця форма t-тесту викорис-товується для перевірки гіпотези про рівність середніх для двох вибірок даних з різних генеральних сукупностей.
Парний t-тест для середніх, який використовується для перевірки гіпотези про розходження середніх для двох вибірок даних, коли передбачається рівність дисперсій генеральних сукупностей, з яких обрані дані. Парний тест використовується, коли є парність спостережень, наприк-лад, до й після експерименту.
Z-тест. Двовибірковий z-тест для середніх з відомими дисперсіями. Використовується для перевірки гіпотези про роз- ходження між середніми двох генеральних сукупностей.
2. SPSS
SPSS (Statistical Package for the Social Sciences - Статистичний пакет для суспільних наук) - одна з найстарших систем статистичного аналізу і керування даними. Продукт фірми SPSS Inc., сьогодні SPSS є одним з лідерів серед універсальних статистичних пакетів.
Пакет SPSS нагадує традиційну базу даних і передбачає накопичення масиву інформації, його формалізацію і пред-ставлення результатів статистичної обробки масиву у вигляді звіту, що значно спрощує знайомство з пакетом і дозволяє досить швидко почати процедуру введення або імпорту даних. Але структурна відмінність від традиційних баз даних виражена у принципах формалізації масиву, що накопичується, вихідної інформації, принципах статистичної обробки і представлення результатів інформації.
Робота в пакеті SPSS здійснюється з використанням наступних типів вікон:
Рис. 1
* Вікно додатка SPSS. Це вікно включає головне меню системи, яку використовують для операцій з файлами, вибору статистичних процедур і т.д., і інструментальну панель для швидкого доступу до часто використовуваних функцій пакета.
* Вікно результатів (output). Результати роботи пакета (описові статистики, таблиці спряженості, кореляційні матриці) виводяться в цьому вікні. Зміст вікна можна редагувати і зберігати у файлі для наступного використання.
Рис. 2
* Вікно Редактора Даних (Data Editor). У цьому вікні відображається зміст поточного файлу даних. За допомогою Редактора Даних можна створювати нові файли даних або змінювати старі. Вікно відкривається автоматично при запуску SPSS.
* Вікно “Каруселі Графіків” (Chart Carousel) призначено для графіків, створених у пакеті. Графіки можна переглядати, коректувати, зберігати і видаляти.
* Вікно Графіка (Chart), у якому можна змінити кольори, шрифти графіка, повернути осі, змінити тип.
* Вікно Синтаксису (Syntax) для введення і редагування командних рядків. Команди в пакеті генеруються з використанням діалогових вікон, але використання командної мови дозволяє редагувати команди і зберігати у файл для використання у наступних сеансах.
Формат вихідних даних. Накопичення статистичних даних у даному пакеті ведеться в редакторі SPSS Data Editor, дані зберігаються у форматі цього редактора (*.sav). Кожному спостереженню в таблиці відповідає визначений рядок, а кожній змінній - визначений стовпець. Можливі наступні формати даних: дійсне число з фіксованою крапкою, дійсне число з крапкою, що плаває, дата і година, грошовий формат, текстовий формат. Також у користувача є можливість побудувати свій формат. Якщо в певній комірці дані відсутні, наприклад, респондент із якої-небудь причини не відповів на поставлене запитання, тоді використовується спеціальна конструкція Missing Values.
Структура пакета. SPSS являє собою модульну систему, але якщо потрібні базові функції, можна скористатися базовою системою SPSS Base. У базову систему закладені усі функції роботи з даними, всі основні статистичні процедури, від описових статистик і таблиць спряженості із факторним і кластерним аналізом.
Експорт і імпорт даних. Масив даних для обробки може бути експортований з текстового файлу, з файлу формату MS Excel, Lotus 1- 2-3 або перенесенням через буфер обміну.
Видача результатів обробки. Результат статистичної обробки представляється в окремому вікні, що улаштовано так само, як стандартний Провідник системи Windows, базові статистики виводяться в лівій частині вікна, а повна інформація - у правій. SPSS представляє результати обробки у вигляді або таблиць, або графіків (діаграм). Якщо натиснути праву клавішу миші, попередньо вказавши на певну діаграму, можна потрапити в редактор діаграм Chart Editor. У ньому виводиться новий інструментальний комплект, що дозволяє змінювати кольори графіка/діаграми, додавати лінії і типи зафарбування, змінювати формати осей, лінії сітки та інші характеристики, вводити текст, але лише в жорстко задані позиції. Можна вбудовувати графіки і діаграми SPSS в інший Windows-додаток, але не навпаки. Графічні можливості. Пакет має величезні можливості побудови графіків. У засобі Charts Carousel виводяться всі типи можливих діаграм і графіків. Будувати їх можна по черзі, вибираючи ім'я потрібного графіка у блоці Carousel. Діалогове вікно запитує специфікацію списку незалежних змінних і будь-яких факторних змінних. Після цього можна вибрати різні варіанти: прямокутні діаграми з викидами (box-and-whisker), деревоподібні діаграми (stemand-leaf), графіки нормального розподілу і графіки розкиду точок.
Стандартні засоби містять у собі стовпчасті діаграми, зафарбовані графіки, кругові діаграми, графіки мінімальних/максимальних значень, діаграми дисперсій і дисперсійні матриці (з перекриттям ліній регресії або без), а також гістограми. Більш спеціалізовані графіки - це стовпчасті діаграми помилок, графіки контролю якості і графіки тимчасових рядів, наприклад, корелограми й автокорелограми.
3. Аналіз даних і представлення результатів дослідження
Аналіз даних -- це процес виконання послідовних логічних дій з інтерпретації відповіді респондентів та їх перетворення у статистичні форми, необхідні для ухвалення маркетингових та управлінських рішень. Зазвичай цей процес складається з трьох послідовних етапів.
Рис. 3
програмний статистичний дескриптивний одномірний
На першому етапі дані, зібрані у процесі опитування, вводять у комп'ютер як матриці (відбувається табуляція даних). Уведення даних і їх табуляція може здійснюватися за допомогою спеціальних комп'ютерних програм, наприклад, Vortex, SPSS, Statistica, або в середовищі MS Excel чи Access. І в першому, і в другому випадку уможливлюється сортування, форматування, відбір та інші операції оброблення даних.
Слід зауважити, що введення даних є процесом трудомістким і часто вимагає залучення спеціально підготовлених фахівців. Тому ще на етапі планування дослідження доцільно визначитися з оптимальною (а краще -- мінімальною) кількістю запитань у анкеті для запобігання труднощам під час уведення та аналізу отриманих даних. Проблеми загострюються, коли опрацьовувати доводиться значну кількість анкет.
На другому етапі проводять статистичний аналіз даних, пошук взаємозв'язків і відмінностей у масивах. Крім того, статистична обробка передбачає розробку висновків та гіпотез (концептуалізацію даних), одночасно проводять перевірку репрезентативності результатів, їх здатності до перенесення на всю генеральну сукупність. Статистичний аналіз може проводитися по!різному (табл. 2).
Таблиця 2. Види статистичного аналізу даних
Вид аналізу |
Характеристика |
|
Дескриптивний |
Оцінка результатів за допомогою узагальнюючих величин. Середні, мода, середньоквадратичне відхилення тощо |
|
Висновків |
Використання статистичних методів з метою перенесення отриманих результатів на всю сукупність |
|
Відмінностей |
Використовують для оцінки відмінностей між двома групами даних (різних сегментів тощо) |
|
Зв'язків |
Пошук систематичних зв'язків між різними групами даних, наприклад, як ціна впливає на обсяг продажів тощо |
|
Прогнозний |
Прогноз розвитку подій у майбутньому, наприклад, шляхом аналізу часових рядів |
Для проведення дескриптивного аналізу широко використовують дві групи вимірювань.
Перша охоплює вимірювання «центральної тенденції», або опис типового респондента. У цьому разі використовуються:
-- мода -- величина ознаки, що з'являється найчастіше;
-- медіана -- значення ознаки, що є всередині впорядкованого ряду;
-- середнє (як правило, середнє арифметичне) -- значення ознаки, що рівномірно розподілене між усіма одиницями сукупності.
У другій містяться вимірювання варіації -- опис відсотка відмінностей відповідей від відповідей типового респондента. Тут застосовують:
-- розподіл частот -- показує кількість випадків появи кожного значення вимірюваної сукупності;
-- розмах варіації -- це різниця між кінцевими точками впорядкованого ряду значень;
-- середнє квадратичне відхилення -- узагальнююча характеристика варіації, що означає відсоток збіжностей або відмінностей оцінок.
Висновковий аналіз -- вид аналізу, що спрямований на загальні припущення щодо сукупності даних на основі вивчення групи одиниць сукупності. Він визначає можливість поширення висновків дослідження на всю сукупність і розмір похибки. Оцінка здійснюється на основі оцінки параметрів, тобто визначення інтервалу, в якому міститься один із параметрів сукупності.
Аналіз відмінностей -- вид аналізу, який ґрунтується на гіпотезі, що дві сукупності не мають відмінностей між собою, а відмінності мають випадковий характер. Можливий аналіз результатів відповідей на однакові запитання різних груп респондентів або на два запитання в одній вибірці. Результатом аналізу може бути рішення про можливість інтерполяції отриманих даних на всю сукупність.
Аналіз зв'язків -- визначення ступеня впливу одного чинника на інший. Відповідає на запитання, чи вплинуть зміни даного показника на інший.
Зазвичай виділяють чотири типи зв'язків:
1. Немонотонний -- означає, що присутність однієї змінної систематично пов'язана з іншою, але відсутня інформація про напрям цього зв'язку.
2. Монотонний -- показує напрям зв'язку без визначення кількісних показників.
3. Лінійний -- прямий зв'язок між чинниками, коли наявність даних про зміни одного чинника автоматично дає змогу розрахувати інший.
у = а + bx,
де у -- оцінювана змінна; а -- вільний член рівняння; b -- коефіцієнт регресії; x -- незалежна змінна, що використовується для визначення залежної.
4. Криволінійний -- описує зв'язок між змінними, що має складніший характер. Наприклад, загальновідомі криві попи! ту та пропозиції. Зв'язок між змінними визначається такими характеристиками: наявність, напрям, сила зв'язку.
Метою прогнозного аналізу є прогнозування розвитку подій на основі наявної інформації. Основна складність даної процедури полягає в неможливості урахування всіх змінних, що можуть впливати на розвиток. Прогноз можна провести із використанням евристичних методів, що ґрунтуються на суб'єктивних оцінках, інтуїції та досвіді особи, яка проводить дослідження, а також із використанням статистичних методів розрахунку.
Третій етап передбачає подання викладеного зрозуміло для замовника або керівника заключного звіту, що дасть змогу досягти остаточної мети дослідження -- ухвалити стратегічне рішення.
Звіт про результати дослідження можна поділити на три частини: вступну, основну та заключну.
У вступній частині міститься титульний аркуш, договір на проведення дослідження, меморандум, зміст, перелік ілюстрацій та анотація. Основна мета меморандуму полягає в зорієнтуванні читача на проблему, яку вивчають, та у створенні позитивного іміджу самого звіту. Меморандум має персональний і дещо неформальний стиль. У ньому стисло викладено відомості про характер дослідження та про його виконавців, прокоментовано одержані результати, висунуто пропозиції щодо проведення подальших досліджень. Обсяг меморандуму -- один аркуш.
Анотація адресована, передусім, керівникам, яких не цікавлять детальні результати проведеного дослідження. Крім того, анотація повинна налаштувати читача на сприйняття основного змісту звіту. В ній повинні бути охарактеризовані: предмет дослідження, коло розглянутих питань, методологія дослідження, основні висновки та рекомендації. Обсяг анотації -- не більше одного аркуша.
Основна частина звіту складається зі вступу, характеристики методології дослідження, обговорення отриманих результатів, констатації обмежень, а також висновків і рекомендацій.
Вступ орієнтує читача на ознайомлення з результатами звіту. Він містить загальну мету звіту та цілі дослідження, актуальність його проведення.
У методологічному розділі з належним рівнем деталізації описують: хто або що є об'єктом дослідження та використовувані методи. Додаткову інформацію подають у додатку. Наводяться посилання на авторів і джерела використаних методів. Читач повинен зрозуміти, у який спосіб були зібрані й опрацьовані дані, чому був використаний вибраний метод, а не інші.
Головним розділом звіту є розділ, у якому подано отримані результати. Рекомендується формувати його зміст відповідно до мети дослідження. Часто логіка викладу даного розділу визначається структурою анкети, оскільки запитання в ній пода! но в певній логічній послідовності.
Оскільки не слід приховувати проблем, що виникли під час проведення дослідження, то в заключний звіт звичайно вміщують розділ «Обмеження дослідження». У цьому розділі визначають ступінь впливу обмежень (обмеженість часу, грошових і технічних засобів, недостатня кваліфікація персоналу тощо) на отримані результати. Наприклад, ці обмеження могли вплинути на формування вибірки тільки для незначної за розміром кількості регіонів. Отже, переносити отримані результати на всю країну слід обережно або взагалі не робити цього. Висновки та рекомендації можуть бути подані як в одному, так і в окремих розділах.
Висновки ґрунтуються на результатах проведеного дослідження. Рекомендації є припущенням щодо того, як потрібно діяти, відповідно до отриманих висновків. Надання рекомендацій може передбачити використання знань, що виходять за рамки отриманих результатів. У заключній частині подають додатки, у яких міститься додаткова інформація, необхідна для більш глибокого осмислення отриманих результатів. Крім написання звіту для клієнтів, дослідники можуть використати усну презентацію методів дослідження та результатів. У цьому разі з'являється можливість відповісти на запитання та обговорити отримані дані.
4. Вибіркове спостереження
Цілі та етапи вибіркового спостереження.
Вибіркове спостереження в даний час знаходить достатньо широке застосування в обстеженнях промислових і сільськогосподарських підприємств, бюджетів та зайнятості населення, вивченні цін на споживчому ринку. Вибірковий метод є найважливішим джерелом інформації в контролі якості продукції, маркетингових та соціологічних дослідженнях.
Вибірковим спостереженням називається таке несуцільну обстеження, при якому ознаки реєструються в окремих одиниць досліджуваної статистичної сукупності, відібраних з використанням спеціальних методів, а отримані в процесі обстеження результати з певним рівнем імовірності поширюються на всю вихідну сукупність.
Вибіркове спостереження можна ототожнювати з несуцільним обстеженням взагалі, так як воно є лише одним із видів останнього, найбільш опрацьованим з методологічної та організаційної точок зору.
Крім вибіркового спостереження несуцільну обстеження може здійснюватися шляхом монографічного опису, методом основного масиву або на основі різних видів анкетування, коли відсутні будь-які спеціальні методи відбору респондентів і відсоток заповнених і повернутих анкет заздалегідь не відомий.
Переваги вибіркового спостереження полягають в істотній економії різного виду ресурсів, а саме:
а) фінансових коштів, що витрачаються на збір та обробку даних, підготовку та оплату персоналу;
б) матеріально-технічних ресурсів (канцелярські товари, оргтехніка, витратні матеріали, транспортне обслуговування тощо);
в) трудових ресурсів, що залучаються до обстеження на всіх його етапах;
г) скорочення часу, що витрачається як на отримання первинної інформації, так і на її подальшу обробку аж до публікації підсумкових матеріалів.
У той же час необхідно чітко уявляти, що вибіркове спостереження, як би грамотно з методологічної точки зору воно не було організовано, завжди пов'язане з певними, нехай невеликими і вимірюваними помилками. Тому коли варіація реєстрованих ознак дуже сильна і відсоток відбору для отримання вибіркових значень із заданою точністю досягає 20-25%, слід правильно оцепить доцільність несплошного обстеження, зіставивши досить великі витрати всіх ресурсів на таку об'ємну вибірку та очікувані похибки статистичних характеристик. Цілком імовірно, що проведення суцільного обстеження в подібних випадках буде більш виправданим.
З іншого боку, при вирішенні ряду задач вибіркове спостереження є єдино можливим способом отримання необхідної інформації. Так, контроль багатьох видів продукції пов'язаний з їх псуванням, втратою товарного вигляду, порушенням герметизації. Наприклад, не можна перевірити кожну вироблену підприємством електролампу на дотримання вимог по тривалості горіння. Неможливо перевірити на відповідність стандартам кожен пакет з соком або молочною продукцією, так як це пов'язано з розкриттям їх упаковки. У подібних випадках контроль якості може здійснюватися тільки з використанням вибіркового методу.
Реалізація вибіркового методу базується па поняттях генеральної і вибіркової сукупностей.
Генеральною сукупністю називається вся початкова досліджувана статистична сукупність, з якої на основі відбору одиниць або груп одиниць формується сукупність вибіркова. Тому генеральну сукупність також називають основою вибірки.
Відбір одиниць у вибіркову сукупність може бути повторним або бесповторного.
При повторному відборі потрапила у вибірку одиниця піддається обстеженню, тобто реєстрації значень її ознак, повертається в генеральну сукупність і нарівні з іншими одиницями бере участь у подальшій процедурі відбору. Таким чином, деякі одиниці можуть потрапляти у вибірку двічі, тричі або навіть більше число разів. І при вивченні вибіркової сукупності вони будуть розглядатися як окремі незалежні спостереження.
Відзначимо, що число одиниць генеральної сукупності, що беруть участь у відборі, при такому підході залишається постійним. Тому ймовірність попадання у вибірку для всіх одиниць сукупності протягом усього процесу відбору також не змінюється.
На практиці методологія повторного відбору зазвичай використовується в тих випадках, коли обсяг генеральної сукупності не відомий і теоретично можливе повторення одиниць з уже зустрічалися значеннями всіх реєстрованих ознак.
Наприклад, при проведенні маркетингових досліджень можна скільки-небудь точно оцінити, яке число споживачів воліють пральний порошок конкретної торгової марки, скільки покупців воліють робити покупки саме в даному супермаркеті і т.д. Тому можливе повторення абсолютно ідентичних одиниць як по причині практично необмежених обсягів сукупності, так і внаслідок можливої повторної реєстрації. Припустимо, при проведенні обстеження один і той же покупець може двічі прийти в магазин і двічі піддатися обстеженню.
При вибірковому контролі якості продукції обсяг генеральної сукупності також часто не визначений, оскільки процес виробництва може здійснюватися постійно, кожен день доповнюючи генеральну сукупність новими одиницями - виробами. Тому у вибіркову сукупність можуть потрапити два і більше виробів з абсолютно однаковими характеристиками. Отже, і в цьому випадку при обробці результатів вибірки необхідно орієнтуватися на методологію, використовувану при повторному відборі.
При бесповторном відборі потрапила у вибірку одиниця піддається обстеженню і в подальшій процедурі відбору не бере участь. Такий відбір доцільний і практично можливий в тих випадках, коли обсяг генеральної сукупності чітко визначений. Отримані при цьому результати, як правило, є більш точними в порівнянні з результатами, заснованими на повторній вибірці.
Як вже зазначалося вище, вибіркове спостереження завжди пов'язане з певними помилками одержуваних характеристик. Ці помилки називаються помилками репрезентативності (показності).
Помилки репрезентативності обумовлені тією обставиною, що вибіркова сукупність не може за всіма параметрами в точності відтворити сукупність генеральну. Отримувані розбіжності, або помилки репрезентативності, дозволяють зробити висновок, якою мірою потрапили у вибірку одиниці можуть представляти всю генеральну сукупність. При цьому слід розрізняти систематичні і випадкові помилки репрезентативності.
Систематичні помилки репрезентативності пов'язані з порушенням принципів формування вибіркової сукупності. Наприклад, внаслідок яких-небудь причин, пов'язаних з організацією відбору, у вибірку потрапили одиниці, що характеризуються дещо більшими або, навпаки, дещо меншими порівняно з іншими одиницями значеннями спостережуваних ознак. У цьому випадку і розраховані вибіркові характеристики будуть завищеними або заниженими.
Випадкові помилки репрезентативності зумовлені дією випадкових факторів, що не містять будь-яких елементів системності в напрямку впливу па розраховуються вибіркові характеристики. Але навіть при строгому дотриманні всіх принципів формування вибіркової сукупності вибіркові та генеральні характеристики будуть дещо відрізнятися. Отримувані випадкові помилки можуть бути статистично оцінені і враховані при поширенні результатів вибіркового спостереження на всю генеральну сукупність. Оцінка помилок вибіркового спостереження заснована на теоремах теорії ймовірностей.
При подальшому розгляді теорії і методів вибіркового спостереження в даній главі використовуються наступні загальноприйняті умовні позначення:
* ЛГ- обсяг (число одиниць) генеральної сукупності;
* п - обсяг (кількість одиниць) вибіркової сукупності;
* х - генеральна середня, тобто середнє значення досліджуваного ознаки по генеральної сукупності (середня прибуток, середня величина активів, середня чисельність працівників підприємства тощо);
* х - вибіркова середня, тобто середнє значення досліджуваного ознаки по вибіркової сукупності;
* М - чисельність одиниць генеральної сукупності, що володіють певним варіантом або варіантами досліджуваного ознаки (чисельність міського чи сільського населення, кількість бракованих виробів, число нерентабельних підприємств тощо);
* р - генеральна частка, тобто частка одиниць, що володіють певним варіантом або варіантами досліджуваного ознаки, у всій генеральної сукупності (частка міського населення в загальній чисельності населення, частка бракованої продукції в загальному випуску, частка нерентабельних підприємств у загальній чисельності підприємств тощо);
Помилка вибірки або відхилення вибіркової середньої від середньої генеральної знаходиться в прямій залежності від дисперсії досліджуваного ознаки у генеральній сукупності і в зворотній залежності від обсягу вибірки. Таким чином, середню помилку вибірки можна представити як:
При проведенні вибіркового спостереження дисперсія досліджуваного ознаки у генеральній сукупності, як правило, не відома. У той же час між генеральної дисперсією і середньої з усіх можливих вибіркових дисперсій існує наступне співвідношення:
У зв'язку з тим, що на практиці в більшості випадків з генеральної сукупності в певний момент часу проводиться тільки одна вибірка, дисперсія досліджуваного ознаки по цій вибірці і використовується при розрахунку помилки. Враховуючи, що при достатньо великому обсязі вибірки ставлення п / (п - 1) близько до 1, формула середньої помилки повторної вибірки приймає наступний вигляд:
де о2 - дисперсія досліджуваного ознаки по вибіркової сукупності.
При визначенні можливих кордонів значень характеристик генеральної сукупності розраховується гранична помилка вибірки, яка залежить від величини її середньої помилки та рівня ймовірності, з яким гарантується, що генеральна середня не вийде за вказані межі. Згідно з теоремою А. М. Ляпунова ймовірність тієї чи іншої величини граничної помилки при достатньо великому обсязі вибіркової сукупності підпорядковується нормальному закону розподілу і може бути визначена на основі інтеграла Лапласа.
Значення інтеграла Лапласа при різних величинах змінної I табульовані і представлені в статистичних довідниках. При узагальненні результатів вибіркового спостереження найбільш часто використовуються такі рівні ймовірності та відповідні їм значення I:
Р ........ 0,683 0,950 0,954 0,997
г ............. 1 1,96 3 лютого
Наприклад, якщо при розрахунку граничної помилки вибірки використовується значення I = 2, то з імовірністю 0,954 можна стверджувати, що розбіжність між вибіркової середньої і генеральної середньої не перевищить дворазової величини середньої помилки вибірки.
Теоретичною основою для визначення меж генеральної частки, тобто частки одиниць, які мають тим чи іншим варіантом ознаки, є теорема Повернули. Згідно даної теоремі ймовірність отримання як завгодно малого розбіжності між вибіркової часткою і генеральної часткою при достатньо великому обсязі вибірки буде прагнути до одиниці. З урахуванням того, що ймовірність розбіжності між вибірковою і генеральною частками підпорядковується нормальному закону розподілу, ця ймовірність також визначається по функції / * "(Ј) при заданому значенні Ј.
Процес підготовки н проведення вибіркового спостереження включає в себе ряд послідовних етапів:
1) визначення мети обстеження;
2) встановлення меж генеральної сукупності;
3) складання програми спостереження і програми розробки даних;
4) визначення виду вибірки, відсотка відбору та методу відбору;
5) відбір і реєстрація спостережуваних ознак у відібраних одиниць;
6) розрахунок вибіркових характеристик і їх помилок;
7) поширення отриманих результатів на генеральну сукупність.
Залежно від складу і структури генеральної сукупності вибирається вид вибірки або спосіб відбору. До найбільш поширених на практиці видів відносяться:
* власне-випадкова (проста випадкова) вибірка;
* механічна (систематична) вибірка;
* типова (стратифікована, розщеплену) вибірка;
* серійна (гніздова) вибірка.
Відбір одиниць із генеральної сукупності може бути комбінованим, багатоступеневим і багатофазним.
Комбінований відбір передбачає об'єднання декількох видів вибірки. Так, можна комбінувати типову і серійну, серійну і власне-випадкову вибірки. Помилка такої вибірки визначається ступінчастістю відбору.
Багатоступеневим називається відбір, при якому з генеральної сукупності спочатку витягуються укрупнені групи, потім більш дрібні і так до тих пір, поки не будуть відібрані тс одиниці, які піддаються обстеженню.
Багатофазна вибірка на відміну від багатоступінчастої припускає збереження однієї і тієї ж одиниці відбору на всіх етапах його проведення; при цьому відібрані на кожній стадії одиниці піддаються обстеженню, щоразу по більш розширеною програмою.
Висновки
У даній роботі було проаналізовано місце інформаційних технологій на різних етапах соціологічного дослідження; розкрито основні можливості інформаційних технологій при проведенні типового кількісного соціологічного дослідження; показано значення інформаційних технологій для проведення сучасного соціологічного дослідження.
Було показано, як в цілому впливає розвиток інформаційних технологій на технологію соціологічного дослідження. Були виділені два основних вектори даного впливу, що дозволяє говорити про застосування інформаційних технологій в соціологічних дослідженнях в широкому і вузькому сенсі.
У широкому сенсі цього поняття окреслює якісну зміну самого соціологічного дослідження під впливом розвитку ІКТ. У вузькому сенсі цього поняття позначає широке впровадження ІТ в процес збору, обробки та аналізу соціологічних даних.
Розглянуто типові види аналізу даних, що виконуються за допомогою програмного забезпечення пакета SPSS в рамках типового дослідження. Показані графічні можливості виведення отриманих результатів.
Обговорено переваги і недоліки існуючих програмних засобів у виконанні конкретних дослідницьких завдань. Вказані переваги сучасних ПО в області спеціальної інформації дослідника і можливостей створення презентації результатів для замовника дослідження.
Проаналізовано соціальні наслідки та обставини впровадження інформаційних технологій в соціологічне дослідження. Зокрема, зроблено висновок про те, що оволодіння відповідними програмними засобами недостатньо для проведення повного аналізу даних. Також зроблено висновок про недостатній мірі гарантії відсутності маніпуляцій з кількісними даними при презентації результатів дослідження.
Нарешті, показано вплив розвитку ПО для конкретних видів соціологічного дослідження на динаміку використання методів в цілому.
Для поліпшення якості соціологічних досліджень в сучасних умовах рекомендується:
- постійно оновлювати технічне забезпечення соціологічних центрів;
- стежити за новинками на ринку інформаційних технологій;
- переймати досвід у зарубіжних колег;
- поступово відмовлятися від консервативних поглядів і переконань на методи соціологічного дослідження;
- розробляти нові методи і програмне забезпечення;
- виділяти кошти на амортизацію та модернізацію засобів технічної підтримки.
Необхідним є не тільки розширення підготовки фахівців в області статистичного аналізу з використанням спеціалізованого ПЗ, але також розширення професійних знань про різні види ПО, що застосовуються в соціології, перепідготовка фахівців і масова освіта з приводу критеріїв якісної наукової інформації.
Література
1. "Аналіз даних в Excel" - Джинжер Саймон: видавництво - "Діалектика", 2004 р.
2. "Microsoft Office Excel для студента" - Л.В. Рудикова: видавництво - " Бхв-Петербург"; 2005 р.
3. Симонович С., Євсєєв Г. "Excel". - "М.: ИНФРА- М", 1998.
4. "Навчання. Excel 2000". - М.: Видавництво "Media", 2000.
5. "Основи інформатики: Учеб. Посібник" / А.Н. Морозевич, Н.Н. Говядинова й ін.; Під ред. А.Н. Морозевича. - Мн.: "Нове знання", 2001.
6. Ланджер М. «Microsoft Office Excel 2003 для Windows». - «НТ Пресс» - 2005.
Размещено на Allbest.ru
...Подобные документы
Программный пакет Microsoft Office и табличный процессор Excel. Задачи и основные функции в Microsoft Excel. Формулы в Microsoft Excel. Общие сведения об алгоритмах. Метод половинного деления. Понятие оптимизационных задач и оптимизационных моделей.
курсовая работа [333,4 K], добавлен 17.03.2008Поняття про кореляцію і регресію. Сутність дисперсійного аналізу. Однофакторний дисперсійний аналіз. Функціональна і статистична залежності. Визначення параметрів вибіркового рівняння прямої лінії середньоквадратичної регресії за незгрупованих даних.
реферат [123,3 K], добавлен 12.02.2011Методика и этапы построения экономических моделей с помощью программы Microsoft Excel. Определение оптимальной структуры производства консервного завода на основании имеющихся статистических данных. Нахождение условного экстремума функции в Excel.
контрольная работа [1,4 M], добавлен 01.06.2009Завдання та етапи кластерного аналізу, вимоги до інформації. Приклад класифікації економічних об'єктів за допомогою алгоритму кластерного аналізу, методи перевірки стійкості кластеризації, інтерпретація результатів аналізу та побудування дендрограми.
реферат [311,2 K], добавлен 15.07.2011Розв'язання економічних задач з інформаційного менеджменту за допомогою програми Excel. Створення таблиці "Фірма" з інформацією про працівників фірми. Визначення кількість чоловіків та жінок на фірмі. Обчислення терміну погашення кредитів підприємства.
контрольная работа [102,0 K], добавлен 30.07.2008- Использование электронных таблиц MS EXCEL для решения экономических задач. Финансовый анализ в Excel
Использование электронных таблиц MS EXCEL для расчета затрат на вспомогательные материалы, прибыли, построение диаграмм. Подведение динамических итогов с применением сводных таблиц. Регрессионный анализ данных. Проведение финансового анализа в Excel.
контрольная работа [607,9 K], добавлен 29.03.2010 Система управління технологічним процесом. Методи експертних оцінок. Принципи виявлення колективної думки експертів про перспективи розвитку об'єкта аналізу. Статистична обробка результатів. Методи евристичного програмування, "мозкової атаки" й аналогії.
реферат [34,1 K], добавлен 11.05.2009Построение экономико-математической модели оптимизации производства с учетом условия целочисленности. Расчет с помощью надстроек "Поиск решения" в Microsoft Excel оптимального распределения поставок угля. Экономическая интерпретация полученного решения.
контрольная работа [2,5 M], добавлен 23.04.2015Прогнозирование как предвидение результатов развития хозяйственной структуры и перспективное планирование. Использование электронных таблиц MS EXCEL для решения экономических задач. Учет затрат на вспомогательные материалы. Этапы построения диаграмм.
курсовая работа [720,1 K], добавлен 16.04.2014Сутність та предмет економічного аналізу. Визначення понять "технологія", "фактор", "резерв", "аналіз". Класифікація господарських резервів. Управлінський та оперативний аналіз. Основні джерела інформації у процесі здійснення аналітичного дослідження.
тест [13,0 K], добавлен 09.09.2010Основні цілі створення моделі, її властивості та функції. Поняття інформації. Класифікація моделей по способі моделювання, призначенню, типі мови опису, залежності від просторових координат та здатності використовувати інформацію. Етапи створення моделі.
реферат [37,8 K], добавлен 16.01.2011Программное определение оптимального сочетания зерновых культур и оптимальных рационов кормления с помощью программы Excel. Экономико-математические модели для расчета оптимального распределения минеральных удобрений, определение перечня переменных.
контрольная работа [3,1 M], добавлен 06.12.2011Оценка социально-экономического развития Финляндии. Установление степени однородности и закономерности распределения рядов данных в среде MS Excel с помощью инструментов "Описательная статистика" и "Скользящее среднее". Расчет коэффициента корреляции.
курсовая работа [176,8 K], добавлен 29.11.2014Вид одномерного распределения для номинальной шкалы с совместимыми альтернативами. Меры центральной тенденции. Математическое ожидание, отклонение. Показатели асимметрии, эксцесса. Построение распределений в пакете ОСА и SPSS, визуальное представление.
курс лекций [2,4 M], добавлен 09.10.2013Цілі і задачі методики аналізу фінансово-господарської діяльності. Система показників, що характеризують фінансовий стан підприємства, аналіз прибутку і рентабельності. Постановка транспортної задачі і її вирішення за допомогою додатків Ms.Excel.
дипломная работа [1,2 M], добавлен 11.03.2010Построение математической и электронной модели в MS Excel. Распределение средств по различным источникам для получения максимальной прибыли от рекламы. Смысл данных отчета по устойчивости. Условия составления оптимального плана распределения средств.
контрольная работа [47,7 K], добавлен 01.03.2011Общая характеристика и функциональные особенности пакета SPSS для Windows, его назначение и анализ возможностей. Основные понятия и методики эконометрического прогнозирования, порядок использования для данного прогнозирования инструментов пакета SPSS.
курсовая работа [507,1 K], добавлен 28.03.2010Рейтингова оцінка галузі по показникам стимуляторам бухгалтерської звітності. Аналіз соціально-економічних процесів за допомогою ранжування та електронних таблиць Excel. Розрахунок коефіцієнту економічного розвитку підприємств деревообробної галузі.
лабораторная работа [494,1 K], добавлен 13.05.2015Технология решения задачи с помощью Поиска решения Excel. Отбор наиболее эффективной с точки зрения прибыли производственной программы. Задачи на поиск максимума или минимума целевой функции при ограничениях, накладываемых на независимые переменные.
лабораторная работа [70,0 K], добавлен 09.03.2014Расчет количества изделий для изготовления на предприятии, чтобы прибыль от их реализации была максимальной (решение графическим способом и в среде MS Excel). Определение равновесной цены спроса-предложения на товар, нижней и верхней цены матричной игры.
контрольная работа [352,0 K], добавлен 13.09.2013