Математичне есе про поняття однорідних величин у статистиці
Аналіз поняття "однорідна сукупність", яке зустрічається в предметі "Статистика". Розкриття нечіткості його трактовок і їх відокремленості від теорії оцінок, незважаючи на те, що саме проблема оцінювання є пріоритетною при визначенні середніх величин.
Рубрика | Математика |
Вид | статья |
Язык | украинский |
Дата добавления | 05.03.2018 |
Размер файла | 30,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МАТЕМАТИЧНЕ ЕСЕ ПРО ПОНЯТТЯ ОДНОРІДНИХ ВЕЛИЧИН У СТАТИСТИЦІ
Джунь Й. В.
У науковій і навчально-методичній літературі зі статистики часто використовуються поняття, які мають досить неоднозначний, розпливчатий зміст. Наприклад, існує більше двадцяти різних визначень поняття «ринок праці», де кожен з авторів трактує його по-своєму, часто міняючи одну категорію на іншу, ще більш нечітку. Таку ж саму долю має трактування поняття однорідних величин у статистиці, відносно якого деякі автори відкрито пишуть про його неоднозначність і відносність [1]. Більше того, у статистичній літературі (і навіть у підручниках), «гуляють» досить сумнівні з математичної точки зору правила, наприклад, критерій однорідності. Згідно цього, так би мовити, «критерію», цілком абсурдного з точки зору теорії перевірки гіпотез, однорідними слід вважати спостереження, у яких квадратичний коефіцієнт варіації менше 33 %, хоча цілком очевидно, що однорідність даних не може визначатись ні їх дисперсією і, тим більше, значенням їх середнього арифметичного. Одним з найкращих методів, за допомогою якого можна надати будь яким категоріям чіткий і цілком однозначній зміст, є їх математизація.
Актуальність нашого дослідження полягає в розробці чіткого математичного обґрунтування поняття «однорідність даних», оскільки воно є одним із базових у статистиці. Для такого обґрунтування нами були використані основні поняття теорії оцінювання і математична теорія вагових функцій, яка детально викладена в роботі [2, с. 55].
Аналіз робіт з проблеми однорідності даних засвідчує таке. У статистичній навчальній літературі і в інтернет-джерелах досить часто зустрічається поняття «однорідні групи», «однорідні величини», «однорідність». Наголошується, що неоднорідні за складом сукупності потрібно розбивати на однорідні групи. Проте пояснень відносно того, що таке однорідна група, однорідна сукупність, а також рекомендацій відносно того, яким же чином можна протестувати сукупність «на однорідність», як правило, не дається. Це здається дуже дивним, оскільки поняття «якісно однорідних сукупностей» пронизує всю статистику наскрізь. Така ситуація не дозволяє якимось чином зрозуміти суть «однорідності», а й відповідно і саму суть статистичного аналізу. Якщо ж у підручнику з високими міністерськими грифами і подається якесь визначення поняття однорідності, то воно скоріше нагадує за своїм смислом або ж щасливі догадки Аліси в країні чудес, або, в кращому випадку, нагадує мудру словесну еквілібристику Цицерона про ту саму однорідність. Наведемо кілька таких визначень: У навчальному посібнику [3, с. 89] (із серії «Вища освіта ХХІ століття) дано таке визначення: «Однорідні сукупності - це сукупності, елементи яких мають спільні властивості та належать до одного класу, типу». Що може дати таке досить таки туманне і нечітке визначення студенту. Можна з впевненістю сказати, що він не зрозуміє, що це таке. Візьмемо для прикладу сукупність банків України: всі вони мають спільні властивості, належать до одного класу установ і одного типу. То чи є сукупність банків, згідно цього визначення, однорідною чи не однорідною цілком не зрозуміло, тим більше, наприклад, для студента. В підручнику [4, розділ 2.1.3], зазначено, що багато дослідників мають неоднакові погляди на проблему однорідності і наводиться таке її визначення: «Поняття однорідності сукупності спостережень охоплює якісну і кількісну однорідність. Під першою треба розуміти однорідність, яка визначається однотипністю економічних об'єктів, їх однаковою якістю та певним призначенням, а під другою - однорідність групи одиниць сукупності, що визначається на основі кількісних ознак». Але як саме визначається однорідність на основі кількісних ознак, не сказано. Лише констатується: «При цьому обидва поняття діалектично взаємопов'язані і кількісна однорідність можлива лише за наявності одноякісності явищ та процесів, що «утворюють сукупність спостережень». Як бачимо, знову поняття однорідності визначається на основі ще більш нечітких категорій. На освітньому порталі «Українська педагогіка» [5] дається таке поняття: «Однорідна сукупність - якщо одна, чи декілька ознак, що вивчаються, є загальними для всіх одиниць». На сайті [6] таке: «Якісно однорідна сукупність означає, що всі її одиниці належать до одного типу явищ». Джерело [7] повідомляє: «Однорідність індивідуальних значень ознаки - це проявлення їх загальних властивостей, обумовлених основними умовами і закономірностями масового процесу, який породжує дану сукупність. У [8] зазначено: «Сукупності бувають: однорідними, якщо одна чи кілька істотних ознак, які вивчаються, є загальними для всіх одиниць, і неоднорідні - це сукупність, в яку входять явища різного типу». Досить цікавою і оригінальною є інформація про однорідність даних, яка розміщена на блозі «Статистический анализ данных в MS Excel»: «Значимость однородности в статистике трудно переоценить, так как она напрямую влияет на точность рассчитываемых показателей и качество аналитических выводов. Чем однороднее данные, тем надежнее и адекватнее реалиям результаты статистического анализа. Однородность - понятие относительное и растяжимое. Она не имеет точных границ и критериев. Под однородными данными следует понимать некоторый уровень их рассеяния, при котором рассчитываемые статистические показатели (средняя и проч.) будут давать надежную и качественную характеристику анализируемой совокупности. Граница, отделяющая однородные данные от неоднородных, плавная и размытая. Основным мерилом разброса (и однородности) являются показатели вариации». Ось так. Майже в усіх підручниках зі статистики наводиться наступне правило, згідно якого спостереження вважаються однорідними, якщо коефіцієнт варіації сукупності:
(1)
де - середнє вибіркове, а - оцінка дисперсії вибірки.
Правило (1) наводиться скрізь, як кінцева істина, без будь-якого посилання на джерело його походження чи, принаймні, на праці, де воно обґрунтовано. Те, що правило (1) безглузде з точки зору математики і теорії оцінок, - це нікого не турбує. Дослідники, які займаються конкретною науковою роботою, бачать всю сумнівність цього «правила». Наприклад, коли зважувати на аналітичних вагах зразок вагою то спостереження «однорідні», а коли , спостереження раптом стають «неоднорідними», навіть на порчених вагах. Головне, щоб вага була велика, - хіба це не безглуздо? Однорідність даних забезпечується метрологічним налаштуванням приладу і правильною методикою вимірювань, а не вагою зразка, яка до однорідності не має ніякого відношення.
Найбільш грамотним (на жаль лише інтуїтивно) є означення однорідності сукупності, дане в роботі [9, с. 8] «Однорідність: належність всіх елементів ряду і їх вибіркових статистичних параметрів (середнього, дисперії) до однієї сукупності». Між тим існує цілком однозначне і обґрунтоване поняття однорідності даних, яке випливає з чистих і прозорих ідей засновників статистики В. Петті, А. Кетле, а найперш - сера Р. Фішера. Поняття однорідності нерозривно пов'язано з поняттям середньої величини, яку А. Кетле вважав основним методом статистичного аналізу, а А. Баулі навіть всю статистику назвав «наукою середніх величин». Згідно з теорією середніх величин А. Кетле, будь-яке явище чи процес формується під впливом двох видів факторів - постійних і випадкових. Випадкові фактори спричиняють розподіл результатів навкруги середньої. Головна мета статистики середніх - це отримати найбільш надійні значення цих середніх і їх точності. Згідно з вченням К. Пірсона [10] судить про те, які є спостереження однорідні чи ні визначаються саме особливими властивостями розподілу результатів статистичних спостережень уі.
Метою і завданням нашого дослідження є створення однозначного і чіткого математичного обґрунтування поняття однорідних величин у статистиці, одного із найважливіших в теорії групувань.
Одним із головних завдань теорії групувань є розбиття неоднорідної за складом сукупності на однорідні групи, оскільки лише в цьому разі середні арифметичні по таким групам забезпечують ефективне оцінювання тих чи інших показників. Окрім того, щоб показати математичну суть поняття однорідності даних у статистиці, необхідно скористатись теорією вагової функції, яка розроблена з метою забезпечення ефективного оцінювання середньої величини по статистичній сукупності за допомогою наступної формули, яка передбачає застосування методу послідовних наближень [2]:
(2)
де yі - результати спостережень, а вагова функція:
. (3)
Замінюючи у рівнянні (3) канонічною формою сімейств розподілів Пірсона [11, c. 101], отримуємо таку загальну аналітичну форму вагової функції (4):
(4)
де - сталі для кожного розподілу коефіцієнти, які обчислюють за відомими формулами [11, с.101] і які залежать від асиметрії і ексцесу розподілу похибок спостережень.
Формула (4) задає нескінчену множину вагових функцій p(x), і кожен статистичний розподіл має свою, властиву лише йому вагову функцію. Та слід звернути особливу увагу на наступну обставину: якщо в (4) x = 0, то при ( асиметрія розподілу), ваги p(x) стають нескінченними.
Таким чином, якщо статистичний розподіл результатів спостережень має значиму асиметрію, то у відповідності з теорією оцінок, середню взагалі не можна обраховувати внаслідок того, що вагова функція розподілу має вироджений характер. Іншими словами, при A = 0 функція p(x) є сингулярною і будь-яке оцінювання з такою функцією є недопустимим.
Для закону Гауса (A = 0; ) вагова функція (5) набуває вигляду константи:
(5)
де - оцінка дисперсії статистичного розподілу вибірки.
З наведеного можна зробити висновок, що статистичні дані мають однакову точність (є якісно однорідними) лише в тому разі, коли ці дані підкоряються нормальному закону розподілу. І лише такі дані можна з повним правом осереднювати, оскільки вони всі мають одинакові ваги, тобто, статистичні величини чи дані, розподіл яких не є нормальним, однорідними вважатись не можуть, так як в цьому разі, згідно з формулою (3), вони мають різну якість по точності, тому просте осереднення таких даних є недопустимим. Зазначимо, що вагова функція p(x), яка підтверджує такий висновок, має розмірність оберненої дисперсії, а в загальному вигляді p(x) - це обернена дисперсія спостереження, похибка якого x.
Коротко підсумуємо основні результати дослідження:
1. Виходячи з формули (5), можна зробити наступний важливий висновок: унікальною особливістю спостережень, які підкоряються закону Гауса, є те, що всі вони у цьому випадку мають однакову вагу, тобто всі спостереження, які підкоряються нормальному закону, мають однакову точність. А це означає, що лише в цьому випадку середня проста є ефективною оцінкою центра вибірки.
2. Формула (4) показує, що за наявності асиметрії статистичних даних їх вагова функція стає виродженою. Це означає, що для таких даних саме поняття середньої величині втрачає свій смисл.
3. «Правило», згідно з яким спостереження вважають однорідними, якщо квадратичний коефіцієнт варіації менше ніж 33 %, є абсурдним, оскільки однорідність даних, як бачимо із формул (4) і (5), визначається виключно формою їх закону розподілу, а саме, його нормальністю і не залежить від того, яким є середнє значення вибірки чи її дисперсія.
Викликає здивування той факт, що це «правило» стільки років використовувалось вченими мужами вже після того, як появилась сучасна теорія оцінок і теорія вагових функцій. Скоріше всього, тут ми маємо справу з типовим академічнім обскурантизмом, який в наш час зустрічається не лише серед університетських вчених, а навіть і серед нобелівських лауреатів [2]. Може здатись, що вимоги, які ми висуваємо до поняття однорідності даних, є занадто строгими. На це можна відповісти словами А. Пуанкаре: «Математична строгість не визначає всього, але там, де її нема, - нема нічого».
За підсумками дослідження, можна дати математично точне і цілком однозначне визначення: якісно однорідною можна вважати лише таку статистичну сукупність, яка має нормальній розподіл з досліджуваного параметру. Отже, єдиним критерієм однорідності даних є форма закону розподілу статистичної сукупності - якщо ця форма Гаусова, то лише такі дані можна вважати однорідними і ніякі інші.
Тестування на нормальність розподілу вибірки застосовують відомим чином: або за допомогою - квадрат критерію Пірсона, або за допомогою перевірки статистичних гіпотез: A = 0, = 0. Будь-яке значиме (по асиметрії та ексцесу) відхилення розподілу статистичної сукупності від закону Гауса означатиме різні ваги спостережень (їх різну якість і їх різну їх точність). Такі спостереження є вже якісно неоднорідними, оскільки прості середні для оцінки типового рівня ознаки в даному разі обчислювати не можна. У цьому випадку ефективними оцінками є зважені середні, які обчислюються за формулою (4). При цьому, оцінку ваг p(x) ми не рекомендуємо обчислювати за формулою (4), у якій оцінки отримані методом моментів, а за формулою (3), у якій оцінки параметрів функції щільності y обчислюються методом максимальної правдоподібності на основі універсального закону похибок Пірсона-Джеффріса [2, c. 59].
При перевірці гіпотези на нормальність за допомогою статистичних кумулянт асиметрії і ексцесу, можна звернутись до роботи [2, с. 82], у якій наведено детальний и розширений аналіз конкретних випадків діагностики на однорідність.
однорідний сукупність статистика
Література
1. Статистический анализ данных в MS Excel [Электронный ресурс] // Режим доступа: publications.hse.ru/books/82235802
2. Джунь И. В. Неклассическая теория погрешностей измерений / И. В. Джунь. Издательский дом ЕСТЕРО: Ровно, 2015. - 168 с.
3. Уманець Т. В. Загальна теорія статистики / Т. В. Уманець. Навч. посіб. - К.: Знання, 2006. - 239 с.
4. Поняття однорідності спостережень. - Економетрія. Навч. посіб. [Електронний ресурс] // Режим доступу: lection. com. ua/econometry/ecnavpos/ ponyattya-odnoridnostti-sposterezhen-econometriya-navchalniy-posibnik
5. Основні поняття статистики. Ймовірність. Сукупність. Вибірка. [Електронний ресурс] // Режим доступу: ukped. com./statti/ onpd/3056-osnovni-poniattia-statystyky-ymovirnist-sukupnist- vybirka.html
6. Характеристика та аналіз статистичних даних [Електронний ресурс] // Режим доступу: intranet. tdmu. edu/ua/data/ kafedra/ internal/ socmedic/classes_stud/uk/med/eik/pnt/ Біостатистика/4/03.
7. Однородной совокупности, kofficienta.ru, экономические и … [Электронный ресурс] // Режим доступа: www. koefficienta.ru/enduratexter-material17modered-1188-index.html
8. Статистика для экономистов. - Dmitry Anisimov [Электронный ресурс] // Режим доступа: anisimovdmitry. com/Documents/ MathStat Econom/mathstateconom.pdf
9. Методические рекомендации по оценке однородности гидрологических характеристик и определению их расчетных значений по неоднородным данным. - С-Пб.: Нестор-история. 2010. - 26 с.
10. Pearson K. On the Mathematical Theory of Errors of Judgment with special Reference to the personal Equation. / K. Pearson. // Philosophical Transaction of the Royal Sosiety of London. Ser. A, 1902, vol. 198, p. 253-296.
Размещено на Allbest.ru
...Подобные документы
Основні поняття математичної статистики. Оцінювання параметрів розподілів. Метод максимальної правдоподібності. Парадокси оцінок математичного сподівання та дисперсії, Байєса, методу найменших квадратів, кореляції, перевірки гіпотез та їх пояснення.
дипломная работа [1,1 M], добавлен 12.08.2010Основні поняття теорії ймовірності. Аналіз дискретної випадкової величини, характеристика закону розподілу випадкової величини. Знайомство з властивостями функції розподілу. Графічне та аналітичне відображення законів ймовірності дискретних величин.
реферат [134,7 K], добавлен 27.02.2012Властивості числових характеристик системи випадкових величин. Обчислення кореляційного моменту. Ведення комплексної випадкової величини, характеристичні функції. Види збіжності випадкових величин. Приклади доказів граничних теорем теорії ймовірностей.
реферат [113,9 K], добавлен 12.03.2011Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Проверка статистических гипотез и выполнение центральной предельной теоремы для заданных последовательностей независимых случайных величин.
курсовая работа [364,8 K], добавлен 13.11.2012Предмет и метод математической статистики. Распределение непрерывной случайной величины с точки зрения теории вероятности на примере логарифмически-нормального распределения. Расчет корреляции величин и нахождение линейной зависимости случайных величин.
курсовая работа [988,5 K], добавлен 19.01.2011Двумерная функция распределения вероятностей случайных величин. Понятие условной функции распределения и плотности распределения вероятностей. Корреляция двух случайных величин. Система произвольного числа величин, условная плотность распределения.
реферат [325,3 K], добавлен 23.01.2011Понятие корреляционного момента двух случайных величин. Математическое ожидание произведения независимых случайных величин Х и У. Степень тесноты линейной зависимости между ними. Абсолютное значение коэффициента корреляции, его расчет и показатель.
презентация [92,4 K], добавлен 01.11.2013Розподіли системи двох випадкових величин, що однозначно визначається сумісним розподілом ймовірностей, який можна задати матрицею. Інтегральна функція розподілу випадкового вектора. Середньоквадратична регресія. Лінійна кореляція нормальних величин.
реферат [253,5 K], добавлен 13.06.2010Пространство элементарных событий, математическое ожидание. Функции распределения и плотности распределения составляющих системы случайных величин. Числовые характеристики системы. Условия нормировки плотности системы случайных непрерывных величин.
практическая работа [103,1 K], добавлен 15.06.2012Закон розподілення дискретної випадкової величини, подання в аналітичній формі за допомогою функції розподілення ймовірності. Числові характеристики дискретних випадкових величин. Значення критерію збіжності Пірсона. Аналіз оцінок математичного чекання.
курсовая работа [105,2 K], добавлен 09.07.2009Динаміка розвитку поняття ймовірності й математичного очікування. Закон більших чисел, необхідні, достатні умови його застосування. Первісне осмислення статистичної закономірності. Поява теорем Бернуллі й Пуассона - найпростіших форм закону більших чисел.
дипломная работа [466,6 K], добавлен 11.02.2011Класичний метод оцінювання розподілу вибірки, незміщені та спроможні оцінки, емпірична функція розподілу. Моделювання неперервних величин і критерій Смірнова. Сучасні методи прямокутних внесків, зменшення невизначеності та апріорно-емпіричних функцій.
дипломная работа [1,9 M], добавлен 12.08.2010Сприймання і усвідомлення понять: випадкова подія, вірогідна подія, неможлива подія, повна група подій, попарно несумісні події, рівно можливі події, елементарні події. Вивчення ймовірнісних закономірностей масових однорідних випадкових подій.
реферат [24,9 K], добавлен 17.02.2009Период зарождения математики (до VII-V вв. до н.э.). Время математики постоянных величин (VII-V вв. до н.э. – XVII в. н.э.). Математика переменных величин (XVII-XIX вв.). Современный период развития математики. Особенности компьютерной математики.
презентация [2,2 M], добавлен 20.09.2015Понятие и направления исследования случайных величин в математике, их классификация и типы: дискретные и непрерывные. Их основные числовые характеристики, отличительные признаки и свойства. Законы распределения случайных величин, их содержание и роль.
презентация [1,4 M], добавлен 19.07.2015Поняття статистичного зведення та його види. Основні завдання методології статистичних групувань. Класифікація в правовій статистиці. Правила до статистичних таблиць та статистичні ряди розподілу. Взаємозв`язок між факторною і результативною ознаками.
курсовая работа [55,1 K], добавлен 05.02.2011Алгебраический расчет плотности случайных величин, математических ожиданий, дисперсии и коэффициента корреляции. Распределение вероятностей одномерной случайной величины. Составление выборочных уравнений прямой регрессии, основанное на исходных данных.
задача [143,4 K], добавлен 31.01.2011Поняття про алгебраїчний метод у геометрії. Побудова коренів квадратного рівняння та формул. Побудова деяких однорідних виразів циркулем і лінійкою. Ознака можливості побудови відрізка. Розв’язування задач на побудову. Поняття про однорідні функції.
курсовая работа [920,5 K], добавлен 17.03.2011Сходимость последовательностей случайных величин. Центральная предельная теорема для независимых одинаково распределенных случайных величин. Основные задачи математической статистики, их характеристика. Проверка гипотез по критерию однородности Смирнова.
курсовая работа [1,6 M], добавлен 13.11.2012Выполнение измерений линейных и угловых величин. Правила обращения с микрометрическими инструментами. Шероховатость, отклонения форм и расположения поверхностей. Контроль поверочными инструментами. Виды отклонения от правильной геометрической формы.
реферат [759,4 K], добавлен 10.12.2013