Особливості статистичної обробки даних за допомогою комп’ютера

Аналіз процесів накопичення помилок під час здійснення арифметичних операцій. Аналіз застосування систем комп’ютерної математики Maple, Matlab та MathCad і пакету Excel для обчислень статистичних характеристик випадкових величин та побудови гістограми.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык украинский
Дата добавления 19.06.2018
Размер файла 85,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

УДК 612.382

Харківський національний університет радіоелектроніки, Харків

Особливості статистичної обробки даних за допомогою комп'ютера

А.С. Корчакова, О.М. Нікітенко

Анотація

арифметичний комп'ютерний mathcad excel

В статті проаналізовано процеси накопичення помилок під час здійснення арифметичних операцій за допомогою комп'ютера, здійснено порівняльний аналіз застосування систем комп'ютерної математики Maple, Matlab та MathCad і пакету Excel для обчислень статистичних характеристик випадкових величин та побудови гістограми. Показано, що засобами вище згаданих програм не всі статистичні характеристики обчислюються однаково. Гістограма в пакеті Excel без прийняття додаткових заходів будується неправильно. Зауважено, що перед використанням цих програмних засобів необхідно здійснювати попередній аналіз.

Ключові слова: обробка даних, накопичення помилок, Excel, Matlab, Maple, MathCad.

Аннотация

Особенности статистической обработки данных с помощью компьютера

А.С. Корчакова, О.М. Никитенко

В статье проанализированы процессы накопления ошибок при проведении арифметических операций с помощью компьютера, проведен сравнительный анализ применения систем компьютерной математики Maple, Matlab и MathCad и пакета Excel для вычисления статистических характеристик случайных величин и построения гистограммы. Показано, что средствами вышеупомянутых программ не все статистические характеристики вычисляются одинаково. Гистограмма в пакете Excel без принятия дополнительных мер строится неправильно. Замечено, что перед использованием этих программных средств необходимо осуществлять предварительный анализ.

Ключевые слова: обработка данных, накопление ошибок, Excel, Matlab, Maple, MathCad.

Annotation

Feature of statistical data processing by computer

A.S. Korchakova, O.M. Nikitenko

In this article processes of error storage was analyzed during arithmetical operations were computed, the compare analysis was made to use computer mathematic systems such as Maple, Matlab, MathCad and Excel to calculate the statistical performances of the random variables and built histogram. It was shown using mentioned above programs we haven't identical calculated descriptive characteristics. In Excel we can't built a histogram right without using supplementary operations. Before using these programs we must preliminary analyzed calculating expressions.

Keywords: data processing, error storage, Excel, Matlab, Maple, MathCad.

Дослідження та оцінювання параметрів якості генераторних систем зі схрещеними полями поділяється на кілька задач, які на перший погляд не мають між собою явних точок дотику, а саме:

1. Моделювання роботи таких систем, що дозволяє теоретично визначити взаємний вплив одних параметрів системи на інші.

2. Визначення механізмів фізичних явищ та параметрів конструктивних вузлів таких систем, які впливають на характеристики цих систем.

3. Визначення параметрів, якість яких або величина яких може впливати на роботу системи в цілому або окремих її вузлів.

4. Визначення параметрів якості систем зі схрещеними полями.

5. Створення системи оцінювання вибраних параметрів якості.

6. Вибір методів дослідження параметрів якості.

7. Вимірювання параметрів якості (збирання даних).

8. Вибір методів обробки зібраних даних.

9. Обробка зібраних даних [1].

Основними розділами теоретичної метрології традиційно є:

- основи забезпечення єдності вимірювань (включаючи стандартизацію одиниць фізичних величин, їх відтворення й методи передачі їхнього розміру);

- теорія похибок й методи обробки результатів вимірювань;

- методи й засоби вимірювальної техніки [2].

Зараз статистичні методи контролю якості застосовуються не тільки у виробництві, але й у плануванні, проектуванні маркетингу, матеріально-технічному постачанні тощо. Особливу увагу приділяють якості планування, проектування, виготовлення виробів, але майже нічого не згадується про якість обробки результатів. Тим самим вважається, що точність обробки результатів є абсолютною.

Наразі обробка результатів досліджень найчастіше здійснюється за допомогою комп'ютерів. Це і зрозуміло, з одного боку вважається, що комп'ютер здійснює обробку з абсолютною точністю, але це не відповідає дійсності. З іншого боку статистичні розрахунки без допомоги ЕОМ є складними й потребують використання багатьох таблиць функцій та квантилів стандартних розподілів. Це не сприяє тому, щоб відчути елемент новизни в матеріалі, який вивчається, змінити задовільно умови задач тощо. Спеціалізовані математичні пакети не можуть використовуватися під час навчання, тому що їх використання вимагає досить високого рівня підготовки у математичній статистиці.

Метою цієї статті є порівняння результатів статистичних обчислень та побудови гістограми, що здійснено за допомогою математичних пакетів.

Аналіз помилок у чисельному результаті має бути невід'ємною складовою частиною будь-якого серйозного обчислення. Вихідна інформація найчастіше не є точною через те, що ці дані найчастіше є експериментальними даними чи будуються на наближеному оцінюванні. Крім того, самі процеси обчислень можуть додавати до результату певні похибки [3].

В процесі розв'язання певної задачі ми маємо справу з трьома основними видами помилок: помилками, що містяться у вихідній інформації, помилками, що виникають під час обмеження нескінченного математичного процесу скінченою кількістю операцій (помилки обмеження), та помилками, що виникають в результаті необхідності зобразити число у вигляді скінченої послідовності цифр (помилки округлення).

Помилки у вихідній інформації виникають в результаті неточності вимірювань чи через неможливість зобразити необхідну величину скінченим дробом.

Ті помилки, що містяться у вихідній інформації, визначають точність результату обчислень незалежно від того, яким методом ці обчислення здійснюються. Два інших типи помилок - помилки обмеження і помилки округлення - визначаються тими чисельними методами, що використовуються для розв'язання задачі.

Навіть якщо припустити, що вихідна інформація не містить жодних помилок і всі обчислювальні процеси є скінченими й не призводять до помилок обмеження, то всеодно у цьому випадку присутній третій тип помилок - помилки округлення.

Однією з найважливіших проблем в чисельному аналізі є запитання про те, як помилка, що виникла у певному місці під час обчислень, розповсюджується у подальшому, тобто чи стає її вплив більшим чи меншим в міру того, як здійснюються наступні операції.

Як приклад розглянемо накопичення помилки під час обчислення параметра, який найчастіше обчислюють - дисперсію

.

Наведена вище формула містить такі операції: віднімання , добуток , знаходження суми і кінцеве ділення.

Відомо [3], якщо необхідно здійснити додавання - віднімання довгої послідовності чисел (знаходження суми ), то для зменшення похибки обчислень спочатку варто знаходити суму найменших чисел, послідовно переходячи до більших. Ця вимога потребує додаткових операцій під час написання коду програми. Ці операції мають здійснювати попереднє сортування доданків перед тим як добути суму. За таких дій відносна похибка обчислення суми не перевищуватиме 5*10-t, де t - кількість значущих цифр.

Якщо це можливо, необхідно уникати двох майже однакових чисел (знаходження різниці ). Формули, що містять таке віднімання дуже часто можна перетворити таким чином, щоб уникнути подібної операції. Ця вимога, як і попередня, потребує додаткових операцій під час написання коду програми.

У будь-якому випадку, щоб зменшити накопичення похибок обчислювань, бажано зменшувати кількість необхідних арифметичних операцій.

Таким чином під час обробки експериментальних результатів за допомогою комп'ютерних програм необхідно враховувати вище наведені зауваження, якщо створюється оригінальна програма обчислень. Якщо ж використовують спеціальне програмне забезпечення, то варто до його застосування ознайомитися з алгоритмами обчислень потрібних характеристик, щоб зменшити накопичення похибок обчислення.

У зв'язку з цим розглянемо обробку даних за допомогою найпоширеніших пакетів: електронні таблиці Excel, систем комп'ютерної математики MatLab, Maple, MathCad.

Більшість з існуючих математичних пакетів надають можливість користувачам оперувати з випадковими величинами, в тому числі й пакети, що набули широкої популярності: Excel, Maple, Matlab, MathCad.

Статистика в цих пакетах має свою розвинену систему команд для обслуговування прикладних задач. Команди для статистичних робіт призначені тим категоріям користувачів, котрі потребують середовища, яке дозволяє легко переходити від однієї математичної спеціалізації до іншої, не витрачаючи зайвого часу на трансформацію даних й опанування різноманітних програмних засобів у вигляді набору команд для аналізу даних з обчисленням різноманітних середніх та квантилів, графічного зображення даних у вигляді гістограм та графіків, а також для обробки даних [4, 5].

Проілюструємо це, здійснивши обробку вибірки, обсяг якої складає 80 значень (табл. 1), за допомогою пакетів Excel, Maple, Matlab, MathCad. Результати обробки вибірки, що наведено в табл. 1, подано в табл. 2.

Таблиця 1 - Вибірка

13,39

13,46

13,26

13,59

13,54

13,42

13,42

13,53

13,33

13,36

13,37

13,45

13,38

13,55

13,43

13,44

13,31

13,32

13,53

13,29

13,5

13,34

13,37

13,44

13,51

13,24

13,44

13,33

13,33

13,58

13,3

13,34

13,53

13,25

13,54

13,5

13,4

13,54

13,48

13,28

13,32

13,36

13,4

13,55

13,48

13,49

13,26

13,4

13,28

13,43

13,34

13,33

13,26

13,36

13,53

13,5

13,52

13,58

13,3

13,62

13,57

13,37

13,39

13,66

13,5

13,4

13,43

13,4

13,23

13,38

13,31

13,47

13,42

13,28

13,45

13,34

13,64

13,56

13,57

13,31

Таблиця 2 - Результати обробки вибірки

Середнє

Дисперсія вибірки

Стандарт не відхилення

Вручну

13,42

0,01136203

0.10659280

Excel

13,42

0,0113620

0,1065928

Maple

13,42

0,011362

0,106593

Matlab

13,42

0,0114

0,1066

MathCad

13,42

0,011

0,107

Асиметричність

Ексцес

Вручну

0,194202

2,0440198

Excel

0,201703

-0,884131

Maple

0,196660

2,069893

Matlab

0,1979

2,0961

MathCad

0,202

-0,884

Як випливає з результатів обчислень, всі пакети подають однакові результати для математичного сподівання (середнього), дисперсії та середньоквадратичного відхилення.

Щодо коефіцієнтів асиметрії та ексцесу, то жоден результат не збігається.

Аналіз результатів обчислень показав, що збіг між цими обчисленнями відсутній через різне визначення коефіцієнтів асиметрії та ексцесу в наведених пакетах.

Теоретично коефіцієнт асиметрії, який характеризує несиметричність графіка функції розподілу, і визначається як , де m3 - центральний емпіричний момент третього порядку, що визначається як

;

n - обсяг вибірки;

xi - елемент вибірки;

- вибіркове середнє, яке визначається як

;

у - підправлене середнє квадратичне або стандартне відхилення випадкової величини, яке визначається як

.

В пакетах Excel та MathCad коефіцієнт асиметрії обчислюється за виразом

.

В системі комп'ютерної математики Maple коефіцієнт асиметрії обчислюється за виразом

.

В системі комп'ютерної математики Matlab коефіцієнт асиметрії збігається з теоретичним.

Теоретично коефіцієнт ексцесу, який характеризує сплющеність кривої розподілу та протяжність спадів, і визначається як

,

де m4 - центральний емпіричний момент четвертого порядку, який визначається як

;

-3 враховує той факт, що коефіцієнт ексцесу для нормального закону розподілу випадкових величин дорівнює 3.

Коефіцієнт ексцесу в пакетах Excel та MathCad обчислюється за виразом

.

В системі комп'ютерної математики Maple коефіцієнт ексцесу обчислюється за виразом

.

В системі комп'ютерної математики Matlab коефіцієнт ексцесу обчислюється як теоретичний без врахування поправки на нормальний закон розподілу .

Для візуалізації відмінностей обчислення коефіцієнтів асиметрії та ексцесу їх наведено на рис. 1.

аб

Рис. 1. Відмінності обчислення коефіцієнтів: а - коефіцієнт асиметрії; б - коефіцієнт ексцесу

Результати побудови гістограми для цієї вибірки наведено на рис. 2.

аб

вг

д

Рис. 2. Гістограми: а - вручну; б - Excel; в - Maple; г - Matlab; д - MathCad

З цього рисунку видно, що гістограми, які побудовано вручну та за допомогою систем комп'ютерної математики Maple, Matlab та MathCad, є однаковими, а та що побудована за допомогою пакету Excel, має багато відмінностей.

Щоб з'ясувати причини такої розбіжності, проаналізуємо межі інтервалів на які поділено варіаційний ряд, що утворено з вибірки.

Результати обчислення меж інтервалів, що виконано за допомогою пакету Excel, наведено в таблиці 3.

Таблиця 3 - Межі інтервалів за пакетом Excel

Bin

Frequency

13,23

1

13,28375

8

13,3375

12

13,39125

14

13,445

14

13,49875

7

13,5525

15

13,60625

6

More

3

Результати обчислення меж інтервалів, що здійснено за допомогою пакетів Maple та Matlab, наведено в таблиці 4.

Результати обчислення середини інтервалів, що здійснено за допомогою пакету MathCad, наведено в таблиці 5.

З порівняння даних з таблиць 3 - 5 випливає, що в пакеті Excel межі інтервалів обчислюються з похибками, а це призводить до неправильного визначення кількості елементів, які потрапляють в ці інтервали.

Отже, для того, щоб правильно побудувати гістограму за допомогою пакету Excel, попередньо необхідно обчислити межі інтервалів.

Таблиця 4 - Межі інтервалів за обчисленнями пакетами Maple та Matlab

Bin

Frequency

13.23 .. 13.27778

6

13.27778 .. 13.32556

11

13.32556 .. 13.37333

14

13.37333 .. 13.42111

12

13.42111 .. 13.46889

9

13.46889 .. 13.51667

9

13.51667 .. 13.56444

11

13.56444 .. 13.61222

5

13.61222 .. 13.66

3

Таблиця 5 - Середини інтервалів за обчисленнями пакетом MathCad

Average

Frequency

13.254

6

13.302

11

13.349

14

13.397

12

13.445

9

13.493

9

13.541

11

13.588

5

13.636

3

Таким чином, під час обчислення статистичних характеристик за допомогою комп'ютерних пакетів необхідно або здійснити попереднє порівняння результатів обчислень, що не завжди зручно, або з'ясувати за якими формулами відбуваються обчислення необхідних параметрів і вжити відповідних заходів для усунення можливих розбіжностей.

Список літератури

1. Чень Синь, Оценивание параметров качества генераторных систем со скрещенными полями // Чень Синь, О.М. Никитенко // 21-я Междунар. Крымская конфер. «СВЧ-техника и телекоммуникационные технологии» (КрыМиКо'2011), Севастополь - С. 340 - 341.

2. Теоретична метрологія. Навч. посібник / Упоряд. І.П. Захаров.- Харків: ХТУРЕ, 2000.- 172 с.

3. Мак-Кракен, Д. Численные методы и программирование на фортране [Текст] / Д. Мак-Кракен, У. Дорн. - Пер. с англ. Казака Б.Н., под ред. Б.М. Неймарка - М. : Мир 1977 - 584 с.

4. Крохмаль, Т.М. Порівняльний аналіз пакетів Excel, Maple, Matlab при використанні їх під час статистичної обробки даних Теорія та методика електронного навчання: збірник наукових праць. / Т.М. Крохмаль, О.М. Нікітенко Випуск ІV. - Кривий Ріг : Видавничий відділ КМІ, 2013. - С. 153 - 158

5. Гречко, А. Л. Сучасний стан програмного забезпечення в курсах якісної теорії диференціальних рівнянь та динамічних систем / А. Л. Гречко // Друга міжнародна науково-практична конференція «Математика в сучасному технічному університеті», 20-21 грудня 2013 р., Київ: Матеріали конф. -- К.: НТУУ «КПІ», 2013 - С. 296 - 298

Размещено на Allbest.ru

...

Подобные документы

  • Види списків, особливості їх створення, застосування та можливості удосконалення роботи користувача персонального комп’ютера. Керування та аналіз груп споріднених даних у середовищі програми MS Excel 2010. Опрацювання спискiв за допомогою форми даних.

    дипломная работа [2,7 M], добавлен 18.06.2014

  • Огляд та класифікація комп'ютерних ігор. Алгоритм розташування кораблів на ігровому полі. Виконання алгоритму гри комп'ютера з використанням методу випадкових чисел. Стратегія гри комп'ютера. Обґрунтування вибору середовища програмної реалізації.

    курсовая работа [616,5 K], добавлен 26.01.2023

  • Сутність поняття "контроль". Оцінювання результатів навчально-пізнавальної діяльності учнів. Особливості комп’ютерного контролю знань. Підходи до зіставлення комп’ютерних програм контролю. Створення тесту з математики за допомогою програми MyTest.

    курсовая работа [278,4 K], добавлен 24.04.2012

  • Історія появи перших обчислювальних машин. Пам'ять як один із основних елементів комп'ютера, що дозволяє йому нормально функціонувати. Значення внутрішньої пам'яті комп'ютера з позиції зберігання інформації. Аналіз зовнішньої пам’яті та її модернізація.

    реферат [24,4 K], добавлен 27.12.2011

  • Алгоритм побудови лінії та використання графічної бібліотеки DirectX. Способи побудови довільної кількості довільного розміру точок на поверхні форми. Можливості комп'ютера виконувати мультимедійні програми під управлінням операційної системи Windows.

    контрольная работа [416,9 K], добавлен 22.10.2009

  • "Критичні" комплектуючі комп'ютера. Процесор та оперативна пам'ять. Швидкість роботи комп'ютера. Порівняння швидкодії комплектуючих з роботою еталонних моделей. Стратегія і варіанти модернізації. Функціональні особливості побудови материнської плати.

    курсовая работа [4,6 M], добавлен 24.06.2013

  • Поняття комп'ютеру як універсальної технічної системи, спроможної виконувати визначену послідовність операцій певної програми. Програмні засоби, за допомогою яких визначають основні характеристики ПК. Утіліта EVEREST Home Edition 1.51, її призначення.

    контрольная работа [403,0 K], добавлен 01.12.2009

  • Аналіз предметної області, опис проекту бази даних, моделей майбутнього програмного забезпечення гри для персонального комп'ютера "Міста". Функціональні можливості програмного забезпечення, які необхідно реалізувати. Інтерфейс програмного забезпечення.

    курсовая работа [2,3 M], добавлен 02.06.2016

  • Системний блок як корпус, який містить основні компоненти персонального комп’ютера. Коротка характеристика головних зовнішніх та внутрішніх пристроїв персонального комп’ютера. Послідовність операцій при обтиску та обробленні роз'єму "витої пари".

    лабораторная работа [1,7 M], добавлен 02.06.2011

  • Структура та галузі застосування систем цифрової обробки сигналів. Дискретне перетворення Фур’є. Швидкі алгоритми ортогональних тригонометричних перетворень. Особливості структурної організації пам’яті комп’ютерних систем цифрової обробки сигналів.

    лекция [924,7 K], добавлен 20.03.2011

  • Поняття та характеритсики комп'ютерних мереж. Огляд існуючих варіантів побудови інформаційної системи для торгівельного підприємства. Побудова локальної мережі, загальної структури інформаційної системи, бази даних. Аналіз санітарно-гігієнічних умов.

    курсовая работа [624,4 K], добавлен 19.05.2015

  • Функції інформаційної системи. Аналіз функцій системи управління базами даних: управління транзакціями і паралельним доступом, підтримка цілісності даних. Аналіз системи MySQL. Елементи персонального комп’ютера: монітор, клавіатура, материнська плата.

    дипломная работа [1,2 M], добавлен 15.05.2012

  • Розвиток комп’ютерної техніки. Основи інформатики. Класифікація персональних комп’ютерів. Складові частини інформатики. Інформація, її види та властивості. Кодування інформації. Структурна схема комп’ютера. Системи числення. Позиційна система числення.

    реферат [36,0 K], добавлен 27.10.2003

  • Класифікація систем комп’ютерної графіки, її різновиди та сфери використання. Міні-комп’ютери як зменшена версія магістральних. Загальна структура і функції комп’ютерної графіки. Растрова графіка, класифікація, призначення і функції її прикладних систем.

    контрольная работа [12,5 K], добавлен 12.10.2010

  • Експонентний розвиток комп'ютерної техніки. Будова сучасного комп'ютера, призначення основних елементів. Будова центрального процесора. Оперативная пам'ять та материнська плата. Будова звукової карти. Характеристика жорсткого диска. Склад чипсету.

    презентация [1,4 M], добавлен 25.02.2010

  • Принципи побудови тривимірних зображень у ГІС засобами комп’ютерної графіки. Інформативність та точність моделей, створених на основі растрових і векторних програм. Технологія побудови 3D-карт за допомогою "ArcGIS/3D Analyst" та "MapInfo"/"Поверхность".

    дипломная работа [700,6 K], добавлен 10.05.2015

  • Внутрішнє представлення в пам’яті комп’ютера даних базових та похідних типів, масивів. Ідентифікатор, зв'язаний з константним виразом та основи представлення даних. Алгоритм представлення цілих, дійсних, логічних і символьних чисел, структур і об’єднань.

    курсовая работа [279,1 K], добавлен 25.08.2014

  • Перевід цілого числа з десяткової системи числення в Р-ічную. Застосовування "трійкової логіки" у ЕОМ. Контроль числових перетворень за допомогою кодів Фібоначчі. Використання недвійкової комп'ютерної арифметики при розробці обчислювальної техніки.

    контрольная работа [35,6 K], добавлен 28.11.2014

  • Арифметичні основи, на яких ґрунтується функціонування комп'ютерної техніки. Основні поняття дискретної обробки інформації. Системи числення, форми подання чисел у комп'ютерах. Арифметичні операції, що виконуються над числами, подані у двійковому коді.

    учебное пособие [903,6 K], добавлен 18.12.2010

  • Огляд програмного комплексу SPSS у ПАТ "Платинум Банк". Аналіз обробки результатів анкетування та ідентифікації інтересів опитаних. Система Access як інструмент управління базами даних. Метод інтеграції даних усіх типів досліджень на замовлення клієнта.

    реферат [2,5 M], добавлен 05.11.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.