Методи Business Intelligence
Щоб залишатися конкурентоспроможними, бухгалтерія повинна використовувати методи бізнес-аналітики, мета яких — інтерпретувати велику кількість даних, загострюючи увагу лише на ключових факторах ефективності, моделюючи результат різних варіантів дій.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | реферат |
Язык | украинский |
Дата добавления | 18.12.2021 |
Размер файла | 1,5 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
МІНІСТЕРСТВО ОСВІТИ І НАУКИ УКРАЇНИ
Київський національний університет будівництва і архітектури
Кафедра кібербезпеки та комп'ютерної інженерії
ІНДИВІДУАЛЬНА РАБОТА
З дисципліни: «Інтелектуальні системи i технології обробки даних»
На тему: «Методи Business Intelligence»
Виконав:
студент групи БІКС-51
Чиренко Н.П.
Керівник:
доц. Шабала Є.Є.
м. Київ ? 2021 р.
ВСТУП
Сучасний бізнес щодня генерує величезні обсяги даних і інформації. Останні досягнення в області інформаційних технологій дали організаціям можливість збирати і зберігати ці дані ефективним і дієвим чином. Однак розрив між зберіганням і використанням даних збільшується.
Бухгалтерський облік -- основа успіху компанії. В сьогоднішніх умовах бухгалтерський облік зазнав революцію. Якщо функція бухгалтерського обліку не може надавати оперативні дані в режимі реального часу бізнес-менеджерам, успіх організацій у все більш конкурентному середовищі виявиться під загрозою. Щоб залишатися конкурентоспроможними і розробляти далекоглядні стратегії, бухгалтерія повинна використовувати методи бізнес-аналітики (англ. Business Intelligence) для швидкого й економічного отримання і обробки відповідної фінансової інформації. Ці методи включають:
· діяльність систем підтримки прийняття рішень;
· запитів і звітів;
· оперативної аналітичної обробки (OLAP) ;
· статистичного аналізу;
· інтелектуального аналізу тексту;
· інтелектуального аналізу даних і візуалізації [1].
Бізнес-аналітика використовується для розуміння можливостей, доступних фірмі: сучасний стан, тенденції та майбутні напрямки на ринках, технологіях і нормативно-правовій базі, в якій компанія конкурує; дії конкурентів і наслідки цих дій.
бізнес аналітика дані моделювання
Розділ 1. Термін Business Intelligence
Термін вперше з'явився в 1958 році в статті дослідника з IBM Ханса Пітера Луна (англ. Hans Peter Luhn), яке визначило BI як «можливість розуміння зв'язків між представленими фактами». BI в сучасному розумінні еволюціонував з систем для прийняття рішень, які з'явилися на початку 1960-х років і розроблялися в середині 1980-х років.
У 1989 році Ховард Дреснер (пізніше аналітик Gartner) визначив Business Intelligence як загальний термін, що описує «концепції і методи для поліпшення прийняття бізнес-рішень з використанням систем на основі бізнес-даних».
Бізнес-аналітика (BI) -- це широка категорія додатків, технологій і процесів для збору, зберігання, доступу та аналізу даних, які допомагають бізнес користувачам приймати більш обґрунтовані рішення. Це широке визначення. BI охоплює не тільки додатки, але також технології і процеси. Він включає не тільки «отримання даних» (за допомогою інструментів і додатків), але також «отримання даних» (в вітрину або сховище даних). [4]
Технології бізнес-аналітики надають історичні, поточні та прогностичні огляди бізнес-операцій. Загальні функції технологій бізнес-аналітики -- це звітність, онлайн-аналітична обробка, аналітика, інтелектуальний аналіз даних, управління ефективністю бізнесу, порівняльний аналіз, інтелектуальний аналіз тексту і прогностична аналітика.
Мета BI -- інтерпретувати велику кількість даних, загострюючи увагу лише на ключових факторах ефективності, моделюючи результат різних варіантів дій, відстежуючи результати прийняття рішень.
BI застосовується для наступних бізнес-задач:
1. Дані -- Завдання даних є обов'язковою умовою для всіх видів діяльності
BI. Основною метою є організація доступної інформації про бізнес та його оточення. Найважливішою проблемою є організація даних таким чином, щоб вони могли бути використані в різних видах діяльності БІ (ETL, Data Mining etc).
2. Вимірювання -- створює ієрархію показників ефективності (Metrics Reference Model) і бенчмаркінг, який інформує керівників підприємств про прогрес досягнення бізнес-цілей (управління бізнес-процесами).
3. Аналітика -- створює кількісні бізнес-процеси, щоб прийти до
оптимальних рішень. Часто включає в себе: аналіз даних, розробка процесів, статистичний аналіз, прогнозне моделювання, моделювання бізнес-процесів, походження даних, обробки складних подій.
4. Корпоративна звітність -- являє собою комплекс звітів, що забезпечують достовірне і повне уявлення про економічний потенціал і тенденції розвитку корпорації в умовах навколишнього ринкового середовища. Часто включає в себе візуалізацію даних, управлінські інформаційні системи і технології OLAP.
BI підтримує безліч бізнес-рішень:
Операційні рішення
· позиціонування продукту
· позиціонування цін
Стратегічні рішення
· пріоритети
· цілі
· напрямки
1.1 Ефективні та своєчасні рішення - як основа BI
Основна мета систем бізнес-аналітики -- надати інтелектуальним працівникам інструменти та методології, що дозволяють їм приймати ефективні та своєчасні рішення.
Ефективні рішення. Застосування строгих аналітичних методів дозволяє особам, які приймають рішення, покладатися на інформацію та знання, які є більш надійними. В результаті вони можуть приймати більш обґрунтовані рішення і розробляти плани дій, які дозволяють більш ефективно досягати своїх цілей. Дійсно, звернення до формальних аналітичних методів змушує осіб, які приймають рішення, детально описувати як критерії оцінки альтернативних варіантів, так і механізми, що регулюють досліджувану проблему. Крім того, подальше поглиблене вивчення і роздуми призводять до більш глибокому усвідомленню і розумінню основної логіки процесу прийняття рішень.
Своєчасні рішення. Підприємства працюють в економічному середовищі, яка характеризується зростаючим рівнем конкуренції і високою динамічністю. Як наслідок, здатність швидко реагувати на дії конкурентів і на нові ринкові умови є вирішальним фактором успіху або навіть виживання компанії.
На малюнку 1.1 показані основні переваги, які організація може отримати від впровадження системи бізнес-аналітики. Зіткнувшись з проблемами, особи, які приймають рішення, задають собі ряд питань і проводять відповідний аналіз. Отже, вони розглядають і порівнюють кілька варіантів, вибираючи серед них краще рішення з урахуванням наявних умов. [3]
Мал. 1.1 Переваги BI-системи на практиці
Деякі переваги більш-менш очевидні, наприклад, велика гнучкість користувачів за рахунок створення звітів, більш швидкий доступ і кращий огляд даних тощо. Інші переваги менш очевидні, і важко визначити, чи є вони насправді результатом використання бізнес-аналітики або чогось ще (наприклад, може бути важко з'ясувати, що насправді сприяло збільшенню доходу в останньому кварталі). Звичайно, правда може перебувати десь посередині, тому певне поліпшення може бути частково результатом використання бізнес-аналітики, а частково результатом інших факторів.
Втім, за допомогою бізнес-аналітики можна знайти причини певних проблем, а також виявити і проаналізувати ключові фактори успіху. Цей процес починається з аналізу більш широкого звіту, такого як загальні дані про продажі, де ми намагаємося виявити причини певних проблемних ситуацій. Це завдання вимагає декількох етапів, перш ніж прийти до суті проблеми, розглянемо наприклад малюнок 1.2. Користувачі можуть заглибитися в зміст вихідного звіту і, таким чином, отримати найдрібнішу і детальну інформацію, щоб виявити основні причини окремих подій або поточної ситуації. Як тільки вони дізнаються причину, вони можуть вжити ряд ефективних дій в протилежному напрямку або для виправлення проблем, або для підтримки гарної практики і, можливо, поширити її на інші області. [10]
Мал. 1.2 Використання BI: розкриття питань у конкретні відповіді
Висновки
У такий спосіб -- ділячи великі питання на малі, можна знайти «корінь» проблеми, який допоможе не тільки виправити певну ситуацію, а навіть сформувати певну стратегію дій для кожного випадку. У сьогоднішньому світі високої конкуренції, ефективність і своєчасність дій для організації -- це не просто вибір між прибутком і збитком; це може бути питання виживання або банкротства.
1.2 Життєвий цикл Business Intelligence
Для успішного впровадження бізнес-аналітики потрібні чотири кроки, які циклічно пов'язані один з одним. На мал. 1.3 показано життєвий цикл бізнес-аналітики.
Мал. 1.3 Життєвий цикл бізнес-аналітики
* Отримання точних даних -- отримання великої кількості даних зі сховищ даних, вітрин даних, баз даних та інших джерел;
* Аналіз даних, отриманих за допомогою операцій BI -- складні елементи розбиваються на менші сегменти для кращого розуміння та створення нових знань. Бізнес-проблеми вирішуються шляхом визначення потреб бізнесу. Створюються складові звітності (річні звіти, аналіз, інформаційні панелі, діаграми тощо);
* Визначення тенденцій, змін та неточностей -- прогнозування тенденцій за допомогою прогнозної аналітики. Допоможе визначити загрози та можливості всередині бізнесу за допомогою складних математичних методів та алгоритмів;
* Моделювання та отримання нових знань про проблеми та можливості бізнесу. [2]
Висновки
Таким чином, на основі циклічної моделі BI, попередні дані, які були отримані на основі минулих досліджень, можуть бути застосовані у майбутньому. Опираючись на них можна знайти більш оптимальні рішення.
1.3 BI в боротьбі проти COVID-19
З початку спалаху COVID-19 в Італії, AREU (Регіональне агентство з надзвичайних ситуацій) щодня використовує BI для відстеження кількості запитів на надання першої допомоги, отриманих від 911. BI аналізує кількість запитів, які були класифіковані як респіраторні або інфекційні епізоди під час телефонної диспетчерської розмови. BI також дозволяє визначити числову тенденцію епізодів в кожному місті, районі тощо (збільшення, стабільність, зменшення).
AREU застосовує BI з використанням даних в реальному часі, записуючи всі отримані запити від кожного інциденту. BI відстежує всі запити, що надійшли з призначеної їм території, 24 години на добу, кожен день тижня. Ці дані показують кількість звернень за невідкладною допомогою з конкретних районів регіону з приводу респіраторних або інфекційних захворювань. AREU вирішує використовувати ці цифри, щоб оцінити, де відбулося зараження і використовують їх для кращого розподілу ресурсів (транспортних засобів і людських ресурсів) на території. Крім того, BI дозволяє порівнювати кількість реєстрованих епізодів з даними за попередні дні, що дуже важливо для перевірки того, чи відповідають дані в реальному часі моделі прогнозу в кожній області.
Грунтуючись на отриманих даних від BI-системи, AREU змогла оптимізувати та мобілізувати необхідні ресурси в боротьбі з епідемією, передбачати нові спалахи хвороби та врятувала життя багатьох людей. [11]
З цього можна зробити висновок, що застосування таких цифрових рішень, допоможе контролювати епідемію і в майбутньому. Окрім того, «заглядаючи» в майбутнє, вважаю, що дослідження з використанням таких рішень має стати пріорітетом.
Розділ 2. Архітектура та компоненти BI
Структура 5-рівневої архітектури бізнес-аналітики представлена на мал. 2.1, беручи до уваги цінність і якість даних, а також інформаційний потік в системі. П'ять рівнів -- це джерело даних, ETL (витяг-перетворення-завантаження), сховище даних, кінцевий користувач і рівні метаданих. Інші частини цього розділу описує кожен з шарів. [6]
Мал. 2.1 5-ти рівнева архітектура BI
2.1 Рівень джерела даних
В даний час багато областей додатків вимагають використання структурованих даних, а також неструктурованих і напівструктурованих даних для прийняття ефективних та своєчасних рішень. Всі ці дані можуть бути отримані з двох типів джерел: внутрішніх і зовнішніх. Внутрішнє джерело даних відноситься до даних, які збираються і обслуговуються операційними системами всередині організації, такими як системи управління взаємовідносинами з клієнтами та планування ресурсів підприємства. Внутрішні джерела даних включають дані, які стосуються бізнес-операцій (дані про клієнтів, продукти і продажах). Ці операційні системи також відомі як системи обробки онлайн-транзакцій, тому що вони обробляють велику кількість транзакцій в режимі реального часу і оновлюють дані, коли це необхідно. Операційні системи містять тільки поточні дані, які використовуються для підтримки повсякденних бізнес-операцій організації. Як правило, операційні системи орієнтовані на процеси, оскільки вони в основному орієнтовані на конкретні бізнес-операції, такі як продажі, бухгалтерський облік і закупівлі.
До зовнішніх джерел даних відносяться ті, які відбуваються за межами організації. Цей тип даних може бути отриманий з зовнішніх джерел, таких як ділові партнери, постачальники даних синдикату, Інтернет, уряду і організації з дослідження ринку. Ці дані часто пов'язані з конкурентами, ринком, навколишнім середовищем (наприклад, демографічні та економічні дані клієнтів) і технологіями.
2.2 Рівень ETL (витяг-перетворення-завантаження)
Цей рівень фокусується на трьох основних процесах: добуванні, перетворенні і завантаженні. Витяг -- це процес виявлення і збору відповідних даних з різних джерел. Зазвичай дані, зібрані з внутрішніх і зовнішніх джерел, не інтегровані, неповні і можуть дублюватися. Отже, процес вилучення необхідний для вибору даних, які важливі для підтримки прийняття організаційних рішень.
Потім витягнуті дані відправляються в тимчасову область зберігання, звану проміжної областю даних, до процесу перетворення і очищення. Це зроблено для того, щоб уникнути повторного отримання даних в разі виникнення будь-яких проблем. Після цього дані пройдуть перетворення і процес очищення. Перетворення -- це процес перетворення даних з використанням набору бізнес-правил (таких як функції агрегування) у погоджені формати для звітності та аналізу. Процес перетворення даних також включає визначення бізнес-логіки для зіставлення даних і стандартизацію визначень даних для забезпечення узгодженості у всій організації. Що стосується очищення даних, це відноситься до процесу виявлення і виправлення помилок даних на основі заздалегідь визначених правил. Якщо в витягнутих даних виявлена ??помилка, вони відправляються назад в джерело даних для виправлення. Після перетворення і очищення дані зберігаються в проміжній області. Це може запобігти необхідність повторного перетворення даних в разі збою або завершення процесів завантаження. Завантаження -- це остання фаза процесу ETL. Дані з проміжної області завантажуються в цільової репозиторій.
2.3 Рівень сховища даних
На рівні сховища даних є три компоненти, а саме: оперативне сховище даних, сховище даних та таблиці даних. Потік даних від оперативного сховища даних до сховища даних, а згодом - до бази даних. Використовуючи інструменти вилучення та перетворення, відомі як витяг, перетворення, завантаження (ETL), дані, що надходять із різних джерел, зберігаються у базах даних, призначених для підтримки аналізу бізнес-аналітики. Ці бази даних зазвичай називають сховищами даних та базами даних. [5]
Сховище даних є одним з найважливіших компонентів архітектури BI. Характеристики сховища даних описуються наступним чином:
· Предметно-орієнтовані: Дані з різних джерел об'єднуються в групи на основі загальних предметних областей, на які організація хотіла б зосередитися, таких як клієнти, продажі та продукти.
· Інтегровані: Сховище даних збирає дані з різних джерел. Усі ці дані повинні бути узгоджені з точки зору умов іменування, форматів та інших пов'язаних характеристик.
· Часові: у всіх даних, що зберігаються в сховищі даних, є часовий вимір, що дозволяє відстежувати зміни або тенденції в даних. Іншими словами, сховище даних буде зберігати історичні зміни для кожної частини даних.
· Довготривала: нові дані можна регулярно додавати в сховище даних.
Але всі дані, що зберігаються в сховищі даних, доступні тільки для читання. Це означає, що користувачам не дозволено оновлювати, перезаписувати або видалити ці дані.
Таким чином, сховище даних -- це центральне сховище, яке збирає і зберігає дані з внутрішніх і зовнішніх джерел для прийняття стратегічних рішень, запитів і аналізу.
2.4 Оперативне сховище даних
Оперативне сховище даних (ODS) використовується для інтеграції всіх даних з рівня ETL та завантаження їх у сховища даних. ODS -- це база даних, яка зберігає орієнтовані на предмет, детальні та поточні дані з різних джерел для підтримки прийняття тактичних рішень. Він забезпечує інтегрований перегляд даних майже в реальному часі, таких як транзакції та ціни. Крім того, дані, що зберігаються в ОРВ, є мінливими, а це означає, що вони можуть бути перезаписані або оновлені новими даними, які вносяться в ОРВ. Таким чином, ODS не зберігає жодних історичних даних. Як правило, ODS призначена для підтримки оперативної обробки та подання звітності щодо конкретного додатка, забезпечуючи інтегрований перегляд даних у багатьох різних бізнес -додатках. Зазвичай він використовується середнім керівництвом для повсякденного управління та прийняття короткострокових рішень. Оскільки дані, що зберігаються в ODS, оновлюються часто (тобто за хвилини чи години), це корисно для типів звітів, які потребують інформації в режимі реального часу (протягом 15 хвилин) або майже часу (оновлення за 15 хвилин до 1 години).
2.5 Рівень кінцевого користувача
Рівень кінцевого користувача складається з інструментів, які відображають інформацію в різних форматах для різних користувачів. Ці інструменти можна згрупувати ієрархічно у формі піраміди (мал. 1.3). Коли ви рухаєтесь знизу до вершини піраміди, ступінь всебічності обробки та подання даних зростає. Це має адаптуватися до зростання складності у прийнятті рішень у міру просування організаційної ієрархії. Наприклад, найвищий рівень піраміди складається з аналітичних додатків, які зазвичай використовуються вищим керівництвом, тоді як найнижчий рівень складається з інструментів запитів та звітності, які використовуються здебільшого на рівні оперативного управління.
2.6 Шар метаданих
Метадані -- це дані про дані. Він описує, де використовуються та зберігаються дані, джерело даних, які зміни були внесені до даних та як одна частина даних стосується іншої інформації. Сховище метаданих використовується для зберігання технічної та комерційної інформації про дані, а також бізнес -правил та визначень даних. Гарне управління та використання метаданих може скоротити час розробки, спростити постійне обслуговування та надати користувачам інформацію про джерело даних. Наприклад, користувачам не потрібно перепроектувати структуру даних (таку як назва таблиці та типи даних) для моделювання даних, оскільки необхідні структури даних були збережені як метадані. Користувачі можуть просто запитувати та отримувати ці метадані зі сховищ. Тому важливо стежити за тим, щоб метадані у сховищах підтримувалися та регулярно оновлювалися.
2.7 OLAP (онлайн-аналітична обробка)
Один або кілька серверів OLAP можуть керувати даними на рівні сховища даних для звітності, аналізу, моделювання та планування оптимізації бізнесу. Сервер OLAP -- це «механізм маніпулювання даними, призначений для підтримки багатовимірних структур даних». Сервер OLAP може надавати багатовимірні та узагальнені подання сукупних даних. OLAP -- це зручний графічний інструмент, який дозволяє користувачам швидко переглядати та аналізувати бізнес-дані з різних точок зору. Крім того, OLAP також дозволяє користувачам легко порівнювати різні типи даних і складні обчислення. [7]
Для аналізу багатовимірних даних використовуються чотири основні операції OLAP:
· Roll-up or drill-up (консолідація): підвищує рівень агрегації або шляхом переходу на більш високий рівень (більш докладні дані) по ієрархії вимірів, або шляхом зменшення одного або декількох вимірювань з заданого куба даних;
· Drill-down (деталізації): це протилежний процес згортанню. Він знижує рівень агрегації, переходячи на більш низький рівень (менше докладні дані) по ієрархії вимірів або додаючи одне або кілька вимірів в куб даних;
· Slice and Dice (нарізка на кубики і скибочки): використовується для опису функції складного аналізу даних, що забезпечується засобами OLAP, вибірка даних (поздовжні і поперечні, площинні та об'ємні зрізи) з багатовимірного куба з заданими значеннями і заданим взаємним розташуванням вимірювань, при якому користувач зазвичай використовує операції обертання концептуального куба даних та деталізації / агрегування даних.
· Pivot: він дозволяє користувачам обертати осі куба даних, тобто міняти місцями вимірювання для отримання різних представлень даних.
2.8 Збір даних
Процес інтелектуального аналізу даних може бути досягнутий за рахунок інтеграції сховищ даних і серверів OLAP шляхом виконання подальшого аналізу даних в кубах OLAP. Оскільки обсяг даних в організації швидко зростає, для більш швидкого прийняття рішень необхідний інтелектуальний аналіз даних. По суті, інтелектуальний аналіз даних -- це процес, який автоматично визначає корисну інформацію, таку як незвичайні закономірності, тенденції і відносини, які приховані у великій кількості даних. Цього можна досягти, застосовуючи статистичні методи, такі як класифікація, аналіз часових рядів або кластеризація. Методи інтелектуального аналізу даних використовувалися в багатьох прикладних областях, таких як маркетинг, фінанси, медицина і виробництво, для прогнозування майбутніх результатів та узагальнення деталей даних. [8]
2.9 Інструменти візуалізації даних
Інструменти візуалізації даних, такі як інформаційна панель та картки показників, можуть бути надані менеджерам та керівникам, яким потрібен загальний огляд їх діяльності. Інформаційна панель -- це корисний інструмент, який дозволяє користувачам візуалізувати дані за допомогою діаграм, кольорових показників або таблиць. Користувачі також можуть переглядати більш детальну інформацію про ключові показники ефективності у своїх організаціях. Роблячи це, менеджери можуть уважно та ефективніше контролювати свою діяльність та прогрес до досягнення визначених цілей.
2.10 Аналітичні додатки
Аналітичні додатки надають такі функції, як моделювання, прогнозування, аналіз продажів і сценарії «what if». Ці додатки можуть використовуватися для підтримки як внутрішніх, так і зовнішніх бізнес-процесів. Додатки, оснащені аналітичними можливостями, дозволяють користувачам отримати уявлення про підвищення ефективності бізнес-операцій. Використовуючи аналітичні додатки, особи, які приймають рішення, також можуть визначити і зрозуміти, які фактори визначають вартість їх бізнесу, і, таким чином, зможуть скористатися наявними можливостями швидше, ніж їх конкуренти. [9]
Висновки
Як вже було зазначено, BI - це комплекс інструментів і методів для роботи з даними і прийнятті рішень в подальшому. Тому, розуміння архітектури BI є важливим, так як, вона грає важливу роль в забезпеченні успіху та реалізації бізнес-аналітики. Маючи добре продуману архітектуру BI, організації зможуть отримати максимальну віддачу від своїх інвестицій в BI і, таким чином, задовольнити свої бізнес-вимоги та підвищити ефективність бізнесу.
Розділ 3. Методологія Business Intelegience
У цьому розділі ми роздивимось основні методи:
3.1 Методологія інтелектуального аналізу даних (Data Mining)
Технології збору та зберігання інформації зробили доступними величезні обсяги даних в більшості сферах, таких як діловий світ, наукове і медичне співтовариство і державне управління. Набір дій, задіяних в аналізі цих великих баз даних, націлений зазвичай на вилучення корисних знань для підтримки прийняття рішень. Термін інтелектуальний аналіз даних визначає процес дослідження та аналізу набору даних, зазвичай великого розміру, з метою пошуку регулярних закономірностей, вилучення відповідних знань і отримання значущих повторюваних правил. Інтелектуальний аналіз даних грає постійно зростаючу роль як в теоретичних дослідженнях, так і в додатках. [3]
Data Mining - це не один, а сукупність великого числа різних методів виявлення знань. Всі завдання, які вирішуються методами Data Mining, можна умовно розбити на шість видів:
· Класифікація;
· Регресія;
· Кластеризація;
· Асоціація;
· Послідовні шаблони;
· Аналіз відхилень.
Data Mining носить мультидисциплінарний характер, оскільки включає в себе елементи чисельних методів, математичної статистики та теорії ймовірностей, теорії інформації та математичної логіки, штучного інтелекту і машинного навчання (мал. 3.1).
Мал. 3.1 Виявлення знань в базах даних (Knowledge Discovery in Databases)
Завдання бізнес-аналізу формулюються по-різному, але рішення більшості з них зводиться до тієї чи іншої задачі Data Mining або до їх комбінації. Наприклад, оцінка ризиків - це вирішення завдання регресії або класифікації, сегментація ринку - кластеризація, стимулювання попиту - асоціативні правила. Фактично завдання Data Mining є елементами, з яких можна «зібрати» рішення більшості реальних бізнес-завдань.
Для вирішення вищеописаних завдань використовуються різні методи і алгоритми Data Mining. З огляду на те, що Data Mining розвивалася і розвивається на стику таких дисциплін, як математична статистика, теорія інформації, машинне навчання і бази даних, цілком закономірно, що більшість алгоритмів і методів Data Mining були розроблені на основі різних методів з цих дисциплін. Наприклад, алгоритм кластеризації k-means був запозичений з статистики.
В Data Mining більшої популярності набули такі методи: нейронні мережі, дерева рішень, алгоритми кластеризації, в тому числі і масштабовані, алгоритми виявлення асоціативних зв'язків між подіями тощо. [12]
Метод кластеризації k-means (k-середнє)
Інтелектуальний аналіз даних спрямований на отримання інформації з різних джерел даних, щоб полегшити прийняття рішень. Метод інтелектуального аналізу даних використовує метод кластеризації k-means. Використання кластеризації k-means полягає в тому, що шляхом класифікації дефектів продукту (мал. 3.2), ми розділимо їх на три кластера: перший - з малою кількістью дефектів, другий - з середньою кількістью дефектів і третій - з великою кількістью дефектів.
Мал. 3.2 Таблиця товарів, які були пошкоджені при виробництві
Метод k-середніх - це метод кластерного аналізу, мета якого є поділ m спостережень (з простору) на k кластерів, при цьому кожне спостереження відноситься до того кластеру, до центру (центроїду) якого воно найближче.
Визначаємо центроїди кожного кластера:
Візьмемо дані з комірки PG-11 як центр кластера 1: (117, 69, 35);
Візьмемо дані з комірки PG-5 як центр кластера 2: (3095, 2656, 2554);
Візьмемо дані з комірки PG-23 як центр кластера 3: (5012, 4085, 4109).
Щоб обчислити відстань між даними та центроїдом будемо використовувати формулу Евклідовї відстані, виконуємо такі дії:
Формула Евклідової відстані
Обчислюємо центри кластерів 2 і 3:
Тобто, тепер в нас є центроїди для 1-3 кластерів. Якщо відстань в межах від 1 до 4680,429 - це перший кластер. Якщо в межах від 4680,429 до 7529,061 - другий. І від 7529,061 до ? - третій кластер.
Розрахуємо відстань для комірки PG-1 і PG-2:
Як бачимо з результату PG-1 7529,061 < 4991.549 > 4680.429 - 2-й кластер.
PG-2 7529,061 < 2141,121 > 4680.429 - 1 кластер.
Результатом кластеризації буде мал. 3.3.
Мал. 3.3 Результат
СПИСОК ВИКОРИСТАНИХ ДЖЕРЕЛ ТА ЛІТЕРАТУРИ
1. Springer. Business Intelligence Techniques (без дати, Google Scholar)
Посилання: http://ndl.ethernet.edu.et/bitstream/123456789/18319/1/179.pdf.pdf
2. USING ADVANCED BUSINESS INTELLIGENCE METHODS IN BUSINESS PROCESS MANAGEMENT (2013, Google Scholar)
Посилання: https://www.researchgate.net/profile/Matjaz-Juric/publication/228991998_USING_ADVANCED_BUSINESS_INTELLIGENCE_METHODS_IN_BUSINESS_PROCESS_MANAGEMENT/links/0f317539ad128836c6000000/USING-ADVANCED-BUSINESS-INTELLIGENCE-METHODS-IN-BUSINESS-PROCESS-MANAGEMENT.pdf
3. Business Intelligence: Data Mining and Optimization for Decision Making (2009 рік, Google Scholar) Посилання:
http://196.223.158.148/bitstream/handle/123456789/2044/103.pdf?sequence=1&isAllowed=y
4. Business Intelligence Approaches (2012, Google Scholar)
Посилання: https://mpra.ub.uni-muenchen.de/41139/1/MPRA_paper_41139.pdf
5. Database Systems Journal BOARD (2013, Google Scholar)
Посилання: http://www.dbjournal.ro/archive/14/14.pdf#page=13
6. A Five-Layered Business Intelligence Architecture (2011, Google Scholar)
Посилання: http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.642.4964&rep=rep1&type=pdf
7. Data Warehousing and OLAP over Big Data: Current Challenges and Future Research Directions (2014, Google Scholar)
Посилання: https://www.researchgate.net/profile/Il-Yeol
Song/publication/262288311_Data_Warehousing_and_OLAP_over_Big_Data_Current_challenges_and_future_research_directions/links/53ed297f0cf2981ada13e729/Data-Warehousing-and-OLAP-over-Big-Data-Current-challenges-and-future-research-directions.pdf
8. The Role of Data Mining for Business Intelligence in Knowledge Management (2015, Електронний ресурс)
1. Посилання: https://www.igi-global.com/chapter/the-role-of-data-mining-for
business-intelligence-in-knowledge-management/116805
9. Fundamentals of business intelligence (2015, Google Scholar)
Посилання: https://doc1.bibliothek.li/acd/FLMF046342.pdf
10. ASSESSING BENEFITS OF BUSINESS INTELLIGENCE SYSTEMS (2010, Електронний ресурс)
Посилання: https://hrcak.srce.hr/index.php?show=clanak&id_clanak_jezik=81748
11. Business Intelligence applied to Emergency Medical Services in the Lombardy region during SARS-CoV-2 epidemic (2020, Електронний ресурс)
Посилання: https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7569617/
12.
https://www.researchgate.net/profile/Ioannis-Kazanidis/publication/283343139_A_Proposed_Methodology_for_E-Business_Intelligence_Measurement_Using_Data_Mining_Techniques/links/5b923051299bf147391fc3f0/A-Proposed-Methodology-for-E-Business-Intelligence-Measurement-Using-Data-Mining-Techniques.pdf
Размещено на Allbest.ru
...Подобные документы
Методология, технология и архитектура решения SAP Business Objects. Возможные действия в Web Intelligence. Создание документов и работа с ними. Публикация, форматирование и совместное использование отчетов. Общий обзор приложения, его интерфейсы.
курсовая работа [1,4 M], добавлен 24.09.2015Классификация информационных систем управления деятельностью предприятия. Анализ рынка и характеристика систем класса Business Intelligence. Классификация методов принятия решений, применяемых в СППР. Выбор платформы бизнес-интеллекта, критерии сравнения.
дипломная работа [1,7 M], добавлен 27.09.2016Поняття та основна мета створення інформаційної системи, її різновиди та процедура побудови, підходи до обробки. Концепція баз даних та методи керування ними, предметна область і процес проектування. Структурована мова запитів SQL, елементи та оператори.
учебное пособие [1,7 M], добавлен 14.11.2009Регулярний тип даних мови Pascal, що дозволяє в програмі задавати структуру даних, яка називається масивом. Поняття одновимірного та багатовимірного масиву. Прямі методи сортування масивів, типи даних. Таблиця результативності гравців футбольної команди.
лекция [411,2 K], добавлен 24.07.2014Проектування бази даних "Аптека" у Microsoft Access, розробка структури таблиць, ключових полів і схеми даних. Створення запитів різних типів, екранних форм різного виду для введення і перегляду даних. Створення кнопкових форм, що полегшують навігацію.
дипломная работа [3,1 M], добавлен 16.11.2014Методика проектування бази даних, в якій повинна зберігатися вся інформація про художників, їх картини, епохи, в які картини були написані, музеї, в яких вони зберігаються. Проектування програмної системи за допомогою засобів візуального моделювання.
курсовая работа [4,0 M], добавлен 12.06.2011Нові методи та спеціалізовані обчислювальні пристрої зменшення обсягів даних тріангуляційного опису об’єктів комп’ютерної томографії. Розвиток методу розбиття тріангуляційних сіток на окремі елементи. VHDL-модель спеціалізованого апаратного прискорювача.
автореферат [135,2 K], добавлен 13.04.2009Методи використання традиційних файлових систем - набору програм, які виконують для користувачів деякі операції, наприклад, створення звітів. Системи керування баз даних. Основні поняття реляційної моделі даних. Реляційна алгебра і реляційне числення.
реферат [40,2 K], добавлен 13.06.2010SQL як стандартна мова для роботи з реляційними базами даних, стандартні типи даних, які можна використовувати. Числа з плаваючою комою, текстові та спеціальні типи даних. Типи та розміри полів таблиці, обмеження з метою забезпечення цілісності таблиці.
реферат [24,8 K], добавлен 20.06.2010Аналіз об'єктів дослідження, проектування баз даних. Розробка програмного забезпечення для роботи зі спроектованою базою даних. Реалізація індексів, опис метаданих в середовищі MySQL. Специфікація DDL для MySQL, протокол тестування DDL-сценарії.
контрольная работа [389,9 K], добавлен 05.01.2014Проблема інформаційної обробки геологічних даних. Методи побудови розрізу з відомих елементів залягання. Підготовка даних для аналізу. Ієрархія об'єктів, що беруть участь в побудовах. Розрахунок витрат на розробку та впровадження проектного рішення.
магистерская работа [4,2 M], добавлен 17.12.2014Бізнес процеси й елементи даних. Специфікація елементів даних. Діаграма класів проектування. Створення та використання об'єктів бази даних. Таблиці, обмеження цілісності, тригери, типові вибірки, представлення, індекси. Типові оператори модифікації даних.
курсовая работа [255,3 K], добавлен 01.06.2019Криптографія – математичні методи забезпечення інформаційної безпеки та захисту конфіденційності. Огляд існуючих методів пошуку нових алгоритмів шифрування. Розробка системи оцінки ефективності криптографічних систем. Найпоширеніші методи шифрування.
дипломная работа [1,2 M], добавлен 13.06.2015Визначення мети створення бази даних магазину та таблиць, які вона повинна містити. Розгляд видів полів та ключів таблиць. Створення запитів, форм, звітів, макросів та модулів. Вибір системи управління базами даних. Реалізація моделі у Microsoft Access.
курсовая работа [3,8 M], добавлен 20.07.2014Клас TNota як батьківській клас, який характеризує об’єкт нота і містить методи: Inc – отримання наступної ноти та Dec – отримання попередньої ноти. Управління програмою: методи та інструменти, оцінка ефективності. Формування інструкції користувачу.
контрольная работа [140,3 K], добавлен 27.03.2011Визначення необхідних даних для створення бази даних "Бібліотека", групування їх по таблицях. Передбачення ключових полів, зв’язків між таблицями Access. Створення запитів для функціонування фільтрів у головній формі, а також інтерфейсу користувача.
курсовая работа [2,5 M], добавлен 22.01.2015Основи безпеки даних в комп'ютерних системах. Розробка програми для забезпечення захисту інформації від несанкціонованого доступу: шифрування та дешифрування даних за допомогою криптографічних алгоритмів RSA та DES. Проблеми і перспективи криптографії.
дипломная работа [823,1 K], добавлен 11.01.2011Компонент (підсистема) інформаційної системи (ІС). Інформаційне та технічне забезпечення. Склад робіт на стадіях впровадження, експлуатації і супроводження проекту ІС. Показники оцінки ефективності і вибір варіантів організації процесів обробки даних.
контрольная работа [26,0 K], добавлен 10.09.2009Методи використання предикатів Cut, Fail. Організація циклу (repeat), складання програми. Алгоритм роботи зі списками та рядками. Елементарні операції і базові функції мови програмування Лісп. Робота зі складними типами даних на прикладі бази даних АТС.
контрольная работа [219,3 K], добавлен 17.06.2011Проект і реалізація структури модулів портальної системи і бази даних: стрічка новин, електронні голосування, користувачі порталу, сторінки сайту; методи та формати зберігання даних. Система адміністрування веб-порталу, управління обліковими записами.
дипломная работа [3,6 M], добавлен 24.09.2012