Структурний синтез за критерієм роздільності в задачі класифікації об’єктів-множин

Класифікація множин, де об’єкти визначені як множини багатовимірних спостережень. Алгоритм методу групового врахування аргументів, критерієм якого вибрано критерій роздільності у трьох формах: внутрішньокласова та міжкласова дисперсія, їх відношення.

Рубрика Математика
Вид статья
Язык украинский
Дата добавления 20.04.2021
Размер файла 137,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Національний технічний університет України «Київський політехнічний інститут імені Ігоря Сікорського»

Структурний синтез за критерієм роздільності в задачі класифікації об'єктів-множин

Павлов Володимир Анатолійович,

кандидат технічних наук, доцент, доцент кафедри біомедичної кібернетики

Трофименко Олександр Володимирович,

студент факультету «Біомедичної інженерії»

Грішко Дмитро Юрійович,

студент факультету «Біомедичної інженерії»

Анотація

міжкласовий дисперсія множина

У статті розглянуто проблему класифікації множин, де об'єкти визначенні, як множини багатовимірних спостережень. Вирішення проблеми запропоновано проводити у просторі параметрів моделей об'єктів класифікації що побудовано на структурі яка вибрана з умови найкращого значення критерію роздільності. Для пошуку такої структури розроблено алгоритм методу групового врахування аргументів, зовнішнім критерієм якого вибрано критерій роздільності у трьох формах: внутрішньокласова дисперсія, міжкласова дисперсія та їх відношення.

Ключові слова: простір параметрів, метод групового урахування аргументів, оптимальна структура, критерій роздільності.

Аннотация

Структурный синтез по критерию разрешения в задачах классификации объектов-множеств

Павлов Владимир Анатолиевич, кандидат технических наук, доцент, доцент кафедры биомедицинской кибернетики Национальный технический университет Украины «Киевский политехнический институт имени Игоря Сикорского»

Трофименко Александр Владимирович студент факультета «Биомедической инженерии» Национального технического университета Украины «Киевский политехнический институт имени Игоря Сикорского»

Гришко Дмитрий Юрьевич студент факультета «Биомедической инженерии» Национального технического университета Украины «Киевский политехнический институт имени Игоря Сикорского»

В статье рассмотрена проблема классификации множеств, где объекты определении, как множества многомерных наблюдений. Решение проблемы предложено проводить в пространстве параметров моделей объектов классификации построены на структуре которая выбрана из условия наилучшего значения критерия разрешения. Для поиска такой структуры разработан алгоритм метода группового учета аргументов, внешним критерием которого выбран критерий разрешения в трех формах: внутришньокласова дисперсия, межклассовая дисперсия и их отношения.

Ключевые слова: пространство параметров, метод группового учета аргументов, оптимальная структура, критерий разрешения.

Summary

Structural synthesis by criterion of sustainability in the problem of classification of objects-multions

Pavlov Vladimir, Candidate of Technical Sciences, Docent, Associate Professor of the Department of Biomedical Cybernetics National Technical University of Ukraine «Igor Sikorsky Kyiv Polytechnic Institute»

Trofymenko Olexandr Student of Biomedical Engineering Faculty of the National Technical University of Ukraine «Igor Sikorsky Kyiv Polytechnic Institute»

Hrishko Dmytro Student of Biomedical Engineering Faculty of the National Technical University of Ukraine «Igor Sikorsky Kyiv Polytechnic Institute»

The article deals with the problem of classification of sets, where objects are defined as sets of multidimensional observations. The solution of the problem is proposed to carry out in the space of parameters of models of objects of classification built on the structure which is selected from the condition of the best value of the criterion of separation. To find such a structure, an algorithm for the method of group consideration of arguments is developed, the external criterion of which is the criterion of separation in three forms: in-class variance, intercolumn variance and their relation.

Key words: space of parameters, method of group consideration of arguments, optimal structure, criterion of separation.

Основна частина

Постановка задачі. Важливу роль у функціональності медичних інформаційних систем відіграють роль підсистеми підтримки прийняття рішень. Математичною основою таких систем є найчастіше методи класифікації. Умови роботи системи в цих областях характеризуються високим ступенем невизначеності поведінки суб'єктів завдання і наявністю прихованих змінних, знання яких необхідно для прийняття управлінських рішень.

Відомою проблемою завдань розпізнавання образів є неоднозначність рішення при недостатній інформативності опису об'єкта класифікації. При цьому, як правило, ми маємо справу з одноразовими спостереженнями його характеристик (ознак). Якщо врахувати, що значення ознак об'єкта можуть змінюватися в залежності від значення деякого неконтрольованого параметра, або в цілому від стану середовища то проблема стає ще більш очевидною. Труднощі виникають через можливість часткового перетину областей значень ознак у вихідному просторі вимірюваних змінних для об'єктів з різних класів при різних станах середовища, наслідком чого стає неоднозначність результату класифікації.

Певним виходом з положення є опис об'єкта не одним, а множиною спостережень, здійснених при різних умовах. Такий комплекс спостережень дозволяє більш точно описати об'єкт, як деяку множину його станів у вихідному багатовимірному просторі. Наведемо постановку задачі класифікації об'єктів заданих множинами.

Нехай існує множина класів

при i?j… На практиці, у базах даних, класи задаються, як апроксимації природніх класів, де , де об'єкт Ск заданий, як множина спостережень мають вигляд вектору ознак у вихідному просторі: .

При вирішенні даної задачі постає дві проблеми. По-перше, досі розроблені підходи, як правило, передбачають однократне вимірювання ознак об'єкта, по-друге, ми допускаємо частковий перетин областей початкового простору ознак для об'єктів класифікації з різних класів.

Аналіз останніх досліджень та публікацій. Задача, що представлена вище має конструктивне вирішення у випадку незалежних ознак, що формують простір опису об'єктів [1]. В деяких часткових випадках для залежних ознак було запропоновано вирішення проблеми у роботах [2; 3]. Проте існує потреба для розробки загальних підходів вирішення задачі класифікації об'єктів заданих множинами спостережень.

Мета дослідження. Запропонувати підхід до вирішення задачі класифікації об'єктів, заданих множинами спостережень у випадку залежних ознак.

Вирішення задачі. В основу пропозиції вирішення поставленої задачі поставимо саме факт залежності ознак, що описують об'єкти класифікації. Запропонуємо будувати моделі для об'єктів класифікації, що відображають сенс цих залежностей та будемо вирішувати задачу класифікації у параметрів параметрів сконструйованих моделей.

Для цього поставимо задачу пошуку найкращої структури, параметри моделей об'єктів класифікації якої, будемо застосовувати для переводу задачі класифікації у простір параметрів. Будемо шукати такі структури серед підструктур деякого повного виразу найскладнішої структури

Структури, що генеруються для пошуку найкращої одної, мають вигляд і нарощуються послідовно все більшої складності, шляхом додавання на кожному й-тому етапі найкращої, з точки зору зовнішнього критерію (критерію роздільності), узагальненої змінної . Надалі пропонується класифікувати об'єкти, як точки в просторі параметрів цих моделей розмірністю М. Для пошуку оптимальної структури для відображення об'єктів-множин застосовано алгоритм, розроблений за принципами методу групового урахування аргументів МГУА [4, 5]. Такий підхід включає в себе дві важливі переваги:

моделювання регресій для відображення множин спостережень дозволяє відібрати найбільш інформативні ознаки з вихідного простору та відсіяти ті, що не впливають на класифікацію.

відображення об'єктів у багатовимірні точки простору параметрів моделей дозволяє застосувати для даної задачі стандартні алгоритми класифікації.

Узагальненні змінні (УЗ), що є складовою доданків, з яких будуються структури, представляють собою комбінації перемножень та кореневих розширень ознак вихідного простору. Кореневі розширення початкових ознак застосовуються для підвищення ефективності кінцевих структур оптимальної складності.

При нарощуванні структур, УЗ генеруються за допомогою мультиплікативного дерева. Гілки дерева відповідають створеним раніше УЗ. На кожному ряду алгоритму реалізується рух по вузлах дерева зліва направо і зверху вниз. Це дерево перебору дозволяє скорочувати час роботи алгоритму за рахунок відсікання непродуктивного нарощування складності структур, що не дають потрібний приріст в значенні зовнішнього критерію.

Параметри моделей, в які відображаються об'єкти-множини, вираховуються за методом найменших квадратів. Розроблений алгоритм МГУА реалізує перебір вкладеними структурами, таким чином, з метою прискорення розрахунку параметрів, застосована рекурентна версія МНК. Переваги у швидкості рекурентного обрахунку досягаються завдяки тому, що наступні значення вектору параметрів обраховується на основі розрахунків попередніх етапів.

В даній роботі для відбору оптимальної структури запропоновано використання зовнішнього критерію роздільності. Даний критерій ґрунтується на обрахуванні дисперсії векторів параметрів моделей, що представляють об'єкти-множини, та спрямований на «розділення» класів у просторі параметрів моделей. Для відбору структур, в якості зовнішнього критерію, застосовується три різновиди критерію роздільності: внутрішньокласовий, міжкласовий та комбінований.

Внутрішньокласовий критерій

Даний критерій відбирає структури, що найщільніше «групують» об'єкти у просторі параметрів своїх моделей до свого центру класу. Нижче наведена форма критерію.

де ri, гj, - вектори параметрів, К - кількість класів.

Міжкласовий критерій Даний критерій відбирає структури, що «віддаляють» центри класів об'єктів один від одного у просторі параметрів своїх моделей. Нижче наведена форма критерію.

де r - центри класів, - кількість класів

Комбінований критерій Даний критерій у пропонованій формі успадковує вимоги обох попередніх критеріїв.

Приклад розрахунку структури та результати класифікації стану серцево-судинної системи

Завдання було викликане реальною проблемою класифікації функціональних станів серцево-судинної системи на основі вимірів пульсу і тиску людини в різних обставинах. Наведено групу з 180 пацієнтів, кожен з яких відноситься до одного з п'яти функціональних класів станів серцево-судинної системи:

Артеріальна гіпертонія.

Ізольована систолічна гіпертонія.

Нормальне регулювання.

Серцева недостатність низького рівня.

Серцева недостатність високого рівня.

Для кожного пацієнта дано набори тривимірних замірів діастолічного тиску, систолічного тиску, частоти серцевих скорочень (DIA, SYS, HR) що вимірювались в кількості від 4 до 151 разів та отримані в різних умовах.

Метою задачі є побудова класифікаторів функціональних станів серцево-судинної системи.

За розробленим алгоритмом та за критерієм роздільності у формі (а саме міжкласової дисперсії було знайдено оптимальну структуру вигляду:

Для цієї структури було обраховано моделі кожного з 180 - пацієнтів, параметри яких стали новими ознаками в задачі класифікації функціональних станів ССС пацієнтів.

Наступним кроком на знайденому наборі ознак застосовано алгоритм класифікації «Випадковий Ліс» розроблений на основі дерев прийняття рішень [6]. Алгоритм було навчено на відображеннях об'єктів у новому просторі параметрів та перевірено на тестовій вибірці для отримання основних метрик класифікації. Тренувальна вибірка складає 135 об'єктів, тестова 45. Результати наведено у таблиці 1.

Висновки. Запропоновано підхід до розпізнавання об'єктів, заданих підмножинами рядків матриці об'єкт-властивості. Підхід передбачає переведення задачі розпізнавання у простір параметрів найкращої структури моделей об'єктів класифікації де вже кожний об'єкт представлений однією багатовимірною точкою в просторі параметрів своєї моделі.

Для знаходженні такої структури розроблено версію рекурентного багатоетапного алгоритму на основі МГУА. Для пошуку оптимальної структури моделей застосовано критерій роздільності, та розглянуто три його різновиди.

Розглянуто приклад для вирішення задачі класифікації функціональних станів ССС людини. Після переведення задачі у простір параметрів моделей об'єктів застосовано алгоритм класифікації «Випадковий ліс». Одержано високі показники якості класифікації.

Значення метрик по класах

Клас

Точність (%)

Повнота (%)

F1-міра (%)

1

97

76

85

2

61

93

74

3

82

73

77

4

99

62

86

5

99

81

90

Література

1. Fukunaga, K. (1990). Introduction to statistical pattern recognition (p. 491). Boston: Academic Press.

2. Jung, S., & Qiao, X. (2014). A statistical approach to set classification by feature selection with applications to classification of histopathology images. Biometrics, 70 (3). P. 536-545.

3. Войтикова М.В. Хурса Р.В. Линейная регрессия параметров артериального давления для определения риска развития вторичной гипотензии / Артериальная гипертензия. 6 (44). 2015. С. 38-42

4. Ивахненко А.Г. Помехоустойчивость моделирования [Текст] / А.Г. Ивахненко, В.С. Степашко // Киев: «Наук.думка». 1985. 216 с.

5. Ie. Nastenko, O. Konoval, O. Nosovets, V. Pavlov. Set Classification, pp. 44-83 - In: Techno-Social Systems for Modern Economical and Governmental Infrastructures (Advances in Finance, Accounting, and Economics).: IGI Global; 1 ed. (July 13, 2018), 351 p.

6. Tin Kam Ho. Random Decision Forests (2011). UDC 327.8

7. Hassan Zhiyan? MA, Political Science and International Relations, Social Sciences Institute Istanbul Aydin University

8. Katman Filiz Assistant Professor Dr. of the Department of Political Science and International Relations, Faculty of Economics and Administrative Sciences Istanbul Aydin University

Размещено на Allbest.ru

...

Подобные документы

  • Поняття множини. Операції над множинами. Об’єднання і переріз двох множин. Різниця і доповненя множин. Множини з відношеннями. Прямий (декартів) добуток множин. Бінарні відношення. Відношення еквівалентності. Відношення порядку. Предикати.

    курсовая работа [239,3 K], добавлен 10.06.2007

  • Аналіз математичних моделей технологічних параметрів та методів математичного моделювання. Задачі технологічної підготовки виробництва, що розв’язуються за допомогою математичного моделювання. Суть нечіткого методу групового врахування аргументів.

    курсовая работа [638,9 K], добавлен 18.07.2010

  • Означення теорії множин. Дії над множинами. Алгебра множин. Вектори і прямий добуток множин. Властивості відношень. Способи задання функції. Сукупність підстановок множини. Алгебраїчні операції та системи. Властивості рефлексивності та симетричності.

    конспект урока [263,1 K], добавлен 28.06.2012

  • Теорія множин як абстрактно-теоретична наука про множини довільної природи, розгляд головних проблем. Загальна характеристика теореми Кантора-Берштейна. Знайомство з властивостями множин потужності континууму. Аналіз діяльності математика К. Геделя.

    курсовая работа [325,6 K], добавлен 27.04.2016

  • Ознайомлення з історією виникнення теорії множин. Способи опису характеристичних властивостей множин. Декартовий добуток та бінарні відношення. Ін’єктивні, сюр’єктивні та бієктивні відображення. Поняття та властивості бінарної алгебраїчної операції.

    лекция [2,5 M], добавлен 28.10.2014

  • Прийняття рішень як основний компонент систем управління проектами. Методика розробки програми для знаходження множини оптимальних рішень за критерієм Байєса-Лапласа з формуванням матриці ймовірностей реалізації умов за експоненційним законом розподілу.

    курсовая работа [802,8 K], добавлен 08.10.2010

  • Множина як визначена сукупність елементів чи об’єктів. Списковий спосіб подання множини. Множина, кількість елементів якої скінченна (скінченна множина). Виведення декартового добутку з кожної заданої комбінації. Алгоритм рішення та реалізація програми.

    задача [112,0 K], добавлен 23.06.2010

  • Основні засади комбінаторики та теорії множин на основі аксіоматики Цермело-Френкеля і використання правила суми й добутку. Знаходження кусково-постійних конфігурацій множин засобами мови програмування IDE C++ Builder з допомогою вбудованого GUI.

    контрольная работа [539,5 K], добавлен 27.11.2010

  • Поняття сукупності предметів, об'єднаних за певною характеристичною ознакою. Основні загальноприйняті множини (геометрична фігура, ГМТ, область визначення та значень функції). Позначення множин, їх елементи, належність об'єктів та способи задання.

    презентация [517,1 K], добавлен 19.01.2011

  • Виключення третього як фундаментальний принцип логіки, істинність і хибність як логічні значення пропозиції. Таблиці істинності, поняття тавтології і еквівалентності. Властивості функцій множин і запереченням гіпотези Гольдбаха в термінах квантифікаторів.

    реферат [82,7 K], добавлен 03.03.2011

  • Перестановка як перевпорядкованість наборів елементів, об’єктів або функція, що задає таку перевпорядкованість. Всі можливі варіанти перестановок елементів множини за умови наявності трьох елементів за умови, що жоден елемент не залишається на місці.

    задача [222,1 K], добавлен 23.06.2010

  • Математичний аналіз властивостей геометричних об'єктів, відкритих і замкнених множин. Основні приклади, спеціальні метрики та топологія повних метричних просторів. Теорема Бера про вкладені кулі. Визначення границі числової послідовності та повноти.

    дипломная работа [2,3 M], добавлен 28.05.2019

  • Визначення та властивості упорядкованих множин, приклади діаграм. Дистрибутивні ґрати як один з основних алгебраїчних об'єктів. Поняття нижньої і точної грані, їх властивості та приклади, доказ лем. Застосування та суть топологічних стоунових просторів.

    курсовая работа [288,0 K], добавлен 24.03.2011

  • Метод відношення правдоподібності для великих вибірок як один із способів перевірки параметричних статистичних гіпотез. Теоретичне обґрунтування даної методики, визначення її основних недоліків та програмне тестування припущення розглянутого критерію.

    курсовая работа [1,2 M], добавлен 23.12.2010

  • Поняття та значення симплекс-методу як особливого методу розв'язання задачі лінійного програмування, в якому здійснюється скерований рух по опорних планах до знаходження оптимального рішення. Розв'язання задачі з використанням програми Simplex Win.

    лабораторная работа [264,1 K], добавлен 30.03.2015

  • Поняття диференціальних рівнянь. Задача Коші і крайова задача. Класифікація методів для задачі Коші. Похибка методу Ейлера. Модифікований метод Ейлера-Коші. Пошук рішення задачі однокроковим методом Ейлера. Порівняння чисельного рішення з точним рішенням.

    презентация [294,4 K], добавлен 06.02.2014

  • Побудова графічної схеми алгоритму та розмітка станів автомата, графа та кодування, структурної таблиці. Синтез комбінаційних схем для функцій збудження тригерів і вихідних сигналів. Представлення функції в канонічних формах алгебр Буля, їх мінімізація.

    курсовая работа [902,8 K], добавлен 27.08.2014

  • Класифікація методів для задачі Коші. Лінійні багатокрокові методи. Походження формул Адамса. Різницевий вигляд методу Адамса. Метод Рунге-Кутта четвертого порядку. Підвищення точності обчислень методу за рахунок подвійного обчислення значення функції.

    презентация [1,6 M], добавлен 06.02.2014

  • Розв'язання задач з теорії множин та математичної логіки. Визначення основних характеристик графа г (Х,W). Розклад функцій дискретного аргументу в ряди по базисним функціям. Побудова та доведення діаграми Ейлера-Вена. Побудова матриці інцидентності графа.

    курсовая работа [988,5 K], добавлен 20.04.2012

  • Визначення метричного простору. Границя функції у точці. Властивості границь дійсних функцій. Властивості компактних множин. Розв’язок системи лiнiйних рівнянь. Теорема про існування i єдність розв’язку диференціального рівняння. Нумерація формул.

    методичка [461,1 K], добавлен 25.04.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.