Сравнительный анализ методов выбора информативных признаков

Сравнение трех методов организации перебора вариантов при выборе информативного подмножества признаков в задаче распознавания образов. Принципы и условия использования алгоритма FRiS-Stolp. Критерии информативности и пригодности выбираемой подсистемы.

Рубрика Математика
Вид статья
Язык русский
Дата добавления 28.10.2018
Размер файла 212,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Размещено на http://www.allbest.ru/

Сравнительный анализ методов выбора информативных признаков

В последние годы проблема выбора информативного подмножества признаков и оценки его пригодности для решения задач распознавания образов сильно возросла. Все чаще стали встречаться реальные задачи распознавания образов, например, в генетике, в которых небольшое число (десятки) объектов обучающей выборки описывается очень большим числом характеристик (десятками тысяч).

При решении этой проблемы возникают вопросы: как организовать перебор вариантов признаковых систем, и по каким критериям оценивать информативность и пригодность выбранной подсистемы признаков. Эксперименты, о которых говорится в этой работе, были поставлены для сравнительного анализа применения трех различных способов перебора вариантов признаковых систем в задачах распознавания. Тип решающих правил и критерии выбора были для всех способов перебора одинаковыми.

Критерии информативности и пригодности

В данной статье в качестве оценки информативности и пригодности во всех способах выбора подсистемы признаков используются критерии, в основе которых лежит функция конкурентного сходства , где ri - минимальное расстояние от распознаваемого объекта до эталона i-го образа [3].

Для оценки информативности используется критерий . Здесь , где Fsi - сумма значений FRiS - функции для всех Moi объектов обучающей выборки i - го образа, Ki - количество столпов в i - ом образе, i = 1, 2.

Для оценки пригодности используется функция , где Fso, Fsk - среднее значение FRiS - функции на обучении и на контроле соответственно.

Алгоритм AdDel

Алгоритм AdDel предназначен для сокращения перебора вариантов признаковых подпространств из большого исходного пространства признаков. Он состоит из последовательно сменяющих друг друга процедур добавления наиболее информативных элементов и исключения наименее информативных [1]. В данной статье этот алгоритм участвует в качестве первого способа сокращения перебора.

Краткое описание алгоритма

1. Свою работу алгоритм начинает с одномерных пространств. В выбранных признаковых подпространствах алгоритм FRiS-Stolp проводит обучение, т.е. находит эталоны (столпы). Вычисляются значения критерия . Величина Krit служит оценкой информативности системы. Выбирается то признаковое пространство, которому соответствует максимальное значение Krit.

2. Затем к уже выбранному признаковому пространству добавляются признаки аналогично пункту 1 до тех пор, пока не будет получено признаковое пространство размерности n1 < N.

3. После того как мы добавили n1 признак, исключим из системы n2 (n2<n1) признаков. Признак исключается из системы, если значение Krit в признаковом пространстве без этого признака дает наибольшее значение по сравнению с остальными.

4. Особенность алгоритма AdDel состоит в том, что в процессе увеличения размерности n выбираемых подпространств качество Krit обучения растет, затем рост прекращается и начинается его уменьшение. Точка перегиба функции Krit = f(n) указывает на наиболее предпочтительный вариант решения задачи. Поэтому описанный выше процесс продолжается до тех пор, пока не будет выбрана наиболее информативная система признаков. Используем n выбранных в этой точке признаков. Они обеспечивают максимальное качество обучения.

Метод главных компонент

МГК также используется для сокращения признакового пространства.

Пусть имеется матрица переменных X размерностью (MЧN), где M - число объектов (строк), а N - это число переменных (столбцов), количество которых, как правило, велико и может быть больше количества объектов (N>M). В методе главных компонент используются новые, формальные переменные ta (a=1,… Q), являющиеся линейной комбинацией исходных переменных xj (j=1,…, N)

информативный подмножество алгоритм

С помощью этих новых переменных матрица X разлагается в произведение двух матриц T и P.

Матрица T называется матрицей счетов (scores). Ее размерность (MЧQ).

Матрица P называется матрицей нагрузок (loadings). Ее размерность (QЧN). Нагрузки - это ортогональные нормированные вектора, т.е. .

Матрица E называется матрицей остатков. Её размерность (MЧN).

Схема разложения по главным компонентам

Новые переменные ta называются главными компонентами (Principal Components), поэтому и сам метод называется методом главных компонент или Principal Component Analysis - PCA. Число столбцов - ta в матрице T, и pa в матрице P - равно Q, которое называется числом главных компонент. Эта величина заведомо меньше числа переменных N и числа объектов M.

Второй способ заключается в использовании МГК, в котором в качестве информативного признакового подпространства выбираются первые m главных компонент.

Комбинированный способ

Этот способ состоит из комбинации выше указанных способов, алгоритма AdDel и МГК - третий способ. Сначала их первичных признаков с помощью МГК формируются вторичные признаки - главные компоненты. А затем алгритм AdDel выбирает из них подмножество наиболее информативных компонент.

Результаты эксперимента

В работе использовались реальные данные: рентгеновские спектры микрочастиц разных типов материалов. Решалась задача распознавания двух образов.

Было задано признаковое пространство X размерности N = 982, количество объектов на обучении и контроле Mo = Mk = 200 (по 100 объектов в каждый образ).

Для всех способов было проведено по 10 экспериментов. Каждый эксперимент отличался случайным делением выборки на обучающую и контрольную.

По результатам экспериментов были сформированы диаграммы (для каждого способа результаты были усреднены по количеству экспериментов), в которых отображаются значения различных параметров в зависимости от способа выбора информативного признакового подпространства (см. рис 1 -5).

Рис. 1. Среднее значение FRiS - функции на контрольной выборке

Рис. 2. Среднее значение FRiS-функции на обучающей выборке

Рис. 3. Результаты распознавания контрольных объектов

Рис. 4. Количество потребовавшихся столпов

Рис. 5. Оценка случайности выбранных признаков

В результате проделанной работы видим, что при использовании первого способа выбора признакового пространства, полученные значения качества обучения, количества столпов, количества ошибок, качества распознавания контрольной выборки и оценки пригодности лучше, чем в остальных способах. Результаты, полученные при использовании способов основанных на МГК, говорят о том, что хотя использование МГК сокращает время работы системы, но уступает первому способу по всем параметрам.

Литература

информативный подмножество алгоритм

[1] Н.Г. Загоруйко: Прикладные методы анализа данных и знаний.: Изд. ИМ СО РАН, Новосибирск, 1999, 270 с.

[2] Айвазян С.А., Мхитарян В.С.: Теория вероятностей и прикладная статистика т. 1: М.: ЮНИТИ-ДАНА, 2001, 656 с.

[3] Борисова И., Дюбанов В., Загоруйко Н., Кутненко О.: Использование FRiS-функции для построения решающего правила и выбора признаков (задача DX).: Труды конференции ЗОНТ -07

Размещено на Allbest.ru

...

Подобные документы

  • Особенности решения линейных и нелинейных уравнений. Характеристика и практическое применение и различных методов при решении уравнений. Сущность многочлена Лагранжа и обратного интерполирования. Сравнение численного дифференцирования и интегрирования.

    курсовая работа [799,6 K], добавлен 20.01.2010

  • Изучение методов одномерной оптимизации и сравнение эффективности их применения для конкретных целевых функций. Нахождение минимума функции 1/|x-3|3 методами перебора, поразрядного поиска, дихотомии, золотого сечения, средней точки, хорд и Ньютона.

    курсовая работа [761,8 K], добавлен 25.12.2015

  • Определение условий сходимости положительного ряда и описание свойств гармонических рядов Дирихле. Изучение теорем сравнения рядов и описание схемы Куммера для вывода из нее признаков сравнения ряда. Вывод признаков сравнения Даламбера, Раабе и Бертрана.

    курсовая работа [263,6 K], добавлен 14.06.2015

  • Методы решения одного нелинейного уравнения: половинного деления, простой итерации, Ньютона, секущих. Код программы решения перечисленных методов на языке программирования Microsoft Visual C++ 6.0. Применение методов к конкретной задаче и анализ решений.

    реферат [28,4 K], добавлен 24.11.2009

  • Оптимизация как раздел математики, ее определение, сущность, цели, формулировка и особенности постановки задач. Общая характеристика различных методов математической оптимизации функции. Листинг программ основных методов решения задач оптимизации функции.

    курсовая работа [414,1 K], добавлен 20.01.2010

  • Геометрическая формулировка задачи распознавания: построение поверхности, которая разделяет множества, соответствующие в пространстве признакам различных классов объектов. Основные понятия и определения. Непараметрические парзеновские оценки плотностей.

    курсовая работа [272,7 K], добавлен 10.04.2011

  • Рассмотрение различных примеров комбинаторных задач в математике. Описание способов перебора возможных вариантов. Использование комбинаторного правила умножения. Составление дерева вариантов. Перестановки, сочетания, размещения как простейшие комбинации.

    презентация [291,3 K], добавлен 17.10.2015

  • Способы решения задач дискретной математики. Расчет кратчайшего пути между парами всех вершин в ориентированном и неориентированном графах с помощью использования алгоритма Флойда. Анализ задачи и методов ее решения. Разработка и характеристика программы.

    курсовая работа [951,4 K], добавлен 22.01.2014

  • Сравнительный анализ численных методов решения систем линейных алгебраических уравнений. Вычисление определителей и обратных матриц. Реализация методов в виде машинных программ на языке высокого уровня и решение задач на ЭВМ. Модификации метода Гаусса.

    реферат [85,2 K], добавлен 04.03.2011

  • Характеристика методов численного интегрирования, квадратурные формулы, автоматический выбор шага интегрирования. Сравнительный анализ численных методов интегрирования средствами MathCAD, а также с использованием алгоритмических языков программирования.

    контрольная работа [50,8 K], добавлен 06.03.2011

  • Методика решения задач высшей математики с помощью теории графов, ее сущность и порядок разрешения. Основная идея метода ветвей и границ, ее практическое применение к задаче. Разбиение множества маршрутов на подмножества и его графическое представление.

    задача [53,0 K], добавлен 24.07.2009

  • Обоснование алгоритма уточнения решения. Свойства последовательности стохастических матриц, которые гарантируют существование предельного конуса. Условия, при которых уточнённое по последовательности конусов оптимальное решение является единственным.

    дипломная работа [117,9 K], добавлен 14.01.2011

  • Построение приближающей функции, используя исходные данные, с помощью методов Лагранжа, Ньютона и Эйткена (простая и упрощенная форма реализации). Алгоритм вычисления интерполяционного многочлена. Сравнение результатов реализации методов в среде Mathcad.

    курсовая работа [299,3 K], добавлен 30.04.2011

  • Рассмотрение особенностей сравнения рядов. Характеристика признаков сходимости Даламбера. Критерий Коши как ряд утверждений в математическом анализе. Анализ геометрической интерпретации интегрального признака. Способы определения сумы числового ряда.

    контрольная работа [214,6 K], добавлен 01.03.2013

  • Понятие и отличительные особенности численных методов решения, условия и возможности их применения. Оптимизация функции одной переменной, используемые методы и закономерности их комбинации, сравнение эффективности. Сущность и разновидности интерполяции.

    реферат [273,3 K], добавлен 29.06.2015

  • Суть задачи коммивояжера, ее применение. Общая характеристика методов ее решения: метод полного перебора, "жадные" методы, генетические алгоритмы и их обобщения. Особенности метода ветвей и границ и определение наиболее оптимального решения задачи.

    курсовая работа [393,2 K], добавлен 18.06.2011

  • Особенности построения вектора А, удовлетворяющего заданному множеству условий и ограничений, если даны величины упорядоченных множеств. Характеристика алгоритма перебора вектора А и оценка его временной сложности. Анализ графического изображения вектора.

    курсовая работа [164,1 K], добавлен 11.03.2010

  • Применение интервальных графов. Алгоритмы распознавания интервальных графов: поиск в ширину, поиск в ширину с дополнительной сортировкой, лексикографический поиск в ширину, алгоритм "трех махов". Программа задания единичного интервального графа.

    курсовая работа [1,5 M], добавлен 10.02.2017

  • Формирование функции Лагранжа, условия Куна и Таккера. Численные методы оптимизации и блок-схемы. Применение методов штрафных функций, внешней точки, покоординатного спуска, сопряженных градиентов для сведения задач условной оптимизации к безусловной.

    курсовая работа [1,8 M], добавлен 27.11.2012

  • Методы последовательного поиска: деление отрезка пополам, золотого сечения, Фибоначчи. Механизмы аппроксимации, условия и особенности их применения. Методы с использованием информации о производной функции: средней точки, Ньютона, секущих, кубической.

    курсовая работа [361,5 K], добавлен 10.06.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.