Дискриминантный анализ

Рассмотрение основ решения задач различия объектов наблюдения по определенным признакам. Описание целей дискриминантного метода. Разбиение объектов выборки методом k-средних на оптимальное количество классов. Прогноз при классификации новых объектов.

Рубрика Математика
Вид лабораторная работа
Язык русский
Дата добавления 08.02.2016
Размер файла 37,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Лабораторная работа

Дискриминантный анализ

Дискриминантный анализ - это раздел математической статистики, содержание которого является разработка методов решения задач различия (дискриминации) объектов наблюдения по определенным признакам. Цель дискриминантного анализа состоит в том, чтобы на основе некоторой "зависимой" переменной определить линейные классификационные модели, позволяющие "предсказать" поведение новых элементов на основании измерении ряда независимых переменных (факторов, показателей), которыми они характеризуются. Например, разбиение совокупности предприятий на несколько однородных групп по значениям каких-либо показателей производственно-хозяйственной деятельности.

Задачей дискриминантного анализа является разбиение совокупности объектов на однородные группы. Для решения данной задачи в дискриминантном анализе на первом этапе формируется обучающие выборки, на основе которых происходит окончательная классификация как объектов, не вошедших в обучающие выборки, так и любых других объектов, подлежащих разбиению.

Дискриминантный анализ используется для принятия решения о том, какие переменные дискриминируют (разделяют) объекты на две или более естественно возникающих групп.

Для проведения данного вида анализа была проведена классификация субъектов РФ по уровню инвестиционной привлекательности. Были представлены данные по 43 субъектам и указаны номера групп, к которым они были отнесены.

Первая группа регионов была определена "как регионы с очень высокой инвестиционной привлекательностью".

Вторая группа - "регионы с высокой инвестиционной привлекательностью".

Третья - "регионы со средней инвестиционной привлекательностью".

Четвёртая - "регионы с низкой инвестиционной привлекательностью".

Пятая - "регионы с крайне низкой инвестиционной привлекательностью"

Для проведения анализа были взяты следующие социально-экономические показатели:

х1 - выбросы в атмосферу загрязняющих веществ

х4 - индексы физического объёма инвестиций в основной капитал, в %

х7 - наличие собственных автомобилей на 1000 населения, шт. на конец года

Целью проводимого анализа является выявление классов таких неклассифицированных объектов, как Брянская область, Краснодарский край, Республика Марий-Эл и Хабаровский край.

После проведения разбиения объектов обучающей выборки методом k-средних на оптимальное количество классов, была получена следующая таблица:

Таблица 1

Structure Matrix

Function

1

2

3

ВЫБРОСЫ

0,79

0,20

0,58

ИНДЕКСЫ ИНВЕСТИЦИЙ

-0,26

0,81

0,53

АВТОМОБИЛИ

0,05

-0,49

0,87

На основании таблицы 1 была получена следующая функция:

y = 0,79х1 - 0,26х4 + 0,05х7.

Данная функция была выбрана в результате расчёта и анализ акоэффициентов дискриминантной функции. Значения этой функции должны как можно отчетливей разделить все 3 класса наблюдений. Качественной мерой такого наблюдения могут служить коэффициенты канонической корреляции (табл. 2).

Каноническая корреляция в дискриминантном анализе - степень связи между дискриминантными показателями и группами.

Таблица 2

Eigenvalues

Function

Eigenvalue

% of Variance

Cumulative %

Canonical Correlation

1,00

0,48

97,18

97,18

0,57

2,00

0,01

2,52

99,70

0,11

3,00

0,00

0,30

100,00

0,04

В данном случае по первой дискриминантной функции можно сказать, что связь имеется (0,57), по второй и третьей - такая связь неудовлетворительна (0,11 и 0,04 соответственно).

Значение, выводимое в столбце Eigenvalue (Собственное значение) этой таблицы, соответствует отношению суммы квадратов между группами к сумме квадратов внутри групп. Большие собственные значения, в данном случае в первой функции (0,48), указывают на удачно подобранную дискриминантную функцию.

Нельзя назвать удачным разбиение с помощью второй и третей функций. Первая дискриминантная функция хорошо разделяет объекты на три класса. Так, на первую функцию приходится 97,18% дисперсии, в то время как на вторую - 2,52%, а на третью - 0,3%.

Итак, на основании приведенных таблиц можно сделать вывод, о том, что результаты дискриминации по первой функции значимы и есть все основания использовать их в дальнейшем анализе.

Далее проанализируем отдельные коэффициенты. Согласно таблице стандартизированных какнонических коэффициентов дискриминантной функции (таблица 3), которая строится для нормированных исходных данных, получаем следующее выражение:

f1 = -0,42x1 - 0,54x2 + 1,12x3

дискриминантный наблюдение выборка

Нормированные коэффициенты указывают на то, что, если зафиксировать остальные характеристики, то увеличение на 1% одного фактора, приведет либо к уменьшению, либо к увеличению дискриминантного балла. Так, в рассматриваемом случае, можно говорить о том, что такие факторы, как выбросы в атмосферу загрязняющих веществ и индекс физического объёма инвестиций в основной капитал, могут отрицательно сказаться на инвестиционной привлекательности региона, в то время как наличие собственных автомобилей на 1000 населения, наоборот, может повысить инвестиционную привлекательность субъекта РФ.

Таблица 3

Standardized Canonical Discriminant Function Coefficients

Function

1

2

3

ВЫБРОСЫ

-0,41663447

-0,662638459

0,80040036

ИНДЕКСЫ ИНВЕСТИЦИЙ

-0,53399422

0,76625174

0,457514171

АВТОМОБИЛИ

1,116809384

0,294783415

0,101257746

Результатом данного анализа является распределение неклассифицированных регионов России на соответствующие классы, что представлено в таблице 4.

Таблица 4

К числу регионов с "крайне низкой инвестиционной привлекательностью" на ряду с Астраханской областью, Еврейской АО, Кабардино-Балкарской Республикой, Карачаево-Черкесской Республикой и Магаданской областью добавились Брянская область и Республика Марий-Эл. Это связано с низкими значениями совокупности определяющих трех факторов.

К субъектам РФ со средней инвестиционной привлекательностью добавился Хабаровский край, за счёт достаточно высокого показателя наличия собственных автомобилей, который уравновешивает фактор выбросов загрязняющих веществ.

Краснодарский край отнёсся к группе регионов с очень высокой инвестиционной привлекательностью, благодаря высоким значениям классификационных показателей.

Однако в дополнение ко всему необходимо выяснить, насколько данное разбиение удачно, и насколько хороший прогноз можно ожидать при классификации новых объектов. Эта информация представлена в таблице 5.

Таблица 5

Classification Results

Predicted Group Membership

Total

VAR00002

1

2

3

4

5

Original

Count

1

1

0

1

0

0

2

2

2

0

1

0

0

3

3

2

0

5

1

3

11

4

0

0

6

3

4

13

5

0

1

4

2

3

10

Ungrouped cases

1

0

1

0

2

4

%

1

50

0

50

0

0

100

2

66,667

0

33,333

0

0

100

3

18,182

0

45,455

9,091

27,27

100

4

0

0

46,154

23,08

30,77

100

5

0

10

40

20

30

100

Ungrouped cases

25

0

25

0

50

100

Cross-validated

Count

1

0

1

1

0

0

2

2

2

0

1

0

0

3

3

2

0

4

2

3

11

4

0

0

6

2

5

13

5

0

1

4

3

2

10

%

1

0

50

50

0

0

100

2

66,667

0

33,333

0

0

100

3

18,182

0

36,364

18,18

27,27

100

4

0

0

46,154

15,38

38,46

100

5

0

10

40

30

20

100

Анализируя таблицу, можно сделать вывод, что все группы были идентифицированы правильно, т.е. точность прогноза по ним составила 100%.

Размещено на Allbest.ru

...

Подобные документы

  • Методика проведения группировки объектов на основе алгоритма K-средних, используя рандомизацию исходных данных (объединенной центрированной матрицы наблюдений). Оценка требуемого числа итераций. Расчет расстояния от объектов до новых центров кластеров.

    практическая работа [195,6 K], добавлен 20.09.2011

  • Сущность комбинаторики как области математики, исследующей количество и разновидности комбинаций заданных объектов в определенных условиях. Особенности и понятие комбинаторной задачи. Примеры составления комбинаторных задач и способы их решения.

    презентация [15,3 M], добавлен 19.02.2012

  • Геометрическая формулировка задачи распознавания: построение поверхности, которая разделяет множества, соответствующие в пространстве признакам различных классов объектов. Основные понятия и определения. Непараметрические парзеновские оценки плотностей.

    курсовая работа [272,7 K], добавлен 10.04.2011

  • Составление четкого алгоритма, следуя которому, можно решить большое количество задач на нахождение угла между прямыми, заданными точками на ребрах многогранника. Условия задач по теме и примеры их решения. Упражнения для решения подобного рода задач.

    практическая работа [1,5 M], добавлен 15.12.2013

  • Показатель надежности как числовая характеристика, с помощью которой можно количественно оценить надежность различных объектов техносферы. Общая характеристика свойств параметра потока отказов. Рассмотрение особенностей признака распределения Пуассона.

    презентация [97,7 K], добавлен 03.01.2014

  • Методика решения задач высшей математики с помощью теории графов, ее сущность и порядок разрешения. Основная идея метода ветвей и границ, ее практическое применение к задаче. Разбиение множества маршрутов на подмножества и его графическое представление.

    задача [53,0 K], добавлен 24.07.2009

  • Матричный метод решения систем линейных алгебраических уравнений с ненулевым определителем. Примеры вычисления определителя матрицы. Блок-схема программы, описание объектов. Графический интерфейс, представляющий собой стандартный набор компонентов Delphi.

    курсовая работа [1,4 M], добавлен 29.06.2014

  • Определение динамических свойств объектов с помощью дифференциальных уравнений для сравнительно простых объектов. Выражение входной и выходной величины элемента в долях, введение безразмерных координат. График кривой разгона, коэффициент усиления.

    реферат [12,5 K], добавлен 16.05.2010

  • Основные свойства геологических объектов как пространственных переменных. Виды математических моделей геологических объектов. Вариограмма и ее аппроксимации. Вероятностные модели геологических полей. Влияние на вариограмму геометрической базы измерений.

    презентация [345,8 K], добавлен 17.07.2014

  • Характеристика способов решения систем линейных алгебраических уравнений (СЛАУ). Описание проведения вычислений на компьютере методом Гаусса, методом квадратного корня, LU–методом. Реализация метода вращений средствами системы программирования Delphi.

    курсовая работа [118,4 K], добавлен 04.05.2014

  • Понятие текстовой задачи, ее роль в процессе обучения математике. Изучение основных способов решения текстовых задач, видов их анализа. Применение метода моделирования в обучении решению данных заданий. Описание опыта работы учителя начальных классов.

    дипломная работа [69,6 K], добавлен 13.01.2015

  • Компьютерное моделирование в базовом курсе информатики. Роль компьютерного моделирования в процессе обучения. Методические рекомендации курса "Математические основы моделирования 3D объектов" базового курса "компьютерное моделирование".

    дипломная работа [284,6 K], добавлен 07.07.2003

  • Статистический подход к измерению правовой информации. Графический метод решения задач линейного программирования. Методика решения задач линейного программирования графическим методом. Количество информации как мера неопределенности состояния системы.

    контрольная работа [79,4 K], добавлен 04.06.2010

  • Линейное программирование как наиболее разработанный и широко применяемый раздел математического программирования. Понятие и содержание симплекс-метода, особенности и сферы его применения, порядок и анализ решения линейных уравнений данным методом.

    курсовая работа [197,1 K], добавлен 09.04.2013

  • Рассмотрение общих сведений обратных задач математической физики. Ознакомление с методами решения граничных обратных задач уравнений параболического типа. Описание численного решения данных задач для линейно упруго-пластического режима фильтрации.

    диссертация [2,8 M], добавлен 19.06.2015

  • Анализ особенностей разработки вычислительной программы. Общая характеристика метода простых итераций. Знакомство с основными способами решения нелинейного алгебраического уравнения. Рассмотрение этапов решения уравнения методом половинного деления.

    лабораторная работа [463,7 K], добавлен 28.06.2013

  • Технические системы, их разновидности, характеристика. Система электроснабжения, ее свойства и надежность. Определение показателей оценки надежности "готовности". Составление модели структуры сети, анализ надежности логико-вероятным методом, ее значение.

    курсовая работа [102,1 K], добавлен 05.03.2009

  • Обыкновенные и модифицированные жордановы исключения. Последовательность решения задач линейного программирования симплекс-методом применительно к задаче максимизации: составлении опорного плана решения, различные преобразования в симплекс-таблице.

    курсовая работа [37,2 K], добавлен 01.05.2011

  • Поиск корней нелинейных САУ с помощью метода продолжения решения по параметру. Математическое описание метода. Программное обеспечение для построения графиков сходимости метода. Требования к программному обеспечению и описание логической структуры.

    курсовая работа [365,5 K], добавлен 27.04.2011

  • Анализ особенностей методической деятельности учителя начальных классов при обучении учащихся решению задач с пропорциональной зависимостью. Роль задач в формировании учебной деятельности младших школьников. Виды задач в начальном курсе математики.

    курсовая работа [36,0 K], добавлен 07.01.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.