Основные статистические характеристики распределения случайных чисел

Гипотеза о подчинении равномерному закону ста одноразрядных чисел. Вычисление коэффициентов линейной зависимости и множественной детерминации. Отношение среднеквадратической ошибки к среднему значению. Среднеквадратическая ошибка прогнозирования.

Рубрика Математика
Вид курсовая работа
Язык русский
Дата добавления 22.11.2021
Размер файла 171,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Пример задания №1

Задание 1.1

Проверить гипотезу о подчинении равномерному закону десяти чисел двух левых столбцов таблицы 1.1 по критерию согласия (КС) Колмогорова.

Таблица 1.1

80

25

12

29

89

84

98

46

42

62

69

43

75

41

47

16

18

80

16

38

41

86

60

75

29

85

48

71

06

68

80

67

93

63

39

75

53

71

35

88

24

48

13

86

53

95

24

77

37

61

Запишем случайные числа по возрастанию: 24, 25, 41, 43, 48, 67, 69, 80, 80, 86.

Построим эмпирическую функцию распределения.

Вычислим основные статистические характеристики распределения случайных чисел.

1. Оценка первого начального момента вычисляется по формуле:

=(24+25+41+43+48+67+69+80+80+86)/10=56,3.

Оценка второго начального момента вычисляется по формуле:

=(242+252+· · · +862)/10=3648,1.

Оценка среднего квадратического отклонения (стандартного отклонения) вычисляется по формуле:

= =21,873.

=56,3-1,732·21,873=18,416.

=56,3+1,732·21,873=94,184.

По двум точкам с координатами (18,4;0) и (94,2;1) на рис.1 построим прямую, являющуюся гипотетической функцией распределения. Ввиду некоторой неточности рис.1.1 точно определить максимальную разницу между эмпирической и гипотетической функциями распределения не представляется возможным. Поэтому вычислим значения гипотетической функции распределения для всех аргументов по формуле:

Результаты вычислений представим в таблице 1.2.

Таблица 1. 2

i

xi

F*(xi)

F(xi)

F*(xi)- F(xi)

1

24

0,1

0,074

0,026

2

25

0,2

0,087

0,113

3

41

0,3

0,298

0,002

4

43

0,4

0,324

0,076

5

48

0,5

0,390

0,110

6

67

0,6

0,641

- 0,041

7

69

0,7

0,668

0,032

8

80

0,8

0,813

- 0,013

9

80

0,9

0,813

0,087

10

86

1,0

0,892

0,108

По результатам таблицы 2 определяем максимальную разницу в функциях распределения, равную 0,113, и вычислим КС Колмогорова.

По статистической таблице 1.3 находим коэффициент доверия высказанной гипотезе рк=0,9985 и так как он превышает рекомендуемое значение 0,2, то делаем заключение что. имеющиеся статистические данные не противоречат гипотезе об их подчинении равномерному закону по КС Колмогорова. В таблице 1.3 жирным цветом выделены значения К, при которых гипотеза о подчинении исходных случайных чисел равномерному закону не отвергается.

Таблица 1.3

рк

1.0000

1.0000

1.0000

1.0000

0.9970

0.9640

0.8640

К

0.0000

0.1000

0.2000

0.3000

0.4000

0.5000

0.6000

рк

0.7110

0.5440

0.3930

0.2700

0.2000

0.1120

0.0680

К

0.7000

0.8000

0.9000

1.0000

1.0500

1.2000

1.3000

рк

0.0400

0.0220

0.0121

0.0060

0.0030

0.0020

0.0010

К

1.4000

1.5000

1.6000

1.7000

1.8000

1.9000

2.0000

Задание 1.2

Проверить гипотезу о подчинении равномерному закону ста одноразрядных чисел всех столбцов таблицы 1.1 по критерию согласия ч2.

Подсчитаем количество символов каждого типа и построим гистограмму.

Вычислим значение критерия согласия Пирсона (КС 2 ) и по статистическим таблицам определим коэффициент доверия, выдвинутой гипотезе:

2 ={(5-10)2+(10-10)2+(8-10)2+(10-10)2+(11-10)2+(9-10)2+(13-10)2+(10-10)2+ +(16-10)2+(8-10)2}/10={25+0+4+0+1+1+9+0+36+4}/10=8,0 при R=7.

По статистической таблице 2.1 находим коэффициент доверия Рр=0,40. Ввиду того, что вычисленное значение КС укладывается в рекомендуемый десяти процентный доверительный интервал делаем заключение что имеющиеся статистические данные не противоречат гипотезе о их подчинении равномерному закону. В таблице 2.1 жирным цветом выделены значения, 2 при которых гипотеза о подчинении исходных случайных чисел равномерному закону не отвергается, т.е. соблюдается условие: 0.1?рр?0.9.

Таблица 2.1

рр

0.990

0.980

0.950

0.900

0.800

2

1.239

1.501

2.170

2.830

3.820

рр

0.700

0.500

0.300

0.200

0.100

2

4.670

6.350

8.380

9.800

12.02

рр

0.050

0.020

0.010

0.001

0.000

2

14.07

16.62

18.48

24.30

?

Задание 1.3

Провести аппроксимацию пяти пар случайных чисел, представленных в таблице 3.1, линейной зависимостью .

Таблица 3.1

х

у

1

1

2

2

3

4

4

7

5

9

Экспериментальные точки, координаты которых представлены в таблице 3.1, представим в системе координат на рис.3.1.

Для проведения аппроксимации проведём предварительные вычисления.

Вычислим коэффициент линейной корреляции.

По статистическим таблицам найдём критическое значение критерия Стьюдента tкрит=3,1814 при n-2=5-2=3 степенях свободы и рекомендуемому уровню значимости б=0,05.

Ввиду того, что делаем заключение, что корреляционная связь между переменными х и у является существенной и она может быть линейной.

Вычислим коэффициенты линейной зависимости по формулам:

Таким образом, получили линейное уравнение регрессии:

По уравнению регрессии по двум точкам построим функцию в системе координат на рис.3.1 и вычислим значения функции по экспериментальным значениям аргумента х и разницу между экспериментальными и вычисленными значениями функции, которые представим в таблице 3.2.

Таблица 3.2

хi

yi

1

1

0,4

0,6

0,36

2

2

2.5

-0,5

0,25

3

4

4,6

-0,6

0,36

4

7

6,7

0,3

0,09

5

9

8,8

0,2

0,04

Вычислим стандартную ошибку и отношение стандартной ошибки к среднему значению:

По отношению стандартной ошибки к среднему значению получен удовлетворительный результат, так как не превышено значение в 0.05.

Проведём оценку уровня значимости коэффициентов уравнения регрессии по критерию Стьюдента:

где

По статистической таблице находим критическое значение критерия Стьюдента tкрит=3,183 для3 степеней свободы и рекомендуемого уровня значимости =0,05. Отметим, что по уровню значимости для коэффици-ентов и получен удовлетворительный результат, так как они по асолютному значению превышают критическое значение.

Проведём оценку качества полученного уравнения регрессии по показателям, вычисляемым на основе дисперсионного анализа:

Проверка:

Результат проверки - положительный, что свидетельствует о корректности проведённых вычислений.

Вычислим критерий Фишера:

при двух степенях свободы:

По статистическим таблицам находим критическое значение критерия

Фишера для рекомендуемого уровня значимости б=0.05 Так как вычисленное значение критерия Фишера превосходит критическое, то будем считать уровень значимости по критерию Фишера удовлетворительным.

Вычислим коэффициент множественной детерминации:

для двух степеней свободы

По статистической таблице для уровня значимости 0,05 находим критическое значение коэффициента множественной детерминации:

Так как вычисленное значение коэффициента множественной детерминации превышает критическое значениe, то полученный результат по данному показателю будем считать удовлетворительным.

Таким образом, все полученные расчётные показатели по оценке качества уравнения регрессии являются удовлетворительными, поэтому будем считать результаты аппроксимации приемлемыми.

Задание 1.4

Пример 1.4.1

Провести оптимизацию графическим методом.

Размещено на http://www.allbest.ru/

Приравняем целевую функцию нулю, неравенства заменим равенствами и затем представим их функциями х2 от х1.

х2=-2х1;

х2= 1,5+0,5х1;

х2=13,5-1,5х1;

х2=-4+х1

и представим в системе координат на рис.4.1.

Область допустимых решений (ОДР) ограничивается осью координат х1, ограничением (2) и ограничением (3). Мысленно направим целевую функцию к ОДР, тогда первая точка их пересечения будет являться точкой минимума (4;0) а последняя - максимума (9;0). В точке минимума z =8,в точке максимума z=18. Проверим выполнение всех ограничений в найденных точках.

Для точки минимума

-4+0<3 выполняется;

3·4+0<27 выполняется;

4-0=4 выполняется как равенство.

Для точки максимума

-9+0<3 выполняется;

3·9+0=27 выполняется как равенство;

9-0>4 выполняется.

Таким образом, в точке минимума значение целевой функции меньше чем в точке максимума и все ограничения выполняются поэтому решение будем считать корректным.

Отметим, что если какая-то проверяемая точка превращает неравенство в равенство, то данная точка принадлежит прямой линии, представляющей данное неравенство. В процессе оптимизации может оказаться, что какая-то точка лежит на пересечении двух, или большего количества прямых, то её координаты можно найти решением системы уравнений.

Пример 1.4.2

Если в условиях примера 1.4.1 изменить третье неравенство на х12?4 то постановка задачи примет следующий вид:

Размещено на http://www.allbest.ru/

В этом случае произойдёт перемещение области допустимых решений как это показано на рис.4.2.

Область допустимых решений (ОДР) ограничивается осью координат х1 и тремя ограничениями (1), (2) и (3). Мысленно направим целевую функцию к ОДР, тогда первая точка их пересечения будет являться точкой минимума (0;0) а последняя - точкой максимума (7;3). В точке минимума z =0,в точке максимума z=17. Проверим выполнение всех ограничений в найденных точках.

Для точки минимума

-0+0<3 выполняется;

0+0<27 выполняется;

0-0<4 выполняется.

Для точки максимума

-7+2·3<3 выполняется;

7+2·3=27 выполняется как равенство;

7-3=4 выполняется как равенство.

Таким образом, в точке минимума значение целевой функции меньше чем в точке максимума и все ограничения выполняются поэтому решение будем считать корректным.

Отметим, что если какая-то проверяемая точка превращает неравенство в равенство, то данная точка принадлежит прямой линии, представляющей данное неравенство. В процессе оптимизации может оказаться, что какая-то точка лежит на пересечении двух, или большего количества прямых, то её координаты можно найти решением системы уравнений. В нашем случае точка максимума лежит на пересечении ограничений (2) и (3). Покажем, что в данном случае её координаты можно найти решением уравнения

х2=13,5-1,5·х1=-4+х1;

откуда 2,5·х1=17,5; х1=17,5/2,5=7;

х2=-4+7=3.

Пример 1.4.3

В условиях примера 1.4.2 произведём преобразование, изменив ограничение (2). Тогда постановка задачи оптимизации примет следующий вид:

Размещено на http://www.allbest.ru/

В этом случае произойдёт перемещение области допустимых решений как это показано на рис.4.3.

Целевая функция

Область допустимых решений (ОДР) определяется тремя ограничениями (1), (2) и (3). Мысленно направим целевую функцию к ОДР, тогда первая точка их пересечения будет являться точкой минимума (6;4,5) а последняя - точкой максимума (11;7). В точке минимума z =16,5,в точке максимума z=28. Проверим выполнение всех ограничений в найденных точках.

Для точки минимума

-6+2·45=3 выполняется как равенство;

3·6+2·4,5=27 выполняется как равенство;

6-4.5<4 выполняется.

Для точки максимума

-11+2·7=3 выполняется как равенство;

3·11+2·7>27 выполняется;

11-7=4 выполняется как равенство.

Таким образом, в точке минимума значение целевой функции меньше чем в точке максимума и все ограничения выполняются поэтому решение будем считать корректным.

Пример 1.4.4

Изменим постановку задачи примера 1.4.1, изменив ограничения (1) и (3).

Размещено на http://www.allbest.ru/

В этом случае произойдёт перемещение области допустимых решений как это показано на рис.4.4.

Область допустимых решений (ОДР) ограничивается осью координат у1, ограничением (1) и ограничением (2). Мысленно направим целевую функцию к ОДР, тогда первая точка их пересечения будет являться точкой минимума (0;1,5) а последняя - точкой максимума (6;4,5). В точке минимума z =3,в точке максимума z=16,5. Проверим выполнение всех ограничений в найденных точках.

Для точки минимума

0+2·1,5=3 выполняется как равенство;

3·0+2·1,5<27 выполняется;

0-1,5<4 выполняется.

Для точки максимума

-6+2·4,5=3 выполняется как равенство;

3·6+2·4,5=27 выполняется как равенство;

6-4,5<4 выполняется.

Таким образом, в точке минимума значение целевой функции меньше чем в точке максимума и все ограничения выполняются поэтому решение будем считать корректным.

Отметим, что решение четырёх примеров позволило найти минимумы и максимумы целевой функции в четырёх различных ОДР, определяемых задаваемыми ограничениями. В остальных областях координатного пространства могут быть найдены только точки минимумов целевой функции, то есть решение будет неполным, ввиду того что области для поиска точек максимума являются расходящимися.

Задание 1.5

Пример 1.5.1

Евклидово расстояние. Наиболее близкий сосед

Требуется разделить шесть объектов на два кластера. Объекты -

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для шести вариантов информационной системы представлены в таблице 5.1.1.

Таблица 5.1.1

1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4

По таблице 5.1.1 построен график, представленный на рис.5.1.1.

По формуле Евклида вычислены расстояния между объектами. Приведём два примера вычисления расстояний между 1 и 5 объектами и 2 и 6 объектами.

Процесс вычисления расстояния между 1 и 5 объектами поясняется на рис. 5.1.2; между 2 и 6 объектами на рис. 5.1.3.

Аналогично по формуле Евклида вычислены расстояния между всеми остальными объектами по двум признакам. Результаты вычислений представлены в виде таблицы 5.1.2

Таблица 5.1.2

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Жирным шрифтом в таблице 5.1.2 выделено наименьшее расстояние между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «ближайшего соседа». На рис. 5.1.4 поясним этот принцип для определения расстояния между 1 объектом и формируемой совокупностью, состоящей из 4 и 5 объектов.

Аналогично предыдущему определены расстояния других объектов с

формируемой совокупностью, состоящей из 4 и 5 объектов, и составлена таблица расстояний, представленная в таблице 5.1.3.

Таблица 5.1.3

1

2

3

4,5

6

1

0

2,83

3,16

10,19

13,60

2

0

3,16

8,94

12,53

3

0

7,07

10,44

4,5

0

2,24

6

0

Жирным шрифтом в таблице 5.1.3 выделено наименьшее расстояние между объектом 4,5 и шестым объектом. Их объединяем в один объект 4,5,6. Расстояния между этим укрупнённым и исходными объектами определены по правилу «ближайшего соседа» и представлены в таблице 5.1.4.

Таблица 5.1.4

1

2

3

4,5,6

1

0

2,83

3,16

10,19

2

0

3,16

8,94

3

0

7,07

4,5,6

0

Жирным шрифтом в таблице 5.1.4 выделено наименьшее расстояние

между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и другими объектами определены по правилу «ближайшего соседа» и представлены в таблице 5.1.5

Таблица 5.1.5

1,2

3

4,5,6

1,2

0

3,16

8,94

3

0

7,07

4,5,6

0

Жирным шрифтом в таблице 5.1.5 выделено наименьшее расстояние между объединённым объектом 1,2 и третьим объектами. Их объединяем в один объект 1,2,3. Расстояния между укрупнёнными объектами опреде-лены по правилу «ближайшего соседа» и представлены в таблице 5.1.6.

Таблица 5.1.6

1,2,3

4,5,6

1,2,3

0

7,07

4,5,6

0

Таким образом процесс кластерного анализа закончен . Выделено два кластера. Расстояние между кластерами равно 7,07.

Представим результаты кластерного анализа в виде совокуп-ности двух матриц: расстояний между объектами (таблица 5.1.7) и символов Кронекера (таблица 5.1.8).

Таблица 5.1.7

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Таблица 5.1.8

1

2

3

4

5

6

1

0

1,00

1,00

0,00

0,00

0,00

2

0

1,00

0,00

0,00

0,00

3

0

0,00

0,00

0,00

4

0

1,00

1,00

5

0

1,00

6

0

Подсчитаем сумму расстояний между объектами:

0+2,83+3,16+10,19+12,17+13,60+

0+ 0+ 3,16+ 8,94+10,77+12,53+

0+ 0+ 0+ 7,07+ 9,06+10,44+

0+ 0+ 0+ 0+ 2+ 3,61+

0+ 0+ 0+ 0+ 0+ 2,24 =111,77.

Среднее расстояние = 111,77/15=7,45.

Сумма расстояний между объектами, вошедшими в кластеры:

1•2,83+1•3,16+1•3,16+1•2,00+1•3,61+1•2,24=17,00.

Среднее расстояние между объектами в кластерах = 17,00/6=2,83.

Сумма расстояний между объектами, находящимися в разных кластерах:

(1-0)•10,19+(1-0)•12,17+(1-0)•13,60+

+(1-0)•8,94+(1-0)•10,77+(1-0)•12,53+

+(1-0)•7,07+(1-0)•9,06+ (1-0)•10,44= 94,77.

Среднее расстояние между объектами, находящимися в разных кластерах

=94,77/9=10,53.

Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41.

Пример 5.2

Евклидово расстояние. Наиболее удалённый сосед

Требуется разделить шесть объектов на два кластера. Объекты -

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для объектов представлены в таблице 5.2.1.

Таблица 5.2.1

1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4

Вычислены расстояния между объектами по формуле Евклида по всем признакам, которые представлены в таблице 5.2.2.

Таблица 5.2.2

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Жирным шрифтом в таблице 5.2.2 выделено наименьшее расстояние

между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «наиболее удалённого соседа», применение которого для вычисления расстояния между 1 объектом и формируемым объектом, который состоит из 4 и 5 объектов поясняет рис.5.2.1 .

Аналогично определены расстояния между другими объектами и объектом, состоящим из 4 и 5 объектов, и составлена таблица расстояний 5.2.3

Таблица 5.2.3

1

2

3

4,5

6

1

0

2,83

3,16

12,17

13,60

2

0

3,16

10,77

12,53

3

0

9,06

10,44

4,5

0

3,61

6

0

Жирным шрифтом в таблице 5.2.3 выделено наименьшее расстояние между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по правилу « наиболее удалённого соседа» и представлены в таблице 5.2.4.

Таблица 5.2.4

1,2

3

4,5

6

1,2

0

3,16

12,17

13,60

3

0

9,06

10,44

4,5

0

3,61

6

0

Жирным шрифтом в таблице 5.2.4 выделено наименьшее расстояние между объектом 1.2 и третьим объектами. Их объединяем в один объект

1,2,3. Расстояния между этим укрупнённым и другими объектами определены по правилу «наиболее удалённого соседа» и представлены в таблице 5.2.5.

Таблица 5.2.5

1,2,3

4,5

6

1,2,3

0

12,17

13,60

4,5

0

3,61

6

0

Жирным шрифтом в таблице 5.2.5 выделено наименьшее расстояние между объединённым объектом 4,5 и шестым объектами. Их объединяем в один объект 4,5.6. Расстояния между укрупнёнными объектами определены по правилу «наиболее удалённого соседа» и представлены в таблице 5.2.6.

Таблица 5.2.6

1,2,3

4,5,6

1,2,3

0

13.60

4,5,6

0

Таким образом процесс кластерного анализа закончен . Выделено два кластера. Расстояние между кластерами равно 13,6. Дендрограмма результатов кластерного анализа представлена на рис. 5.2.2.

Дендрограмма, представленная на рис 5.2.2, отличается от дендрограммы, представленной на рис. 5.1.5. Все остальные результаты примера 5.1 и примера 5.2 одинаковы. Повторим их с изменением номеров таблиц. Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.2.7) и символов Кронекера (таблица 5.2.8).

Таблица 5.2.7

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Таблица 5.2.8

1

2

3

4

5

6

1

0

1,00

1,00

0,00

0,00

0,00

2

0

1,00

0,00

0,00

0,00

3

0

0,00

0,00

0,00

4

0

1,00

1,00

5

0

1,00

6

0

Подсчитаем сумму расстояний между объектами:

0+2,83+3,16+10,19+12,17+13,60+

0+ 0+ 3,16+ 8,94+10,77+12,53+

0+ 0+ 0+ 7,07+ 9,06+10,44+

0+ 0+ 0+ 0+ 2+ 3,61+

0+ 0+ 0+ 0+ 0+ 2,24 =111,77.

Среднее расстояние = 111,77/15=7,45.

Сумма расстояний между объектами, вошедшими в кластеры:

1•2,83+1•3,16+1•3,16+1•2,00+1•3,61+1•2,24=17,00.

Среднее расстояние между объектами в кластерах = 17,00/6=2,83.

Сумма расстояний между объектами, находящимися в разных кластерах:

(1-0)•10,19+(1-0)•12,17+(1-0)•13,60+

+(1-0)•8,94+(1-0)•10,77+(1-0)•12,53+

+(1-0)•7,07+(1-0)•9,06+ (1-0)•10,44= 94,77.

Среднее расстояние между объектами, находящимися в разных кластерах

=94,77/9=10,53.

Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41.

Пример 5.3

Евклидово расстояние. По среднему значению

Требуется разделить шесть объектов на два кластера. Объекты -

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для шести объектов представлены в таблице 5.3.1.

Таблица 5.3.1

1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4

Вычислены расстояния между объектами по формуле Евклида по двум признакам, которые представлены в таблице 5.3.2.

Таблица 5.3.2

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Жирным шрифтом в таблице 5.3.2 выделено наименьшее расстояние между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «среднего значения» и представлены в таблице 5.3.3. Вычисление среднего расстояния пояснено на рис. 5.3.1.

Таблица 5.3.3

1

2

3

4,5

6

1

0

2,83

3,16

11,18

13,60

2

0

3,16

9,855

12,53

3

0

8,065

10,44

4,5

0

2,925

6

0

Жирным шрифтом в таблице 5.3.3 выделено наименьшее расстояние

между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по принципу « среднего значения» и представлены в таблице 5.3.4.

Таблица 5.3.4

1,2

3

4,5

6

1,2

0

3,16

10,5175

13,065

3

0

8,0650

10,44

4,5

0

2,925

6

0

Жирным шрифтом в таблице 5.3.4 выделено наименьшее расстояние между объектом 4,5 и шестым объектом. Их объединяем в один объект 4,5,6. Расстояния между этим укрупнённым и другими объектами определены по правилу «среднего значения» и представлены в таблице 5.3.5.

Таблица 5.3.5

1,2

3

4,5,6

1,2

0

3,16

11,79125

3

0

9,25250

4,5.6

0

Жирным шрифтом в таблице 5.3.5 выделено наименьшее расстояние между объединённым объектом 1,2 и третьим объектом. Их объединяем в один объект 1,2,3. Расстояния между укрупнёнными объектами определены по правилу «среднего значения» и представлены в таблице 5.3.6.

Таблица 5.3.6

1,2,3

4,5,6

1,2,3

0

10,521875

4,5,6

0

Таким образом процесс кластерного анализа закончен. Выделено два кластера. Расстояние между выделенными кластерами равно 10,52. Дендрограмма результатов кластерного анализа представлена на рис. 5.3.2.

Дендрограмма, представленная на рис 5.3.2, отличается от дендрограммы, представленной на рис. 5.1.5. Все остальные результаты примера 5.1 и примера 5.3 одинаковы. Повторим их с изменением номеров таблиц. Представим результаты кластерного анализа в виде совокупности двух матриц: расстояний между объектами (таблица 5.3.7) и символов Кронекера (таблица 5.3.8).

Таблица 5.3.7

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Таблица 5.3.8

1

2

3

4

5

6

1

0

1,00

1,00

0,00

0,00

0,00

2

0

1,00

0,00

0,00

0,00

3

0

0,00

0,00

0,00

4

0

1,00

1,00

5

0

1,00

6

0

Подсчитаем сумму расстояний между объектами:

0+2,83+3,16+10,19+12,17+13,60+

0+ 0+ 3,16+ 8,94+10,77+12,53+

0+ 0+ 0+ 7,07+ 9,06+10,44+

0+ 0+ 0+ 0+ 2+ 3,61+

0+ 0+ 0+ 0+ 0+ 2,24 =111,77.

Среднее расстояние = 111,77/15=7,45.

Сумма расстояний между объектами, вошедшими в кластеры:

1•2,83+1•3,16+1•3,16+1•2,00+1•3,61+1•2,24=17,00.

Среднее расстояние между объектами в кластерах = 17,00/6=2,83.

Сумма расстояний между объектами, находящимися в разных кластерах:

(1-0)•10,19+(1-0)•12,17+(1-0)•13,60+

+(1-0)•8,94+(1-0)•10,77+(1-0)•12,53+

+(1-0)•7,07+(1-0)•9,06+ (1-0)•10,44= 94,77.

Среднее расстояние между объектами, находящимися в разных кластерах

=94,77/9=10,53.

Таким образом, мы убедились, что условия постановки задачи выполнены, т.е. среднее расстояние между элементами в кластерах более, чем в два с половиной раза меньше чем среднее расстояние между объектами: 7,45/2,83=2,63; а расстояние между объектами, находящимися в различных кластерах почти в полтора раза превышает среднее расстояние между объектами 10,53/7,45=1,41.

Пример 5.4

Евклидово расстояние. По медиане

Требуется разделить шесть объектов на два кластера. Объекты -

информационные системы характеризуются двумя признаками:

Х1-среднее время решения одной задачи в минутах;

Х2-количество задач, в решении которых было отказано ввиду перегрузки информационной системы.

Значения признаков Х1 и Х2 для шести объектов представлены в таблице 5.4.1.

Таблица 5.4.1

1

2

3

4

5

6

X1

2

4

5

12

14

15

X2

8

10

7

6

6

4

Вычислены расстояния между объектами по формуле Евклида по двум признакам, которые представлены в таблице 5.4.2.

Таблица 5.4.2

1

2

3

4

5

6

1

0

2,83

3,16

10,19

12,17

13,60

2

0

3,16

8,94

10,77

12,53

3

0

7,07

9,06

10,44

4

0

2,00

3,61

5

0

2,24

6

0

Жирным шрифтом в таблице 5.4.2 выделено наименьшее расстояние

между четвёртым и пятым объектами. Их объединяем в один объект 4,5. Расстояния между этим укрупнённым и исходными объектами определены по принципу «медианы» и представлены в таблице 5.4.3. Применение принципа по вычислению расстояния между первым объектом и формирующимся объектом, состоящим из 4 и 5 объектов поясняется рис.5.4.1.

Таблица 5.4.3

1

2

3

4,5

6

1

0

2,83

3,16

7,8692705

13,60

2

0

3,16

6,9266965

12,53

3

0

5,6583675

10,44

4,5

0

2,8328

6

0

Жирным шрифтом в таблице 5.4.3 выделено наименьшее расстояние

между первым и вторым объектами. Их объединяем в один объект 1,2. Расстояния между этим укрупнённым и остальными объектами определены по правилу « медианы» и представлены в таблице 5.4.4.

Таблица 5.4.4

1,2

3

4,5

6

1,2

0

2,8254866

7,2767125

12.999162

3

0

5,6583675

10,44

4,5

0

2,8328

6

0

Жирным шрифтом в таблице 5.4.4 выделено наименьшее расстояние между объектом 1,2 и третьим объектом. Их объединяем в один объект 1,2.3. Расстояния между этим укрупнённым и другими объектами определены по принципу «медианы» и представлены в таблице 5.4.5.

Таблица 5.4.5

1,2,3

4,5

6

1,2,3

0

6,363017

11,704275

4,5

0

2,8328


Подобные документы

  • Важная роль простых чисел (ПЧ) в криптографии, генерации случайных чисел, навигации, имитационном моделировании. Необходимость закономерности распределения ПЧ в ряду натуральных чисел. Цель: найти закономерность среди ПЧ + СЧ, а потом закономерность среди

    доклад [217,0 K], добавлен 21.01.2009

  • Закон сохранения количества чисел Джойнт ряда в натуральном ряду чисел как принцип обратной связи чисел в математике. Структура натурального ряда чисел. Изоморфные свойства рядов четных и нечетных чисел. Фрактальная природа распределения простых чисел.

    монография [575,3 K], добавлен 28.03.2012

  • Понятие случайной величины, а также ее основные числовые характеристики. Случайная величина, подчиняющаяся нормальному закону распределения. Кривые плотности вероятности. Использование генератора случайных чисел. Изображение векторов в виде графика.

    лабораторная работа [301,4 K], добавлен 27.05.2015

  • Свойства чисел натурального ряда. Периодическая зависимость от порядковых номеров чисел. Шестеричная периодизация чисел. Область отрицательных чисел. Расположение простых чисел в соответствии с шестеричной периодизацией.

    научная работа [20,2 K], добавлен 29.12.2006

  • Предельные теоремы теории вероятностей. Сходимость последовательностей случайных величин и вероятностных распределений. Метод характеристических функций. Закон больших чисел. Особенности проверки статистических гипотез (критерия согласия w2 Мизеса).

    курсовая работа [1,0 M], добавлен 27.01.2012

  • Исторические факты исследования простых чисел в древности, настоящее состояние проблемы. Распределение простых чисел в натуральном ряде чисел, характер и причина их поведения. Анализ распределения простых чисел-близнецов на основе закона обратной связи.

    статья [406,8 K], добавлен 28.03.2012

  • Построение линейной множественной регрессии для моделирования потребления продукта в разных географических районах. Расчет оценки дисперсии случайной составляющей. Вычисление и корректировка коэффициентов детерминации. Расчет доверительного интервала.

    контрольная работа [814,0 K], добавлен 19.12.2013

  • Сумма n первых чисел натурального ряда. Вычисление площади параболического сегмента. Доказательство формулы Штерна. Выражение суммы k-х степеней натуральных чисел через детерминант и с помощью бернуллиевых чисел. Сумма степеней и нечетных чисел.

    курсовая работа [8,2 M], добавлен 14.09.2015

  • Понятие математического моделирования: выбор чисел случайным образом и их применение. Критерий частот, серий, интервалов, разбиений, перестановок, монотонности, конфликтов. Метод середины квадратов. Линейный конгруэнтный метод. Проверка случайных чисел.

    контрольная работа [55,5 K], добавлен 16.02.2015

  • Гипотеза Биля как неопределенное уравнение, не имеющее решения в целых положительных числах. Использование метода замены переменных. Запись уравнения в соответствии с известной зависимостью для разности квадратов двух чисел. Наличие дробных чисел.

    творческая работа [35,4 K], добавлен 25.06.2009

  • Описание случайных ошибок методами теории вероятностей. Непрерывные случайные величины. Числовые характеристики случайных величин. Нормальный закон распределения. Понятие функции случайной величины. Центральная предельная теорема. Закон больших чисел.

    реферат [146,5 K], добавлен 19.08.2015

  • Вивчення властивостей натуральних чисел. Нескінченість множини простих чисел. Решето Ератосфена. Дослідження основної теореми арифметики. Асимптотичний закон розподілу простих чисел. Характеристика алгоритму пошуку кількості простих чисел на проміжку.

    курсовая работа [79,8 K], добавлен 27.07.2015

  • Збагачення запасу чисел, введення ірраціональних чисел. Зведення комплексних чисел у ступінь і знаходження кореня. Окремий випадок формули Муавра. Труднощі при витягу кореня з комплексних чисел. Витяг квадратного кореня із негативного дійсного числа.

    курсовая работа [130,8 K], добавлен 26.03.2009

  • Понятие комплекса случайных величин, закона их распределения и вероятностной зависимости. Числовые характеристики случайных величин: математическое ожидание, момент, дисперсия и корреляционный момент. Показатель интенсивности связи между переменными.

    курсовая работа [2,4 M], добавлен 07.02.2011

  • Анализ и обработка статистического материала выборок Х1, Х2, Х3. Вычисление статистической дисперсии и стандарта случайной величины. Определение линейной корреляционной зависимости нормального распределения двух случайных величин, матрицы вероятностей.

    контрольная работа [232,5 K], добавлен 25.10.2009

  • Характеристика истории изучения значения простых чисел в математике путем описания способов их нахождения. Вклад Пьетро Катальди в развитие теории простых чисел. Способ Эратосфена составления таблиц простых чисел. Дружественность натуральных чисел.

    контрольная работа [27,8 K], добавлен 24.12.2010

  • Способы получения псевдослучайных чисел. Общая характеристика генератора псевдослучайных чисел фон Неймана. Сущность равномерного закона распределения. Понятие о критериях согласия. Анализ критериев Пирсона и Колмогорова.

    курсовая работа [176,9 K], добавлен 28.04.2010

  • Свойства делимости целых чисел в алгебре. Особенности деления с остатком. Основные свойства простых и составных чисел. Признаки делимости на ряд чисел. Понятия и способы вычисления наибольшего общего делителя (НОД) и наименьшего общего кратного (НОК).

    лекция [268,6 K], добавлен 07.05.2013

  • Поиски и доказательства простоты чисел Мерсенна. Окончание простых чисел Мерсенна на цифру 1 и 7. Вопрос сужения диапазона поиска. Эффективный алгоритм Миллера-Рабина. Разделение алгоритмов на вероятностные и детерминированные. Числа джойнт ряда.

    статья [127,5 K], добавлен 28.03.2012

  • Проблема универсального генератора простых чисел. Попытки создания формул для нахождения простых чисел. Сущность теоремы сравнений. Доказательство "Малой теоремы Ферма". "Золотая теорема" о квадратичном законе взаимности. Генераторы простых чисел Эйлера.

    реферат [22,8 K], добавлен 22.03.2016

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.