Типизация территории методами геостатистического анализа по физико-географическим факторам

Описание способа типизации территории по физико-географическим факторам с использованием кластерного анализа. Типизация территории водосборов методами геостатистического анализа для моделирования пространственного распределения интенсивности снеготаяния.

Рубрика Математика
Вид статья
Язык русский
Дата добавления 26.04.2019
Размер файла 177,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Типизация территории методами геостатистического анализа по физико-географическим факторам

Е.В. Бабушкина,

В.С. Русаков,

С.В. Русаков,

Ю.Н. Шавнина

Аннотация

Описан способ типизации территории по физико-географическим факторам с использованием кластерного анализа. Сбор данных был проведен в инструментальной ГИС ArcGIS, для проведения расчетов была составлена программа на языке программирования C#. Тестовый расчет, результаты которого представлены в статье, проводился для бассейна реки Язьвы.

Ключевые слова: геоинформационные системы; геостатистика; кластерный анализ; классификация.

*Работа выполнена при финансовой поддержке гранта РФФИ №11-05-96026-р_урал_а.

© Бабушкина Е.В., Русаков В.С., Русаков С.В., Шавнина Ю.Н., 2012Введение

Пермский край занимает первое место на Урале по обеспеченности водными ресурсами. Основная часть рек относится к бассейну Камы, который характеризуется сложностью, обусловленной разнообразием форм рельефа. Реки края имеют преимущественно снеговой тип питания с четко выраженным весенним половодьем. В период половодья в зону затопления могут попадать жилые дома, земли сельскохозяйственного назначения, объекты социальной сферы и экономики, в том числе потенциально опасные объекты. Повышение эффективности мероприятий по защите от наводнений может быть достигнуто при системном учете всех факторов, влияющих на формирование половодья. Одной из основных задач прогнозирования уровня воды в реках и предотвращения негативных последствий затопления территории в весенний период является исследование процессов снеготаяния [1]. типизация моделирование снеготаяние

Цель данной работы - типизация территории водосборов методами геостатистического анализа по физико-географическим факторам для моделирования пространственного распределения интенсивности снеготаяния.

Для исследования был выбран бассейн реки Язьвы. Авторы располагают, во-первых, электронным слоем границы этого бассейна, а также цифровой моделью его рельефа, представленной в виде растра с пространственным разрешением 1000 м, каждый пиксель которого содержит высоту над уровнем моря соответствующего участка местности.

Известно, что на интенсивность снеготаяния влияют, в том числе, и такие физико-географические характеристики местности, как высота исследуемого участка над уровнем моря, величина его уклона, а также экспозиция склона. Поскольку территория, на которой тестируется модель, велика, то целесообразно поделить ее на участки, однородные в смысле упомянутых выше характеристик. Подходящий для этого инструмент - кластерный анализ.

Для проведения кластерного анализа из цифровой модели рельефа бассейна реки Язьвы был получен точечный слой пространственных объектов. Каждый объект характеризуется набором признаков: высотой соответствующего участка местности над уровнем моря, экспозицией склона, на котором находится этот участок, а также его уклоном. Высота над уровнем моря измерена в метрах, экспозиция - в градусах от направления на север, а уклон - в градусах от горизонтали. Высота над уровнем моря взята непосредственно из цифровой модели рельефа (ЦМР), а экспозиция и уклон - результаты ее обработки посредством инструментальной геоинформационной системы ArcGIS.

Анализируемый класс пространственных объектов представлен на рис. 1. Интенсивность цвета соответствует высоте объектов над уровнем моря.

Рис. 1. Анализируемые территории

1. Описание алгоритма выделения однородных групп пространственных объектов

Обозначим через

совокупность анализируемых пространственных объектов. Каждый объект представляет собой трехмерный вектор. Задача состоит в том, чтобы разбить совокупность на однородные группы (кластеры), учитывая только результаты измерений характеризующих объекты признаков.

Для этой цели используется одна из наиболее известных процедур кластерного анализа - метод k-средних. Данный метод принадлежит к группе итерационных методов эталонного типа. Ее смысл состоит в последовательном уточнении на каждой итерации эталонных точек (средних арифметических многомерных наблюдений, попавших в образовавшиеся кластеры) [2]. Таким образом, в геометрическом пространстве векторов-признаков определяются довольно плотные структуры.

Доказано, что в результате применения метода k-средних всегда находится решение (последовательность итераций сходится), однако конечный результат сильно чувствителен к выбору начального разбиения. В связи с этим предлагается в качестве начального разбиения использовать результат кластеризации объектов иерархическим методом полных связей [4]. Центры тяжести образовавшихся кластеров в дальнейшем могут рассматриваться как эталонные точки начального разбиения в процедуре метода k-средних.

Еще одной особенностью метода k-средних является то, что исследователь должен располагать информацией о количестве однородных групп в структуре анализируемого множества объектов еще до проведения кластеризации. Однако такая априорная информация не всегда доступна. Поэтому возникает необходимость обосновывать полученный результат разбиения. Для этого в данной работе используется функционал качества разбиения вида

. (1)

Здесь - количество кластеров в разбиении, - центр тяжести кластера с номером , - евклидово расстояние между объектом , принадлежащим кластеру с номером и центром тяжести этого кластера.

Функционал (1) характеризует разброс объектов внутри кластера (плотность кластера). Наилучшим считается разбиение, при котором достигается минимальное значение этого функционала [3]. Таким образом, последовательно применяя метод k-средних для k=1,2… и вычисляя значение функционала (1) для каждого полученного разбиения, можно определить наиболее оптимальную типизацию объектов.

Перед применением вышеописанной процедуры кластерного анализа целесообразно применить нормировку исходных статистических данных с использованием следующих формул:

; ,

где - размерность вектора характеристик пространственных объектов, - количество анализируемых объектов. Такое преобразование необходимо, так как первая характеристика объектов измерена в метрах, а другие - в градусах. В результате получаем безразмерные координаты для каждой многомерной точки наблюдения.

Авторами работы разработано приложение для выполнения описанной выше процедуры [5]. Входные данные - исходная совокупность объектов, сохраненная в базе данных MS Access. Выходные данные - текстовый файл, содержащий сведения о принадлежности объектов к кластерам в различных разбиениях, а также значения функционала (1) для этих разбиений.

2. Результаты

Кластерный анализ проводился для выборки, состоящей из 5 886 объектов. Каждому из них были назначены следующие атрибуты:

высота над уровнем моря;

экспозиция склона;

уклон склона.

Кроме того, для каждого объекта известна точка его местонахождения на электронной карте.

Выборка разбивалась на 2, 3, 4,… 10 кластеров. Для каждого разбиения вычислялось значение функционала (1). Результаты расчетов представлены в табл. 1 и на рис. 2.

Таблица 1. Значения функционала (1) для различных разбиений

Количество

кластеров

Значение

функционала

2

15 517,70

3

9 400,61

4

17 253,49

5

16 110,43

6

19 640,10

7

16 790,57

8

5 152,36

9

7 688,13

10

11 250,81

Рис. 2. График значений функционала (1) для различных разбиений

На рис. 2 по оси Ox отложено значение числа кластеров в разбиении, по Oy - значение функционала (1). Легко видеть, что локальные минимумы функционала достигаются при разбиениях, состоящих из трех, пяти и восьми кластеров, причем "наилучший" минимум получается для восьми кластеров. Изображение слоя электронной карты, где каждая точка-объект раскрашена в зависимости от номера кластера (для случая 8 кластеров), к которому она принадлежит, представлено на рис. 3.

Рис. 3. Разбиение территории на 8 кластеров

Из рисунка видно, что, несмотря на то

что при анализе не брались во внимание географические координаты объектов, нам уда-лось получить разбиение на компактные группы, отражающие характерные формы рельефа изучаемой местности. Статистика по каждому кластеру представлена в табл. 2.

Если учитывать средние значения физико-географических характеристик и средневкадратичные отклонения по ним, то из таблицы видно, что кластеры хорошо разделены по совокупности характеристик. Например, первый и второй кластеры пересекаются по высоте, но разделены по экспозиции.

Заключение

Таким образом, полученные результаты могут быть использованы в дальнейшем для построения наиболее качественной математико-картографической модели расчета процесса снеготаяния.

В дальнейшем планируется включить в анализ данные о растительном покрове местности.

Таблица 2. Статистика по кластерам

Количество элементов

в кластере

Средняя высота

Среднеквадратичное

отклонение по высоте

Средняя экспозиция

Среднеквадратичное отклонение по экспозиции

Средний

уклон

Среднеквадратичное отклонение

по уклону

1

1926

180,80

45,52

272,82

47,28

0,40

0,31

2

1531

171,28

39,51

73,81

47,33

0,45

0,32

3

128

421,78

91,29

186,37

53,56

3,76

0,66

4

331

338,44

84,80

77,12

55,81

2,06

0,53

5

810

354,16

80,27

280,42

40,63

1,71

0,51

6

476

345,84

99,03

159,49

59,82

0,73

0,37

7

287

684,58

101,40

251,30

54,53

2,91

0,62

8

397

554,18

90,67

258,46

55,15

1,10

0,51

Список литературы

1. Комлев А., Черных Е. Реки Пермской области. Пермь: Перм. книжн. изд-во, 1984.

2. Айвазян С.А., Бухштабер В.М., Енюков И.С., Мешалкин Л.Д. Прикладная статистика: Классификация и снижение размерности. М.: Финансы и статистика, 1989.

3. Бабушкина Е.В. Обработка и анализ многомерных данных с использованием статисти-ческих программных комплексов. Пермь: Изд-во Перм. гос. ун-та, 2007.

4. Дюран Б., Одел П. Кластерный анализ. М.: Статистика, 1977.

5. Русаков С.В., Бабушкина Е.В., Русаков В.С. Свидетельство Роспатента о государственной регистрации программ для ЭВМ №2011616906 "Кластерная обработка данных", 2011.

Размещено на Allbest.ru

...

Подобные документы

  • Проверка адекватности линейной регрессии. Вычисление выборочного коэффициента корреляции. Обработка одномерной выборки методами статистического анализа. Проверка гипотезы значимости с помощью критерия Пирсона. Составление линейной эмпирической регрессии.

    задача [409,0 K], добавлен 17.10.2012

  • Описание сущности функции, которая была введена немецким математиком П.В. Дирихле как пример функции, свободной от аналитического задания значения. Характеристика и описание ряда ее свойств и области определения методами математического анализа.

    курсовая работа [44,8 K], добавлен 23.11.2011

  • Математика как всеобщая и абстрактная наука. Задача ее - описание различных процессов формально-логическим способом. Развитие интеллекта школьника, обогащение его методами отбора и анализа информации. Воспитание волевых и гражданских качеств личности.

    реферат [28,5 K], добавлен 22.05.2009

  • История возникновения и понятия дифференциальной геометрии, в которой плоские и пространственные кривые и поверхности изучаются с помощью дифференциального исчисления и методами математического анализа. Применение темы "Теория поверхностей " в школе.

    реферат [608,8 K], добавлен 23.04.2015

  • Исследование задачи Дирихле для вырождающегося уравнения смешанного типа в прямоугольной области методами спектрального анализа. Обоснование корректности постановки нелокальных начально-граничных задач различных вырождающихся дифференциальных уравнений.

    курсовая работа [135,1 K], добавлен 06.05.2011

  • Понятие математического анализа. Предшественники математического анализа - античный метод исчерпывания и метод неделимых. Л. Эйлер - входит в первую пятерку великих математиков всех времен и народов. Современная пятитомная "Математическая энциклопедия".

    реферат [68,3 K], добавлен 04.08.2010

  • Исследование методами математического анализа поведения функций при заданных значениях аргумента. Этапы решения уравнения функции и определения значения аргумента и параметра. Построение графиков. Сочетание тригонометрических, гиперболических функций.

    контрольная работа [272,3 K], добавлен 20.08.2010

  • Решение системы линейных уравнений с неизвестными методами Гаусса, Зейделя и простой итерации. Вычисление корня уравнения методами дихотомии, хорды и простой итерации. Нахождение приближённого значения интеграла с точностью до 0,001 методом Симпсона.

    контрольная работа [1,7 M], добавлен 05.07.2014

  • Значение математической статистики для анализа закономерностей массовых явлений. Основные теоретические выкладки корреляционного анализа. Применение его инструментария в контексте металлургической промышленности в среде программного средства Statistica 6.

    реферат [261,4 K], добавлен 03.08.2014

  • Пределы функции, ее полное исследование с использованием дифференциального исчисления. Вычисление неопределенных интегралов с использованием методов интегрирования. Определенный и несобственный интегралы. Числовые ряды, их исследование на сходимость.

    контрольная работа [713,2 K], добавлен 07.04.2013

  • Дифференциальные уравнения как математический инструмент моделирования и анализа разнообразных явлений и процессов в науке и технике. Описание математических методов решения систем дифференциальных уравнений. Методы расчета токов на участках цепи.

    курсовая работа [337,3 K], добавлен 19.09.2011

  • Описание случайных ошибок методами теории вероятностей. Непрерывные случайные величины. Числовые характеристики случайных величин. Нормальный закон распределения. Понятие функции случайной величины. Центральная предельная теорема. Закон больших чисел.

    реферат [146,5 K], добавлен 19.08.2015

  • Понятие доверительного интервала, сущность и определение критерия согласия Пирсона. Особенности точечного оценивания неизвестных параметров, основные требования к оценкам и статистикам. Характеристика классической линейной модели регрессионного анализа.

    дипломная работа [440,4 K], добавлен 23.07.2013

  • Определение математического ожидания и среднеквадратического отклонения с целью подбора закона распределения к выборке статистических данных об отказах элементов автомобиля. Нахождения числа событий в заданном интервале; расчет значения критерия Пирсона.

    контрольная работа [336,3 K], добавлен 01.04.2014

  • Анализ исследований в области лечения диабета. Использование классификаторов машинного обучения для анализа данных, определение зависимостей и корреляции между переменными, значимых параметров, а также подготовка данных для анализа. Разработка модели.

    дипломная работа [256,0 K], добавлен 29.06.2017

  • Топологическое определение гомотопии. Смысл, преимущества и недостатки гомотопного метода анализа. Уравнения деформации нулевого и старшего порядка. Особенности теоремы сходимости и значение трех фундаментальных правил, полиномиальное выражение.

    доклад [168,7 K], добавлен 13.08.2011

  • Точечное оценивание основных числовых характеристик, функции и плотности распределения компонент многомерного случайного вектора. Статистическая проверка характера распределения. Особенности корреляционного анализа признаков этой математической категории.

    курсовая работа [1,1 M], добавлен 01.10.2013

  • Непрерывная случайная величина и функция распределения. Математическое ожидание непрерывной случайной величины. Среднее квадратичное отклонение. Кривая распределения для непрерывной случайной величины. Понятие однофакторного дисперсионного анализа.

    контрольная работа [165,5 K], добавлен 03.01.2012

  • Лейбниц и "древняя история" нестандартного анализа. Робинсон и "новая история" нестандартного анализа. Бесконечно малые величины. Гипердействительная прямая. Пример неархимедовой числовой системы. Следствия основной гипотезы.

    курсовая работа [41,7 K], добавлен 15.12.2003

  • Функциональные и стохастические связи. Статистические методы моделирования связи. Статистическое моделирование связи методом корреляционного и регрессионного анализа. Проверка адекватности регрессионной модели.

    курсовая работа [214,6 K], добавлен 04.09.2007

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.