Развитие алгоритмов искусственного интеллекта и распознавания образов для решения дискретных задач при оценке перспектив скоординированного социально-экономического развития России и Украины в общеевропейском контексте
Обработка данных, представленных в виде системы временных рядов и отражающих те или иные демографические явления в России и на Украине. Алгоритмическая система оперативной оценки динамического процесса, осуществляющая мониторинг его активности.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 08.06.2018 |
Размер файла | 1,0 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru//
Размещено на http://www.allbest.ru//
Развитие алгоритмов искусственного интеллекта и распознавания образов для решения дискретных задач при оценке перспектив скоординированного социально-экономического развития России и Украины в общеевропейском контексте
Агаян С.М.
д.ф.-м.н., гл.н.с. Геофизического центра РАН
Лушников А.А.
д.ф.-м.н., гл.н.с. Геофизического центра РАН
Богоутдинов Ш.Р.
к.ф.-м.н., в.н.с. Геофизический центр РАН
Введение
Настоящая статья посвящена анализу и обработке данных, представленных в виде системы временных рядов и отражающих те или иные демографические явления в России и на Украине. Для этого в рамках многоцелевой ГИС “Россия-Украина” построена алгоритмическая система оперативной оценки динамического процесса, осуществляющая мониторинг его активности [1]. Под динамическим процессом понимается система временных рядов данных различной природы. Мониторинг возможен как в режиме off-line, так и в режиме on-line. Суть мониторинга динамического процесса заключается в анализе мер его активности с последующими выводами о стабильности, нестабильности, прогнозе развития и других вещах, касающихся самого процесса. Меры активности процесса строятся в рамках алгоритмического ядра ГИС “Россия-Украина”.
В качестве такого ядра выступает созданный в ГЦ РАН новый подход к анализу данных. Называется он “Дискретный математический анализ” (в дальнейшем ДМА) и представляет собой серию алгоритмов, нацеленных на решение основных задач анализа данных: в многомерных массивах - кластеризация, выделение сгущений (топологическая фильтрация), поиск линейных структур[2, 3]; во временных рядах - сглаживание, тренды, экстремумы, морфология[4-12] (рис. 1).
Рис.1. Блок-схема ДМА и динамика его развития.
Все алгоритмы ДМА носят универсальный характер, скреплены единой формальной основой, базирующейся, в свою очередь, на нечеткой логике и искусственном интеллекте. Поэтому ДМА значительно сильнее ориентирован на эксперта, чем традиционные методы анализа данных (прикладная статистика, спектрально-временной анализ, image processing, математическая морфология).
Мониторинг активности
Мера активности временного ряда характеризует его активность в каждый момент времени в шкале отрезка [-1, 1]. Строится она в два этапа. Дело в том, что активность - понятие многозначное, зависящее от экспертной точки зрения. На первом этапе такая точка зрения выбирается и затем моделируется на исходном ряде путем построения для него некоторого вспомогательного ряда, который называется выпрямлением. Далее, на втором этапе выпрямление нормируется в рамках ДМА с помощью, так называемых, нечетких сравнений. В результате получается мера активности для исходного временного ряда, выражающего принятую точку зрения на нее.
Итак, мера активности временного ряда - это нормированный временной ряд со значениями в отрезке[-1, 1]. С каждым временным рядом можно связать целую серию его мер, реализующих разные точки зрения на активность.
Пусть дана дискретная положительная полуось и конечный временной ряд, определенный на отрезке (периоде регистрации) . Активность ряда - характеристика локальная, схожая по своей природе с производной, поэтому введем параметр локального обзора , кратный : и назовем фрагментом локального обзора ряда с центром в его отрезок:
.
Определение 1. Если совокупность фрагментов локального обзора записи и , где - множество положительных действительных чисел, то суперпозицию назовем выпрямлением на основе .
Для построения выпрямления крайне полезным оказывается наличие материала обучения, предварительная работа на нем эксперта.
Примеры выпрямлений. 1, Длина фрагмента обзора
2. Энергия фрагмента обзора
, где
Построение выпрямления завершает первый этап в определении меры активности.
Нечеткие сравнения.
Второй этап построения меры активности основан на нечётких сравнениях [10, 11]. Во многих случаях обычная мера превосходства одного числа над другим в виде их разности оказывается слишком грубой. Алгоритмы ДМА требуют более тонких конструкций сравнения чисел.
Определение 2. Нечеткое сравнение действительных чисел и измеряет в знакопеременной шкале отрезка [-1,1] степень превосходства “” над “”:
.
Пример 2. Сравнение Минковского. Если, то для любого
Пусть - временной ряд на , - неотрицательный временной ряд на , количественно формализующий экспертное понимание активности на .
Мера активности в узле - степень максимальности вна основе off-line анализа
(1)
Пример 3. В верхней части рис. 2 представлен временной ряд. В нижней части рис. 2 представлена мера его активности . Красным (зеленым) цветом показаны аномально активные (аномально неактивные) участки.
Рис. 2. Мера активности .
Динамическая мера активности в узле - степень максимальности в на основе on-line анализа
, (2)
Пример 4. В верхней части рис. 3 представлен временной ряд, уже встречавшийся выше на рис. 2. В нижней части рис. 3 представлена мера его динамической активности . Красным (зеленым) цветом показаны аномально активные (аномально неактивные) участки. Как видно, меры (1) (рис. 2) и (2) (рис. 3) существенно различаются между собой, особенно в начале.
Рис. 3. Мера динамической активности .
Под конечным динамическим процессом понимается совокупность временных рядов , заданных на конечном временном периоде наблюдений и индексированных конечным множеством : . Конструкция (1) по времени продолжается на , определяет конечный нормированный процесс со значениями в отрезке , обозначается через и называется мерой активности :
. (3)
Совершенно аналогично и только по времени на продолжается конструкция (2). Она также определяет конечный нормированный процесс, который естественно назвать динамической мерой активности и обозначить через :
. (4)
Итак, и осуществляют соответственно off-line и on-line мониторинг по времени активности процесса . В общем случае компоненты процесса имеют совершенно различную природу и их непосредственное сравнение между собой некорректно. С другой стороны, компоненты и процессов и нормированы, выражают для разных одну и ту же сущность и потому сравнимы, поскольку эти меры в рамках нечеткой логики отвечают в шкале отрезка на вопрос: “В какой степени происходящее в режиме off-line (on-line) в момент времени в процессе по координате является активным?”
Подведем итог: с конечным динамическим процессом мы связали два производных нормированных процесса , . Их анализ составляет суть предлагаемого мониторинга самого .На его основе делаются выводы о характере развития процесса, выявляются признаки дестабилизации, осуществляется прогноз. Возможны различные варианты такого анализа. Остановимся на самом простом и естественном - статистическом анализе.
Статистический анализ процессов , дает возможность численно выразить активность процесса и в первом приближении использует операции усреднения, разброса и построения гистограммы. Анализ по для любой фиксированной координате относится к локальной активности и считается локальным статистическим анализом активности по .
Дуально, анализ, привлекающий все пространство , относится к глобальной активности и считается глобальным статистическим анализом активности .
Локальный статистический анализ активности :
средняя активность по времени процесса для координаты
, , (5)
разброс активности процесса по времени для координаты
,.(6)
Глобальный статистический анализ активности :
средняя мера активности на
, , (7)
средний разброс активности на
, . (8)
Пример 5. На рис. 4 представлен динамический мониторинг рождаемости по регионам Украины (2003-2012гг.) на основе выбранной меры активности (4). Справа показана гистограмма динамической активности.
данные демографический алгоритм динамический
Рис. 4. Динамический мониторинг активности в сети INTERMAGNET.
Эволюционные модели
Как было сказано в начале, особое внимание предполагается уделить демографическим данным, в частности, их прогнозированию на основе эволюционных моделей. Соединение мер активности с эволюционным прогнозированием дает возможность более объективно и точно понять демографическое будущее. Эволюционное моделирование - это эффективный метод, позволяющий не только анализировать текущую ситуацию, но и делать предсказания, надежность которых зависит от ранга и качества модели [13-21].
Любая эволюционирующая система может быть описана набором величин, каждая из которых изменяется со временем. Обычно эти изменения описываются системами нелинейных дифференциальных уравнений первого порядка по времени. Сами уравнения, содержащие размерные параметры, определяющие временные масштабы исследуемых явлений вместе с начальными условиями позволяют предсказывать судьбу эволюционирующей системы.
Нами сформулированы эволюционные модели разного уровня и, соответственно, разной сложности:
Модель эволюции двуполой популяции
Модель, описывающая эволюцию возрастного состава на селения
Модель, принимающая в расчет конечность репродуктивного периода
Модель рождение-болезнь-смерть
Модель развития эпидемии
Таким образом, вместо того, чтобы оперировать со стандартными демографическими показателями, такими как смертность, рождаемость, заболеваемость мы определяем скорости переходов между разными состояниями исследуемой группы. Далее, параметризованные модели используются для предсказания изменений во времени численного и возрастного состава. Это открывает возможность для компоновки геоинформационных систем, в которых картированы параметры эволюционных уравнений. Такие геоинформационные системы, наряду со стандартными, позволяют видеть перспективы развития демографических ситуаций.
Идею введения эволюционных моделей поясним простым примером. Пусть необходимо проследить за судьбой замкнутой группы людей. Обозначим через n(t) число людей в группе в момент времени t. Будем считать, что только два процесса ответственны за численность группы: рождение и смерть. Численность возрастает за счет рождения новых особей и уменьшается за счет смерти. Мы можем тогда написать следующее простое эволюционное уравнение,
(9)
Здесь -- коэффициент рождаемости, -- коэффициент смертности. Функции f(n) и g(n) описывают зависимость скорости процесса рождения новых особей от численности группы. Самый простейший вариант - это f(n)=n2 , g(n)=n, т.е., скорость рождения пропорциональна числу пар, а смертность не зависит от численности группы. Уравнение (9) тогда приобретает вид:
(10)
Теперь мы можем посмотреть, что из этого получается. Во-первых, мы сразу можем определить численность группы в стационарном состоянии, когда n не меняется со временем (dn/dt=0) . Из уравнения мы найдем
= (11)
Коэффициенты рождаемости и смертности определяются из результатов специально сделанных измерений. Коэффициент может быть найден, если мы проследим за жизнью выбранной группы людей, в которой никто не рождается (). Тогда из уравнения (9) мы найдем
(12)
Здесь - начальное число людей в группе. Теперь, если мы знаем число людей n1 и n2 в моменты времени t1 и t2, то найдется из равенства
(13)
Коэффициент рождаемости тоже может быть найден. Для этого надо рассмотреть времена много меньшие 1/. Тогда можно пренебречь последним членом в уравнении (10). Производя интегрирование и пренебрегая временной зависимостью n на коротком промежутке времени , получим,
(14)
Тогда по измеренному приросту численности и промежутку времени , который мы выбираем сами, мы можем определить константу .
Следующий уровень эволюционных моделей использует вероятностный подход. Опять, система характеризуется набором величин и вводится вероятность застать систему в состоянии в момент времени . Для этой вероятности формулируется система эволюционных уравнений. Самый простейший пример - это уравнения, приводящие к закону Мальтуса. Пусть . Тогда эволюционное уравнение имеет вид:
Здесь- численность популяции и - вероятность того, что численность популяции в момент t. Решение этой системы - распределение Пуассона
где среднее значение численности популяции подчиняется уравнению (9)
Или
Здесь - начальная численность популяции. Теперь видно, что если рождаемость превышает смертность, то численность населения экспоненциально растет. В противном случае она падает (закон Мальтуса).
Рис. 5. Зависимость численности населения в ограниченной популяции от времени для линейной зависимости от численности группы скорости рождаемости и линейно квадратичной скорости вымирания.
Результаты расчетов по предложенным моделям представлены на рис. 5-7. Рис.5 демонстрирует спадание численности населения в модели с линейной по численности населения рождаемостью и линейно-квадратичной зависимостью скорости вымирания.
Наиболее соответствующая реальности модель должна учитывать возрастные характеристики популяции. В соответствии с этим мы вводим распределение по возрастам и понятие репродуктивного возраста у женщин. Решение соответствующих эволюционных уравнений позволило найти распределение по возрастам в стационарном пределе. Результат показан на рис. 6.
Зависимость численности популяции от времени в этой же модели представлена на рис. 7. Этот рисунок демонстрирует, что в зависимости от соотношения между коэффициентами, характеризующими рождаемость и смертность, динамика изменения численности популяции может меняться. Видно, что в зависимости от соотношения параметров население может увеличиваться или уменьшаться.
Нами найдены также решения для случая зависящих от времени коэффициентов рождаемости и смертности. Здесь возможны ситуации, когда режимы роста сменяются режимами спада численности.
Рис. 6. Типичное распределение населения по возрастным группам.Кривая нормирована на предельный возраст 100 лет.
Эти и более сложные модели предполагается применить для анализа и прогнозирования демографических ситуаций в России и Украине.
Рис. 7. Динамика изменения численности популяции для различных соотношений между коэффициентами рождаемости и смертности.
Список литературы
Гвишиани А.Д., Любовцева Ю.С., Красноперов Р.И., Згуровский М.З., Пятыгина О.О., Шибаева А.А., Ефремов К.В. Создание многоцелевой ГИС «Россия--Украина» для оценки перспектив скоординированного социально-экономического развития России и Украины в общеевропейском контексте (в печати).
Гвишиани А.Д., Агаян С.М., Богоутдинов Ш.Р., Соловьев А.А. Дискретный математический анализ и геолого-геофизические приложения // Вестник Краунц. Науки о Земле. 2010. - № 2, вып. № 16. - С.109-125.
Агаян С. М., Богоутдинов Ш. Р., Добровольский М. Н. Об одном алгоритме поиска плотных областей и его геофизических приложениях // Математические методы распознавания образов: 15-я Всероссийская конференция, г. Петрозаводск, 11_17 сентября 2011 г.: Сборник докладов. - М., 2011. - C. 543_546.
Гвишиани А.Д., Агаян С.М., Богоутдинов Ш.Р., Леденев А.В., Злотники Ж., Боннин Ж. Математические методы геоинформатики. II. Алгоритмы нечеткой логики в задачах выделения аномалий на временных рядах // Кибернетика и системный анализ. 2003. - № 4. - С.103-111.
Gvishiani A.D., Agayan S.M., BogoutdinovSh.R., Tikhotsky S.A., Hinderer J., Bonnin J., Diament M. Algorithm FLARS and recognition of time series anomalies // System Research & Information Technologies. 2004. - №. 3. - P.7-16.
Агаян С.М., Богоутдинов Ш.Р., Гвишиани А.Д., Граева Е.М., Злотники Ж., Родкин М.В. Исследование морфологии сигнала на основе алгоритмов нечеткой логики // Геофизические исследования. - М.: ИФЗ РАН, 2005. - Вып.1. - С. 143-155.
Zlotnicki J., LeMouel J.-L., Gvishiani A., Agayan S., Mikhailov V., Bogoutdinov Sh. Automatic fuzzy-logic recognition of anomalous activity on long geophysical records. Application to electric signals associated with the volcanic activity of la Fournaise volcano (Rйunion Island) // Earth and Planetary Science Letters. 2005. - Vol.234. - P.261-278.
Богоутдинов Ш.Р., Агаян С.М., Гвишиани А.Д., Граева Е.М., Родкин М.В., Злотники Ж., ЛеМуэль Ж.Л. Алгоритмы нечеткой логики в анализе электротеллурических данных в связи с мониторингом вулканической активности // Физика Земли. 2007. - № 7. - C.72-85.
Gvishiani A.D., Agayan S.M., Bogoutdinov Sh.R., Graeva E.M., Zlotnicki J., Bonnin J. Recognition of anomalies from time series by fuzzy logic methods // Russian Journal of Earth Sciences. 2008. - Vol. 10. ES1001, doi:10.2205/2007ES000278.
Гвишиани А.Д., Агаян С.М., Богоутдинов Ш.Р. Определение аномалий на временных рядах методами нечеткого распознавания // Доклады Академии наук. 2008. - Т.421, № 1. - С.101-105.
Гвишиани А.Д., Агаян С.М., Богоутдинов Ш.Р., Злотники Ж., Боннин Ж. Математические методы геоинформатики. III. Нечеткие сравнения и распознавание аномалий на временных рядах // Кибернетика и системный анализ. 2008. - Т.44, № 3. - С.3-18.
Гвишиани А.Д., Агаян С.М., Богоутдинов Ш.Р. Дискретный математический анализ и мониторинг вулканов // Инженерная экология. 2008. - № 5. - С.26-31.
Charlesworth B. Evolution in Age - structured Populations. - Cambridge: Cambridge University Press, 1980.
Clark C.W. A delayed-recruitment model of population dynamics with an application to baleen whale populations // J. Math. Biol. 1976. - Vol. 3. - P. 381-391.
Cohen D.S., Murray J.D. A generalized diffusion model for growth and dispersal in a population // J. Math. Biol. 1981. - Vol.12. - P.237-249.
Ferriere R., Gatto M. Chaotic population dynamics can result from natural selection // Proc. R. Soc. Lond. 1993. - Vol. 251. - P. 33-38..
Капица С.П. общая теория роста человечества: сколько людей жило, живет и будет жить на Земле. - М.: Наука, 1999. - 190 с.
Демографические модели: сб. статей / Под ред. Е.М. Андреева, А.Г. Волкова. - М.: Статистика, 1977. - 182 с.
Уильямсон М. Анализ биологических популяций: пер. в англ. А.Д. Базыкина; под ред. Ю.М. Свирежева. - М.: Мир, 1975. - 271 с.
Donald T.R. Demographic methods and concepts. - Oxford: Oxford University Press, 2006. - 523 p.
Любовцева Ю.С., А.А. Макоско, Е.В. Воронова, О.О. Пятыгина, А.А. Шибаева, Р.И. Красноперов. Медицинская геоинформационная система России в условиях изменяющегося климата // Труды международной конференции «Влияние космической погоды на человека в космосе и на земле» (ИКИ РАН, Москва, Россия 2--8 июня 2012 года).
Размещено на Allbest.ru
...Подобные документы
Информация, как сырье и как товар: абсолютная, относительная и аналитическая информация. Автоматизированные системы распознавания образов. Система искусственного интеллекта. Признаки и этапы жизненного цикла интеллектуальных информационных систем.
шпаргалка [60,4 K], добавлен 10.06.2009Основные понятия теории распознавания образов и ее значение. Сущность математической теории распознавания образов. Основные задачи, возникающие при разработке систем распознавания образов. Классификация систем распознавания образов реального времени.
курсовая работа [462,2 K], добавлен 15.01.2014Сущность искусственного интеллекта, сферы человеческой деятельности, в которых он распространен. История и этапы развития данного явления. Первые идеи и их воплощение. Законы робототехники. Использование искусственного интеллекта в коммерческих целях.
реферат [40,8 K], добавлен 17.08.2015Применение методов искусственного интеллекта и современных компьютерных технологий для обработки табличных данных. Алгоритм муравья, его начальное размещение и перемещение. Правила соединения UFO-компонентов при моделировании шахтной транспортной системы.
дипломная работа [860,8 K], добавлен 23.04.2011Понятие искусственного интеллекта как свойства автоматических систем брать на себя отдельные функции интеллекта человека. Экспертные системы в области медицины. Различные подходы к построению систем искусственного интеллекта. Создание нейронных сетей.
презентация [3,0 M], добавлен 28.05.2015Сущность и проблемы определения искусственного интеллекта, его основных задач и функций. Философские проблемы создания искусственного интеллекта и обеспечения безопасности человека при работе с роботом. Выбор пути создания искусственного интеллекта.
контрольная работа [27,9 K], добавлен 07.12.2009История развития искусственного интеллекта в странах дальнего зарубежья, в России и в Республике Казахстан. Разработка проекта эффективного внедрения и адаптации искусственного интеллекта в человеческом социуме. Интеграция искусственного в естественное.
научная работа [255,5 K], добавлен 23.12.2014Обзор задач, возникающих при разработке систем распознавания образов. Обучаемые классификаторы образов. Алгоритм персептрона и его модификации. Создание программы, предназначенной для классификации образов методом наименьшей среднеквадратической ошибки.
курсовая работа [645,2 K], добавлен 05.04.2015Описание структурной схемы искусственного нейрона. Характеристика искусственной нейронной сети как математической модели и устройств параллельных вычислений на основе микропроцессоров. Применение нейронной сети для распознавания образов и сжатия данных.
презентация [387,5 K], добавлен 11.12.2015Решение неформализованных задач экспертными системами. Системы искусственного интеллекта, эвристический поиск решения. Особенности работы экспертных систем. Знания о процессе решения задач, используемые интерпретатором. Системы обнаружения неисправности.
презентация [100,1 K], добавлен 12.02.2014Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.
дипломная работа [887,3 K], добавлен 26.11.2013Понятие и суть нечеткой логики и генетических алгоритмов. Характеристика программных пакетов для работы с системами искусственного интеллекта в среде Matlab R2009b. Реализация аппроксимации функции с применением аппарата нечеткого логического вывода.
курсовая работа [2,3 M], добавлен 23.06.2012Теоретические основы распознавания образов. Функциональная схема системы распознавания. Применение байесовских методов при решении задачи распознавания образов. Байесовская сегментация изображений. Модель TAN при решении задачи классификации образов.
дипломная работа [1019,9 K], добавлен 13.10.2017Начало современного этапа развития систем искусственного интеллекта. Особенности взаимодействия с компьютером. Цель когнитивного моделирования. Перспективы основных направлений современного развития нейрокомпьютерных технологий, моделирование интеллекта.
реферат [24,7 K], добавлен 05.01.2010Словесный, графический, табличный, программный способы представления алгоритма. Основные конструкции в любом алгоритмическом языке. Теория обнаружения, различения и оценивания сигналов. Радиолокационные системы обнаружения. Система распознавания образов.
презентация [4,8 M], добавлен 09.06.2015Искусственный интеллект – научное направление, связанное с машинным моделированием человеческих интеллектуальных функций. Черты искусственного интеллекта Развитие искусственного интеллекта, перспективные направления в его исследовании и моделировании.
реферат [70,7 K], добавлен 18.11.2010Понятие и особенности построения алгоритмов распознавания образов. Различные подходы к типологии методов распознавания. Изучение основных способов представления знаний. Характеристика интенсиональных и экстенсиональных методов, оценка их качества.
презентация [31,6 K], добавлен 06.01.2014Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.
курсовая работа [16,2 M], добавлен 21.06.2014Выбор типа и структуры нейронной сети. Подбор метода распознавания, структурная схема сети Хопфилда. Обучение системы распознавания образов. Особенности работы с программой, ее достоинства и недостатки. Описание интерфейса пользователя и экранных форм.
курсовая работа [3,0 M], добавлен 14.11.2013Разработка программы на языке Си++ и осуществление постановки и выбора алгоритмов решения задач обработки экономической информации, создание и редактирование базы данных, сортировка записей по определенному запросу, анализ эффективности обработки данных.
контрольная работа [316,8 K], добавлен 28.08.2012