Главная Коллекция "Revolution" Программирование, компьютеры и кибернетика Применение многослойных радиально-базисных нейронных сетей для верификации реляционных баз данных

Применение многослойных радиально-базисных нейронных сетей для верификации реляционных баз данных

Разработка способов обеспечения достоверности информации баз данных. Описание метода определения достоверности вводимого кортежа. Параметры и характеристика нейронной сети Кохонена. Обучение радиально-базисной сети путём обратного распространения ошибки.

Рубрика	Программирование, компьютеры и кибернетика
Вид	статья
Язык	русский
Дата добавления	29.05.2017
Размер файла	275,3 K

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://allbest.ru

Донской государственный технический университет

Применение многослойных радиально-базисных нейронных сетей для верификации реляционных баз данных

В.В. Галушка, А.А.

Молчанов,

В.А. Фатхи

г. Ростов-на-Дону

Применительно к базам данных (БД) верификация означает проверку содержащихся в ней данных на соответствие реальности, т.е. их достоверности. Необходимость такой проверки обусловлена негативными последствиями, связанными с использованием недостоверных данных.

Целью проведения верификации является повышение достоверности данных путем определения и устранения недостоверных данных. Использование такой процедуры актуально в любых прикладных информационных системах, в которых для хранения данных используется БД. Например, в [1] указывается, что в результате проведения верификации БД налоговой инспекции из неё было исключено 5 935 недостоверных записей из более чем 1 500 000.

Для определения достоверности БД требуется обладание полными знаниями, как о содержимом БД, так и о реальном мире. Система управления базами данных может контролировать только целостность БД [2], но принципиально не в состоянии контролировать достоверность БД. Контроль достоверности БД может обычно возлагается на человека, да и то в ограниченных масштабах, поскольку в ряде случаев люди не обладают полнотой знаний о реальном мире.

Основными же способами обеспечения достоверности информации БД является её входной контроль с помощью триггеров или хранимых процедур, обеспечиваемый СУБД или прикладным приложением. В случае наличия недостоверных строк в базе данных их выявление и исправление осуществляется преимущественно вручную и сопряжено с большими временными затратами.

В данной работе для определения достоверности вводимого кортежа (строки) в таблицу БД предлагается интеллектуальный метод, основанный на теории искусственных нейронных сетей [3,4], т.к. интеллектуальные информационные системы позволяют переложить на вычислительную систему часть работ традиционно выполняемых человеком.

Как известно, искусственные нейронные сети (ИНС) -- это математические модели, а также их программные или аппаратные реализации, построенные по принципу организации и функционирования биологических нейронных сетей. ИНС представляют собой систему соединённых и взаимодействующих между собой искусственных нейронов.

Постановка задачи. Теоретической основой реляционных БД является теория отношений [2]. Реляционная алгебра представляет собой набор таких операций над отношениями, что результат каждой из операций также является отношениям. Таким образом, верификация БД является, по сути, проверкой всех содержащихся в ней отношений или отношений, порождаемых реляционными операциями, используемыми в запросах.

Имеется БД, представляющая совокупность отношений. Рассмотрим n-арное отношение , которое является подмножеством полного декартова произведения D₁ Ч D₂ Ч … Ч D_n множеств доменов D₁, D₂, …, D_n (n ? 1), не обязательно различных. Каждый элемент отношения R=r₁, r₂, …, r_j, …, r_m (m ? 0) является кортежем, включающим в себя элементы множеств D₁, D₂, …, D_n: j-ый элемент отношения R равен a_j_,1, a_j_,2, …, a_j_,_n, a_j_,₁ D₁, a_j_,2 D₂, ..., a_j_,_n D_n. Отношение может быть представлено в виде таблицы (см. табл. 1), в которой столбцы (поля, атрибуты) соответствуют вхождениям доменов в отношение, а строки (записи) -- наборам из n значений, взятых из исходных доменов. Каждому элементу r_j поставим в соответствие параметр d(r_j) -- достоверность данного элемента такова, что 0 d(r_j) 1.

Рассмотрим следующий случай -- имеется таблица, содержащая некоторое (относительно небольшое) количество достоверных данных, т.е. для каждого r_j R d(r_j) = 1. Данная таблица постоянно пополняется. Необходимо для каждой новой строки r_m₊₁, заносимой в таблицу, определить её достоверность d(r_m₊₁) (cм. табл. 1).

Таблица 1. Представление отношения R

r₁	a_1,1	a_1,2	…	a_1,n	d(r₁)
r₂	a_2,1	a_2,2	…	a_2,n	d(r₂)
	…	…	…	…	…
r_m+1	a_m+1,1	a_m+1,2	…	a_m+1,n	d(r_m+1)

Для простоты описания метода определения достоверности вводимого кортежа ограничимся проверкой отношений, содержащих только числовые данные. В случае необходимости поля строкового типа могут быть исключены или заменены числовыми кодами. Таблица БД хранит в себе информацию о совокупности объектов предметной области принадлежащих одному классу (являющихся экземплярами одной сущности).

Однако в этой совокупности могут быть выделены группы объектов похожих между собой в пределах группы, и максимально отличающихся от объектов, принадлежащих другой группе, т.е. кластеров. Первым этапом верификации является выявление этих кластеров.

Для определения принадлежности элемента к кластеру используются сети Кохонена, преимущество которых заключается в обучении без учителя [4]. При этом, количество кластеров T соответствует количеству нейронов выходного слоя и определяется в соответствии с методикой, описанной в [5].

Рис. 1. Нейронная сеть Кохонена

Конфигурация сети представлена на рис. 1, где x₁, x₂, …, x_n -- входные сигналы сети, n -- количество элементов кортежа; w_ik -- вес связи между i-ым нейроном входного слоя и k-ым нейроном выходного слоя, k = 1, 2, …, T; out¹₁, out¹₂, …, out¹_T -- значения выходов нейронов последнего слоя.

Результатом кластеризации сетью Кохонена будет получение для каждого элемента r_i пары (r_i, C_k), где C_k -- кластер, к которому принадлежит элемент r_i. Данное множество пар используется при обучении радиально-базисной нейронной сети. информация сеть кохонен нейронный

Для использования радиально-базисной нейронной сети определим количество нейронов во входном и выходном слое, количество скрытых слоев и нейронов в каждом из них, функции активации нейронов каждого слоя.

Количество нейронов во входном слое определяется количеством n столбцов анализируемой таблицы. Количество нейронов скрытого слоя определяется для каждого случая отдельно, однако проведенные ранее исследования показывают, что достаточным является количество в 1,5 - 2 раза превышающее количество нейронов в выходном слое [6]. Количество нейронов в последнем (выходном) слое соответствует количеству кластеров T, определённых на предыдущем этапе с помощью сети Кохонена. Схема применяемой радиально-базисной сети приведена на рис. 2.

Текущее состояние нейрона определяется как взвешенная сумма его входов

где x_i -- значение входа, w^L_ij -- веса связей. При этом, для нейронов первого слоя x_i = a_ji, , L = 2, 3 -- номер слоя, u -- номер нейрона в слое.

Выход нейрона есть функция его состояния: y = f (s). Нелинейная функция f называется активационной и может иметь различный вид. Одной из наиболее распространённых является нелинейная функция с насыщением, так называемая логистическая функция или сигмоид (т.е. функция S-образного вида):

f (s) = (1 + e^-^бs)^-1.

Из выражения для сигмоида очевидно, что выходное значение нейрона лежит в диапазоне [0,1]. Одно из ценных свойств сигмоидной функции -- простое выражение для ее производной:

f '(s) = б f(s)(1 - f (s)).

Производная функции активации используется при обучении сети. Для решения поставленной задачи будем использовать алгоритм обратного распространения ошибки, который предполагает два прохода по всем слоям сети: прямого и обратного.

При прямом проходе входной вектор подается на входной слой нейронной сети, после чего распространяется по сети от слоя к слою. В результате генерируется набор выходных сигналов, который и является фактической реакцией сети на данный входной образ. Во время прямого прохода все синаптические веса сети фиксированы.

На каждой итерации во время обратного прохода производится корректировка весов нейронной сети в соответствии с дельта-правилом:

Дw_i= ндx_i,

где д -- ошибка на выходе скрытого нейрона, н -- коэффициент скорости обучения, x_i-- значения, поступающие по входным связям, для которых вычисляется коррекция.

Зная ее величину для i-й связи, можно вычислить новый вес

w_i(h + 1) = w_i(h) + Дw,

где h -- номер итерации обучения. Веса связей настраиваются с целью максимального приближения выходного сигнала сети к желаемому. На каждом h-ом этапе обучения

Рис. 2. Радиально-базисная сеть

В результате обучения радиально-базисной сети методом обратного распространения ошибки с использованием полученного множества пар (r_j, C_k) будет получена сеть, способная классифицировать объекты, информация о которых хранится в анализируемой таблице.

Благодаря способности нейронных сетей к обобщению, т.е. распространению выделенных знаний на неизвестные ранее образцы, обученную сеть можно применять для классификации объектов, не входивших в достоверную БД.

При этом степень уверенности в принадлежности образца, поданного на вход, к определённому классу определяется максимальным значением выхода нейронов выходного слоя, т.е.

d(r_m₊₁) = max(out²₁, out²₂, …, out²_T),

где

out²_i -- значение выхода i-го нейрона выходного слоя сети; max -- функция, вычисляющая максимальное значение;

d -- оценка достоверности.

Низкое значение d означает, что поданный на вход образец не относится ни к одному из классов с достаточной степенью уверенности и, следовательно, может содержать ошибки или неточности. Данный параметр можно использовать в качестве значения оценки достоверности.

Таким образом, в методике можно выделить 3 основных этапа, указанных на рис. 3.

Помимо рассмотренного случая, возможен вариант, когда имеется таблица, содержащая большое количество строк, достоверность которых неизвестна и её требуется оценить.

Рис. 3. Общая схема методики верификации таблицы базы данных

Данный случай можно свести к описанному ранее, если в качестве подготовительного этапа верификации выбрать из таблицы некоторое число строк и проверить их вручную, получив, таким образом, достоверные строки, которые можно использовать в качестве обучающей выборки.

Таким образом, предложенная методика может применяться для решения задач верификации различных БД. На данный момент программно реализована процедура создания радиально-базисных ИНС заданной конфигурации и их обучения методом обратного распространения ошибки с возможностью управления параметрами обучения [7]. Приведенное математическое описание методики позволяет получить её программную реализацию для дальнейшего проведения численных экспериментов и практического применения полученного программного средства.

Литература

1. Открыт новый этап верификации баз данных по имущественным налогам физических лиц [Электронный ресурс]. -- Сайт УФНС России по Московской области. // URL: http://www.r50.nalog.ru/ns/3869612/ (дата обращения: 20.02.2012)

2. Карпова Т.С. Базы данных: модели, разработка, реализация [Текст] / Т.С. Карпова -- СПб.: Питер, 2001. -- 304 с.; ил. ISBN 5-272-00278-4

3. Барсегян А.А. Технологии анализа данных: Data Mining, Visual Mining, Text Mining, OLAP [Текст] / А.А. Барсегян, М.С. Куприянов, М.С. Кузнецов, В.В. Степаненко, И.И. Холод. -- 2-е изд. перераб. и доп. -- СПб.: БХВ-Петербург, 2007. -- 384 с.: ил. ISBN 5-94157-991-8

4. Каллан Р. Основные концепции нейронных сетей [Текст].: Пер. с англ. -- М.: Издательский дом «Вильямс», 2001. -- 287 с. ISBN 5-8459-0210-X

5. Галушка В.В. Методика определения оптимального числа нейронов выходного слоя сети Кохонена при решении задач кластеризации [Текст] / В.В. Галушка, Д.В. Фатхи // Информационная безопасность регионов. -- 2011. -- №2. -- с. 41-44

6. Галушка В.В. Программная модель для исследования возможностей применения искусственных нейронных сетей в агропромышленном комплексе [Текст] / В.В. Галушка, В.А. Фатхи // Состояние и перспективы развития сельскохозяйственного машиностроения: материалы междунар. науч.-практ. конф. / ДГТУ. -- Ростов н/Д, 2011. -- с. 229-231

7. Программа синтеза многослойных искусственных нейронных сетей прямого распространения с изменяемыми параметрами обучения: свид-во о гос. регистрации прогр. для ЭВМ 2011617298 Рос. Федерация / В.В. Галушка, Дм.В. Фатхи, Д.В. Фатхи; заяв. 2011615489 21.07.2011

...

статья "Применение многослойных радиально-базисных нейронных сетей для верификации реляционных баз данных" скачать

Подобные документы

Разработка и исследование искусственной нейронной сети для управления динамическим объектом с переменными параметрами
Математическая модель нейронной сети. Однослойный и многослойный персептрон, рекуррентные сети. Обучение нейронных сетей с учителем и без него. Алгоритм обратного распространения ошибки. Подготовка данных, схема системы сети с динамическим объектом.

дипломная работа [2,6 M], добавлен 23.09.2013
Метод обучения нейронных сетей (правило обратного распространения ошибки)
Обучение простейшей и многослойной искусственной нейронной сети. Метод обучения перцептрона по принципу градиентного спуска по поверхности ошибки. Реализация в программном продукте NeuroPro 0.25. Использование алгоритма обратного распространения ошибки.

курсовая работа [1019,5 K], добавлен 05.05.2015
Автоматизированная система построения нейронной сети методом обратного распространения ошибки
Рассмотрение способов применения и основных понятий нейронных сетей. Проектирование функциональной структуры автоматизированной системы построения нейросети обратного распространения ошибки, ее классов и интерфейсов. Описание периода "бета тестирования".

дипломная работа [3,0 M], добавлен 02.03.2010
Разработка программы моделирования нейронной сети
Общие сведения о принципах построения нейронных сетей. Искусственные нейронные системы. Математическая модель нейрона. Классификация нейронных сетей. Правила обучения Хэбба, Розенблатта и Видроу-Хоффа. Алгоритм обратного распространения ошибки.

дипломная работа [814,6 K], добавлен 29.09.2014
Искусственные нейронные сети
Возможности программ моделирования нейронных сетей. Виды нейросетей: персептроны, сети Кохонена, сети радиальных базисных функций. Генетический алгоритм, его применение для оптимизации нейросетей. Система моделирования нейронных сетей Trajan 2.0.

дипломная работа [2,3 M], добавлен 13.10.2015
Алгоритм обратного распространения ошибки
Обучение нейронных сетей как мощного метода моделирования, позволяющего воспроизводить сложные зависимости. Реализация алгоритма обратного распространения ошибки на примере аппроксимации функции. Анализ алгоритма обратного распространения ошибки.

реферат [654,2 K], добавлен 09.06.2014
Программное обеспечение, использующие в качестве вычислительного механизма для прогнозирования - нейронные сети
Прогнозирование на фондовом рынке с помощью нейронных сетей. Описание типа нейронной сети. Определение входных данных и их обработка. Архитектура нейронной сети. Точность результата. Моделирование торговли. Нейронная сеть прямого распространения сигнала.

дипломная работа [2,7 M], добавлен 18.02.2017
Кластеризация с помощью нейронных сетей
Сущность, структура, алгоритм функционирования самообучающихся карт. Начальная инициализация и обучение карты. Сущность и задачи кластеризации. Создание нейронной сети со слоем Кохонена при помощи встроенной в среды Matlab. Отличия сети Кохонена от SOM.

лабораторная работа [36,1 K], добавлен 05.10.2010
Разработка искусственной нейронной сети
Математическая модель искусственной нейронной сети. Структура многослойного персептрона. Обучение без учителя, методом соревнования. Правило коррекции по ошибке. Метод Хэбба. Генетический алгоритм. Применение нейронных сетей для синтеза регуляторов.

дипломная работа [1,5 M], добавлен 17.09.2013
Разработка и реализация нейросетевого поиска в рамках проекта "AIST"
Построение векторной модели нейронной сети. Проектирование и разработка поискового механизма, реализующего поиск в полнотекстовой базе данных средствами нейронных сетей Кохонена с применением модифицированного алгоритма расширяющегося нейронного газа.

курсовая работа [949,0 K], добавлен 18.07.2014
Применение нейронных сетей для прогнозирования в экономике
Исследование задачи и перспектив использования нейронных сетей на радиально-базисных функциях для прогнозирования основных экономических показателей: валовый внутренний продукт, национальный доход Украины и индекс потребительских цен. Оценка результатов.

курсовая работа [4,9 M], добавлен 14.12.2014
Аппроксимация функции с использованием нейронных сетей
Понятие искусственного нейрона и искусственных нейронных сетей. Сущность процесса обучения нейронной сети и аппроксимации функции. Смысл алгоритма обучения с учителем. Построение и обучение нейронной сети для аппроксимации функции в среде Matlab.

лабораторная работа [1,1 M], добавлен 05.10.2010
Моделирование сети кластеризации данных в MATLAB NEURAL NETWORK TOOL
Сущность и понятие кластеризации, ее цель, задачи, алгоритмы; использование искусственных нейронных сетей для кластеризации данных. Сеть Кохонена, самоорганизующиеся нейронные сети: структура, архитектура; моделирование кластеризации данных в MATLAB NNT.

дипломная работа [3,1 M], добавлен 21.03.2011
Нейронные сети и их применение для распознавания образов
Описание структурной схемы искусственного нейрона. Характеристика искусственной нейронной сети как математической модели и устройств параллельных вычислений на основе микропроцессоров. Применение нейронной сети для распознавания образов и сжатия данных.

презентация [387,5 K], добавлен 11.12.2015
Разработка автоматизированной системы классификации товаров по изображениям
Программное обеспечение для получения исходных данных для обучения нейронных сетей и классификации товаров с их помощью. Алгоритм метода обратного распространения ошибки. Методика классификации товаров: составление алгоритма, программная реализация.

дипломная работа [2,2 M], добавлен 07.06.2012
Распознавание образов (на примере цифр)
Принципы и система распознавание образов. Программное средство и пользовательский интерфейс. Теория нейронных сетей. Тривиальный алгоритм распознавания. Нейронные сети высокого порядка. Подготовка и нормализация данных. Самоорганизующиеся сети Кохонена.

курсовая работа [2,6 M], добавлен 29.04.2009
Разработка топологии нейронной сети для прогнозирования выбора тяжелых токарных станков
Математические модели, построенные по принципу организации и функционирования биологических нейронных сетей, их программные или аппаратные реализации. Разработка нейронной сети типа "многослойный персептрон" для прогнозирования выбора токарного станка.

курсовая работа [549,7 K], добавлен 03.03.2015
Решение задач с использованием нейронных сетей в Matlab
Технологии решения задач с использованием нейронных сетей в пакетах расширения Neural Networks Toolbox и Simulink. Создание этого вида сети, анализ сценария формирования и степени достоверности результатов вычислений на тестовом массиве входных векторов.

лабораторная работа [352,2 K], добавлен 20.05.2013
Основные системы построения сети 10 Base T
Монтаж и прокладывание локальной сети 10 Base T. Общая схема подключений. Сферы применение компьютерных сетей. Протоколы передачи информации. Используемые в сети топологии. Способы передачи данных. Характеристика основного программного обеспечения.

курсовая работа [640,0 K], добавлен 25.04.2015
Обзор и анализ нейросетей
Разработка систем автоматического управления. Свойства нейронных сетей. Сравнительные оценки традиционных ЭВМ и нейрокомпьютеров. Формальная модель искусственного нейрона. Обучение нейроконтроллера при помощи алгоритма обратного распространения ошибки.

реферат [1,4 M], добавлен 05.12.2010

Другие документы, подобные "Применение многослойных радиально-базисных нейронных сетей для верификации реляционных баз данных"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.