Разработка вычислительно-эффективных алгоритмов классификации
Ознакомление с методами оптимизации процессов программных вычислений. Рассмотрение преимуществ корпоративных информационных систем, функционирующих на базе распределенных компьютерных сетей. Анализ набора элементарных операций над случаями лечения.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 19.01.2018 |
Размер файла | 24,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Ростовский государственный университет путей сообщения
Разработка вычислительно-эффективных алгоритмов классификации
Евдокимов А.В., к.т.н.
e-mail: aevd@rambler.ru
Введение
Объектом рассмотрения настоящей работы являются методы оптимизации процессов программных вычислений. Практическим приложением являются алгоритмы классификации в области медицины.
С ростом вычислительных ресурсов компьютерных систем вопросы эффективных вычислений практически перестали рассматриваться специалистами в данной области, тем не менее, покажем, что проблемы разработки эффективно вычислимых (алгоритмов) по-прежнему актуальны.
Стремительное развитие вычислительной техники привело к тому, что практически во всех отраслях народного хозяйства были внедрены и продолжают развиваться и модернизироваться крупные корпоративные информационные системы, функционирующие на базе распределенных компьютерных сетей, обрабатывающие огромное количество разнородной информации, исходящей из множества различных источников. Увеличение объема вычислительных задач и необходимость выполнения их за приемлемое для системы время свидетельствуют об актуальности дальнейшего развития методов эффективных вычислений и их внедрения в системы обработки информации.
Одной из проблем, возникающих в ходе деятельности лечебного учреждения в рамках оказания медицинской помощи, является формирование стандартов оказания услуг.
Предлагаемая методика позволит нормировать доходы лечебного учреждения, оказывающего медицинскую помощь при применении схемы оплаты за законченный случай лечения.
Под стандартом в данном случае понимается перечень услуг, оказываемых для диагностики и лечения установленного заболевания либо комплекса заболеваний, включающего сопутствующие. Стандарт лечения подразумевает также определенную стоимость случая лечения.
При использовании технологии автоматизированной обработки данных о ходе диагностики и лечения пациентов, информация о случае лечения включает в себя набор параметров, таких как шифры диагнозов (основного и сопутствующих), набора услуг, оказываемых для лечения данного случая (включая их стоимость).
Задача автоматизированного формирования стандартов лечения, рассматриваемая в данной работе, предполагает формирование минимального набора стандартов лечения (с расчетом их конечной стоимости), позволяющего определить набор возможных видов оказания медицинской помощи (фактически, включая прейскурант работы лечебного учреждения).
Кроме того, предлагается разработать алгоритм, относящий реальный случай лечения к одному из стандартов согласно данным, известным о случае до начала лечения. Это позволит отнести случай заболевания к одному из предполагаемых стандартов на этапе диагностики.
Кроме того, при разработке методики, учтем федеральные стандарты лечения и предусмотрим возможность автоматизированной оценки качества их исполнения (процент выполнения стандарта).
Таким образом, видна необходимость разработки алгоритмов классификации, применяемых в медицине.
1. Характеристика предметной области
Случай лечения является сущностью объективного мира и характеризуется множеством различных параметров. Для целей нашего исследования целесообразным представляется сбор следующих исходных данных о случае лечения. программный информационный компьютерный
1. Возраст (на момент обращения).
2. Предварительный диагноз.
3. Ожидаемая итоговая стоимость лечения (по существующей схеме оплаты).
4. Фактические затраты на лечение.
5. Длительность лечения (количество койко-дней, врачебных манипуляций, посещений).
6. Сопутствующий диагноз.
7. Дополнительные обследования.
Основными проблемами, возникающими при решении задач классификации случаев лечения методами кластерного анализа, являются:
· выбор целевой функции, согласно постановке задачи;
· выбор функции сравнения параметров в пространстве случаев заболевания.
2. Разработка вычислительно-эффективных алгоритмов классификации
Частичные вычисления - это техника, предназначенная для оптимизации процесса программных вычислений. Процесс программных вычислений представляет собой отображение входных данных на выходные:
,
где: - статические данные, известные до начала вычислений;
- динамические (исходные) данные программы;
- выходные данные.
Процесс частичных вычислений преобразует ( в () вычислением всех статических данных на стадии компиляции. Таким образом, полученная после преобразования с использованием метода частичных вычислений программа является более эффективной, чем исходная.
2.1 Автоматическая генерация программ
Покажем возможность создания генераторов программ, преобразующих исходные программы с использованием метода частичных вычислений.
Метод частичных вычислений всегда порождает корректную программу:
out = [[ source]]S input = [[int]] [source, input] = [[[[mix]] [int, source] ]] input = [[target]] input
Здесь:int - интерпретатор,
mix - процедура частичных вычислений.
Таким образом, процесс автоматической генерации программ с использованием метода частичных вычислений описывается показанной далее последовательностью шагов.
1. Интерпретация исходного кода программы, написанной на языке S.
2. Преобразование исходной программы с использованием методики частичных вычислений.
3. Генерация результирующей преобразованной программы на языке L.
Выражение [target] = [mix] int, source часто называется первой проекцией Футамуры и впервые описано в [1].
Автором разрабатывались алгоритмы оптимизации, основанные на технике частичных вычислений. Например [2].
Пусть задано множество точек в пространстве и реализован алгоритм, определяющий принадлежность точки к определенному классу , где - набор правил, определяющий метод классификации (целевая функция классификации).
Алгоритм классификации состоит из последовательности некоторых элементарных операций. Разработаем процедуру построения вычислительно-эффективного метода классификации для заданных множеств входных параметров.
Для разработки вычислительно-эффективного метода классификации необходимо разработать алгоритмы оптимизации:
· разбиения заданного набора точек на множества в соответствии с целевой функцией;
· определения принадлежности выбранной точки одному из классов;
· определения принадлежности выбранного множества точек классам.
Алгоритм оптимизации в контексте данного раздела представляет собой метод, основанный на технике частичных вычислений и предназначенный для уменьшения объема вычислений времени выполнения алгоритма за счет увеличения объема вычислений на этапе компиляции.
Практическое повышение эффективности зависит от того, как часто изменяется множество входных параметров, так как каждое изменение приводит к необходимости повторного выполнения вычислительно-трудоемкой процедуры оптимизации, что снижает общую эффективность системы в целом.
Очевидно, что эффективности оптимизационной процедуры (степень повышения быстродействия алгоритма) зависит от степени разбиения алгоритма на элементарные операции. Возможно применять иерархический алгоритм оптимизации, сначала применяемый к операциям высокого уровня, затем более низкого.
Рассмотрим простейшую процедуру оптимизации.
Шаг процедуры оптимизации любого уровня представляет собой объединение нескольких терминальных либо нетерминальных символов грамматики (подвыражения), описывающей алгоритм классификации и замену его новым символом грамматики, который определяется алгоритмом оптимизации. Объединение возможно в случае, если все элементы подвыражения вычислимы на этапе компиляции. В случае расположенных элементов такая операция имеет линейную вычислительную сложность и легко реализуема в виде простого алгоритма.
Например, выражение , преобразуется к виду .
А так же выражение к виду
Однако такой алгоритм уже не преобразует к виду , а выражение к виду
То есть для построения эффективной процедуры оптимизации необходимо разработать алгоритм поиска зависимостей между элементами. Также следует учесть специфику предметной области и оптимизируемых алгоритмов, что позволит повысить вычислительную эффективность алгоритма оптимизации.
2.2 Набор элементарных операций над случаями лечения
Пусть заданы различные сущности, относящиеся к одному множеству и имеющие одинаковый набор атрибутов. Тогда возможно разработать набор элементарных операций на данном множестве.
Разработка таких операций позволяет упростить разработку и описание алгоритмов взаимодействия таких сущностей и алгоритмов поиска оптимального значения минимизируемой функции, аргументами которой являются элементы множества.
Кроме того, возможно произвести разработку процедур оптимизации расчетов на этапе проведения вычислительного эксперимента.
Пусть задано множество точек в мерном пространстве . Обозначим - -ю размерность точки
Отметим, что различные размерности в пространстве могут иметь различную степень релевантности.
Обозначим - пустое значение атрибута (размерности). Будем применять, когда значение атрибута не заполнено.
Определим для случаев лечения следующие операции.
1. Пересечение случаев лечения
2. Объединение случаев лечения
3. Инверсия случая лечения.
4. Нечеткий минимум
5. Нечеткий максимум
6. Нечеткая инверсия
7. Близость.
где
Разработанные операции будут использованы при описании алгоритмов классификации для первого уровня иерархической оптимизации.
Таким образом, основная трудность в создании алгоритма заключается в выборе процедуры перебора синтаксического дерева, с целью определения выражений, значение которых может быть вычислено на стадии компиляции.
Автором предполагается опробовать несколько различных алгоритмов перебора с целью сравнения их итоговой эффективности. Результаты будут изложены в последующих статьях.
Выводы
В работе показана актуальность проблемы дальнейшего развития методов эффективных вычислений и их внедрения в системы обработки информации, рассмотрены основные трудности разработки и реализации предлагаемого алгоритма, намечены пути дальнейшего совершенствования алгоритма.
Литература
1. Futamura Y. Partial evaluation of computation process - an approach to a compiler / Systems, Computers, Controls, 2(5):45-50, 1971.
2. Евдокимов А.В. Использование техники частичных вычислений для оптимизации процессов обработки информации в программных комплексах // Журнал научных публикаций аспирантов и докторантов. Курск, 2008.-№ 2.
Размещено на Allbest.ru
...Подобные документы
Изучение понятия корпоративной информационной системы; требования к их разработке. Ознакомление с процессом проектирования и внедрения данных компьютерных технологий на производстве. Рассмотрение специфики работы корпоративных информационных систем.
курсовая работа [33,1 K], добавлен 02.11.2014Эффективность построения и использования корпоративных информационных систем. Описание программных систем имитационного моделирования сетей. Обозначения и интерфейс программы "Net-Emul". Использование маршрутизатора (роутера) как сетевого устройства.
контрольная работа [1,9 M], добавлен 22.12.2011Признаки классификации вычислительных, информационных и смешанных компьютерных сетей. Пользовательские приложения и их соответствия стандартам. Потенциально высокая производительность распределенных систем. Поддержка видов трафика и качество обслуживания.
дипломная работа [34,7 K], добавлен 22.02.2011Использование компьютерных сетей для передачи данных. Основные преимущества использования корпоративных сетей, защищенных от доступа извне физически или при помощи аппаратно программных средств сетевой защиты. Сетевой экран и алгоритмы шифрования.
дипломная работа [573,3 K], добавлен 25.09.2014Виды архитектуры распределенных информационных систем. Сущность синхронного и асинхронного, блокирующего и неблокирующего взаимодействия в распределенных информационных системах. Основные проблемы и принципы реализации удаленного вызова процедур.
реферат [26,4 K], добавлен 22.06.2011Основные признаки классификации компьютерных сетей как нового вида связи и информационного сервиса. Особенности локальных и глобальных сетей. Объекты информационных сетевых технологий. Преимущества использования компьютерных сетей в организации.
курсовая работа [1,9 M], добавлен 23.04.2013Агентно-ориентированная программная архитектура систем обработки потоковых данных. Обеспечение гибкости и живучести программного обеспечения распределенных информационно-управляющих систем. Спецификации программных комплексов распределенной обработки.
реферат [1,1 M], добавлен 28.11.2015Повышение эффективности системы управления информационной безопасностью в корпоративных информационных системах. Разработка структуры процесса классификации объектов защиты и составляющих его процедур; требования к архитектуре программного обеспечения.
дипломная работа [1,8 M], добавлен 19.05.2013Описание промышленных компьютерных сетей. Анализ файлов, передаваемых по ним и общие требования к реализуемой библиотеке. Архитектура и уровни интерфейса библиотеки, принципы реализации алгоритмов исполняемых и неисполняемых структурированных файлов.
дипломная работа [883,5 K], добавлен 12.08.2017Общая характеристика преимуществ взаимодействующих процессов: модульность, ускорение вычислений. Знакомство с основами современных операционных систем. Анализ особенностей использования общего почтового ящика, рассмотрение способов создания и удаления.
презентация [1,6 M], добавлен 24.01.2014Детерминированный и вероятностный подходы к оценке живучести сетей. Анализ моделей гибели и вероятности связности сетей. Табличное представление результатов вычислений и построение графических зависимостей в программе, написанной на языке Object Pascal.
дипломная работа [2,9 M], добавлен 03.09.2013Виды обеспечения автоматизированных информационных систем. Составление технического задания, разработка информационной системы, составление руководства пользователя к программе. Средства программирования распределенных систем обработки информации.
отчет по практике [1,1 M], добавлен 16.04.2017Структура современных корпоративных сетей. Применение технологии Intranet в корпоративных сетях передачи данных. Принципы их построения и главные тенденции развития. Особенности стандартов Fast Ethernet и Gigabit Ethernet. Технология 100VG-AnyLAN.
курсовая работа [1,5 M], добавлен 02.07.2011Математический процессор для вычисления элементарных функций. Расчет разрядности представления данных и числа итераций. Разработка алгоритмов вычисления функции в математическом пакете. Обоснование достаточности аппаратных средств, программных ресурсов.
курсовая работа [615,9 K], добавлен 19.12.2010Конфигурация аппаратных средств и характеристика программных средств для создания беспроводных компьютерных сетей, особенности их использования и анализ возможных проблем. Технология организация безопасной работы в беспроводных компьютерных сетях.
курсовая работа [2,5 M], добавлен 27.12.2011Анализ средств построения динамически масштабируемых ВС. Разработка алгоритма, обеспечивающего устойчивость функционирования информационно-вычислительных сетей в условиях воздействий компьютерных атак, использующих фрагментированные пакеты сообщений.
дипломная работа [3,8 M], добавлен 21.12.2012Методология структурного анализа и проектирования информационных систем. Базовый стандарт процессов жизненного цикла программного обеспечения. Цели и принципы формирования профилей информационных систем. Разработка идеальной модели бизнес-процессов.
презентация [152,1 K], добавлен 07.12.2013Разработка городских систем на базе мобильных интерфейсов. Методики геокодирования в информационных системах, ориентированных на определенную группу пользователей. Прототипная реализация туристической карты для мобильных устройств на платформе Android.
дипломная работа [4,3 M], добавлен 05.12.2013Рассмотрение взаимосвязи информационных подсистем предприятия. Характеристика сервис-ориентированной архитектуры информационных систем. Оценка реализации SOA-инфраструктуры на базе сервисной шины предприятия. Анализ бизнес-цели внедрения SOA-решений.
контрольная работа [1,0 M], добавлен 28.03.2018Общее понятие, история возникновения и эволюция корпоративных информационных систем. Сущность, виды, возможности и механизм работы систем класса MRPII/ERP. Способы внедрения и оценка эффективности использования систем класса MRPII/ERP на предприятии.
курсовая работа [263,5 K], добавлен 03.06.2010