Применение мягких вычислений для формирования оптимального подмножества тестов

Формирование и выбор "хороших" безусловных безызбыточных диагностических тестов (ББДТ) как один из наиболее важных при принятии решений в интеллектуальных системах. Тест - совокупность признаков, различающих пары объектов, принадлежащих разным образам.

Рубрика Программирование, компьютеры и кибернетика
Вид доклад
Язык русский
Дата добавления 19.01.2018
Размер файла 54,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Применение мягких вычислений для формирования оптимального подмножества тестов**Работа выполнена при финансовой поддержке РФФИ (проект № 07-01-00452 и проект № 09-01-99014-р_офи)

Янковская А.Е.

Цой Ю.Р.

Введение

Формирование и выбор "хороших" [1] безусловных безызбыточных диагностических тестов (ББДТ) является одним из наиболее важных при принятии решений в интеллектуальных системах, поскольку от свойств используемых тестов существенно зависит качество принимаемых решений. Идея использования мягких вычислений, к которым относятся генетические алгоритмы (ГА), для построения ББДТ при большом признаковом пространстве предложена в статьях [2, 3]. Первые алгоритмы построения ББДТ, описанные в [2, 3], программно реализованы и развиты в плане оптимизации построения ББДТ в последующих работах Янковской А.Е. и Янковской А.Е. с Блейхер А.М. [4].

Однако, выбор "хороших" ББДТ не всегда приводит к оптимальному решению, поскольку общее количество признаков в выбранном множестве тестов может быть слишком большим, также как временные и стоимостные затраты или ущерб (риск) [5], наносимый в результате выявления значений признаков исследуемого объекта, например, в медицине. Впервые критерии оптимальности и актуальная задача поиска оптимального подмножества безызбыточных безусловных диагностических тестов (ББДТ) поставлена в статье [6]. В статье [7] сформулированы критерии оптимальности, а в статье [8] предложено три алгоритма, обеспечивающие выполнение этих критериев: логико-комбинаторный, алгоритм на основе метода анализа иерархии и генетический алгоритм (ГА).

В докладе представлены результаты исследования применения ГА для решения поставленной задачи и сформулированы направления дальнейших исследований.

Определения и обозначения

Воспользуемся определениями и обозначениями, необходимыми для постановки задачи и при дальнейшем изложении [6, 9].

Тестом называется совокупность признаков, различающих любые пары объектов, принадлежащих разным образам (классам). Тест называется безызбыточным, если при удалении любого признака тест перестает быть тестом. Признак называется обязательным, если он содержится во всех безызбыточных тестах. Признак называется псевдообязательным, если он не является обязательным и входит во множество используемых при принятии решений безызбыточных тестов.

Пусть тест интеллектуальный образ

-

матрица ББДТ, n - количество ББДТ, m - количество характеристических признаков, строкой представлен i-й ББДТ. Обозначим через

-

множество характеристических признаков, причем

.

Для каждого признака zj зададим весовой коэффициент wj и коэффициенты стоимости и ущерба (риска) [5]. Далее будем использовать термины "вес", "стоимость" и "ущерб" признака вместо соответственно "весовой коэффициент", "коэффициент стоимости" и "коэффициент ущерба".

Будем рассматривать случай бинарной матрицы T и определим вес i-го теста:

.

Аналогично определяются значения стоимости и ущерба теста.

Постановка задачи

Дана матрица тестов T с заданными весами, стоимостью и ущербами признаков.

Необходимо выделить такую подматрицу T0, содержащую n0 строк, чтобы соответствующее ей множество тестов N0 обеспечивало выполнение следующих критериев в порядке их следования: 1) в N0 должно содержаться максимальное число псевдообязательных признаков; 2) N0 должно содержать минимальное общее число признаков; 3) N0 должно иметь максимальный суммарный вес; 4) N0 должно иметь наименьшую суммарную стоимость; 5) N0 должно иметь наименьший суммарный ущерб.

Генетический алгоритм

Для решения поставленной задачи предлагается использовать ГА, представляющий итерационный вероятностный эвристический алгоритм поиска. Отличительной особенностью ГА является одновременная работа со множеством точек (популяцией) из пространства потенциальных решений. Каждое возможное решение представлено бинарной хромосомой (строкой) длины n, каждый i-й символ которой кодирует включение i-го диагностического теста в итоговое подмножество.

Будем вычислять приспособленность k-й особи c хромосомой h путем оценки качества соответствующей подматрицы в соответствии с выражением [5]:

, ,

где - весовой коэффициент j-го критерия, соответствующий его значимости; - количество единичных разрядов в бинарной строке ; - функция штрафа за невыполнение j-го критерия:

,

где и - соответственно суммарный вес, стоимость и ущерб по всем тестам множества, соответствующего матрице ;

и -

соответственно количество единичных разрядов в конъюнкции и дизъюнкции по всем строкам бинарной матрицы .

Поскольку необходимо максимизировать максимальное количество псевдообязательных признаков в искомом подмножестве ББДТ (критерий 1), а также его суммарный вес (критерий 3), но рассматривается задача минимизации целевой функции f, то в выражениях для соответствующих критериям функций штрафа и используется вычитание количества псевдообязательных признаков и веса от максимальных значений. Аналогичные рассуждения использовались при выборе вида функций штрафов для критериев 2, 4 и 5.

Отметим, что выбор значений штрафов зависит от рассматриваемой прикладной задачи.

Результаты экспериментов

Исследование ГА для решения поставленной задачи проведено с использованием псевдослучайных матриц тестов размерностями 1000х 50, 1000х 100, 1000х 200, 1000х 300, 1000х 400, 1000х 500, 2000х 500. Элементы матриц определяются псевдослучайным образом, после чего производится удаление поглощающих строк. Значения весов, стоимостей и ущербов признаков также определяются как псевдослучайные величины, равномерно распределенные в интервале [0; 1]. Мощность n0 искомого подмножества тестов для всех экспериментов равна 300.

Отметим, что псевдослучайное заполнение матриц тестов соответствует отсутствию корреляции между характеристическими признаками, что приводит к минимизации числа возможных закономерностей в исходной матрице тестов. В силу этого использование псевдослучайных матриц тестов представляет более сложную задачу по сравнению с реальной.

Значения штрафов установлены следующим образом: , , , , . Рассматривается ГА с турнирной селекцией с размером турнира равным 6, двухточечным оператором кроссинговера, битовой мутацией и 1 элитной особью. По итогам 100 независимых запусков для каждой из рассматриваемых матриц оцениваются результаты, как по полученному лучшему значению функции приспособленности, так и по параметрам, сформулированным в статье [10] и характеризующим стабильность решений, полученных в различных запусках:

1. Критерий стабильности, учитывающий частоту pi встречаемости i-го теста во всех решениях, полученных по результатам 100 запусков ГА. Чем больше количество тестов, для которых значение pi равно или близко к 1, тем выше сходимость алгоритма.

2. Суммарное количество () ББДТ, не вошедших в полученные решения. Чем больше значение , тем выше сходимость алгоритма.

Полученные лучшие значения целевой функции, усредненные по 100 запускам, для различных матриц ББДТ в зависимости от размера популяции показаны на рис. 1. При увеличении размера (r) популяции наблюдаем улучшение результатов, однако это улучшение весьма незначительно, в большинстве случаев, порядка 10-2.

Рис. 1. Результаты решения задачи в зависимости от размера r популяции для псевдослучайных матриц различной размерности

Анализ решений, полученных при различных настройках ГА, показал, что сформированные по 100 запускам подмножества тестов, соответствующие различным параметрам ГА, отличаются незначительно. Например, для матрицы тестов 1000х 500 при размерах популяции 50 и 200 особей полученные подмножества тестов отличались только на 35 тестов, что позволяет сделать вывод о достаточно высокой степени сходимости алгоритма. Однако значительное количество тестов, встречающихся менее чем в 50% решений (соответственно, 460 и 162 для популяций из 50 и 200 особей) свидетельствует о возможности повышения эффективности работы ГА и сходимости результатов.

Также было проведено исследование зависимости состава подмножества тестов, сформированного по результатам нескольких запусков ГА, от количества запусков. При использовании матрицы тестов размерностью 1000x500 результаты ГА с популяцией размером 50 особей для 10, 20, 30, 40, 50, 60, 70, 80, 90 и 100 запусков совпадают для 245 тестов (из 300 искомых). Совпадение с результатами ГА с популяцией 200 особей составляет 244 теста. Таким образом, несмотря на различное количество запусков и размер популяции, 245 и 244 теста присутствуют в большинстве найденных решений.

Отметим, что увеличение размера популяции способствует повышению сходимости ГА по критериям из статьи [10], однако получены результаты, свидетельствующие о том, что для матриц тестов, имеющих не больше 1000 строк, анализ решений, сформированных при использовании сравнительно небольшого размера популяции и малого количества запусков, позволяет построить подмножество тестов, близкое к оптимальному.

Данный вывод представляется авторам статьи весьма важным, так как показывает, что возможно эффективное решение поставленной задачи с использованием сравнительно небольших вычислительных затрат. Однако данный вывод необходимо проверить на реальных данных.

Таким образом, сокращение количества особей в популяции в a1 раз и количества запусков ГА в--a2 раз, позволяет уменьшить вычислительные затраты и время поиска решения пропорционально произведению a1a2.

Направления дальнейших исследований

Для повышения скорости сходимости ГА предполагается реализовать процедуру редукции многокритериальной задачи построения оптимального подмножества ББДТ. В результате этого число критериев оптимизации будет уменьшено, что приведет к уменьшению количества недоминируемых решений и, следовательно, глобальных экстремумов в пространстве поиска.

Также, исходя из изложенных выше результатов исследований, уменьшение размера исходной матрицы ББДТ способствует повышению качества получаемых решений. Отметим, что уменьшение размеров исходной матрицы возможно в частности путем удаления столбцов, сопоставленных обязательным признакам, в силу следующей теоремы:

Теорема: Соотношения между весовыми коэффициентами безызбыточных диагностических тестов не изменяются при исключении из каждого теста обязательных признаков.

Доказательство: Пусть сумма весовых коэффициентов обязательных признаков равна Wоб. Рассмотрим два любых теста из матрицы Т ББДТ: Ti и Tj, , весовые коэффициенты которых соответственно равны Wi и Wj. Рассмотрим разность между весовыми коэффициентами тестов Ti и Tj после удаления обязательных признаков:

(Wi - Wоб) - (Wj - Wоб) = Wi - Wj.

Таким образом, в силу произвольности выбора тестов Ti и Tj удаление обязательных признаков не влияет на соотношение между весовыми коэффициентами этих тестов.

Необходимо отметить, что в одной из предыдущих статей [11] была предложена модификация ГА, предусматривающая постепенное удаление строк в исходной матрице тестов в процессе эволюционного поиска в результате анализа текущих результатов оптимизации.

Заключение

Полученные в результате исследований результаты показывают высокую эффективность эволюционного подхода к выбору оптимального подмножества ББДТ для псевдослучайных матриц тестов. Однако приведенные выводы требуют проверки при решении практических задачах.

Дальнейшие исследования будут направлены на реализацию алгоритма выбора оптимального подмножества ББДТ с использованием выше сформулированной теоремы, его исследование и на повышение эффективности формирования оптимального подмножества ББДТ путем реализации процедуры редукции критериев при построении оптимального подмножества ББДТ для решения задач принятия решений на основе тестового распознавания образов.

Литература

1. Naidenova R.A., Plaksin M.V., Shagalov V.L. Inductive inferring all good classification test // Труды конференции "Знание-Диалог-Решение". -Т.1, 1995. - С.79-84.

2. Янковская А.Е. Тестовое распознавание образов с использованием генетических алгоритмов // Труды конференции "Распознавание образов и анализ изображений: новые информационные технологии" (РОАИ-4-98). -Ч. I. - Новосибирск, 1998. - С.195-199.

3. Yankovskaya A.E. Test Pattern Recognition with the Use of Genetic Algorithms // Pattern Recognition and Image Analysis, vol.9. -no.1, 1999. -P.121-123.

4. Yankovskaya A.E., Bleikher A.M. Optimization of tests synthesis on the base of descent algorithms with the use of genetic transformations // Radioelectronics & Informatics. -no.3(24), 2003. -P.51-55.

5. Yankovskaya A. E, Tsoy Y.R. Optimization of a set of tests selection satisfying the criteria prescribed using compensatory genetic algorithm // Proc. of IEEE East-West Design & Test Workshop (EWDTW'05) Odessa, Ukraine, September, 2005 - Kharkov: SPD FL Stepanov V.V. - P.123-126.

6. Янковская А.Е. Построение логических тестов с заданными свойствами и логико-комбинаторное распознавание на них // Тезисы докладов конференции ИОИ-2002. - Симферополь, 2002. - С.100-102.

7. Yankovskaya A.E., Mozheiko V.I. Optimization of a set of tests selection satisfying the criteria prescribed // 7th Int. Conf. PRIA-7-2004. Conf. Proc. Vol. I. - St. Petersburg: SPbETU 2004. - P.145-148.

8. Колесникова С.И., Можейко В.И., Цой Ю.Р., Янковская А.Е. Алгоритмы выбора оптимального множества безызбыточных диагностических тестов в интеллектуальных системах поддержки принятия решений // Первая международная конференция САИТ-2005: Т.1. - М.: КомКнига, 2005. - С.256-262.

9. Журавлев Ю.И., Гуревич И.Б. Распознавание образов и анализ изображений // Искусственный интеллект: В 3-х кн. Кн.2. Модели и методы: Справочник / Под ред. Д.А. Поспелова. М.: Радио и связь, 1990. - С.149-191.

10. Янковская А.Е., Цой Ю.Р. Исследование эффективности генетического поиска оптимального подмножества безызбыточных тестов для принятия решений // Искусственный интеллект. Научно-теоретический журнал, 2006. -С.257-260.

11. Цой Ю.Р., Янковская А.Е. Генетический алгоритм и его модификация для формирования оптимального подмножества тестов // Труды 11-й национальной конференции по искусственному интеллекту с международным участием (КИИ-2008). - Дубна, 28 сентября - 3 октября 2008. - Москва: ЛЕНАНД, 2008 - Т.3. - С.58-65.

Размещено на Allbest.ru

...

Подобные документы

  • Примеры построения тестов и технологии исследования алгоритмов на их основе. Построение тестов на основе метода покрытия решений и проведение исследования соответствующего исходного алгоритма и алгоритма с ошибками в операторах проверки условий.

    контрольная работа [224,8 K], добавлен 24.05.2016

  • Функции, место и виды контроля в обучении. Тест как инструмент измерения качества знаний, формы тестов. Балльно-рейтинговая система оценивания студентов. Разработка компьютерных тестов по математике на базе Конструктора Distance Learning Studio.

    дипломная работа [2,2 M], добавлен 05.09.2011

  • Разработка программного обеспечения, предназначенного для предоставления трех способов прохождения тестов для студентов. Построение модели потоков данных, физической базы данных. Выбор языка программирования. Условия эксплуатации, требования к надежности.

    дипломная работа [2,7 M], добавлен 18.04.2014

  • Выбор цели тестирования, составление структурно-логической схемы проверяемого учебного материала и тестовых заданий. Конструирование базы заданий, требования к оформлению, составление эталона и апробация тестов. Материалы тестов целевого назначения.

    курсовая работа [86,3 K], добавлен 19.07.2011

  • Понятие и характеристика открытой системы образовательных тестов (ОСОТ). Ее преимущества и недостатки, их сущность. Алгоритм работы с системой, детальное описание процесса. Установка системы на сервер и ее использование. Изложение алгоритма решения.

    доклад [28,1 K], добавлен 25.02.2009

  • Автоматизация промежуточного и финального контроля результатов обучения учащихся различных учебных заведений. Тестирование, основанное на диалоге вычислительной системы с пользователем. Реализация приложения генерации тестов из базы данных на языке РНР.

    курсовая работа [234,1 K], добавлен 04.08.2009

  • Понятие, виды и функции тестов, компьютерное тестирование. Государственные стандарты создания компьютерных тестов и практическая реализация комплекса генерации тестов: СУБД и язык программирования, пользовательский интерфейс, экономическая эффективность.

    дипломная работа [2,1 M], добавлен 29.06.2012

  • Рассмотрение основных способов идентификации объектов: реккурентного; с использованием степенных полиномов; ортогональных полиномов Чебышева; методом наименьших квадратов для авторегрессионной модели. Алгоритм построения простых диагностических тестов.

    курсовая работа [1,9 M], добавлен 14.06.2012

  • Описание предметной области. Компоненты и палитра компонентов. Выбор архитектуры приложения. Структурные и функциональные схемы. Описание разрабатываемых процедур и функций, таблица идентификаторов. Выбор стратегии тестирования и разработка тестов.

    дипломная работа [8,2 M], добавлен 18.06.2014

  • Понятия в области метрологии. Представление знаний в интеллектуальных системах. Методы описания нечетких знаний в интеллектуальных системах. Классификация интеллектуальных систем, их структурная организация. Нечеткие системы автоматического управления.

    курсовая работа [768,2 K], добавлен 16.02.2015

  • Обзор технологий проектирования компьютерных тестов и анализ существующих систем тестирования. Создание системы автоматизированного тестирования студентов с динамической генерацией тестовых заданий при участии преподавателя, с функцией оценивания.

    дипломная работа [3,6 M], добавлен 18.07.2012

  • Общее описание информационно–справочной системы, предназначенной для контролирования работы промоутеров. Описание входных и выходных данных. Проектирование интерфейса пользователя. Выбор стратегии разработки тестов. Поиск информации, просмотр отчётов.

    курсовая работа [3,6 M], добавлен 27.07.2014

  • Пользовательский интерфейс, функциональное, структурное, алгоритмическое и архитектурное обеспечение программы. Разработка руководства пользователя и методики интеграционных и модульных тестов. Анализ исходного кода приложения, его производительности.

    дипломная работа [464,5 K], добавлен 17.06.2013

  • Основные типы динамических подключаемых библиотек DLL: исполняемые и библиотеки ресурсов. Способы экспорта процедур и функций: по имени и порядковому номеру. Системные требования к разработке программы для организации проведения опросов (тестов).

    курсовая работа [124,3 K], добавлен 23.07.2012

  • Составление программы, предназначенной для прохождения человеком психологических тестов. Проведение исследования быстроты мышления, предпринимательских способностей и оценка собственной интровертности. Прохождение теста "Формула темперамента А. Белова".

    курсовая работа [778,3 K], добавлен 14.03.2015

  • Сущность и задачи системы грид их практическое применение. Основные идеи, заложенные в концепции грид-вычислений. Уровни архитектуры грид, их характеристика. Технология облачных вычислений. Промежуточное программное обеспечение в распределенных системах.

    контрольная работа [736,9 K], добавлен 06.01.2013

  • Создание программного продукта - базы данных "тестирование", с описанием требований предметной области, объектов, их атрибутов и взаимосвязей между ними. Ведение базы вопросов, учет выполненного тестирования, формирование тестов из данных вопросов.

    курсовая работа [1,4 M], добавлен 18.12.2010

  • Выбор сервера базы данных, инструментальных средств разработки клиентского интерфейса и технологий. Описание таблиц базы данных системы мониторинга. Разработка инструментальных средств создания элементов системы. Интерфейс генерации тестов. Расчет затрат.

    дипломная работа [1,9 M], добавлен 12.03.2013

  • Выбор инструментария программирования, технология создания электронного учебника. Установка программного продукта, инструкция пользователя по сопровождению. Набор тестов и тестирование, протокол ошибок. Расчёт цены и себестоимости программного продукта.

    курсовая работа [1,9 M], добавлен 09.12.2010

  • Трехмерная графика как раздел компьютерной графики, совокупность приемов и инструментов, предназначенных для изображения объемных объектов. Сферы применения 3D графики. Процесс моделирования 3D объектов. Объемы вычислений при моделировании, расчет сцены.

    реферат [1,4 M], добавлен 01.01.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.