Применение нечетких интерфейсов для обработки нечисловых данных
Обработка нечисловых данных и снижения их субъективности при проведении федеральных статистических наблюдений. Использование лингвистических шкал для обработки нечисловых данных. Плюсы использования визуального интерфейса нечеткого ввода данных.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 05.05.2019 |
Размер файла | 85,9 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на Allbest.ru
Вступление
Исследования, связанные с человеческим фактором, несут в себе необходимость обработки нечисловых, субъективных данных, что принимает особую актуальность в сфере использования статистических данных при принятии управленческих решений на различных уровнях. Федеральные статистические наблюдения представляют собой основной источник получения экономических данных, формируемых в качестве официальной статистической информации. Потребителями официальной статистической информации, которые принимают управленческие решения, выступают органы государственной власти и местного самоуправления, а также юридические лица. При этом, показатели ряда форм федерального статистического наблюдения содержат информацию, основанную на экспертной оценке респондентов, снижение ее субъективности на этапах ввода и обработки данных сможет повысить ее значимость и уровень информативности для потребителей.
В настоящее время в формах статистических наблюдений, которые включают экспертную оценку респондента, предусмотрены варианты ответа, представляющие собой лингвистическую шкалу с положительным, нейтральным и отрицательным вариантами ответа, - тем самым процесс обработки полученных данных сводится к анализу долей респондентов, ответивших тем или иным образом. При этом, субъективные сведения респондентов, которые, как правило, выходят за рамки трех вариантов ответа, предполагая наличие промежуточных мнений, не поддаются формализации. Указанные факторы влекут за собой трудности, связанные, во-первых, с организацией такого способа сбора и последующего ввода данных, который обеспечивал бы корректную интерпретацию мнения респондента, который, в свою очередь, не в состоянии достаточно точно выразить оцениваемые сведения способом, предусмотренным рамками форм и указаний к ним, во-вторых, с последующим анализом полученных в результате наблюдения данных.
Проблема решается простым сочетанием алгоритмов четкой и нечетной логики при обработке полученных данных, однако, традиционный нечеткий логический вывод основывается на вводе количественных данных, либо конкретных лингвистических переменных, что затрудняет его применение напрямую, поскольку при первом варианте ввода - формы ответа в рамках указанных статистических наблюдений не предусматривают ввода числовых данных, во втором - лингвистические переменные достаточно ограничены (как правило, до трех).
Поэтому необходимо применение такого способа ввода данных, который будет основан на нечеткой логике, что позволит опрашиваемым максимально просто и точно выразить свои субъективные ощущения по вопросам, которые невозможно оценить другими способами.
Опыт Красноярскстата в использовании лингвистических шкал для обработки нечисловых данных
Ежегодно Красноярскстат проводит исследование удовлетворенности пользователей официальной статистической информации. Индекс удовлетворенности пользователей определяется на основе интегральной экспертной оценки, данной респондентами по отдельным индикаторам. В исследованиях, проводимых в 2011 - 2013 годах, использовались полярные (оппозиционные) лингвистические шкалы с бинарными оценками: удовлетворен - не удовлетворен, согласен - не согласен, доверяю - не доверяю. С 2014 года варианты ответов на вопросы анкеты были построены с использованием балльной системы экспертной оценки, приведенной в соответствие методике определения удовлетворенности пользователей официальной статистической информации Росстата. Методика предусматривает одновременное использование полярной лингвистической шкалы с четырьмя лингвистическими оценками и соответствующей ей десятибалльной шкалы. В таблице приведена расшифровка шкалы для оценки уровня удовлетворенности:
Значение лингвистической шкалы |
Значение числовой десятибалльной шкалы |
|
не удовлетворен |
1 - 3 |
|
скорее не удовлетворен |
4 - 5 |
|
скорее удовлетворен |
6 - 7 |
|
удовлетворен |
8 - 10 |
Таким образом, шкала приближена к симметричной шкале Стейпла, исключающей нейтральные оценки и представляющей возможность респонденту выразить, в какой мере к официальной статистической информации относится та или иная характеристика.
Одновременное использование лингвистической и числовой шкал обеспечивает, с одной стороны для респондента - более точное и однозначное выражение своей точки зрения при ответе на вопрос, который носит субъективный характер, с другой - для исследователя - предоставляет инструментарий, позволяющий дать объективную оценку ситуации, используя в процессе интерпретации терминологию респондента.
Исследования, проведенные Красноярскстатом в 2011 - 2013 годы, позволили выявить доли респондентов, удовлетворенных или не удовлетворенных качеством статистической информации. Введенная в анкеты 2014 года шкала позволила дать уровню удовлетворенности не только количественную (какая доля респондентов удовлетворена официальной статистической информацией), но и качественную (в какой мере респонденты удовлетворены официальной статистической информацией) оценку. Тем самым для лиц, принимающих управленческие решения, введение такой системы оценки, повлекло доступность более полной информативности полученных сведений для анализа и принятия в последующем на его основе корректирующих мер. К примеру, положительной может считаться тенденция незначительного снижения доли удовлетворенных пользователей при существенном росте балльной оценки, и, напротив, негативной - тенденция, при которой наряду с увеличением доли удовлетворенных пользователей наблюдается существенное снижение балльной оценки удовлетворенности пользователей.
Таким образом, опыт Красноярскстата демонстрирует использование дискретных шкал оценки, характеризуемое ввиду наибольшей продуктивности тенденцией перехода к непрерывным шкалам, которые требуют нечеткого ввода данных.
Визуальный интерфейс нечеткого ввода данных
Для обеспечения нечеткого ввода был разработан визуальный интерфейс. В простейшем случае он представляет собой шкалу-слайдер, концы которого обозначены лингвистическими переменными, с движущимся курсором. Также возможно условное деление шкалы с использованием промежуточных лингвистических переменных, порядок и расположение которых будет соответствовать их степени принадлежности Опрашиваемый может поместить курсор в любое место шкалы, так, чтобы это максимально соответствовало его ощущениям, связанным с экспертными знаниями. В зависимости от положения курсора будет рассчитываться конкретное значение функции принадлежности.
Применение подобных интерфейсов при проведении статистических наблюдений в электронной форме позволяет наиболее точно определить значение функции принадлежности для опрашиваемого, так как он не ограничен в своих ответах конечным набором вариантов (лингвистических переменных), а может выбрать промежуточное значение, наиболее точно выражающее его мнение. Данный интерфейс может быть адаптирован под различные типы функций принадлежности. Для функций заданных так, что внутри некоторого интервала функция принадлежности равна 1, а вне этого интервала равна 0 достаточно описанной шкалы с обозначенными крайними точками. Для функции типа треугольника, которая задается тремя числами A < B < C, при этом левее A и правее C функция принадлежности равна 0, а точке B функция принадлежности принимает значение 1, возможно 2 варианта применения данного интерфейса. Первый вариант - поместить лингвистическую переменную, советующую точке B в центр. В первом варианте шкала будет иметь 1 курсор, и значение функции принадлежности будет задаваться его удаленностью от точки B, во втором варианте реализации предусматривается 2 курсора, на отрезках [A; B] и [B; C], а результирующим значением функции принадлежности будет среднее расстояние от курсоров до точки B.
Для функции принадлежности типа трапеции пользовательский интерфейс формируется аналогично.
В результате применения такого пользовательского интерфейса по каждому вопросу будет получена уже фаззифицированная, т. е. приведенная к «нечеткому» виду, степень принадлежности, тем самым исключится необходимость в фаззификации входных величин. Рисунок 1 иллюстрирует изменения, связанные с применением интерфейса нечеткого ввода по сравнению с традиционным алгоритмом обработки данных с помощью нечеткой логики.
Размещено на Allbest.ru
Рисунок 1. Использование нечеткого ввода данных
Полученные в результате проведенного наблюдения данные могут обрабатываться стандартными методами нечеткого логического вывода, обеспечивая тем самым на выходе четкое значение величины, пригодное для последующего агрегирования и анализа.
Использование визуального интерфейса для ввода данных при проведении федеральных статистических наблюдений
Росстатом предусмотрены формы федерального статистического наблюдения, в которых информация, полученная на основе экспертных оценок респондентов, носит качественный характер. К подобного рода наблюдениям относятся в частности обследования деловой и инвестиционной активности организаций, по которым предусмотрены формы: № ДАС «Обследование деловой активности строительной организации», № ИАП «Обследование инвестиционной активности организаций», № ДАФЛ «Обследование деловой активности организации, осуществляющей деятельность в сфере финансового лизинга», № ДАП-ПМ «Обследование деловой активности малых предприятий добывающих, обрабатывающих производств, производства и распределения электроэнергии, газа и воды». В указанных формах респонденты дают оценку ситуации, производственной деятельности, финансовым показателям, ценам и т. д.
В соответствии с указаниями к заполнению форм показатели ряда разделов являются качественными и представляют собой экспертные оценки соответствующих показателей деятельности, определяемые на основе профессионального мнения руководителя (менеджера) предприятия, т. е. на основе субъективной оценки. В свою очередь, следует отметить, что пользователями официальной статистической информации в соответствии с Федеральным законом от 29. 11. 2007 № 282-ФЗ «Об официальном статистическом учете и системе государственной статистики в Российской Федерации» выступают государственные органы, а также органы местного самоуправления, принимающие управленческие решения и нуждающиеся в качественной информации, объективно отражающей реальное состояние ситуации, что свидетельствует о важности получения органами статистики максимально полных, объективных сведений.
Применение информационных технологий в процессе сбора статистической отчетности позволяет проводить обследования с использованием электронных форм федеральной статистической отчетности, достоверность которых обеспечивается электронной подписью. Это позволяют шире внедрять визуальный интерактивный интерфейс для ввода данных, что позволяет реализовать ввод субъективных данных с использованием лингвистических переменных. Такой способ ввода данных позволяет, как было показано выше, повысить точность обработки субъективных экспертных оценок респондентов, а использование электронной подписи и электронного ввода в целом, позволит повысить точность ввода данных за счет снижения роли воздействия человеческого фактора. Однако следует учитывать, что на сегодняшний день существует доля респондентов, отчитывающихся по формам федерального статистического наблюдения с использованием традиционной формы предоставления информации - на бумажных носителях. В таких случаях для обеспечения объективности и сопоставимости данных в бланке формы следует предусмотреть либо шкалу, на которой пользователь смог бы указать условным знаком свою оценку, что является полным аналогом нечеткого ввода данных в электронном виде, либо окно для фиксации своего отношения к ситуации посредством значения от 1 до 100, которое впоследствии будет фаззифицировано для интеграции с данными, полученными в электронном виде.
Заключение
визуальный интерфейс нечеткий ввод данные
Резюмируя, следует подчеркнуть несомненные преимущества использования визуального интерфейса нечеткого ввода в процессе ввода и обработки данных. Разработанный метод использования визуального интерфейса для ввода субъективных данных позволит повысить привлекательность заполнения форм со стороны респондентов за счет того, что формами будет предусмотрен весь спектр вариантов ответа для респондента, обеспечив тем самым точность предоставляемых сведений и сокращение времени на заполнение (у опрашиваемого исключает потребность в дополнительном обдумывании предложенных вариантов ответа для определения из них того, который соответствует его субъективному мнению в большей мере). Со стороны Красноярскстата как субъекта официального статистического учета метод наряду со снижением трудоемкости ввода данных обеспечивается рост точности ввода данных, обусловленный снижением роли человеческого фактора оператора, производящего ввод данных. В свою очередь, на этапе предоставления информации - повышение ее объективности, связанное с более точной передачей сложно формализуемых данных, и снижение человеческого фактора со стороны респондента. Таким образом, на выходе пользователь получит качественную социальноэкономическую информацию, основанную на экспертных оценках респондентов, отвечающую требованиям, предъявляемым к информации для принятия эффективных управленческих решений.
Размещено на Allbest.ru
...Подобные документы
Анализ таблиц сопряженности и коэффициента сопряженности Крамера. Выявление структуры нечисловых данных. Определение эмпирического среднего с помощью медианы Кемени. Очистка тестового сигнала от шума с использованием дискретного вейвлет-преобразования.
контрольная работа [408,8 K], добавлен 23.12.2016Система компьютерной обработки данных для сбора, систематизации, статистической обработки, анализа результатов учебного процесса за четверть, полугодие, год. Модуль обработки данных о качестве обучения, итогов успеваемости и данных о движении учащихся.
реферат [22,5 K], добавлен 05.02.2011Определения теории баз данных (БД). Элементы приложения информационных систем. Реляционные модели данных. Задача систем управления распределенными базами данных. Средства параллельной обработки запросов. Использование БД при проведении инвентаризации.
курсовая работа [518,9 K], добавлен 01.05.2015Изучение особенностей информационного процесса обработки данных. Процессы, связанные с поиском, хранением, передачей, обработкой и использованием информации. Основные режимы обработки данных на ЭВМ. Организация обслуживания вычислительных задач.
реферат [130,9 K], добавлен 28.09.2014Формы представляемой информации. Основные типы используемой модели данных. Уровни информационных процессов. Поиск информации и поиск данных. Сетевое хранилище данных. Проблемы разработки и сопровождения хранилищ данных. Технологии обработки данных.
лекция [15,5 K], добавлен 19.08.2013Функциональные зависимости и нормализация отношений. Ограничения целостности данных. Описание таблиц на языке SQL. Интерфейс пользователя и надёжность программ обработки данных. Обработка данных с помощью запросов. Работа с данными из внешних источников.
дипломная работа [1,6 M], добавлен 25.04.2015Режимы компьютерной обработки данных. Понятие и типы данных, структура и отличительные особенности. Характеристика основных операций, проводимых с данными, приемы их кодирования. Порядок и инструменты измерения информации и единицы хранения данных.
контрольная работа [104,1 K], добавлен 22.11.2010Системы автоматизированной обработки информации. Хранение большого объема информации. Понятие базы данных (БД). Обеспечение секретности данных. Уровни представления данных в БД. Логическая структура данных. Ограничения, накладываемые на данные.
реферат [65,2 K], добавлен 26.11.2011Обработка текстовых данных, хранящихся в файле. Задачи и алгоритмы обработки больших массивов действительных и натуральных чисел. Практические задачи по алгоритмам обработки данных. Решение задачи о пяти ферзях. Программа, которая реализует сортировку Шел
курсовая работа [29,2 K], добавлен 09.02.2011Термины "логический" и "физический" как отражение различия аспектов представления данных. Методы доступа к записям в файлах. Структура систем управления базами данных. Отличительные особенности обработки данных, характерные для файловых систем и СУБД.
лекция [169,7 K], добавлен 19.08.2013Структура автомата для сбора данных. Программы, реализующие заданный пользователем алгоритм автоматизации процедуры обработки журнальных данных. Описание микропроцессорной системы, ее упрощенная модель, система команд, блок-схема алгоритма обработки.
контрольная работа [65,8 K], добавлен 14.11.2010Возможности извлечения информации из баз данных. Программы для создания и обработки базы данных и создания пользовательского интерфейса. Обоснование выбора программных средств для реализации. Создание базы данных, интерфейса и базы данных к интерфейсу.
курсовая работа [2,9 M], добавлен 24.03.2023Изучение существующих методов и программного обеспечения для извлечения числовых данных из графической информации. Программное обеспечение "graphtrace", его структура и методы обработки данных. Использование этой системы для данных различного типа.
дипломная работа [3,9 M], добавлен 06.03.2013Режимы компьютерной обработки данных. Централизованный, децентрализованный, распределенный и интегрированный способы обработки данных. Средства обработки информации. Типы ведения диалога, пользовательский интерфейс. Табличный процессор MS Excel.
курсовая работа [256,9 K], добавлен 25.04.2013Особенности проектирования программы на языке С++ для обработки данных из таблиц базы данных. Основные функции программы, создание концептуальной модели базы данных и диаграммы классов, разработка интерфейса пользователя и запросов к базе данных.
курсовая работа [2,1 M], добавлен 08.06.2012Концепции хранилищ данных для анализа и их составляющие: интеграции и согласования данных из различных источников, разделения наборов данных для систем обработки транзакций и поддержки принятия решений. Архитектура баз для хранилищ и витрины данных.
реферат [1,3 M], добавлен 25.03.2013Понимание хранилища данных, его ключевые особенности. Основные типы хранилищ данных. Главные неудобства размерного подхода. Обработка информации, аналитическая обработка и добыча данных. Интерактивная аналитическая обработка данных в реальном времени.
реферат [849,7 K], добавлен 16.12.2016Средства первичной обработки данных MS Excel. Сортировка связанных областей. Виды поиска: по формату; по содержанию. Главные средства фильтрации. Использование форм в поиске записей. Целостная обработка данных таблицы на примере телефонного справочника.
курсовая работа [426,1 K], добавлен 29.11.2010Расмотрение системы распределенной обработки данных подсистемы "Ведомственная статистика" АИС ФССП России. Основные формы отчётности, производимые подсистемой. Форматы передачи данных. Окно выгрузки шаблона отчетной формы. Тестирование системы приложения.
отчет по практике [879,5 K], добавлен 21.11.2014Определение базы данных и банков данных. Компоненты банка данных. Основные требования к технологии интегрированного хранения и обработки данных. Система управления и модели организации доступа к базам данных. Разработка приложений и администрирование.
презентация [17,1 K], добавлен 19.08.2013