Основы компьютерного представления экспертных знаний для мониторинга программно-целевой деятельности
Разработка концептуальных основ и моделей компьютерного представления экспертных знаний, формируемых для индикаторного оценивания программно-целевой деятельности, а также отображения динамики формирования личностных и коллективных знаний экспертов.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | автореферат |
Язык | русский |
Дата добавления | 28.10.2018 |
Размер файла | 717,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
- коды - компьютерные эквиваленты двоичных цифр (или их последовательностей), которые могут представлять собой в цифровой среде намагниченность или ее отсутствие, наличие электрического тока или его отсутствие, способность к отражению света или ее отсутствие; в интересах описания моделей выделяются три категории кодов: коды первой категории для концептов, коды второй категории для имен и коды третьей категории для состояний денотатов индикаторов (цифровая среда);
- цифровые данные - компьютерные эквиваленты двоичных цифр, которые в описании семиотических моделей не соотнесены в явном виде с тремя категориями кодов (цифровая среда);
- данные - формы представления цифровых данных в социально-коммуникационной среде (социально-коммуникационная среда).
Рисунок 2 содержит 12 терминов Словосочетание "знаковая информация" является неисчисляемым, поэтому для описания моделей в диссертации также используется понятие "информационные объекты" как исчисляемый аналог понятия знаковой информации., пронумерованных против часовой стрелки. Эти термины распределены по шести прямоугольникам. В качестве критериев для их распределения использовались средовой принцип, предложенный К.К Колиным, определение сферы незнания, предложенное В.Л. Макаровым и Г.Б. Клейнером, разграничение между знаковой информации и данными по источнику их генерации, предложенное Ю.И. Шемакиным, и разграничение личностных, коллективных и общепринятых знаний, предложенное Вежбицки и Накамори. На основе перечисленных критериев в диссертации сформулированы следующие пять положений, которые позиционируются как исходные данные для разработки семиотических моделей.
Положение 1. Согласно средовому принципу 12 терминов разделены на три группы в зависимости от природы обозначаемых ими сущностей: ментальной, социальной или цифровой.
Кроме трех сред, при построении семиотических моделей в диссертации рассматривается также сфера материальных объектов и явлений в тех случаях, когда речь идет о денотатах материальной природы.
Положение 2. В диссертации рассматриваются денотаты цифровой, материальной и социально-коммуникационной природы. Денотатами цифровой природы в семиотических моделях компьютерного представления экспертных знаний являются совокупности компьютерных программ вычисления значений индикаторов, данных, используемых этими программами, и вычисленных значений индикаторов.
Положение 3. Перечисленные термины семиотических моделей разделены на два класса. Первый класс терминов на рисунке 2 обозначен прямоугольниками, расположенными слева, второй класс - прямоугольниками справа. Разделение терминов на уровне ментальной среды основано на определение сферы незнания. Разделение терминов на уровне социально-коммуникационной среды основано на идее разграничения знаковой информации и данных по источнику их генерации.
Положение 4. Категоризация кодов цифровой среды позволяет в семиотических моделях разделить коды концептов, имен и состояний денотатов индикаторов.
Положение 5. Для определения числовых значений семантических кодов концептов, информационных кодов имен индикаторов и объектных кодов состояний денотатов в диссертации используются, соответственно, уникальные семантические, информационные и объектные идентификаторы дескрипторов проективного словаря лингвистического обеспечения. Дескрипторы строятся экспертами в процессе разработки ими новых индикаторов.
Используя пять перечисленных положений, в диссертации определена стационарная семиотическая модель компьютерного кодирования экспертных знаний.
Для построения модели кодирования экспертных знаний о стабильных индикаторах используются три среды: ментальная, социально-коммуникационная и цифровая среды Если в треугольнике Фреге вершина денотата является материальным объектом или явлением, то в диссертации рассматривается более общий случай, включающий также материальную сферу объектов и явлений., так как денотат индикатора принадлежит цифровой среде.
Определение 1 (для кодирования экспертных знаний о стабильных индикаторах). Стационарной семиотической моделью компьютерного кодирования в системе информационного мониторинга стабильного индикатора, включая его концепт, имя и денотат, которые не изменяются во времени, называется треугольник Фреге этого индикатора, трем вершинам которого назначены семантический код для концепта, информационный код для его имени и объектный код для денотата индикатора В предметной области мониторинга Определение 1 для индикаторов с неизменяемыми денотатами, является вспомогательным. Это определение понадобится далее для построения нестационарной модели для случая индикаторов с изменяемыми денотатами..
Отметим, что в этом и последующих двух определениях говорится о денотатах, а не о состояниях денотатов, так как стационарная модель применима только для случая неизменяемых денотатов.
В диссертации рассматривается также задача кодирования экспертных знаний о трудностях перевода, в которой используются те же три среды: ментальная, социально-коммуникационная и цифровая среды, так как денотат трудности перевода, представляющий собой пару фрагментов параллельных текстов на русском и французском языках, принадлежит социально-коммуникационной среде.
Определение 2 (для кодирования экспертных знаний о трудностях перевода). Стационарной семиотической моделью компьютерного кодирования стабильной трудности перевода, включая ее денотат, концепт и название, которые не изменяются во времени, называется треугольник Фреге трудности перевода, трем вершинам которого назначены семантический код для концепта, информационный код для названия и объектный код для денотата трудности перевода.
Определение 3 (обобщенное, которое не зависит от предметной области). Стационарной семиотической моделью компьютерного кодирования концепта как значения знака, информационного объекта как формы этого знака и денотата знака, которые не изменяются во времени, называется семиотический треугольник Фреге этого знака, для которого построен дескриптор и трем вершинам которого (значению знака, форме знака и денотату) назначены, соответственно, семантический, информационный и объектный коды (т.е. три компьютерных кода первой, второй и третьей категорий - см. Рисунок 3):
- код первой категории для концепта как значения знака, который является семантическим идентификатором дескриптора и составной частью семокода,
- код второй категории для информационного объекта как формы знака, который является информационным идентификатором дескриптора и составной частью формокода,
- код третьей категории для денотата знака, который является объектным идентификатором дескриптора (на рисунке 3 показан денотат, который относится к сфере материальных объектов и явлений).
Рисунок 3. Семиотический треугольник Фреге и коды трех его вершин
Стационарная модель основана на семиотическом треугольнике Фреге, стороны которого, обозначенные на рисунке 3 полужирными отрезками, соединяют три вершины этого треугольника: концепт как значение знака, соответствующий ему денотат и информационный объект как форму этого знака.
Сочетание трех компьютерных кодов трех разных категорий для трех вершин любого треугольника Фреге предлагается называть "цифровым семиотическим треугольником" (три его стороны изображены на рисунке 3 двойными точечными отрезками, которые соединяют три компьютерных кода цифровой среды).
Принципиальная новизна стационарной семиотической модели компьютерного кодирования заключается в том, что она отображает треугольник Фреге, вершины которого имеют разную природу (ментальную, социально-коммуникационную, цифровую или материальную), на цифровой семиотический треугольник, принадлежащий полностью цифровой среде.
Определение нестационарной семиотической модели компьютерного представления знаний об индикаторах, формируемых экспертами, основано на семиотической модели отображения треугольника Фреге на цифровой семиотический треугольник, построенного в некоторый момент времени. В нестационарной модели фиксируются этапы формирования новых индикаторов, включая регистрацию моментов времени изменений их концептов, имен и состояний изменяемых денотатов индикаторов с помощью кодов трех категорий.
В диссертации сначала строится множество точек, которое названо "пространством Фреге". Основная цель построения пространства Фреге заключается в том, чтобы представить в числовом виде этапы формирования новых индикаторов, используя последовательности семантических, информационных и объектных компьютерных кодов.
Формирование индикаторов, включая концептуализацию их денотатов, будем фиксировать в последовательные моменты времени, которые обозначим как {ti, i = 1, 2, ...}, где ti - дискретный момент времени завершения i-го этапа концептуализации и описания в виде дескрипторов семиотических треугольников Фреге для новых индикаторов.
При этом за t1 принимается тот момент времени, когда эксперты начали описывать процесс формирования новых индикаторов в виде дескрипторов лингвистического обеспечения системы информационного мониторинга.
Предполагается, что в моменты времени {ti, i = 1, 2, ...}, в процессе формирования новых индикаторов, концептуализации их денотатов и описания экспертами их семиотических треугольников Фреге, система информационного мониторинга генерирует цифровые семиотические треугольники, соответствующие треугольникам Фреге. При этом в каждый момент времени ti может быть сгенерировано одновременно несколько цифровых семиотических треугольников с использованием уникальных идентификаторов дескрипторов, если эксперты фиксируют в словаре в этот момент времени состояние разработки нескольких новых индикаторов.
Пространство Фреге (для регистрации экспертами в системах информационного мониторинга процесса формирования новых индикаторов) определим как четырехмерное пространство действительных чисел R2, в котором задано множество точек {(ti, ni,j, mi,j, ki,j), где j = 1, ..., Si, Si - число индикаторов, создание (изменение) и, возможно, интерпретация состояний денотатов которых регистрировались в момент времени ti, i = 1, 2, ...}, где:
- ti - момент времени завершения i-го этапа формирования индикаторов экспертами, а также генерации кодов трех категорий, фиксирующих состояния денотатов, их концепты как результат интерпретации этих состояний и имена индикаторов в момент времени ti;
- ni,j - числовое представление компьютерного кода концепта j-го индикатора, формируемого в момент времени ti (ni,j=0, если концепта нет, т.е. у экспертов отсутствует понимание совокупности программы, данных и значений этого индикатора);
- mi,j - числовое представление компьютерного кода имени (названия) j-го индикатора, формируемого в момент времени ti (mi,j=0, если имя не было присвоено);
- ki,j - числовое представление компьютерного кода состояния денотата j-го индикатора, формируемого в момент времени ti, т.е. числовое представление кода объекта интерпретации как совокупности программы вычисления, обрабатываемых данных и значений этого индикатора.
Определение пространства Фреге в других предметных областях может быть сформулировано аналогично. В диссертации это показано на примере ЦСЗ о трудностях перевода.
Пространство Фреге (для формирования ЦСЗ о трудностях перевода) определим как четырехмерное пространство действительных чисел R2, в котором задано множество точек {(ti, ni,j, mi,j, ki,j), где j = 1, ..., Si, Si - число пар В общем случае, одной трудности перевода может соответствовать несколько пар. фрагментов на русском и французском языках с трудностями перевода, формирование (изменение) и, возможно, интерпретация которых регистрировались в момент времени ti, i = 1, 2, ...}, где:
- ti - момент времени завершения i-го этапа описания экспертами-лингвистами пар фрагментов с трудностями перевода, а также генерации кодов трех категорий, фиксирующих пары фрагментов, описанных на этом этапе, их концепты как результат смысловой интерпретации этих пар и имена соответствующих трудностей перевода в момент времени ti;
- ni,j - числовое представление компьютерного кода концепта трудности перевода j-ой пары фрагментов, описанной в момент времени ti (ni,j=0, если концепта нет, т.е. у экспертов-лингвистов отсутствует понимание трудности перевода этой пары фрагментов);
- mi,j - числовое представление компьютерного кода названия (имени) трудности перевода j-ой пары фрагментов (mi,j=0, если имени нет);
- ki,j - числовое представление компьютерного кода j-ой пары фрагментов на русском и французском языках, описанной в момент времени ti.
Пространство Фреге в общем случае определим как четырехмерное пространство действительных чисел R2, в котором задано множество точек {(ti, ni,j, mi,j, ki,j), где j = 1, ..., Si, Si - число денотатов, создание (изменение) и, возможно, интерпретация состояний которых регистрировались экспертами в момент времени ti, i = 1, 2, ...}, где:
- ti - момент времени завершения i-го этапа создания (изменения) денотатов, интерпретации состояний денотатов и генерации соответствующих цифровых семиотических треугольников, число которых равно Si в момент времени ti;
- ni,j - числовое представление компьютерного кода концепта, полученного в результате интерпретации состояния j-го денотата в момент времени ti (ni,j=0, если концепта нет, т.е. отсутствует понимание состояния этого денотата);
- mi,j - числовое представление компьютерного кода имени, выбранного в результате интерпретации состояния j-го денотата в момент времени ti, (mi,j=0, если имя не было выбрано);
- ki,j - числовое представление компьютерного кода состояния j-го денотата, созданного или измененного в момент времени ti.
Пространство Фреге включает ось времени и три оси с числовыми значениями кодов концептов, имен и состояний денотатов. В диссертации рассматривается случай, когда используется N видов кодов концептов (семантических кодов), M видов кодов имен (информационных кодов) и K видов кодов состояний денотатов (объектных кодов). Тогда размерность пространства Фреге равна N + M + K + 1. В автореферате рассматривается случай, когда N = M = K = 1.
Пространство Фреге не отображает связи компьютерных кодов с концептами, именами и состояниями денотатов. Однако в любой дискретный момент времени ti описание связей концепта, имени и состояния денотата с тремя компьютерными кодами фиксируется дескриптором, построенным в момент времени ti (согласно семиотической модели, определенной в момент времени ti) Определение модели для дискретного момента времени дано в диссертации..
Определение 4 (для кодирования экспертных знаний о формируемых индикаторах). Нестационарной семиотической моделью компьютерного представления концептов формируемых индикаторов, кодирования состояний их денотатов и имен в дискретные моменты времени {ti, i = 1, 2, ...} называется совокупность следующих трех составляющих:
- множество треугольников Фреге {Ti,j, где j = 1, ..., Si, Si - число индикаторов, формируемых или изменяемых в момент времени ti, i = 1, 2, ...};
- множество соответствующих цифровых семиотических треугольников {Di,j, где j = 1, ..., Si, Si - число индикаторов, i = 1, 2, ...}, каждый из которых состоит из семантического, информационного и объектного кодов;
- множество точек {(ti, ni,j, mi,j, ki,j), где j = 1, ..., Si, Si - число индикаторов, i = 1, 2, ...}, полученных в результате отображения в R2 цифровых семиотических треугольников {Di,j}.
В этом определении множество точек {(ti, ni,j, mi,j, ki,j)} пространства Фреге зависит от правил назначения информационных, семантических и объектных идентификаторов, так как компьютерные коды любого цифрового семиотического треугольника представляют собой соответственно информационный, семантический и объектный идентификаторы дескриптора, соответствующего треугольнику {Ti,j}.
В качестве примера опишем нестационарную семиотическую модель компьютерного представления ЦСЗ одного эксперта, целью которого является формирование нескольких вариантов индикатора распределения публикационной активности научного коллектива по возрастным группам (далее - ЦСЗ об индикаторах возрастного распределения публикаций или ЦСЗ об индикаторах ВРП).
Построим нестационарную семиотическую модель, концепты которой сформированы экспертом в два последовательных момента времени t1 и t2. Пример охватывает только эти два момента времени, но это не значит, что в момент времени t2 формирование вариантов индикатора ВРП было завершено (см. Рисунок 4).
Предположим, что в момент времени t1 эксперт сформировал ЦСЗ (состояние ЦСЗ в момент времени t1 обозначено как К(t1)), состоящую из двух его личностных концептов, обозначенных как ConceptI(t1) и ConceptII(t1), полученных в результате анализа и смысловой интерпретации состояний двух цифровых денотатов, обозначенных как DenotatumI(t1) и DenotatumII(t1), т.е. в момент времени t1 эксперт создал два варианта индикатора ВРП.
Каждый из двух цифровых денотатов представляет собой совокупность программы вычисления значений соответствующего варианта индикатора ВРП, исходных данных, используемых этой программой, и вычисленных значений этого варианта индикатора ВРП. В результате анализа экспертом состояний двух таких совокупностей в момент времени t1 были сформированы два концепта: ConceptI(t1) и ConceptII(t1).
Эти концепты сначала описываются как позиции (рубрики) этих вариантов индикатора в системе классификации, а затем в виде дефиниций двух вариантов индикатора ВРП. Их авторские имена (названия), которые придумал эксперт в момент времени t1, на экране монитора на рисунке 4 условно обозначены как два информационных объекта ObjectI(t1) и II(t1). Одновременно эксперт построил два дескриптора.
Затем в момент времени t2 этот же эксперт продолжил формирование ЦСЗ о вариантах индикатора ВРП и описал ее новое состояние, которое обозначено как К(t2), включающее три его личностных концепта. Эти концепты на рисунке 4 обозначены как ConceptI(t2), II(t2) и III(t2).
Концепт ConceptI(t2) был сформирован на основе ConceptI(t1). Концепт II(t2) был сформирован на основе ConceptII(t1). Концепт третьего варианта индикатора, обозначенный как III(t2), был сформирован как новый. Концепты ConceptI(t2), II(t2) и III(t2) сформированы в процессе анализа и интерпретации состояний денотатов DenotatumI(t2), DenotatumII(t2) и DenotatumIII(t2).
Первые два свои концепта в момент времени t2 пользователь описал в виде дескрипторов как варианты концептов ConceptI(t1) и ConceptII(t1), а третий личностный концепт III(t2) он отметил в словаре как новый. Структурированное описание пользователем в момент времени t2 концептов ConceptI(t2), II(t2) и III(t2) представляет собой дефиницию каждого из этих трех вариантов индикатора. Их авторские имена (названия) на экране монитора на рисунке 4 условно обозначены как три информационных объекта ObjectI(t2), II(t2) и III(t2).
Дескрипторы в моменты времени t1 и t2 пользователь строил на основе своих личностных концептов, сформированных в процессе анализа и смысловой интерпретации состояния цифровых (а не материальных) денотатов в интересах формирования ЦСЗ о вариантах индикатора ВРП.
Рисунок 4. Два треугольника Фреге и два цифровых семиотических треугольника кодов в моменты времени t1 и t2 (арабскими цифрами в кодах обозначены их категории: "1" обозначает семантические коды, "2" - информационные, а "3" - объектные)
Каждый из пяти концептов ConceptI(t1), ConceptII(t1), ConceptI(t2), II(t2), III(t2) с соответствующим ему состоянием денотата, в процессе анализа и интерпретации которого этот концепт был сформирован, а также именем (информационным объектом) как авторским названием индикатора, образуют один семиотический треугольник Фреге. Каждому семиотическому треугольнику Фреге соответствует один дескриптор, построенный экспертом.
Рисунок 4 показывает только два треугольника Фреге из пяти (обозначены точечным контуром) в моменты времени t1, t2 и только шесть кодов из 15 (всего в этом примере эксперт сформировал 5 концептов, 5 имен, 5 состояний трех денотатов индикатора ВРП и, следовательно, автоматически было сгенерировано 15 кодов). Концепт ConceptI(t1) является вершиной левого треугольника Фреге, а концепт ConceptI(t2) - вершиной правого треугольника. Каждому из этих треугольников соответствует свой цифровой семиотический треугольник: один в момент времени t1 и один - в t2 (обозначены двойным точечным контуром).
Левый цифровой семиотический треугольник, сгенерированный в момент времени t1, включает три кода:
- семантический код Computer code1.I(t1) личностного концепта ConceptI(t1);
- информационный код Computer code2.I(t1) имени, т.е. информационного объекта ObjectI(t1);
- объектный код Computer code3.I(t1) состояния денотата DenotatumI(t1), в результате анализа и смысловой интерпретации которого был сформирован концепт ConceptI(t1).
Правый цифровой семиотический треугольник, сгенерированный в момент времени t2, также включает три кода:
- семантический код Computer code1.I(t2) личностного концепта ConceptI(t2);
- информационный код Computer code2.I(t2) имени, т.е. информационного объекта ObjectI(t2);
- объектный код Computer code3.I(t2) состояния денотата DenotatumI(t2), в результате анализа и смысловой интерпретации которого был сформирован концепт ConceptI(t2).
В пространстве Фреге (см. Рисунок 5) показаны все числовые значения 15 компьютерных кодов (5 значений n1,1, n1,2, n2,1, n2,2, n2,3 числового представления семантических кодов концептов, 5 значений m1,1, m1,2, m2,1, m2,2, m2,3 информационных кодов имен и 5 значений k1,1, k1,2, k2,1, k2,2, k2,3 объектных кодов состояний денотатов).
Рисунок 4 иллюстрирует построение первых двух составляющих нестационарной семиотической модели компьютерного представления двух состояний ЦСЗ, обозначенных как К(t1) и К(t2):
- семейство семиотических треугольников Фреге для вариантов индикатора ВРП, описанных экспертом в моменты времени t1 и t2 в виде пяти дескрипторов (на рисунке показано два треугольника Фреге из пяти);
- соответствующие этим треугольникам Фреге цифровые семиотические треугольники, автоматически сгенерированные в процессе построения дескрипторов в моменты времени t1 и t2 (на рисунке показано два треугольника из пяти).
Для завершения построения нестационарной семиотической модели компьютерного представления двух состояний ЦСЗ зафиксируем в R2 множество из пяти точек {(ti, ni,j, mi,j, ki,j), где j = 1, ..., Si; i = 1, 2; S1 = 2, S2 = 3}.
В этом примере число цифровых семиотических треугольников S1, сгенерированных в момент времени t1, равно 2, а число цифровых семиотических треугольников S2, сгенерированных в момент времени t2, равно 3.
Перечислим все числовые значения пяти точек {(ti, ni,j, mi,j, ki,j), где j = 1, ..., Si; i = 1, 2; S1 = 2, S2 = 3} (см. Рисунок 5):
- t1 и t2 - моменты времени описания экспертом пяти семиотических треугольников Фреге (двух в момент времени t1 и трех в момент времени t2);
- n1,1, n1,2, n2,1, n2,2, n2,3 - числовые значения семантических компьютерных кодов Computer code1.I(t1), Computer code1.II(t1), Computer code1.I(t2), Computer code1.II(t2) и Computer code1.III(t2);
- m1,1, m1,2, m2,1, m2,2, m2,3 - числовые значения информационных компьютерных кодов Computer code2.I(t1), Computer code2.II(t1), Computer code2.I(t2), Computer code2.II(t2) и Computer code2.III(t2);
- k1,1, k1,2, k2,1, k2,2, k2,3 - числовые значения объектных компьютерных кодов Computer code3.I(t1), Computer code3.II(t1), Computer code3.I(t2), Computer code3.II(t2) и Computer code3.III(t2).
Рисунок 5. Множество из пяти точек
Рисунок 5 иллюстрирует отображение пяти цифровых семиотических треугольников в R2, размерность которого равна 4, но ось времени в явном виде не показана. Так как отображаемое семейство включает цифровые семиотические треугольники, которые сгенерированы только в два момента времени t1 и t2, то эти моменты времени показаны внутри треугольников. В этом примере показаны три оси: семантическая ось числовых значений кодов n, информационная ось m и объектная ось k.
Пять точек {(ti, ni,j, mi,j, ki,j), где j = 1, ..., Si; i = 1, 2; S1 = 2, S2 = 3}, полученных в результате отображения пяти цифровых семиотических треугольников в R2, образуют третью составляющую нестационарной семиотической модели компьютерного представления знаний одного эксперта о вариантах индикатора ВРП в два момента времени t1 и t2.
В четвертой главе диссертации дано описание технических решений, основанных на стационарной и нестационарной семиотических моделях, а также результаты экспериментальной апробации компьютерного представления экспертных знаний. В этой главе предметом рассмотрения являются:
- полиструктурная динамическая классификация индикаторов мониторинга ПЦД, включающая:
· статический раздел классификации программно-ориентированных индикаторов целей, результатов, ресурсов, состоятельности, эффективности и результативности некоторой программы Цели, результаты, ресурсы, состоятельность, эффективность и результативность одной программы или ПЦД в целом в диссертации называются объектами мониторинга верхнего уровня.;
· динамические структуры объектов мониторинга;
· сочетание статического раздела классификации и динамических структур объектов мониторинга;
- эксперименты по компьютерному представлению экспертных знаний (случай нескольких экспертов);
- архитектура лингвистического обеспечения систем информационного мониторинга, включающего проективный словарь;
- технология автоматизированного формирования аналитических отчетов по целевым программам в сфере науки, включающих программно-ориентированные индикаторы, разработанные экспертами.
Классификация индикаторов необходима экспертам в процессе разработки индикаторов для предварительного описания их смыслового содержания. Выбирая ту или иную позицию (рубрику) в системе классификация, эксперт тем самым фиксирует свое предварительное понимание формируемого индикатора. Поэтому от степени детальности рубрик применяемой классификации зависит потенциально возможная степень точности описания смысла, которую предоставляет эксперту эта система классификации.
В диссертации самые общие концепты рубрик верхнего (статического) уровня классификации индикаторов, определяются на основе анализа нормативно-правовых актов, регулирующих реализацию некоторой программы или ПЦД в целом. Общие концепты рубрик образуют статический раздел классификации программно-ориентированных индикаторов целей, результатов, ресурсов, состоятельности, эффективности и результативности ПЦД.
В процессе диссертационного исследования рубрики нижних уровней классификации индикаторов были спроектированы как динамически формируемые. Это дало возможность, с одной стороны, учесть полиструктурность как отдельной программы, так и полиструктурность ПЦД в целом, а с другой стороны, адаптировать классификацию к изменениям каждой структуры во времени. Динамическая классификация индикаторов как компонент лингвистического обеспечения является ключевым техническим решением для компьютерного представления знаний об индикаторах, формируемых экспертами для мониторинга и оценивания ПЦД.
При реализации этого технического решения, структурирование целей, результатов, ресурсов, состоятельности, эффективности и результативности на составляющие (по тем или иным разрезам) отражалось не в статическом разделе классификации индикаторов, а в описании соответствующих структурных разрезов анализируемой программы.
Так, в действующем прототипе Информационно-технологической системы мониторинга РАН, описание которого дано в приложении к диссертации, для мониторинга и оценивания Программы фундаментальных научных исследований РАН (далее - Программа ФНИ РАН) используются три ее структурных разреза:
· организационный разрез РАН как исполнителя Программы ФНИ РАН,
· разрез по видам деятельности по Программе ФНИ РАН,
· тематическое деление Программы ФНИ РАН на 88 направлений фундаментальных исследований.
Приведем пример с делением в 2009 году Программы ФНИ РАН на следующие шесть видов деятельности:
· программы фундаментальных исследований Президиума РАН;
· программы фундаментальных исследований Отделений РАН;
· программы фундаментальных исследований научных учреждений РАН (базовое финансирование научных учреждений);
· программы целевых расходов Президиума РАН;
· программа модернизации материально-технической базы научных учреждений РАН;
· исследования по новым направлениям, необходимость в которых возникала в течение 2009 года.
Отметим, что в рамках Программы ФНИ РАН в период 2008-2012гг. это деление по видам деятельности не является постоянным, и от года к году оно может изменяться. Кроме того, может быть изменено и общее число структурных разрезов Программы ФНИ РАН.
Поэтому в процессе разработки лингвистического обеспечения в статический раздел классификации индикаторов не были включены изменяемые во времени организационная, тематическая и другие структуры, но были разработаны средства динамической суперпозиции статического раздела классификации индикаторов и выбранной экспертом организационной, тематической или иной структуры Программы ФНИ РАН.
Разработанное проектное решение по динамической классификации индикаторов дает возможность экспертам с одной стороны, учесть полиструктурность ПЦД, а с другой стороны, адаптировать классификацию к изменениям каждой структуры во времени. Рассмотренный подход к автоматической генерации полиструктурной динамической классификации был реализован в процессе разработки прототипа Информационно-технологической системы мониторинга РАН, описание которой дано в приложении к диссертации.
Кроме полиструктурной динамической классификации, в состав лингвистического обеспечения прототипа включено два словаря (см. Рисунок 6): семантический словарь для используемых индикаторов и проективный словарь для отражения этапов формирования новых индикаторов экспертами.
Рассмотрим разработанную и реализованную архитектуру лингвистического обеспечения, включающего словари индикаторов, а также полиструктурную динамическую классификацию программно-ориентированных индикаторов.
Основной целью создания семантического словаря является обеспечение пользователей информацией в виде словарных статей об используемых индикаторах. Каждая статья включает следующие компоненты:
- дефиницию и название индикатора (см. Рисунок 6, на котором показаны названия двух индикаторов "X индикатор" и "Y индикатор" без дефиниций);
- примеры использования индикатора (на рисунке не показаны);
- параметры отбора информационных ресурсов, задаваемые при вычислении значений индикатора, например, параметр отбора только тех статей, которые опубликованы в журналах из списка ВАК (обозначены как "{PXi}" и "{PYi}");
- параметры алгоритма вычисления значений индикатора, например, параметр учета самоцитирования, от которого зависят значения индексов цитирования авторов публикаций (обозначены как "{RXi}" и "{RYi}");
- ссылку на описание того алгоритма программы, который используется для вычисления значений индикатора (две ссылки условно обозначены в виде двух штриховых стрелок, направленных от словарных статей индикаторов "X" и "Y" к программному обеспечению);
- ссылки на те базы данных (хранилища), из которых осуществляется отбор информационных ресурсов, используемых при вычислении значений индикатора (обозначены в виде двух штриховых стрелок, направленных от словарных статей индикаторов "X индикатор" и "Y индикатор" к информационному обеспечению);
- ссылки на положения методических и нормативно-правовых документов (если такие существуют), имеющие отношение к вычисляемому индикатору (в виде еще двух штриховых стрелок, направленных к нормативно-методическому виду обеспечения, которое обозначено прямоугольником со словами "Нормативное обеспечение").
Рисунок 6. Семантический и проективный словари лингвистического обеспечения
Задачи, функции и применение семантического словаря в системах информационного мониторинга описаны в автореферате и кандидатской диссертации О.С. Кожуновой "Технология разработки семантического словаря системы информационного мониторинга", выполненной под руководством автора диссертационного исследования. Отметим, что в разработанном О.С. Кожуновой варианте семантического словаря пользователь имеет возможность задавать значения параметров {PXi} и {PYi} для вычисления значений индикатора, используя интерфейсное окно словарной статьи, и получать в этом же окне вычисленные значения индикатора в интерактивном режиме.
Основной целью создания проективного словаря является предоставление экспертам возможности описания процесса формирования ими новых индикаторов согласно разработанным семиотическим моделям в виде дескрипторов, включающих словарные статьи.
Каждый дескриптор проективного словаря отражает состояние одного индикатора (варианта индикатора) в момент времени завершения некоторой итерации (этапа) его формирования. Разработанный вариант архитектуры позволяет описать этапы процесса формирования индикаторов экспертами.
Рисунок 6 отражает два этапа разработки двух индикаторов, обозначенных буквами U и V: первый этап, который завершился в момент времени t1, и n-ый этап, который завершился в момент времени tn. Каждый дескриптор проективного словаря включает следующие компоненты:
- дефиницию и название индикатора (Рисунок 6 содержит названия двух индикаторов "U индикатор" и "V индикатор" для случая, когда названия индикаторов не меняются в процессе их разработки с первого по n-ый этапы); примеры использования формируемого индикатора (на рисунке не показаны);
- параметры отбора информационных ресурсов системы мониторинга, задаваемые при вычислении значений формируемого индикатора в моменты времени t1 и tn (наборы этих параметров условно обозначены как {PUi (t1)}, {PUi (tn)}, {PVi (t1)} и {PVi (tn)};
- параметры алгоритмов вычисления значений формируемого индикатора, задаваемые в моменты времени t1 и tn (наборы этих параметров условно обозначены как {RUi (t1)}, {RUi (tn)}, {RVi (t1)} и {RVi (tn)};
- ссылки на те базы данных (хранилища), из которых осуществляется отбор информационных ресурсов, используемых при вычислении значений формируемого индикатора (эти ссылки обозначены в виде четырех точечных стрелок, направленных от словарных статей индикаторов "U индикатор" и "V индикатор" в моменты времени t1 и tn к информационному обеспечению системы информационного мониторинга);
- ссылки на описание тех алгоритмов, которые используются для вычисления значений формируемого индикатора (также обозначены в виде четырех точечных стрелок);
- ссылки на положения методических и нормативно-правовых документов (если такие существуют), имеющие отношение к формируемому индикатору (в виде четырех точечных стрелок, направленных к двум прямоугольникам со словами "Нормативное обеспечение" в моменты времени t1 и tn).
В проективном словаре предусмотрена возможность изменения дефиниций и названий индикаторов, наборов параметров отбора информационных ресурсов, наборов параметров алгоритмов вычисления индикаторов. После завершения разработки и утверждения нового индикатора его описание переносится из проективного словаря в семантический.
Серия экспериментов по компьютерному представлению экспертных знаний о формируемых вариантах индикатора ВРП на основе разработанных семиотических моделей была проведена в процессе выполнения НИР "Разработка методов и принципов создания информационных технологий для оценивания результатов влияния фундаментальных исследований". Эксперименты проводились с использованием прототипа Информационно-технологической системы мониторинга РАН.
Прежде чем описать эксперименты, в рамках которых велась разработка вариантов индикатора ВРП, включая отображение этапов их формирования, отметим новый аспект решаемой проблемы, который проявился в процессе реализации проектных решений по созданию проективного словаря.
Этот аспект касается категоризации концептов. Реализация проектных решений показала необходимость введения еще одной категории - неактуальных концептов и соответствующих им дескрипторов проективного словаря (см табл. 1).
Таблица 1. Четыре категории концептов ЦСЗ и соответствующих им дескрипторов
Категории концептов и дескрипторов |
Неактуальные |
Личностные (авторские) |
Согласованные (коллективные) |
Конвенциональные (нормативно утвержденные) |
|
Концепты ЦСЗ |
Неактуальные концепты |
Личностные концепты |
Согласованные концепты |
Конвенциональные концепты |
|
Дескрипторы проективного словаря |
Неактуальные дескрипторы |
Авторские дескрипторы |
Коллективные дескрипторы |
Нормативно-утвержденные дескрипторы |
Поэтому была модифицирована идея Вежбицки и Накамори о разграничении личностных, коллективных и общепринятых знаний. Дополнительно было введено понятие неактуальных концептов системы знаний, от которых на некотором этапе отказались все эксперты. Отметим, что в обобщенной модели формирования знаний Вежбицки и Накамори неактуальные знания не рассматриваются.
Опишем результаты серии экспериментов по компьютерному представлению знаний нескольких экспертов о формируемых вариантах индикатора ВРП и построению функции, позволяющей вычислять степень согласованности между экспертами формируемых ими вариантов.
Одним из итогов серии экспериментов является вывод о том, что область определения функции степени согласованности должна иметь на одно измерение больше, чем пространство Фреге. Это дополнительное измерение необходимо для описания эволюции степени согласованности формируемых вариантов индикатора ВРП. В проведенной серии экспериментов использовалось четырехмерное пространство Фреге. Поэтому, область определения построенной функции степени согласованности имела пять измерений.
Как отмечалось ранее, основная цель построения пространства Фреге заключается в том, чтобы эволюцию во времени концептов ЦСЗ об индикаторах представить в виде последовательностей семантических кодов, а эволюцию соответствующих имен индикаторов и их денотатов - в виде информационных и объектных компьютерных кодов, соответственно. Эти коды генерируются программно в процессе описания экспертами-разработчиками индикаторов семиотических треугольников Фреге и соответствующих им дескрипторов в дискретные моменты времени {ti, i = 1, 2, ...}.
С целью построения функции степени согласованности, сначала были определены границы между четырьмя категориями концептов и между соответствующими им категориями дескрипторов (неактуальный, авторский, коллективный и сформированный для утверждения, который использовался в серии экспериментов вместо нормативно-утвержденного).
Было определено множество целочисленных параметров {Lpi, j ? 0, где j = 1, ..., Si, i = 1, 2, ..., p =0, 1, 2, ...}, значение каждого из которых равно числу экспертов, согласованно интерпретирующих в момент времени ti+p три вершины (концепт, имя и состояние денотата) семиотического треугольника Ti,j, сгенерированного в момент ti.
Было задано число NC как граница между категориями коллективных и сформированных для утверждения дескрипторов. В серии экспериментов дескриптор считался сформированным, если число экспертов, согласованно интерпретирующих этот дескриптор, было больше или равно NC.
Понятие неактуального дескриптора было определено следующим образом: если в момент времени ti все эксперты, участвующие в формировании ЦСЗ, приняли решение о неперспективности некоторого дескриптора, то в момент времени ti он помечался как неактуальный.
Целочисленный параметр Lpi, j равен 1 для всех тех семиотических треугольников, которым в момент времени ti+p соответствует авторский дескриптор с личностным концептом. Если в некоторый момент времени эксперт-автор этого дескриптора и все остальные эксперты, участвующие в формировании ЦСЗ, отмечали его как неактуальный для процесса построения ЦСЗ, то тогда целочисленный параметр Lpi, j в этот момент времени становился равен нулю.
В процессе проведения экспериментов функция степени согласованности Fcon была определена следующим образом: для любого i при условии, что
где p =0, 1, 2, ... является пятым измерением области определения Fcon, кроме четырех измерений i, n, m, и k (пятое измерение было введено для отражения изменения степени согласованности дескрипторов индикаторов, начиная с момента создания каждого из этих дескрипторов).
Значения определенной функции Fcon не зависят от семантических, информационных и объектных компьютерных кодов ni,j, mi,j, и ki,j, соответственно, а зависят только от хода процесса согласования экспертами смысла дескрипторов вариантов индикатора. В проведенной серии экспериментов согласование экспертами смысла предполагало согласование экспертами атрибутов и связей соответствующего дескриптора.
Серия экспериментов включала пять этапов (итераций) разработки вариантов индикатора ВРП группой из пяти экспертов (обозначим их как А, Б, В, Г и Д).
Первая итерация. Эксперт А создал первый вариант индикатора ВРП при следующих условиях:
- для вычисления значений этого варианта индикатора использовались статьи сотрудников одного из подразделений ИПИ РАН, напечатанные в любых журналах и сборниках в 2009 году и введенные в базу данных статей прототипа Информационно-технологической системы мониторинга РАН;
- возрастная группа В экспериментах учитывались 14 возрастных групп: 20-24, 25-29 и далее до группы 85-89 лет. каждого соавтора статьи получала за одну статью 1 балл;
- отсутствовала нормализация относительно численности возрастных групп.
В это же время (на этой же итерации) эксперты Б и В создали совместно и согласованно второй вариант индикатора ВРП при тех же первом и третьем условиях, но второе из трех вышеперечисленных условий отличалось: возрастная группа каждого соавтора получала 1/N балла за статью, у которой N соавторов.
...Подобные документы
Преимущества и недостатки моделей представления знаний. Модель, основанная на правилах, фреймовая модель. Семантическая сеть. Структура экспертных систем и этапы их разработки. Механизмы логического вывода. Стратегия "вверх-снизу", "от цели к ситуации").
презентация [195,3 K], добавлен 29.10.2013Понятия, классификация и структура экспертных систем. Базы знаний и модели представления знаний. Механизмы логического вывода. Инструментальные средства проектирования и разработки экспертных систем. Предметная область ЭС "Выбор мобильного телефона".
курсовая работа [2,2 M], добавлен 05.11.2014Классы и группы моделей представления знаний. Состав продукционной системы. Классификация моделей представления знаний. Программные средства для реализации семантических сетей. Участок сети причинно-следственных связей. Достоинства продукционной модели.
презентация [380,4 K], добавлен 14.08.2013Сущность данных и информации. Особенности представления знаний внутри ИС. Изучение моделей представления знаний: продукционная, логическая, сетевая, формальные грамматики, фреймовые модели, комбинаторные, ленемы. Нейронные сети, генетические алгоритмы.
реферат [203,3 K], добавлен 19.06.2010Проблема представления знаний в компьютерных системах – одна из основных проблем в области искусственного интеллекта. Исследование различных моделей представления знаний. Определения их понятия. Разработка операции над знаниями в логической модели.
курсовая работа [51,9 K], добавлен 18.02.2011Определения знаний и приобретения знаний человеком. Виды знаний и способы их представления. Приобретение и извлечение знаний. Визуальное проектирование баз знаний как инструмент обучения. Программное обеспечение для проведения лабораторных работ.
дипломная работа [960,9 K], добавлен 12.12.2008Изучение фреймового способа представления знаний, его специфики и основных характеристик. Обзор других методов представления знаний, их плюсы и минусы. Иерархическая структура данных фрейма. Механизм управления выводом с помощью присоединенной процедуры.
реферат [2,6 M], добавлен 22.12.2014Синтаксис логики предикатов. Преобразование унарных предикатов в бинарные. Функции, выполняемые экспертной системой. Правила "если-то" для представления знаний. Разработка оболочки в экспертных системах. Рассуждения, использующие логические формулы.
курс лекций [538,1 K], добавлен 16.06.2012Представление знаний в когнитологии, информатике и искусственном интеллекте. Связи и структуры, язык и нотация. Формальные и неформальные модели представления знаний: в виде правил, с использованием фреймов, семантических сетей и нечетких высказываний.
контрольная работа [29,9 K], добавлен 18.05.2009База знаний - структурированная информация из области знаний для использования кибернетическим устройством (человеком). Классификация, структура, формат представления знаний, интеллектуальные системы поиска информации. Базы знаний на примере языка Пролог.
презентация [51,3 K], добавлен 17.10.2013Анализ процессов диагностики повреждений трубопровода. Разработка модели продукционной базы знаний: обзор методов представления знаний, описание создания базы знаний и разработки механизма логического вывода. Экономическое обоснование концепции проекта.
дипломная работа [3,0 M], добавлен 16.04.2017Проблема представления знаний. Представление декларативных знаний как данных, наделенных семантикой. Представление процедурных знаний как отношений между элементами модели, в том числе в виде процедур и функций. Представление правил обработки фактов.
курсовая работа [33,1 K], добавлен 21.07.2012Рассмотрение теоретических и методологических основ создания компьютерных тестов. Описание практической разработки программного обеспечения для контроля знаний студентов. Сравнение экономических и технических параметров аналогичных тестовых программ.
дипломная работа [1,3 M], добавлен 14.07.2010Фреймы как один из распространенных формализмов представления знаний в электронных системах, их классификация и типы, структура и элементы. Иерархические фреймовые структуры и принципы их построения. Код программы Интерфейс. Разработка программного кода.
лабораторная работа [524,2 K], добавлен 02.11.2013Структура контрольно-оценочной деятельности. Разработка набора инструментальных средств поддержки тестового контроля знаний. Расчет затрат на разработку программной системы с использованием постархитектурной модели COCOMO II. Нормирование шума и вибрации.
дипломная работа [5,4 M], добавлен 21.11.2012Структура экспертных систем, их классификация и характеристики. Выбор среды разработки программирования. Этапы создания экспертных систем. Алгоритм формирования базы знаний с прямой цепочкой рассуждений. Особенности интерфейса модулей "Expert" и "Klient".
курсовая работа [1,1 M], добавлен 18.08.2009Обобщенная структура и принципы функционирования экспертных систем. Выбор модели представления знаний. Разработка логического блока программы и графического пользовательского интерфейса. Текст программы и экспериментальная оценка результатов работы.
дипломная работа [2,4 M], добавлен 06.03.2013Проверка и коррекция знаний учащихся в системе личностно ориентированной технологии образования с использованием тестирования. Подготовка материалов для компьютерного контроля знаний. Разработка проекта "тестирующая программа". Понятие и виды тестов.
дипломная работа [696,2 K], добавлен 16.06.2015Фреймовые модели представления знаний. Разработка структуры фреймов для реализации экспертной системы. Разработка экспертной системы с фреймовой моделью представления знаний. Редактирование базы фактов кандидатов и описание режима консультации.
курсовая работа [1,3 M], добавлен 13.10.2012Изучение в реальных условиях способов представления знаний во Всемирной сети. Представления данных в интернет и способы эффективной публикации данных. Конфигурация Web-сервера на виртуальном хостинге. Настройка и отладка работы сайтов на разных CMS.
отчет по практике [947,2 K], добавлен 09.02.2012