Методология, технология и организация информационно-аналитической работы

Понятие, сущность, структура и задачи аналитики. Методология и принципы организации аналитической деятельности. Методы формализации предметной области и моделирование. Аналитика как взвешенный подход к разработке и оцениванию управленческих решений.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 10.01.2016
Размер файла 695,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

В связи с этим, чрезвычайно важным фактором, определяющим успешность применения созданной базы данных, является структура описаний (совокупность атрибутов, используемых для описания объектов учета) . Если структура описаний не обеспечивает тех возможностей, которые необходимы потребителю для производства работ с ресурсами базы данных, то из эффективного инструмента информационной работы база данных превращается в кладбище данных, где на покосившихся крестах и памятниках давно повыцвели надписи. Уже на уровне структуры описаний должны быть учтены особенности технологии обработки информации, структура деловых процессов, возможности дальнейшего наращивания комплекса средств автоматизации, возможность востребования данных и без применения специализированных интерфейсов (программ иных, нежели программы системы управления базами данных) и так далее. В противном случае, в какой-то момент времени, когда очередная смена технологии потребует заменить интерфейсное программное обеспечение, вам придется проводить на заслуженный отдых не только эти программы, но и все те данные, которые были накоплены за годы работы вашей организации.

Вопросу атрибуции данных мы посвятим отдельный подраздел в данной главе. При этом мы не будем затрагивать проблему синтеза классификаций, которые используются для декомпозиции некоторой системы или предметной области на классы сущностей, описываемых набором атрибутов -- эти вопросы подробно рассматриваются в специализированной литературе, посвященной вопросам теории баз данных, их проектирования, организации процесса проектирования и создания Мейер Д. Теория реляционных баз данных: Пер. с англ. -- М.: Мир, 1987, Васкевич Д. Стратегии Клиент/сервер. Руководство по выживанию для специалистов по реорганизации бизнеса. -- К.: Диалектика, 1996.. При рассмотрении вопросов, связанных с атрибуцией данных, наше внимание будет сосредоточено на проблеме создания специфических баз данных -- баз данных, предназначенных для хранения первичных материалов ИАР (сообщений) и описания источников информации, адаптированных к решению задач автоматизированного анализа ситуаций .

Однако, прежде, чем перейти к рассмотрению этого блока вопросов, рассмотрим специфику структурированных источников информации.

Мы уже указали на необходимость использования для работы со структурированными данными двухуровневых моделей интерпретации, а именно -- модели организации данных (метаданных или метамодели). Располагая такой моделью, аналитик получает уникальную возможность получения специализированных массивов данных, отражающих состояние некоторого атрибута объекта анализа. В том числе, благодаря наличию структурной организации, может быть легко получен упорядоченный во времени массив численных значений некоторого параметра системы или процесса, или, наоборот -- мгновенный срез состояния системы, образованный совокупностью измерений всех ее параметров.

В этом смысле, база данных представляет собой уникальный источник информации, использование которого в сочетании со средствами автоматизации ИАР способно многократно повысить продуктивность труда аналитика. Характерно, что большинство технических средств сбора информации, выражающих результаты в символьном виде, способно служить источниками только таких -- специализированных данных. Как следствие, методологическое обеспечение систем анализа структурированных и числовых параметрических данных во многом совпадает . Даже в случае, когда в качестве параметров используются естественно-языковые термины, они могут рассматриваться как численные оценки значения атрибута, между которыми могут быть установлены те или иные отношения (порядка, величины, объема понятия и т. д.). В результате для обработки таких данных могут быть (хоть и с некоторыми изменениями) применены пакеты автоматизированной статистической обработки данных наблюдений, системы математического моделирования и иные программные средства, располагающие широкими возможностями для проведения статистических исследований, анализа временных рядов, спектрального анализа и так далее.

По существу, одной из задач информационной работы и является построение именно такого, структурированного ресурса для «внутреннего потребления» субъектом ИАР. Однако на пути к этому необходимо решить целый ряд сложных проблем, связанных с переходом от символьных данных произвольной семантики к символьным данным специальной семантики, обладающих метризованным словарем. Здесь, в частности, используются методы нечетких множеств, многозначной и нечеткой логики (работы А. Лукасевича, Л. Заде и их последователей).

Взаимные преобразования различных типов данных

Структурированные текстовые данные занимают промежуточную ступень между численными и естественно-языковыми данными. К этому виду могут быть приведены практически любые числовые данные, при этом речь идет не о преобразовании записи числа из системы цифровой записи в запись с помощью числительных натурального языка, а реальной трансляции числа в термин. Примером такого преобразования может выступать преобразование числовых данных «длина отражаемой или излучаемой объектом волны светового колебания» в текстовые данные типа «цвет объекта» и тому подобные. При этом используются не только значения величин, но и производные первого и второго порядков, результаты интегрирования, вычисления дискретной суммы и тому подобных вычислительных процедур.

Инструментом выполнения таких преобразований служат модели трансляции, задачей которых является установление взаимно однозначного соответствия между параметром (группой параметров) и термином на основе объективных критериев. В наглядной интерпретации процесс трансляции данных с частной семантикой (областью определения терминов знаковой системы) к виду данных универсальных знаковых систем может быть представлен так, как это сделано на рисунке, приведенном ниже.

Т1

Т2

Т3

Т4

Т5

Термины П1 (динамика) П 2

Рисунок 4.1 -- Графическое представление процесса трансляции.

Графическая интерпретация процесса трансляции иллюстрирует частный случай применения модели трансляции для преобразования данных, отображающих процесс, характеризующийся одним параметром, в совокупность терминов четырех классов: имена (имя процесса, имя параметра, имя состояния, предикат и характеристика предиката). С помощью подобной модели трансляции могут быть получена следующая совокупность высказываний: «Процесс (имя) пребывает в состоянии (Т1). Значение параметра (имя параметра) (характеристика крутизны Д1, наречие) (предикат П1, глагол)». Усложнение подобной модели трансляции может позволить формировать и более сложные высказывания, но это потребует усложнения тезауруса. Однако уже в таком виде при использовании системы координат параметр/время высказывания будут содержать существительные, наречия и глаголы.

Введение в модель трансляции иерархического тезауруса, позволяет использовать шкалу уровня абстракции, с помощью которой потребитель сообщений сможет управлять степенью детализации информации. Например, нормализованный иерархический тезаурус, состоящий из трех уровней, позволяет описывать некоторое состояние параметра (имя параметра) в терминах, определенных на трех уровнях иерархии. Термин «нормализованный» в применении к этому тезаурусу указывает на то, что между термином и состоянием может быть установлено взаимно однозначное соответствие, то есть, ни в одном высшем уровне абстракции не существует такого термина, границы области определения которого не совпадают с одной из границ области определения терминов низшего уровня. В языках естественного общения такое требование в большинстве случаев не выполняется (до тех пор, пока для решения задач практической деятельности такой термин не будет введен и не заместит общеупотребительный термин).

Модели трансляции в принципе могут быть построены для любой предметной области, для которой в языке естественного общения существует разработанная терминология, которая может быть спроецирована на пространство формальных признаков (модель фрагмента реальности). К числу предметных областей поддающихся трансляции в терминологическую систему относится, в том числе, и пространственная семантика. В частности, этот принцип используется в географии при именовании объектов, размещение которых может быть отображено на некоторой модели.

Большим преимуществом структурированных текстовых данных перед неструктурированными тестовыми данными является возможность их перевода к графическому представлению, которое, как известно, способно стимулировать мыслительную деятельность, а также позволяет в сжатом виде выразить большое количество информации. То есть, модели трансляции могут использоваться и для обратного преобразования, однако точность такого преобразования довольно низка и определяется количеством терминов, включенных в состав модели трансляции. При этом существует проблема совместимости тезауруса источника и модели трансляции.

Благодаря своим уникальным свойствам модели трансляции являются весьма полезным инструментом при работе как с текстами различной тематики, так и при работе с источниками числовых и структурированных данных.

Анализ информативности источников

При рассмотрении технологии поиска, отбора и экспресс-анализа мы не касались проблемы анализа информативности источников. Между тем, задачи анализа информативности источников чрезвычайно важны, поскольку напрямую связаны с вопросами эффективности ИАР.

Наиболее распространенным подходом к анализу информативности источника является подход, основанный на определении отношения числа сообщений, релевантных проблеме исследования, к общему числу сообщений, однако такой подход не всегда приемлем. Например, если некий источник функционирует в соответствии с известным графиком и в установленное время предоставляет релевантные данные, его информативность в соответствии с описанным подходом может оказаться крайне низкой. Но если учесть возможность отслеживания данных только на заданном интервале времени, то при разумной организации работ информативность окажется намного выше, нежели у многих других источников, передающих релевантные данные в непредсказуемый момент времени.

Другой аспект проблемы оценивания информативности связан с характером данных и категорией потребителя (в том числе, его ценностной ориентацией и финансовыми возможностями). Допустим, что, действуя по поручению некого штаба предвыборной кампании, ваша организация решает задачу определения предвыборной тактики гипотетического соперника заказчика, пытающегося «оседлать» малоимущие слои населения. Если в интересах решения задачи вы без разбора закупаете все множество местных газет, то наиболее вероятно, что большую часть денег вы тратите понапрасну. Ведь соперник вашего кандидата тоже ограничен в средствах, и постарается оптимизировать затраты, а значит, он не станет размещать свою предвыборную агитацию в дорогих изданиях (на них придется минимум средств из его бюджета), а будет ориентироваться на дешевые, но содержательные, либо на бесплатно распространяемые газеты, публикующие программу телепередач. Информативность таких газет в целом (в пересчете на количество статей) может оказаться невысокой, но релевантные данные будут встречаться регулярно (из номера в номер).

Можно привести похожий пример, но из сферы бизнеса: едва ли имеет смысл скупать всю региональную прессу для получения суточной сводки биржевых котировок -- для того есть специальные колонки в солидных газетах (а тем более -- в ГСТК Интернет и «за бесплатно»). И наоборот… Всем известно, что реклама -- двигатель прогресса, что стоит она недешево, и что существуют определенные требования к числу показов рекламы для того, чтобы объект рекламы отпечатался в памяти потребителя. Пусть перед вами стоит задача установления системы целей и коэффициентов их важности для некого рекламодателя… Вот здесь вам, действительно, стоит изучить весь массив региональной прессы, дабы установить рекламную политику объекта: состав привлекаемых СМИ, стоимость размещения рекламного блока, слои населения, потребляющего продукцию данного СМИ. Возможно, вам придется сымитировать попытку размещения рекламы в СМИ и изучить предлагаемую их рекламным отделом тактику проведения рекламной кампании… то есть, бизнес-разведка в чистом виде. А на выходе -- сведения о бюджете рекламной кампании, оценка приоритетов конкурента и иные полезные сведения.

Таким образом, любая организация, работающая в сфере ИАО и борющаяся за повышение качества своей информационной продукции, помимо прочих работ должна осуществлять:

-- непрерывные поисковые мероприятия в интересах определения круга источников информации по своей специфике;

-- проводить активный поиск и отслеживать периодически обновляемые информационные ресурсы телекоммуникационных сетей;

-- располагать классификацией аудитории и вести работы по установлению типа аудитории того или иного средства массовой информации.

По существу, на момент получения очередной задачи субъект ИАР должен располагать готовой гипотезой о составе и характере источников, потенциально представляющих интерес для проведения исследований в своей «зоне ответственности». Для освоения новой области исследований полезны различные методы активизации мыслительной деятельности от «метода кроссворда» до мозговых штурмов и исследований технического плана.

Но не все так просто: существует ряд проблем, связанных с процессом оценки информативности, да и с процессом анализа и интерпретации текстовых данных в целом. Как это ни странно, но при решении этих проблем компьютерные системы способны оказать чуть ли не большую пользу, чем эксперт-аналитик. В том числе, речь идет и о проблемах эмоциональной аттестации текстов и выявлении скрытых противоречий и недомолвок во внешне нейтральных и непротиворечивых текстах, а также о проблеме поддержания целостности и стабильности модели мира аналитика.

Проблема активной фильтрации сообщений

Одним из наиболее распространенных путей добывания информации в сфере средств массовой информации является использование каналов межличностных коммуникаций (хотя, «метод потолка и пальца» в СМИ еще никто не отменял). Система межличностных связей бывает крайне сложной, и на пути к потребителю информация проходит через сложную цепочку связей, выполняющую роль активного фильтра.

Работа с сообщениями вторичных источников имеет свою специфику, заключающуюся в том, что относительная простота получения доступа к ним сочетается с крайней сложностью интерпретации данных, получаемых от них. Характерной особенностью современной информационной обстановки является экспоненциальный рост числа вторичных источников информации по отношению к первичным. В создавшихся условиях аналитические службы уже не могут пренебрегать такой важной характеристикой канала распространения информации, как ценностная ориентация вторичного источника или их совокупности. Это приводит к тому, что все больший вес приобретает задача оценивания и «аттестации» источников. Важность этой задачи легко проиллюстрировать с помощью представленного на рисунке примера отображения исходного сообщения первичного источника А0 в сообщения А1 и А2 вторичных.

В предложенном примере исходное сообщение А0, изначально представленное множеством информационных составляющих а0, а1, а7, проходя по цепочке информационного взаимодействия, теряет часть составляющих, трансформируясь в А1 и А2. В данном случае эти потери вызваны различиями в ценностной ориентации индивидов В и С, а множества В и С отражают характеристики их фильтров ценностной ориентации.

Исходное сообщение А

Ценн. ориент. индивида В

Вторичное сообщение А&В

Ценн. ориент. индивида С

Вторичное сообщение A&B&C

A0 = {a0,a1,a2,a3,a4,a5,a6,a7 B = {0,0,1,1,1,0,1,0

A1 = {0,0,a2,a3,a4,0,a6,0 C = {1,1,1,1,0,0,1,0

A2 = {0,0,a2,a3,0,0,a6,0

Рисунок 4.2 -- Случай пассивной фильтрации сообщения.

Рассматриваемый здесь случай демонстрирует двоичный вариант пассивной мультипликативной фильтрации сообщения. При этом коэффициенты фильтра принимают значения 0 или 1, исключая или пропуская без изменений ту или иную составляющую исходного сообщения. На практике такой случай встречается довольно часто и может условно именоваться «случай умалчивания». Однако такая блокировка части сообщения не всегда убедительно выглядит для потребителя сообщения -- на практике значения элементов упорядоченного множества коэффициентов передачи (назовем их условно множителями), составляющего характеристику ценностной ориентации могут колебаться в диапазоне действительных чисел (данное утверждение условно, так как зависит от формальных договоренностей).

Реальная возможность оценивания характеристики совокупной ценностной ориентации всей передающей цепочки, как правило, отсутствует. В редких случаях, используя провокационную стратегию (тестирование) можно определить реакцию компонентов цепочки на отдельные входные сообщения, однако действие социальных и психологических факторов при общении способно обесценить результат такой работы.

Психологические установки собеседников, различия в их социальном статусе, целевой и ценностной ориентации нередко служат причиной того, что в процессе общения собеседники, образуя своебразную систему, оказывают друг на друга взаимное влияние, что также приводит к искажению сообщения. Варианты искажений в таких мини-системах могут быть резко полярными -- от сокрытия до многократного преувеличения или инверсии отдельных смысловых составляющих сообщения. Особенно часто этот феномен наблюдается при попытках сглаживания конфликтных ситуаций.

Особый интерес представляют результаты анализа искажений при наличии нескольких версий сообщения, поступивших из различных источников, поскольку они позволяют сформировать представление о ценностной ориентации вторичных источников и осуществить их категорирование по признаку сонаправленности векторов их целей с целями некоторых политических, финансовых и иных группировок. Вопрос мотивации вторичного источника в данном случае не рассматривается, поскольку применительно к индивидууму, мотивация тех или иных его поступков может быть крайне разнообразна, а для объединений и группировок, как правило, легко выводится из основной целевой функции и совокупной ценностной ориентации.

Казалось бы, все эти характеристики можно выявить лишь в результате кропотливой работы по анализу смыслового содержания сообщений. Да, это так, но… некоторые данные, косвенно характеризующие сообщение и его источник, могут быть получены и на этапе формального и экспресс-анализа сообщений, причем, даже без погружения на семантический уровень. Зачастую даже анализ поверхностных грамматических структур способен дать очень много полезной информации.

Мы уже писали, что организация, активно работающая в сфере ИАО, в интересах создания корпоративного ресурса данных, релевантных основной тематике исследований вынуждены разрабатывать и эксплуатировать собственные базы и хранилища данных, а также специализированный инструментарий ИАР. Соответственно, если строить работу по уму, сообщения должны подвергаться каталогизации, аннотированию и атрибуции (указанию атрибутов сообщения). Состав атрибутов сообщения может варьироваться в зависимости от характера решаемых задач.

С этой точки зрения целесообразно рассмотреть перечень потенциально представляющих интерес аспектов сеансов информационного взаимодействия при получении сообщений и их фрагментов по различным каналам информационных взаимодействий. Но, прежде, чем перейти к рассмотрению задачи атрибуции сообщений, следует определиться с тем, что представляет собой аналитический режим потребления сообщений. Только после этого можно говорить о том, насколько полезны для работы аналитика те или иные атрибуты сообщения.

4.6 Аналитический режим потребления информации

Рассматривая технологии поиска, отбора и экспресс-анализа данных, мы вскользь упомянули о том, что аналитик подвержен действию множества помех, сказывающихся на качестве проводимой им работы. Это действительно так: аналитик, помимо его воли, может быть переведен в режим, не приспособленный для рациональной оценки ситуации. Аналитический режим потребления информации -- это особый режим мыслительной деятельности человека, отнюдь не всегда реализуемый им . Более того, аналитический режим потребления информации -- это режим требующий от человека значительных мыслительных усилий и сопровождающийся стрессовыми нагрузками.

Мыслительная деятельность вообще нелегко дается человеку -- достаточно вспомнить экзаменационную пору, когда есть хочется, как волку, голова гудит, как колокол, а добродушная шутка однокашника может стать причиной серьезной ссоры. Дело в том, что эмоции и логика -- две грани, два метода познания мира. Эмоции можно отнести к восприятию системы как целого, а логику -- к восприятию системы как совокупности элементов. Как следствие, логикой нам удается смирить эмоции, а неконтролируемые эмоции нередко «захлестывают» логику. Именно на этапе осмысления полученного блока информации для аналитика (человека познающего) эмоции могут выступать в качестве препятствия на пути к правильной интерпретации полученных данных. Когда же мы нечто сообщаем сторонним слушателям, то, как правило, выдаем уже результат размышлений и переживаний, и поэтому легко смешиваем логику и эмоции в тех пропорциях, которые сочтем нужными для достижения желаемого эффекта.

В случае, когда человек не имеет времени на логическое осмысление непосредственно наблюдаемой ситуации или поступившей информации, он приблизительно в 50 % случаев выступает в роли ретранслятора эмоций (собственных ли, чужих ли -- безразлично, если обратиться к Социальным Технологиям, то причина становится понятна). Такой эффект часто можно наблюдать в прямых репортажах корреспондентов, передающих не содержание ситуации, а эмоциональную атмосферу, однако в СМИ так реагируют не только в силу специфики устройства психики, но и в силу профессиональной традиции. Действительно, что еще остается делать, когда точные причины и логика событий неизвестны, а единственно достоверные сведения либо слишком общи, либо слишком кратки? Более того, эмоции более мобильны и не требуют от субъекта серьезной мыслительной работы.

Взять, к примеру, события 11 сентября 2001 года: более суток большинство каналов телевидения и средств массовой информации посвящали этим событиям максимум экранного времени и основные ресурсы материальных носителей информации (газетные полосы, дисковые накопители и каналы ГСТК Интернет и т. п.), однако информации для установления населением реальной ситуации было недостаточно. В течение первых суток большинство граждан получило лишь достоверные и непротиворечивые сведения о самом факте состоявшегося террористического акта. За одни сутки население США и других стран было дезориентировано, сформировалась специфическая эмоциональная атмосфера -- спустя неделю в Великобритании были отмечены неединичные случаи психических расстройств, вызванных просмотром трансляции с места событий (английские психиатры назвали это «манхеттенским синдромом»). Обилие сырых, построенных на недостоверной информации версий играло на руку террористам, на сцену выступили представители «оккультных наук», намеренно или ненамеренно дискредитировавшие своими заявлениями работу спецслужб. На этом фоне заявления руководителей спецслужб, осуществлявших систематический и целенаправленный сбор и анализ информации, вне зависимости от степени их достоверности воспринимались с подозрением. Мотивы недоверия были очевидны и скрывались на уровне обыденного сознания, сформированного в ходе просмотра различных горячих новостей, журналистских расследований, сериалов и боевиков: а) не может представитель спецслужбы, запятнавшей свое имя участием во множестве «грязных» дел, говорить правду; б) если так долго распутывается «простейшее» уголовное преступление, то столь масштабное преступление не может быть раскрыто в краткие сроки; в) США находятся в узле мировых противоречий и у них слишком много недоброжелателей; г) спецслужбы давно вышли из под контроля правительства, коррумпированы и недееспособны.

К чему это отступление? Поясним: существует масса причин, по которым даже та информация, которая является и достоверной и непротиворечивой, может быть не воспринята аналитиком -- в числе этих причин одно из первых мест занимает эмоциональный строй информации и состояние аналитика . Эти факторы сказываются на состоянии «ментальных» моделей интерпретации информации, которыми пользуется аналитик. Однако, эта -- эмоциональная -- компонента текстовых сообщений очень часто исключается из рассмотрения при анализе информации либо выделяется в отдельный блок задач анализа. В результате чего при работе с такими сообщениями блокировка модели мира аналитика становится невозможной, что, как будет показано далее, является обязательным требованием к аналитическому режиму потребления информации. Однако, прежде чем продвинуться дальше в наших рассуждениях, следует дать ряд определений. И в первую очередь -- определение термина «модель мира».

Модель мира субъекта познания -- есть активно использующаяся им для выработки управленческих решений совокупность приобретенных в результате накопления и анализа индивидуального и социального опыта представлений о сущностях и процессах реального мира. Модель мира субъекта познания представляет собой целостную динамичную систему представлений, в которой в зависимости от ситуационного контекста субъект способен выделить множество формально изолированных модельных фрагментов.

С точки зрения информационно-аналитической работы наибольший интерес представляют собой следующие фрагменты модели мира субъекта:

-- модель фрагмента реальности, являющегося предметом мыслительной деятельности;

-- модель познающего субъекта, мыслимая им самими (познающий субъект совпадает с объектом познания);

-- модель инструментария сбора данных, мыслимая познающим субъектом;

-- модель источника сообщения.

В процессе аналитического восприятия массива исходных данных познающий субъект в различные моменты времени осознанно фиксирует или модифицирует различные фрагменты своей модели мира. При этом наряду с переработкой данных, непосредственно затрагивающих интересы субъекта в области практической деятельности, познающим субъектом должны подвергаться анализу и те фрагменты данных, которые непосредственно не связаны с решаемой управленческой задачей. Например, те приемы, которые используются источником сообщения для усиления воздействия на получателя сообщения.

Оперируя сформулированными понятиями, можно дать своеобразное определение информационно-аналитической работы.

Информационно-аналитическая работа (ИАР) -- это специфический вид мыслительной деятельности человека , связанный с извлечением из некоторого массива входных данных информации (нового знания об объекте исследования) на основе использования некоторой относительно устойчивой субъективной модели мира. Специфика этого вида мыслительной деятельности заключается в недопущении субъектом ИАР (аналитиком) неконтролируемой, спонтанной модификации собственной модели мира в результате воздействия потока входных данных.

Итак, процесс восприятия сообщений представляет собой систему процедур, осуществляемых потребителем сообщения над отдельными высказываниями и их составляющими, раскрывающими субъективную модель реальности, отраженную в сообщении его автором. Каждое высказывание, входящее в состав сообщения, подвергается анализу с привлечением тех сведений, которыми получатель сообщения располагал на момент времени, непосредственно предшествовавший восприятию. В случае обнаружения логической неполноты или противоречий в приведенной аргументации, при диалогической форме обмена информацией получатель может направить запрос на повторное воспроизведение сообщения, или же потребовать пояснений. При восприятии сообщений, представленных в символьном виде, при обнаружении логической неполноты или противоречий в аргументации, потребитель может самостоятельно вернуться к тому высказыванию, начиная с которого, по мнению получателя, целостность аргументации была нарушена. То есть, в некоторых случаях для восполнения недостатка знаний потребитель сообщения может воспользоваться процедурами привлечения дополнительной (или не воспринятой ранее) информации. Для этого могут быть использованы процедуры повторного считывания информации, построения запроса к источнику сообщения или иным источникам информации.

С точки зрения анализа познавательных процессов особый интерес представляет собой процедура повторного считывания сообщения. Автомату, не способному к обучению, повторное считывание не способно дать какого бы то ни было положительного эффекта, но для обучающегося автомата повторное считывание уже приобретает смысл. Положительный эффект при повторном считывании достигается за счет пополнения или уточнения тезауруса, установления системы отношений между сущностями, упоминаемыми в сообщении, в результате им может быть получена информация об области значений ранее неизвестных терминов и иные сведения, способствующие восприятию сообщения и/или выявлению специфики локального тезауруса и модели мира источника.

Однако эти процедуры могут быть реализованы лишь при наличии мощного тезауруса, в котором возможен поиск, в том числе и ассоциативный. Это означает, что тезаурус в обучаемой системе должен строиться на основе семантического принципа упорядочивания . Принцип алфавитного упорядочения, используемого в классических словарях здесь неприменим -- способ упорядочения должен определяться системой отношений в используемой источником сообщения модели мира. В настоящее время вновь стал популярен класс семантических словарей, строящихся именно по такому принципу См. например: Русский семантический словарь. Толковый словарь, систематизированный по классам слов и значений / Российская академия наук. Ин-т рус. яз. им. В. В. Виноградова; Под общей ред. Н. Ю. Шведовой. -- М.: «Азбуковник», 1998. - в 6-и томах. Это издание, в котором представлена иерархически упорядоченная система современной русской общеупотребительной лексики. Базовая единица описания в словаре -- значение слова; они сгруппированы по частям речи и лексико-семантическим классам слов и их отдельным фрагментам. Словарь содержит около 300 000 лексических единиц -- значений слов и фразеологизмов. -- использование таких словарей при синтезе автоматизированных систем обработки текстов способно дать положительные результаты, однако этого недостаточно: отношения между терминами должны выражать их эмоциональную окраску, направленность действия и иные характеристики. При этом направленность действия должна определяться не столько по отношениям, проявленным в сообщении (по формальным признакам, проявленным в синтактике, т. е. грамматическим категориям), сколько в абсолютном их истолковании (по постулированным в тезаурусе семантическим отношениям).

В качестве примера результатов некорректной аналитической обработки по формальным критериям можно привести результаты анализа высказывания «Лагерь боевиков подвергся бомбардировке». Данное сообщение, будучи истолковано в соответствии с формальными правилами интерпретации будет означать следующее: «Лагерь боевиков подверг себя (подверг-ся -- обращение действия на себя) бомбардировке». Последнее утверждение не может быть признано корректным, однако по формальным признакам -- вполне приемлемо. Корректность высказывания проверяется на модели мира субъекта, и в результате дополняется неким пропущенным в сообщении субъектом, восстановление которого возможно лишь с привлечением социального опыта получателя сообщения.

Если рассматривать конструктивные элементы естественного языка (слова, частицы, знаки препинания и маркеры, выделяющие текстовые макроструктуры, типа абзаца) с позиций семиотики, то в общем множестве этих элементов могут быть выделены специфические подмножества, элементы которых несут специфическую нагрузку как на синтактическом, так и на семантическом (смысловом) уровне. При этом по всем канонам на синтактическом уровне следует рассматривать интерфейсные свойства этих элементов, которыми обусловлены их грамматические функции (например, количество и тип связываемых компонентов для переходных глаголов, падежные цепочки и т. д.), но, в то же время, интерфейсные свойства элементов проявляются и на семантическом уровне. Более того, для ряда элементов строгое разграничение синтактики и семантики осуществить крайне сложно -- эти элементы образуют своеобразное подмножество естественного языка. Именно эти элементы в свое время были выделены в логическое подмножество языка: сюда могут быть отнесены такие конструкции «если -- то», «до после», «ниже выше», «и или» (класс этих терминов охватывает причинно-следственные и пространственные отношения, отношения предшествования следования, включения|вложенности, порядка и иные). Многие элементы служат для выражения отношений иного класса -- близкого к прагматической компоненте сообщения -- это отношения превосходства, предпочтения и иные, обладающие выраженной эмоциональной окраской.

Для корректной интерпретации сообщений требуется наличие служебных эталонных моделей, способных учитывать специфику каждого элемента языка и описывать объекты, процессы и явления реального мира в терминах грамматических и семантических категорий, составляющих модель дискурса (ситуационного и коммуникационного контекста). На основе их использования может быть распознана система различных умолчаний, используемых в сообщении, что позволяет, если не осуществить подстановку в автоматическом режиме, то, как минимум, предоставить для последующего рассмотрения экспертом состав категорий, подстановка которых на место пропущенного термина позволит сформулировать корректное высказывание.

Акт коммуникации и ошибки интерпретации

Увы, никто не застрахован от ошибок интерпретации -- особенно часто они возникают при работе с иностранными языками, для которых потребитель сообщения, как правило, не в состоянии сформулировать целостную модель мира, построенную в терминах данного языка. Однако и родной язык часто преподносит сюрпризы: даже говоря на одном языке люди умудряются настолько превратно истолковывать слова собеседника, что остается только удивляться. Рассмотрим причины возникновения ошибок при осуществлении языковой коммуникации. Определим, что есть акт коммуникации и акт коммуникации в рамках нормативной языковой системы.

Акт коммуникации -- это процесс информационного взаимодействия неизменной совокупности участников акта коммуникации (коммуникантов), ограниченный интервалом времени, на протяжении которого ситуационный контекст информационного взаимодействия остается стабильным. Под ситуационным контекстом мы понимаем как внешние условия протекания акта коммуникации, так и основное содержание деятельности его участников.

Акт коммуникации в рамках нормативной языковой системы или акт нормативной коммуникации -- это такой акт информационного взаимодействия (ИВ), при котором его участники используют для представления сообщений нормативную языковую (знаковую) систему. При этом нормативная языковая система -- есть некий эталон языка, имеющий внешнее материальное представление и в равной степени доступный его пользователям. По существу, нормативная языковая система -- это эталонная модель языка, обращение к которой позволяет синхронизировать представление участников АК о правилах использования терминов и их значении.

Акты коммуникации (АК) в нормативной языковой системе могут быть успешными и неуспешными. В результате успешного акта языковой коммуникации участники получают адекватную проекцию сущностей и отношений реального мира на плоскость (множество) допустимых высказываний и обратное отображение с высказываний на модель реального мира.

Успешный акт коммуникации при нормативной языковой коммуникации характеризуется тем, что результат прямого и обратного преобразования «реальный мир -- модельный мир -- высказывание» приводит к правильной идентификации объектов и отношений реального мира . Такой акт может протекать различным образом и может быть:

-- идеальным (траектории прямого и обратного преобразования сущностей и отношений реального мира в высказывание не будут отклоняться от нормативной траектории);

-- когерентным (прямая и обратная траектории будут совпадать, но при этом могут отклоняться от нормативной траектории);

-- дефлекторным (прямая и обратная траектории не будут совпадать, но приведут к корректному отображению на фрагмент реальности).

Неуспешный акт коммуникации при нормативной языковой коммуникации характеризуется тем, что результат прямого и обратного преобразования «реальный мир -- модельный мир -- высказывание» приводит к ошибочной идентификации объектов и отношений реального мира . Результат завершения АК не всегда очевиден его участникам -- более того, в большинстве случаев ошибки остаются незамеченными.

Причины того, что ошибки часто остаются незамеченными, отчасти разъясняет классификация ошибок АК :

-- ошибки прагматического плана , вызванные наличием расхождений между нормативной и субъективными моделями мира;

-- ошибки семантического плана , вызванные наличием расхождений между нормативной и субъективными терминологиями;

-- ошибки метаязыкового (синтактического) плана, порожденные наличием различий между нормативной и субъективными моделями метаязыка;

-- ошибки контекстуального плана , вызванные нарушениями восприятия источником сообщения контекста информационного взаимодействия.

При возникновении ошибок следует различать два варианта отображения :

-- квазикорректное отображение представляет собой вариант отображения, при котором единичная ошибка или их композиция не приводят к тому, что хотя бы в одной из плоскостей модельного или реального миров высказывание не имеет референта; обнаружение такого рода ошибок является чрезвычайно сложной задачей, поскольку обеспечивает формальное согласование моделей и может быть выявлено лишь при условии, что по мере накопления ошибок расхождение моделей станет явным;

-- индикативное отображение представляет собой вариант отображения, при котором ошибки источника сообщения приводят к проекции высказывания на сущности и/или отношения, не имеющие референта хотя бы в одной из плоскостей модельного мира или в плоскости реального мира; следствием этого становится явление индикации ошибки -- в зависимости от типа ошибки или их композиции индикативное отображение может обеспечивать различную точность при позиционировании ошибки.

Чрезвычайно важными при анализе ошибок, возникающих в ходе информационных взаимодействий, являются условия протекания акта коммуникации. От этих условий зависит то, какого рода ошибки коммуникации будут подлежать локализации, а также то, в какие сроки и с какой точностью это можно будет осуществить. Условия протекания акта коммуникации определяют контекст акта коммуникации в широком смысле. Рассмотрим виды контекста АК:

-- коммуникация, синхронная фрагменту реальности;

-- коммуникация, не синхронная фрагменту реальности;

-- коммуникация с совпадением фрагментов моделей мира участников АК;

-- коммуникация без совпадения фрагментов моделей мира участников АК;

-- коммуникация с установлением визуального контакта между участниками АК;

-- коммуникация без установления визуального контакта между участниками АК;

-- коммуникация с наличием адекватного инструментального контакта с фрагментом реального мира, на который осуществляется проекция высказываний;

-- коммуникация без наличия адекватного инструментального контакта с фрагментом реального мира, на который осуществляется проекция высказываний.

Таким образом, можно выделить четыре дихотомии, описывающие контекст информационного взаимодействия , относящиеся к условиям:

-- наблюдаемости участников ИВ;

-- совместимости фрагментов моделей мира;

-- инструментальной доступности фрагмента реальности;

-- синхронности АК фрагменту реальности.

Перечисленные дихотомии не предполагают симметричности отношений и обладают свойством направленности, т. е. контекст ИВ может быть несимметричным для участников АК. Более того, именно, несимметричность контекста ИВ наиболее характерна при анализе сообщений СМИ.

Управление элементами модели мира

Модель мира, синтезируемая аналитиком на основе личного и социального опыта, является тем фундаментом, на котором строится вся аналитическая работа. Более того, модельный мир субъекта представляет собой мыслимый интерфейс для управления объективной реальностью. Можно предложить различные классификации элементов модельного мира. Так, например, для объективной реальности элементами являются объекты и процессы реального мира, а элементами модели мира субъекта -- их характеристики, состояния и отношения. Однако в данном случае нас интересует несколько иной аспект модельного мира -- аспект, связанный с коммуникацией и восприятием информации.

Поскольку целью АК является передача информации (независимо от ее характера), постольку практически во всех случаях речь идет о процессе модификации (адаптации) моделей мира участников АК. Таким образом, в течение АК состояние элементов модельного мира участников остается стабильным лишь на протяжении времени, необходимого для восприятия высказывания (к числу элементов модельного мира относятся субъективная модель мира, субъективная модель терминологии и субъективная модель метаязыка Семиотика. Под ред. Степанова Ю.С. -- Благовещенск: БГК, 1998). Соответственно, ошибки могут возникать вследствие несовместимости различных фрагментов модельного мира участников АК (см. рис. 5.3).

При этом будем учитывать, что структура модельного мира аналитика, представленная на рисунке, показана для одного из видов деятельности (языковой коммуникации). Для других же видов деятельности может быть выбрано и иное деление на фрагменты, что мы и продемонстрируем позже.

Сформулируем ряд важнейших утверждений относительно целей акта коммуникации.

Утверждение 1: Целью любого акта коммуникации и процесса информационного взаимодействия в целом является управление состоянием элементов модельного мира.

Утверждение 2: Целью акта коммуникации могут быть синхронизация (согласование) или десинхронизация (рассогласование) состояний элементов модельного мира участников акта.

Утверждение 3: Целью управления состоянием элементов модельного мира является управление процессами реального мира.

Для всякой системы, в которой могут возникать ошибки различного рода важно оценить те условия, при которых она обладает максимальной и минимальной устойчивостью, по отношению к воздействию. В зависимости от целей, преследуемых участниками АК, участники АК по-разному оперируют своими моделями мира. Проведем анализ АК, условно разделив модельный мир потребителя сообщения на два фрагмента, один из которых ответственен за представление источника сообщений, а другой -- за представление всех остальных элементов реального мира. Фиксируя в различных сочетаниях состояния этих фрагментов модельного мира потребителя сообщения, получим следующие разновидности АК.

-- с абсолютной фиксацией модельного мира потребителя сообщения (ММПС);

-- с фиксацией фрагмента модельного мира потребителя сообщения, ответственного за представление источника сообщения (ИС);

-- с фиксацией фрагмента модельного мира потребителя сообщения, не ответственного за представление источника сообщения (ММПС-ИС);

-- без фиксации модельного мира потребителя сообщения.

Данная классификация будет представлять интерес при решении прикладных задач лишь в том случае, когда для потребителя сообщения будет введено разграничение пассивной и активной стратегий. С этой целью в рамках диалогического режима коммуникации выделяются интервалы времени, в пределах которых каждый участник АК потребляет или передает информацию. Полная классификация АК по признаку состояния элементов модельного мира включает 32 варианта отношений между участниками АК. Однако при рассмотрении закономерностей аналитической работы с материалами СМИ или иных источников информации, не подлежащих обучению или переубеждению, интерес представляет лишь часть разновидностей АК. Работа с источниками информации предполагает скорее монологический режим коммуникации, а это значит, что элементы модельного мира источника сообщений (корреспондента) должны рассматриваться как фиксированные. Как следствие получаем всего восемь типов АК, различающихся лишь статусом активности потребителя сообщения (способом получения сообщений: целенаправленный поиск или помимовольное потребление информации). Поскольку аналитик имеет мотивацию к анализу сообщений, постольку и статус активности потребителя сообщений (аналитика) фиксируется в активном состоянии -- соответственно остается лишь четыре варианта отношений. Таблица, содержащая сокращенный вариант классификация АК по признаку состояния фрагментов модельного мира приведена в табл. 4.1. Если колонка ММПС-ИС или ИС содержит «0», то данный фрагмент модели мира потребителя сообщения остается неизменным, а если «1», то фрагмент модифицируется.

Таблица 4.1 -- Характеристика значимых вариантов АК

ТипАК

ММПС-ИС

ИС

Оценка содержания АК

АК1

0

0

АК неэффективен

АК2

0

1

Потребитель сообщений оценивает модельный мир источника сообщений (фрагмент модели мира потребителя сообщения, ответственный за отражение источника сообщения подвергается модификации)

АК3

1

0

Режим активного авторитетного обучения (модель мира источника сообщения служит эталоном для коррекции модели мира потребителя сообщения, что не сопровождается изменением мнения об источнике)

АК4

1

1

Потребитель сообщений корректирует свой модельный мир (источник сообщений служит эталоном для коррекции модели мира потребителя сообщений, одновременно с этим меняются и оценки в отношении источника)

Относительно неэффективности варианта АК, приведенного в первой строке таблицы, следует привести некоторые пояснения. Если рассматривать АК, как акт, связанный с модификацией модельного мира его участников, то вариант АК1 не может рассматриваться, как успешный. Более того, АК1 не может быть квалифицирован, как АК, сопровождающийся переносом информации. Однако такой тип АК, который являет собой АК1, также значим, поскольку такие АК служат основой для формирования статистического знания (являются источником сведений, которые по мере накопления могут быть обобщенны до уровня нового знания). То есть, АК1 можно считать успешным, если допустить, что информация была воспринята, как очередное подтверждение сведений, имевшихся на момент, предшествовавший получению сообщения, как еще одна итерация на пути к синтезу знания.

В процессе ведения информационно-аналитической работы эксперт-аналитик переходит от одного режима коммуникации к другому, подвергая коррекции то одни, то другие компоненты модельного мира -- это вполне естественно, но существует один нюанс: высокая динамичность модели мира аналитика может стать причиной его неспособности к прогностической деятельности .

По этой причине необходимо рассматривать несколько уровней моделей мира, обладающих различными степенями динамизма. Реализация такого подхода вне коллективной деятельности экспертов представляет собой сложную задачу. Квалификация аналитика, способного реализовать режим сопровождения такой многоуровневой модели должна быть очень высока -- в противном случае произойдет разрушение модели высшего уровня, образующей мировоззренческую и методологическую базу ИАР. Подтверждением может служить низкий уровень аналитических способностей у людей, без подготовки перешедших к режиму активного поглощения телевизионных информационных программ, транслируемых по различным каналам. Низкое качество аналитических выводов обусловлено высокой адаптивностью синтезируемых ими моделей мира. Причиной такой их динамичности является как раз отсутствие базы для накопления статистических знаний (вариант АК 1 в предложенной классификации).

С учетом приведенной классификации АК попытаемся выявить такие сочетания дихотомических пар, описывающих контекст протекания АК, при которых будут возникать критические условия протекания АК. С этой целью определим, какого рода информация может передаваться в ходе АК и какое соотношение дихотомических пар при этом будет обеспечивать наибольшую вероятность ошибочного восприятия сообщения. Однако, даже рассуждая на уровне обыденного сознания, можно прийти к выводу о том, что не все языковые конструкции в равной степени будут подвержены действию этих дихотомических факторов.

Введем своеобразную классификацию видов информации, которая может передаваться с помощью средств языковой (знаковой) системы между участниками АК:

-- эмоциональная (любая не имеющая физической репрезентации, например, этико-морального плана -- такая трактовка характерна для эмотивистской философской школы);

-- субстанциональная (потенциально эмпирически верифицируемая -- трактовка Р. Карнапа);

-- сенсорная (непосредственно данная в ощущениях, в том числе -- с использованием инструментальных средств)

-- пространственная (позволяющая локализовать субстанцию в некотором пространстве);

-- временная (позволяющая соотнести состояние с некоторой шкалой времени).

Рассмотрим, каким образом влияет изменение контекста информационного взаимодействия на восприятие терминов, служащих для передачи перечисленных видов информации. Ниже на табл. 4.2 представлена зависимость, отражающая воздействие контекста АК на восприятие терминов, служащих для выражения информации различного типа.

Не имея возможности предоставить строгую количественную оценку изменениям качества восприятия, воспользуемся шкалой с тремя градациями {-1, 0, 1}. Каждой из градаций шкалы установим в соответствие следующие значения: «-1» -- «ухудшение», «0» -- «без изменений», «1» -- «улучшение». Такое размещение данных позволяет наглядно продемонстрировать насколько комфортным для восприятия сообщения, состоящего из терминов заданного класса, является тот или иной вид контекста ИВ. Из таблицы явствует, что наиболее критичным для восприятия сообщения при любой комбинации прочих условий, задающих контекст, является несовместимость фрагментов модельного мира. Несовместимость фрагментов модельного мира оказывает негативное воздействие на восприятие всех видов терминов. Если же оценивать, какой именно вид информации наиболее устойчив по отношению к вариациям контекста ИВ, можно сделать вывод о приоритете временной информации (описывающей точное время, интервал времени или отношения предшествования/следования).

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.