Методология, технология и организация информационно-аналитической работы

Понятие, сущность, структура и задачи аналитики. Методология и принципы организации аналитической деятельности. Методы формализации предметной области и моделирование. Аналитика как взвешенный подход к разработке и оцениванию управленческих решений.

Рубрика Программирование, компьютеры и кибернетика
Вид дипломная работа
Язык русский
Дата добавления 10.01.2016
Размер файла 695,5 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Для обработки результатов наблюдений используются методы корреляционного, регрессионного, факторного, кластерного и иных видов анализа, оперирующих статистическими гипотезами. Особая роль здесь отводится методу статистических испытаний (методу Монте-Карло). Это метод численного решения математических задач, основанный на многократном теоретико-вероятностном и статистическом моделировании случайных величин или процессов с целью построения статистических оценок для искомых величин. Сущность метода состоит в реализации многократного моделирования случайного явления с помощью некоторой процедуры, дающей случайный результат. Для этого с применением ЭВМ создается некоторое множество реализаций случайных процессов, моделирующих возмущающие воздействия на исследуемый объект или процесс, после чего производится моделирование этого процесса или объекта в условиях, определяемых полученными случайными воздействиями. Результаты такого моделирования обрабатывают с использованием методов математической статистики. При этом могут варьироваться тип и параметры распределения случайной величины.

Реализация случайного процесса методом Монте-Карло представляет собой последовательность розыгрышей единичных жребиев, перемежающихся обычными расчетами, в ходе которых определяется результат возмущающего воздействия на объект или процесс, на исход операции.

Поскольку адекватность модели распределения случайных воздействий в общем случае установить трудно, задачей моделирования с применением метода Монте-Карло является обеспечение робастности полученных решений (устойчивости к изменению параметров закона распределения случайных величин и начальных условий моделирования). Если результат моделирования не является робастным (существенно зависит от параметров закона распределения и параметров модели), то это свидетельствует о наличии высокого риска при принятии решения в данной реализации моделируемой системы.

Важную роль в статистических моделях играют гипотезы о характере процессов смены состояний в моделируемой системе. Так, например, весьма интересный случай представляет собой гипотеза о «марковости » процессов (получившая название в честь русского ученого А.А. Маркова -- начало XX века). Марковские процессы представляют собой случай процесса с детерминированными вероятностями, для которого ранняя предыстория смены состояний системы на некотором предшествующем интервале времени несущественна для установления вероятности наступления следующего события -- основное значение придается ее текущему состоянию. Если существует уверенность в марковости процесса, это существенно меняет представления о системе (она может рассматриваться как «инерционная», в большой степени зависящая от текущего ее состояния и характера возмущающего воздействия). Принцип марковости был открыт при анализе текстов на естественных языках, где вероятность появления следующего символа может быть предсказана на основе статистического анализа текстовых массивов, на данном конкретном языке.

Статистическое моделирование тесно сопряжено с имитационным моделированием , ходе которого модель объекта нередко «погружается в вероятностную (статистическую) среду», в которой проигрываются различные ситуации и режимы функционирования модели/объекта. Однако имитационные модели могут реализовываться и в детерминированных средах.

Методы статистического моделирования широко распространены в сфере стратегического планирования и управления. Широкому распространению методов статистического моделирования в сфере оперативного управления препятствует высокая трудоемкость процесса моделирования. В основном это связано с необходимостью глубокой математической проработки моделей и высокими требованиями, предъявляемыми к математическим познаниям пользователей.

Аналитические модели

Данный класс моделей обладает высочайшей степенью формализации описаний и применяется там, где закономерности протекания процессов и функционирования системы являются хорошо изученными, а сами процессы могут рассматриваться как детерминированные. Нередко аналитические модели справедливо отождествляются с моделями детерминированных процессов. Такие ограничения являются достаточно жесткими, что ограничивает сферу их применения системами, функционирующими в стационарных условиях (т. е. в малой степени подверженных влиянию случайных возмущающих воздействий) или требуют существенного упрощения модели. В качестве примера аналитической модели может рассматриваться модель невозмущенного движения объекта в космическом пространстве.

Аналитическое математическое моделирование -- это вид моделирования, в ходе которого основная роль отводится аналитической математической модели, обладающей следующими особенностями:

-- аналитическая модель строится на основе некоторой теории или научной гипотезы;

-- модель описывает в целом определенный аспект моделируемой системы (процесс в системе) посредством различных математических конструкций (функций или функционалов, алгебраических или дифференциальных уравнений и т. д.);

-- модель позволяет получать конечные результаты исследования в виде некоторых формальных соотношений, пригодных для производства количественного или качественного анализа.

Использование ЭВМ при аналитическом моделировании не является обязательным, но решение достаточно сложных задач, сформулированных аналитически, целесообразно сопровождать проведением численных исследований на ЭВМ. Для проведения этих исследований разрабатывается соответствующий алгоритм (алгоритмическая модель), реализующая его программа, формируется массив исходных данных, после чего выполняются расчеты.

Проведению аналитического моделирования может предшествовать построение концептуальной модели с целью установления того, какой именно теоретический аппарат целесообразно использовать для моделирования данной конкретной системы.

Важным достоинством аналитического моделирования является возможность получения на его основе фундаментальных результатов и инвариантных зависимостей, которые могут быть распространены как на различные случаи использования моделируемой системы в тех или иных ситуациях и распространены на случаи рассмотрения других систем данного класса.

Основным же недостатком аналитического моделирования является то, что его применение к сложным системам требует существенной идеализации описания системы. Это связано с разрастанием объемов вычислений даже при несущественном усложнении описаний. Такая идеализация может приводить к неполной адекватности получаемых результатов, к тому, что эти результаты могут использоваться лишь в качестве первого приближения.

Однако, такие результаты могут быть использованы в ходе проведения моделирования с применением имитационных моделей в качестве неких опорных величин, относительно которых осуществляется дальнейшее исследование системы.

Имитационные модели

Данная разновидность моделей неразрывно связана с идеей машинного эксперимента. Собственно, имитационная модель -- это модель комплексная, к которой не предъявляется строгих требований к применению моделей какого-то заданного типа. Идеология многомодельного исследования целиком основывается именно на этом типе моделей.

Имитационная модель -- это комплексное логико-математическое представление системы, реализованное в виде программы, предназначенной для решения на ЭВМ, включающее в себя модели различного типа, и рассматривающее аспект функционирования динамической системы во времени. Данный класс моделей применяется при невозможности строгого аналитического решения задачи или проведения натурного эксперимента. Имитационные модели служат для изучения поведения во времени сложной неоднородной динамической системы, относительно структуры которой существуют точные знания или детализированные гипотезы. Для каждого элемента или подсистемы моделируемой системы в памяти ЭВМ формируется блок данных, характеризующих ее текущее и предшествующие состояния, блок логических и вычислительных процедур, описывающих изменения критических параметров во времени, а также производятся вычисления этих параметров на основе заданных значений.

Комплекс подпрограмм или относительно автономных программных агентов функционирует под управлением программы-супервизора, осуществляющей диспетчеризацию вызовов, активизирующей и приостанавливающей на время выполнение тех или иных процедур в соответствии с планом машинного эксперимента, имитируя тем самым поведение системы. В результате машинного эксперимента формируются массивы данных о состоянии различных параметров системы в различные моменты времени с привязкой к системным событиям, имитируемым в ходе эксперимента.

При этом программа-супервизор управляет процессом имитации случайных возмущающих воздействий, от которых зависит функционирование системы в целом и ее элементов и подсистем. Широкое применение здесь находит метод Монте-Карло, ранее упоминавшийся нами.

Имитационная модель -- это инструмент исследования, посредством которого могут осуществляться и манипуляции с масштабом времени функционирования модели. Различают имитационные модели, функционирующие как в натуральном, так и в замедленном или ускоренном масштабе времени. Это является крайне важным при анализе поведения систем, для наблюдения которых отсутствует возможность воспользоваться натуральным масштабом времени. К разряду таких систем могут быть отнесены экосистемы, популяции, системы, в которых протекают скоротечные физические процессы и иные.

К числу наиболее памятных для человечества имитационных моделей могут быть отнесена модель глобальной ядерной войны, приведшая к укоренению в обиходе политиков и военных термина «ядерная зима». Эта модель оказала существенное влияние на международную обстановку и на долгое время снизила накал гонки вооружений. Но уроки не идут впрок -- все забывается и новые политики безответственно манипулируют терминами «превентивный удар» и иными, столь же абсурдными.

Частным случаем имитационных моделей являются модели ситуационные. Ситуационные модели -- это модели, используемые при решении задач с неопределенностью, исходя из совокупности ситуаций . В отличие от других моделей, основанных на заданном графе функционирования системы, для ситуационной модели такой граф неизвестен. Однако существует набор прецедентов ситуаций, обладающих малым прогностическим потенциалом. Под ситуацией будем понимать временное отношение, сложившееся между ее объектами-участниками, либо между состояниями этих объектов.

Соответственно, под ситуационным моделированием будем понимать метод анализа некоторой системы с применением ситуационной модели, с требуемой степенью адекватности отображающую логическую, временную, пространственную структуру процессов, а также характер и структуру информации о состоянии системы и изменении образующих ее элементов.

Для создания ситуационных моделей требуется решить следующие задачи:

-- создать информационную модель фрагмента реального мира, в которой каждому явлению, процессу или участнику будет соответствовать уникальный информационный аналог;

-- обеспечить сбор и регистрацию информации об изменениях ситуации во времени, пространстве и пространстве введенных признаков;

-- оценить прогностический потенциал тех или иных ситуаций (что связано с инерционностью вовлеченных в ситуацию объектов и системы в целом и т. п.).

Поскольку граф, описывающий последовательность переходов, для ситуационных моделей в общем случае не определен, постольку целесообразно рассматривать вариант представления ситуационной модели в виде обобщенной семантической сети (см. определение, данное ранее). Одна из разновидностей семантических сетей -- сценарий, как нельзя лучше подходит для этой цели.

В целом структура ситуационной модели определяется субъективными особенностями восприятия и свойственным аналитику способом разложения ситуации на составляющие. Это вызвано тем, что эксперт-аналитик, осуществляющий процедуру синтеза ситуационной модели, формулирует свои собственные критерии, соответствующие пребыванию системы в том или ином состоянии.

2.3 Аналитика как интерфейс между теорией и практикой

Говоря о посреднической (интерфейсной) функции аналитики, мы указываем на роль аналитики как некоторого средства, обеспечивающего связь между потребностями, существующими в практической сфере управления, и возможностями, предоставляемыми теоретико-методологическим блоком аналитики, рассмотрению которого были посвящены предыдущие разделы этой главы.

Сразу вспоминается кинофильм «Кавказская пленница» и ставший популярным тост: «…Так выпьем же за то, чтобы наши желания всегда совпадали с нашими возможностями!» И ведь не случайно вспоминается -- скорее всего, по прочтении предыдущих разделов у вас возникло ощущение, что ваши потребности не полностью удовлетворяются возможностями, предоставляемыми теоретико методологическим блоком. Да, действительно, процедура перехода от теории к практике (и наоборот) является непростой -- хотя бы по причинам психологического плана. Для того, чтобы осуществить этот переход, требуется либо наличие определенных навыков системного мышления, либо каких-либо методов преодоления психологического барьера, всегда существующего при освоении нового.

Ну, а поскольку в психологии все мы чувствуем себя большими специалистами, постольку решение «проблемы старта» начнем именно с психологических позиций (надо же с чего-то начинать -- так зачем начинать с непонятного). Кстати, когда речь идет о приобретении знаний и навыков, этот подход себя оправдывает -- иначе желание учиться отбивается напрочь.

Методы активизации мышления

Представим себе ситуацию такого сорта: проблема есть (ее существование остро ощущается), а знаний для ее решения, подлежащих формализации, -- нет. Более того, сама проблема никак не поддается локализации, описанию и структурированию -- ни источника противоречий не видно, ни -- тем более -- путей ее решения. Можно сработать по симптомам, но бросая ресурсы на направление прорыва, оголяешь другие участки, да и ресурсы уходят, как вода сквозь сито. Мозги буксуют на месте, перемалывая одни и те же мысли, но о чем эти мысли? -- Интересно, что чаще всего проносится в голове не мысль, а навязчивая фраза типа «…Черт! В чем же дело?! Как быть?!..» -- и так по циклу, по циклу, как в квартирном счетчике расхода электричества.

Важную роль в преодолении этого состояния играют, так называемые, методы активизации мышления. Применение этих методов позволяет:

-- осуществить переход от эмоционального восприятия к абстрактно логическому (избавиться от восклицательных знаков в формулировке проблемы);

-- перейти к конструктивным интеллектуальным процедурам -- установление комплекса симптомов, поиск аналогов и т. д. -- вплоть до локализации проблемы;

-- приступить к генерации путей решения проблемы.

Осуществить переход от состояния дезадаптационного стресса к состоянию креативного (творческого, созидательного) мышления можно с применением различных методик. В общем случае такие методики можно условно разделить на две группы: психологические и организационные методики. Однако, если приглядеться внимательно, убеждаешься в том, что оба направления являются действенными только в связке -- иначе на выходе получается либо походная колонна невротиков, либо спокойное стадо альпийских коров.

Программисты любят давать бесплатные советы «бестолковым юзерам», например, когда сбоит программа, можно получить такой: «Если у вас что-то не получается -- выйдите и войдите снова». Звучит глупо, особенно, если у вспомнить ослика Иа-Иа с горшочком и лопнувшим шариком: шарик «входил и выходил», а настроение у Иа не менялось. Но происходило это только потому, что шарик и горшочек были простыми объектами -- способностью к структурной динамике они не обладают, эмержентных свойств у них нет, а уж тем более -- способности к адаптации и самоорганизации.

В случае со сложными системами и уж, тем более, с системами, способными к целеполаганию, дело обстоит иначе. Вход и выход из программы, как системы функционирующей в динамической среде, способен дать весьма положительный эффект. Так же обстоит и с входом и выходом из процесса решения задачи в среде динамичной человеческой психики -- от того, как это сделано зависит очень многое, в частности -- результативность мыслительного процесса.

Задача состоит в том, чтобы «правильно» подступиться к решению задачи, для чего и разработаны методы активизации мышления. В этой книге мы не будем апеллировать к опыту, связанному с применением гипноза и психотропных препаратов (хотя трансовые методики тоже используются для достижения эффекта смены эмоционального контекста мыслительных операций), а обратимся с тем методикам, которые зародились в рамках системной теории. Перечислим наиболее распространенные методы активизации мышления (в том числе -- использования интуиции и опыта) экспертов и лиц, принимающих решения:

-- методы коллективной генерации идей (мозговой атаки, судов идей и т. п.);

-- метод «Дельфи»;

-- сценарные методы;

-- методы поэтапной структуризации задач (синтез деревьев целей и задач, прогнозного графа и т. п.);

-- морфологический подход.

Даже беглый взгляд на этот список позволяет сделать вывод о существовании связи между методами активизации мышления и методами синтеза формальных моделей (это очевидно, поскольку названия говорят сами за себя -- многие слова выглядят очень знакомо). Действительно, результаты применения методов активизации мышления используются на соответствующих этапах и уровнях процесса формализации.

Рассмотрим класс методов коллективной генерации идей. Первым представителем этого класса является метод мозговой атаки. Этот метод сформировался в начале 1950-х годов в ходе разработки перспективных программ вооружений и космической техники, проводившихся корпорацией RAND по заказу правительства США. Данный метод зарекомендовал себя настолько хорошо, что на некоторое время был принят в качестве основного метода выдвижения новых идей при синтезе решений сложных межрубрикативных проблем, перспективных планов и прогнозов. В основе метода лежит предположение, что при генерации идей в непринужденной обстановке стимулируется творческая активность, и что среди множества предложенных идей, хотя бы одна, да содержит рациональное зерно. После этапа бурной генерации идей специалисты в спокойной обстановке анализировали выдвинутые варианты решения проблем, невзирая на уровень специальной подготовки лиц их предложивших (хотя состав участников мозговой атаки, безусловно, тщательно подбирается). Существуют несколько разновидностей этого метода: прямая мозговая атака, конференция или «ярмарка идей», обмен мнениями и другие. Основной задачей, ставящейся перед участниками мозговой атаки, является задача генерации максимально возможного количества идей вне зависимости от степени их конструктивности (вплоть до абсурда). Для создания особой атмосферы могут использоваться различные методы стимулирования (в том числе начисление баллов и иные). Вплоть до того, что для повышения творческой активности мужчин-участников мозговых атак в экспертную группу включались привлекательные женщины.

Принято различать прямую мозговую атаку (непосредственно генерацию идей без обсуждения), обмен мнениями (при этом стороны поочередно высказывают свои взгляды на метод решения проблемы -- часто это приводит к выдвижению корпоративных стратегий), суды идей (эксперты разбиваются на две группы -- одна осуществляет прямую мозговую атаку, генерируя идеи, а второй группе вменяется в обязанность выступать в роли критика, выдвигающего контраргументы, направленные на дискредитацию предложенных решений). Часто для проведения мозговых атак используется форма деловой игры, для чего в группу включается специалист-игротехник, задачей которого является поддержание деловой атмосферы, духа здоровой конкуренции и подавление агрессии участников обсуждения. Довольно интересны методы, которые используются игротехниками для обеспечения такого режима общения: часто производится формализация процесса обмена мнениями -- в обиход вводятся стандартизованные речевые обороты, произношение которых входит в обязанность каждого участника игры при генерации тех или иных типов высказываний. За счет этого происходит снижение эмоционального накала, обеспечивается соблюдение установленного этикета. Нарушение регламента может наказываться штрафами или исключением из группы.

Например, на игротехнических модулях профессора О.С. Анисимова в ходе дискуссий с оппонентом обязательно произносится вводная фраза: «Правильно ли я понимаю, что…» -- далее следует изложение интерпретации точки зрения собеседника, которому адресован вопрос. Это позволяет исключить возможность неконструктивной критики, вызванной неправильным истолкованием высказываний оппонента.

Однако, вскоре обнаружился общий недостаток методов типа мозговой атаки -- конформизм и пристрастность суждений, возникающий в условиях, когда социальный (и должностной) статус участников атаки неодинаков. Это явление с одинаковой силой проявлялось как в коллективах ученых, так и в среде политиков, военных, специалистов в области управления производством и финансами.

Наиболее очевидным вариантом преодоления этого недостатка явилось решение о разработке анонимных методов опроса мнений специалистов. Подобные методы возникли в 1960-е годы и получили название методов типа Дельфи. Базовый метод Дельфи представляет собой вариант многоэтапного проведения мозговой атаки, в ходе которой обеспечивается анонимность экспертов, для чего их мнения представляются в виде документов, авторство которых известно только организатору или модератору сессии . Модератор сессий рассылает материалы, полученные в ходе предыдущего тура опроса, остальным членам экспертной группы, предлагая каждому из них произвести ранжирование полученных вариантов по значимости. После чего участники экспертной группы направляют результаты проделанной работы модератору. В дальнейшем, по результатам полученных откликов от членов экспертной группы формируются оценки согласованности мнений, а также вводятся коэффициенты, указывающие на степень продуктивности идей генерируемых каждым конкретным экспертом. Благодаря этому оценивалась целесообразность участия того или иного члена экспертной группы в дальнейшем обсуждении проблемы, а также обеспечивалась обратная связь при синтезе решения. После чего проводились последующие туры опроса, в ходе которых модератором задавалась основная тематика, определившаяся по итогам предыдущих туров. Тогда, в 60-х годах метод Дельфи представлял собой длительную бюрократическую процедуру, что препятствовало его широкому распространению в практике оперативного управления, что существенно ограничивало сферу его применения. Но, спустя годы, в результате развития телекоммуникационных технологий применение метода Дельфи существенно упростилось, а процедура Дельфи вошла в качестве составляющей части в другие методы синтеза управленческих решений.

Сценарные методы представляют собой еще одну группу методов, обычно относимую к классу методов активизации мышления. Следует заметить, что по мере отдаления от начала этого подраздела, методы, причисляемые к этому классу, становятся все менее похожими на методы активизации мышления (по крайней мере, внешне). Ну, каким образом сценарий может активизировать мыслительную деятельность?

Похоже, мы забыли ответить на один очень важный вопрос: -- «Какова, собственно, цель нашей деятельности, для чего необходимо активизировать мыслительную деятельность?» Если этот вопрос оставить без ответа, то вроде бы активизировать мышление и ни к чему. Но вспомним, с чего начинался этот раздел… -- Начинался он с описания состояния растерянности, возникающем при переходе от практики к теории и обратно.

Спускаться с высот абстракции легче -- изучил тезаурус, подновил в памяти значения введенных обозначений и переменных -- и вот он -- ответ на многие вопросы. А вот как взобраться на эти высоты? Как абсолютно неструктурированную проблему превратить в нечто, похожее на модель, как создать тот «скелет», вокруг которого позже будет выстроена теоретическая модель?

Есть такая голливудская профессия -- «писатель сценариев -- scriptwriter». Авторы сценариев -- это не совсем писатели, они не занимаются прорисовкой подробностей. Их задача -- построение сюжетной основы фильма, своеобразной функциональной модели, к которой по ходу работы будут прикрепляться все новые и новые подробности. Если в основе сценария полноценная книга, то сценарий -- это ее модель, модель трансляции текста в фильм -- целостную совокупность видеоряда, текстов, музыки и всех прочих атрибутов кинематографа. Если сценарий рождается, как самостоятельное произведение, то сценарий -- это функциональная модель некоторого фрагмента реального или вымышленного мира, описывающая его с заданным уровнем детализации. Почему фильмы не снимают прямо по книге? -- Да потому, что книги пишутся без учета возможностей кинематографа -- где-то они слишком абстрактны, где-то слишком конкретны, какие-то фрагменты просто не представляется возможным отснять (хотя после вторжения в кинематограф компьютерной анимации трудно представить такие фрагменты).

С той же целью (но не только) пишутся сценарные модели действительности, чтобы создать некое описание, адаптированное для его дальнейшего развития до уровня модели заданного уровня формализации. Подведем итог всем этим вольным рассуждениям на тему кинематографа и не только… Итак, сценарные модели строятся для того, чтобы:

-- создать основу для построения формальной модели;

-- зафиксировать на материальном носителе совокупность знаний о системе или процессе;

-- привести описания системы или процесса к виду, допускающему его описание с помощью формальных средств;

-- проанализировать существующие расхождения в субъективном восприятии проблемной ситуации различными специалистами;

-- выявить максимально полный комплекс вариантов решения проблемы и т. д.

Метод сценариев в своей основе имеет все тот же механизм письменного опроса экспертов, перед которыми ставится задача описания процесса, системы, каких-то особенностей ее функционирования и управления ей, некоторой проблемы или ее аспекта, путей ее решения и т. д. На заре возникновения метода сценариев к сценариям предъявлялось требование их развертки во времени, однако позже это требование было признано необязательным. В современном понимании сценарий -- это имеющее низкий уровень формализации структурированное текстовое описание некоторой проблемы и путей ее решения, представленное в виде совокупности пунктов (или иных блоков, отражающих структуру изложения), между которыми установлены некие логические отношения.

На практике сценарии зачастую имеют весьма интересное оформление. Нередко сценарии бывают представлены в виде подобия графа (см. рис. 2.5), блок-схемы, диаграммы Гантта или иным способом.

Способность сценария стимулировать мыслительную деятельность обусловлена спецификой его представления -- до тех пор, пока наши суждения не зафиксированы на материальном носителе и не приобрели наглядную форму, судить о полноте и непротиворечивости знаний может только их носитель, да и то -- не всегда. Когда же лицо, принимающее решение, имеет совокупность экспертных решений представленных на материальном носителе, у него появляется возможность анализировать их логическую полноту и непротиворечивость, отбраковывать варианты, постепенно формировать основу решения, определять направления работы по сбору информации о конкретных аспектах проблемы (вести работу, направленную на снижение уровня неопределенности знаний).

Существует еще два метода (на самом деле -- это целые классы методов), которые принято относить к классу методов активизации мышления -- это методы поэтапной структуризации задач (синтез деревьев целей и задач, прогнозного графа и т. п.) и группа морфологических методов. Однако, несмотря на несомненную принадлежность этих методов к классу методов активизации мышления, нам показалось более логичным рассмотреть их в следующем подразделе вместе с методами структурирования информации.

Методы структурирования информации

Многообразие методов структурирования информации обусловлено тем, что способов ее представления и организации существует масса, да и информация, сама по себе, бывает весьма различного свойства. Например, весьма существенно то, какие средства отображения/каналы восприятия задействуются при выводе/вводе данных, потенциально содержащих информацию, каков исходный уровень организации этих данных, относятся ли они к разряду числовых, текстовых, графических, видео, аудио и т. д. Очень важную роль играют те цели, которые преследуются при выполнении процедуры структурирования данных (информации).

Краткое отступление: ранее мы уже указывали на различие между данными и информацией, говоря о том, что понятие «данные» связано с представлением информации на материальных носителях, а также о том, что данные для конкретного потребителя могут вообще не содержать информации, поскольку информация -- это те новые знания, которые приобретает получатель данных. Здесь мы считаем нелишним напомнить об этом и, по привычке оперируя словом «информация», будем подразумевать, что структурируем мы все-таки данные (хотя в голове мы можем структурировать и информацию, пытаясь мысленно систематизировать, упорядочить имеющиеся знания).

Для начала введем классификацию целей структурирования информации . Здесь могут быть выделены следующие классы целей:

-- получение качественно нового знания о системе/процессе;

-- установление факта и локализация неполноты и/или противоречивости совокупности знаний;

-- систематизация, упорядочение некоторой совокупности знаний;

-- акцентирование или выделение одного или нескольких аспектов информации (например, временного, пространственного, функционального и т. д.);

-- сокращение избыточности представления информации;

-- согласование представления информации с некоторой системой обработки и интерпретации;

-- повышение наглядности отображения информации;

-- смена уровня общности/абстракции описаний.

В зависимости от класса цели меняются методы и технологии структурирования информации. Но мы уже указывали на то, что цель -- это не единственный фактор, определяющий выбор метода структурирования информации. По этой причине необходимо рассмотреть виды информации, подлежащей структурированию, а также способы ее представления.

Введем классификацию видов информации по ее сущности/содержанию и способу ее использования:

-- информация о ценностях и целях (информация целеполагания), используемая при планировании/прогнозировании;

-- информация о функциях системы/процесса;

-- информация о структуре системы/процесса;

-- информация о динамике системы/процесса;

-- информация о состоянии системы/процесса;

-- информация о задачах системы/процесса.

В приведенной классификации виды информации размещены в порядке убывания периода стабильности/актуальности. Однако два класса информации, описывающей ценности, цели и задачи, являются относительно независимыми от состояния, динамики, структуры и функций системы/процесса, поскольку связаны с реализацией функции целеполагания. Впрочем, можно считать, что решение об использовании именно такой схемы размещения этих классов информации вполне обоснованно, поскольку позволяет решать многие прикладные задачи.

Кроме всего прочего, следует учитывать еще и такие классификационные признаки, как:

-- отношение информации к объекту:

-- информация, относящаяся к объекту;

-- информация, относящаяся к классу объектов;

-- информация, относящаяся к среде;

-- отношение информации к некоторому моменту времени:

-- информация, относящаяся к прошлому;

-- информация, относящаяся к настоящему;

-- информация, относящаяся к будущему;

-- отношение информации к классу структурной организации:

-- информация неструктурированная;

-- информация структурированная;

-- информация упорядоченная;

-- информация формализованная.

Теперь, после того как мы определились с тем, что же, собственно, нам предстоит структурировать, можно перейти к рассмотрению методов структуризации.

Можно ли сказать, что структуризация информации/данных -- это нечто новое или незнакомое нам? -- Конечно, нет. Собственно, все те действия, которые мы проделывали в начале этого подраздела, представляли собой одну из множества ипостасей процесса структуризации информации. В нашем случае мы занимались структурированием знаний -- мы решали задачу изменения уровня организации знаний, пытаясь построить компактную систему знаний, которая могла бы выступать в качестве основы для дальнейшего развития теории (американцам очень нравится слово «скелет/skeleton», которым они пользуются в таких случаях).

Следует признать, что у американцев язык науки гораздо более метафоричен, нежели чем у нас, а ведь метафора, как мы указывали, -- это ступень к новому знанию. Если мы знаем, с чем можно сравнить нечто, то вполне вероятно, что на это нечто могут быть перенесена некоторая часть наших знаний об объекте, с которым мы сравниваем это нечто. Наш «великий и могучий русский язык» гораздо более академичен, а процесс словообразования достаточно сложен и не всегда приводит к желаемому результату (закреплению нового, более «экономного» слова). Это довольно грустно, поскольку одним из первых признаков научного и культурного застоя является прекращение словотворчества и преобладание процесса приращения словаря за счет иноязычных заимствований. Надо сказать, что даже предмет национальной «гордости» россиян -- русский мат -- по запасу ругательных слов, оказывается, уступает большинству языков мира. Зато мы чаще пользуемся этими словами -- запальчиво возразит «патриот»… что ж, возможно, но это тоже аргумент не в нашу пользу.

Итак, зачем мы так старательно расклассифицировали цели структурирования информации? Да затем, чтобы создать тот самый скелет, который нам предстоит в дальнейшем оснастить «сухожилиями», «мышцами» и обтянуть «кожей» -- то есть дополнить более конкретными знаниями. Что ж, скелет мы уже смастерили -- пора приступать к следующему этапу.

В основе большинства процедур структурирования лежит метод классификации. Классификация -- это иерархически организованная система информационных элементов , обозначающих объекты/процессы реального мира и упорядоченных по признаку сходства/различия классификационных признаков, отражающих избранные свойства объектов. Как правило, процедура классификации (классифицирование) осуществляется для удобства исследования некоторой предметной области (фрагмента реального мира). Принято различать следующие виды классификации:

-- искусственную, осуществляемую по внешним признакам, не выражающим сущности объектов/процессов, и служащую для упорядочения некоторого их множества;

-- натуральную (естественную), осуществляемую по существенным признакам, характеризующим внутреннюю (сущностную) общность объектов/процессов.

Натуральная классификация является инструментом и результатом научного исследования, поскольку выражает результаты изучения закономерностей классифицируемых объектов/процессов. В то время как искусственная классификация обладает исключительно прикладной ценностью в рамках решения конкретной задачи. Например, спелое/неспелое яблоко -- натуральная классификация, красное/зеленое яблоко -- искусственная.

От качества выполнения процедуры классификации на ранних этапах исследований сложных систем (да и не только сложных) зависит результативность и качество всей работы. Поэтому при осуществлении процедуры классификации необходимо придерживаться следующих принципов.

-- при выполнении каждой операции разделения на классы (акт деления) допускается применение только одного классификационного основания;

-- совокупный объем полученных в результате разделения на классы понятий должен равняться объему делимого понятия;

-- понятия, полученные в результате деления должны взаимно исключать друг друга;

-- деление должно быть последовательным.

Классификации делятся на следующие виды:

-- простые (одноуровневые), например -- дихотомия, когда одно понятие верхнего уровня (А) делится на два таких (В и С), что для них выполняются условия А = В + С и В = не С (С = не В);

-- сложные (многомерные) обычно, представляемые в виде таблиц сложной организации, где строкам и столбцам соответствуют различные классификационные признаки, например -- периодическая таблица химических элементов Д.И. Менделеева;

-- иерархическая (древовидная), едва ли нуждающаяся в примерах и пояснениях.

Метод классификации в том или ином виде используется при решении самых разнообразных задач, связанных со структурированием информации. Неорганизованные информационные элементы подвергаются процедурам группирования, связывания, обобщения, в результате чего структура или проявляется (при натуральной классификации), или образуется (при искусственной классификации). В книге В.Ф. Турчина «Феномен науки: Кибернетический подход к эволюции» Турчин В.Ф. Феномен науки: Кибернетический подход к эволюции. Изд. 2-е -- М.: ЭТС. -- 2000. -- 368 с. момент смены уровня организации системы именуется метасистемным переходом (возникновения системы более высокого уровня иерархии), который и рассматривается как эволюционный процесс. Соответственно, процессы синтеза новой классификации и структурирования информации можно рассматривать, как процесс эволюции знаний. Это не означает, что в результате выполнения процедур классификации или структурирования появляется новое знание, но означает, что в результате выполнения этих процедур создается новая система управления знаниями , существенно упрощающая различные манипуляции с ними, в том числе -- и поиск ранее не выявленных закономерностей и законов.

Заметим, что процедура классификации не имеет собственной ценности и приобретает ее только, если она способствует достижению некоторого комплекса целей. Созданная в результате выполнения классификационной процедуры система управления знаниями должна быть полезной -- что означает, что выбор классификационных критериев не может быть произвольным, а должен осуществляться с учетом решаемой задачи. Они должны отвечать целям деятельности. При этом следует различать два вида/аспекта деятельности.

-- деятельность, направленную на достижение конечной (генеральной или глобальной) цели;

-- деятельность, направленную на решение задач обеспечения этой деятельности.

К последней категории может быть отнесена деятельность, направленная на решение задач построения адекватной модели предметной области, ее тезауруса, создания инструментальных средств, используемых для достижения конечной цели.

При структурировании информации должна учитываться специфика потребителя полученного информационного продукта. Иными словами, полученный информационный продукт должен отвечать требованиям к уровню детализации информации, способу ее представления и составу тезауруса, обеспечивающим оптимальный режим восприятия информационного продукта.

Ранее, при рассмотрении видов моделей и методов моделирования мы установили, что уровень формализации представления знаний может изменяться в пределах от неструктурированного текста, представленного на естественном языке (ЕЯ) до структурированного текста на некотором искусственном (формальном) языке (ИЯ). Искусственные языки могут быть построены в базисе различных формальных систем (формальной логики, теоретико-множественного, алгебраического формального аппарата и иных).

В зависимости от исходного уровня структурной организации обрабатываемых данных, могут быть выделены следующие классы задач (классы задач по уровню структурной организации информации на входе/выходе):

1. Задачи преобразования неструктурированного ЕЯ-текста в ЕЯ-текст с разбиением на рубрики;

2. Задачи преобразования ЕЯ-текста с разбиением на рубрики в структурированный ЕЯ текст с элементами логического формализма;

3. Задачи преобразования структурированного ЕЯ текста с элементами логического формализма в символьную модель, использующую формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг);

4. Задачи преобразования символьной модели, использующей формализм теории графов с ЕЯ-маркировкой вершин (узлов) и связей (дуг), в символьную модель, использующую формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг);

5. Задачи преобразования символьной модели, использующей формализм теории графов с ИЯ-маркировкой вершин (узлов) и связей (дуг), в строгую символьную ИЯ-модель.

В принципе, уже после решения задачи второго типа, может осуществляться переход от ЕЯ-представлений к некоторой промежуточной системе обозначений (имен), как это делается при разработке программ. Однако такой переход имеет смысл только при условии, что уже произведена декомпозиция на элементарные термины, выражающие свойства и функции объектов, с тем, чтобы в дальнейшем для них не потребовалось осуществлять процедуру восстановления ЕЯ-представления. Если это условие выполняется, то становится возможен даже автоматизированный переход от промежуточной системы имен к ИЯ-представлению (при условии существования тезауруса соответствующего уровня). В общем же случае, операция детальной декомпозиции осуществляется лишь при решении задачи четвертого типа. Впрочем, жесткий стандарт здесь установить трудно, да и не может он быть жестким, поскольку специфику алгоритма структуризации определяют цели деятельности.

Более того, в случае, когда достигнутая степень формализации не удовлетворяет требованиям, предъявляемым спецификой деятельности, полученное формальное описание может быть повторно подвергнута процедурам, которые ранее осуществлялись в отношении представления иного типа.

Заметим, что структурированию может подвергаться и информация, представленная в нетекстовом виде, однако и здесь могут быть выделены задачи, по своему содержанию -- равносильные перечисленным.

Например, рассматривая в качестве исходного массива данных массив графических изображений различных фрагментов некоторого объекта/процесса, относящихся к разным моментам времени и полученных с разных ракурсов, можно решить задачу структурирования , воспользовавшись теми же этапами/задачами. Для чего можно воспользоваться одной из двух стратегий:

-- осуществить предварительную трансляцию в текстовую форму (составление подробных описаний изображений на ЕЯ с указанием пространственных и временных отношений между описываемыми объектами), после чего воспользоваться ранее описанными процедурами;

-- интерпретировать изображение, как разновидность текста, с применением альтернативной знаковой системы, позволяющей осуществить процесс структуризации в другой знаковой системе.

В качестве теоретического основания для применения такого подхода выступает семиотика, интерпретирующая любой способ представления информации как разновидность текста, представленного средствами некоторой знаковой системы. Для графического представления информации разработан ряд методов, позволяющих перейти от обычного цветного тонального изображения к контурным и иным представлениям, упрощающим процедуры распознавания и трансляции к иным знаковым системам. Однако, поскольку графические модели, получаемые методом последовательной фиксации состояния объектов реального мира, способны отражать лишь пространственно-временные и атрибутивные характеристики наблюдаемых объектов/процессов, постольку извлечение из них системы причинно-следственных отношений становится возможным только с привлечением внешней (чаще всего -- экспертной) модели интерпретации.

Наиболее распространенным путем решения задач структуризации информации является привлечение эксперта-аналитика. В этом случае на него ложится вся нагрузка по преобразованию исходного текста: от поиска связных фрагментов до выявления системы логических, пространственных, временных отношений и дальнейших процедур синтеза формальной модели. Хотя в последнее время, благодаря развитию семиотики, лингвистики, теории искусственных языков, теории систем искусственного интеллекта, нейрокибернетики и ряда других научных дисциплин, в эту отрасль стали все чаще вторгаться технологии если не автоматического, то автоматизированного анализа и структурирования информации. Среди такого рода технологий можно выделить системы автоматизированного реферирования текста, предназначенные для извлечения фрагментов текста, наиболее ярко выражающих сущность текста или его основные положения. Как правило Впрочем, рассматриваются и иные подходы, например, грамматический и логико-семантический подходы, привлекающие к процессу реферирования и структурирования текста присутствующие в нем метаязыковые (логические) термины, которые служат для связывания его семантических компонентов., эта операция осуществляется за счет применения статистических закономерностей, открытых Дж. Зипфом (George Kingsley Zipf) и получивших название принципа экономии усилий в лингвистике или закона Зипфа (или, более общей формулировке, закона Зипфа-Мандельброта).

В зависимости от реализации статистические критерии могут применяться к тексту на раннем этапе (до грамматико-логической обработки текста), а могут и на завершающей стадии (после предварительной обработки, согласования словоформ и т. п.). Однако, в настоящее время без поддержки интерактивного режима (диалога с экспертом) качество реферирования достаточно низко и не всегда удовлетворяет потребителя. Вне зависимости от спектра технологий, используемых при анализе словоформ (формальные ли грамматики, нейросетевые ли технологии), результаты семантической обработки пока далеки от тех, которые в состоянии обеспечить эксперт, что отчасти объясняется тем, что любая из созданных на сегодня баз знаний, в известном смысле, наивнее ребенка. Причиной такой «наивности» является то, что механизмы обучения подобных систем и способы организации знаний в них несовершенны, а количество каналов приобретения знаний слишком мало. Существуют прототипы самообучающихся интеллектуальных систем, но до уровня интеллекта разумных существ эти системы пока не могут дорасти.

Однако оставим подробное рассмотрение этих вопросов специалистам в области теории систем искусственного интеллекта. Заметим лишь, что работы в области теории систем искусственного интеллекта действительно заслуживают того, чтобы с ними ознакомились люди, занятые в «сфере информационного производства». Чрезвычайно интересны эти работы хотя бы потому, что представляют собой попытки осмыслить то, каким образом человек осуществляет свою мыслительную деятельность, алгоритмизировать и упорядочить ее, что крайне важно и для эксперта-аналитика. Кроме того, нелишне хотя бы в общих чертах представлять, каким образом работает твой инструмент, каковы его параметры и особенности функционирования. Так, например, ряд направлений современной психологии выросли не из классической психологии, а из гибрида теории искусственного интеллекта, классической психологии и философской теории познания. И столь необычное происхождение этих психологических теорий, отнюдь, не мешает специалистам в этой области успешно решать задачи именно психологического плана.

Методы первичного структурирования информации широко используются при синтезе баз данных и подробно рассматриваются в разнообразных изданиях по информатике, в частности -- тех, которые посвящены вопросам проектирования и разработки баз данных различного назначения Информатика: Учебник / Под ред. проф. Н.В.Макаровой. -- М.: Финансы и статистика, 1997. -- 768 с.. В наиболее популярном и, в то же время, профессиональном изложении эти проблемы рассматриваются в книге американского автора Дэвида Васкевича Васкевич Д. Стратегии клиент/сервер. Руководство по выживанию для специалистов по реорганизации бизнеса. -- К.: Диалектика, 1996. -- 384 с., написанной именно для тех людей, которые руководят деятельностью или формулируют задачи перед специалистами в области разработки программного обеспечения, но не обязаны вникать в технологические подробности процесса разработки. В частности, в книге Васкевича описываются различные способы организации и структурирования данных, виды отношений между ними, приведены наглядные примеры, что позволяет руководителю по ее прочтении квалифицированно руководить коллективом разработчиков и грамотно организовать технологический процесс. Но подчеркнем еще раз: для нас в этой книге содержится информация, связанная именно с проблемой структурирования информации.

Нет ничего удивительного в том, что мы обращаемся к базам данных для того, чтобы проиллюстрировать процессы структурирования информации. Базы данных -- это тоже модели, описывающие те или иные аспекты существования системы/процесса, поэтому при их создании и проектировании так же применяются методы структурирования информации, отличающиеся от прочих методов лишь тем, что структурирование осуществляется уже с учетом ограничений, налагаемых технологической платформой. В общем случае при структурировании информации такие ограничения не всегда принимаются в расчет.

Так или иначе, но полученный массив описаний предметной области или проблемы на начальном этапе структурирования информации должен быть приведен к виду, упрощающему его дальнейшую обработку. Если сведения получены в результате проведения информационно-поисковых процедур (например, в различного рода средствах массовой информации -- от печатной прессы до сети Интернет), полученный исходный массив, как правило, не структурирован и разноформатен. В этом случае перед аналитиком встает задача первичного структурирования массива сообщений в ее наиболее сложном варианте (здесь требуется выделение из сообщений информации, релевантной задачам исследования, ее компоновка и т. п.).

Однако если речь идет о сборе информации методом опроса экспертов, первичное структурирование информации может быть проведено уже на предшествующем этапе за счет разработки системы опросников, анкет и иных средств упорядочивания информации. Стратегия опроса экспертов (в том числе -- проведения мозговых атак или деловых игр) может быть организована таким образом, чтобы ввести экспертов в ситуацию, управляющую процессом высказывания суждений в той последовательности, при которой информация будет изначально структурирована некоторым образом, отвечающим потребностям последующей ее формализации. В некоторых случаях экспертам могут быть предъявлены на оценку заранее подготовленные варианты решения задач, массивы исходных данных и прочие материалы, нуждающиеся в оценивании и ранжировании с привлечением их опыта.

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.