Количество знания и ценность информации

Изучение воздействия обучения на поведение информационной системы. Практичные условия сравнимости знания. Рассмотрение универсальной модели ценности данных. Разработка нового теоретического подхода к оценке количества знания в информационных системах.

Рубрика Экономико-математическое моделирование
Вид статья
Язык русский
Дата добавления 28.08.2018
Размер файла 375,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http: //www. allbest. ru/

Количество знания и ценность информации

Соболев Владимир Владимирович

Региональный менеджер финансовых

проектов компании Проктер энд Гэмбл

Milena.555@mail.ru

Аннотация

В статье предложен новый теоретический подход к оценке количества знания в информационных системах. Проанализированы две теоретические модели проверки знания и показана недостаточность одной из моделей. Концепция количественной оценки знания расширена до обобщенной величины обучения системы, на ее основе предложена универсальная модель ценности информации для системы-приемника.

Ключевые слова: знание, количество знания, обучение, адекватное поведение, теория информации, ценность информации, качество информации

Abstract

AMOUNT OF KNOWLEDGE AND INFORMATION VALUE

Sobolev Vladimir Vladimirovich

Area manager of financial projects of the company Prokter энд Gembl

Milena.555@mail.ru

The article introduces a new approach to the quantity of knowledge within information systems. Two theoretical models of the knowledge verification are analyzed and one of them is concluded to be insufficient. The concept of the knowledge quantity is expanded to a generalized amount of a system learning, a universal model of information value for the recipient is introduced on this basis.

Keywords: knowledge, quantity of knowledge, learning, adequate behavior, information theory, value of information, information quality

Понятие «знания» занимает одно из центральных мест в системе человеческого миропонимания. Являясь ключевым для философских теорий познания, оно также выступает на первый план в кибернетике, робототехнике в теории информации и искусственного интеллекта.

Между тем, широкое применение этого понятия в прикладных науках, связанных с использованием математического аппарата, крайне затруднено, в первую очередь потому, что научное определение понятия «количества знания» отсутствует.

Возьмем, к примеру, несколько определений знания из Википедии:

«Знание -- форма существования и систематизации результатов познавательной деятельности человека. ...

Знание в широком смысле -- субъективный образ реальности в форме понятий и представлений.

Знание в узком смысле -- обладание проверенной информацией (ответами на вопросы), позволяющей решать поставленную задачу.

Знание (предмета) -- уверенное понимание предмета, умение обращаться с ним, разбираться в нём, а также использовать для достижения намеченных целей.

Знание -- в теории искусственного интеллекта и экспертных систем -- совокупность информации и правил вывода (у индивидуума, общества или системы ИИ) о мире, свойствах объектов, закономерностях процессов и явлений, а также правилах использования их для принятия решений.»

Отметим, насколько тесно связаны большинство определений с понятием информации. Но даже наиболее «техническое» определение из области теории искусственного интеллекта включает в понимание «знания», помимо информации, некоторые «правила» обращения с ней. Понятно, что найти количественное выражение для «правил» в совокупности с информацией достаточно сложно.

С отсутствием количественного выражения для знания связано и еще одно существенное ограничение в использовании этого понятия - несравнимость знания. Невозможно сказать, в какой ситуации передается или содержится больше знания - в информации о погоде на завтра или же в теории относительности. Неоднородность элементов входящих в столь сложное понятие как знание делает попытку его сведения к некоторой количественной однородности крайне трудной.

И все же, я думаю, сделать такую попытку можно и нужно.

Обратим внимание на важнейшую черту знания, присутствующую во всех определениях. Наличие знания фиксируется по специфическому изменению поведения. Даже при самом общем подходе мы можем судить о приобретении знания субъектом лишь тогда, когда его поведение начинает соответствовать некоторой поставленной задаче.

В специальной ситуации система, обладающая знанием, отвечает особой, «правильной» реакцией, ожидаемой наблюдателем. Такой ответ системы можно назвать «адекватной реакцией».

Важной чертой процесса выработки адекватной реакции можно считать то, что при этом можно ожидать повышения информации, передаваемой системой.

Ложные ответы на вопрос могут быть совершенно различными, но правильный ответ либо единственный, либо входит в ограниченную область возможных реакций системы. Следовательно, по адекватной реакции можно гораздо точнее судить о состоянии системы-источника, чем по неадекватной.

В случае человеческого поведения этот же процесс убедительно описан Бернштейном в его теории построения движения как выработка двигательного навыка.

Ї Как показывает опыт, для сложных крупных движений … отсеивается, как правило, всего одна-две, самое большее -- несколько единиц исполнимых, несаморазрушающихся форм движения. Эти формы обладают между собой резкими качественными различиями и разделены широкими промежутками неисполнимых форм.?

Сказанное позволяет говорить о возможности определения количества знания как увеличения информации, передаваемой системой, после обучения в сравнении с ее передачей до этого.

Попробуем формализовать это предположение в виде информационной модели. Дадим несколько определений.

Количество знания - изменение информации, передаваемой поведением системы в ситуации близкого или тождественного стимулирования.

где

Размещено на http: //www. allbest. ru/

– количество полученного знания

– величина информации после получения знания

– величина информации до получения знания

Область адекватных реакций - набор реакций, соответствующих ожидаемому, адаптивному, «правильному» поведению систем.

Обучение - любой процесс, ведущий к изменению распределения вероятности реакций системы на тождественные стимулы.

Обучаемость - способность системы принимать адекватное состояние без переопределения множества её состояний.

При построении модели нашим основным требованием должна быть сонаправленность динамики обучения (получения знания) и количества знания.

Должно быть ясно, что понятия «обучения», в данном выше широком определении недостаточно для удовлетворения этому требованию. Ведь порядок обучения и область адекватности реакций задаются раздельно, независимо друг от друга. Поэтому в общем случае вектор изменений, связанных с обучением системы, может быть направлен вовсе не в сторону увеличения адекватности поведения системы. Определение обучения, таким образом, следует сузить, введя более точное понятие.

Адекватное обучение - обучение, ведущее к увеличению суммарной вероятности адекватных реакций таким образом, что:

1) Перераспределение вероятностей адекватных реакций не направлено в сторону снижения точности отражения состояний источника

2) Изменение точности отражения состояний источника адекватными реакциями в целом не направлено в сторону уменьшения.

Соответственно основное требование модели можно сформулировать как:

На любом отрезке времени при адекватном обучении количество знания, полученного системой, обладающей обучаемостью, будет неотрицательно.

Остается построить модель, удовлетворяющую указанному требованию. По причинам, которые станут ясны позднее, я рассмотрю два варианта модели количества знания.

МОДЕЛЬ С ЖЕСТКОЙ ПРОВЕРКОЙ ЗНАНИЯ

В рамках этой модели мы переопределяем систему-приемник (канал связи) сузив ее до области адекватных реакций. Таким образом, любое состояние системы-источника, не отраженное адекватной реакцией, считается ненаблюдаемым. Тем самым в область допустимых состояний приемника вводится некоторое дополнительное «нейтральное» состояние, при котором состояние системы-источника предполагается неизвестным.

Ограничение возможных состояний системы-приемника выступает, по сути, проверкой наличия знания. С такой системой мы встречаемся, например, на письменном тесте, где правильным является единственный ответ, тогда как все другие просто игнорируются, независимо от того, насколько близко или далеко от истины находится ошибочный выбор. Именно поэтому такую модель можно назвать моделью с жесткой проверкой знания.

Докажем, что введение жесткой проверки является достаточным условием для обеспечения основного требования к модели.

Количество знания можно выразить через изменения энтропий как:

Должно быть понятно, что сам подход к количеству знания как изменению количества информации о системе-источнике предполагает неизменность самого источника. Сравнение информаций о разных источниках с этой точки зрения бессмысленно. Следовательно:

Размещено на http: //www. allbest. ru/

где

– вероятность адекватных состояний канала до обучения

-- условная вероятность состояния источника при определении

состояний канала (до обучения)

– область адекватных реакций

– вероятность «нейтрального» состояния канала (неадекватной реакции).

-- условная вероятность состояния источника при «нейтральном» состоянии канала связи (системы-приемника)

- частная условная энтропия источника при адекватной реакции y

- частная условная энтропия источника при «нейтральном» состоянии канала связи (системы-приемника)

Показатели с индексом 1 относятся к моменту после обучения.

Отметим, что

По условию обучаемости системы объем области адекватных состояний системы не меняется в результате обучения. Происходит лишь изменения вероятностей адекватных реакций. Соответственно, мы можем учесть, что

и оперировать с этой областью как с тождественным (по объему) множеством.

Размещено на http: //www. allbest. ru/

Перейдем от абсолютных вероятностей к значениям их прироста

В силу нормировки вероятностей до и после обучения сумма всех изменений вероятностей равна нулю, а значит:

и

Учтем, что

У - частная информация от сообщения

Тогда

Для более четкого различения факторов, воздействующих на количество знания, введем вспомогательный показатель:

где

-- количество элементов в области адекватных реакций.

Тогда

Нетрудно доказать неотрицательность полученной суммы, учитывая, что

• можно считать величиной, отражающей только перераспределение вероятностей адекватных реакций, без учета изменения суммарной вероятности подобласти. Согласно условию 1 определения адекватности обучения эта величина неотрицательна.

• можно считать величиной, характеризующей точность отражения состояний источника адекватными реакциями. По условию 2 адекватности обучения точность не уменьшается (т.е. остаточная неопределенность не возрастает): .

Слагаемое неотрицательно в силу неотрицательности любой частной информации i (известно из теории информации) и отрицательности изменения вероятности нейтрального состояния (по определению адекватного обучения):

Размещено на http: //www. allbest. ru/

Следовательно, все 3 слагаемых, входящих в выражение количества знания неотрицательны. Величина знания при адекватном обучении неотрицательна:

что и соответствует основному требованию к модели.

При таком понимании модель с жесткой проверкой знания соответствует основному требованию при определении обучения и знания, близком к их повседневному использованию.

И все же жесткость определения адекватного канала связи может представляться достаточно серьезным недостатком модели. Кажется желательным включить в модель ситуации, аналогичные устному экзамену, когда неточные, но близкие к истине ответы оцениваются выше (с точки зрения знания), чем не имеющие с ней ничего общего. Можем ли мы отказаться от требования жесткой проверки?

МОДЕЛЬ С НЕЖЕСТКОЙ ПРОВЕРКОЙ ЗНАНИЯ и ее

недостаточность

Как и следовало ожидать, в случае нежесткой проверки мы не переопределяем канал связи и считаем наблюдаемыми любые реакции - как адекватные, так и нет. Знание в такой модели можно записать как:

Размещено на http: //www. allbest. ru/

В силу обучаемости системы объем состояний при обучении не меняется. Происходит лишь перераспределение вероятностей. При этом требование адекватности обучения накладывает ограничения лишь на динамику вероятностей области адекватных реакций. Динамика любой другой области вне адекватной может быть произвольной.

Следовательно, вполне возможно подобрать такое распределение и точность кодирования до и после обучения, что условная энтропия всего канала возрастет

Или

Таким образом, нежесткая проверка знания допускает падение количества знания при адекватном обучении, что нарушает основное требование к модели.

Важно подчеркнуть, что недостаточность модели с нежесткой проверкой является следствием глубоких принципиальных характеристик предлагаемого подхода к теории количества знания. Разумеется, в первую очередь, речь идет о специфичности знания и открытости информационной системы.

Говоря о специфичности знания, мы имеем в виду его применимость лишь в некоторых конкретных обстоятельствах. Знание в предлагаемой модели не может быть универсально, оно переопределяется для каждой специфической ситуации путем задания области адекватных реакций. Реакция энтомолога будет отлична от реакции охотника на одну и ту же ситуацию в джунглях, но нет никаких оснований утверждать, что одна из них более адекватна, чем другая.

Тем самым специфичность тесно связана с открытостью модели. Ведь область адекватных реакций не является собственной характеристикой ни канала, ни источника, в отличие, скажем, от их алфавита. А значит, адекватность реакции задается экзогенно, извне, некоторым внешним системе арбитром, обладающим в данной ситуации необходимыми «полномочиями».

Указанные характеристики означают, что в пространстве возможных состояний канала нельзя указать некоторую универсально и объективно адекватную область. Невозможно и вывести адекватность некоторой области, используя внутренние закономерности системы. Любая область в некоторых специальных условиях может быть определена как адекватная.

Между тем, существует немало практических ситуаций, когда желательно иметь в арсенале анализа несколько более универсальный показатель. Его можно предложить, оставаясь в рамках предлагаемой теории количества знания.

Для этого вернемся к оценке знания в модели с нежесткой проверкой. Поскольку мы уже убедились, что эта модель недостаточна для представления собственно количества знания, обозначим этот показатель D:

Размещено на http: //www. allbest. ru/

Повторив наши рассуждения из доказательства достаточности модели с жесткой проверкой, представим в тождественном виде: По условию нормировки сумма всех изменений вероятностей равна нулю, а значит:

Следовательно:

Рассмотрим полученный показатель подробнее.

Первое слагаемое отражает изменение вероятности состояний системы - т.е. результат обучения. Назовем его «поведенческим сдвигом».

Но и второе слагаемое является неявным результатом обучения. Оно отражает изменение условных вероятностей состояний источника при определении состояний приемника. Этот фактор логично назвать «сдвигом точности».

Таким образом, является ничем иным, как количественной оценкой воздействия обучения на поведение системы. Для определенности можно назвать «величиной обучения».

Не следует, однако понимать это так, будто модель с жёсткой проверкой вообще лишена гибкости. Вовсе не так. Напротив, я полагаю, что для многих, если не для большинства, практически интересных систем жёсткая проверка предоставляет всю необходимую полноту аналитической гибкости. При достаточно широком определении области адекватных реакций естественный процесс обучения (с постепенным уточнением реакции) приведёт к тому, что даже при продолжении обучения внутри адекватного множества мы будем наблюдать постепенный рост количества знания: при переходе от полного незнания к приблизительному знанию, а затем, - к точному знанию.

Такая полнота охвата реальных систем и ситуаций при строгой математической определённости позволяет предположить возможность широкого теоретического и практического применения модели. И я полагаю, что важнейшим ее применением можно смело назвать возможность структурированного и универсального решения проблемы ценности информации, при этом в терминах теории информации как таковой.

Несколько слов о самой проблеме. Дело в том, что сама по себе информация абсолютно безлична. Она объективно и беспристрастно фиксирует степень снижения неопределённости состояния системы источника при получении сообщения по каналу связи. Это важнейшее преимущество шенноновской информации, лежащее в основе универсальности ее применения. И в том же состоит ее недостаток, не позволяющий сравнивать информацию по ее качеству, например, по степени ее полезности для получателя. Одни и те же байты, полученные приёмником, могут нести как абсолютно нейтральную, бессмысленную для приёмника информацию, так и некоторое сообщение, критичное для выживания приёмника-организма.

Насколько затруднительным является качественное сравнение информации для исследователей показывает уже простое перечисление применяемых качественных характеристик, например, в системе образования: репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.

Предлагаемая теория количества знания позволяет компенсировать этот недостаток. Достаточно лишь сравнить те количества знания, которые могут быть ассоциированы с данной информацией. Чем больше прирост знания, полученный приёмником, тем выше ценность информации, с которой этот прирост ассоциирован.

Для формализации этого подхода нам потребуется ввести еще одно определение:

Самообучаемость - способность системы к изменению вероятностей своих состояний лишь за счёт получения и обработки информации.

Величину ценности информации можно сформулировать в виде показателя гносеоёмкости:

Количество знания, полученного самообучаемой системой в результате передачи некоторой информации, отнесенное на единицу этой информации, называется гносеоёмкостью данной информации для данной системы:

В соответствии с определением гносеоемкость является специфической величиной по трем направлениям: по информационному сообщению, по обучаемой системе и по области адекватных реакций.

Используя понятие величины обучения, по аналогии с гносеоёмкостью, мы можем ввести и более универсальный показатель ценности информации, дидактоёмкость:

Величина обучения, наблюдаемая в самообучаемой системе в результате передачи ей некоторой информации, отнесенная на единицу этой информации, называется дидактоёмкостью данной информации для данной системы:

Размещено на http: //www. allbest. ru/

Показатель дидактоёмкости, таким образом, характеризует способность данной информации к изменению поведения данной системы. В отличие от гносеоёмкости, новый показатель универсален по критерию адекватности, т.е. не требует задания области адекватных реакций.

Отметим неопределенность знака величины обучения: он может быть как положительным (увеличение вероятности состояний с большей информацией передачи), так и отрицательным (падение информации). Соответственно и дидактоёмкость может принимать оба знака.

Подводя итог предложенному подходу к количеству знания, хочется выразить надежду, что он вызовет интерес у специалистов и окажется полезным при исследовании различных теоретических и практических вопросов в области теории знания. В качестве очевидных его преимуществ я вижу возможность дать простую и очевидную количественную оценку сложному философскому понятию, максимально близко придерживаясь при этом обыденного понимания трактуемых терминов. Немаловажно и то, что качественную оценку ценности информации в рамках подхода удается ввести естественным образом, оперируя понятиями самой теории информации.

Количественная определенность знания дает прозрачные и практичные условия сравнимости знания, при соблюдении которых каждый бит знания становится качественно тождественным биту любого другого знания.

Применение предлагаемого подхода позволит устранить ограничения, существующие в применимости понятия знания в различных науках, и может привести к его более широкому и плодотворному использованию.

знание информационный ценность

Литература

1. Shannon C.E. “A Mathematical Theory of Communication”, Board of Trustees of the University of Illinois, 1949

2. Бернштейн Н.А., «О ловкости и ее развитии», Москва, Физкультура и спорт, 1991

3. Википедия, Свободная энциклопедия, http://ru.wikipedia.org/wiki/ Знание

4. «Понятия: информация, данные, знания; количество и качество информации», Copyright © 2009-2014 Pandia. http://www.pandia.ru/text/77/203/78371.php

References

1. Shannon C.E. “A Mathematical Theory of Communication”, Board of Trustees of the University of Illinois, 1949

2. Bernstein N.A., “Dexterity and Its Development”, Moscow, Fizkultura i sport, 1991

3. Wikipedia, The Free Encyclopedia, http://ru.wikipedia.org/wiki/ Знание

4. “Concepts: information, data, knowledge; quality and quantity of information”, Copyright © 2009-2014 Pandia. http://www.pandia.ru/text/77/203/78371.php

Размещено на Allbest.ru

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.