Кодирование двоичной информации на компьютере

Универсальность двоичного кодирования информации в компьютере. Методы классификации экономической информации. Двоичное кодирование – один из распространенных способов представления информационных данных. Перекодировка текстовых документов на компьютере.

Рубрика Программирование, компьютеры и кибернетика
Вид реферат
Язык русский
Дата добавления 29.06.2015
Размер файла 63,3 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Содержание

Введение

1. Универсальность двоичного кодирования информации в компьютере

2. Методы кодирования экономической информации

Заключение

Список используемой литературы

Введение

Фундаментальной чертой цивилизации является рост производства, потребления и накопления информации во всех отраслях человеческой деятельности. Вся жизнь человека, так или иначе, связана получением, накоплением и обработкой информации. Что бы человек ни делал: читает ли он книгу, смотрит ли он телевизор, разговаривает, он постоянно и непрерывно получает и обрабатывает информацию. Представление информации в двоичной системе использовалось человеком с давних времен. Так, жители островов Полинезии передавали необходимую информацию при помощи барабанов: чередование звонких и глухих ударов. Звук над поверхностью воды распространялся на достаточно большое расстояние, таким образом «работал» полинезийский телеграф. В телеграфе в XIX-XX веках информация передавалась с помощью азбуки Морзе - в виде последовательности из точек и тире. Часто мы договариваемся открывать входную дверь только по «условному сигналу» - комбинации коротких и длинных звонков. Самюэл Морзе в 1838 г. изобрел код - телеграфную азбуку - систему кодировки символов короткими и длинными посылками для передачи их по линиям связи, известную как «код Морзе» или «морзянка». Современный вариант международного «кода Морзе» (International Morse) появился совсем недавно - в 1939 году, когда была проведена последняя корректировка. Своя система существует и в вычислительной технике - она называется двоичным кодированием и основана на представлении данных последовательностью всего двух знаков: 0 и 1. Эти знаки называются двоичными цифрами, по-английски - binary digit или сокращенно bit (бит). Одним битом могут быть выражены два понятия: 0 или 1 (да или нет, черное или белое, истина или ложь и т.п.).

1. Универсальность двоичного кодирования информации в компьютере

Двоичное кодирование - один из распространенных способов представления информации. В вычислительных машинах, в роботах и станках с числовым программным управлением, как правило, вся информация, с которой имеет дело устройство, кодируется в виде слов двоичного алфавита.

Двоичный алфавит состоит из двух цифр 0 и 1.

Цифровые ЭВМ (персональные компьютеры относятся к классу цифровых) используют двоичное кодирование любой информации. В основном это объясняется тем, что построить техническое устройство, безошибочно различающее 2 разных состояния сигнала, технически оказалось проще, чем то, которое бы безошибочно различало 5 или 10 различных состояний. К недостаткам двоичного кодирования относят очень длинные записи двоичных кодов, что затрудняет работу с ними.

Двоичное кодирование символьной (текстовой) информации

Основная операция, производимая над отдельными символами текста - сравнение символов. При сравнении символов наиболее важными аспектами являются уникальность кода для каждого символа и длина этого кода, а сам выбор принципа кодирования практически не имеет значения. Для кодирования текстов используются различные таблицы перекодировки. Важно, чтобы при кодировании и декодировании одного и того же текста использовалась одна и та же таблица. Таблица перекодировки - таблица, содержащая упорядоченный некоторым образом перечень кодируемых символов, в соответствии с которой происходит преобразование символа в его двоичный код и обратно. Наиболее популярные таблицы перекодировки: ДКОИ-8, ASCII, CP1251, Unicode. Исторически сложилось, что в качестве длины кода для кодирования символов было выбрано 8 бит или 1 байт. Поэтому чаще всего одному символу текста, хранимому в компьютере, соответствует один байт памяти. Различных комбинаций из 0 и 1 при длине кода 8 бит может быть 28 = 256, поэтому с помощью одной таблицы перекодировки можно закодировать не более 256 символов. При длине кода в 2 байта (16 бит) можно закодировать 65536 символов. В настоящее время большая часть пользователей при помощи компьютера обрабатывает текстовую информацию, которая состоит из символов: букв, цифр, знаков препинания и др. Традиционно для того чтобы закодировать один символ используют количество информации равное 1 байту, т. е. I = 1 байт = 8 бит. При помощи формулы, которая связывает между собой количество возможных событий К и количество информации I, можно вычислить сколько различных символов можно закодировать (считая, что символы - это возможные события):

К = 2I = 28 = 256,

т. е. для представления текстовой информации можно использовать алфавит мощностью 256 символов. Суть кодирования заключается в том, что каждому символу ставят в соответствие двоичный код от 00000000 до 11111111 или соответствующий ему десятичный код от 0 до 255. Необходимо помнить, что в настоящее время для кодировки русских букв используют пять различных кодовых таблиц(КОИ - 8, СР1251, СР866, Мас, ISO), причем тексты, закодированные при помощи одной таблицы не будут правильно отображаться в другой кодировке. Наглядно это можно представить в виде фрагмента объединенной таблицы кодировки символов. Одному и тому же двоичному коду ставится в соответствие различные символы.

Двоичный код

Десятичный код

КОИ8

СР1251

СР866

Мас

ISO

11000010

194

б

В

-

-

Т

Впрочем, в большинстве случаев о перекодировке текстовых документов заботится на пользователь, а специальные программы - конверторы, которые встроены в приложения. Начиная с 1997 г. последние версии Microsoft Windows & Office поддерживают новую кодировку Unicode, которая на каждый символ отводит по 2 байта, а, поэтому, можно закодировать не 256 символов, а 65536 различных символов. Чтобы определить числовой код символа можно или воспользоваться кодовой таблицей, или, работая в текстовом редакторе Word 6.0 / 95. Для этого в меню нужно выбрать пункт "Вставка" - "Символ", после чего на экране появляется диалоговая панель Символ. В диалоговом окне появляется таблица символов для выбранного шрифта. Символы в этой таблице располагаются построчно, последовательно слева направо, начиная с символа Пробел (левый верхний угол) и, кончая, буквой "я" (правый нижний угол). Для определения числового кода символа в кодировке Windows (СР1251) нужно при помощи мыши или клавиш управления курсором выбрать нужный символ, затем щелкнуть по кнопке Клавиша. После этого на экране появляется диалоговая панель Настройка, в которой в нижнем левом углу содержится десятичный числовой код выбранного символа

Примеры двоичного кодирования информации. Среди всего разнообразия информации, обрабатываемой на компьютере, значительную часть составляют числовая, текстовая, графическая и аудиоинформация. Познакомимся с некоторыми способами кодирования этих типов информации в ЭВМ.

Кодирование чисел. Есть два основных формата представления чисел в памяти компьютера. Один из них используется для кодирования целых чисел, второй (так называемое представление числа в формате с плавающей точкой) используется для задания некоторого подмножества действительных чисел. Множество целых чисел, представимых в памяти ЭВМ, ограничено. Диапазон значений зависит от размера области памяти, используемой для размещения чисел. В k-разрядной ячейке может храниться 2k различных значений целых чисел. Чтобы получить внутреннее представление целого положительного числа N, хранящегося в k-разрядном машинном слове, нужно:

1) перевести число N в двоичную систему счисления;

2) полученный результат дополнить слева незначащими нулями до k разрядов.

Например, для получения внутреннего представления целого числа 1607 в 2-х байтовой ячейке число переводится в двоичную систему: 160710 = 110010001112. Внутреннее представление этого числа в ячейке имеет вид: 0000 0110 0100 0111. Для записи внутреннего представления целого отрицательного числа (-N) нужно:

1) получить внутреннее представление положительного числа N;

2) получить обратный код этого числа, заменяя 0 на 1 и 1 на 0;

3) полученному числу прибавить 1 к полученному числу.

Внутреннее представление целого отрицательного числа -1607. С использованием результата предыдущего примера и записывается внутреннее представление положительного числа 1607: 0000 0110 0100 0111. Обратный код получается инвертированием: 1111 1001 1011 1000. Добавляется единица: 1111 1001 1011 1001 - это и есть внутреннее двоичное представление числа -1607. Формат с плавающей точкой использует представление вещественного числа R в виде произведения мантиссы m на основание системы счисления n в некоторой целой степени p, которую называют порядком:

R = m * n p.

Представление числа в форме с плавающей точкой неоднозначно. Например, справедливы следующие равенства:

12,345 = 0,0012345 Ч 104 = 1234,5 Ч 10-2 = 0,12345 Ч 102

Чаще всего в ЭВМ используют нормализованное представление числа в форме с плавающей точкой. Мантисса в таком представлении должна удовлетворять условию:

0,1p m < 1p.

Иначе говоря, мантисса меньше 1 и первая значащая цифра - не ноль (p - основание системы счисления). В памяти компьютера мантисса представляется как целое число, содержащее только значащие цифры (0 целых и запятая не хранятся), так для числа 12,345 в ячейке памяти, отведенной для хранения мантиссы, будет сохранено число 12 345. Для однозначного восстановления исходного числа остается сохранить только его порядок, в данном примере - это 2.

Кодирование текста

Множество символов, используемых при записи текста, называется алфавитом. Количество символов в алфавите называется его мощностью. Для представления текстовой информации в компьютере чаще всего используется алфавит мощностью 256 символов. Один символ из такого алфавита несет 8 бит информации, т. к. 28 = 256. Но 8 бит составляют один байт, следовательно, двоичный код каждого символа занимает 1 байт памяти ЭВМ. Все символы такого алфавита пронумерованы от 0 до 255, а каждому номеру соответствует 8-разрядный двоичный код от 00000000 до 11111111. Этот код является порядковым номером символа в двоичной системе счисления. Для разных типов ЭВМ и операционных систем используются различные таблицы кодировки, отличающиеся порядком размещения символов алфавита в кодовой таблице. Международным стандартом на персональных компьютерах является уже упоминавшаяся таблица кодировки ASCII. Принцип последовательного кодирования алфавита заключается в том, что в кодовой таблице ASCII латинские буквы (прописные и строчные) располагаются в алфавитном порядке. Расположение цифр также упорядочено по возрастанию значений. Стандартными в этой таблице являются только первые 128 символов, т. е. символы с номерами от нуля (двоичный код 00000000) до 127 (01111111). Сюда входят буквы латинского алфавита, цифры, знаки препинания, скобки и некоторые другие символы. Остальные 128 кодов, начиная со 128 (двоичный код 10000000) и кончая 255 (11111111), используются для кодировки букв национальных алфавитов, символов псевдографики и научных символов.

Единицы измерения информации.

1 байт = 8 бит

1 Кбайт = 1024 байтам

1 Мбайт = 1024 Кбайтам

1 Гбайт = 1024 Мбайтам

1 Тбайт = 1024 Гбайтам

Кодирование графической информации

В видеопамяти находится двоичная информация об изображении, выводимом на экран. Почти все создаваемые, обрабатываемые или просматриваемые с помощью компьютера изображения можно разделить на две большие части - растровую и векторную графику. Растровые изображения представляют собой однослойную сетку точек, называемых пикселами (pixel, от англ. picture element). Код пиксела содержит информации о его цвете. Для черно-белого изображения (без полутонов) пиксел может принимать только два значения: белый и черный (светится - не светится), а для его кодирования достаточно одного бита памяти: 1 - белый, 0 - черный. Пиксел на цветном дисплее может иметь различную окраску, поэтому одного бита на пиксел недостаточно. Для кодирования 4-цветного изображения требуются два бита на пиксел, поскольку два бита могут принимать 4 различных состояния. Может использоваться, например, такой вариант кодировки цветов: 00 - черный, 10 - зеленый, 01 - красный, 11 - коричневый. На RGB-мониторах все разнообразие цветов получается сочетанием базовых цветов - красного (Red), зеленого (Green), синего (Blue), из которых можно получить 8 основных комбинаций:

R

R

G

G

B

B

цвет

цвет

0

1

0

0

0

0

черный

красный

0

1

0

0

1

1

синий

розовый

0

1

1

1

0

0

зеленый

коричневый

0

1

1

1

1

1

голубой

белый

Разумеется, если иметь возможность управлять интенсивностью (яркостью) свечения базовых цветов, то количество различных вариантов их сочетаний, порождающих разнообразные оттенки, увеличивается. Количество различных цветов - К и количество битов для их кодировки - N связаны между собой простой формулой:

2N = К.

В противоположность растровой графике векторное изображение многослойно. Каждый элемент векторного изображения - линия, прямоугольник, окружность или фрагмент текста - располагается в своем собственном слое, пиксели которого устанавливаются независимо от других слоев. Каждый элемент векторного изображения является объектом, который описывается с помощью специального языка (математических уравнения линий, дуг, окружностей и т.д.) Сложные объекты (ломаные линии, различные геометрические фигуры) представляются в виде совокупности элементарных графических объектов. Объекты векторного изображения, в отличие от растровой графики, могут изменять свои размеры без потери качества (при увеличении растрового изображения увеличивается зернистость).

Кодирование звука

Из физики известно, что звук - это колебания воздуха. Если преобразовать звук в электрический сигнал (например, с помощью микрофона), то видно плавно изменяющееся с течением времени напряжение. Для компьютерной обработки такой - аналоговый - сигнал нужно каким-то образом преобразовать в последовательность двоичных чисел. Делается это, например, так - измеряется напряжение через равные промежутки времени и полученные значения записываются в память компьютера. Этот процесс называется дискретизацией (или оцифровкой), а устройство, выполняющее его - аналого-цифровым преобразователем (АЦП).

Чтобы воспроизвести закодированный таким образом звук, нужно сделать обратное преобразование (для этого служит цифро-аналоговый преобразователь - ЦАП), а затем сгладить получившийся ступенчатый сигнал. Чем выше частота дискретизации и чем больше разрядов отводится для каждого отсчета, тем точнее будет представлен звук, но при этом увеличивается и размер звукового файла. Поэтому в зависимости от характера звука, требований, предъявляемых к его качеству и объему занимаемой памяти, выбирают некоторые компромиссные значения. Описанный способ кодирования звуковой информации достаточно универсален, он позволяет представить любой звук и преобразовывать его самыми разными способами. Но бывают случаи, когда выгодней действовать по-иному. Издавна используется довольно компактный способ представления музыки - нотная запись. В ней специальными символами указывается, какой высоты звук, на каком инструменте и как сыграть. Фактически, ее можно считать алгоритмом для музыканта, записанным на особом формальном языке. В 1983 ведущие производители компьютеров и музыкальных синтезаторов разработали стандарт, определивший такую систему кодов. Он получил название MIDI. Конечно, такая система кодирования позволяет записать далеко не всякий звук, она годится только для инструментальной музыки. Но есть у нее и неоспоримые преимущества: чрезвычайно компактная запись, естественность для музыканта (практически любой MIDI-редактор позволяет работать с музыкой в виде обычных нот), легкость замены инструментов, изменения темпа и тональности мелодии.

Есть и другие, чисто компьютерные, форматы записи музыки. Среди них - формат MP3, позволяющий с очень большим качеством и степенью сжатия кодировать музыку, при этом вместо 18-20 музыкальных композиций на стандартном компакт-диске (CDROM) помещается около 200. Одна песня занимает, примерно, 3,5 Mb, что позволяет пользователям сети Интернет легко обмениваться музыкальными композициями.

Хранится информация на дисках в виде файлов, то есть определённой группы байтов со своим именем. Существуют текстовые, графические, звуковые и видео файлы.

Наиболее удобной для построения ЭВМ оказалась двоичная система счисления, т.е. система счисления, в которой используются только две цифры: 0 и 1, т.к с технической точки зрения создать устройство с двумя состояниями проще, также упрощается различение этих состояний.

2. Методы кодирования экономической информации

Обработка экономических задач заканчивается составлением на ЭВМ различных сводок, таблиц, ведомостей, в которых информация сгруппирована по каким-либо реквизитам -признака.

ГруппировкаРазмещено на http://www.allbest.ru/

информации осуществляется на основе систем классификации и кодирования (это специализированные средства формализованного описания), позволяющих представить экономическую информацию в форме, удобной для ввода и обработки данных с помощью вычислительной техники, и в форме, удобной для восприятия человеком.

Классификация и кодирование - неотъемлемые части процесса перевода разнообразной экономической информации с естественного языка на формализованный язык ЭВМ. В отличие от людей, ЭВМ воспринимают и обрабатывают информацию в исключительно закодированном виде.

Классификация экономической информации

Любая классификация всегда относительна. Один и тот же объект может быть классифицирован по разным признакам или критериям. Часто встречаются ситуации, когда в зависимости от условий внешней среды объект может быть отнесен к разным классификационным группировкам. Эти рассуждения особенно актуальны при классификации видов информации без учета ее предметной ориентации, так как она часто может быть использована в разных условиях, разными потребителями, для разных целей.

Место возникновения. По этому признаку информацию можно разделить на входную, выходную, внутреннюю, внешнюю.

Входная информация - это информация, поступающая в фирму или ее подразделения.

Выходная информация - это информация, поступающая из фирмы в другую фирму, организацию (подразделение).

Одна и та же информация может являться входной для одной фирмы, а для другой, ее вырабатывающей, выходной.

По отношению к объекту управления (фирма или ее подразделение: цех, отдел, лаборатория) информация может быть определена как внутренняя, так и внешняя.

Внутренняя информация возникает внутри объекта, внешняя информация - за пределами объекта.

Порядковая система кодирования заменяет перечень предметов или понятий порядковыми номерами.

Стадия обработки. По стадии обработки информация может быть первичной, вторичной, промежуточной, результатной.

Первичная информация - это информация, которая возникает непосредственно в процессе деятельности объекта и регистрируется на начальной стадии.

Вторичная информация - это информация, которая получается в результате обработки первичной информации и может быть промежуточной и результатной.

Промежуточная информация используется в качестве исходных данных для последующих расчетов.

Результатная информация получается в процессе обработки первичной и промежуточной информации и используется для выработки управленческих решений.

Способ отображения. По способу отображения информация подразделяется на текстовую и графическую.

Текстовая информация - это совокупность алфавитных, цифровых и специальных символов, с помощью которых представляется информация на физическом носителе (бумага, изображение на экране дисплея).

Графическая информация - это различного рода графики, диаграммы, схемы, рисунки и т.д.

Стабильность. По стабильности информация может быть переменной (текущей) и постоянной (условно-постоянной).

Переменная информация отражает фактические количественные и качественные характеристики производственно-хозяйственной деятельности фирмы. Она может меняться для каждого случая как по назначению, так и по количеству. Например, количество произведенной продукции за смену, еженедельные затраты на доставку сырья, количество исправных станков и т.п.

Постоянная (условно-постоянная) информация - это неизменная и многократно используемая в течение длительного периода времени информация. Постоянная информация может быть справочной, нормативной, плановой:

· постоянная справочная информация включает описание постоянных свойств объекта в виде устойчивых длительное время признаков. Например, табельный номер служащего, профессия работника, номер цеха и т.п.;

· постоянная нормативная информация содержит местные, отраслевые и общегосударственные нормативы. Например, размер налога на прибыль, стандарт на качество продуктов определенного вида, размер минимальной оплаты труда, тарифная сетка оплаты государственным служащим;

· постоянная плановая информация содержит многократно используемые в фирме плановые показатели. Например, план выпуска телевизоров, план подготовки специалистов определенной квалификации.

Функция управления. По функциям управления экономическая информация разделяется на: планово-учетную, нормативно-справочную, отчетно-статистическую информацию.

Плановая (директивная) информация включает в себя директивные значения планируемых и контролируемых показателей бизнес-планирования на некоторый период в будущем (пятилетка, год, квартал, месяц, сутки). Например, выпуск продукции в натуральном и стоимостном выражении, планируемые спрос на продукцию и прибыль от ее реализации и т. д.

Учетная информация отражает фактические значения запланированных показателей за определенный период времени. На основании этой информации может быть скорректирована плановая информация, проведен анализ деятельности организации, приняты решения по более эффективному управлению фирмой, В качестве учетной информации выступает информация натурального (оперативного) учета, бухгалтерского у чета, финансового учета. Например, учетной информацией являются: количество деталей данного наименования, изготовленных рабочим за смену (оперативный учет), заработная плата рабочего за изготовление детали (бухгалтерский учет), фактическая себестоимость изготовления изделия (бухгалтерский и финансовый учет).

Нормативно-справочная информация содержит различные справочные и нормативные данные, связанные с производственными процессами и отношениями. Это самый объемный и разнообразный вид информации. Достаточно отметить, что в общем объеме циркулирующей на фирме информации нормативно-справочная информация составляет 50-60%.

Примерами нормативно-справочной информации могут служить: технологические нормативы изготовления деталей, узлов, изделия в целом; стоимостные нормативы (расценки тарифы, цены); справочные данные по поставщикам и потребителям продукции и т. д.

В фирме количество нормативов может достигать нескольких миллионов, а объем нормативно-справочной информации - сотен мегабайт.

Отчетно-статистическая информация отражает результаты фактической деятельности фирмы для вышестоящих органов управления, органов государственной статистики, налоговой инспекции и т. д., например годовой бухгалтерский отчет о деятельности фирмы.

Серийная система кодирования применяется для кодирования сложных номенклатур. В каждой группе кодируемых объектов выделяют определенную серию номеров с определенным запасом свободных (зарезервированных) номеров.

Серийно-порядковая система кодирования является сочетанием предыдущих систем. Ее обычно применяют для кодирования изделий и т.п.

Позиционная система кодирования требует, чтобы при предварительной классификации объектов выделялись определенные признаки, за которыми закрепляется соответствующее количество разрядов в кодовом обозначении.

Структура кода может включать класс объектов, подкласс, группу объектов (в пределах определенного подкласса), подгруппу, вид (в пределах подгруппы) и код самого объекта. Для простых случаев в структуру кода может входить только код самого объекта.

После установления структуры кода каждому понятию присваивают число. Затем составляют списки классов, подклассов, групп, подгрупп, видов и предметов (изделий и т.п.). Такие списки называются классификаторы.

Комплекс взаимоувязанных классификаторов технико- экономической информации, приспособленных для непосредственной обработки средствами вычислительной техники, представляет собой часть информационного обеспечения ИС.

Классификатор технико-экономической информации представляет собой документ (книгу, комплект таблиц, компьютерный файл и т.п.), отображающий закон разбиения множества объектов на классы, подклассы, группы, подгруппы и содержащий код тех понятий, которые входят в номенклатуру данного классификатора.

Структуру классификаторов разрабатывают с учетом следующих рекомендаций:

* возможности расширения кодируемого множества объектов без нарушения системы кодирования;

* обеспечения максимальной автоматизации процессов сбора, обработки, хранения и выдачи информации;

* систем классификации и кодирования информации, действующих в разных органах управления;

* возможности агрегирования информации по определенным категориям.

В процессе разработки классификаторов всю информацию, циркулирующую в системе, изучают и анализируют для выявления множества понятий (слов, фраз, названий предметов и т.п.), для которых возникает задача создания классификатора. Множество понятий, в свою очередь, разбивают на определенное число классифицируемых множеств, для которых установлены правила классификации элементов и методы их кодирования.

Практически при создании информационной базы на машинных носителях и распечатке выходных форм наименования видов материалов, продукции, единиц измерения и т.п. целесообразно сокращать для уменьшения расхода внешней памяти ЭВМ и объема выходных документов. Такие классификаторы с использованием сокращенных наименований отдельных позиций называются словарями.

Структуру словарей разрабатывают с учетом требований к размещению информации в выходных формах; удобства ввода в ЭВМ; возможности выборки отдельных реквизитов словаря; необходимости расширения словарных позиций.

При разработке системы кодирования по любому множеству объектов применяется системный подход. Систему кодирования, длину и структуру кода рекомендуется выбирать так, чтобы обеспечить решение всего комплекса задач. Это означает, что система кодирования должна обеспечивать возможность включения в классификатор всех объектов данного множества (всех возможных значений данного реквизита) в разрезе системы, а не только отдельных ее частей (подсистем).

«Правильная» система кодирования должна обеспечивать присвоение каждому элементу заданного множества уникального кодового обозначения - т.о., исключаются разночтения. Для этого признаки сходства (различия) элементов множества необходимо выбирать так, чтобы они были присущи всем элементам множества.

Признаки, которые не идентифицируют объект, а лишь характеризуют его с различных точек зрения, не включаются в систему кодирования данного множества, а кодируются как объекты другого множества. Также не допускается включение в систему кодирования признаков, которые относятся не ко всем элементам данного множества.

Алфавит кода для всех кодируемых множеств должен быть одинаковый - цифровой, буквенный или буквенно-цифровой. При выборе системы кодирования, структуры и длины кода необходимо резервировать не менее 25% емкости классификатора для кодирования новых элементов множества.

В зависимости от характера множества объектов классификаторы можно разрабатывать по различным формам. Простейшая форма классификатора содержит 2 реквизита: наименование объекта и его кодовое обозначение. Составленные перечни объектов классификации проверяют на полноту, качество и соответствие записей стандартам и другим руководящим материалам. После составления перечней всем позициям номенклатуры присваивают полные кодовые обозначения. Позиции классификаторов записывают в порядке возрастания числовых значений кодов, определяется компоновка текста в соответствии с классификационной группировкой.

Методы классификации экономической информации.

В классификаторах применяется два метода классификации: иерархический и фасетный. Выбор между этими двумя методами зависит от особенностей конкретной предметной области.

Существуют следующие требования для выбранной системы классификации:

*достаточная емкость и необходимая полнота, которые гарантируют охват всех объектов классификации в заданных границах;

*оправданная глубина;

*обеспечение возможности решения комплекса задач различного уровня; возможность расширения множества классифицируемых объектов и внесения необходимых изменений в структуры классификации;

* обеспечение возможности сопряжения с другими классификациями однородных объектов;

* обеспечение простоты ведения классификатора.

Иерархический метод классификации

Под Иерархическим методом классификации понимается метод, при котором заданное множество последовательно делится на подчиненные подмножества, постепенно конкретизируя объект классификации. При этом основанием деления служит некоторый выбранный признак. Совокупность получившихся группировок при этом образует иерархическую древовидную структуру в виде ветвящегося графа, узлами которого являются группировки.

Выбор последовательности признаков зависит, прежде всего, от характера информации. При построении классификации выбор последовательности признаков зависит от вероятности обращения к тому или иному признаку. При этом наиболее вероятным обращениям должны соответствовать высшие уровни классификации.

Требования к классификатору, построенному на иерархическом методе классификации: Классификационные группировки, расположенные на одной ступени классификатора, не должны пересекаться, то есть не должны включать в себя аналогичных понятий. На каждой ступени классификатора для разделения вышестоящей группировки должен использоваться только один признак. Сумма подмножества всегда должна давать делимое множество объектов; не должна оставаться часть объектов, не вошедших в состав классификационной группировки.

Основными преимуществами иерархического метода является большая информационная емкость, традиционность и привычность применения, возможность создания для объектов классификации мнемонических кодов, несущих смысловую нагрузку.

Значительным недостатком иерархической классификации является слабая гибкость структуры, обусловленная фиксированным основанием деления и заранее установленным порядком следования, не допускающим включение новых объектов и классификационных группировок. Таким образом, при изменении состава объектов классификации и характеристик с помощью классификационных задач, требуется коренная переработка всей классификационной схемы.

Фасетный метод классификации

Фасетный метод классификации подразумевает параллельное разделение множества объектов на независимые классификационные группировки. При этом не предполагается жёсткой классификационной структуры и заранее построенных конечных группировок. Классификационные группировки образуются путем комбинации значений, взятых из соответствующих фасетов. Последовательность расположения фасетов при образовании классификационной группировки задается фасетной формулой. Количество фасетных формул определяется возможными сочетаниями признаков.

К классификатору, построенному на фасетном методе классификации, предъявляются следующие требования:

Должен соблюдаться принцип непересекаемости фасета, то есть состав признаков одного фасета не должен повторяться в других фасетах этого же класса;

В состав классификатора должны быть включены только такие фасеты и признаки, которые необходимы для решения конкретных задач.

Основным преимуществом классификации с использованием фасетного метода является гибкость структуры ее построения. Изменения в любом из фасетов не оказывают существенного влияния на все остальные. Большая гибкость обуславливает хорошую приспособляемость классификации к меняющемуся характеру решаемых задач, для которых она создается. При фасетной классификации появляется возможность агрегации объектов и осуществления информационного поиска по любому сочетанию фасетов. двоичный кодирование текстовый компьютер

Недостатками фасетного метода классификации являются неполное использование емкости, нетрадиционность и иногда сложность применения.

Заключение

Существование современного общества немыслимо без ее основного ресурса - информации. Понимая информацию как один из основных стратегических ресурсов, без которого невозможна деловая, управленческая, вообще любая социально значимая деятельность, необходимо уметь его оценивать как с качественной, так и с количественной стороны. На этом пути существуют большие проблемы из-за нематериальной природы этого ресурса и субъективности восприятия конкретной информации различными индивидуумами человеческого общества. С этой точки зрения классификация информации является важнейшим средством создания систем хранения и поиска информации, без которых сегодня невозможно эффективное функционирование информационного обеспечения управления. Классификация информации является неотъемлемой частью информационного обеспечения управления, без которой невозможно эффективно и оперативно осуществлять управленческую деятельность.

Список используемой литературы

1. ГОСТ 6.01.1-87 Единая система классификации и кодирования технико-экономической информации. Основные положения. - М.: Изд. стандартов, 1999.

2. ГОСТ Р 1.2-92 Государственная система стандартизации (ГСС) РФ. Порядок разработки государственных стандартов

3. Постановление Правительства РФ "О развитии единой системы классификации и кодирования технико-экономической и социальной информации" № 1212 от 1 ноября 1999 г. // Вестник Госстандарта России. - 2000. - № 1.

4. ПР 50-733-93. Правила по стандартизации. Основные положения Единой системы классификации и кодирования технико-экономической и социальной информации и унифицированных систем документации Российской Федерации. - М., 1995.

5. Костомаров М.Н. Классификация и кодирование документов и документной информации (классификация документов) // Секретарское дело. - 2003. - № 11.

6. Костомаров М.Н. Классификация и кодирование документов и документной информации (классификация документов) // Секретарское дело. - 2003. - № 10.

7. Костомаров М.Н. Разработка общероссийских классификаторов ТЭСИ) // Секретарское дело. - 2001. - № 3.

8. Костомаров М.Н., Соколов А.В., Степанов Е.А. Информационное обеспечение управления. - М.: МГИАИ,1990.

Размещено на Allbest.ru

...

Подобные документы

  • Представление информации в двоичной системе. Необходимость кодирования в программировании. Кодирование графической информации, чисел, текста, звука. Разница между кодированием и шифрованием. Двоичное кодирование символьной (текстовой) информации.

    реферат [31,7 K], добавлен 27.03.2010

  • Исследование процессов, методов и средств технологии хранения информации. Изучение единиц измерения памяти и классификации запоминающих устройств. Характеристика основных способов кодирования данных на компьютере на сегодняшний день, таблиц кодировок.

    курсовая работа [86,9 K], добавлен 07.12.2011

  • Содержательный и кибернетический подходы к определению и измерению информации. Кодирование символьной информации в компьютере. Линия информации и информационных процессов. Обзор процесса передачи информации по техническим каналам связи. Языки информатики.

    презентация [173,0 K], добавлен 19.10.2014

  • Средства и технологии обработки текстовой информации: MS-DOS Editor, Word Pad, Блокнот, Microsoft Word. Двоичное кодирование текстовой информации в компьютере. Рассмотрение разновидностей кодовых таблиц для русских букв: Windows, MS-DOS, КОИ-8, Мас, ISO.

    курсовая работа [644,5 K], добавлен 27.04.2013

  • Программы работы с текстами: MS-DOS Editor, Word Pad, блокнот, word, текстовый процессор. Редакторы для обработки документов. Стили форматирования. Двоичное кодирование текстовой информации в компьютере. Операции технологического процесса ее обработки.

    курсовая работа [324,0 K], добавлен 25.04.2013

  • Компьютерное кодирование чисел, текста, графики: параметры качества кодирования; аналогово-цифровое преобразование звука. Область применения электронных таблиц; расчет стоимости междугородних телефонных разговоров абонента с применением Microsoft Excel.

    курсовая работа [641,2 K], добавлен 27.04.2013

  • Знакомство с идеей векторного способа представления изображений в цифровом виде. Разработка последовательности команд для кодирования графического объекта. Основные команды; двоичное кодирование графической информации, растровый и векторный варианты.

    презентация [128,5 K], добавлен 05.01.2012

  • Сущность линейного и двухмерного кодирования. Схема проверки подлинности штрих-кода. Анализ способов кодирования информации. Расчет контрольной цифры. Штриховое кодирование как эффективное направление автоматизации процесса ввода и обработки информации.

    презентация [1,1 M], добавлен 05.10.2014

  • Информация и информационные процессы в природе, обществе, технике. Информационная деятельность человека. Кодирование информации. Способы кодирования. Кодирование изображений. Информация в кибернетике. Свойства информации. Измерение количества информации.

    реферат [21,4 K], добавлен 18.11.2008

  • Понятие сигнала и данных. Кодирование информации, текстовых и графических данных. Представления цифровой информации. Логические схемы и основы алгебры логики. Комбинационные, последовательностные и арифметические устройства. Организация памяти в системе.

    шпаргалка [1,6 M], добавлен 16.12.2010

  • Место темы "Кодирование информации" в школьном курсе информатики. Рекомендации по изучению "Кодирования информации" в школьном курсе информатики. Дидактический материал для изучения темы "Кодирование информации" и внеклассное мероприятие по информатике.

    курсовая работа [2,3 M], добавлен 17.06.2012

  • Кодирование как процесс представления информации в виде кода. Кодирование звуковой и видеоинформации, характеристика процесса формирования определенного представления информации. Особенности универсального дружественного интерфейса для пользователей.

    контрольная работа [20,3 K], добавлен 22.04.2011

  • Сущность и содержание двоичного кодирования, цели и задачи, этапы реализации данного процесса, оценка его эффективности. Принципы и особенности кодирования чисел и символов, а также рисунков и звука. Используемые методы и приемы, применяемые инструменты.

    презентация [756,5 K], добавлен 29.10.2013

  • Виды компьютерной графики: растровая, векторная, фрактальная и трёхмерная. Основные понятия компьютерной графики. Кодирование аудиоинформации, основные аудио форматы. Смешение сигналов и видео форматы. Разработка программы построения фракталов.

    дипломная работа [1,2 M], добавлен 14.01.2015

  • Понятие экономической информации, ее классификаторы. Системы классификации и кодирования информации. Документация и технологии её формирования. Применение технологий Workflow, их функции. Виды носителей информации, современные технологии ее хранения.

    курсовая работа [2,0 M], добавлен 27.09.2013

  • Язык как способ представления информации и знаковая система. Естественные и формальные языки. Функции естественного языка. Строгие однозначные правила, ограниченный словарь в основе формальных языков. Кодирование информации, ее представление в компьютере.

    презентация [2,6 M], добавлен 11.01.2012

  • Анализ эффективности способов кодирования. Средний размер одного разряда и средняя длина кодового слова. Кодирование по методу Хаффмена. Кодирование информации по методу Шенона-Фано. Построение кодового дерево для различных методов кодирования.

    контрольная работа [491,4 K], добавлен 15.10.2013

  • Угрозы информации на персональном компьютере. Понятие, история развития и виды вирусов. Создание и классификация антивирусных программ. Защита информации средствами Avast!: интерфейс программы, общие возможности, настройки и организация проверки.

    отчет по практике [4,6 M], добавлен 21.04.2012

  • Двоичный код, особенности кодирования и декодирования информации. Система счисления как совокупность правил записи чисел с помощью определенного набора символов. Классификация систем счисления, специфика перевода чисел в позиционной системе счисления.

    презентация [16,3 K], добавлен 07.06.2011

  • Основные понятия и определения кодирования информации. Кодовая комбинация и ее длина. Классификация кодов по различным признакам, способы их представления, назначение. Представление в виде кодовых деревьев или многочленов, матричное и геометрическое.

    реферат [38,1 K], добавлен 05.08.2009

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.