Информационные технологии в юридической деятельности
Аппаратное и программное обеспечение информационных технологий. Назначение и основные функции операционных систем. Основы правовой статистики. Технология работы в компьютерных сетях. Автоматизированное рабочее место, основы информационной безопасности.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | курс лекций |
Язык | русский |
Дата добавления | 29.10.2017 |
Размер файла | 564,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
В-третьих, корреляция возникает при взаимосвязи признаков, каждый из которых может выступать и как причина, и как следствие. Такова, например, корреляция между уровнем производительности труда и уровнем оплаты одного часа труда (тарифной ставкой). С одной стороны, чем выше производительность труда, тем выше и оплата. Но с другой стороны, установленные тарифные ставки выступают в качестве стимулирующего фактора по отношению к производительности труда. В такой системе каждый признак может выступать и в роли независимой переменной X, и в качестве зависимой переменной Y.
Первым условием возможности изучения корреляции является общее условие всякого статистического исследования: - наличие данных по достаточно большой совокупности явлений. Какое именно число явлений достаточно для анализа корреляционной связи, зависит от цели анализа, требуемой точности и надежности параметров связи, от числа факторов, корреляция с которыми изучается. Обычно считают, что число наблюдений должно быть не менее чем в 5-6, а лучше - не менее чем в 10 раз больше числа факторов. При большом числе наблюдений вступает в действие закон больших чисел, обеспечивающий взаимное погашение случайных отклонений от закономерного характера исследуемой связи.
Вторым условием возможности изучения корреляционной связи служит условие, обеспечивающее достоверное выражение закономерности в средней величине для чего необходима качественная однородность исследуемой совокупности. Например, не следует объединять в одну совокупность преступления, совершаемые обычными гражданами, с преступлениями, совершаемыми лицами, отбывающими наказание в исправительно-трудовых учреждениях, поскольку указанные преступления имеют существенные отличия.
Третьим условием корреляционного анализа является необходимость подчинения распределения совокупности по результативному Y и факторному X признакам нормальному закону распределения. Это условие связано с используемым при корреляционном анализе математическим аппаратом, дающим достоверную оценку параметров корреляции только при нормальном распределении. Однако на практике это условие чаще всего выполняется приближенно, но и в этом случае получаемые результаты обладают достаточной надежностью. При значительном отклонении распределений признаков от нормальных нельзя оценивать надежность корреляции, используя параметры данного распределения или распределения Стьюдента.
В статистике линейная зависимость между двумя признаками измеряется посредством простого (выборочного) коэффициента корреляции. Величина линейной зависимости одной переменной от нескольких других измеряется коэффициентом множественной корреляции. Возможно, вычисление частного коэффициента корреляции, который измеряет линейную зависимость между двумя признаками после устранения части линейной зависимости, обусловленной связью этих переменных с другими переменными.
По форме корреляционные связи могут быть линейными (прямолинейными) и нелинейными (криволинейными), а по направлению - прямыми (положительными) и обратными (отрицательными).
Прямая связь свидетельствует о том, что с увеличением (уменьшением) значений одного признака увеличиваются (уменьшаются) значения другого признака. При обратной связи увеличение (уменьшение) значений одного признака ведет к уменьшению (увеличению) значений другого признака.
Главная задача корреляционного анализа - измерение тесноты связи - решается путем вычисления различных коэффициентов корреляции и проверки их значимости.
Коэффициент корреляции может принимать значения при прямой связи от 0 до + 1, а при обратной - от - 1 до 0. При коэффициентах, близких к 0, считается, что статистическая линейная связь между признаками отсутствует; при абсолютных значениях коэффициентов, меньших 0,3, - связь слабая; при значениях 0,3...0,5 - связь умеренная; при 0,5...0,7 - связь значительная; при 0,7...0,9 - связь сильная; если значения коэффициентов больше 0,9, то связь считается очень сильной; если коэффициенты равны +1 или -1, то говорится о функциональной связи (что практически не встречается в статистических исследованиях).
Однако такая упрощенная оценка силы связи не всегда корректна, так как степень уверенности в наличии статистической связи зависит от объема исследуемой совокупности. Чем меньше объем совокупности, тем большим должно быть значение коэффициента корреляции для принятия гипотезы о существовании зависимости между признаками. С целью количественного измерения степени уверенности в существовании линейной статистической связи между признаками введены понятия уровня значимости и пороговых (критических) значений коэффициента корреляции.
Проверка значимости полученного коэффициента корреляции состоит в сравнении расчетного значения с критическим. При данном числе измерений и задаваемом уровне значимости находится критическое значение, которое сравнивается с расчетным. Если расчетное больше критического, то связь значима, если меньше, то связь или отсутствует (а такое значение коэффициента корреляции объясняется случайными отклонениями) или выборка мала для ее выявления.
Для определения существования и величины линейной зависимости между двумя переменными X и Y необходимо осуществить две процедуры. Первая заключается в графическом отображении точек [Xi, Yi, i=1,..., n] на плоскость [XY].
Рис. 2. Линейная зависимость Рис. 3. Линейная зависимость
существует. не просматривается.
Полученный график (рис. 2, 3) называется диаграммой рассеяния, анализ которой позволяет сделать вывод о допустимости предположения о линейной зависимости между переменными. Если такое предположение допустимо, то необходимо выразить в количественном виде величину линейной связи. Для этого используется выборочный коэффициент корреляции:
R = ,
где: , - среднеквадратические отклонения переменных X и Y соответственно.
Однако даже при наличии сильной статистически значимой связи между двумя переменными нельзя быть полностью уверенным в их причинно-следственной обусловленности, так как могут существовать другие причины (факторы), определяющие их совместную статистическую взаимосвязь. Статистические выводы должны быть всегда обоснованы надежной теоретической концепцией.
В то же время отсутствие статистически значимой связи не говорит об отсутствии причинно-следственных отношений, а заставляет искать другие пути и средства ее выявления, если содержательная концепция и практический опыт указывают на ее возможное существование.
Регрессионный анализ
Понятия корреляции и регрессии непосредственно связаны между собой. В корреляционном и регрессионном анализе много общих вычислительных приемов. Они используются для выявления причинно-следственных соотношений между явлениями и процессами. Однако если корреляционный анализ позволяет оценить силу и направление стохастической связи, то регрессионный анализ - еще и функцию зависимости. При этом следует отметить, что чем слабее взаимосвязь, тем больше диаграмма рассеяния похожа на облако (рис. 3) и тем труднее определить функцию зависимости.
Регрессия может быть:
а) в зависимости от числа явлений (переменных):
Рис. 4. Линейная зависимость Рис. 5. Нелинейная зависимость
- простой (регрессия между двумя переменными, рис. 4, 5);
- множественной (регрессия между зависимой переменной (y) и несколькими объясняющими ее переменными (х1, х2...хn);
б) в зависимости от формы (см. рис. 9, 10):
- линейной (отображается линейной функцией, а между изучаемыми переменными существуют линейные соотношения);
- нелинейной (отображается нелинейной функцией, между изучаемыми переменными связь носит нелинейный характер);
в) по характеру связи между включенными в рассмотрение переменными:
- положительной (увеличение значения объясняющей переменной приводит к увеличению значения зависимой переменной и наоборот);
- отрицательной (с увеличением значения объясняющей переменной значение объясняемой переменной уменьшается);
г) по типу:
- непосредственной (в этом случае причина оказывает прямое воздействие на следствие, т.е. зависимая и объясняющая переменные связаны непосредственно друг с другом);
- косвенной (объясняющая переменная оказывает опосредованное действие через третью или ряд других переменных на зависимую переменную);
- ложной (нонсенс-регрессия) - может возникнуть при поверхностном и формальном подходе к исследуемым процессам и явлениям. Например, регрессия, устанавливающая связь между уменьшением количества потребляемого алкоголя в нашей стране и уменьшением продажи стирального порошка.
При проведении регрессионного анализа решаются следующие основные задачи:
1. Определение формы зависимости.
2. Определение функции регрессии. Для этого используют математическое уравнение того или иного типа, позволяющее, во-первых, установить общую тенденцию изменения зависимой переменной, а, во-вторых, вычислить влияние объясняющей переменной (или нескольких переменных) на зависимую переменную.
3. Оценка неизвестных значений зависимой переменной. Полученная математическая зависимость (уравнение регрессии) позволяет определять значение зависимой переменной как в пределах интервала заданных значений объясняющих переменных, так и за его пределами. В последнем случае регрессионный анализ выступает в качестве полезного инструмента при прогнозировании изменений социально-экономических процессов и явлений (при условии сохранения существующих тенденций и взаимосвязей). Обычно длина временного отрезка, на который осуществляется прогнозирование, выбирается не более половины интервала времени, на котором проведены наблюдения исходных показателей. Можно осуществить как пассивный прогноз, решая задачу экстраполяции, так и активный, ведя рассуждения по известной схеме «если ..., то» и подставляя различные значения в одну или несколько объясняющих переменных регрессии.
Технология построения регрессии
Для построения регрессии используется метод, получивший название метода наименьших квадратов. Суть его заключается в нахождении по фактическим данным динамического ряда теоретической кривой (тренд), точки которой равноудалены от кривой 1 (см. рис. 6).
При выборе модели регрессии одним из существенных требований к ней является возможность обеспечения наибольшей простоты, позволяющей получить решение с достаточной точностью. Поэтому для установления статистических связей вначале, как правило, рассматривают модель из класса линейных функций, затем другие.
Существует хорошо развитая система подбора аппроксимирующих функций - методика группового учета аргументов (МГУА), достаточно удачно реализованная в программе Excel.
О правильности подобранной модели можно судить по результатам исследования остатковi, являющихся разностями между наблюдаемыми величинамиyi и соответствующими прогнозируемыми с помощью регрессионного уравнения величинами yi . В этом случае для проверки адекватности модели рассчитывается средняя ошибка аппроксимации:
Модель считается адекватной, если , находится в пределах не более 15%.
5. Прогноз, понятие, классификация, методы
5.1 Общие понятия прогнозирования
Прогноз - это научно обоснованное суждение о возможных состояниях объекта в будущем и (или) об альтернативных путях и сроках их достижения.
Под прогнозированием понимают процесс разработки прогнозов. Прогнозы, разрабатываемые в сфере деятельности органов внутренних дел, относятся к категории обществоведческих или юридических. Наиболее характерным видом юридического прогноза является криминологический прогноз.
Под криминологическим прогнозом обычно понимается научное предсказание изменений в структуре и динамике преступности (в целом как явления, отдельных его видов, групп и т.д.) в будущем.
Период упреждения прогноза - промежуток времени от настоящего в будущее, на который разрабатывается прогноз.
Прогнозный горизонт - максимально возможный период упреждения прогноза.
В основе определения периода упреждения лежит общий методологический принцип: прогноз возможен лишь во временных границах, в которых количественные изменения не выходят за пределы данного качества, т.е. пока действуют характерные для данного качества законы. В рамках этих временных границ для юридических прогнозов в соответствии с характером и темпами развития преступности как явления применяется следующая градация прогнозов по периоду упреждения:
- краткосрочные прогнозы - до одного года;
- среднесрочные прогнозы - от одного до пяти лет;
- долгосрочные прогнозы - на период свыше пяти и примерно до пятнадцати лет;
- дальнесрочные прогнозы - свыше пятнадцати лет.
С периодом упреждения связан и другой вид классификации прогнозов, подразделяющий их на качественные и количественные.
Качественные прогнозы разрабатываются в виде качественных оценок развития объекта: общего описания тенденций и ожидаемого характера изменений, а в самом простом случае - утверждение о возможности или невозможности наступления прогнозируемых событий (например, "возможен рост преступности" или "может наступить стабилизация определенных видов преступления" и т.п.).
Количественные прогнозы представляют собой числовые значения прогнозируемых показателей (например, "число краж превысит миллион") либо количественные оценки вероятностей достижения этих значений.
На практике, как правило, прогнозируются одновременно и качественные и количественные характеристики объекта. Соотношение этих сторон в прогнозе зависит от специфики самого объекта прогноза, целей прогнозирования, периода упреждения и др.
Например, с точки зрения последнего критерия достаточно распространенной является следующая структура прогнозной информации: краткосрочные прогнозы являются преимущественно количественными; среднесрочные - количественно-качественными; долгосрочные - в основном качественными; дальнесрочные - качественными.
5.2 Методы прогнозирования
В зависимости оттого, насколько глубоко были исследованы криминологические процессы (получены ли только динамические ряды, либо исследование проведено на уровне изучения причинно-следственных зависимостей) задача выяснения развития любого явления в будущем может решаться тремя методами: экспертных оценок, экстраполяции, моделирования.
Метод экспертных оценок. Сущность метода экспертных оценок состоит в том, что в основе прогноза используется мнение специалистов, основанное на профессиональном, научном и практическом опыте.
Сущность метода экспертных оценок состоит в том, что в основе прогноза используется мнение специалистов, основанное на профессиональном, научном и практическом опыте. При этом особенно важно вооружить экспертов качественной и количественной аналитической информацией о состоянии преступности, длительных тенденциях в ее среде, процессах, которые на нее могут повлиять. Оценивая все эти данные, эксперты высказывают свое мнение о возможной картине преступности в будущем.
В зависимости от цели экспертизы используются те или иные методы экспертных оценок. Их можно разбить на два класса: методы коллективной работы экспертной группы и методы получения индивидуального мнения членов экспертной группы. К методам коллективной оценки относятся: «комиссия», «мозговая атака», «суд», «индуцирование психоинтеллектуальной деятельности (ИПИД)», «игровая имитация». Колоссальные по своей эмоционально-психологической нагрузке психоэвристические обсуждения на короткое время мобилизуют все мыслительные резервы участников экспертизы, заставляют их интенсивно думать, познавать всю глубину проблемы.
Наиболее известным методом получения индивидуального мнения членов экспертной группы является метод ДЕЛЬФИ. Работа экспертов по этому методу организована следующим образом. Вначале производится индивидуальный опрос экспертов, при этом эксперты не контактируют друг с другом. Затем производится статистическая обработка индивидуальных экспертных оценок с целью определения усредненного мнения группы, а также крайних оценок. Эта обобщенная информация вместе с аргументами экспертов (без персонификации) в пользу своих суждений сообщается всем экспертам. После ознакомления с этой информацией эксперты могут изменить свои первоначальные оценки, если они сочтут аргументы своих коллег убедительными, либо оставить их без изменения. Процедура повторяется несколько раз и завершается при стабилизации экспертных оценок.
Экспертные оценки для разработки прогнозов, как правило, применяются в следующих случаях:
- в условиях отсутствия представительных и достоверных статистических данных о прогнозируемом объекте;
- в условиях неопределенности среды функционирования объекта, влияния на его развитие факторов внешней среды;
- в условиях дефицита времени и иных экстремальных ситуациях.
Метод экстраполяции заключается в специальной обработке динамических рядов, которая сводится к нахождению показателей уровней, лежащих за пределами временных интервалов анализируемого динамического ряда. Практически, технология экстраполяции часто заключается в продлении на длину прогнозируемого периода тренда, полученного методом наименьших квадратов (рис. 6). Затем из последней точки продленного тренда опускается перпендикуляр на ось Y. Точка пересечения перпендикуляра с осью Y определяет искомое значение признака.
Рис. 6. Прогноз методом экстраполяции.
Следует отметить, что достоверность прогноза методом экстраполяции в большой степени зависит от ряда условий:
1. Факторы, влияющие на динамику исследуемого признака должны быть достаточно стабильны. Например, если разрабатывается прогноз преступности на несколько лет вперед, то должна быть уверенность, что социально-экономические и политические условия не претерпят сильных изменений на прогнозном горизонте.
2. Прогнозный горизонт не должен превышать 1/3 анализируемого периода. Т.е., если необходимо сделать прогноз на три года вперед, то необходимо собрать статистический материал как минимум за последние девять лет.
Ввиду того, что уровни динамического ряда формируются под воздействием множества факторов, а также состоят из нескольких компонент (долговременных, циклических, сезонных и случайных), детальный анализ его поведения представляет собой довольно сложную задачу. Есть и другие особенности прогнозирования динамических рядов области социально-правовых процессов:
- развитие процессов в сфере правопорядка происходит непрерывно, однако характеризующие их уровни динамического ряда соответствуют определенным дискретным моментам времени (месяц, квартал, год), что приводит в некоторых случаях к потере части важной информации;
- динамические ряды представлены часто сравнительно небольшим числом элементов, что затрудняет формальное применение экстраполяционных методов прогнозирования;
- динамические ряды часто бывают автокоррелированными, т.е. их элементы тесно взаимосвязаны между собой, что требует применения специальных, довольно сложных методов анализа;
- при построении многофакторных моделей по данным рядов динамики в некоторых случаях имеется тесная связь между независимыми переменными (мультиколлинеарность), что также требует применения специальных процедур;
- при исследовании взаимосвязей между процессами, характеризующимися рядами динамики, часто возникает явление сдвига во времени влияния одного фактора на другой (временной лаг).
Указанные особенности динамических рядов обусловливают необходимость глубокого содержательного анализа структуры описываемого ими явления и применения для их исследования разнообразных статистических процедур.
Как отмечалось ранее, в основе однофакторных статистических методов прогнозирования лежит гипотеза о том, что исходный динамический ряд состоит из устойчивой детерминированной компоненты и случайной составляющей. При этом выделяются три вида детерминированных компонент:
1) устойчивая долговременная тенденция, описываемая чаще всего гладкими апериодическими функциями типа линейной или квадратичной, - Y1(t);
2) циклическая долговременная тенденция, связанная с периодическими качественными изменениями процессов и описываемая колебательными функциями с периодом меньшим, чем время действия устойчивой долговременной тенденции, но большим, чем у различных сезонных колебаний, - Y2(t);
3) циклическая устойчивая тенденция, связанная с периодическими колебаниями уровней ряда за счет влияния сезонных факторов, меняющихся в течение дней недели, месяцев, времен года, - Y3(t).
Таким образом, общую модель динамического ряда можно представить в следующем виде:
Y(t) = Y1(t) + Y2(t) + Y3(t) + g(t),
где: g(t) - случайная составляющая.
Прогноз методом математического моделирования. Следует отметить, что экстраполяция есть отправной момент прогнозирования, а не конечный итог.
Дело в том, что уровни динамического ряда, отражающие изменение оперативной обстановки, формируются под воздействием многих социально-политических, экономических и демографических факторов, иногда внезапно меняющихся на прогнозируемом периоде. Поэтому прогнозирование криминологических процессов как бы самих из себя при игнорировании факторов внешней среды значительно снижает точность прогноза.
К сожалению, в современной практике аналитической работы, например, органов внутренних дел очень редко применяется многофакторный анализ для прогноза оперативной обстановки. В некоторых случаях используется метод экстраполяции, но обычно результатом аналитической работы является группировка сведений о преступлениях по видам, степени общественной опасности, лицам, вычисление обобщающих показателей.
Между тем выделение и изучение наиболее существенных факторов, влияющих на уровень и структуру преступности, изучение тесноты, а затем и функции взаимосвязи между ними позволяет, по существу, создать модель криминологической обстановки. Зная, какое влияние выявленные факторы, оказывают на состояние преступности, всегда можно сделать выводы об ожидаемых ее изменениях.
Этот метод прогнозирования известен как метод моделирования. Следует отметить, что данный метод имеет некоторое ограничение в применении, связанное с необходимостью привлечения специалистов в области моделирования, математиков и представителей других научных направлений, что не всегда удается реализовать в условиях практической деятельности. Вместе с тем, не всегда остро стоит необходимость в разработке полной математической модели. Чаще необходимо только выявить новые факторы, появляющиеся на прогнозируемом горизонте и оценить степень их влияния на преступность, т.е. оценить насколько сильно их появление изменит тренд, полученный методом экстраполяции (рис. 6).
Технология этого метода выглядит следующим образом:
1. Методом экспертных оценок проводится оценка криминологической обстановки с целью выявления наиболее существенных факторов, которые по мнению экспертов могут влиять на преступность. Задача эта достаточно сложная и требует высокой квалификации экспертов. Необоснованно малое количество выбранных факторов грозит тем, что «вместе с водой можно выплеснуть и ребенка». Необоснованно большое количество - излишне усложняет модель, приводит к ситуации, когда «за деревьями можно и не увидеть леса», т.е., невозможности расчета математическими методами прогнозных значений преступности.
2. По каждому выбранному фактору на основе собранных за определенный период статистических данных составляется динамический ряд. Затем, используя метод корреляционного анализа, рассчитывается теснота взаимосвязей между динамическими рядами, выбранных существенных факторов. Для дальнейшего исследования выбираются только те группы факторов, которые имеют достаточно высокие коэффициенты корреляции, т.е., зависимость между ними должна быть близка к линейной. Обычно, чтобы обеспечить в дальнейшем уверенный подбор функций этих зависимостей, а значит - достоверный прогноз, коэффициент корреляции не должен быть менее 0,7.
3. Применяя систему подбора аппроксимирующих функций, которая реализована, например, в программе EXCEL - МАСТЕР ДИАГРАММ, находим математические функции выбранных зависимостей.
4. Задаваясь известными значениями независимого фактора Х, через найденную функцию зависимости находим неизвестные значения зависимого фактора Y. Например, если было определено, что коэффициент корреляции между количеством ввозимых автомобилей и количеством ДТП больше 0,7 и подобрана функция этой зависимости, то, подставляя известные значения ввезенных автомобилей в функцию этой зависимости можем рассчитать какую долю в общее количество ДТП внесут эти автомобили.
Среди методов этой группы также можно отметить метод имитационного моделирования, как один из наиболее перспективных и вместе с тем наиболее сложных методов прогнозирования. Он основан на построении системы дифференциальных уравнений, описывающих зависимость прогнозируемого объекта от факторов внешней среды. С помощью этой системы уравнений, являющейся математической моделью данного объекта, на ЭВМ производится исследование (имитация) реального развития прогнозируемого объекта. Достоинство метода заключается в возможности исследования различных вариантов развития объекта в зависимости от исходных предположений о возможных изменениях факторов внешней среды.
ТЕМА 5. ТЕХНОЛОГИЯ РАБОТЫ С БАЗАМИ ДАННЫХ
1. Основные понятия
Информационная база, поддерживающая работу любого предприятия или учреждения, представляет собой сложный комплекс нормативных, служебных и учетных документов (а также средств и методов их описания и организации).
Работа с информационной базой организуется как традиционным образом (вручную), так и с использованием автоматизированных систем на базе ЭВМ. Любая картотека есть совокупность единообразных документов (учетных карточек). Они имеют определенную структуру (фиксированные поля - реквизиты - для записи отдельных признаков объекта учета; фиксированную форму и т.д.).
Поэтому справочные картотеки являются первоочередным объектом автоматизации информационного обеспечения деятельности любого предприятия.
Рассмотрим основные понятия информационных баз (прежде всего, автоматизированных).
Информация обрабатывается в информационных системах в виде данных.
Данные - это информация, представленная в определенном формализованном виде, позволяющем ее передавать, хранить на различных (в том числе и машинных) носителях и обрабатывать.
По своему составу данные подразделяются на целые и вещественные числа, слова и так называемые булевы величины. Например, в ответах на вопросы анкеты, заполняемой при приеме на работу, содержатся все указанные типы элементарных данных. Так, графа анкеты «профессия» заполняется словами; графа «год рождения» - цифрами. А вот графа «имеете ли награды» - булевыми величинами (да, нет).
Запись (или в обычном представлении - документ) - совокупность данных, в целом характеризующая тот или иной объект учета или описываемое явление.
Например, биографические данные на штатное лицо представляют собой один из возможных видов подобной записи (см. рис. 1).
Поле (реквизит) - элемент данных, располагающийся в отдельной определенной позиции записи и характеризующий некоторое свойство (или признак) описываемого объекта.
Как правило, поле записи соответствует определенной позиции исходного документа, называемой атрибутом (или реквизитом). Для примера с анкетой атрибутами будут отдельные ее графы: возраст, пол, национальность, рост и т.д.
Файл (массив данных) - совокупность записей одного вида. В частности, совокупность анкет на всех сотрудников какого-либо учреждения составляет кадровый файл этого учреждения.
Таким образом, в автоматизированной информационной системе массиву данных соответствует файл, документу - запись, реквизиту документа - поле записи.
Поток данных - последовательность данных, передаваемых в некоторой системе от источников к приемникам.
О количественной оценке объемов информации уже упоминалось в теме 1, где было дано определение таким единицам как бит, байт, килобайт, мегабайт, гигабайт, терабайт, петабайт.
2. Банки данных и их структура
В соответствии с понятием информационной системы, рассмотренным в теме 1, основными ее компонентами являются:
- люди (персонал), обеспечивающие функционирование названных систем;
- информация, которая в них собирается, систематизируется, хранится и обрабатывается;
- процедуры сбора и методы преобразования информации.
- технические средства;
Автоматизация информационных систем породила новые понятия и новые структуры, которые, тем не менее, являются лишь частным случаем информационной системы.
В качестве таких понятий рассмотрим понятия банка и базы данных. Что это - родственные понятия, суть разные понятия или синонимы? Чтобы ответить на этот вопрос, дадим определение банка данных.
Банк данных (в широком смысле) - организационно-техническая система, предназначенная для накопления, длительного хранения, поиска и обработки информации, используемой в дальнейшем различными пользователями.
Для банка данных является характерной особенностью то, что данные используются многими потребителями с различными целями. Поэтому банки данных в этом плане аналогичны коммерческим банкам, финансовыми ресурсами которых пользуются многие клиенты путем кредитования производственной, организационной и др. деятельности. Очевидно, что именно эта аналогия с коммерческими банками легла в основу понятия «банк данных».
В состав банка данных входят:
- базы (база) данных;
- система управления базами (базой) данных (СУБД);
- обслуживающий персонал;
- ЭВМ и технические средства.
В связи с тем, что последние два компонента дополнительного изучения не требуют, рассмотрим подробно понятие базы данных и СУБД.
3. Понятие и организация базы данных
Информационный фонд автоматизированных информационных систем - совокупность всех данных, подлежащих накоплению, хранению, поиску, преобразованию и выдачи в установленном порядке, а также используемых для организации общения человека с ЭВМ.
Существуют два подхода к созданию информационных фондов - локальный и интегрированный.
При локальной структуре информационного фонда создаются массивы (файлы) данных, предназначенные для решения самостоятельных (отдельных) задач управления или их комплексов.
Файлы при этом обычно бывают простыми, последовательными наборами данных, полностью зависящими от программного обеспечения, используемого для их обработки, т.е. конкретных прикладных программ, при помощи которых к этим данным обращаются их пользователи.
Многие файлы локального информационного фонда формируются отдельно для каждого расчета, решения отдельных задач. Поэтому одни и те же данных, используемые в различных приложениях, обычно представляются в другой форме. Это ведет к тому, что в фонде создается большая избыточность или дублирование данных, возникают определенные трудности при их актуализации (обновлении). Практически при большом объеме фонда очень трудно сохранять все файлы на одном и том же уровне обновления.
В связи с этим пользователи часто могут обнаруживать явные противоречия в данных и испытывать определенное недоверие к ЭВМ. Кроме того, при постоянном изменении и расширении фонда локальных файлов возникает необходимость в модификации прикладных программ, которая требует значительных затрат.
Указанные недостатки локальных информационных фондов, в основном проявлялись в системах обработки данных на базе ЭВМ второго поколения. Полностью или значительно они отсутствуют в интегрированных или так называемых единых информационных фондах.
Единые фонды также могут иметь файловую структуру, но при этом данные, включаемые в определенный файл, имеют многоцелевое назначение. Тем самым уменьшается избыточность или дублирование данных, упрощается процесс обновления данных.
Для описания структур данных выделяют два способа: логический и физический.
Логическое описание структуры данных выглядит в виде, полностью готовом для представления пользователю (например, карточки исходной информации, таблицы выходных данных, отпечатанные на ЭВМ и т.д.).
Физическое описание отражает их реальное расположение в определенных ячейках памяти ЭВМ, а также методы доступа к указанным устройствам (например, физическое расположение данных на поле магнитного диска и организация прямого, т.е. без дополнительных устройств, доступа к этому диску оперативного запоминающего устройства ЭВМ).
При создании упомянутых выше локальных информационных фондов физическая и логическая структуры данных полностью совпадали, т.е. отсутствовала возможность по иному, чем физически записано на носителе информации, представлять последовательность и взаимосвязь данных в документах, предназначенных для пользователей. Соответственно любые требуемые изменения в той или иной структуре данных вызывали необходимость изменения всей системы описания данных.
Создание единых информационных фондов потребовало разделения физических и логических структур данных.
Разделение физической и логической структуры данных позволило обеспечить их независимость от прикладных программ. Это в свою очередь создало возможность перейти к новому уровню организации единых информационных фондов, получившему название базы данных. Практическая реализация концепции баз данных связана с внедрением ЭВМ третьего поколения.
База данных - это управляемый единый информационный фонд, содержащий не только соответствующим образом организованные и логически связанные между собой данные, но и систему их описания, а также средства, поддерживающие установленные информационные связи.
Для организации структур баз данных используется три способа: иерархический, сетевой и реляционный.
Иерархические структуры организации баз данных называют также деревьями.
Дерево представляет собой иерархию (строгий порядок расположения) элементов, называемых узлами (рис. 2.).
На самом верхнем уровне иерархии имеется только один узел - корень. Каждый узел, кроме корня, является порожденным и связан только с одним узлом более высокого уровня (исходным узлом).
Рис. 2. Структура иерархической базы данных
По указанному принципу построена, например алфавитно-справочная картотека адресного бюро. В ней исходным элементом является фамилия зарегистрированного лица, а все остальные найденные сведения являются порожденными.
Иерархические структуры обладают достоинством надежного хранения сформированных данных, т.к. отдельные элементы данных лишь однозначно связаны между собой. Кроме того, иерархическая структура базы дает возможность организовать несколько способов поиска данных по их адресам. Причем эти способы поиска отличаются высокой логической четкостью, последовательностью и позволяют вести поиск требуемых данных с большой точностью и максимальной полнотой.
Но иерархические базы данных имеют и ряд существенных недостатков:
1. Необходимость составления сложного и громоздкого программного обеспечения;
2. Необходимость дублирования одних и тех же данных в описании их логической структуры;
3. Сложность поиска требуемых данных сразу по нескольким связям или признакам.
Многие из указанных недостатков устраняются применением сетевых структур организации баз данных или сетевых файлов.
К сетевым структурам приходится обращаться во всех случаях, если в отношениях или связях между данными порожденный элемент имеет более одного исходного элемента. В сетевой структуре любой элемент может быть связан с любым другим элементом (рис. 3.).
Рис. 3. Структура сетевой базы данных
Наглядным примерам сетевых структур является генеалогическое дерево с указанием родственных связей, где каждый ребенок порожден от двух родителей.
Другим примером связи сетевых структур является квалификация степени наказания (статьи УК РФ) на основании отношения лица к преступлению (организатор, соучастник, исполнитель и т.д.), способа совершения (в группе, в одиночку и т.д.), а также возможно и других исходных данных.
Сетевые структуры имеют некоторые преимущества в описании данных по сравнению с иерархическим подходом. Смысл этих преимуществ можно свести к гораздо большему перечню возможностей и разнообразию услуг для пользователей сетевых баз данных. В первую очередь данное положение относится к многоаспектному (т.е. по многим признакам) поиску требуемых данных.
Вместе с тем расширение количества связей между элементами данных приводит к определенной трудности в общении с сетевыми базами данных (требует применения «не-фон-неймановских», например, параллельных структур ЭВМ с ассоциативным подходом). Это составляет главный недостаток сетевого подхода.
Дальнейшее развитие способов организации баз данных привело к разработке и внедрению реляционных структур данных.
Реляционный подход (табличный подход) к описанию структур данных основывается на представлении их в виде двумерных таблиц (рис. 4.). Такое представление данных является одним их наиболее естественных и понятных для пользователей.
Строкой такой таблицы является запись (документ) как единица логического описания данных, а каждый столбец является набором значений какого-либо атрибута или признака для всего перечня записей.
К основным преимуществам реляционных структур относятся:
1. Простота понимания и работы с базой.
2. Простота развития и дополнения базы.
3. Простота исключения несанкционированного доступа к закрытым данным.
4. Простота осуществления многоаспектного поиска требуемых наборов данных.
Атрибут 1 |
Атрибут 2 |
Атрибут 3 |
||
. . . Запись 1 |
||||
. . . Запись 2 |
||||
. . . Запись 3 |
Рис. 4. Структура реляционной базы данных
В заключение необходимо указать, что в настоящее время наибольшее распространение в стране (и в мире) нашли реляционные и различным образом комбинированные способы организации баз данных. В особенности это относится к базам данных на персональных ЭВМ.
4. Системы управления базами данных и их основные функции
Приведем два определения СУБД.
СУБД - программно-логический аппарат (специальный пакет программ), организующий создание, ведение и выдачу данных.
СУБД - это программная система, обеспечивающая создание, актуализацию и выдачу данных из базы с соблюдением основных требований автоматизированной системы, в которой она установлена.
В любом варианте подчеркивается программный смысл СУБД, организованной в соответствии со структурой базы данных.
Основные функции, выполняемые СУБД, следующие:
1 - создание базы данных;
2 - ведение базы данных в банке данных;
3 - поддержание целостности данных и логический контроль вводимых данных;
4 - обеспечение выборки нужных данных и выдача результатов пользователю в заданной форме;
5 - соблюдение приоритета и санкционирование доступа к данным.
Рассмотрим содержание указанных функций на примере образца реляционной структуры базы данных - обобщенной таблицы, содержащей сведения о владельцах автомобилей.
1. Создание базы данных заключается в обеспечении необходимой упорядоченности и связности накапливаемых и хранимых данных.
В нашем случае СУБД задает табличную форму, «шапкой» которой является строго фиксированная последовательность атрибутов или наименований данных, а каждой строкой - соответствующая ей последовательность значений, описывающих конкретный объект учета (в данном случае - автомобиль). При этом название каждого атрибута (реквизита) характеризует некоторое общее свойство реальных объектов, например, «фамилия владельца», «марка, модель автомобиля». А конкретное значение реквизита описывает индивидуальное проявление данного свойства, например, «ПЕТРОВ», «ВОЛГА ГАЗ-31».
2. Ведение базы данных состоит в систематическом пополнении ее новыми данными, корректировке (изменении) или изъятии устаревших данных.
Для реализации данной функции СУБД должна работать как в автономном, так и в оперативном режимах. В автономном режиме целесообразно выполнять массовый ввод данных с заранее подготовленных машинных носителей. В оперативном режиме ввод и корректировка данных обеспечиваются непосредственно с видеотерминала.
В примере основанием для занесения в базу данных новых записей является постановка автомобиля на учет в ГИБДД. Корректировка проводится, например, по причине изменения значения атрибута (скажем, цвета автомобиля). Данные изымаются, если автомобиль по каким-то причинам снимается с учета ГИБДД.
3. Целостность данных - это их непротиворечивость, согласованность и достоверность в любой момент содержания в базе данных.
Так как база данных содержит информацию, используемую многими потребителями, очень важно, чтобы элементы данных и связи между ними не разрушались. В СУБД это достигается использованием программ обнаружения разрушений и восстановления правильного состояния базы данных.
Логический контроль вводимых данных обеспечивает их частичную защиту от промахов и ошибок, возникающих при заполнении исходных (первичных) документов или при непосредственном вводе их оператором в ЭВМ.
Посредством специального логико-программного аппарата СУБД может указывать оператору на правильность, либо очевидную абсурдность некоторых записей. Например: фамилия - ИВАНОВ, имя - ОЛЬГА. Другой пример: автомобиль - ВОЛГА, модель - СИДОРОВ и т.п.
4. СУБД реализует различные способы (логические, математические) поиска и выборки данных и выдачу пользователям необходимого результата поиска в заданной форме (справки, сводки, таблицы и т.д.).
Она может, например, обеспечить выдачу сведений (по запросу или инициативно) о владельцах, имеющих автомобили определенной марки, цвета, о количестве автомашин и т.д.
5. Соблюдение приоритетов обработки запросов применяется в случаях многопрограммного режима обслуживания пользователей, например, в информационных сетях.
Для увеличения жизнестойкости информации в базе данных необходимо защищать ее от некомпетентного, несанкционированного и злонамеренного использования.
Поэтому СУБД должна защищать данные от случайного или преднамеренного доступа к ним лиц, не имеющих на это права, от неавторизованной модификации (корректировки) данных или от их уничтожения.
Защита от несанкционированного доступа заключается, например, в том, что некоторые из входящих в базу данных сведения могут быть выданы только с использованием системы паролей и лишь определенной категории пользователей.
ТЕМА 6. ТЕХНОЛОГИЯ РАБОТЫ В КОМПЬЮТЕРНЫХ СЕТЯХ
Современное развитие информатизации общества, повышение производительности и качественной эффективности различных систем обработки данных неразрывно связано с внедрением компьютерных информационных сетей. Применение информационных сетей можно рассматривать как одно из направлений использования систем связи, действующих практически без ограничения дальности передачи сообщений. Но главным отличием и достоинством данной технологии является возможность разнообразной обработки информации на расстоянии, а также, в случае необходимости, подключения к этому процессу дополнительных вычислительных средств, территориально удаленных друг от друга.
1. Общая характеристика информационно-вычислительных сетей
Рассмотрим основные понятия, характеристики и организационные варианты дистанционного обслуживания пользователей ЭВМ.
Телеобработка данных - это такая организация информационно-вычислительного процесса, при которой ресурсы одной или нескольких ЭВМ одновременно используются многими пользователями через различные виды средств связи.
По архитектурному и организационному построению такая обработка данных имеет два принципиальных варианта: системная телеобработка и сетевая телеобработка (информационно-вычислительные сети).
При этом существуют различные способы структурирования информации, методы кодирования данных, алгоритмы взаимодействия компонентов систем и сетей.
Классификация средств телеобработки на основные группы по существу не зависит от архитектурных принципов телеобработки. И системная и сетевая телеобработка состоят из программных и технических средств телеобработки. Программные средства содержат телекоммуникационные методы доступа. Технические включают в себя устройства сопряжения ЭВМ с каналами передачи данных, абонентские пункты или средства доступа пользователей к ЭВМ, аппаратуру передачи данных. Однако функции программных и технических средств системной и сетевой телеобработки существенно отличаются.
В историческом плане начало практики применения телеобработки данных приходится на конец 50-х - начало 60-х годов XX в., когда для обеспечения загрузки парка ЭВМ универсального назначения стали искать пути дистанционного использования возможностей машин.
Данный метод получил название системная телеобработка.
Системная телеобработка обеспечивает удаленному пользователю, как правило, не имеющему своих вычислительных ресурсов, доступ к комплексу на базе ЭВМ через различные виды телефонных коммутируемых и выделенных каналов связи, телеграфные каналы и другие физические линии.
Позднее появился вариант, который собственно и стали называть сетевой телеобработкой или информационной сетью.
Сетевая телеобработка (информационно-вычислительная сеть) обеспечивает объединение различных вычислительных средств в сеть, доступ локальных и удаленных пользователей к распределенным в сети информационно-вычислительным ресурсам и базам данных.
Этот метод обработки информации развил системный вариант и расширил такие возможности как: объединение всех процессов обработки информации в единый автоматизированный комплекс, решение более глобальных информационных задач, значительное увеличение скорости передачи данных, повышение их защищенности и др.
В общем виде сети ЭВМ состоят из набора различных устройств: больших ЭВМ, персональных ЭВМ, терминалов, устройств печати, файловых процессоров и т.д., соединенных между собой каналами связи. Каналы связи представляют собой витые (телефонные) пары, коаксиальные кабели, волоконная оптика (передача светового сигнала по гибким стеклянным волокнам) и т.д. Каждое устройство подключается к каналу с помощью соответствующего согласующего контроллера.
Одна из основных отличительных особенностей сетей состоит в том, что каждое устройство, подключенное к сети, имеет возможность взаимодействия с любым другим устройством этой сети.
2. Классификация информационно-вычислительных сетей
По степени охвата сетью территорий и количеству пользователей сети делятся на:
- глобальные (WAN - Wide Area Network);
- региональные;
- локальные (LAN - Local Area Network);
- микро сети.
Представленные варианты классификации WAN и LAN разделяются в соответствии с используемыми протоколами (о которых подробнее будет сказано ниже).
Наиболее распространенными являются локальные вычислительные сети и микро сети, особенностью которых является то, что они размещены на ограниченной территории (до нескольких километров), а микро сети даже в одном помещении, под контролем одной организации, но с возможностью выхода во внешнюю среду - в региональные, охватывающие целый регион, (например: Хабаровский край) или национальные (глобальные) вычислительные сети (способные действовать вплоть до размеров всего земного шара). Чем глобальнее компьютерная сеть, чем больше пользователей она объединяет, тем больше вероятность утечки и порчи информации, циркулирующей в сети.
По конфигурации (топологии расположения) - схеме связей между узлами сети передачи данных - наибольшее распространение получили сети:
- с кольцевой топологией (центральная и пользовательские ЭВМ подключаются последовательно в единое замкнутое кольцо);
- с шинной топологией (центральная и пользовательские ЭВМ подключены к единой шине или магистрали с двух сторон);
- со звездообразной топологией (от центральной ЭВМ подключение идет по радиально отходящим в стороны лучам).
Кроме того, существуют сети с древовидной топологией и многосвязные сети. Древовидные и многосвязные сети являются, в сущности, комбинацией сетей типа: «кольцо», «звезда» или «общая шина».
Топология сети во многом определяет надежность сети, сложность сетевых контроллеров, сетевого математического обеспечения и соответственно сервиса, представляемого пользователю, и в конечном итоге стоимость сети.
По своей архитектуре сети можно разделить на три группы:
- одноранговые сети;
- сети с выделенным сервером - «клиент-сервер»;
- комбинированные.
Одноранговые сети обычно объединяют несколько компьютеров, называемых рабочими станциями. Все рабочие станции равноправны и равнозначны с точки зрения выполняемых ими функций (учитывая возможности передачи управления любому компьютеру, общее число ЭВМ в такой сети довольно ограниченно, например 2-3 десятка). Любой компьютер в такой сети работает под управлением обычной дисковой операционной системы, а для выполнения сетевых функций в его оперативную память дополнительно загружаются необходимые программы.
...Подобные документы
Основные характеристики и принцип новой информационной технологии. Соотношение информационных технологий и информационных систем. Назначение и характеристика процесса накопления данных, состав моделей. Виды базовых информационных технологий, их структура.
курс лекций [410,5 K], добавлен 28.05.2010Основные понятия и определения информационных технологий, их классификация, техническое и программное обеспечение. Роль глобальных информационных сетей и интернета. Сущность автоматизации процессов принятия решений, использование компьютерных технологий.
тест [34,6 K], добавлен 10.12.2011Средства компьютерной, коммуникационной и организационной техники как техническая основа обеспечения информационных технологий. Основные системы классификации компьютеров. Программное обеспечение информационных технологий в маркетинге и экономике.
лекция [924,6 K], добавлен 01.04.2012Программное обеспечение решения аналитических и прогнозных задач сбытовой деятельности, критерии выбора средств, использование информационных технологий управления. Архитектура "клиент-сервер" в локальных сетях информационных маркетинговых систем.
реферат [50,1 K], добавлен 12.03.2011Понятие информационных технологий, этапы их развития, составляющие и основные виды. Особенности информационных технологий обработки данных и экспертных систем. Методология использования информационной технологии. Преимущества компьютерных технологий.
курсовая работа [46,4 K], добавлен 16.09.2011Цели социальной работы как профессиональной деятельности. Описание работы специалиста отдела социальной поддержки. Автоматизированное рабочее место специалиста, его функции, цели и задачи. Техническое и программное обеспечение рабочего места сотрудника.
курсовая работа [36,0 K], добавлен 14.12.2014Роль структуры управления в информационной системе. Примеры информационных систем. Структура и классификация информационных систем. Информационные технологии. Этапы развития информационных технологий. Виды информационных технологий.
курсовая работа [578,4 K], добавлен 17.06.2003Информационные технологии в экономике. Основы автоматизации экономической деятельности предприятий. Компьютерные технологии моделирования управления. Защита информации в информационных системах. Программное обеспечение экономической деятельности.
курс лекций [1,8 M], добавлен 15.03.2010Уровень развития информационных технологий. Зависимость безопасности Российской Федерации от обеспечения информационной безопасности. Характеристика интернет-попрошайничества. Мошенничества, связанные с интернет-магазинами. Виды компьютерных вирусов.
презентация [188,1 K], добавлен 06.04.2015Технологические процессы обработки информации в информационных технологиях. Способы доступа к Internet. Информационные технологии в локальных и корпоративных компьютерных сетях. Средства обработки графической информации. Понятие информационной технологии.
учебное пособие [1,4 M], добавлен 23.03.2010Сущность и этапы развития информационных технологий, их функции и составляющие. Характеристика информационных технологий управления и экспертных систем. Использование компьютерных и мультимедийных технологий, телекоммуникаций в обучении специалистов.
курсовая работа [48,6 K], добавлен 03.03.2013Понятие и содержание информационной технологии на современном этапе, ассортимент изделий данной группы на рынке. Объекты информационных технологий и результаты их работы. Средства и методы информационных технологий, особенности и сферы их применения.
реферат [17,9 K], добавлен 05.11.2010Основное программное обеспечение для автоматизации производства. Финансовые и коммуникационные системы. Системы планирования и управления. Текстовые редакторы и табличные процессоры. Финансовое программное обеспечение. Шрифтовые технологии в документах.
шпаргалка [551,9 K], добавлен 16.08.2010Исследование эволюции, типов операционной системы и архитектуры компьютерных сетей. Теоретические основы применения информационных технологий в экономике. Описание и область применения автоматизированной информационной системы предприятия 1С: Бухгалтерия.
реферат [123,8 K], добавлен 25.12.2010Классификация автоматизированных информационных систем. Классические примеры систем класса А, B и С. Основные задачи и функции информационных систем (подсистем). Информационные технологии для управления предприятием: понятие, компоненты и их назначение.
контрольная работа [22,9 K], добавлен 30.11.2010Понятие информационной технологии и ее принципы: интерактивный режим работы, интегрированность с другими программными продуктами, гибкость процесса измерения данных. Цели применения автоматизированных информационных систем в следственной деятельности.
реферат [23,4 K], добавлен 15.03.2015Система формирования режима информационной безопасности. Задачи информационной безопасности общества. Средства защиты информации: основные методы и системы. Защита информации в компьютерных сетях. Положения важнейших законодательных актов России.
реферат [51,5 K], добавлен 20.01.2014Особенности и принципы безопасности программного обеспечения. Причины создания вирусов для заражения компьютерных программ. Общая характеристика компьютерных вирусов и средств нейтрализации их. Классификация методов защиты от компьютерных вирусов.
реферат [21,7 K], добавлен 08.05.2012Разработка программы тестирования для выявления акцентуаций типа человека в среде Delphi и Microsoft Access. Проектирование алгоритма реализации модели. Описание программы и модулей, руководство пользователя. Меры обеспечения информационной безопасности.
дипломная работа [2,7 M], добавлен 15.06.2012Возможность оптимизации работы сотрудников отдела продаж предприятия снабжения путем внедрения современных информационных технологий. Программное обеспечение в бухгалтерии. Работа с программой Бизнес Пак, ее основные функции. Алгоритм работы с клиентом.
контрольная работа [822,5 K], добавлен 27.06.2011