Лингвистическое обеспечение автоматизированных библиотечно-информационных систем Национального аэрокосмического университета
Совокупность применяемых в технологии автоматизированных библиотечно-информационных систем информационных языков. Анализ информационно-языковых словарей и классификаторов. Обеспечения выполнения системных функций поиска в документальных базах данных.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 01.02.2019 |
Размер файла | 1,2 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ЛИНГВИСТИЧЕСКОЕ ОБЕСПЕЧЕНИЕ АИБС НТБ НАЦИОНАЛЬНОГО АЭРОКОСМИЧЕСКОГО УНИВЕРСИТЕТА «ХАИ»
Смыслова Л.А.
Лингвистическое обеспечение (ЛО) играет достаточно большую роль в функционировании автоматизированных библиотечно-информационных систем (АИБС).
Вопросы ЛО являются самыми проблемными и трудоемкими аспектами работы АИБС.
Лингвистическое обеспечение АБИС определяется как совокупность применяемых в технологии АБИС информационных языков (ИЯ), поддержки информационно-языковых словарей и классификаторов на актуальном уровне, обеспечения выполнения системных функций поиска в документальных БД АБИС по тематическим запросам и индексирование документов.
Практически всегда ЛО отстает в своем развитии от других компонентов АИБС и в тоже время зависит от аппаратного, технологического, программного и информационного обеспечения. Оно находится в состоянии постоянного совершенствования и развития.
Одним из основных барьеров, сдерживающих совершенствование и развитие ЛО, является явное отставание теории ЛО от практики развития информационно-библиотечных систем. Внедряемые в практику работы библиотек АИБС, не сопровождаются научно обоснованными рекомендациями о выборе соответствующих средств лингвистического обеспечения, методические центры не дают рекомендаций по их разработке и ведению. Все это ведет к проведению самостоятельных исследований по выбору ИПЯ и лингвистических средств.
То, что АИБС «Библиотека.УФД» уже располагала некоторыми поисковыми инструментами обеспечивающими содержательный поиск (встроенными основными разделами классификационных таблиц УДК и ББК и процедурами поиска с помощью языка библиографической записи), стало руководством к созданию и ведению т.н. «Тематических каталогов» или «Классификаторов» на основе классификационных таблиц.
Что бы определить насколько эта система ЛО является научно обоснованной, провести исследования и сделать выводы о качестве ЛО, необходимо было заниматься созданием ЭК, внедрением модуля обработки документов их учета и распределения по отделам - фондодержателям и т.д.
Параллельно с автоматизацией библиотечных процессов началась работа по созданию «Классификаторов».
Это не значит, что функциональная жизнь классификационных таблиц с бумажных носителей была перенесена в электронную среду. Разрабатывалась соответствующая методика создания лингвистических средств и методика индексирования документов.
Так:
- для увеличения степени детализации в состав классификаторов вводились сложные индексы (образованные сочетанием основного индекса с общими или специальными определителями) и самостоятельно формулировались рубрики к ним:
- не использовались составные классификационные индексы, а содержание документов, классификационная формула которых, состояла из нескольких простых или сложных индексов, индексировалась несколькими терминами классификационных таблиц:
- для каждого понятия или темы предусматривался один соответствующий индекс и его словесная форма выражения (Например, если такое понятие как «Математическая лингвистика» в классификационных таблицах имеет 2 индекса и рассматривается с разных точек зрения (519.765 - математическая кибернетика, 81'32 - языкознание, то в нашем «классификаторе» это понятие будет иметь только один индекс), чтобы устранить субъективизм и альтернативность в индексировании и создать комфортность поиска документов.
- лексической единицей в «классификаторе» является: индекс, слово, словосочетание, фраза. Поэтому устранить многозначность можно с помощью разных формулировок рубрик, содержащих определенный термин. Например:
В самом начале работы по созданию лингвистических средств, встал вопрос о языке (в грамматическом его понимании) их составления. Было принято решение о том, что это будут украинский и русский языки. Поэтому, в одну строку записи стали формулировать рубрики на двух языках. К большому нашему сожалению, не хватило длины поля. Тогда параллельно стали вести два «классификатора» на разных языках, но стало некомфортно вести поиск. И мы отказались от русского языка. К счастью, в новой версия АИБС увеличено поле, и в одной строке записи мы можем дать формулировку на трех языках, но пока это делается на двух языках.
«УДК - тематический каталог» создается параллельно с созданием ЭК. Записи тематического каталога создаются на реальные БЗ ЭК., что дает возможность индексировать документы и осуществлять поиск по тематическим запросам.
В процессе работы над созданием «УДК - тематического каталога» мы пришли к таким выводам:
1. Не хватает степени детализации в классификационных таблицах. Тему документов, классификационная формула которых состоит из составного индекса, необходимо выразить одним понятием, словосочетанием или фразой, с целью эффективного поиска документов. Например, «электронная библиотека». Классификационный индекс документа, содержание которого отвечает этому понятию, может быть таким: 027:004; 027:65.011.56 и индексировать можно несколькими рубриками тематического каталога («Універсальні бібліотеки: Комп'ютерна наука і технологія. Застосування комп'ютера» или «Універсальні бібліотеки:Автоматизація»), но такого понятия как «электронная библиотека» в этих классификационных статьях нет.
2. Нет возможности индексирования классификационными индексами конкретных летательных аппаратов, автомобилей, компьютерных программ, операционных систем, персоналий и т.д. из-за технически возможностей АИБС.
3. Возник вопрос: «Как определить труды сотрудников университета», желательно труды каждого из сотрудников; «Редкие и ценные издания».
По публикациям в печати и ресурсам Интернет мы начали изучать опыт библиотек по ЛО АИБС.
Каковы же основные тенденции в развитии лингвистического обеспечении АИБС? Это:
1. Комплексное использование элементов библиографического описания, классификационных индексов, ключевых терминов/слов, предметных рубрик в качестве ключевых элементов при поиске
2. Использование в технологиях индексирования и поиска документов одного или нескольких классификационных языков и хотя бы одного вербального языка
3. Среди вербальных языков индексирование предпочтение отдается языку ключевых терминов. При этом используется как контролируемое (на основе словаря), так и свободное (неконтролируемое словарем) индексирование
4. Ведение и поддержка в актуальном состоянии БД классификационных систем, тезаурусов, предметных рубрик, применяемых при индексировании и поиске
5. Организация поиска в предлагаемых лингвистических средствах по ключевым словам с последующим выходом в электронный каталог
6. Ведутся работы по созданию классификационных систем и систем предметных рубрик или ключевых терминов
7. В составе лингвистических средств появляются средства автоматического ведения словарей, автоматизированного индексирования текстов
8. Существует необходимость в разработке новых ИПЯ для поиска визуальной и фактографической информации.
Решением проблем индексирования классификационными индексами и рубриками классификационных таблиц стало создание «Словаря ключевых терминов», словаря «Труды сотрудников ХАИ», «Летательные аппараты» «Редкие и ценные издания», «Дары НТБ ХАИ» (Правда два последних словаря состоят только из одного названия).
Создание «Словаря ключевых терминов» и индексирование терминами «Словаря…» находится в стадии эксперимента. В настоящее время «Словарь» состоит из папок общего украинского алфавита и нескольких понятий:
Инструкция по организации и ведению разработана и включает ряд правил. Некоторые из них:
- «Словарь…» создается на трех языках (украинском, русском, английском)
- лексической единицей (ЛЕ) словаря могут быть слова (унитермы), терминологические сочетания, фразы, аббревиатуры, численные характеристики, хронологические данные, имена собственные, символические обозначения, отсутствующие в «УДК - тематическом каталоге»
- терминологический состав «Словаря...» формируется непосредственно в процессе индексирования документов
- выбранные ключевые слова и словосочетания в процессе анализа содержания документа, подвергаются нормализации согласно инструкции «Индексирование документов» НТБ ХАИ и ГОСТа 7.25-2001 Тезаурус информационно-поисковый одноязычный в части «Формирование словника ИПТ»
Можно сказать, что мы пытаемся создать дескрипторный словарь, в котором приведены в общем алфавитном ряду дескрипторы и их синонимы (с указанием эквивалентности знаком «=»), но без указания других отношений лексических единиц.
Отдельно по тем же правилам создается словарь «Летательные аппараты»
В этих словарях предполагается создать латинский алфавит для непереводимых терминов и понятий не поддающихся транслитерации.
Немного о технологии индексирования. Индексирование документов производится в процессе создания БЗ:
Индексирование содержит взаимосвязанные процессы:
- анализ содержания документа как объекта индексирования
- выявление и отбор смысловых компонентов в содержании документа
- принятие решения о составе ПОД
- оформление отобранных смысловых компонентов в терминах индексирования и классификационной формулы
- создание или редактирование терминов индексирования.
Попытаемся провести диалоговое индексирование документа представленного на слайде терминами и классификационными индексами классификатора и словарей
Харьковский авиационный институт (1930-1990) [Текст] : очерк истории / Н. А. Быстров, А. С. Набатов, Н. П. Артеменко и др. ; Под. ред..Н.Ф. Березюка. - Х. : Основа, 1990. - 190 с. - ISBN 5-11-000800-0 : 2,40.
Индексирование классификационными индексами производится автоматически, если в поле «индекс УДК» ввести классификационную формулу и нажать кнопку «Темы УДК»
И еще одна составляющая ЛО - обеспечение выполнения системных функций поиска в документальных БД АБИС по тематическим запросам (в нашем случае это ЭК).
Тематический поиск в АИБС «Библиотека.УФД» может осуществляться несколькими способами:
-по некоторым элементам БЗ, например, по словам из названия документа индексам классификационных таблиц из БЗ документа:
(Таким образом мы получили все БЗ документов, содержание которых так или иначе связаны с «004 Комп'ютерна наука і технологія. Застосування комп'ютера»)
- по контексту, т.е. по терминам, включенным в классификационную статью «классификаторов» или термину какого - либо из словарей. Кроме того опять по индексу классификации, поскольку он тоже является лингвистической единицей классификационных лингвистических средств
(Например, нам необходимо найти документы по «Композиционным материалам») ( поиск в локальной сети библиотеки):
- отбор элементов для поиска (терминов, тем, индексов) с помощью вертикальной навигации по иерархии делений по всем «классификаторам» и словарям АИБС:
Существует, пока только в локальной сети библиотеки, одновременный поиск по нескольким терминам, рубрикам классификационных таблиц.
Например, необходимо найти документы по теме «Авиационные композиционные материалы». Формируем поисковый образ запроса (ПОЗ):
С нажатием кнопки «Показать общие документы для тем» ПОЗ автоматически переносится в ЭК и мы получаем ответ на запрос в виде перечня БЗ документов, содержание которых отвечает запросу «Авиационные композиционные материалы»:
автоматизированный библиотечный информационный документальный
К большому сожалению, в АИБС отсутствует совместимость различных лингвистических средств и одновременный поиск по нескольким темам можно осуществить только в пределах одного «классификатора» или словаря.
Сейчас можно сказать, что в состав ЛО АИБС входят контролируемые лингвистические средства классификационного и вербального типа.
Наша задача - разработка качественной поисковой системы, которая при использовании хорошо разработанных классификационных и вербальных средств гарантировала бы высокую точность, полноту и оперативность поиска в сочетании с разнообразными возможностями составления запроса.
Размещено на Allbest.ru
...Подобные документы
Эволюция технического обеспечения. Основные требования, применение и характеристики современных технических средств автоматизированных информационных систем. Комплексные технологии обработки и хранения информации. Создание базы данных учета и продажи.
курсовая работа [127,1 K], добавлен 01.12.2010Характеристика сущности и назначения автоматизированных информационных систем (АИС), под которыми понимают совокупность информационных массивов технических, программных и языковых средств, предназначенных для сбора, хранения, поиска, обработки данных.
контрольная работа [24,4 K], добавлен 29.08.2010Развитие информационных систем. Современный рынок финансово-экономического прикладного программного обеспечения. Преимущества и недостатки внедрения автоматизированных информационных систем. Методы проектирования автоматизированных информационных систем.
дипломная работа [1,5 M], добавлен 22.11.2015Жизненный цикл автоматизированных информационных систем. Основы методологии проектирования автоматизированных систем на основе CASE-технологий. Фаза анализа и планирования, построения и внедрения автоматизированной системы. Каскадная и спиральная модель.
курсовая работа [1,1 M], добавлен 20.11.2010Классификация автоматизированных информационных систем. Классические примеры систем класса А, B и С. Основные задачи и функции информационных систем (подсистем). Информационные технологии для управления предприятием: понятие, компоненты и их назначение.
контрольная работа [22,9 K], добавлен 30.11.2010История развития автоматизированных информационных систем, преимущества их использования. Эволюция MRP, MRP II, ERP, ERP II. Системы бизнес-аналитики. Внедрение ERP системы SAP в ООО "Газпром добыча Астрахань" и ОАО "Астраханское стекловолокно".
курсовая работа [1,6 M], добавлен 10.06.2014Создание и организация автоматизированных информационных систем (АИС). Основные компоненты и технологические процессы АИС. Стадии и этапы создания АИС с позиции руководства организации. Разработка комплексов проектных решений автоматизированной системы.
реферат [286,6 K], добавлен 18.10.2012Виды обеспечения автоматизированных информационных систем. Составление технического задания, разработка информационной системы, составление руководства пользователя к программе. Средства программирования распределенных систем обработки информации.
отчет по практике [1,1 M], добавлен 16.04.2017Задачи и преимущества использования автоматизированных информационных систем. Внедрение программного обеспечения в эксплуатационную деятельность на железнодорожном транспорте. Классификация систем управления по степени автоматизации управляющего объекта.
реферат [98,1 K], добавлен 09.11.2010Классификация автоматизированных информационных систем; их использование для систем управления. Характеристика предоставляемых услуг ООО "Континент"; анализ эффективности применения информационных технологий конечного пользователя на предприятии.
дипломная работа [4,2 M], добавлен 05.12.2011Особенности основных, вспомогательных и организационных процессов жизненного цикла автоматизированных информационных систем. Основные методологии проектирования АИС на основе CASE-технологий. Определение модели жизненного цикла программного продукта.
курсовая работа [1,8 M], добавлен 20.11.2010Жизненный цикл информационных систем, методологии и технологии их проектирования. Уровень целеполагания и задач организации, классификация информационных систем. Стандарты кодирования, ошибки программирования. Уровни тестирования информационных систем.
презентация [490,2 K], добавлен 29.01.2023Современное состояние информационных систем и технологий и их роль в управлении предприятием. Экономическая информация на предприятиях и способы ее формализованного описания. Стадии создания автоматизированных систем. Классы информационных технологий.
курс лекций [146,8 K], добавлен 16.11.2009Анализ технического обеспечения информационных систем (микропроцессоры). Программное обеспечение информационных систем. Классификация программного обеспечения. Программы подготовки первичных документов на примере "1С: Бухгалтерия", "1С: Налогоплательщик".
контрольная работа [808,5 K], добавлен 20.07.2010Техническое обеспечение и его состав. Организационные формы использования технических средств. Факторы, влияющие на выбор настольных ПК для решения экономических задач. Виды информационных технологий в экономике. Технология формирования документов.
реферат [47,5 K], добавлен 07.12.2011Система "человек-машина" для автоматизированного сбора и обработки информации. Два вида информационных систем: информационно-справочные (пассивные) и информационно-советующие (активные). Критерии и подходы к классификации для управляющих сложных систем.
реферат [21,3 K], добавлен 27.02.2009Анализ информационных связей, выявление наиболее существенных недостатков и резервов в области экономики и управления предприятием. Обоснование проектных подходов к разработке автоматизированных информационных систем для решения управленческих проблем.
курсовая работа [64,4 K], добавлен 13.05.2013Методы организации процесса обработки информации; основные направления реализации внутримашинного информационного обеспечения. Принципы построения и эффективного применения технологий баз и банков данных как основных компонентов автоматизированных систем.
дипломная работа [186,8 K], добавлен 30.05.2013Предмет и основные понятия информационных систем. Базовые стандарты корпоративных информационных систем. Характеристика входящих и исходящих потоков информации. Основные понятия искусственного интеллекта. Обеспечение безопасности информационных систем.
курс лекций [295,6 K], добавлен 11.11.2014История развития информационных технологий. Классификация, виды программного обеспечения. Методологии и технологии проектирования информационных систем. Требования к методологии и технологии. Структурный подход к проектированию информационных систем.
дипломная работа [1,3 M], добавлен 07.02.2009