Автоматизация мониторинга и системного анализа распределенной проблемно-ориентированной информации в среде Интернет
Анализ существующих средств информационного поиска. Разработка программного комплекса, реализующего автоматизирующий мониторинг и системный анализ распределенной проблемно-ориентированной информации с целью формирования хранилищ данных в среде Интернет.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | автореферат |
Язык | русский |
Дата добавления | 28.03.2018 |
Размер файла | 240,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
АВТОРЕФЕРАТ
диссертации на соискание ученой степени кандидата технических наук
АВТОМАТИЗАЦИЯ МОНИТОРИНГА И СИСТЕМНОГО АНАЛИЗА РАСПРЕДЕЛЕННОЙ ПРОБЛЕМНО-ОРИЕНТИРОВАННОЙ ИНФОРМАЦИИ В СРЕДЕ ИНТЕРНЕТ
Специальность 05.13.01 - Системный анализ, управление и обработка информации (по техническим наукам)
Рощин Сергей Михайлович
Брянск 2005
1. Общая характеристика работы
Актуальность темы диссертации.
В настоящее время в России принимаются законы, регулирующие действия с информацией. Правительство РФ придает огромное значение научно-техническому прогрессу. Первостепенной задачей становится, прежде всего, его дальнейшее ускорение, направленное на повышение эффективности производства и достижение высокой производительности труда.
Вследствие этого во многих сферах деятельности (промышленности, образовании, и др.) начался процесс освоения новых информационных технологий, в которых компьютерные средства используются не столько для вычислений, сколько для хранения информации и обеспечения доступа к ней. Организации создают информационные системы, переводят информационные ресурсы в электронную форму и устанавливают связи в массиве информации. Электронные информационные ресурсы ежегодно создаются, приобретаются и накапливаются, образуя большие объемы неструктурированной информации. Использование электронной информации требует решения проблемы поиска нужных пользователю сведений в большом объеме неструктурированной информации, хранящейся в компьютерах и компьютерных сетях.
Одной из главных особенностей развития информационно-телекоммуникационных технологий в промышленности, образовании и др. сферах деятельности в последние годы явилось широкое использование информационных ресурсов, доступных через сеть Интернет.
Наиболее распространенной и популярной службой в Интернете является WWW (World Wide Web). Информация в WWW представлена в виде гипертекста. Работа в WWW происходит посредством навигации. Однако поиск информации посредством навигации нельзя признать эффективным.
Другой значимой и популярной службой Интернета является FTP. Использование информации из FTP-ресурсов затруднено ввиду следующих причин. Принятая классификация файлов в каталоге может быть непонятна пользователю, не соответствовать тематике исследуемой предметной области или документы могут быть недостаточно структурированными.
Важной особенностью сети Интернет является то, что информация в ней постоянно изменяется. Предпринимаемые попытки улучшить данную ситуацию (разработка средств поиска, семантической Web, сети знаний и др.) не решают данную проблему, а лишь автоматизируют отдельные ее части.
Таким образом, быстрое развитие глобальной компьютерной сети Интернет обострило проблему поиска содержащейся в ней информации. Из-за изменения информации, доступной через сеть Интернет, навигационные методы поиска быстро достигают предела своих функциональных возможностей и эффективности применения. Основа Сети - протоколы, используемые для передачи информации, - не обеспечена достаточными встроенными функциями поиска. В сложившихся условиях потребность в использовании новых средств поиска информации в глобальной компьютерной сети Интернет становится особенно актуальной.
Приведенные особенности глобальной компьютерной сети Интернет ведут к необходимости проведения исследования процессов мониторинга и системного анализа распределенной проблемно-ориентированной информации в компьютерных сетях, а также создания программных продуктов, обеспечивающих точный и оперативный доступ к слабоструктурированной или неструктурированной информации.
Целью диссертационной работы является автоматизация мониторинга и системного анализа распределенной проблемно-ориентированной информации в сети Интернет на основе разработки новых подходов к построению методов информационного поиска, формирования и управления знаниями.
Для достижения указанной цели в работе решались следующие задачи:
1. Построение структуры модели предметной области для автоматизации мониторинга и системного анализа информации.
2. Разработка метода автоматизации мониторинга проблемно-ориентированной информации в сети Интернет.
3. Разработка метода автоматического индексирования текстовой информации.
4. Структурирование (классификация, кластеризация) информации с использованием семантических сетей для построения на основе этого хранилища данных.
5. Представление информации на запрос пользователя в виде, удобном для восприятия и анализа, на основе технологий когнитивной графики.
6. Разработка программного обеспечения, автоматизирующего процессы управления информацией (сбор информации, ее анализ и хранение, представление информации пользователю на запрос).
Объектом исследования является обработка распределенной проблемно-ориентированной информации. Предмет исследования: автоматизация мониторинга и системного анализа информации в среде Интернет.
Методы исследования. Для достижения поставленной цели использованы теория поиска и классификации информации; теория систем и системного анализа; математическое моделирование; теория графов; математический аппарат и методы теории множеств, в том числе и нечетких; теория и методы построения экспертных оценок. В разработанном программном обеспечении использовались технологии реляционных баз данных, а также методы структурного и объектно-ориентированного подхода для проектирования и реализации программных систем.
Научная новизна работы состоит в следующем:
1. Предложены модель и алгоритм мониторинга распределенной, проблемно-ориентированной информации в сети Интернет, которые основаны на комплексном анализе рассматриваемых информационных ресурсов.
2. Разработаны и применены методы системного анализа (индексирование, классификация и кластеризация) для обработки проблемно-ориентированной информации в среде Интернет.
3. Предложены модель и алгоритмы автоматизации системного анализа проблемно-ориентированной информации.
4. Введены инвариантные понятия и структура системы формирования знаний, показаны пути их использования в различных предметных областях.
Практическая полезность работы
1. Создан программный комплекс для автоматизации мониторинга и системного анализа распределенной проблемно-ориентированной информации в среде Интернет, позволяющий реализовать доступ к большим неструктурированным массивам информации, обеспечивая пользователю удобные средства анализа информации всего информационного массива.
2. Разработанное программное обеспечение было проверено при решении задач на машиностроительном предприятии и в медицинских учреждениях, о чем имеются соответствующие акты внедрения. Его применение при поиске и анализе информации Интернета позволило сократить время, затрачиваемое на выполнение этих операций и тем самым ускорить процесс получения информационных ресурсов специалистами и снизить стоимость данной работы.
Публикации. Основные положения диссертационной работы были изложены в двух учебных пособиях. Также докладывались на следующих международных, всероссийских и региональных конференциях и семинарах: международной научно-технической конференции «Машиностроение и техносфера на рубеже XXI века» (Севастополь-2001), всероссийском научно-методическом семинаре «Менеджмент качества подготовки специалистов в техническом вузе» (Брянск-2001), молодежной научно-технической конференции вузов приграничных регионов славянских государств (Брянск-2002), всероссийской научно-методической конференции «Телематика'2004» (Санкт-Петербург-2004) и др.
Всего опубликовано более 30 печатных работ, из них по теме диссертации - 20 работ.
2. Основное содержание работы
Во введении обоснована актуальность проводимой работы, а также необходимость разработки новых подходов и исследования процессов мониторинга и системного анализа распределенной проблемно-ориентированной информации в компьютерных сетях, а также создания программных продуктов обеспечивающих быстрый доступ к слабоструктурированной или неструктурированной информации. Здесь сформулирована цель работы и задачи, которые необходимо решить для достижения поставленной цели, указана научная новизна и приводится краткий обзор структуры работы.
В первой главе анализируются проблемы разработки и применения методов системного анализа обработки распределенной проблемно-ориентированной информации в среде Интернет. На основании работ В.Н. Волковой, А.А. Денисова, О.Г. Тайца, С. Оптнера, Д. Клиланда, Н.Н. Моисеева, Ю.И. Черняка, Ф.И. Перегудова и других ученых рассмотрены подходы к выполнению системного анализа информационных ресурсов. Также рассмотрены подходы и пути автоматизации анализа данных (работы: И.Ф. Кодда, Н. Пендса, С.К. Дулина, И.А. Киселева, А.В. Заболеева-Зотовой, А.В. Андрейчикова, Т.А. Гавриловой, В.Ф. Хорошевского и др.), мониторинга информации (работы: С.В. Кузнецова, О.Б. Сладковой, С.К. Дулина, Т.Я. Ашихминой, Б.А. Баллода, Э.С. Манелиса и др.), теории информационного поиска (работы: Дж. Солтона, К. Спарк-Джоунз, И.И. Попова, А.Г. Романенко, О.Ф. Самойлюка, В.А. Копылова, Ю.И. Шемакина, П.Б. Храмцова и др.)
Анализ результатов научных исследований в области мониторинга и системного анализа информационных ресурсов, а также информации web-серверов компаний-производителей современных средств поиска и систем управления знаниями («Microsoft», «IBM», «Google», «Яndex», «Рамблер Интернет Холдинг» и др.) показал наличие в них средств, позволяющих решать отдельные задачи обработки информации. В связи с этим были сделаны следующие выводы:
1. Ввиду специфики темы работы, ориентированной на обеспечение постоянного мониторинга и системного анализа информации, проанализированы подходы к организации хранения и анализа данных на основе использования технологий хранилищ данных.
2. Методы, используемые для обработки информации Интернета, в том числе для поиска информации, и созданные с их использованием автоматизированные программные системы реализуют лишь часть реально необходимых в организациях функций по управлению информацией. К основным нереализуемым современными подходами и системами функциям относятся:
· описание проблемы в соответствии со структурой предметной области;
· автоматическое расширение накопленных знаний полученных из информации сети Интернет;
· автоматизированный анализ всего перечня результатов в средствах поиска;
· централизованное управление запросами и результатами поиска из различных систем.
На рис. 1 представлен сравнительный анализ основных параметров существующих систем и разработанной в рамках диссертационной работы системы формирования знаний, а также определено место данной информационно-аналитической системы среди этих систем.
Система формирования знаний является для организации связующим звеном между системами информационного поиска Интернета и системами управления знаниями, позволяя накапливать необходимые информационные ресурсы. Проведенный на рис. 1 сравнительный анализ рассматриваемых систем выявил их основные отличительные признаки: использование модели предметной области, возможность кластеризации информации и анализа результата поиска.
Характеристики систем |
Системы информационного поиска |
Системы управления знаниями |
Система формирования знаний |
|
Описание предметной области |
нет |
используется для внутренних ресурсов |
используется для внешних ресурсов |
|
Мониторинг информации |
внешний |
внутренний и внешний |
внешний проблемно-ориентированный |
|
Индексирование информации |
да |
да |
да |
|
Кластеризация |
нет |
нет |
да |
|
Очищение информации |
да |
да |
да |
|
Согласование информации |
нет |
да |
да |
|
Агрегирование информации |
нет |
да |
да |
|
Анализ результата поиска |
нет |
нет |
да |
|
Хранение информации |
да |
да |
да |
Рис. 1. Место системы формирования знаний среди подобных систем и их характеристики
Вторая глава посвящена постановке задачи мониторинга и системного анализа распределенной проблемно-ориентированной информации в среде Интернет.
В этой главе приводится обоснование выбора и анализ свойств объекта исследования. Вводится новый тип систем - системы формирования знаний (knowledge forming system), под которыми понимается программное средство, выполняющее специально организованное, систематическое наблюдение за состоянием проблемно-ориентированных данных и получение из них знаний на основе моделей, методов и алгоритмов, опирающихся на комплексный подход и учет взаимосвязей между данными (рис. 2).
Рис. 2 Структура системы формирования знаний
Система формирования знаний должна обеспечивать следующие функциональные возможности:
1) описание предметной области;
2) мониторинг проблемно-ориентированной информации;
3) индексирование информации;
4) предварительная обработка собранной и индексированной информации (очищение, согласование, агрегирование и др.);
5) структурирование (кластеризация, классификация) информации для построения на основе этого хранилища данных;
6) хранение и управление информацией в хранилище данных;
7) понимание запроса, сформулированного пользователем, причем от пользователя не требуется знание способа организации информации в системе;
8) выборка информации, релевантной запросу пользователя, представленной разнотипными документами;
9) представление информации на запрос пользователя в виде удобном для восприятия и анализа.
Рассмотрен принцип работы данного типа систем, которые автоматизируют процесс сбора и анализа информации из сети Интернет, что значительно облегчает работу пользователя. Общая схема работы предлагаемой системы включает два этапа:
1. Периодически с использованием модуля управления системы запускаются на выполнение модули мониторинга и индексирования. Цель работы данных модулей - найти новые и измененные информационные ресурсы в сети Интернет относящиеся к тематике предметной области, на которую ориентирована система, скорректировать хранилище данных системы и базу знаний в соответствии с текущим состоянием информационных ресурсов.
2. Параллельно с модулями мониторинга и индексирования и независимо от них в системе выполняются другие два модуля - модуль аналитики и модуль поиска. Цель этих модулей - отобрать данные, соответствующие запросам пользователей и провести их аналитическую обработку, используя для этого многомерное хранилище данных системы и базу знаний. При этом в ответ на запрос выдаются только те данные, информация о которых уже известна системе к моменту поступления запроса, т.е. эти данные проиндексированы и занесены в хранилище данных.
Следует отметить, что разработанная система универсальна в том смысле, что подходы, используемые в ней, не зависят от конкретной предметной области. Система может быть настроена на работу с информацией из широкого спектра различных предметных областей.
Рассмотренный тип систем, основанный на формировании знаний, позволяет эффективно выполнять мониторинг и системный анализ проблемно-ориентированной информации и таким образом способствует решению многих задач в организации.
Были разработаны общие принципы математического моделирования системы формирования знаний (рис 3.). Математическая модель включает модель предметной области, а также модели процессов мониторинга, индексирования, классификации и кластеризации.
Рис. 3 Общая структура математической модели задачи
Документы, поступающие на вход в систему, проверяются на соответствие предметной области. Все соответствующие заданной предметной области документы образуют множество проблемно-ориентированных документов, каждый из которых в системе представляется в виде поискового образа. Документы классифицируются в соответствии с построенной моделью. Значительные по объему группы документов разделяются на более мелкие на основе алгоритмов кластеризации.
Сделано описание модели предметной области, на которую ориентирована система. В основе модели, описываемой предметной области, была положена семантическая сеть S:
S = <N, RN, D, RND >,(1)
Где N = {N1, N2, …, NK} - множество элементов, отражающих понятия предметной области;
RN = RN ( Ni, Nj ) - отношение задающее тип и силу взаимодействия между понятиями.
D = {D1, D2, …, DL} - множество документов, относящихся к заданной предметной области;
RND = RND ( Ni, Dj ) - отношение сопоставляющее понятиям предметной области документы.
Третья глава посвящена исследованию системных связей и закономерностей функционирования процессов мониторинга и анализа распределенной проблемно-ориентированной информации в среде Интернет.
Мониторинг распределенной проблемно-ориентированной информации в сети Интернет осуществляется в разработанной системе формирования знаний на основе модели предметной области (основной частью которой является классифицирующая структура), которая формируется экспертом и выполняется путем взаимодействия системы с существующими в Сети системами информационного поиска (информационно-поисковые системы, каталоги, метапоисковые системы), а также самостоятельного исследования всего информационного пространства.
Для формализованного описания процесса мониторинга путем навигации в данных службах используется аппарат теории графов.
Служба WWW представлена в виде ориентированного графа W, состоящего из множества вершин (документов) D = {D1, D2, …, DM} и множества дуг (гиперссылок) LINKS:
.(2)
Служба FTP представима в виде леса N, состоящего из множества деревьев {Ni ¦ i = 1, …, L}:
N = {Ni ¦ i = 1, …, L}.(3)
Каждое из деревьев представляет отдельный FTP-ресурс. Узлами FTP-ресурса являются папки F = {F1, F2, …, FK} и файлы (документы) D = {D1, D2, …, DM}.
Приведенные в работе методы, основанные на формализованных описаниях основных служб Интернета, потенциально позволяют достичь максимальной полноты охвата информационных ресурсов в сети Интернет соответствующих определенной предметной области. Однако на практике в WWW часто бывает сложно выявить замкнутые информационные массивы и найти в них начальные страницы, такие, что предоставляют возможность обойти все документы отдельного массива. В качестве таких начальных страниц могут выступать главные страницы крупных информационных ресурсов (в основном глобальных, региональных, локальных и специализированных каталогов). Универсального алгоритма поиска начальных страниц нет ввиду специфики организации Интернета. Источниками адресов этих страниц могут являться периодическая печать, СМИ, пользователи Интернета и др.
В данной главе подробно рассматривается метод мониторинга информационных ресурсов в системе формирования знаний - доступ к ним через существующие системы информационного поиска Интернета.
После осуществления доступа к информационному ресурсу с использованием любого из изложенных подходов модуль мониторинга выполняет проверку на предмет отсутствия сведений о нем в системе и, если данная проверка успешна, то выполняется еще одна проверка ресурса на предмет его соответствия заданной предметной области (наличие в нем ключевых слов запроса или их синонимов). Обе проверки могут быть выполнены модулем мониторинга автоматически, т.е. без привлечения человека. Если вторая проверка пройдена успешно - документ передается модулю индексирования для последующей обработки.
Обобщенно алгоритм работы модуля мониторинга может быть представлен схемой (рис. 4).
Рис. 4. Алгоритм работы модуля мониторинга
Процесс занесения документа Интернета в систему и формирование сведений о нем осуществляется алгоритмом изображенным на рис. 5
Самый главный этап процесса индексирования - вычисление веса слова. На значение веса слова влияют следующие факторы:
· частота употребления слова в документе,
· место употребления слова;
· наличие у слова синонимов в тексте документа.
Значение веса слова в документе определяется по формуле:
(4)
Рис. 5. Алгоритм индексирования
Где Dm - текстовый документ (m = 1, …, M; M - количество текстовых документов);
t - слово документа Dm;
- количество вхождений слова t в документ Dm;
l - количество синонимов слова t используемых в документе Dm;
- количество вхождений синонима l слова t в документ Dm;
- переменная определяющая значимость слова t (j), находящегося в документе Dm на позиции i;
- вес слова t в документе Dm.
После завершения выполнения процессов индексирования и классификации может сложиться ситуация, при которой к одному объекту (термину) сети будет сопоставлена большая группа документов, анализ пользователем которой затруднен. В этом случае необходимо выполнить разделение данного объекта на более мелкие разделы, поддающиеся анализу.
Для решения описанной ситуации в системе имеется процесс автоматической кластеризации документов (рис. 6). Сделанное разбиение объектов с использованием данного модуля на части - подразделы в дальнейшем может быть скорректировано инженером по знаниям на основе данных полученных от эксперта.
Рис. 6. Алгоритм кластеризации информации
Поиск и представление найденной, индексированной, классифицированной и кластеризованной информации пользователю выполняется по алгоритму рис. 7.
Ключевым этапом процесса поиска является вычисление меры релевантности документа запросу.
Эта мера показывает, на сколько слова входящие в запрос соответствуют содержимому документа. Она позволяет выявить какой из двух документов соответствует запросу больше. Значение меры сходства определяется по формуле:
(5)
Где Q - сделанный системе запрос;
nq - количество слов в запросе Q;
qi - i-ое слово запроса (qi Q ; i = 1, … nq);
- поисковый образ текстового документа, соответствующего запросу Q (mr = 1, …, Mr; Mr - количество релевантных запросу текстовых документов в безе документов);
- коэффициент значимости слова qi запроса Q. Значения этого коэффициента задаются пользователем при вводе запроса. Если коэффициент не задан, то он принимается равным 1;
- вес слова qi в документе . Значение веса слова в документе вычисляются по формуле (4) в процессе индексирования документа (см. выше);
- мера сходства запроса Q и документа .
Блок когнитивного представления базы знаний системы позволяет пользователю представить результат поиска в форме графического изображения. На основе правил данного блока семантическая сеть представляется в виде дерева, различным типам узлов которого сопоставлены информационные пиктограммы и названия. При выборе узла сети, в зависимости от его типа может быть выполнено одно из следующих действий:
· если выбран узел-документ, то автоматически отображается перечень соответствующих ему ключевых слов, а также перечень соответствующих документов с целым рядом наборов атрибутов. При выборе документа он загружается в окно просмотра. Все атрибуты документа можно посмотреть в отдельном графическом окне и в случае необходимости внести соответствующие изменения;
Рис. 7. Алгоритм поиска и классификации информации
· если выбран узел-документ-папка, то дополнительно к выше описанным действиям может быть выбран просмотр подузлов данного узла с теми же функциональными возможностями;
· узлы-ссылки позволяют выполнить автоматический переход в другие участки семантической сети, которые логически сходны с данным участком;
· узлы-паки служат только для логического объединения узлов-документов, узлов-документов-папок и узлов-ссылок.
Информация о документах Интернета в системе формирования знаний хранится в хранилище данных. Структурно разработанное хранилище данных по предметной области можно представить в виде куба с измерениями: охват, время и потребность.
В четвертой главе освещаются вопросы разработки программного комплекса автоматизирующего мониторинг и системный анализ распределенной проблемно-ориентированной информации в среде Интернет.
Требования к программному комплексу формируются с учетом разработанных математических моделей и общих принципов построения распределенных информационных систем.
Приводятся архитектура и функциональная схема программного комплекса (ПК ЛОЦМАН) (рис. 8), реализующего программную поддержку математических моделей и семантического моделирования. В разработанном программном комплексе предусмотрен доступ к хранилищу данных и базе знаний, а также интерфейс системы с пользователем.
Рис. 8. Функциональная схема программного комплекса Лоцман
При создании системы использовалась среда программирования Borland Delphi 7. В главе рассмотрены вопросы организации хранилища данных с использованием языка XML.
Излагается пользовательский интерфейс системы формирования знаний и схема поиска информации с использованием данной системы пользователем. В завершении главы приводится функциональная схема аппаратных средств, необходимых для функционирования разработанной системы. Анализируются возможные направления развития и пути применения программного комплекса.
В пятой главе освещаются вопросы, связанные с применением программного комплекса автоматизирующего мониторинг и системный анализ распределенной проблемно-ориентированной информации в среде Интернет. Рассматривается практическое применение разработанной системы при инновационной деятельности на предприятии, в образовательном процессе и медицине, а также при проведении мониторинга общественного мнения.
Описано применение разработанной системы формирования знаний при инновационной деятельности на предприятии. Управление инновационной деятельности на предприятии включает несколько взаимосвязанных блоков от маркетинга до производства новых изделий. На каждом из этапов требуется своя специфическая информация из сети Интернет. Система была апробирована при сборе информации о конкурентах предприятия. Разработанная система на основе построенной модели предметной области умеет самостоятельно выявлять новые предприятия на рынке, заносить их в различные классы сформированной модели и предоставлять полученную информацию специалистам в виде удобном для просмотра.
Система формирования знаний экономически эффективна. Заложенные в ней методы, позволяют в значительной степени автоматизировать процесс индексирования и поиска документов. Разработанная система универсальна в том смысле, что подходы, используемые в ней, не зависят от конкретной предметной области. Система может быть настроена на работу с информацией из широкого спектра различных предметных областей. Cистема была апробирована не только в промышленности, но и в медицине. Предложенный в данной работе подход позволяет реализовать эффективный доступ к проблемно-ориентированной информации из больших распределенных неструктурированных массивов информации, в том числе и из сети Интернет.
Основные выводы и результаты работы
При решении задач, направленных на достижение цели диссертационного исследования, были достигнуты следующие основные научные результаты:
1. Проведен анализ существующих средств информационного поиска, систем управления знаниями, а также технологий и подходов к организации хранилищ данных. Методы, используемые для обработки информации Интернета, реализуют лишь часть реально необходимых в организациях функций по управлению информацией.
2. Разработан новый тип систем - системы формирования знаний представляющий собой комплекс, автоматизирующий мониторинг и системный анализ распределенной проблемно-ориентированной информации с целью формирования хранилищ данных. Данный тип систем направлен на повышение эффективности работы пользователей с информацией.
3. Предложена модель организации и структура хранилища данных в виде куба с измерениями: охват, время, потребность, что позволяет оптимальным образом структурировать данные по предметным областям.
4. Создан подход представления найденной информации конечному пользователю в удобном для восприятия и анализа виде на основе технологий семантических сетей и когнитивной графики, что значительно позволяет упорядочить информацию и ускорить процесс ее анализа.
5. Спроектирована функциональная схема программного комплекса, отображающая процесс взаимодействия компонентов системы, а также ряд алгоритмов, реализующих теорию, приведенную в рамках диссертационного исследования.
6. Разработан программный комплекс, реализующий автоматизацию мониторинга и системного анализа распределенной проблемно-ориентированной информации в среде Интернет. Данный комплекс эффективно управляет неструктурированной информацией.
7. Более высокая скорость доступа к информационным ресурсам Сети с меньшими затратами при использовании разработанной системы позволяет повысить эффективность работы пользователей и сократить затраты на передачу данных за счет хранения информационных ресурсов Интернета на локальном компьютере.
8. Система созданная в рамках диссертационной работы инвариантна относительно предметных областей. Она использует единый механизм обработки и управления потоком информации для различных отраслей знания. Система была апробирована в промышленности и медицине.
информация интернет хранилище автоматизирующий
Основные положения диссертации опубликованы в следующих работах
1. Аверченков В.И., Мирошников В.В., Рощин С.М. Автоматизация анализа распределенной информации в среде Интернет // Материалы междунар. конф. по телекоммуникациям «IEEE/ICC 2001» 13-15 июня 2001 г., - СПб.: СПбГЭТУ «ЛЭТИ», 2001. - С. 416-420.
2. Аверченков В.И., Мирошников В.В., Рощин С.М. Автоматизация мониторинга и системного анализа распределенной проблемно-ориентированной информации в среде Интернет // Машиностроение и техносфера на рубеже XXI века / Сборник трудов Международной научно-технической конференции в г. Севастополе 10-16 сентября 2001 г. В 3-х томах. - Донецк: ДонГТУ, 2001. Т.1. - С. 15-20.
3. Аверченков В.И., Мирошников В.В., Рощин С.М. Автоматизация мониторинга и анализа информации в среде образования // Менеджмент качества подготовки специалистов в техническом вузе: Матер. Всероссийск. науч.-метод. семин., 17-18 апреля 2001 г., г. Брянск / Под ред. В.И. Попкова. - Брянск: БГТУ, 2001. - с. 83-87.
4. Аверченков В.И., Мирошников В.В., Рощин С.М. Индексирование и поиск мультимедийных документов в Интернете // Научный сервис в сети Интернет: Труды Всероссийской научной конференции (24-29 сентября 2001г., г. Новороссийск). - М.: МГУ, 2001. - С. 124-126.
5. Аверченков В.И., Мирошников В.В., Рощин С.М. Интернет-технологии как инструментальная основа интеграции образования, науки и производства // Интеграция образования, науки и производства: Матер. V междунар. научн.-метод. конф. (26-29 2001 г.) / Под. ред. О.Ф. Гордеева. - Луцк: ЛДТУ, 2001. - С. 38-40.
6. Аверченков В.И., Мирошников В.В., Рощин С.М. Информационный поиск в сети Интернет: Учеб. пособие / Под общ. ред. В.И. Аверченкова. - Брянск: БГТУ, 2001. - 204 с.
7. Аверченков В.И., Мирошников В.В., Рощин С.М. Эффективное использование неструктурированной информации в процессе обучения // Новые информационные технологии в университетском образовании. Тезисы междунар. науч.-метод. конф., 6-8 июня 2001 г., - Новосибирск, 2001. - C. 205-206.
8. Аверченков В.И., Рощин С.М. Автоматизация мониторинга и системного анализа распределенной проблемно-ориентированной информации в среде Интернет // Труды Всероссийской научно-методической конференции «Телематика'2004» (7-10 июня 2004г.). - СПб.: Изд-во Регионального образовательного центра, 2004. - С. 220-221.
9. Аверченков В.И., Рощин С.М. Применение технологий информационного поиска в дистанционном обучении // Единое образовательное пространство славянских государств в XXI веке: проблемы и перспективы: Материалы Междунар. науч.-практ. конф. (2-4 апр. 2002 г., г.Брянск) / Под ред. В.И. Аверченкова. - Брянск: БГТУ; СГУ, 2002. - С. 374-378.
10. Аверченков В.И., Рощин С.М. Система формирования знаний // Материалы международной конференции. В 3-х т. Т.1./ ВолгГТУ. - Волгоград, 2004. - С. 10-15.
11. Аверченков В.И., Рощин С.М., Трифанков Ю.Т. Информационный поиск в Интернете: Учеб. пособие / Под общ. ред. В.И. Аверченкова. - Брянск: БГТУ, 2002. - 304 с.
12. Рощин С.М. Интернет для учителя-предметника // Брянская учительская газета № 42, 24.10.2003 г. - С. 12-13.
13. Рощин С.М. Проблемы информационного поиска в глобальной компьютерной сети Интернет и подход к их решению // Молодежная научно-техническая конференция вузов приграничных регионов славянских государств, 23 - 24 окт. 2001 г., г. Брянск: Материалы конф. / Под ред. О.А. Горленко. - Брянск: БГТУ, 2002. - С. 43-49.
14. Рощин С.М. Системный подход к исследованию методов индексирования информации / Практика системного анализа. - Кострома: 2002. - С. 15-20.
15. Утка В.Г., Рощин С.М. Методика поиска информационных ресурсов в сети Интернет // Брянский медицинский вестник № 5(10), ноябрь 2003 г. - С. 85-90.
Размещено на Allbest.ru
...Подобные документы
Требования, предъявляемые к свойствам систем распределенной обработки информации. Логические слои прикладного программного обеспечения вычислительных систем. Механизмы реализации распределенной обработки информации. Технологии обмена сообщениями.
курсовая работа [506,8 K], добавлен 03.03.2011Проект экспериментального программного комплекса индексирования и поиска неструктурированной текстовой информации в многоязычной среде, состоящего из математических моделей, алгоритмов и программных средств. Исследование характеристик его эффективности.
автореферат [296,5 K], добавлен 31.01.2012Средства поиска информации в сети Интернет. Основные требования и методика поиска информации. Структура и характеристика поисковых сервисов. Глобальные поисковые машины WWW (World Wide Web). Планирование поиска и сбора информации в сети Интернет.
реферат [32,2 K], добавлен 02.11.2010Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.
реферат [17,2 K], добавлен 12.05.2010Особенности программных средств (браузеров) для просмотра web-страниц и для работы с электронной почтой (почтовые клиенты). Этапы и методы разработки Интернет-сайта. Средства поиска информации в Интернет. Сравнительная характеристика поисковых сайтов.
курсовая работа [617,9 K], добавлен 19.06.2010Основные этапы развития языков программирования. Характеристика машинно-ориентированной, проблемно-ориентированной и процедурно-ориентированной систем программирования. Ознакомление с системами программирования Delphi, Visual Basic и Visual C++.
курсовая работа [102,4 K], добавлен 21.07.2012Характеристики распределенной системы управления базой данных. Уровни представления информации в распределенной базе. Сравнительные характеристики стратегий хранения информации: централизованной, расчленения (фрагментации), дублирования, смешанной.
курсовая работа [1,7 M], добавлен 16.05.2014Интернет и его возможности. Распространенный и недорогой способ подключения к интернет. Схема передачи информации по протоколу TCP/IP. Характеристики адресов разного класса. Поисковые системы, способы поиска и скачивания информации в глобальной сети.
курсовая работа [245,6 K], добавлен 25.09.2013Разработка программного обеспечения в объектно-ориентированной среде визуального программирования Microsoft Office VBA, реализующего базу данных "Энциклопедия домашних животных". Выбор языка программирования. Реализация программных модулей в блоках.
курсовая работа [3,3 M], добавлен 11.01.2013Общая характеристика и принципы деятельности интернет-магазина "World memory", реализующего устройства чтения и хранения информации для персональных компьютеров. Составление отчет по реализации товаром в МS Excel. Построение базы данных в среде МS Access.
контрольная работа [2,4 M], добавлен 22.12.2013Принципы построения СУБД, их достоинства. Архитектура распределенной информационной системы. Разработка интернет-магазина рынка книг: построение физической модели данных на языке SQL, проектирование схемы базы данных с использованием веб-интерфейса.
курсовая работа [2,3 M], добавлен 01.11.2011Анализ объектно-ориентированной технологии программирования на примере языка Java. Методы, инструменты разработки web-приложений. Применение их при создании Интернет-магазина для ООО "Компас". Разработка апплета для его страницы в виде стрелочных часов.
курсовая работа [2,7 M], добавлен 31.01.2014Современные базы данных – многофункциональные программные системы, работающие в открытой распределенной среде изучении администрирования базы данных. Способы организации внешней памяти баз данных. Системы управления базами данных для хранения информации.
курсовая работа [185,6 K], добавлен 07.12.2010Анализ средств информации консалтингового бизнеса: обзор языков программирования и программных средств для создания сайтов, информационных систем и сайтов консалтинговых фирм. Моделирование бизнес-процессов. Разработка интернет-представительства.
дипломная работа [2,9 M], добавлен 11.04.2012Информационная революция, которую сейчас переживает общество. Проведение структурного анализа документов. Поиск аналоговой информации в системных областях. Поиск информации через сеть интернет. Виды поисковых ресурсов: каталоги и поисковые роботы.
курсовая работа [58,6 K], добавлен 16.12.2012Рост количества информации в мире, его увеличение в сети Интернет в геометрической прогрессии. Количество сайтов, зарегистрированных в поисковой системе Яндекс. Особенности эффективного поиска информации в сети Интернет. Схема информационных потоков.
презентация [52,6 K], добавлен 27.08.2013Проектирование базы данных в среде СУБД MS Access. Автоматизация учета информации о товаре в магазине. Определение требований и функций системы. Анализ предметной области. Разработка, создание таблиц, запросов, форм и отчетов. Инструкция для пользователя.
отчет по практике [523,6 K], добавлен 21.04.2014Теоретические основы Интернет-технологий и основных служб сети Интернет. Ознакомление с возможностями подключения к сети Интернет. Основные службы сети. Принципы поиска информации в WWW. Обзор современных Интернет браузеров. Программы для общения в сети.
курсовая работа [385,2 K], добавлен 18.06.2010Изучение принципа работы интернет-аукциона (на примере сайта molotok.ru). Способ получения информации с веб-ресурсов. Разработка программного обеспечения с целью создания исходных данных для обучения нейронных сетей и классификации товаров с их помощью.
дипломная работа [2,0 M], добавлен 29.06.2012Сущность и принцип работы глобальной сети Интернет. Поиск информации по параметрам в системе Google. Специализированные системы поиска информации: "КтоТам", "Tagoo", "Truveo", "Kinopoisk", "Улов-Умов". Целесообразное использование поисковых систем.
презентация [572,6 K], добавлен 16.02.2015