Автоматизация мониторинга и системного анализа распределенной проблемно-ориентированной информации в среде интернет

Модель и алгоритм мониторинга распределенной, проблемно-ориентированной информации в сети Интернет, которые основаны на комплексном анализе рассматриваемых информационных ресурсов. Введение инвариантных понятий, структура системы формирования знаний.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 24.11.2017
Размер файла 582,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru//

Размещено на http://www.allbest.ru//

Специальность 05.13.01 - Системный анализ, управление и обработка информации (по техническим наукам)

АВТОРЕФЕРАТ

диссертации на соискание ученой степени
кандидата технических наук

«Автоматизация мониторинга и системного анализа распределенной проблемно-ориентированной информации в среде интернет»

Рощин Сергей Михайлович

Брянск 2005

Работа выполнена на кафедре «Компьютерные технологии и системы» Брянского государственного технического университета

Научный руководитель:заслуженный деятель науки РФ, д.т.н, профессор

В.И. Аверченков

Официальные оппоненты:д.т.н, профессор А.В. Андрейчиков

к.т.н., доцент Б.И. Квитко

Ведущая организация:Орловский государственный

технический университет

Защита состоится 21 июня 2005 года в 15 часов на заседании
диссертационного совета К212.021.01 при Брянском государственном техническом университете по адресу: 241035, Брянск, бульвар 50-летия Октября, д. 7.

С диссертацией можно ознакомиться в библиотеке Брянского
государственного технического университета.

Ученый секретарь

диссертационного совета к.т.н., доцент В.А. Шкаберин

ОБЩАЯ ХАРАКТЕРИСТИКА РАБОТЫ

Актуальность темы диссертации

В настоящее время в России принимаются законы, регулирующие действия с информацией. Правительство РФ придает огромное значение научно-техническому прогрессу. Первостепенной задачей становится, прежде всего, его дальнейшее ускорение, направленное на повышение эффективности производства и достижение высокой производительности труда.

Вследствие этого во многих сферах деятельности (промышленности, образовании, и др.) начался процесс освоения новых информационных технологий, в которых компьютерные средства используются не столько для вычислений, сколько для хранения информации и обеспечения доступа к ней. Организации создают информационные системы, переводят информационные ресурсы в электронную форму и устанавливают связи в массиве информации. Электронные информационные ресурсы ежегодно создаются, приобретаются и накапливаются, образуя большие объемы неструктурированной информации. Использование электронной информации требует решения проблемы поиска нужных пользователю сведений в большом объеме неструктурированной информации, хранящейся в компьютерах и компьютерных сетях.

Одной из главных особенностей развития информационно-телекоммуникационных технологий в промышленности, образовании и др. сферах деятельности в последние годы явилось широкое использование информационных ресурсов, доступных через сеть Интернет.

Наиболее распространенной и популярной службой в Интернете является WWW (World Wide Web). Информация в WWW представлена в виде гипертекста. Работа в WWW происходит посредством навигации. Однако поиск информации посредством навигации нельзя признать эффективным.

Другой значимой и популярной службой Интернета является FTP. Использование информации из FTP-ресурсов затруднено ввиду следующих причин. Принятая классификация файлов в каталоге может быть непонятна пользователю, не соответствовать тематике исследуемой предметной области или документы могут быть недостаточно структурированными.

Важной особенностью сети Интернет является то, что информация в ней постоянно изменяется. Предпринимаемые попытки улучшить данную ситуацию (разработка средств поиска, семантической Web, сети знаний и др.) не решают данную проблему, а лишь автоматизируют отдельные ее части.

Таким образом, быстрое развитие глобальной компьютерной сети Интернет обострило проблему поиска содержащейся в ней информации. Из-за изменения информации, доступной через сеть Интернет, навигационные методы поиска быстро достигают предела своих функциональных возможностей и эффективности применения. Основа Сети - протоколы, используемые для передачи информации, - не обеспечена достаточными встроенными функциями поиска. В сложившихся условиях потребность в использовании новых средств поиска информации в глобальной компьютерной сети Интернет становится особенно актуальной.

Приведенные особенности глобальной компьютерной сети Интернет ведут к необходимости проведения исследования процессов мониторинга и системного анализа распределенной проблемно-ориентированной информации в компьютерных сетях, а также создания программных продуктов, обеспечивающих точный и оперативный доступ к слабоструктурированной или неструктурированной информации.

Целью диссертационной работы является автоматизация мониторинга и системного анализа распределенной проблемно-ориентированной информации в сети Интернет на основе разработки новых подходов к построению методов информационного поиска, формирования и управления знаниями.

Для достижения указанной цели в работе решались следующие задачи:

Построение структуры модели предметной области для автоматизации мониторинга и системного анализа информации.

Разработка метода автоматизации мониторинга проблемно-ориентированной информации в сети Интернет.

Разработка метода автоматического индексирования текстовой информации.

Структурирование (классификация, кластеризация) информации с использованием семантических сетей для построения на основе этого хранилища данных.

Представление информации на запрос пользователя в виде, удобном для восприятия и анализа, на основе технологий когнитивной графики.

Разработка программного обеспечения, автоматизирующего процессы управления информацией (сбор информации, ее анализ и хранение, представление информации пользователю на запрос).

Объектом исследования является обработка распределенной проблемно-ориентированной информации. Предмет исследования: автоматизация мониторинга и системного анализа информации в среде Интернет.

Методы исследования. Для достижения поставленной цели использованы теория поиска и классификации информации; теория систем и системного анализа; математическое моделирование; теория графов; математический аппарат и методы теории множеств, в том числе и нечетких; теория и методы построения экспертных оценок. В разработанном программном обеспечении использовались технологии реляционных баз данных, а также методы структурного и объектно-ориентированного подхода для проектирования и реализации программных систем.

Научная новизна работы состоит в следующем:

Предложены модель и алгоритм мониторинга распределенной, проблемно-ориентированной информации в сети Интернет, которые основаны на комплексном анализе рассматриваемых информационных ресурсов. информация интернет распределенный

Разработаны и применены методы системного анализа (индексирование, классификация и кластеризация) для обработки проблемно-ориентированной информации в среде Интернет.

Предложены модель и алгоритмы автоматизации системного анализа проблемно-ориентированной информации.

Введены инвариантные понятия и структура системы формирования знаний, показаны пути их использования в различных предметных областях.

Практическая полезность работы

Создан программный комплекс для автоматизации мониторинга и системного анализа распределенной проблемно-ориентированной информации в среде Интернет, позволяющий реализовать доступ к большим неструктурированным массивам информации, обеспечивая пользователю удобные средства анализа информации всего информационного массива.

Разработанное программное обеспечение было проверено при решении задач на машиностроительном предприятии и в медицинских учреждениях, о чем имеются соответствующие акты внедрения. Его применение при поиске и анализе информации Интернета позволило сократить время, затрачиваемое на выполнение этих операций и тем самым ускорить процесс получения информационных ресурсов специалистами и снизить стоимость данной работы.

Публикации. Основные положения диссертационной работы были изложены в двух учебных пособиях. Также докладывались на следующих международных, всероссийских и региональных конференциях и семинарах: международной научно-технической конференции «Машиностроение и техносфера на рубеже XXI века» (Севастополь-2001), всероссийском научно-методическом семинаре «Менеджмент качества подготовки специалистов в техническом вузе» (Брянск-2001), молодежной научно-технической конференции вузов приграничных регионов славянских государств (Брянск-2002), всероссийской научно-методической конференции «Телематика'2004» (Санкт-Петербург-2004) и др.

Всего опубликовано более 30 печатных работ, из них по теме диссертации - 20 работ.

Структура и объем работы. Диссертационная работа состоит из введения, пяти глав, выводов, списка литературы и 3 приложений. Работа изложена на 172 страницах формата А4 и включает 36 рисунков, 4 таблицы, список литературы из 164 наименований и приложения на 25 страницах. Общий объем работы - 197 страниц.

ОСНОВНАЯ ЧАСТЬ

Во введении обоснована актуальность проводимой работы, а также необходимость разработки новых подходов и исследования процессов мониторинга и системного анализа распределенной проблемно-ориентированной информации в компьютерных сетях, а также создания программных продуктов обеспечивающих быстрый доступ к слабоструктурированной или неструктурированной информации. Здесь сформулирована цель работы и задачи, которые необходимо решить для достижения поставленной цели, указана научная новизна и приводится краткий обзор структуры работы.

В первой главе анализируются проблемы разработки и применения методов системного анализа обработки распределенной проблемно-ориентированной информации в среде Интернет. На основании работ В.Н. Волковой, А.А. Денисова, О.Г. Тайца, С. Оптнера, Д. Клиланда, Н.Н. Моисеева, Ю.И. Черняка, Ф.И. Перегудова и других ученых рассмотрены подходы к выполнению системного анализа информационных ресурсов. Также рассмотрены подходы и пути автоматизации анализа данных (работы: И.Ф. Кодда, Н. Пендса, С.К. Дулина, И.А. Киселева, А.В. Заболеева-Зотовой, А.В. Андрейчикова, Т.А. Гавриловой, В.Ф. Хорошевского и др.), мониторинга информации (работы: С.В. Кузнецова, О.Б. Сладковой, С.К. Дулина, Т.Я. Ашихминой, Б.А. Баллода, Э.С. Манелиса и др.), теории информационного поиска (работы: Дж. Солтона, К. Спарк-Джоунз, И.И. Попова, А.Г. Романенко, О.Ф. Самойлюка, В.А. Копылова, Ю.И. Шемакина, П.Б. Храмцова и др.)

Анализ результатов научных исследований в области мониторинга и системного анализа информационных ресурсов, а также информации web-серверов компаний-производителей современных средств поиска и систем управления знаниями («Microsoft», «IBM», «Google», «Яndex», «Рамблер Интернет Холдинг» и др.) показал наличие в них средств, позволяющих решать отдельные задачи обработки информации. В связи с этим были сделаны следующие выводы:

Ввиду специфики темы работы, ориентированной на обеспечение постоянного мониторинга и системного анализа информации, проанализированы подходы к организации хранения и анализа данных на основе использования технологий хранилищ данных.

Методы, используемые для обработки информации Интернета, в том числе для поиска информации, и созданные с их использованием автоматизированные программные системы реализуют лишь часть реально необходимых в организациях функций по управлению информацией. К основным нереализуемым современными подходами и системами функциям относятся:

описание проблемы в соответствии со структурой предметной области;

автоматическое расширение накопленных знаний полученных из информации сети Интернет;

автоматизированный анализ всего перечня результатов в
средствах поиска;

централизованное управление запросами и результатами поиска из различных систем.

На рис. 1 представлен сравнительный анализ основных параметров существующих систем и разработанной в рамках диссертационной работы системы формирования знаний, а также определено место данной информационно-аналитической системы среди этих систем.

Система формирования знаний является для организации связующим звеном между системами информационного поиска Интернета и системами управления знаниями, позволяя накапливать необходимые информационные ресурсы. Проведенный на рис. 1 сравнительный анализ рассматриваемых систем выявил их основные отличительные признаки: использование модели предметной области, возможность кластеризации информации и анализа результата поиска.

Рис. 1. Место системы формирования знаний среди подобных систем
и их характеристики

Вторая глава посвящена постановке задачи мониторинга и системного анализа распределенной проблемно-ориентированной информации в среде Интернет.

В этой главе приводится обоснование выбора и анализ свойств объекта исследования. Вводится новый тип систем - системы формирования знаний (knowledge forming system), под которыми понимается программное средство, выполняющее специально организованное, систематическое наблюдение за состоянием проблемно-ориентированных данных и получение из них знаний на основе моделей, методов и алгоритмов, опирающихся на комплексный подход и учет взаимосвязей между данными (рис. 2).

Система формирования знаний должна обеспечивать следующие функциональные возможности:

описание предметной области;

мониторинг проблемно-ориентированной информации;

индексирование информации;

предварительная обработка собранной и индексированной информации (очищение, согласование, агрегирование и др.);

структурирование (кластеризация, классификация) информации для построения на основе этого хранилища данных;

хранение и управление информацией в хранилище данных;

понимание запроса, сформулированного пользователем, причем от пользователя не требуется знание способа организации информации в системе;

выборка информации, релевантной запросу пользователя, представленной разнотипными документами;

представление информации на запрос пользователя в виде удобном для восприятия и анализа.

Рассмотрен принцип работы данного типа систем, которые автоматизируют процесс сбора и анализа информации из сети Интернет, что значительно облегчает работу пользователя. Общая схема работы предлагаемой системы включает два этапа:

1. Периодически с использованием модуля управления системы запускаются на выполнение модули мониторинга и индексирования. Цель работы данных модулей - найти новые и измененные информационные ресурсы в сети Интернет относящиеся к тематике предметной области, на которую ориентирована система, скорректировать хранилище данных системы и базу знаний в соответствии с текущим состоянием информационных ресурсов.

2. Параллельно с модулями мониторинга и индексирования и независимо от них в системе выполняются другие два модуля - модуль аналитики и модуль поиска. Цель этих модулей - отобрать данные, соответствующие запросам пользователей и провести их аналитическую обработку, используя для этого многомерное хранилище данных системы и базу знаний. При этом в ответ на запрос выдаются только те данные, информация о которых уже известна системе к моменту поступления запроса, т.е. эти данные проиндексированы и занесены в хранилище данных.

Следует отметить, что разработанная система универсальна в том смысле, что подходы, используемые в ней, не зависят от конкретной предметной области. Система может быть настроена на работу с информацией из широкого спектра различных предметных областей.

Рассмотренный тип систем, основанный на формировании знаний, позволяет эффективно выполнять мониторинг и системный анализ проблемно-ориентированной информации и таким образом способствует решению многих задач в организации.

Были разработаны общие принципы математического моделирования системы формирования знаний (рис 3.). Математическая модель включает модель предметной области, а также модели процессов мониторинга, индексирования, классификации и кластеризации.

Документы, поступающие на вход в систему, проверяются на соответствие предметной области. Все соответствующие заданной предметной области документы образуют множество проблемно-ориентированных документов, каждый из которых в системе представляется в виде поискового образа. Документы классифицируются в соответствии с построенной моделью. Значительные по объему группы документов разделяются на более мелкие на основе алгоритмов кластеризации.

Сделано описание модели предметной области, на которую ориентирована система. В основе модели, описываемой предметной области, была положена семантическая сеть S:

S = <N, RN, D, RND >,(1)

гдеN = {N1, N2, …, NK} - множество элементов, отражающих понятия предметной области;

RN = RN ( Ni, Nj ) - отношение задающее тип и силу взаимодействия между понятиями.

D = {D1, D2, …, DL} - множество документов, относящихся к заданной предметной области;

RND = RND ( Ni, Dj ) - отношение сопоставляющее понятиям предметной области документы.

Третья глава посвящена исследованию системных связей и закономерностей функционирования процессов мониторинга и анализа распределенной проблемно-ориентированной информации в среде Интернет.

Мониторинг распределенной проблемно-ориентированной информации в сети Интернет осуществляется в разработанной системе формирования знаний на основе модели предметной области (основной частью которой является классифицирующая структура), которая формируется экспертом и выполняется путем взаимодействия системы с существующими в Сети системами информационного поиска (информационно-поисковые системы, каталоги, метапоисковые системы), а также самостоятельного исследования всего информационного пространства.

Для формализованного описания процесса мониторинга путем навигации в данных службах используется аппарат теории графов.

Служба WWW представлена в виде ориентированного графа W, состоящего из множества вершин (документов) D = {D1, D2, …, DM} и множества дуг (гиперссылок) LINKS:

.(2)

Служба FTP представима в виде леса N, состоящего из множества деревьев {Ni ¦ i = 1, …, L}:

N = {Ni ¦ i = 1, …, L}.(3)

Каждое из деревьев представляет отдельный FTP-ресурс. Узлами FTP-ресурса являются папки F = {F1, F2, …, FK} и файлы (документы)
D = {D1, D2, …, DM}.

Приведенные в работе методы, основанные на формализованных описаниях основных служб Интернета, потенциально позволяют достичь максимальной полноты охвата информационных ресурсов в сети Интернет соответствующих определенной предметной области. Однако на практике в WWW часто бывает сложно выявить замкнутые информационные массивы и найти в них начальные страницы, такие, что предоставляют возможность обойти все документы отдельного массива. В качестве таких начальных страниц могут выступать главные страницы крупных информационных ресурсов (в основном глобальных, региональных, локальных и специализированных каталогов). Универсального алгоритма поиска начальных страниц нет ввиду специфики организации Интернета. Источниками адресов этих страниц могут являться периодическая печать, СМИ, пользователи Интернета и др.

В данной главе подробно рассматривается метод мониторинга информационных ресурсов в системе формирования знаний - доступ к ним через существующие системы информационного поиска Интернета.

После осуществления доступа к информационному ресурсу с использованием любого из изложенных подходов модуль мониторинга выполняет проверку на предмет отсутствия сведений о нем в системе и, если данная проверка успешна, то выполняется еще одна проверка ресурса на предмет его соответствия заданной предметной области (наличие в нем ключевых слов запроса или их синонимов). Обе проверки могут быть выполнены модулем мониторинга автоматически, т.е. без привлечения человека. Если вторая проверка пройдена успешно - документ передается модулю индексирования для последующей обработки.

Обобщенно алгоритм работы модуля мониторинга может быть представлен схемой (рис. 4).

Процесс занесения документа Интернета в систему и формирование сведений о нем осуществляется алгоритмом изображенным на рис. 5

Самый главный этап процесса индексирования - вычисление веса слова. На значение веса слова влияют следующие факторы:

частота употребления слова в документе,

место употребления слова;

наличие у слова синонимов в тексте документа.

Значение веса слова в документе определяется по формуле:

(4)

гдеDm - текстовый документ (m = 1, …, M; M - количество текстовых документов);

Рис. 4. Алгоритм работы модуля мониторинга

t - слово документа Dm;

- количество вхождений слова t в документ Dm;

l - количество синонимов слова t используемых в документе Dm;

- количество вхождений синонима l слова t в документ Dm;

- переменная определяющая значимость слова t (j), находящегося в документе Dm на позиции i;

- вес слова t в документе Dm.

После завершения выполнения процессов индексирования и классификации может сложиться ситуация, при которой к одному объекту (термину) сети будет сопоставлена большая группа документов, анализ пользователем которой затруднен. В этом случае необходимо выполнить разделение данного объекта на более мелкие разделы, поддающиеся анализу.

Для решения описанной ситуации в системе имеется процесс автоматической кластеризации документов (рис. 6). Сделанное разбиение объектов с использованием данного модуля на части - подразделы в дальнейшем может быть скорректировано инженером по знаниям на основе данных полученных от эксперта.

Поиск и представление найденной, индексированной, классифицированной и кластеризованной информации пользователю выполняется по алгоритму рис. 7.

Рис. 5. Алгоритм индексирования

Ключевым этапом процесса поиска является вычисление меры релевантности документа запросу.

Эта мера показывает, на сколько слова входящие в запрос соответствуют содержимому документа. Она позволяет выявить какой из двух документов соответствует запросу больше. Значение меры сходства определяется по формуле:

(5)

гдеQ - сделанный системе запрос;

nq - количество слов в запросе Q;

qi - i-ое слово запроса (qi Q ; i = 1, … nq);

- поисковый образ текстового документа, соответствующего запросу Q (mr = 1, …, Mr; Mr - количество релевантных запросу текстовых документов в безе документов);

Рис. 6. Алгоритм кластеризации информации

- коэффициент значимости слова qi запроса Q. Значения этого коэффициента задаются пользователем при вводе запроса. Если коэффициент не задан, то он принимается равным 1;

- вес слова qi в документе . Значение веса слова в документе вычисляются по формуле (4) в процессе индексирования документа (см. выше);

- мера сходства запроса Q и документа .

Блок когнитивного представления базы знаний системы позволяет пользователю представить результат поиска в форме графического изображения. На основе правил данного блока семантическая сеть представляется в виде дерева, различным типам узлов которого сопоставлены информационные пиктограммы и названия. При выборе узла сети, в зависимости от его типа может быть выполнено одно из следующих действий:

если выбран узел-документ, то автоматически отображается перечень соответствующих ему ключевых слов, а также перечень соответствующих документов с целым рядом наборов атрибутов. При выборе документа он загружается в окно просмотра. Все атрибуты документа можно посмотреть в отдельном графическом окне и в случае необходимости внести соответствующие изменения;

Рис. 7. Алгоритм поиска и классификации информации

если выбран узел-документ-папка, то дополнительно к выше описанным действиям может быть выбран просмотр подузлов данного узла с теми же функциональными возможностями;

узлы-ссылки позволяют выполнить автоматический переход в другие участки семантической сети, которые логически сходны с данным участком;

узлы-паки служат только для логического объединения узлов-документов, узлов-документов-папок и узлов-ссылок.

Информация о документах Интернета в системе формирования знаний хранится в хранилище данных. Структурно разработанное хранилище данных по предметной области можно представить в виде куба с измерениями: охват, время и потребность.

В четвертой главе освещаются вопросы разработки программного комплекса автоматизирующего мониторинг и системный анализ распределенной проблемно-ориентированной информации в среде Интернет.

Требования к программному комплексу формируются с учетом разработанных математических моделей и общих принципов построения распределенных информационных систем.

Приводятся архитектура и функциональная схема программного комплекса (ПК ЛОЦМАН) (рис. 8), реализующего программную поддержку математических моделей и семантического моделирования. В разработанном программном комплексе предусмотрен доступ к хранилищу данных и базе знаний, а также интерфейс системы с пользователем.

Рис. 8. Функциональная схема программного комплекса Лоцман

При создании системы использовалась среда программирования Borland Delphi 7. В главе рассмотрены вопросы организации хранилища данных с использованием языка XML.

Излагается пользовательский интерфейс системы формирования знаний и схема поиска информации с использованием данной системы пользователем. В завершении главы приводится функциональная схема аппаратных средств, необходимых для функционирования разработанной системы. Анализируются возможные направления развития и пути применения программного комплекса.

В пятой главе освещаются вопросы, связанные с применением программного комплекса автоматизирующего мониторинг и системный анализ распределенной проблемно-ориентированной информации в среде Интернет. Рассматривается практическое применение разработанной системы при инновационной деятельности на предприятии, в образовательном процессе и медицине, а также при проведении мониторинга общественного мнения.

Описано применение разработанной системы формирования знаний при инновационной деятельности на предприятии. Управление инновационной деятельности на предприятии включает несколько взаимосвязанных блоков от маркетинга до производства новых изделий. На каждом из этапов требуется своя специфическая информация из сети Интернет. Система была апробирована при сборе информации о конкурентах предприятия. Разработанная система на основе построенной модели предметной области умеет самостоятельно выявлять новые предприятия на рынке, заносить их в различные классы сформированной модели и предоставлять полученную информацию специалистам в виде удобном для просмотра.

Система формирования знаний экономически эффективна. Заложенные в ней методы, позволяют в значительной степени автоматизировать процесс индексирования и поиска документов. Разработанная система универсальна в том смысле, что подходы, используемые в ней, не зависят от конкретной предметной области. Система может быть настроена на работу с информацией из широкого спектра различных предметных областей. Cистема была апробирована не только в промышленности, но и в медицине. Предложенный в данной работе подход позволяет реализовать эффективный доступ к проблемно-ориентированной информации из больших распределенных неструктурированных массивов информации, в том числе и из сети Интернет.

ОСНОВНЫЕ ВЫВОДЫ И РЕЗУЛЬТАТЫ РАБОТЫ

При решении задач, направленных на достижение цели диссертационного исследования, были достигнуты следующие основные научные результаты:

Проведен анализ существующих средств информационного поиска, систем управления знаниями, а также технологий и подходов к организации хранилищ данных. Методы, используемые для обработки информации Интернета, реализуют лишь часть реально необходимых в организациях функций по управлению информацией.

Разработан новый тип систем - системы формирования знаний представляющий собой комплекс, автоматизирующий мониторинг и системный анализ распределенной проблемно-ориентированной информации с целью формирования хранилищ данных. Данный тип систем направлен на повышение эффективности работы пользователей с информацией.

Предложена модель организации и структура хранилища данных в виде куба с измерениями: охват, время, потребность, что позволяет оптимальным образом структурировать данные по предметным областям.

Создан подход представления найденной информации конечному пользователю в удобном для восприятия и анализа виде на основе технологий семантических сетей и когнитивной графики, что значительно позволяет упорядочить информацию и ускорить процесс ее анализа.

Спроектирована функциональная схема программного комплекса, отображающая процесс взаимодействия компонентов системы, а также ряд алгоритмов, реализующих теорию, приведенную в рамках диссертационного

исследования.

Разработан программный комплекс, реализующий автоматизацию мониторинга и системного анализа распределенной проблемно-ориентированной информации в среде Интернет. Данный комплекс эффективно управляет неструктурированной информацией.

Более высокая скорость доступа к информационным ресурсам Сети с меньшими затратами при использовании разработанной системы позволяет повысить эффективность работы пользователей и сократить затраты на передачу данных за счет хранения информационных ресурсов Интернета на локальном компьютере.

Система созданная в рамках диссертационной работы инвариантна относительно предметных областей. Она использует единый механизм обработки и управления потоком информации для различных отраслей знания. Система была апробирована в промышленности и медицине.

ОСНОВНЫЕ ПОЛОЖЕНИЯ ДИССЕРТАЦИИ ОПУБЛИКОВАНЫ В СЛЕДУЮЩИХ РАБОТАХ

Аверченков В.И., Мирошников В.В., Рощин С.М. Автоматизация анализа распределенной информации в среде Интернет // Материалы междунар. конф. по телекоммуникациям «IEEE/ICC 2001» 13-15 июня 2001 г., - СПб.: СПбГЭТУ «ЛЭТИ», 2001. - С. 416-420.

Аверченков В.И., Мирошников В.В., Рощин С.М. Автоматизация мониторинга и системного анализа распределенной проблемно-ориентированной информации в среде Интернет // Машиностроение и техносфера на рубеже XXI века / Сборник трудов Международной научно-технической конференции в г. Севастополе 10-16 сентября 2001 г. В 3-х томах. - Донецк: ДонГТУ, 2001. Т.1. - С. 15-20.

Аверченков В.И., Мирошников В.В., Рощин С.М. Автоматизация мониторинга и анализа информации в среде образования // Менеджмент качества подготовки специалистов в техническом вузе: Матер. Всероссийск. науч.-метод. семин., 17-18 апреля 2001 г., г. Брянск / Под ред. В.И. Попкова. - Брянск: БГТУ, 2001. - с. 83-87.

Аверченков В.И., Мирошников В.В., Рощин С.М. Индексирование и поиск мультимедийных документов в Интернете // Научный сервис в сети Интернет: Труды Всероссийской научной конференции (24-29 сентября 2001г., г. Новороссийск). - М.: МГУ, 2001. - С. 124-126.

Аверченков В.И., Мирошников В.В., Рощин С.М. Интернет-технологии как инструментальная основа интеграции образования, науки и производства // Интеграция образования, науки и производства: Матер. V междунар. научн.-метод. конф. (26-29 2001 г.) / Под. ред. О.Ф. Гордеева. - Луцк: ЛДТУ, 2001. - С. 38-40.

Аверченков В.И., Мирошников В.В., Рощин С.М. Информационный поиск в сети Интернет: Учеб. пособие / Под общ. ред. В.И. Аверченкова. - Брянск: БГТУ, 2001. - 204 с.

Аверченков В.И., Мирошников В.В., Рощин С.М. Эффективное использование неструктурированной информации в процессе обучения // Новые информационные технологии в университетском образовании. Тезисы междунар. науч.-метод. конф., 6-8 июня 2001 г., - Новосибирск, 2001. - C. 205-206.

Аверченков В.И., Рощин С.М. Автоматизация мониторинга и системного анализа распределенной проблемно-ориентированной информации в среде Интернет // Труды Всероссийской научно-методической конференции «Телематика'2004» (7-10 июня 2004г.). - СПб.: Изд-во Регионального образовательного центра, 2004. - С. 220-221.

Аверченков В.И., Рощин С.М. Применение технологий информационного поиска в дистанционном обучении // Единое образовательное пространство славянских государств в XXI веке: проблемы и перспективы: Материалы Междунар. науч.-практ. конф. (2-4 апр. 2002 г., г.Брянск) / Под ред. В.И. Аверченкова. - Брянск: БГТУ; СГУ, 2002. - С. 374-378.

Аверченков В.И., Рощин С.М. Система формирования знаний // Материалы международной конференции. В 3-х т. Т.1./ ВолгГТУ. - Волгоград, 2004. - С. 10-15.

Аверченков В.И., Рощин С.М., Трифанков Ю.Т. Информационный поиск в Интернете: Учеб. пособие / Под общ. ред. В.И. Аверченкова. - Брянск: БГТУ, 2002. - 304 с.

Рощин С.М. Интернет для учителя-предметника // Брянская учительская газета № 42, 24.10.2003 г. - С. 12-13.

Рощин С.М. Проблемы информационного поиска в глобальной компьютерной сети Интернет и подход к их решению // Молодежная научно-техническая конференция вузов приграничных регионов славянских государств, 23 - 24 окт. 2001 г., г. Брянск: Материалы конф. / Под ред. О.А. Горленко. - Брянск: БГТУ, 2002. - С. 43-49.

Рощин С.М. Системный подход к исследованию методов индексирования информации / Практика системного анализа. - Кострома: 2002. - С. 15-20.

Утка В.Г., Рощин С.М. Методика поиска информационных ресурсов в сети Интернет // Брянский медицинский вестник № 5(10), ноябрь 2003 г. -

С. 85-90.

Размещено на Allbest.ru

...

Подобные документы

  • Общая характеристика ГСНТИ. Концепция создания распределенной информационно-аналитической системы (РИАС) ГСНТИ. Цели, структура и виды информационных ресурсов. Требования к аппаратно-программным средствам. Электронные Интернет-ресурсы РИАС ГСНТИ.

    презентация [555,8 K], добавлен 14.10.2013

  • Требования, предъявляемые к свойствам систем распределенной обработки информации. Логические слои прикладного программного обеспечения вычислительных систем. Механизмы реализации распределенной обработки информации. Технологии обмена сообщениями.

    курсовая работа [506,8 K], добавлен 03.03.2011

  • Понятие системы "Интернет", использование, размер сети, количество абонентов и пользователей. Поисковые системы, подход к сбору информации о ресурсах Интернет. Современные поисковые серверы. Работа с каталогами ресурсов, сохранение информации в Интернете.

    реферат [17,6 K], добавлен 02.12.2010

  • Основные этапы развития языков программирования. Характеристика машинно-ориентированной, проблемно-ориентированной и процедурно-ориентированной систем программирования. Ознакомление с системами программирования Delphi, Visual Basic и Visual C++.

    курсовая работа [102,4 K], добавлен 21.07.2012

  • Рост количества информации в мире, его увеличение в сети Интернет в геометрической прогрессии. Количество сайтов, зарегистрированных в поисковой системе Яндекс. Особенности эффективного поиска информации в сети Интернет. Схема информационных потоков.

    презентация [52,6 K], добавлен 27.08.2013

  • Особенности поиска информации в Интернет: стратегия и методика. Поисковые машины, каталоги и порталы информационных ресурсов. Подбор и введение ключевых слов. Использование режима "расширенный поиск", который имеет каждая из поисковых систем в Интернете.

    реферат [27,3 K], добавлен 06.08.2014

  • Понятие глобальной компьютерной сети "Интернет". Основы классификации ее информационных ресурсов. Виды информации, хранимой в Интернете и профессиональных базах. Вопросы эффективности и технологии поиска информации в Интернете и профессиональных базах.

    реферат [26,1 K], добавлен 22.06.2011

  • Понятие, развитие, формы организации Интернет. Сеть Интернет как информационный канал. Особенности средств массовой информации в глобальной сети, ее функции и возможности. Исследование электронных версий газет и информационных агентств в сети Интернет.

    курсовая работа [2,6 M], добавлен 09.04.2011

  • Технические и юридические аспекты использования интернет-технологий в государственном и муниципальном управлении. Особенности анализа эффективности работы интернет-ресурсов, разработка методики анализа сайтов, проведение мониторинга доступности.

    дипломная работа [964,8 K], добавлен 18.08.2013

  • Средства поиска информации в сети Интернет. Основные требования и методика поиска информации. Структура и характеристика поисковых сервисов. Глобальные поисковые машины WWW (World Wide Web). Планирование поиска и сбора информации в сети Интернет.

    реферат [32,2 K], добавлен 02.11.2010

  • Понятие и особенности образовательного интернет-ресурса, необходимость технического и концептуального подхода для их создания. Отсутствие системного подхода к размещению информационных ресурсов в сети Интернет, возможные пути решения этой проблемы.

    реферат [21,4 K], добавлен 20.02.2009

  • Интернет и его возможности. Распространенный и недорогой способ подключения к интернет. Схема передачи информации по протоколу TCP/IP. Характеристики адресов разного класса. Поисковые системы, способы поиска и скачивания информации в глобальной сети.

    курсовая работа [245,6 K], добавлен 25.09.2013

  • Сущность и принцип работы глобальной сети Интернет. Поиск информации по параметрам в системе Google. Специализированные системы поиска информации: "КтоТам", "Tagoo", "Truveo", "Kinopoisk", "Улов-Умов". Целесообразное использование поисковых систем.

    презентация [572,6 K], добавлен 16.02.2015

  • Теоретические основы Интернет-технологий и основных служб сети Интернет. Ознакомление с возможностями подключения к сети Интернет. Основные службы сети. Принципы поиска информации в WWW. Обзор современных Интернет браузеров. Программы для общения в сети.

    курсовая работа [385,2 K], добавлен 18.06.2010

  • Интернет - мощное глобальное средство обмена информацией. Классификация источников информации в Интернете. Электронная почта - один из видов информационных услуг, которые предоставляют компьютерные сети. Понятие и особенности телеконференции в Интернете.

    презентация [440,9 K], добавлен 18.04.2012

  • Задачи, решаемые малым предприятием с использованием Интернет-ресурсов. Способы и схемы подключения к сети Интернет. Организация доступа к информации и требования к технологии управления сетью. Расчет суммарных затрат на разработку программного продукта.

    дипломная работа [2,0 M], добавлен 17.10.2013

  • Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.

    реферат [17,2 K], добавлен 12.05.2010

  • Характеристики распределенной системы управления базой данных. Уровни представления информации в распределенной базе. Сравнительные характеристики стратегий хранения информации: централизованной, расчленения (фрагментации), дублирования, смешанной.

    курсовая работа [1,7 M], добавлен 16.05.2014

  • Общество и информация, определение информации и ее свойства, базовые информационные процессы. Виды и особенности экономической информации. Понятие, виды и этапы развития информационных компьютерных систем. Обзор информационных ресурсов Интернет.

    шпаргалка [645,8 K], добавлен 22.02.2011

  • Информационный ресурс - совокупность накопленной информации, зафиксированной на материальных носителях. Типы мировых информационных сетей. Классификация информационных ресурсов, браузеры-программы, язык разметки, система адресации в сети Интернет.

    курс лекций [427,8 K], добавлен 18.12.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.