О подходах к созданию карт науки
Создание карт науки на основе использования электронных информационных ресурсов, их достоинства и недостатки. Способ формирования входного массива. Подход к динамической структуризации сетевого информационного пространства на основе тематических структур.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 06.05.2018 |
Размер файла | 19,0 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
5
Размещено на http://www.allbest.ru/
Российский экономический университет им. Г.В. Плеханова
О подходах к созданию карт науки
Козлова И.В.,
доцент, кандидат технических наук
Аннотации
Рассматриваются современные подходы к созданию карт науки на основе использования электронных информационных ресурсов. Обсуждаются достоинства и недостатки этих подходов. Делается вывод о том, что методы построения карт науки не зависят от информации, используемой для формирования входного массива. Способ формирования входного массива определяется целями, стоящими перед создателями карт науки. Предлагается подход к динамической структуризации сетевого информационного пространства на основе тематических структур.
Ключевые слова: электронные информационные ресурсы, карта науки, семантический анализ, распознавание образов.
The modern approaches to maps of science creation through the use of electronic information resources are considered. The advantages and disadvantages of these approaches are discussed. The conclusion is that the science mapping methods are independent of the information used to generate the input array. A method of forming the input array is determined by the objectives facing the maps of science creators. The approach to information space structuring on thematic structures basis is offered.
Keywords: electronic information resources, maps of science, semantic analysis, pattern recognition.
Основное содержание исследования
Современные тематические информационные ресурсы составляют сотни тысяч различных документов. Хранящиеся в виде различных баз данных они широко используются как в различных организациях, так и в сети Интернет. Постоянное увеличение числа документов в информационных ресурсах требует динамических классификационных систем для работы широкого круга пользователей с различными информационными потребностями.
Одним из направлений создания такого рода классификационных систем в 60-х гг. ХХ века явилось построение детальных карт развития отдельных направлений науки. Первыми создателями карт науки были С. Прайc, Ю. Гарфилд и Г. Смолл на основании данных из SCI (Science Citation Index, ISI, USA).
Для классификации научных направлений использовался метод социтирования (co-citation method), в основе которого лежит принцип выделения взаимосвязи между двумя публикациями по их совместному цитированию в последующих работах. Этот метод явился аналитической техникой для изучения когнитивных структур науки.
Целью кластеризации, проводимой по объединенной базе данных естественных и социальных наук SCI/SSCI, было получение глобальных карт и атласов науки пяти уровней. От "макроуровня", отображающего карты областей исследования в естественных и социальных науках с последующей детализацией кластеров до второго уровня, где выделенные кластеры представляли собой активные исследовательские фронты. Первый уровень содержал кластеры "ядерных" публикаций в этих исследовательских направлениях.
Исследовательские фронты, являясь структурной единицей тематического строения науки, объединяются в научные специальности, затем в более крупные научные направления, которые в совокупности и представляют иерархическую когнитивную структуру современной науки.
Визуализация кластеров и взаимосвязей между ними осуществляется с использованием графов. В результате формируется междисциплинарная карта науки. Такие карты позволяют получить детальное представление о структуре науки и выявить новые актуальные направления исследований. Исследование в динамике карт науки дает возможность оценивать концептуальные изменения, которые происходят в науке как на микроуровнях развития, так и на макроуровне, где фиксируются изменения, происходящие в традиционных отраслях знания.
Дальнейшее развитие метод социтирования получил при анализе базы данных Web of Knowledge (Thomson Reuters), частью которой является Web of Science, и базы данных Scopus (Elsevier). В [4] представлены карты науки России, Германии и Китая в виде "колеса науки", составленные на основании публикаций этих стран в Scopus в 2007-2011 годах. Кружочки в "колесе науки" представляют собой статьи авторов организации в тех областях, где организация занимает лидирующее положение в мировой науке. Диаметр соответствует количеству публикаций, а положение - дисциплинарной области. При этом, чем ближе к центру колеса располагаются кружочки, тем более междисциплинарный характер имеет соответствующий кластер публикаций.
Необходимо отметить, что основным ограничением для оценки научной деятельности российских организаций с использованием возможностей Scopus или Web of Knowledge является то, что значительная часть научных результатов российских ученых публикуется в российских журналах, они не попадают в мировое научное сообщество и не цитируются зарубежными учеными. Проект по разработке информационно-аналитической системы "Карта российской науки" для сбора и предоставления информации об актуальных направлениях научной деятельности российских ученых все еще не готов к запуску в штатном режиме. Источником информации для построения карты науки являются российские и зарубежные патенты, научные публикации, индексируемые в базе данных Web of Science, а также входящие в РИНЦ - систему, еще очень далекую от совершенства. Scopus и Thomson Reuters полностью не охватывают специализированные научные области, которые развиты в России, поэтому планируется расширить перечень источников данных.
Вопросы создания систем динамической классификации информационных ресурсов Интернет рассматриваются в работе [2]. При этом авторы отмечают, что в настоящее время в мировой информационной сети Интернет происходят процессы самоорганизации и структурирования различных видов документальной информации, своя классификационная система в сети еще не сформирована. Поисковые сервера, основанные на дескрипторных языках, показали свою несостоятельность при значительном увеличении числа разнообразных документов в сети Интернет.
Интересным представляется альтернативный подход, в котором информационные ресурсы Интернет используются в качестве базы для построения карт науки на основе данных о навигации пользователей сетевых ресурсов. Данный подход лишен недостатков, присущих подходам, использующим социтирование: для формирования связей между статьями должно пройти время после их публикации. В результате навигации по научным журналам информация о результатах тематического поиска публикаций сохраняется и, соотносясь с тематикой опубликованных научных работ автора, становится базой для построения карты науки [5].
В статье [1] предложен подход к динамической структуризации сетевого информационного пространства на основе тематических структур (ТС), построенных на терминологических сетях информационного пространства документов. Терминологическая сеть представляется в виде графа G (T,t), вершины которого представляют собой множество T терминов индексирования информационного пространства, а ребра - отношения сходства t, существующие между терминами индексирования. Отношение сходства t между парой терминов определяется их совместной встречаемостью в одном и том же документе, исходя из анализа смысла термина: термины сходны по смыслу, если сходны их окружения.
В этом случае из терминологической сети выделяются подграфы, включающие максимально возможные подмножества пар терминов, последовательно по цепочке, присоединяемых к исходной паре терминов с использованием связи через посредника. Каждый такой подграф моделирует отдельное тематическое направление данной области исследований. Это позволяет рассматривать задачу выделения тематических направлений как задачу объединения терминов в классы в соответствии с некоторым критерием сходства и решать ее методами кластерного анализа.
Следующим этапом решения задачи построения ТС области исследований является структуризация терминов внутри выделенного направления. В работе сформулирована задача выявления и оценки семантических отношений между терминами индексирования информационного пространства документов. Предварительный анализ видов семантических отношений между терминами в поисковых образах документов (ПОД) дает основание предполагать:
существование устойчивых отношений между терминами ПОД;
проявление статистических закономерностей встречаемости различных видов отношений при увеличении объемов исследуемых документов информационного пространства.
Это позволяет наметить путь в решении поставленной задачи, состоящий из двух этапов:
1. определение основных видов (классов) семантических отношений и получение статистических характеристик их появления;
2. отнесение каждой пары терминов к заданному классу отношений с использованием статистических критериев и методов распознавания образов.
карта наука электронный информационный ресурс
В заключение следует отметить, что методы построения карт науки не зависят от того, какая информация (индексы цитирования, библиографические базы данных, ресурсы Интернет) используются для формирования входного массива. Способ формирования входного массива зависит от целей, которые стоят перед создателями карты науки. Без понимания семантических и статистических законов развития мирового информационного пространства, связанного с глобализацией информационных процессов в мире, разработка новых принципов построения классификационных систем представляется бесперспективной. Важность рассмотренных вопросов и необходимость их изучения в вузе подчеркивается в работе [3].
Литература
1. Васина Е.Н., Козлова И.В. Построение тематических структур предметных областей // Современные проблемы науки и образования. - 2013. - № 6; URL: http://www.science-education.ru/113-11782 (дата обращения: 21.01.2014).
2. Васина Е.Н., Козлова И.В. Проблема структуризации современных информационных ресурсов // Вестник Российского экономического университета им. Г.В. Плеханова, 2014. - № 04.
3. Коников А.И. Новые направления в преподавании дисциплины "Информатика" в экономических вузах // Вестник Российского экономического университета им. Г.В. Плеханова, 2013. - № 4 (58). С.42-46.
4. Москалева О. Научная доля России [Электронный ресурс]. - Режим доступа: http://www.gazeta.ru/science (дата обращения 14.01.2014).
5. Bollen J. Clickstream Data Yields High-Resolution Maps of Science / PLOS ONE [Электронный ресурс]. - Режим доступа: http://journals. plos.org/plosone/article (дата обращения03.2009).
Размещено на Allbest.ru
...Подобные документы
Создание и уровни реализации облачных вычислений. Достоинства и недостатки использования облачных технологий в организации единого информационного пространства. Оценка важности критериев методом "Попарного сравнения", "Тепловых карт", "Экспертных оценок".
дипломная работа [1,3 M], добавлен 08.04.2014Характеристика общих вопросов организации электронных ресурсов. Принципы взаимодействия Интернет-ресурсов и процесса формирования каталогов электронных изданий. Анализ концепции построения электронных библиотек и организации информационных ресурсов в них.
дипломная работа [111,4 K], добавлен 24.11.2012Факторы угрозы безопасности информационного пространства. Государственно-правовое обеспечение безопасности информационного пространства. Методы обеспечения безопасности информационного пространства. Развитие информационных технологий.
реферат [16,7 K], добавлен 10.05.2007Особенности создания цифровых топографических карт и планов. Используемые технические средства, программное обеспечение. Создание цифровых карт по материалам полевых измерений. Цифрование картографических изображений. Прикладные задачи картографии.
курсовая работа [5,3 M], добавлен 31.05.2014Генерирование на основе имеющихся карт Кавказа ландшафта на базе алгоритма Diamond-Square. Визуализация получившихся карт высот с помощью библиотек glut и glaux OpenGL. Суть алгоритма Diamond-Square, этапы его реализации. Скриншоты созданной программы.
курсовая работа [1,4 M], добавлен 27.05.2013Программные средства выполнения, обращения и хранения электронных документов на предприятии. Правовое и методическое обеспечение сохранности информационных ресурсов в организациях Республики Беларусь. Создание электронной регистрационной карточки.
реферат [25,4 K], добавлен 17.04.2015Создание элемента управления для отображения карт, представляющих собой векторные изображений в формате Encapsulated PostScript. Поддержка использования программных интерфейсов. Разработка элемента управления, вписывание изображения в область компонента.
дипломная работа [1,1 M], добавлен 11.11.2010Исследование проблем формирования и использования информационных ресурсов как совокупности сведений, получаемых в процессе практической деятельности людей. Состав и свойства информационных ресурсов. Государственная политика в сфере защиты информации.
реферат [23,7 K], добавлен 31.01.2011Создание программного продукта, который позволит сшивать и редактировать топографические карты. Разработка алгоритмов отдельных функций. Возможность автоматизированной сшивки карт путем анализа изображения, добавлять и удалять с них топографические знаки.
дипломная работа [3,5 M], добавлен 22.11.2015Функции формирования массива времени. Формирование массива входного напряжения, массива выходного напряжения. Функция вывода таблицы, расчета заданной точности, вывода титульного листа. Запись в файл массива времени. Блок–схема и текст программы.
курсовая работа [155,6 K], добавлен 22.04.2012Изучение корреляционных методов стереозрения для получения плотных карт глубины, особенности и главные ограничения их использования. Исследование характера влияния используемых размеров окна корреляции и диапазона допустимых стереодиспаратностей.
лабораторная работа [5,7 M], добавлен 20.05.2014Основные характеристики информационного пространства. Требования к составу и оценке качественных характеристик экономической информации. Определение степени взаимосвязи и меры организованности совокупности элементов информационного пространства.
практическая работа [207,5 K], добавлен 22.06.2010Определение основных требований к разрабатываемой системе учета работ по созданию электронных образовательных ресурсов, характеристика их основных видов. Структура базы данных, разработка пользовательского интерфейса, экономическая эффективность проекта.
дипломная работа [3,8 M], добавлен 06.03.2010Определение площади населенных пунктов, попавших на территорию Буинского района и не входящих в его состав. Выбор населенных пунктов. Создание колонки для населенных пунктов, показывающих процент населения в нём по отношению к общей численности района.
контрольная работа [3,4 M], добавлен 21.06.2015Средства организации блогов, разновидности CMS используемых для разработки и сопровождения блогов, их достоинства и недостатки. Общий алгоритм работы программного средства и алгоритмы работы с данными. Программное конструирование индивидуальных блогов.
дипломная работа [3,6 M], добавлен 10.07.2012Общие характеристики смарт-карт. Архитектура микросхемы: компоновка элементов микрокомпьютера смарт-карты, размещение процессора, памяти, периферийных модулей, блока ввода-вывода. Комплексный подход к обеспечению информационной безопасности смарт-карт.
курсовая работа [423,9 K], добавлен 26.11.2013Рассмотрение методических особенностей изучения курса "Macromedia Flash" и создание электронного учебника для изучения этого курса учащимися. Достоинства и недостатки, структура учебного пособия. Принципы подготовки к созданию электронных учебников.
дипломная работа [1,9 M], добавлен 23.04.2015Социальные последствия компьютеризации науки. Изучение и развитие теории информационных технологий и ресурсов, их роли в интеллектуализации общества на современном этапе. Обучение в учебных заведениях при помощи компьютерных заданий в сети Интернет.
контрольная работа [15,2 K], добавлен 01.03.2015История развития языков программирования; создание и распространение языка С++; новый подход к разработке объектно-ориентированного программного обеспечения. Применение моделирования предметных областей для структуризации их информационных отражений.
реферат [29,1 K], добавлен 06.12.2010Опис додаткового обладнання персонального комп'ютера, що дозволяє обробляти звук. Порівняння основних технічних характеристик звукових карт різних виробників. Аналіз особливостей вбудованих, мультимедійних, напівпрофесійних та професійних звукових карт.
курсовая работа [1,9 M], добавлен 08.01.2014