Информационно-лингвистические аспекты Интернет-исследований

Анализ рубрикации открытых Интернет-сервисов рейтинговой статистики. Изучение методики, позволяющей разработать модель, сводящую систему взаимосвязанных и соподчиненных заголовков издания нескольких ресурсов. Применение концепции на практическом примере.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 16.07.2018
Размер файла 19,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Информационно-лингвистические аспекты интернет-исследований

Социологические науки

Поволжский государственный университет сервиса

СЕМАНТИЧЕСКОЕ ПОЛЕ ИНТЕРНЕТ РЕЙТИНГОВЫЕ СЕРВИСЫ РУБРИКАЦИЯ ИНТЕРНЕТ-РЕСУРСОВ ЛИНГВИСТИЧЕСКАЯ МОДЕЛЬ

Хрипунов Николай Владимирович

В статье рассмотрен вопрос рубрикации открытых Интернет-сервисов рейтинговой статистики. Показано, что для проведения Интернет-исследований с использованием нескольких сервисов необходимо согласовать их рубрикации. Предложена методика, позволяющая разработать модель, объединяющую рубрикации нескольких ресурсов. Показано применение предложенной методики на практическом примере.

Похожие материалы

· Методологические аспекты интернет-исследований

· Инструментарий интернет-исследований

· Влияние культуры на свободу личности

· Особенности порядка формирования муниципальных услуг

· Источники информационно-психологической безопасности личности, общества и государства

Проведение исследований с использованием открытых сервисов интернет-статистики сайтов обладает значительным потенциалом, особенно в части организации инициативных работ начинающих исследователей [1, 2]. По результатам анализа русскоязычного сегмента Интернета определена группа ресурсов, в наибольшей степени соответствующая исследовательскому применению с точки зрения репрезентативности выборки (количества сайтов) и организации работы с открытой интернет-статистикой сайтов [3]. Вместе с тем, особенно при кросс-ресурсной организации исследований, возникает необходимость корректного соотнесения рубрикаций различных сервисов интернет-статистики сайтов. Актуальность подобной постановки проблемы видна из сравнения параметров рубрикаций основных открытых сервисов интернет-статистики сайтов, которое представлено в таблице 1. Пять исследуемых ресурсов обозначены: 1 - Рейтинг Mail.Ru [4]; 2 - LiveInternet [5]; 3 - Openstat [6]; 4 - Рамблер.Топ100 [7]; 5 - Hotlog [8].

Таблица 1. Параметры рубрикации открытых сервисов интернет-статистики сайтов

Обозначение ресурса

1

2

3

4

5

Количество уровней рубрикации

2

1

1

2

1

Количество рубрик первого уровня

19

47

38

28

148

Примеры рубрик приведены в таблице 2 - показаны по три рубрики из начала, середины и конца списков рубрик, отсортированных по алфавиту. Из приведенных данных можно заключить, что с одной стороны в информационно-лингвистическом смысле рассматриваемые рубрикации достаточно схожи, а с другой имеет место различный уровень детализации и различное наименование схожих по смыслу рубрик. Например, в начале каждого списка есть группа, посвящённая автомобильной тематике, но представление данной группы варьируется как по названию, так и по количеству задействованных рубрик.

Таблица 2. Рубрики открытых сервисов интернет-статистики сайтов

Ресурс

Рубрики начала списка

Рубрики середины списка

Рубрики конца списка

1

Авто/мото

WAP сайты

Вокруг света

Интернет

Карьера/работа

Компьютеры

Спорт

Справки

Юмор

2

Hi-End

MP3

Авто

Музыка

Наука и техника

Недвижимость

Фото

Хостинг

Юмор

3

IT

Авто

Активный отдых

Непознанное

Образование

Общество. Государство

Увлечения. Хобби

Услуги

Финансы

4

Авто и мото

Бизнес

Государство и общество

Непознанное

Новости и СМИ

Образование

Транспорт, перевозки

Услуги

Финансы

5

PC и мобильные игры

Авто СМИ и порталы

Автосалоны и автодилеры

Медицинское оборудование

Мини-игры

Мода

Электронная коммерция

Юмор

Юридические услуги

На основании изложенного, цель работы может быть сформулирована как разработка лингвистической модели, позволяющей эффективно работать с несколькими открытыми сервисами интернет-статистики сайтов.

В качестве методов достижения цели использован принцип агрегации - объединения близких по смыслу рубрик. Предлагаемая методика включает следующие действия: рубрикация интернет сервис рейтинговый

1. Сформировать списки рубрикации для парного сравнения. Положим, что Список 1 имеет меньше рубрик, чем Список 2.

2. На основании Списка 1 сформировать основной массив, включающий полностью совпадающие или близкие по смыслу рубрики сравниваемых списков.

3. Из рубрик сравниваемых списков, не вошедших в основной массив, сформировать массив остатков. Каждый элемент массива остатков содержит одну рубрику.

4. Дать наименование каждому элементу основного массива. Каждый элемент массива рассматривается как синонимическое семантическое поле [9], состоящее их рубрик. Процесс именования представляет трансформацию синонимического поля в гипонимическое, что выражается в формировании доминантной лексемы, которая обобщает смысл рубрик, составляющих элемент, и является наименованием элемента.

5. Исходя из наименований элементов основного массива провести действия п. 2. с целью распределить элементы массива остатков по основному массиву. Возможность такого распределения обеспечивается тем, что за счет гипонимичности наименования относительно рубрик, входящих в состав элемента основного массива, обеспечивается более широкий смысловой охват.

6. Рассмотреть возможность смыслового объединения и именования элементов массива остатков, не вошедших в именованный основной массив.

Рассмотрим применение предложенной методики объединения рубрикаций для ресурсов 1 (Рейтинг Mail.Ru) и 2 (LiveInternet). В ходе формирования основного массива в списке рубрик ресурса 1 объединены близкие по смыслу рубрики, например, «Интернет» и «WAP сайты» поскольку сайты, специализированные для просмотра с мобильных телефонов входят в Интернет. Основной массив, состоящий из 17 элементов, представлен в таблице 3. Массив остатков содержит рубрики ресурса 2, не вошедшие в основной массив: Реклама, Страхование, Товары и услуги, Недвижимость, Медицина, Безопасность, Города и регионы.

На этапе именования элементов основного массива в ряде случаев доминантные лексемы совпадают с рубриками, входящими в элемент, например, Работа, Компьютеры. В других случаях, например, элемент 4 Бизнес, введение обобщающего наименования позволяет ввести в элемент одну или несколько рубрик из массива остатков.

Таблица 3. Основной массив

ресурс 1

ресурс 2

ресурс 1

ресурс 2

1

Авто/мото

Авто

10

Культура/Искусство

MP3

2

Вокруг света

Путешествия

Кино

3

Государство Российское

Государство

Культура и искусство

Общество

Литература

Политика

Музыка

Политические партии

Фото

4

Деловой мир

Банки

11

Наука/Техника/Образование

Наука и техника

Финансы

Обучение

5

Домашний очаг

Дом и семья

12

Непознанное

Непознанное

6

Интернет

Интернет

13

Отдых

Генеалогия

6

WAP сайты

Связь

13

Юмор

Развлечения

Хостинг

Юмор

Бесплатное

14

Предприятия

Бухгалтерия

Персональные страницы

Предприятия

7

Карьера/работа

Работа

Строительство

8

Компьютеры

Hi-End

15

СМИ

Новости и СМИ

Игры

Телевидение

Компьютеры

16

Спорт

Спорт

Софт

17

Справки

Справки

9

Для взрослых

Знакомства и общение

Погода

В результате именования элементов основного массива и распределения массива остатков по именованным элементам не распределенной по основному массиву осталась рубрика Безопасность. Данная рубрика может быть отнесена к нескольким из элементов основного массива и вместе с тем несет собственную имманентную смысловую нагрузку, следовательно, целесообразно присоединить ее к основному массиву в виде отдельного элемента (таблица 4).

Таблица 4. Результаты наименования и распределения

№ элемента

Наименование элемента

Вновь вошедшие рубрики

1

Транспортные средства

2

Туризм и путешествия

3

Государство/общество/регионы

Города и регионы

4

Бизнес

Реклама

Страхование

Товары и услуги

Недвижимость

5

Дом и семья

6

Интернет и коммуникации

7

Работа

8

Компьютеры

9

18+

10

Культура и искусство

11

Наука/Техника/Образование

12

Непознанное

13

Досуг

14

Предприятия

15

Новости и СМИ

16

Спорт и здоровье

Медицина

17

Справки

18

Безопасность

Полученная модель позволяет, опираясь на наименования элементов, оперировать рубриками двух рейтинговых ресурсов.

В целом по результатам работы получено:

1. Установлено, что открытые сервисы интернет-статистики содержат формально достаточно разнородную рубрикацию, которая затрудняет использование нескольких ресурсов при проведении Интернет-исследований.

2. Предложена методика, позволяющая разработать модель, объединяющую рубрикации нескольких ресурсов.

3. Показано применение предложенной методики на рубрикациях открытых сервисов интернет-статистики Рейтинг Mail.Ru и LiveInternet.

Список литературы

1. Хрипунов Н.В. Применение универсальных информационных технологий в практике решения экономических задач // Научный альманах. 2015. №12(14) - 1. С. 382-385.

Размещено на Allbest.ru

...

Подобные документы

  • Технические и юридические аспекты использования интернет-технологий в государственном и муниципальном управлении. Особенности анализа эффективности работы интернет-ресурсов, разработка методики анализа сайтов, проведение мониторинга доступности.

    дипломная работа [964,8 K], добавлен 18.08.2013

  • Интернет-портал как средство доступа к электронным ресурсам. Системное многоуровневое объединение различных ресурсов и сервисов. Интернет-порталы в сфере государственного управления, образования и культуры. Электронные библиотеки интернет-порталов.

    презентация [34,2 M], добавлен 14.10.2013

  • Возникновение и развитие World Wide Web и глобальной сети Интернет. Интернет-браузеры и программы обмена сообщениями. Направление интернет-технологий в образовательном процессе. Применение Интернет-ресурсов в процессе изучения учебных дисциплин.

    дипломная работа [346,2 K], добавлен 22.02.2013

  • Рассмотрение понятия сетевых технологий как совокупности программных, аппаратных и организационных средств; принципы их организации и функционирования. Маршрутизация и доменная система имен в Интернет. Характеристика популярных сервисов Интернет.

    презентация [198,8 K], добавлен 15.07.2014

  • Интернет как глобальная информационная система, особенности развития в России и Украине. Комплексное применение сервисов передачи информации. Анализ принципов электронной коммерции. Способы создания таблиц. Динамические стили как одно из оснований DHTML.

    лекция [264,6 K], добавлен 19.12.2012

  • PKI как инфраструктура открытых ключей. История разработки асимметричных шифров. Процесс работы с сертификатами, виды архитектур. Реализация сертификации адресных интернет-ресурсов региональными интернет регистратурами. Центр сертификации ключей.

    курсовая работа [220,6 K], добавлен 01.07.2015

  • Примеры применения интернет-сервисов для реализации функций управления. Торговые интернет-площадки: понятие и виды. Выгоды и риски продавцов и покупателей. Возможности и виды шифрования информации. Изучение инструментов поисковой системы Google.

    контрольная работа [3,3 M], добавлен 04.06.2015

  • Изучение типов подключения (постоянное по выделенной линии, сеансное телефонное Dial-up), доступа к информации, видов сервисов (интерактивные, прямые, отложенного чтения) и поисковых систем (Lycos, AltaVista, Yahoo, OpenText, WAIS) в сети Интернет.

    контрольная работа [20,2 K], добавлен 26.01.2010

  • Развитие русскоязычного Интернета: гендерные и возрастные аспекты. Социально-психологические аспекты общения пользователей Интернет. Причины обращения к Интернету. Критерии Интернет-зависимости. Мотивация пользователей Интернет.

    научная работа [21,8 K], добавлен 14.05.2007

  • Обзор существующих технологий создания информационно-справочных ресурсов в Интернете. Языки программирования для создания Интернет-ресурсов. Разработка и тестирование информационно-справочного ресурса развлекательного комплекса. Расчет текущих затрат.

    дипломная работа [8,6 M], добавлен 07.07.2012

  • Критерии и аспекты создания web-сайтов. Правовые акты, регулирующие применение интернет-технологий в государственном и муниципальном управлении. Оценивание сайта ОГБУ Центр социальной поддержки населения Советского района Томска, оптимизация его работы.

    дипломная работа [1,0 M], добавлен 24.06.2013

  • Современные подходы к дистанционному образованию. Применение новых образовательных технологий. Анализ подходов к созданию обучающих интернет-ресурсов и выбор среды разработки. Эффективность создания интернет-ресурса с использованием cms-системы ucoz.

    дипломная работа [317,4 K], добавлен 26.11.2010

  • Анализ распространения интернет-пользователей в регионах России. Статистика использования web-ресурсов. Развитие информационно-коммуникативных технологий передачи данных 4G. Особенности применения сетей мобильного интернета по стандарту LTE-1800.

    реферат [4,2 M], добавлен 29.10.2014

  • Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.

    реферат [17,2 K], добавлен 12.05.2010

  • Теоретико-методологические основы формирования электронного муниципалитета. Электронное государство как основа формирования Интернет-ресурсов в муниципальном управлении. Мероприятия по оптимизации Интернет-ресурсов в Нижнекамском муниципальном районе.

    дипломная работа [200,1 K], добавлен 26.02.2015

  • Текущий уровень развития Интернет-ресурсов органов по делам молодежи в субъектах РФ. Классификация Интернет-сайтов органов по делам молодёжи. Особенности восприятия студенческой молодёжью Интернет-ресурса органа по делам молодежи Новосибирской области.

    контрольная работа [5,5 M], добавлен 07.06.2009

  • История появления и развития сети Интернет, особенности ее гуманитарной и технической стороны. Применение системы World Wide Web - "Всемирная паутина". Ключевые аспекты WWW-технологии, специфика ее использования для создания образовательных ресурсов.

    реферат [19,3 K], добавлен 26.03.2011

  • Особенности программных средств (браузеров) для просмотра web-страниц и для работы с электронной почтой (почтовые клиенты). Этапы и методы разработки Интернет-сайта. Средства поиска информации в Интернет. Сравнительная характеристика поисковых сайтов.

    курсовая работа [617,9 K], добавлен 19.06.2010

  • Построение модели деятельности организации в IDEF0. Описание средств размещения данных в Интернет (форум, e-mail, web-site, хостинг). Выбор инструментальной среды разработки, логическое проектирование, установка и тестирование информационной системы.

    дипломная работа [1,9 M], добавлен 13.01.2014

  • Интернет как мир широких возможностей. Основные угрозы безопасности компьютера. Примеры вирусов. Типы интернет-зависимости. Примеры платежного мошенничества. Выманивание sms-пароля. "Официальные" письма платежных сервисов. Фальшивые сайты авиабилетов.

    презентация [16,7 M], добавлен 04.02.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.