Информационно-лингвистические аспекты Интернет-исследований
Анализ рубрикации открытых Интернет-сервисов рейтинговой статистики. Изучение методики, позволяющей разработать модель, сводящую систему взаимосвязанных и соподчиненных заголовков издания нескольких ресурсов. Применение концепции на практическом примере.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 16.07.2018 |
Размер файла | 19,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Информационно-лингвистические аспекты интернет-исследований
Социологические науки
Поволжский государственный университет сервиса
СЕМАНТИЧЕСКОЕ ПОЛЕ ИНТЕРНЕТ РЕЙТИНГОВЫЕ СЕРВИСЫ РУБРИКАЦИЯ ИНТЕРНЕТ-РЕСУРСОВ ЛИНГВИСТИЧЕСКАЯ МОДЕЛЬ
Хрипунов Николай Владимирович
В статье рассмотрен вопрос рубрикации открытых Интернет-сервисов рейтинговой статистики. Показано, что для проведения Интернет-исследований с использованием нескольких сервисов необходимо согласовать их рубрикации. Предложена методика, позволяющая разработать модель, объединяющую рубрикации нескольких ресурсов. Показано применение предложенной методики на практическом примере.
Похожие материалы
· Методологические аспекты интернет-исследований
· Инструментарий интернет-исследований
· Влияние культуры на свободу личности
· Особенности порядка формирования муниципальных услуг
· Источники информационно-психологической безопасности личности, общества и государства
Проведение исследований с использованием открытых сервисов интернет-статистики сайтов обладает значительным потенциалом, особенно в части организации инициативных работ начинающих исследователей [1, 2]. По результатам анализа русскоязычного сегмента Интернета определена группа ресурсов, в наибольшей степени соответствующая исследовательскому применению с точки зрения репрезентативности выборки (количества сайтов) и организации работы с открытой интернет-статистикой сайтов [3]. Вместе с тем, особенно при кросс-ресурсной организации исследований, возникает необходимость корректного соотнесения рубрикаций различных сервисов интернет-статистики сайтов. Актуальность подобной постановки проблемы видна из сравнения параметров рубрикаций основных открытых сервисов интернет-статистики сайтов, которое представлено в таблице 1. Пять исследуемых ресурсов обозначены: 1 - Рейтинг Mail.Ru [4]; 2 - LiveInternet [5]; 3 - Openstat [6]; 4 - Рамблер.Топ100 [7]; 5 - Hotlog [8].
Таблица 1. Параметры рубрикации открытых сервисов интернет-статистики сайтов
Обозначение ресурса |
1 |
2 |
3 |
4 |
5 |
|
Количество уровней рубрикации |
2 |
1 |
1 |
2 |
1 |
|
Количество рубрик первого уровня |
19 |
47 |
38 |
28 |
148 |
Примеры рубрик приведены в таблице 2 - показаны по три рубрики из начала, середины и конца списков рубрик, отсортированных по алфавиту. Из приведенных данных можно заключить, что с одной стороны в информационно-лингвистическом смысле рассматриваемые рубрикации достаточно схожи, а с другой имеет место различный уровень детализации и различное наименование схожих по смыслу рубрик. Например, в начале каждого списка есть группа, посвящённая автомобильной тематике, но представление данной группы варьируется как по названию, так и по количеству задействованных рубрик.
Таблица 2. Рубрики открытых сервисов интернет-статистики сайтов
Ресурс |
Рубрики начала списка |
Рубрики середины списка |
Рубрики конца списка |
|
1 |
Авто/мото WAP сайты Вокруг света |
Интернет Карьера/работа Компьютеры |
Спорт Справки Юмор |
|
2 |
Hi-End MP3 Авто |
Музыка Наука и техника Недвижимость |
Фото Хостинг Юмор |
|
3 |
IT Авто Активный отдых |
Непознанное Образование Общество. Государство |
Увлечения. Хобби Услуги Финансы |
|
4 |
Авто и мото Бизнес Государство и общество |
Непознанное Новости и СМИ Образование |
Транспорт, перевозки Услуги Финансы |
|
5 |
PC и мобильные игры Авто СМИ и порталы Автосалоны и автодилеры |
Медицинское оборудование Мини-игры Мода |
Электронная коммерция Юмор Юридические услуги |
На основании изложенного, цель работы может быть сформулирована как разработка лингвистической модели, позволяющей эффективно работать с несколькими открытыми сервисами интернет-статистики сайтов.
В качестве методов достижения цели использован принцип агрегации - объединения близких по смыслу рубрик. Предлагаемая методика включает следующие действия: рубрикация интернет сервис рейтинговый
1. Сформировать списки рубрикации для парного сравнения. Положим, что Список 1 имеет меньше рубрик, чем Список 2.
2. На основании Списка 1 сформировать основной массив, включающий полностью совпадающие или близкие по смыслу рубрики сравниваемых списков.
3. Из рубрик сравниваемых списков, не вошедших в основной массив, сформировать массив остатков. Каждый элемент массива остатков содержит одну рубрику.
4. Дать наименование каждому элементу основного массива. Каждый элемент массива рассматривается как синонимическое семантическое поле [9], состоящее их рубрик. Процесс именования представляет трансформацию синонимического поля в гипонимическое, что выражается в формировании доминантной лексемы, которая обобщает смысл рубрик, составляющих элемент, и является наименованием элемента.
5. Исходя из наименований элементов основного массива провести действия п. 2. с целью распределить элементы массива остатков по основному массиву. Возможность такого распределения обеспечивается тем, что за счет гипонимичности наименования относительно рубрик, входящих в состав элемента основного массива, обеспечивается более широкий смысловой охват.
6. Рассмотреть возможность смыслового объединения и именования элементов массива остатков, не вошедших в именованный основной массив.
Рассмотрим применение предложенной методики объединения рубрикаций для ресурсов 1 (Рейтинг Mail.Ru) и 2 (LiveInternet). В ходе формирования основного массива в списке рубрик ресурса 1 объединены близкие по смыслу рубрики, например, «Интернет» и «WAP сайты» поскольку сайты, специализированные для просмотра с мобильных телефонов входят в Интернет. Основной массив, состоящий из 17 элементов, представлен в таблице 3. Массив остатков содержит рубрики ресурса 2, не вошедшие в основной массив: Реклама, Страхование, Товары и услуги, Недвижимость, Медицина, Безопасность, Города и регионы.
На этапе именования элементов основного массива в ряде случаев доминантные лексемы совпадают с рубриками, входящими в элемент, например, Работа, Компьютеры. В других случаях, например, элемент 4 Бизнес, введение обобщающего наименования позволяет ввести в элемент одну или несколько рубрик из массива остатков.
Таблица 3. Основной массив
№ |
ресурс 1 |
ресурс 2 |
№ |
ресурс 1 |
ресурс 2 |
|
1 |
Авто/мото |
Авто |
10 |
Культура/Искусство |
MP3 |
|
2 |
Вокруг света |
Путешествия |
Кино |
|||
3 |
Государство Российское |
Государство |
Культура и искусство |
|||
Общество |
Литература |
|||||
Политика |
Музыка |
|||||
Политические партии |
Фото |
|||||
4 |
Деловой мир |
Банки |
11 |
Наука/Техника/Образование |
Наука и техника |
|
Финансы |
Обучение |
|||||
5 |
Домашний очаг |
Дом и семья |
12 |
Непознанное |
Непознанное |
|
6 |
Интернет |
Интернет |
13 |
Отдых |
Генеалогия |
|
6 |
WAP сайты |
Связь |
13 |
Юмор |
Развлечения |
|
Хостинг |
Юмор |
|||||
Бесплатное |
14 |
Предприятия |
Бухгалтерия |
|||
Персональные страницы |
Предприятия |
|||||
7 |
Карьера/работа |
Работа |
Строительство |
|||
8 |
Компьютеры |
Hi-End |
15 |
СМИ |
Новости и СМИ |
|
Игры |
Телевидение |
|||||
Компьютеры |
16 |
Спорт |
Спорт |
|||
Софт |
17 |
Справки |
Справки |
|||
9 |
Для взрослых |
Знакомства и общение |
Погода |
В результате именования элементов основного массива и распределения массива остатков по именованным элементам не распределенной по основному массиву осталась рубрика Безопасность. Данная рубрика может быть отнесена к нескольким из элементов основного массива и вместе с тем несет собственную имманентную смысловую нагрузку, следовательно, целесообразно присоединить ее к основному массиву в виде отдельного элемента (таблица 4).
Таблица 4. Результаты наименования и распределения
№ элемента |
Наименование элемента |
Вновь вошедшие рубрики |
|
1 |
Транспортные средства |
||
2 |
Туризм и путешествия |
||
3 |
Государство/общество/регионы |
Города и регионы |
|
4 |
Бизнес |
Реклама |
|
Страхование |
|||
Товары и услуги |
|||
Недвижимость |
|||
5 |
Дом и семья |
||
6 |
Интернет и коммуникации |
||
7 |
Работа |
||
8 |
Компьютеры |
||
9 |
18+ |
||
10 |
Культура и искусство |
||
11 |
Наука/Техника/Образование |
||
12 |
Непознанное |
||
13 |
Досуг |
||
14 |
Предприятия |
||
15 |
Новости и СМИ |
||
16 |
Спорт и здоровье |
Медицина |
|
17 |
Справки |
||
18 |
Безопасность |
Полученная модель позволяет, опираясь на наименования элементов, оперировать рубриками двух рейтинговых ресурсов.
В целом по результатам работы получено:
1. Установлено, что открытые сервисы интернет-статистики содержат формально достаточно разнородную рубрикацию, которая затрудняет использование нескольких ресурсов при проведении Интернет-исследований.
2. Предложена методика, позволяющая разработать модель, объединяющую рубрикации нескольких ресурсов.
3. Показано применение предложенной методики на рубрикациях открытых сервисов интернет-статистики Рейтинг Mail.Ru и LiveInternet.
Список литературы
1. Хрипунов Н.В. Применение универсальных информационных технологий в практике решения экономических задач // Научный альманах. 2015. №12(14) - 1. С. 382-385.
Размещено на Allbest.ru
...Подобные документы
Технические и юридические аспекты использования интернет-технологий в государственном и муниципальном управлении. Особенности анализа эффективности работы интернет-ресурсов, разработка методики анализа сайтов, проведение мониторинга доступности.
дипломная работа [964,8 K], добавлен 18.08.2013Интернет-портал как средство доступа к электронным ресурсам. Системное многоуровневое объединение различных ресурсов и сервисов. Интернет-порталы в сфере государственного управления, образования и культуры. Электронные библиотеки интернет-порталов.
презентация [34,2 M], добавлен 14.10.2013Возникновение и развитие World Wide Web и глобальной сети Интернет. Интернет-браузеры и программы обмена сообщениями. Направление интернет-технологий в образовательном процессе. Применение Интернет-ресурсов в процессе изучения учебных дисциплин.
дипломная работа [346,2 K], добавлен 22.02.2013Рассмотрение понятия сетевых технологий как совокупности программных, аппаратных и организационных средств; принципы их организации и функционирования. Маршрутизация и доменная система имен в Интернет. Характеристика популярных сервисов Интернет.
презентация [198,8 K], добавлен 15.07.2014Интернет как глобальная информационная система, особенности развития в России и Украине. Комплексное применение сервисов передачи информации. Анализ принципов электронной коммерции. Способы создания таблиц. Динамические стили как одно из оснований DHTML.
лекция [264,6 K], добавлен 19.12.2012PKI как инфраструктура открытых ключей. История разработки асимметричных шифров. Процесс работы с сертификатами, виды архитектур. Реализация сертификации адресных интернет-ресурсов региональными интернет регистратурами. Центр сертификации ключей.
курсовая работа [220,6 K], добавлен 01.07.2015Примеры применения интернет-сервисов для реализации функций управления. Торговые интернет-площадки: понятие и виды. Выгоды и риски продавцов и покупателей. Возможности и виды шифрования информации. Изучение инструментов поисковой системы Google.
контрольная работа [3,3 M], добавлен 04.06.2015Изучение типов подключения (постоянное по выделенной линии, сеансное телефонное Dial-up), доступа к информации, видов сервисов (интерактивные, прямые, отложенного чтения) и поисковых систем (Lycos, AltaVista, Yahoo, OpenText, WAIS) в сети Интернет.
контрольная работа [20,2 K], добавлен 26.01.2010Развитие русскоязычного Интернета: гендерные и возрастные аспекты. Социально-психологические аспекты общения пользователей Интернет. Причины обращения к Интернету. Критерии Интернет-зависимости. Мотивация пользователей Интернет.
научная работа [21,8 K], добавлен 14.05.2007Обзор существующих технологий создания информационно-справочных ресурсов в Интернете. Языки программирования для создания Интернет-ресурсов. Разработка и тестирование информационно-справочного ресурса развлекательного комплекса. Расчет текущих затрат.
дипломная работа [8,6 M], добавлен 07.07.2012Критерии и аспекты создания web-сайтов. Правовые акты, регулирующие применение интернет-технологий в государственном и муниципальном управлении. Оценивание сайта ОГБУ Центр социальной поддержки населения Советского района Томска, оптимизация его работы.
дипломная работа [1,0 M], добавлен 24.06.2013Современные подходы к дистанционному образованию. Применение новых образовательных технологий. Анализ подходов к созданию обучающих интернет-ресурсов и выбор среды разработки. Эффективность создания интернет-ресурса с использованием cms-системы ucoz.
дипломная работа [317,4 K], добавлен 26.11.2010Анализ распространения интернет-пользователей в регионах России. Статистика использования web-ресурсов. Развитие информационно-коммуникативных технологий передачи данных 4G. Особенности применения сетей мобильного интернета по стандарту LTE-1800.
реферат [4,2 M], добавлен 29.10.2014Характеристика методов поиска информации в Интернете, а именно - с использованием гипертекстовых ссылок, поисковых машин и специальных средств. Анализ новых интернет ресурсов. История возникновения и описание западных и русскоязычных поисковых систем.
реферат [17,2 K], добавлен 12.05.2010Теоретико-методологические основы формирования электронного муниципалитета. Электронное государство как основа формирования Интернет-ресурсов в муниципальном управлении. Мероприятия по оптимизации Интернет-ресурсов в Нижнекамском муниципальном районе.
дипломная работа [200,1 K], добавлен 26.02.2015Текущий уровень развития Интернет-ресурсов органов по делам молодежи в субъектах РФ. Классификация Интернет-сайтов органов по делам молодёжи. Особенности восприятия студенческой молодёжью Интернет-ресурса органа по делам молодежи Новосибирской области.
контрольная работа [5,5 M], добавлен 07.06.2009История появления и развития сети Интернет, особенности ее гуманитарной и технической стороны. Применение системы World Wide Web - "Всемирная паутина". Ключевые аспекты WWW-технологии, специфика ее использования для создания образовательных ресурсов.
реферат [19,3 K], добавлен 26.03.2011Особенности программных средств (браузеров) для просмотра web-страниц и для работы с электронной почтой (почтовые клиенты). Этапы и методы разработки Интернет-сайта. Средства поиска информации в Интернет. Сравнительная характеристика поисковых сайтов.
курсовая работа [617,9 K], добавлен 19.06.2010Построение модели деятельности организации в IDEF0. Описание средств размещения данных в Интернет (форум, e-mail, web-site, хостинг). Выбор инструментальной среды разработки, логическое проектирование, установка и тестирование информационной системы.
дипломная работа [1,9 M], добавлен 13.01.2014Интернет как мир широких возможностей. Основные угрозы безопасности компьютера. Примеры вирусов. Типы интернет-зависимости. Примеры платежного мошенничества. Выманивание sms-пароля. "Официальные" письма платежных сервисов. Фальшивые сайты авиабилетов.
презентация [16,7 M], добавлен 04.02.2017