Оценка эффективности канала передачи гипертекстовых данных с кэшированием

Особенность снижения доли повторно передающихся по каналу связей данных во время применения кэширования данных. Проведение исследования вероятности попадания запроса в кэш и коэффициент снижения требуемой пропускной способности канала передачи данных.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 25.08.2020
Размер файла 43,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Оценка эффективности канала передачи гипертекстовых данных с кэшированием

Комашинский В.В., Логинов И.В., Иванов И.В.

Современный этап развития информационно-коммуникационной сферы характеризуется наличием множества различных каналов передачи данных. Среди таких каналов можно выделить каналы передачи гипертекстовых данных (например, наиболее распространенным является канал передачи данных образованный по протоколу http). Такие каналы передачи данных характеризуются многократной повторной передачей данных при многократных запросах, что приводит к нецелесообразному использованию имеющейся пропускной способности канала передачи данных.

Применение кэширования данных позволяет снизить долю повторно передающихся по каналу связи данных. Указанное обстоятельство вызывает необходимость исследования эффективности каналов передачи данных с кэшированим с целью определения численных характеристик эффективности применения кэширования.

Основными характеристики эффективности кэширования при передачи данных являются вероятность попадания запроса в кэш и коэффициент снижения требуемой пропускной способности канала передачи данных.

Канал передачи данных без кэширования представляет собой двунаправленное движение запросов и ответов [1]. В одну сторону идут запросы на предоставление ресурсов, а в другую сторону-ответы на запрос с предоставлением запрошенных ресурсов.

Входной поток запросов представляет собой сумму потоков запросов от множества пользователей канала передачи данных: ,

где - количество пользователей. Поскольку общий поток запросов формируется из множества потоков, то общий поток является стационарным и распределенным по экспоненциальному запросу. Запрос представляет собой заявку на получение некоторых гипертекстовых данных с удаленного сервера. Предоставление этих данных является ответом сервера. Будем считать, что количество запросов равно количеству ответов:

.

Постановка задачи

Имеется канал передачи данных с кэшированием. Будем рассматривать однонаправленный канала передачи данных (в одну сторону идут только запросы, в другую только ответы). Количество различных гипертекстовых данных в сети Internet в общем случае велико (имеется не менее 100 млн. web-серверов средним размером не менее 1000 объектов). Однако для конкретного канала передачи данных количество разных обрабатываемых ответов не столь велико. В общем случае предположительное число таких ответов можно определить путем экспериментального сбора статистики (использование прокси-серверов) на канале передачи данных в течение достаточного периода времени (неделя, месяц). После сбора такой статистики можно получить следующие величины:

время проведения эксперимента примем равным для конкретного эксперимента;

количество различных ответов системы (запросов, что аналогично в нашем случае) равно ;

Общее количество запросов (ответов) равно ;

Общий размер принятых данных равен .

Требуется построить модель канала передачи и оценить его эффективность при изменяющихся входных данных. Модель канала передачи данных с кэшированием должна отражать влияние размера кэша данных на вероятность попадания ответа на запрос в кэш.

Модель канала передачи данных с кэшированим таких

Исходя из условий постановки задачи можно вычислить следующие характеристики:

средний размер ответа равен ;

значение потока задач составит ;

средняя использованная пропускная способность .

Предел уменьшения пропускной способности канала связи - является отличительной характеристикой канала передачи данных.

Запрос к конкретному ресурсу из множества ресурсов представляет собой случайную величину [2]. При этом размер множества ресурсов равен . Случайная величина распределена по нормальному закону, поскольку общий поток запросов объединяет множество потоков запросов от пользователей [3]. Каждый последующий запрос будем считать независимым от предыдущего вследствие наличия множества пользователей и большого размера множества ресурсов , то есть поток запросов будем рассматривать как поток с отсутствием последействия.

Количество пользователей канала передачи данных является ограниченным, однако оно достаточно, чтобы считать поступление заявки случайной величиной, распределенной по нормальному закону.

В канале передачи данных с кэшированием весь входной поток заявок делится на два: один поток заявок не выходит за пределы кэша данных, а второй выходит из него и поступает в канал передачи данных . Аналогично для ответов на запросы: .

Примем размер кэша данных, равный в байтах или в среднем количестве ответов.

Кэш данных заполняется следующим образом:

Ответ на новый запрос заноситься в кэш (в том случае, если он не заполнен). кэширование данный запрос

После заполнения кэша, данные из него по истечении некоторого срока старения информации удаляются (функция старения определяется экспериментально). Для условий передачи гипертекстовых данных лимит времени нахождения данных в кэше не должен превышать 24 часов. Для других типов данных он может составлять больший срок. Например: для передачи файлов возможно их кэширование на время до 1 месяца.

Вероятность того, что ответ на запрос пользователя находиться в кэше данных (вследствие предположения независимости запросов) составляет отношение среднего количества ответов, находящихся в кэше, к мощности множества ответов [3, 4]:

.

Приведем вероятность попадания в кэш к его размеру в байтах (2):

.

Вероятность того, что ответ на запрос не находится в кэше равен (3):

.

Требуемая пропускная способность канала передачи данных с использованием кэширования для передачи аналогичного потоков запросов и ответов составляет (4):

.

Рассмотрим размер уменьшения требуемой пропускной способности канала передачи данных в зависимости от предела уменьшения пропускной способности и размера кэша .

Для этого приведем формулу (2) к виду (5):

,

где - время нахождения данных в кэше, которое может принимать значения от 0 до 24 часов. Время проведения эксперимента примем равным недельному периоду сбору статистики и которое равно 192 часа. Предел уменьшения пропускной способности может изменяться в пределах от 1 до , однако в проведенных экспериментах значение не превышало 14, для целей эксперимента возьмем диапазон изменения от 1 до 30, что должно перекрыть возможные варианты каналов передачи гипертекстовых данных.

Рисунок 1 - График зависимости вероятности нахождения данных в кэше от его размера и предела снижения пропускной способности

Следует отметить, что максимальная вероятность попадания в кэш не может превышать следующую величину (6):

Рассмотрим зависимость размера кэша данных от величины пропускной способности канала связи при постоянной вероятности попадания в кэш. Приведем формулу (5) к виду (7):

.

Время эксперимента примем равным недельному периоду сбора статистики и равным 192 часам. Предел уменьшения пропускной способности может изменяться в пределах от 1 до 30, что должно перекрыть возможные варианты каналов передачи гипертекстовых данных. Вероятность попадания в кэш зададим на уровне , реальную пропускную канала передачи данных будем изменять в диапазоне от 100 кбит/с до 10 Гбит/с. Результаты вычислений приведены на рисунке 2.

Рисунок 2 - График зависимости размера кэша данных от величины пропускной способности канала

Результаты вычислений говорят о том, что при повышении пропускной способности канала передачи требования к размеру кэша растут прямо пропорционально. При больших потоках данных размер кэша должен достигать десятков гигабайт.

Методика определения эффективности применения кэширования данных

Методика предполагает определение снижения требований к каналу передачи данных через определения вероятности попадания в кэш [5];

- определение рабочих часов пользователей с наибольшей нагрузкой (например, если канал передачи данных проложен от организации, то такими часами будет установленное рабочее время);

- определение значений , , за время часов;

- расчет значений предела снижения пропускной способности ;

- установление предположительного времени нахождения в кэше в пределах часов в зависимости от требования к оперативности данных;

- определение значений вероятности и требуемой пропускной способности канала согласно формулам (2) и (3);

- построение графиков зависимости вероятности попадания в кэш от его абсолютного (в байтах) и относительного (в часах) размера согласно формуле (5).

Экспериментальные данные

Экспериментальное определение значений требуемой пропускной способности и вероятности попадания в кэш производились для трех различных каналов передачи гипертекстовых данных (КПД). В рамках проведенных экспериментов были получены следующие результаты, приведенные в таблице:

Таблица 1 - Значения пропускной способности и вероятности попадания в кэш для различных каналов передачи данных

показатели

КПД 1

КПД 2

КПД 3

208561

170889

3500232

1922297

1579221

26551984

48,66 ГБ

39,2 ГБ

573,22 ГБ

168 ч.

185 ч.

123 ч.

9,21

9,24

7,58

25,3 КБ

24,8 КБ

21,5 КБ

644 кбит/с

471 кбит/с

10330 кбит/с

Значения среднего размера сообщения , предел уменьшения пропускной способности , и средняя реальная скорость передачи данных были рассчитаны на основе экспериментальных данных, приведенных в таблице. Построим график вероятности попадания в кэш (наличия ответа на запрос в кэше данных) в зависимости от относительного (в часах) размера кэша (рисунок 3).

Рисунок 3 - График зависимости вероятности попадания в кэш в зависимости от его размера

Построим график вероятности попадания в кэш в зависимости от размера кэша данных (рисунок 4) согласно формуле (5).

В результате проведения расчетов были получены следующие данные:

- вероятность попадания запроса в кэш увеличивается при увеличении размера кэша;

- канал передачи данных 3 имеет наибольшую эффективность при передаче данных с использованием кэширования;

- требования к размеру кэша данных растут прямо пропорционально пропускной способности канала передачи данных.

Заключение

Экспериментальное применение разработанной модели и методик определения эффективности применения кэша осуществлялись для КПД 1. В качестве кэширующеего прокси-сервера использовался squid. Функция устаревания данных информации задавалась в виде константы, равной 4 часам. Размер кэша данных был задан размером 300 Мбайт. В результате обработки данных в течение 182 часов сокращение количества внешних запросов составило порядка 22 % по сравнению с эталонным, что хорошо согласуется с теоретическим значением, полученным в результате расчетов.

Рисунок 4 - График зависимости вероятности попадания в кэш от абсолютного размера кэша данных

Следовательно, возможно применение разработанной модели канала передачи гипертекстовых данных и методики оценки эффективности применения кэширования для определения целесообразности и эффективности использования кэширующего прокси-сервера в организациях имеющих доступ к сети Internet и провайдерами услуг.

Литература

1. Олифер, В.Г. Компьютерные сети. Принципы, технологии, протоколы [Текст] / В.Г. Олифер, Н. А. Олифер - СПб.: Издательство «Питер», 1999. - 672 с.: ил.

2. Шмейлин, Б.З. Повышение производительности микропроцессорных систем путем эффективного использования кэш. Системы и средства информатики [Текст]: / Б.З. Шмейлин, Е.Я. Попкова. Ежегодник/ Рос. акад. наук, Ин-т проблем информатики. -М. : Наука. -2006.-526 с. :ил. с. 496-510.

3. Вентцель, Е.С. Теория вероятности и ее инженерные приложения [Текст] / Е.С. Вентцель, Л.А. Овчаров - М.: Высшая школа, - 2000. - 480 с.

4. Деревенсков, С.О. Анализ эффективности алгоритмов Web-кэширования [Текст] / С.О. Деревенсков, А.А. Казаковский, В.Н. Скакунов, П.Е. Смирнов. Материалы VII всероссийской научно-методической конференции «Телемеханика 2000», с. 42-45, 2000 г.

5. Хотелева, А.Л. Исследование эффективности политик кэширования Web-объектов [Текст] / А.Л. Хотелева, В.С. Синепол Материалы межвузовской научно-технической конференции «Неделя науки СПбГПУ». Ч. VI: с. 37-39, 2005 г.

Размещено на Allbest.ru

...

Подобные документы

  • Беспроводные и проводные системы передачи данных. Методы обеспечения безошибочности передачи данных в сетях. Оценка зависимости показателей эффективности. Снижение вероятности появления ошибки сбора данных в соответствии с предъявленными требованиями.

    дипломная работа [309,0 K], добавлен 14.10.2014

  • Понятие и классификация систем передачи данных. Характеристика беспроводных систем передачи данных. Особенности проводных систем передачи данных: оптико-волоконных и волоконно-коаксиальных систем, витой пары, проводов. Оценка производителей аппаратуры.

    курсовая работа [993,0 K], добавлен 04.03.2010

  • Последовательный интерфейс для передачи данных. Синхронный и асинхронный режимы передачи данных. Формат асинхронной посылки. Постоянная активность канала связи при синхронном режиме передачи. Реализация последовательного интерфейса на физическом уровне.

    реферат [106,9 K], добавлен 28.04.2010

  • Особенности организации передачи данных в компьютерной сети. Эталонная модель взаимодействия открытых систем. Методы передачи данных на нижнем уровне, доступа к передающей среде. Анализ протоколов передачи данных нижнего уровня на примере стека TCP/IP.

    курсовая работа [1,0 M], добавлен 07.08.2011

  • Рассмотрение способов организации передачи данных между различными процессами, основанных на использовании дейтаграммных каналов Mailslot. Однонаправленный интерфейс взаимодействия между процессами. Создание и открытие канала, запись и чтение сообщений.

    контрольная работа [19,1 K], добавлен 10.10.2010

  • Краткая характеристика, главные преимущества и область применения MS Access. Базы данных и системы управления базами данных. Описание пошагового создания базы данных, таблиц, форм, запроса и отчета. Особенности и функциональные возможности MS Access.

    курсовая работа [3,4 M], добавлен 23.09.2010

  • Понятие и структура реляционной базы данных, ее основные элементы и их взаимодействие. Методика и основные этапы создания базы данных, ее назначение и сферы применения. Правила ввода данных в таблицы. Создание запроса к базе данных, отчетов и диаграмм.

    учебное пособие [3,6 M], добавлен 19.12.2009

  • Возможности системы управления базами данных Access. Структура простейшей базы данных: свойства ее полей, типы данных, безопасность и режим работы. Определение связей между таблицами в базе данных. Использование запроса на выборку, макроса и отчетов.

    курсовая работа [1,7 M], добавлен 05.12.2010

  • Выбор беспроводной технологии передачи данных. Механизмы управления качеством передачи потоков. Программное обеспечение приемной и передающей станции. Эксперименты, направленные на изучение неравномерности передаваемого потока данных при доступе к среде.

    дипломная работа [1,1 M], добавлен 18.05.2012

  • Анализ реляционных баз данных и способов манипулирования ими. Основные понятия баз данных, архитектура СУБД, модели данных. Модель сущность-связь, характеристика связей, классификация сущностей, структура первичных и внешних ключей, целостности данных.

    курсовая работа [166,6 K], добавлен 18.07.2012

  • Физическая модель базы данных. Структура таблиц, ключи и индексы. Установка связей между таблицами. Список книг с фамилиями авторов, работа над которыми идет в настоящее время. Книги, отредактированные определенным редактором. Проведение анализа данных.

    курсовая работа [1,2 M], добавлен 02.10.2014

  • Разработка протоколов передачи данных электросвязи для систем сотовой и кабельной связи по аналого-цифровым телефонным линиям связи. Одновременная передача данных и голоса, коррекция ошибок и сжатия; их возможности. История и прогноз на будущее.

    реферат [72,9 K], добавлен 06.04.2010

  • Создание таблиц базы данных с помощью MS Access "Страны Азии". Форма базы данных и запросы к выборкам данных. Модификация структуры таблиц, создания связей между главными таблицами, редактирование данных и проектирование форм для реальной базы данных.

    контрольная работа [723,9 K], добавлен 25.11.2012

  • Построение и анализ модели работы магистрали передачи данных. Формализация концептуальной модели, создание моделирующего алгоритма. Компьютерная программа, имитирующая передачу данных по двухканальной магистрали для получения статистических результатов.

    курсовая работа [294,0 K], добавлен 17.01.2015

  • Теоретические сведения и основные понятия баз данных. Системы управления базами данных: состав, структура, безопасность, режимы работы, объекты. Работа с базами данных в OpenOffice.Org BASE: создание таблиц, связей, запросов с помощью мастера запросов.

    курсовая работа [3,2 M], добавлен 28.04.2011

  • Структура многотабличных баз данных, создание и редактирование таблиц в MS Access, установка связей между таблицами, фильтрация и сортировка данных, создание БД "Месторождения нефти". Составление форм, запроса на выборку по разным полям и отчетов.

    лабораторная работа [531,5 K], добавлен 13.02.2012

  • Существующая телефонная сеть общего пользования. Расчет пропускной способности для предоставления услуг Triple Play. Расчет общей пропускной способности сети для передачи и приема данных. Выбор коммутатора абонентского доступа и оптического кабеля.

    дипломная работа [1,8 M], добавлен 19.01.2016

  • Изучение особенностей функционирования базы данных Excel. Организация ввода и просмотра данных, сортировка, фильтрация и консолидация данных в таблицах. Подведение итогов и сводная таблица. Организация базы данных в Access. Создание запроса и отчетов.

    курсовая работа [2,7 M], добавлен 04.10.2013

  • Технология построения сетей передачи данных. Правила алгоритма CSMA/CD для передающей станции. Анализ существующей сети передачи данных предприятия "Минские тепловые сети". Построение сети на основе технологии Fast Ethernet для административного здания.

    дипломная работа [2,5 M], добавлен 15.02.2013

  • Построение сети с расчетом передачи финансовых транзакций между всеми городами. Топология глобальной сети. Описание требований к сетевому оборудованию для узлов. Обоснование выбранных маршрутов. Расчет пропускной способности для каналов передачи данных.

    курсовая работа [1,4 M], добавлен 29.04.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.