Исследование подсистемы памяти мультипроцессоров с буферным устройством и общей очередью на основе открытых сетей массового обслуживания
Математические модели подсистем памяти многопроцессорных систем с устройством с единой очередью. Анализ влияния числа процессорных узлов на реальную пропускную способность подсистемы "процессор-память" с архитектурой памяти UMA с буферным устройством.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 11.04.2016 |
Размер файла | 165,7 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ИССЛЕДОВАНИЕ ПОДСИСТЕМЫ ПАМЯТИ МУЛЬТИПРОЦЕССОРОВ С БУФЕРНЫМ УСТРОЙСТВОМ И ОБЩЕЙ ОЧЕРЕДЬЮ НА ОСНОВЕ ОТКРЫТЫХ СЕТЕЙ МАССОВОГО ОБСЛУЖИВАНИЯ
В многопроцессорных системах очень широко применяется память с архитектурой UMA [6; 10; 13], но её использование ограничивает наращиваемость процессорных узлов из-за возникновения конфликтных простоев запрашивающих процессоров, что в большой степени снижает производительность вычислительной системы. Известно, что память по сравнению с процессором, работает медленнее из-за возникающих временных задержек, приходящихся на процессы физической записи и физического чтения данных. Проблема решается применением памяти типа NUMA, чем обеспечивается приемлемая масштабируемость, но требует значительных дополнительных аппаратных затрат в процессорных узлах. Альтернативным решением является использование памяти UMA, разделенной на множество независимых блоков, однако её применение ограничивается пропускной способностью межпроцессорной шины [9; 11].
Известно, что межпроцессорная шина менее производительная, чем локальная. Она выступает посредником между процессорами и памятью. При непрерывном выполнении операции (транзакции) записи или чтения памяти шиной монопольно владеет один из процессоров системы до тех пор, пока операция не будет завершена [3]. Таким образом, шина и процессоры находятся в режиме ожидания до тех пор, пока память не произведет физическую процедуру чтения или записи. В результате теряются циклы шины, которые могли быть использованы другими процессорами. Кроме того, при доступе к шине множества процессоров, необходимо производить процедуру арбитража. Эти обстоятельства снижают реальную пропускную способность межпроцессорной шины и вносят дополнительные задержки в вычислительные процессы [4; 5]. Для уменьшения временных потерь и повышения пропускной способности шины необходимо, чтобы она поддерживала режимы расщепления транзакций чтения и буферизации транзакций записи [2; 8].
Блок памяти является «интеллектуальным устройством» [12] и должен быть снабжен двумя буферами для хранения транзакций чтения и записи. В свою очередь буфер чтения имеет две части. Первая содержит регистры для хранения адреса ячейки памяти, в которую производится обращение, вторая - регистры для хранения выбранных из памяти данных. Буфер записи также состоит из двух частей. В первой хранятся адреса ячейки памяти, в которую производится обращение, во второй хранятся записываемые данные. Структурная схема многопроцессорной системы с буферным устройством (контроллером памяти) при выполнении запросов процессоров в память показана на рис. 1.
Рисунок 1. Структура многопроцессорной системы с буферным устройством памяти
Интенсивность потока заявок на входе сети определяется суммарным потоком заявок процессоров li= ai + транзакции, обеспечивающие кэш-когерентность. Заявка, поступившая в СМО Si и заставшая его занятым, становится в очередь, причем. Заявка, обслуженная в СМО Si, с вероятностью pij поступает на обслуживание в одну из СМО Sj (j=2,…,m+1). Получив полное обслуживание, заявка покидает сеть с вероятностью pi0.
Структура модели МПС с архитектурой UMA с буфером и её граф передач показаны на рисунке 2. Источником заявок являются процессоры (S0), генерирующие потоки транзакций чтения, записи в память. В качестве обслуживающих приборов выступают общая шина (S1), буферное устройство (буфер записи (S2) и буфер чтения (S3)) и общая память (S4). Поток заявок, ai моделируют транзакции обращения i-го процессора через буферное устройство к глобальной (удаленной) памяти. Процесс выполнения заявок из потока ai проходит три фазы обслуживания транзакций записи: общей шинойSi, буферным устройством и одним из модулей памяти Sj (j=2,…,m+1). Для транзакций чтения пять фаз обслуживания: общей шиной, буферного устройства, общей памятью, буферного устройства и снова общей шиной. Все входящие в СМО потоки считаются простейшими, а времена обслуживания распределенными по экспоненциальному закону [1]. Моделирование производилось с помощью программы расчета стохастических сетей массового обслуживания [7].
а)
б)
Рисунок 2. Структура модели МПС с архитектурой памяти UMA с буферным устройством (а) и граф передач стохастической сети (б)
Анализ влияния числа процессорных узлов на реальную пропускную способность подсистемы «процессор-память» с архитектурой памяти UMA с буферным устройством.
Исходные данные: число обслуживающих каналов (модулей ОП) в СМО K = 4; число источников нагрузки (процессоров) Mцп = 2-10; время обслуживания заявок одним каналом (модулем ОП) n=37,5 нс; интенсивность потока запросов l=0,028 запроса/нс.
При Мцп=2-8 в исследуемой системе длина очереди l<0,1 (от 0,00011 до 0,07492 заявок), время ожидания в очереди - от 0,0098 до 1,6774 нс.
При Мцп=8-10 число заявок в очереди достигает 0,21721 заявки, время ожидания в очереди увеличивается до 3,8904 нс, время ответа памяти равно 41,3904, что в 1,14 раза превышает значение при М=2.
память многопроцессорный буферный устройство
Рисунок 3. Влияние числа ЦП на латентность памяти при одной и двух очередях к памяти
Анализ влияния числа модулей памяти на реальную пропускную способность подсистемы «процессор-память» с архитектурой памяти UMA с буферным устройством.
Исходные данные: число обслуживающих каналов (модулей ОП) в СМО K = 1-8; число источников нагрузки (процессоров) M = 4; время обслуживания заявок одним каналом (модулем ОП) n=37,5 нс; интенсивность потока запросов l=0,028 запроса/нс.
Исходя из результатов моделирования, среднее число занятых каналов b для данной системы при заданной интенсивности потока задач составляет 0,8374, т. е. не превышает 1. Среднее число заявок в системе при К>2 также не превышает 1.
Таким образом, оптимальное число модулей памяти 3-6. Это подтверждается и другими характеристиками, например, средней длиной очереди (от 0,0226 при 3 модулях памяти до 0,000039 при 6 модулях памяти), загрузкой модулей памяти (от 0,2791 при 3 модулях до 0,1396 при 6 модулях) и временем ответа памяти (от 38,5134 при 3 модулях до 37,5017 при 6 модулях).
Рисунок 4. Влияние числа ЦП на латентность памяти при одной и двух очередях обращения к памяти
Список литературы
1. Бершадская Е.Г. Моделирование. Модели систем и методы принятия решений: учебное пособие. - Пенза: Изд-во Пенз. гос. технол. акад., 2012. - 144 с.
2. Воронцов А.А. Анализ распределения и моделирование магнитных полей двухкоординатных магнитострикционных наклономеров [Текст] / Ю.Н. Слесарев, А.А. Воронцов, Т.В. Дарченко, В.А. Володин // Информационные технологии. Радиоэлектроника. Телекоммуникации. - Тольятти, Поволжский государственный университет сервиса, 2013. № 3. С. 306-310.
3. Воронцов А.А. Исследование оптимального значения результирующей напряженности магнитного поля в двухкоординатных магнитострикционных наклономерах с использованием сплошных постоянных магнитов [Текст] / Ю.Н. Слесарев, А.А. Воронцов, В.А. Володин, Р.В. Шабнов // Информационные технологии. Радиоэлектроника. Телекоммуникации. - Тольятти, Поволжский государственный университет сервиса, 2013. № 3. С. 299-305.
4. Курносов В.Е., Андреева Т.В. Учебно-научный программный комплекс решения задач анализа и синтеза конструкций [Текст] // XXI век: итоги прошлого и проблемы настоящего плюс, - 2015, - № 3 (25). - С. 202-209.
5. Мартышкин А.И. Исследование алгоритмов планирования процессов в системах реального времени [Текст] // в сборнике Современные методы и средства обработки пространственно-временных сигналов сборник статей XIII Всероссийской научно-технической конференции. Под ред. И.И. Сальникова. Пенза, 2015. - С. 118-124.
6. Мартышкин А.И. Исследование подсистем памяти с буферизацией транзакций на моделях массового обслуживания [Текст] // XXI век: итоги прошлого и проблемы настоящего плюс. - 2011. - № 3. - С. 124-131.
7. Мартышкин А.И. Комплекс программ для определения характеристик диспетчеров задач многопроцессорных систем с использованием приоритетных стохастических сетей массового обслуживания [Текст] / Р.А. Бикташев, А.И. Мартышкин, Н.Г. Востоков // Фундаментальные исследования. - 2013. - № 10-1. - С. 13-20.
8. Мартышкин А.И. Математическое моделирование аппаратного буфера памяти многопроцессорной системы [Текст] // в сборнике: Оптико-электронные приборы и устройства в системах распознавания образов, обработки изображений и символьной информации. Распознавание-2015 сборник материалов XII Международной научно-технической конференции, 2015. - С. 247-249.
9. Мартышкин А.И. Разработка аппаратного буферного устройства памяти многопроцессорной системы [Текст] // Фундаментальные исследования. - 2015. - № 12-3. - С. 485-489.
10. Мартышкин А.И. Разработка и исследование разомкнутых моделей подсистемы «процессор-память» многопроцессорных вычислительных систем архитектур UMA и NUMA [Текст] // Вестник РГРТУ. - 2015. - № 54. - Ч. 1. - С. 121-126.
11. Мартышкин А.И. Реализация аппаратного буфера памяти многопроцессорной системы [Текст] // в сборнике: Новые информационные технологии и системы сборник статей XII Международной научно-технической конференции. 2015. - С. 96-99.
12. Сальников И.И. Критерии отнесения устройств и систем обработки информации к интеллектуальным [Текст] // XXI век: Итоги прошлого и проблемы настоящего плюс, - 2012. - № 1 (5). - С. 11-15.
13. Martyshkin A.I., Yasarevskaya O.N. Mathematical modeling of Task Managers for Multiprocessor systems on the basis of open-loop queuing networks [Текст] // ARPN Journal of Engineering and Applied Sciences. - 2015. - V. 10. - № 16. - P. 6744-6749.
Аннотация
Исследование подсистемы памяти мультипроцессоров с буферным устройством и общей очередью на основе открытых сетей массового обслуживания
Мартышкин Алексей Иванович
канд. техн. наук, доц. кафедры Вычислительных машин и систем Пензенского государственного технологического университета,
РФ, г. Пенза
E-mail: Alexey314@yandex.ru
Мартенс-Атюшев Дмитрий Сергеевич
магистрант кафедры Вычислительных машин и систем Пензенского государственного технологического университета,
РФ, г. Пенза
E-mail: novoselich93@mail.ru
Работа выполнена при финансовой поддержке РФФИ (Проект № 16-07-00012 А).
В статье исследуются математические модели подсистем памяти многопроцессорных систем с буферным устройством с единой очередью. Приводятся результаты моделирования. Даются выводы по работе.
Ключевые слова: математическая модель, система массового обслуживания, архитектура памяти, многопроцессорная система, оценка вероятностно-временных характеристик многопроцессорной системы.
Abstract
Study of memory subsystem multiprocessors with a buffer device and a shared queue based on open queuing networks
Alexey Martyshkin
candidate of Science, assistant professor Department of Computational Systems and Machines of Penza State Technological University,
Russia, Penza
Dmitriy Martens-Atushev
master student Department of Computational Systems and Machines of Penza State Technological University,Russia, Penza
The article investigates mathematical models of memory subsystems for multiprocessor systems with a buffer device with a single queue. Results of the modeling results. Given the findings of the work.
Keywords: mathematical model, queuing system, memory architecture, multiprocessor systems, evaluation of probability-time characteristics of a multiprocessor system.
Размещено на Allbest.ru
...Подобные документы
Архитектура многопроцессорных систем с общей шиной и с неоднородным доступом к памяти. Структура кэш памяти. Взаимодействие user space с kernel space. Средства синхронизации ядра Linux. Обход каталогов страниц. Инструментация кода средствами Clang.
дипломная работа [513,7 K], добавлен 14.11.2017Внутренний кэш. Смешанная и разделенная кэш-память. Статическая и динамическая память. TLB как разновидность кэш-памяти. Организация кэш-памяти. Отображение секторов ОП в кэш-памяти. Иерархическая модель кэш-памяти. Ассоциативность кэш-памяти.
курсовая работа [229,1 K], добавлен 04.11.2006Разработка принципиальной электрической схемы электронного устройства ЭВМ. Построение модуля памяти ПЗУ на основе Intel 80286. Описание микросхемы, основных узлов и блоков. Расчет максимальной мощности, потребляемой устройством в рабочем режиме.
курсовая работа [944,8 K], добавлен 26.12.2012Объем двухпортовой памяти, расположенной на кристалле, для хранения программ и данных в процессорах ADSP-2106x. Метод двойного доступа к памяти. Кэш-команды и конфликты при обращении к данным по шине памяти. Пространство памяти многопроцессорной системы.
реферат [28,1 K], добавлен 13.11.2009Общее устройство микропроцессора. Структура 64-битной подсистемы памяти. Селекция портов ввода/вывода. Особенности интерфейса микропроцессорных систем. Проектирование подсистемы памяти на базе Itanium 2. Расчёт информативности и необходимых объёмов.
курсовая работа [3,7 M], добавлен 05.12.2012Стратегии размещения информации в памяти. Алгоритмы распределения адресного пространства оперативной памяти. Описание характеристик модели и ее поведения, классов и элементов. Выгрузка и загрузка блоков из вторичной памяти. Страничная организация памяти.
курсовая работа [708,6 K], добавлен 31.05.2013Хранение различной информации как основное назначение памяти. Характеристика видов памяти. Память типа SRAM и DRAM. Кэш-память или сверхоперативная память, ее специфика и области применения. Последние новинки разработок в области в оперативной памяти.
презентация [2,1 M], добавлен 01.12.2014Способность устройства обеспечивать хранение информации. Ячейки памяти и центральный процессор. Перфокарты, перфоленты, магнитные ленты, барабаны, диски, оптические диски. Необходимость в создании кэш-памяти. Использование большой сверхскоростной памяти.
презентация [180,2 K], добавлен 13.08.2013Сравнительный анализ статической и динамической памяти. Быстродействие и потребление энергии статической памятью. Объем памяти микросхем. Временные диаграммы чтения и записи памяти. Микросхемы синхронной и асинхронной памяти. Режимы модулей памяти.
презентация [114,2 K], добавлен 27.08.2013Память персонального компьютера, основные понятия. Характеристика внутренней и внешней памяти компьютера. Логическое отображение и размещение. Классификация компьютерной памяти по назначению, по удаленности и доступности для центрального процессора.
контрольная работа [1,8 M], добавлен 27.11.2010Физическая организация памяти компьютера. Организация структуры обработки потока данных. Степень и уровни параллелизма. Оценка иерархической организации памяти. Динамическая перестройка структуры. Микросхемы запоминающих устройств. Кэш-память процессора.
лекция [2,4 M], добавлен 27.03.2015Схема распределения памяти, соответствующая пользовательской трактовке распределения памяти. Перемещение с помощью таблицы сегментов. Аппаратная поддержка сегментного распределения памяти. Сегментно-страничная организация памяти с двухуровневой схемой.
лекция [1,5 M], добавлен 24.01.2014Используемые в компьютерах устройства памяти для хранения данных. Внутренние (оперативная и кэш-память) и внешние устройства памяти. Уровни иерархии во внутренней памяти. Подключения дисководов и управления их работой с помощью дискового контроллера.
презентация [47,7 K], добавлен 26.11.2009Память для вычислительных систем ее создание и характеристика особенностей. Создание устройств памяти и основные эксплуатационные характеристики. Функциональные схемы и способ организации матрицы запоминающих элементов. Виды магнитной и флеш памяти.
презентация [184,9 K], добавлен 12.01.2009Типы системной памяти. ОЗУ (оперативное запоминающее устройство), ПЗУ (постоянное запоминающее устройство), "энергонезависимая память" (CMOS). Процессор. Основные шины. Адресные данные. Совокупность всех возможных команд - система команд процессора.
контрольная работа [24,3 K], добавлен 30.03.2009Простейшая схема взаимодействия оперативной памяти с ЦП. Устройство и принципы функционирования оперативной памяти. Эволюция динамической памяти. Модуль памяти EDO-DRAM BEDO (Burst EDO) - пакетная EDO RAM. Модуль памяти SDRAM, DDR SDRAM, SDRAM II.
реферат [16,1 K], добавлен 13.12.2009Классификация компьютерной памяти. Использование оперативной, статической и динамической оперативной памяти. Принцип работы DDR SDRAM. Форматирование магнитных дисков. Основная проблема синхронизации. Теория вычислительных процессов. Адресация памяти.
курсовая работа [1,5 M], добавлен 28.05.2016Обобщение основных видов и назначения оперативной памяти компьютера. Энергозависимая и энергонезависимая память. SRAM и DRAM. Триггеры, динамическое ОЗУ и его модификации. Кэш-память. Постоянное запоминающее устройство. Флэш-память. Виды внешней памяти.
курсовая работа [1,7 M], добавлен 17.06.2013Проблемы, возникающие при работе с динамическими переменными, их решение. Алгоритм Дойча-Шорра-Уэйта. Структура памяти и стратегия ее перераспределения. Главная идея, лежащая в основе "методов близнецов". Разбивка памяти на блоки и их упорядочение.
курсовая работа [57,0 K], добавлен 29.01.2010Модель памяти как набор опций компилятора, ее виды в BC++2.0, размеры и взаимное расположение. Назначение сегментных регистров в различных моделях памяти, порядок просмотра переменных. Основные и дополнительные функции динамических переменных в памяти.
лабораторная работа [28,4 K], добавлен 06.07.2009