Разработка быстродействующих маломощных блоков ассоциативной памяти для микропроцессора "Эльбрус-4C+"

Главный анализ мощности, рассеиваемой блоками ассоциативной памяти, построенной по классической схеме. Трата мощности на перезаряд шин поиска и шин совпадения. Основные характеристики пяти блоков САМ, разработанных для микропроцессора "Эльбрус-4С+".

Рубрика Коммуникации, связь, цифровые приборы и радиоэлектроника
Вид статья
Язык русский
Дата добавления 27.11.2018
Размер файла 309,4 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ОАО «ИНЭУМ им. И.С. Брука»

РАЗРАБОТКА БЫСТРОДЕЙСТВУЮЩИХ МАЛОМОЩНЫХ БЛОКОВ АССОЦИАТИВНОЙ ПАМЯТИ ДЛЯ МИКРОПРОЦЕССОРА «ЭЛЬБРУС-4С+»

Г.В. Кристовский

Ю.Л. Погребной

Ассоциативная память (content addressable memory - CAM) представляет собой устройство, в котором реализованы параллельный опрос массива ячеек памяти и нахождение слова по его содержимому. При проектировании современных вычислительных систем возникает ряд задач, эффективность решения которых может быть существенно повышена за счет использования ассоциативной памяти. Такими задачами являются преобразование виртуального адреса в физический адрес, реализация памяти тегов, управление очередями в кэш-памяти. Однако широкое применение устройств подобного типа ограничено тем, что при классической реализации ассоциативная память рассеивает относительно большую мощность.

В статье исследованы возможные схемы реализации быстродействующей ассоциативной памяти, проведен анализ мощностных и временных характеристик этих схем. Предложена оригинальная схема ассоциативной памяти, сочетающая высокое быстродействие и малую рассеиваемую мощность.

1. Классическое решение

В составе обобщенной структуры ассоциативной памяти (рис. 1) показана упрощенная электрическая схема классической ассоциативной памяти (рис. 1а) [1]. Основным элементом этой памяти (ЭАП) является 10-транзисторная ячейка (рис. 1б), состоящая из 6-транзисторной ячейки оперативной памяти и схемы сравнения на четырех транзисторах. Схема сравнения представляет собой две пары последовательно соединенных транзисторов. К затворам верхних транзисторов подключены парафазные выходы хранящей ячейки. На затворы нижних транзисторов подаются данные для сравнения. Если они не совпадают с информацией, хранящейся в ячейке, то одна пара транзисторов становится проводящей, в противном случае в каждой паре один из последовательно соединенных транзисторов закрыт.

Выходы схем сравнения одного слова объединены при помощи шины совпадения (match line). Шины, объединяющие входы данных одноименных разрядов слов массива, носят название «шины поиска» (search lines). Заметим, что на шины поиска подается инвертированное слово, в силу чего при совпадении исходного слова с записанным ранее проводящий путь между шиной совпадения и землей отсутствует. Информация о результате сравнения поступает на выходы ассоциативной памяти Q0…QN.

Рис. 1. Обобщенная структура ассоциативной памяти

(а - классическая организация ассоциативной памяти, б - основной ЭАП)

Временная диаграмма работы этой схемы состоит их двух фаз. На фазе предварительного заряда (предзаряда) осуществляется заряд шин совпадения до напряжения питания через p-канальные транзисторы (рис. 1а). На выходах устанавливается низкий уровень. Для исключения сквозных токов до начала предзаряда на всех шинах поиска должен быть установлен нулевой потенциал.

На фазе опроса предзаряд отключается, а на шины поиска подаются данные для сравнения. В случае совпадения этих данных с ранее записанным словом потенциал соответствующей шины совпадения не изменяется. Для всех слов, в которых имеется несовпадение хотя бы в одном разряде, появляется ток, разряжающий шины совпадения до потенциала «земли».

Максимальная задержка будет в случае, если не совпадает только один разряд. Традиционным способом уменьшения задержки является увеличение транзисторов в схемах сравнения. Однако это приводит к увеличению мощности, затрачиваемой на перезаряд шин совпадения. В худшем случае все шины совпадения (кроме одной) перезаряжаются на напряжение питания. Кроме того, значительная мощность расходуется на перезаряд шин поиска, половина которых перезаряжается при каждом обращении. Именно эти две составляющие определяют мощность, рассеиваемую устройством, и ограничивают допустимое количество слов и количество разрядов в каждом слове.

2. Известные модификации схемы, позволяющие уменьшить рассеиваемую мощность

Известным способом уменьшения мощности является предварительная зарядка шин совпадения к уровню «земли», а не к уровню питания [2]. Такой способ исключает необходимость обнуления шин поиска перед каждым обращением и перезаряда большого количества шин совпадения при опросе, т.к. токи, появляющиеся при несовпадении, только подтверждают нулевой потенциал этих шин. Однако в таком случае для шин совпадения должны быть разработаны специальные схемы, обеспечивающие повышение потенциала этих шин при совпадении данных во всех разрядах. На схемы, выполняющие данную функцию, накладываются два противоречивых требования. С одной стороны, если данные совпадают, то выходной ток должен быть достаточным для повышения потенциала шины совпадения на необходимое напряжение в течение заданного интервала времени. С другой стороны, ток разряда, возникающий при несовпадении только в одном бите, должен надежно поглощать выходной ток схемы. Эти две задачи должны быть надежно решены с учетом разброса характеристик компонентов схемы и в изменяющихся режимах работы схемы. Ниже приведен краткий анализ двух наиболее простых способов решения этой задачи.

В схеме, показанной на рис. 2, для фиксации потенциала шины совпадения используется инвертор с положительной обратной связью. Для обеспечения минимального разброса при помощи генератора тока задается ток заряжающего шину совпадения. Выходной ток генератора выбирается равным половине минимального тока разряда, что в худшем случае обеспечивает примерно одинаковую скорость заряда и разряда шины совпадения. Недостатком схемы является сложность реализации качественного генератора тока, в особенности при напряжении питания порядка 1 В.

Рис. 2. Схема с фиксацией потенциала шины совпадения инвертором с положительной обратной связью

Вместо генератора тока для изменения потенциала шины совпадения может быть использована накопительная емкость (рис. 3). Во время предзаряда накопительная емкость заряжается до напряжения питания, а шина совпадения - до уровня «земли». Во время опроса происходит перераспределение заряда между накопительной емкостью и емкостью шины совпадения, в результате чего напряжение на шине совпадения повышается. В этой схеме время опроса равно времени, за которое минимальный ток, соответствующий несовпадению в одном бите, разрядит накопительную емкость.

Для уменьшения величины накопительной емкости в схеме использован малосигнальный дифференциальный усилитель, второй вход которого заземлен. Количество усилителей равно количеству слов. Т.к. во всех усилителях рассеивается постоянная мощность, они могут вносить существенный вклад в общую мощность устройства. Кроме того, усилители и накопительные емкости увеличивают площадь устройства.

Рис. 3. Схема с накопительной емкостью

Таким образом, предзаряд шины совпадения к уровню «земли» приводит к усложнению схемотехники ассоциативной памяти и появлению дополнительных потребителей мощности. По этим причинам данный подход не нашел широкого применения.

3. Предлагаемое решение

В данной статье предлагается схемотехническое и топологическое решение ассоциативной памяти, в которой предварительная зарядка шины совпадения осуществляется до некоторого промежуточного уровня между «землей» и питанием. На рис. 4 приведена электрическая схема одного слова такой памяти. Ее отличительной особенностью является то, что схемы сравнения подключаются к «земле» через ключ, управляемый сигналом предзаряда. Во время предзаряда этот ключ разомкнут, что исключает появление сквозных токов между шиной совпадения и «землей». Таким образом, исключается необходимость предварительной зарядки шин поиска.

Так как «0» на выходе инвертора закрывает транзистор обратной связи, через который осуществляется предварительная зарядка, она выполняется для шины только до уровня, достаточного для переключения выходного инвертора.

Рис. 4. Электрическая схема одного слова ассоциативной памяти

Во время опроса включаются транзисторы, соединяющие компараторы всех слов с «землей», и при наличии в них несовпадения хотя бы в одном разряде появляется ток разряда соответствующей шины совпадения. Существенно, что в случае несовпадения только в одном разряде ток, разряжающий емкость шины совпадения, должен понизить потенциал этой шины на величину порядка зоны переключения выходного инвертора, что уменьшает задержку выходного сигнала. Емкость шины совпадения зависит от количества разрядов. С целью дальнейшего уменьшения задержки шина совпадения разделена на две секции, которые объединены через схему «И-НЕ».

Для тех шин, где имеет место совпадение, необходимо исключить влияние токов утечки закрытых транзисторов. С этой целью все шины совпадения подключены к напряжению питания через два последовательно включенных р-канальных транзистора. Нижний транзистор включен в диодном режиме, а верхний управляется инвертором обратной связи. Если ток разряда шины совпадения отсутствует, то на выходе этого инвертора сохраняется низкий уровень, который поддерживает открытое состояние верхнего транзистора. Здесь могут быть использованы транзисторы минимальных размеров, т.к. их задача заключается в поглощении токов утечки. мощность микропроцессор ассоциативный память

Существенно, что в одном такте могут выполняться запись и ассоциативный опрос. В этом случае данные, поданные на шины поиска, сравниваются с данными, записанными в этом же такте. Результат ассоциативного опроса (сигналы совпадения) фиксируется на триггерах и сохраняется неизменным в течение следующего такта. Задержка сигналов совпадения задается относительно начала следующего такта.

4. Оценка мощности

Максимальная мощность рассеивается в режиме, когда в каждом такте происходят и запись, и ассоциативный опрос. Для всех рассмотренных конструкций ассоциативной памяти аппаратура записи такая же, как в статической памяти с произвольным доступом. Поэтому для оценки выигрыша по мощности достаточно сравнить энергию, затрачиваемую на ассоциативный опрос. Как указано выше, основная часть энергии тратится на перезаряд шин совпадения и шин поиска, если это необходимо.

Для классической схемы (рис. 1) в фазе предзаряда все шины совпадения заряжаются до напряжения питания Vdd. В фазе ассоциативного опроса в худшем случае все шины кроме той, где имело место совпадение, разряжаются до уровня «земли». Таким образом, энергия, затрачиваемая на перезаряд шин совпадения, равна (N-1)CmlVdd2, где N - количество слов ассоциативной памяти, Cml - емкость шины совпадения. В предложенном варианте предзаряд осуществляется до напряжения переключения выходного инвертора, которое не превышает Vdd /2. Следовательно, энергия, затрачиваемая на перезаряд шины совпадения, будет в четыре раза меньше.

Рассмотрим процесс перезаряда шин поиска. Для исключения сквозных токов во время предзаряда шин совпадения в классической схеме все шины поиска должны иметь потенциал «земли». Во время опроса половина этих шин заряжается до напряжения Vdd. Энергия, затрачиваемая на изменение потенциала половины шин поиска от Vdd до 0 и обратно, равна MCsVdd2 , где M - количество разрядов, Сs - емкость шины поиска. В предложенной схеме не требуется проводить предзаряд шин поиска до потенциала «земли», следовательно, за такт шины ассоциативного поиска заряжаются только один раз. Далее количество перезаряжаемых шин поиска зависит от информации, поступающей на входы данных, и может изменяться в пределах от M до 0. В среднем будет перезаряжаться M/2 шин поиска. В результате средняя энергия, затрачиваемая на перезаряд шин поиска в предлагаемой схеме, равна 1/4MCsVdd2.

Таким образом, предлагаемая реализация ассоциативной памяти в режиме ассоциативного опроса рассеивает в четыре раза меньше мощности по сравнению с классической схемой. В классической схеме энергия, затрачиваемая на запись, составляет примерно половину энергии опроса, т.к. при каждой записи перезаряжается только одна словарная шина. Кроме того, в большинстве применений ассоциативной памяти операция записи встречается значительно реже, чем операция опроса. Это позволяет утверждать, что с точки зрения энергосбережения операция ассоциативного опроса является определяющей.

5. Топологическая реализация

На рис. 5 представлена топология основного элемента ассоциативной памяти, который содержит два бита одного слова. При такой компоновке шина совпадения состоит из двух половинок, объединяемых непосредственно перед выходным регистром, что позволяет уменьшить вдвое все паразитные емкости. Этот элемент содержит две ячейки памяти с соответствующими схемами совпадения, две половинки шины совпадения и отрезок словарной шины, общий для обеих ячеек памяти.

Перечисленные шины выполнены в третьем металле. Шины данных для записи, шины поиска и шины виртуальной «земли» выполнены во втором металле. Таким образом, для реализации устройства используются только три слоя металла.

Ориентация затворов транзисторов и слоев металлов такая же, как в логических элементах. Топология разработана в строгом соответствии с топологическими нормами и правилами для технологии 40 нм фирмы TSMC.

Рис. 5. Топологическая реализация основного элемента ассоциативной памяти

Для микропроцессора «Эльбрус-4С+» были разработаны пять типов блоков ассоциативной памяти, основные характеристики которых приведены в табл. 1.

Таблица 1


типа

Кол-во слов

Кол-во разрядов

Размеры, мкм

Частота, ГГц

Мощность, мВт

1

16

32

2850

1,2

1,85

2

16

34

2852

1,2

1,92

3

32

12

4626

1,2

1,35

4

32

20

4635

1,2

2,25

5

32

34

4652

1,2

3,85

Литература

1. K. Pagiamtzis, A. Sheilholeslami. Content - addressable memory (CAM) circuits and architectures: a tutorial and surway. IEEE J. Solid - State Circuits, vol. 41, pp. 712-726, March 2006.

2. N. Mohan, W Fung, D. Wright and M. Sachdev. Design techniques and test methodology for low - power TCAMS. IEEE Transactions on VLSI Systems, vol. 14, pp. 573-586, June 2006.

Аннотация

Проведен анализ мощности, рассеиваемой блоками ассоциативной памяти, построенной по классической схеме. Выявлено, что основная часть мощности тратится на перезаряд шин поиска и шин совпадения. Предложена новая схемотехника, позволяющая уменьшить рассеиваемую мощность в четыре раза. Приведены основные характеристики пяти блоков САМ, разработанных для микропроцессора «Эльбрус-4С+».

Ключевые слова: высокоскоростная ассоциативная память, методы снижения мощности, ячейка ассоциативной памяти, виртуальная «земля».

Detailed power analysis is performed for standard CAM circuitry. It is revealed that main portion of power is spent for charging and discharging of search lines and math lines. A new CAM circuitry was proposed which allowed to reduce power in 4 times. The main parameters of 5 CAM which designed for microprocessor «Elbrus-4C+» are demonstrated.

Keywords: high-speed content addressable memory, low-power techniques, associative memory cell, virtual ground.

Размещено на Allbest.ru

...

Подобные документы

  • Анализ обрабатывающей части микропроцессора. Основные элементы микропроцессора, их взаимодействие в процессе его работы. Методы решения примеров в двоичной системе исчислений. Назначение блоков микропроцессора. Принцип работы лабораторной установки.

    лабораторная работа [2,6 M], добавлен 26.09.2011

  • Порядок и обоснование выбора микропроцессора, схема его подключения. Организация ввода-вывода и памяти микропроцессора. Разработка и апробация программного обеспечения на базе восьмиразрядного МП Z80. Методы повышения частоты работы микропроцессора.

    курсовая работа [735,7 K], добавлен 03.01.2010

  • Разработка модулей памяти микропроцессорной системы, в частности оперативного и постоянного запоминающих устройств. Расчет необходимого объема памяти и количества микросхем для реализации данного объема. Исследование структуры каждого из блоков памяти.

    контрольная работа [1,3 M], добавлен 07.07.2013

  • Характеристика микропроцессора Z80, его достоинства и система команд. Проектирование интерфейса, структурной схемы и алгоритма работы управляющей микро-ЭВМ. Разработка модулей памяти, генератора тактового импульса, контроллера, ввода/вывода и индикатора.

    курсовая работа [1,7 M], добавлен 17.02.2014

  • Рассмотрение аппаратных принципов построения устройств микропроцессорной техники и их программного обеспечения. Структурная схема микропроцессора К1821ВМ85А. Карта распределения адресного пространства памяти. Расчет потребляемой устройством мощности.

    курсовая работа [2,4 M], добавлен 26.11.2012

  • Структурная схема устройства. Общая характеристика микропроцессора Z80, его особенности. Описание выводов. Схемотехника и принцип работы блоков. Схема микропроцессорного блока и памяти. Программное обеспечение микроконтроллера. Расчёт блока питания.

    контрольная работа [355,3 K], добавлен 07.01.2013

  • Алгоритм работы схемы микропроцессорного устройства и протокол обмена информацией между ним и объектом управления. Составление карты памяти для микропроцессора. Разработка программы на языке Ассемблера для выбранного микропроцессора и микроконтроллера.

    контрольная работа [207,8 K], добавлен 29.06.2015

  • Разработка структурной и принципиальной схемы микропроцессора. Подключение шины адреса, данных и управления к соответствующим блокам на схеме. Формирование блока устройства памяти (ОЗУ и ПЗУ) и подключение его к шинам блока центрального процессора.

    контрольная работа [220,5 K], добавлен 08.07.2012

  • Разработка микропроцессорной системы на основе однокристального 8-разрядного микропроцессора КР580ВМ80А. Основные характеристики системы. Формирование сигнала выбора модуля. Структура памяти, организация ввода и вывода. Программное обеспечение системы.

    курсовая работа [422,5 K], добавлен 10.03.2015

  • Выбор типа микросхем памяти и расчет их количества в модулях. Выбор дешифратора адреса. Распределение адресного пространства. Распределение модулей программ. Расчет нагрузочной способности модуля памяти. Генератор тактовых импульсов микропроцессора.

    дипломная работа [1,7 M], добавлен 08.01.2017

  • Арифметико-логическое устройство микропроцессора: его структура и составные части, назначение, функции, основные технические характеристики. Организация системы ввода/вывода микро ЭВМ. Реальный режим работы микропроцессора, его значение и описание.

    контрольная работа [201,1 K], добавлен 12.02.2014

  • Проектирование функциональных узлов, блоков и устройств вычислительной техники. Разработка устройств и систем. Частота смены элементов. Блок буферной памяти. Обеспечение работы устройства ввода визуальной информации. Последовательность сигналов частоты.

    курсовая работа [1,7 M], добавлен 31.01.2011

  • Разработка и обоснование общего алгоритма функционирования устройства. Выбор однокристального микропроцессора повышенной производительности. Написание управляющей программы на языке микропроцессора. Расчет амплитудно-частотной характеристики фильтра.

    курсовая работа [113,8 K], добавлен 04.12.2010

  • Понятие и функции блоков управления пропорциональной электрогидравлической системы, порядок их разработки: выбор и обоснование элементной базы, структурной и принципиальной схемы, расчет узлов и блоков, а также потребляемой устройством мощности.

    дипломная работа [665,9 K], добавлен 05.12.2012

  • Аппаратные принципы построения устройств микропроцессорной техники и приобретение практических навыков по разработке микропроцессорных систем. Техническая характеристика микропроцессора ATmega и анализ микросхемы памяти. Схема микропроцессорной системы.

    курсовая работа [1,6 M], добавлен 19.11.2011

  • Разработка программы непрерывного вычисления заданного логического выражения с использованием команды микропроцессора Intel 8080/8085; размещение ее в памяти, начиная с нулевой ячейки. Программная реализация временной задержки длительностью 100 мкс.

    контрольная работа [59,3 K], добавлен 09.04.2014

  • Методика расчета теплового режима микроэлектронной аппаратуры (МЭА). Характеристика и способы передачи тепловой энергии, рассеиваемой в радиоэлектронном блоке. Анализ путей защиты блоков МЭА от механических воздействий при эксплуатации и транспортировке.

    реферат [149,6 K], добавлен 19.09.2010

  • Идеальная и реальная амплитудно-частотные характеристики полосно-пропускающего фильтра, его схемотехника и применение. Усилитель мощности по схеме Агеева. Синтез схемы полосового фильтра с УМ. Зависимость относительного падения напряжения от мощности.

    курсовая работа [1,3 M], добавлен 15.03.2011

  • Разработка структуры многопроцессорного вычислительного комплекса с многовходовым оперативным запоминающим устройством. Характеристика структурной схемы МПВК: блок генерации сигналов, блок микропроцессора, блок сопряжения, памяти и контроллеров пуска.

    курсовая работа [594,1 K], добавлен 25.12.2010

  • Определение основных параметров микропроцессора. Разработка структурной, функциональной и принципиальной схемы, расчет временных параметров. Принципы формирования структуры программного обеспечения и определение основных требований, предъявляемых к нему.

    курсовая работа [788,6 K], добавлен 14.06.2014

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.