НОУ ИНТУИТ | Архитектура параллельных вычислительных систем. Лекция 3: Распараллеливание в ВС на уровне исполнительных устройств

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Московский государственный университет путей сообщения

Опубликован: 22.12.2006 | Доступ: свободный | Студентов: 2440 / 570 | Оценка: 4.07 / 4.02 | Длительность: 16:07:00

ISBN: 978-5-9556-0071-0

Темы: Программирование, Аппаратное обеспечение, Суперкомпьютерные технологии

Специальности: Разработчик аппаратуры

|

Вам нравится? Нравится 28 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Обобщенная процедура динамического распараллеливания в многофункциональном АЛУ

В многопроцессорном вычислительном комплексе "Эльбрус-2" используется динамическое распределение работ между исполнительными устройствами АЛУ. При этом успешно разрешается противоречие между безадресной системой команд, предполагающей их выполнение на стеке, и возможностью одновременной загрузки многих исполнительных устройств.

При ближайшем рассмотрении стек представляется сугубо последовательностной структурой. Работа со стеком, как через "узкое горло", производится с использованием его вершины, и в случае многофункциональных АЛУ (т.е. АЛУ, состоящих из набора нескольких специализированных по операциям исполнительных устройств) представляется проблематичной. Казалось бы, стек по самой своей природе не предназначен для распараллеливания. Однако это не так, что и было продемонстрировано в МВК "Эльбрус-2". Здесь мы обобщим данный опыт.

Формирование потока трехадресных команд

В ИУ АЛУ в основном выполняются двуместные операции. Для выполнения такой операции надо знать код операции, адреса двух операндов (как правило, — в СОЗУ) и адрес результата. Т.е. АЛУ в общем случае оперирует трехадресными командами вида $\theta A_{1}A_{2}A_{3}$ .

Для эффективного использования многофункционального АЛУ надо в каждый момент иметь в рассмотрении большое число таких команд, чтобы на их основе производилась полная загрузка заданиями и параллельная работа всех ИУ.

Значит, надо иметь некоторый буфер команд АЛУ (рис. 3.7), в котором формируется и поддерживается в достаточном количестве множество команд данной структуры. Готовые к выполнению команды из этого буфера назначаются на ИУ. Буфер "снизу" пополняется устройством управления новыми командами взамен назначенных для выполнения.

Рис. 3.7. Обработка буфера команд АЛУ

В ЦП МВК "Эльбрус-2" для загрузки 10 ИУ разной специализации просматривается до 30 команд.

Такой буфер и есть "окно просмотра", через которое проходят исполнительные команды, сформированные на основе выполняемой программы, m — максимальное число команд в "окне просмотра". Буфер может заполняться УУ после базирования и индексации команд.

Выше говорилось, что стек максимально снижает число обращений к ОП. Кроме того, ПОЛИЗ - естественный и простой результат трансляции с любого алгоритмического языка. Однако выполнение операций на стеке заключается в последовательном преобразовании его вершины. Это, казалось бы, исключает параллелизм, но и на ПОЛИЗ он виден. Например, по приведенной выше записи можно выделить первые параллельные операции счета:

$\text{\boldmath{$k l \colorbox[gray]{0.8}{\boldmath$m n \times$} - + \colorbox[gray]{0.8}{\boldmath$a b -$} \times \text{\itshape\bfseries Зп } Y$}}$

— две двуместные операции умножения и вычитания, которыми можно бы было загрузить два ИУ.

Значит, чтобы распараллелить выполнение программы на стеке, надо выполнить промежуточный перевод

$\fbox{программа в ПОЛИЗ} \to \fbox{поток команд через "окно просмотра"}$

— динамически, в процессе выполнения программы. Т.е. от безадресной системы необходимо перейти к системе программирования, использующей адреса. Тогда команды будут иметь вид тех процедур, о которых говорилось выше.

Для этого предполагается, что стек формируется не на основе данных, как выше, а на основе их адресов в СОЗУ, вне стека. Т.е. данные и промежуточные результаты располагаются в регистрах СОЗУ, а их адресами загружается стек; в стеке представлены не данные, а их адреса. Такой стек называется адресным стеком. Расположение же данных (включая промежуточные результаты) в СОЗУ планируется аппаратно, динамически так, чтобы оптимально использовать ограниченный объем СОЗУ (или предоставляемой его области) при достижении максимального параллелизма. Быстрые регистры СОЗУ являются распределяемым ресурсом.

Подобная общая схема работы АЛУ представлена на рис. 3.8.

Рис. 3.8. Схема распараллеливания выполнения команд

Рассмотрим работу блока динамического распределения регистров.

Он обрабатывает два списка адресов регистров СОЗУ: адресный стек и список свободных регистров.

Ранее мы видели, что в программе ПОЛИЗ есть три вида команд: загрузка стека, выполнение операции, запись из стека. Каждая из этих команд порождает трехадресную команду следующим образом.

Загрузка стека порождает трехадресную команду, в которой адрес считываемой величины в памяти указывается по первому адресу формируемой команды. По третьему адресу указывается первый адрес из списка свободных регистров. Этот адрес образует новую вершину адресного стека. (Т.е. регистр с этим адресом образует новую вершину стека, на котором производится счет.)

Команда выполнения операции порождает трехадресную команду, где одним из операндов является вершина стека. Если операция одноместная, адрес, стоящий в вершине адресного стека, становится первым адресом команды. Если операция двуместная, то адрес из вершины адресного стека становится вторым адресом формируемой команды, а первым адресом становится адрес, составляющий второй уровень адресного стека. Третий адрес берется из списка свободных регистров. Использованные адреса операндов исключаются из адресного стека и переводятся в конец списка свободных регистров. Адрес регистра, составивший третий адрес сформированной команды, т.е. адрес результата, включается в адресный стек как его новая вершина.

Запись из стека порождает трехадресную команду, где первый адрес — адрес из вершины адресного стека, третий адрес — адрес записи (в СОЗУ или ОП). Использованный адрес из вершины адресного стека исключается из этого стека и записывается в конец списка свободных регистров.

Пример.

$\text{\boldmath{$k l \colorbox[gray]{0.8}{\boldmath$m n \times$} - + \colorbox[gray]{0.8}{\boldmath$a b -$} \times \text{\itshape\bfseries Зп } Y$}}$

$\begin{center} \tabcolsep=2pt \begin{tabular}{ccccc} & & \bf\itshape ПОЛИЗ & & \bf\itshape программа\\ \boldmath{$A:= (a+b):(m\times n)$} & $\to$ & \boldmath{$Aab+mn\times ::=$} & $\to$ & \boldmath{$ab+mn\times:3nA$} \end{tabular} \end{center}$

В таблице 3.1 представлен перевод программы из безадресной системы команд в трехадресную.

Таблица 3.1.
N_k	Адресный стек	Список свободных регистров	Формируемые команды
N_k	Адресный стек	Список свободных регистров	$\theta$	A₁	A₂	A₃
1		r₁,r₂,r₃,r₄,r₅,r₆	Сч	<a>		r₁
2	r₁	r₂,r₃,r₄,r₅,r₆	Сч	<b>		r₂
3	r₂,r₁	r₃,r₄,r₅,r₆	+	r₁	r₂	r₃
4	r₃	r₄,r₅,r₆,r₁,r₂	Сч	<m>		r₄
5	r₄,r₃	r₅,r₆,r₁,r₂	Сч	<n>		r₅
6	r₅,r₄,r₃	r₆,r₁,r₂	x	r₄	r₅	r₆
7	r₆,r₃	r₁,r₂,r₄,r₅	:	r₃	r₆	r₁
8	r₁	r₂,r₄,r₅,r₃,r₆	Зп	r₁		<A>

Дальше >>

Авторизоваться

Архитектура параллельных вычислительных систем

Распараллеливание в ВС на уровне исполнительных устройств

Обобщенная процедура динамического распараллеливания в многофункциональном АЛУ

Формирование потока трехадресных команд

Вопросы и ответы