НОУ ИНТУИТ | Основы параллельного программирования с использованием Visual Studio 2010. Лекция 1: Введение в параллельное программирование

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Твой путь к знаниям!

Томский политехнический университет

Опубликован: 23.01.2013 | Доступ: свободный | Студентов: 1158 / 192 | Длительность: 12:09:00

Специальности: Программист, Архитектор программного обеспечения

Теги: высокопроизводительные вычисления, многозадачность, многоядерные процессоры, распараллеливание, распределенные вычисления

|

Вам нравится? Нравится 27 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Аннотация: В рамках данной лекции будут рассмотрены следующие вопросы: определение, назначение параллельного программирования; многоядерные вычисления; множественные потоки команд/данных; ускорение; закон Амадал; закон Густафсона-Барсиса.

Ключевые слова: программирование, параллельные вычисления, параллельное программирование, multithreading, ПО, производительность, SISD, MISD, SIMD, MIMD, отношение, время выполнения, расходы, алгоритм, программа, объём, ввод/вывод, менеджмент

Определение, назначение параллельного программирования

Существуют различные способы написания программ, которые условно можно разделить на три группы:

Последовательное программирование с дальнейшим автоматическим распараллеливанием.
Непосредственное формирование потоков параллельного управления, с учетом особенностей архитектур параллельных вычислительных систем или операционных систем.
Описание параллелизма без использования явного управления обеспечивается заданием только информационных связей. Предполагается, что программа будет выполняться на вычислительных системах с бесконечными ресурсами, операторы будут запускаться немедленно по готовности их исходных данных.

Каждый из перечисленных подходов обладает своими достоинствами и недостатками параллельное программирование.

Параллельные вычисления - способ организации компьютерных вычислений, при котором программы разрабатываются, как набор взаимодействующих вычислительных процессов, работающих асинхронно и при этом одновременно.

Параллельное программирование - это техника программирования, которая использует преимущества многоядерных или многопроцессорных компьютеров и является подмножеством более широкого понятия многопоточности (multithreading).

Многоядерные вычисления

Использование параллельного программирования становится наиболее необходимым, поскольку позволяет максимально эффективно использовать возможности многоядерных процессоров и многопроцессорных систем. По ряду причин, включая повышение потребления энергии и ограничения пропускной способности памяти, увеличивать тактовую частоту современных процессоров стало невозможно. Вместо этого производители процессоров стали увеличивать их производительность за счет размещения в одном чипе нескольких вычислительных ядер, не меняя или даже снижая тактовую частоту. Поэтому для увеличения скорости работы приложений теперь следует по-новому подходить к организации кода, а именно - оптимизировать программы под многоядерные системы.

Множественные потоки команд/данных (Классификация М.Флинна)

Самой ранней и наиболее известной является классификация архитектур вычислительных систем, предложенная в 1966 году М.Флинном. Классификация базируется на понятии потока, под которым понимается последовательность элементов, команд или данных, обрабатываемая процессором. На основе числа потоков команд и потоков данных Флинн выделяет четыре класса архитектур: SISD, MISD, SIMD, MIMD. Описание классов приведено в Табл. 1.1.

Таблица 1.1. Описание классов архитектур
Название класса	Описание класса
SISD (single instructiоn streаm / single dаtа streаm) или ОКОД (Одиночный поток Команд, Одиночный поток Данных)	Одиночный поток команд и одиночный поток данных (исполнение одним процессором одного потока команд, обрабатывающего данные, хранящиеся в одной памяти). К этому классу относятся, классические последовательные машины, или иначе, машины фон-неймановского типа (PDP-11 или VАX 11/780).
SIMD (single instructiоn streаm / multiple dаtа streаm) или ОКМД (одиночный поток команд, множественный поток данных)	Одиночный поток команд и множественный поток данных. В архитектурах подобного рода сохраняется один поток команд, включающий, в отличие от предыдущего класса (SISD), векторные команды, что позволяет выполнять одну арифметическую операцию сразу над многими данными - элементами вектора.
MISD (multiple instructiоn streаm / single dаtа streаm) или МКОД (Множественный поток Команд, Одиночный поток Данных)	Множественный поток команд и одиночный поток данных. Определение подразумевает наличие в архитектуре многих процессоров, обрабатывающих один и тот же поток данных.
MIMD (multiple instructiоn streаm / multiple dаtа streаm) или МКМД (Множественный поток Команд, Множественный поток Данных)	Множественный поток команд и множественный поток данных. Этот класс предполагает, что в вычислительной системе есть несколько устройств обработки команд, объединенных в единый комплекс и работающих каждое со своим потоком команд и данных.

На основании Табл. 1.1 можно проранжировать архитектуры на однопоточность/многопоточность (Табл. 1.2).

Таблица 1.2. Ранжирование архитектур по обработке потоков
	Одиночный поток команд (Single Instructiоn)	Множество потоков команд (Multiple Instructiоn)
Одиночный поток данных (Single Dаtа)	SISD (ОКОД)	MISD (МКОД)
Множество потоков данных (Multiple Dаtа)	SIMD (ОКМД)	MIMD (МКМД)

Ускорение (Speedup)

Ускорением параллельного алгоритма называется отношение:

$S_n=\frac{T_1}{T_n}$

где T_n - время вычисления задачи на n процессорах, T_1 - время выполнения однопоточной программы

T(n)<T(1) , если параллельная версия алгоритма эффективна.

T(n)>T(1) , если накладные расходы (издержки) реализации параллельной версии алгоритма чрезмерно велики.

С ускорением связана эффективность параллельного алгоритма. Эффективностью параллельного алгоритма называется величина:

$E_n=\frac{S_n}{ n}$

По определению, E_1 =1 . Теоретически должно быть $S_n\leq n$ и $E_n\leq 1$ . Если алгоритм достигает максимального ускорения (S_n=n) , то E_n=1 . На практике эффективность убывает при увеличении числа процессоров.

Если же результат получается E_n > 1 (суперлинейное ускорение). Эта аномалия вызвана, чаще всего, двумя причинами:

В качестве последовательного алгоритма был применён не самый быстрый алгоритм из существующих.
С увеличением количества вычислителей растёт суммарный объём их оперативной и кэш памяти. Поэтому всё большая часть данных задачи умещается в оперативной памяти и не требует подкачки с диска, или (чаще всего) умещается в кэше.

Закон Амдала

Закон Амдала (1967 год), описывает максимальный теоретический выигрыш в производительности параллельного решения по отношению к лучшему последовательному решению. Закон Амдала описывается следующей математической формулой:

$S_n=\frac{1}{\alpha+\frac {1-\alpha}{n}$

где S_n - во сколько раз можно ускорить вычисления (ускорение), n - количество процессоров (ядер), $\alpha$ - доля последовательно вычисляемого кода ( $\alpha \neq 0$ ).

Закон Амдаля, несмотря на то, что он не учитывает многих факторов, накладывает ограничения на максимально достижимую эффективность параллельного алгоритма.

Предположим, например, что $\alpha =\frac{1}{3}$ , то есть две трети операций в алгоритме могут выполняться параллельно, а треть - нет. Тогда ускоре-ние S_n<3 . Таким образом, независимо от количества процессоров (ядер) и даже при игнорировании всех затрат на подготовку данных нельзя ускорить решение задачи более, чем в три раза.

Закон Густафсона-Барсиса

Закон Густафсона - Барсиса (1988г) оценивает максимально допустимое ускорение выполнения параллельной программы, в зависимости от количества одновременно выполняемых потоков вычислений и доли последовательных расчётов. Формула Густафсона - Барсиса выглядит следующим образом:

$S_n=n+(1-n)\alpha$

Где $\alpha$ - доля последовательных расчётов в программе, - количество процессоров.

Густафсон заметил, что, работая на многопроцессорных системах, пользователи склонны к изменению тактики решения задачи. Теперь снижение общего времени исполнения программы уступает объёму решаемой задачи. Такое изменение цели обусловливает переход от закона Амдала к закону Густафсона. К примеру, на 100 процессорах программа выполняется 20 минут. При переходе на систему с 1000 процессорами можно достичь времени исполнения порядка двух минут. Однако для получения большей точности решения имеет смысл увеличить объём решаемой задачи, т.е. при сохранении общего времени исполнения пользователи стремятся получить более точный результат. Увеличение объёма решаемой задачи приводит к увеличению доли параллельной части, так как последовательная часть (ввод/вывод, менеджмент потоков, точки синхронизации и т.п.) не изменяется.

Дальше >>

Авторизоваться

Основы параллельного программирования с использованием Visual Studio 2010