НОУ ИНТУИТ | Программирование на кластерах с использованием инструментов Intel (Intel Cluster Studio). Лекция 6: Распараллеливание программы вычисления определенного интеграла с помощью OpenMP

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 11.10.2012 | Доступ: свободный | Студентов: 307 / 58 | Длительность: 07:36:00

Темы: Программирование, Суперкомпьютерные технологии

Специальности: Программист, Системный архитектор

Теги: mpi, кластеры, распараллеливание, распределенные вычисления, суперкомпьютеры

|

Вам нравится? Нравится 2 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Распараллеливание программ с помощью OpenMP

Параллельная OpenMP-программа состоит из последовательных и параллельных секций. Границы параллельных секций обозначаются директивами OpenMP. Процесс разработки OpenMP-программы включает следующие этапы:

Разработка последовательной программы.
Выявление участков потенциального параллелизма. Чаще всего это циклы.
Анализ трудоемкости параллельных секций (профилирование программы). Наибольший выигрыш в производительности дает распараллеливание секций, на которые приходятся наибольшие затраты процессорного времени.
Пошаговое распараллеливание программы, начиная с наиболее трудоемких секций.

Профилирование может производиться как с помощью специальных программных инструментов, так и простыми средствами, например, с помощью вызова специальных подпрограмм-таймеров, размещенных в различных местах программы.

Цикл эффективно распараллеливается, если отсутствуют перекрестные зависимости между его итерациями. Избавиться от таких зависимостей иногда можно, выполнив преобразование цикла.

Необходимо правильно определить область видимости переменных в параллельных секциях программы. Параметр цикла, например, должен быть объявлен локальной переменной. Инвариант цикла (величина, не изменяющаяся при выполнении итераций цикла) должен быть глобальным.

При вычислении суммы, например, к переменной, которая используется для "накопления" суммы, должна быть применена операция приведения (редукции).

Следует обратить внимание на синхронизацию вычислений. По умолчанию в циклах используется барьерная синхронизация. Наличие синхронизаций увеличивает предсказуемость поведения программы, но замедляет ее работу.

Дополнительный выигрыш в производительности дает объединение нескольких параллельных секций в одну. В этом случае уменьшаются накладные расходы на запуск нитей и их завершение.

Трансляция OpenMP-программ

Трансляция OpenMP-программы выполняется со специальным ключом. В операционной системе Linux транслятор Intel®Compiler использует ключ –openmp, например:

#ifort –o my_prog prog_source.f90 -openmp

В операционной системе Microsoft®Windows командная строка выглядит следующим образом:

#ifort prog_source.f90 /Qopenmp

Приближенное вычисление определенного интеграла

Приближенное вычисление интеграла:

$I = \int\limits_{x_0}^{x_1} F(x) dx,$

основано на его замене конечной суммой:

$I_n = \sum\limits_{k=0}^n w_k F(x_k),$

где w_k — числовые коэффициенты, а x_k — точки отрезка [x_0, x_1] . Приближенное равенство:

$I \approx I_n$

называется квадратурной формулой, точки x_k — узлами квадратурной формулы, а числа w_k — коэффициентами квадратурной формулы. Разные методы приближенного интегрирования отличаются выбором узлов и коэффициентов. От этого выбора зависит погрешность квадратурной формулы:

$R_n = \mid I-I_n \mid$

Метод трапеций

Интегрирование методом трапеций — основано на использовании кусочно-линейного приближения для интегрируемой функции. Пусть F(x) — гладкая функция на интервале [a, b] , и этот интервал делится на равных частей, каждая длиной $h = \frac {(b-a)} {n}$ .

Приближение метода трапеций:

$I(h) = \frac {h[f_0+2f_1+2f_2+...+2f_{n-1}+2f_n]} {2}$

где f_i = F(a+jh) ,— значение интегрируемой функции в точке a+jh .

Метод Симпсона

Идея трехточечного метода Симпсона заключается в следующем. Пусть x_m — это средняя точка интервала [x_0, x_1] и пусть Q(x) — единственный полином второй степени, который интерполирует (приближает) подынтегральную функцию F(x) по точкам x_0 , x_m и x_1 . Искомый интеграл аппроксимируется интегралом от функции Q(x) :

$I_i \approx \int\limits_{x_i}^{x_{i+1}} Q(x)dx$

Эта оценка точна, если F(x) является полиномом степени 3.

Обычно используются составные квадратурные формулы, когда промежуток интегрирования разбивается на подинтервалов и простая формула Симпсона применяется на каждом из этих подинтервалов:

$I_i \approx \int\limits_{x_i}^{x_{i+1}} Q(x)dx$ $I = \sum\limits_{i=1}^N I_i$

Недостатком рассмотренного метода является то, что он не дает возможности явно задать точность вычисления интеграла. Точность связана с количеством точек разбиения. От этого недостатка свободны методы интегрирования с адаптивным выбором шага разбиения. Если трехточечный метод Симпсона не дает достаточную точность на заданном интервале, он делится на 3 равные части и метод вновь применяется к каждой из полученных частей.

Лабораторная работа

В заданиях лабораторной работы 6 предлагается выполнить распараллеливание последовательных программ, предназначенных для вычисления определенных интегралов. В задании 4 распараллеливание производится с помощью MPI. Цель работы – получить навык анализа простых программ и выявления в них потенциального параллелизма, применить для распараллеливания OpenMP и MPI, сравнить трудоемкость обоих подходов и эффективность полученного результата. Звездочкой отмечено задание повышенной сложности.

Задания для практической работы

Задание 1

Получить у преподавателя файл с исходным текстом программы (примеры 1, 2) и ознакомиться с реализацией квадратурной формулы.

Задание 2

Откомпилировать программу, выполнить расчет. Определить процессорное время, потраченное на выполнение расчета.

Задание 3

Проанализировать последовательный код и выявить участки потенциального параллелизма. Выполнить распараллеливание с помощью OpenMP. Определить процессорное время, потраченное на выполнение расчета для разного числа потоков (меньшего, равного и большего, чем число процессоров). Сравнить с результатом, полученным в задании 2. Объяснить полученный результат.

Задание 4

Распараллелить программу с помощью MPI. Определить процессорное время, потраченное на выполнение расчета. Сравнить с результатами, полученными в заданиях 2 и 3.

Задание 5

На основании результатов, полученных при выполнении заданий данной лабораторной работы, написать отчет, в котором содержатся выводы об эффективности различных способов распараллеливания исходного последовательного кода и трудоемкости реализации этих способов на практике.

Пример 1

В программе на языке Fortran 90 реализован метод трапеций.

program integral_trapez 
 
integer, parameter :: div_no = 100 
real, parameter :: x0 = 0., x1 = 1. !3.14159 
real, external :: F 
real :: result 
 
result = trapezium(F, x0, x1, div_no) 
print *, result 
 
end 
 
 
real function trapezium(F, x0, x1, div_no) 
 
real, external :: F 
real, intent(in) :: x0, x1 
integer, intent(in) :: div_no 
 
real :: x, dx, sum 
integer :: j 
 
 dx = (x1 - x0) / div_no 
 sum = F(x0) + F(x1) 
 x = x0 
 do j = 1, div_no - 1 
   x = x + dx 
     sum = sum + 2.0 * F(x) 
   end do 
   trapezium = dx * sum / 2.0 
end 
 
real function F(x) 
real, intent(in) :: x 
!F= sin(x) 
F = 4./(1.+x**2) 
end

Пример 2

В программе на языке Fortran 90 реализован метод Симпсона.

program integral_simps 
 
integer, parameter :: div_no = 100 
real, parameter :: x0 = 0., x1 = 1. !3.14159 
real, external :: F 
real :: result 
 
result = simpson(F, x0, x1, div_no) 
print *, result 
 
end 
 
 
real function simpson(F, x0, x1, div_no) 
 
real, external :: F 
real, intent(in) :: x0, x1 
integer, intent(in) :: div_no 
 
real :: x, dx, sum 
integer :: j 
 
 dx = (x1 - x0) / (2.0 * div_no) 
 sum = F(x0) + F(x1) 
 x = x0 
 do j = 1, 2 * div_no - 1 
   x = x + dx 
   if (mod(j, 2) /= 0) then 
     sum = sum + 4.0 * F(x) 
   else 
     sum = sum + 2.0 * F(x) 
   end if 
   end do 
   simpson = dx * sum / 3.0 
end 
 
real function F(x) 
real, intent(in) :: x 
!F= sin(x) 
F = 4./(1.+x**2) 
end

Дальше >>

Программирование на кластерах с использованием инструментов Intel (Intel Cluster Studio)

Самостоятельная работа 6: Распараллеливание программы вычисления определенного интеграла с помощью OpenMP

Распараллеливание программ с помощью OpenMP

Трансляция OpenMP-программ

Приближенное вычисление определенного интеграла

Метод трапеций

Метод Симпсона

Лабораторная работа

Задания для практической работы

Задание 1

Задание 2

Задание 3

Задание 4

Задание 5

Пример 1

Пример 2

Вопросы и ответы

Авторизоваться

Программирование на кластерах с использованием инструментов Intel (Intel Cluster Studio)

Самостоятельная работа 6: Распараллеливание программы вычисления определенного интеграла с помощью OpenMP

Распараллеливание программ с помощью OpenMP

Трансляция OpenMP-программ

Приближенное вычисление определенного интеграла

Метод трапеций

Метод Симпсона

Лабораторная работа

Задания для практической работы

Задание 1

Задание 2

Задание 3

Задание 4

Задание 5

Пример 1

Пример 2

Вопросы и ответы