Опубликован: 15.04.2009 | Уровень: специалист | Доступ: платный
В рамках курса проводится изучение основных возможностей стандарта OpenMP, необходимых для создания эффективных параллельных программ для многоядерных и многопоточных процессоров. Рассматриваются подходы для функциональной отладки OpenMP-программ, а также отладки эффективности.
В рамках курса рассматриваются современные направления развития параллельных вычислительных систем (многоядерность и многопоточность), OpenMP – модель параллелизма по управлению, конструкции распределения работы, конструкции для синхронизации нитей, система поддержки выполнения OpenMP-программ, переменные окружения, управляющие выполнением OpenMP-программы, вложенный параллелизм, наиболее часто встречаемые ошибки в OpenMP-программах, функциональная отладка OpenMP-программ, отладка эффективности OpenMP-программ, использование OpenMP на кластере.
Цель: Цель курса состоит в изложении основных возможностей стандарта OpenMP, необходимых для создания эффективных параллельных программ для многоядерных и многопоточных процессоров.
Необходимые знания: При изложении учебного материала курса у обучаемых предполагается наличие общих (начальных) знаний в области программирования.

План занятий

ЗанятиеЗаголовок <<Дата изучения
-
Лекция 1
Введение
Современные направления развития параллельных вычислительных систем (многоядерность и многопоточность). SMP (Symmetric Multiprocessing) и DSM (Distributed Shared Memory)-системы. Процессы и нити. Модель общей памяти. Стандарт POSIX (Portable Operating System Interface for UNIX) для создания параллельных программ для мультипроцессоров.
Оглавление
    -
    Лекция 2
    OpenMP - модель параллелизма по управлению
    Выполнение OpenMP-программы (Fork and Join Model). Модель памяти. Понятие консистентности памяти. Консистентность памяти в OpenMP (weak ordering). Классы переменных (клаузы SHARED, PRIVATE; директива THREADPRIVATE).
    Оглавление
      -
      Тест 1
      15 минут
      -
      Лекция 3
      Основные понятия
      Директивы и клаузы. Понятие структурного блока. Компиляция OpenMP-программы. Параллельная область (директива PARALLEL). Понятие задачи (директива TASK).
      Оглавление
        -
        Тест 2
        15 минут
        -
        Лекция 4
        Конструкции распределения работы
        Распределение витков циклов. Циклы с зависимостью по данным. Организация конвейерного выполнения для циклов с зависимостью по данным. Распределение нескольких структурных блоков между нитями (директива SECTION). Редукционные операторы (клауза REDUCTION). Выполнение структурного блока одной нитью (директива SINGLE). Распределение операторов одного структурного блока между нитями (директива WORKSHARE). Копирование значений приватных переменных (клаузы FIRSTPRIVATE, LASTPRIVATE, COPYIN, COPYPRIVATE).
        Оглавление
          -
          Тест 3
          15 минут
          -
          Лекция 5
          -
          Тест 4
          15 минут
          -
          Лекция 6
          -
          Тест 5
          15 минут
          -
          Лекция 7
          Наиболее часто встречаемые ошибки в OpenMP-программах. Функциональная отладка OpenMP-программ
          Создание вложенной параллельной области. Распределение витков тесно-вложенных циклов (с использованием вложенных параллельных областей и клаузы COLLAPSE). Задание количества нитей для вложенной параллельной области. Задание/опрос максимального уровня вложенности для параллельных областей. Задание максимального количества создаваемых нитей (переменная OMP_THREAD_LIMIT).
          Оглавление
            -
            Тест 6
            15 минут
            -
            Лекция 8
            Отладка эффективности OpenMP-программ
            Стратегии распределения витков цикла между нитями (клауза SCHEDULE). Отмена барьерной синхронизации по окончании выполнения цикла (клауза NOWAIT). Локализация данных. Задание поведения нитей во время ожидания (переменная OMP_WAIT_POLICY). Оптимизация OpenMP-программы при помощи Intel Thread Profiler.
            Оглавление
              -
              Тест 7
              15 минут
              -
              Лекция 9
              Использование OpenMP на кластере
              Технология Intel Cluster OpenMP. Программная реализация DSM. Директива SHARABLE. Гибридная модель параллельного программирования MPI/OpenMP.
              Оглавление
                -
                Тест 8
                15 минут
                -
                5 часов
                -
                Андрей Яндуганов
                Андрей Яндуганов

                Здравствуйте. Сейчас я прохожу данный курс, и пришел к выводу, что без практики толку будет мало. Собственно, хотелось бы получить какие-либо задания для самостоятельной работы, которые мельком упоминаются в этом курсе, но нет ни слова о том, что это за задачи и где их брать.

                Светлана Токаревская
                Светлана Токаревская

                Добрый день! Пару дней назад прошла тест 1 по курсу (с принятием результатов). А сегодня нет информации об этом! Как так?

                Виктор Котов
                Виктор Котов
                Россия, Санкт-Петербург, НИУ ИТМО, 2012