Томский государственный университет систем управления и радиоэлектроники
Опубликован: 01.11.2012 | Доступ: свободный | Студентов: 651 / 76 | Длительность: 06:01:00
Дополнительный материал 5:

Intel-VTune-Amplifier-XE-2013-PB-Russian

Ключевые слова: программные средства

Орингинал текста Вы можете скачать здесь.

Основные особенности

  • Профилирует C, C++, C#, Fortran, Assembly и Java.
  • Собирайте полные данные для настройки производительности центрального и графического процессоров, многоядерного масштабирования, пропускной способности и многого другого.
  • Средства мощного анализа позволяет вам сортировать, фильтровать и визуализировать результаты по оси времени для вашего исходного кода.
  • Командная строка для автоматизации регрессионного тестирования и упрощения удаленного сбора данных.

"Новый VTune™ Amplifier XE еще больше расширяет функциональность уже существующего инструмента, без которого невозможно обойтись. Анализ горячих точек стека вызовов на базе выборки - замечательная функция, и только ради нее стоит приобрести данное обновление. Мы также были поражены возможностями анализа параллельности, блокировок и ожиданий, который в состоянии предоставлять полезные данные по таким сложным приложениям как Premiere Pro"

Рич Гербер – технический директор, MediaCore, Adobe Systems Inc.

Также доступно в:

  • Intel® Parallel Studio XE
  • Intel® C++ Studio XE
  • Intel® Fortran Studio XE
  • Intel® Cluster Studio XE

Взаимодействующие продукты

  • Intel® Graphics Performance Analyzer

Поддержка ОС:

  • Windows*
  • Linux*

Оптимизация производительности последовательных и параллельных портов

Intel® VTune™ Amplifier XE 2013 представляет собой основной профилировщик C, C++, C#, Fortran, Assembly и Java*.

Простота

Анализ производительности может оказаться трудоемким, но инструмент должен быть простым.

  • Отсутствие специальных конструкций – Используйте рабочую конструкцию с символами Вашего обычного компилятора.
  • Предварительно заданные профили производительности – Предварительно заданные профили производительности обеспечивают простое задание параметров.
  • Низкие издержки – Точные результаты, на которые вы можете положиться.
  • Командная строка – автоматический регрессионный анализ. Простой удаленный сбор данных.

Универсальность – Широкий выбор профилей производительности

Независимо от того, осуществляете ли вы первую настройку или расширенную оптимизацию, VTune Amplifier XE предоставляет данные, необходимые для обеспечения соответствия разнообразным требованиям настройки.

  • Анализ горячих точек – Быстрое нахождение кода, которое обычно занимает много времени. См. вызывающие последовательности.
  • Расширенный анализ горячих точек – низкие издержки, высокое разрешение с использованием встроенного оборудования.
  • Блокировки и ожидания – Многопоточная настройка. Поиск объектов синхронизации, препятствующих масштабированию производительности.
  • Анализ в масштабе системы – настройка драйверов, модулей ядра и мультипроцессовых приложений.
  • Анализ числа вызов – поиск кода, использующего преимущества встраивания.
  • Анализ пропускной способности, памяти, сегмента и т. д. – расширенный анализ для комплексного подхода.
  • Приложения MPI – анализ гибридных приложений с использованием MPI и OpenMP. Установка в кластер.
  • GPU Compute – настройка OpenCL*. Собирайте и изучайте показатели производительности ГП (новые модели процессоров, только для Windows*).

Производительность – Сортировка, фильтрация и визуализация

Наличия качественных данных недостаточно. Вам необходимы инструменты для интеллектуального анализа данных и облегчения их понимания.

  • Просмотр кода – Просматривайте данные профиля в своем коде и узлах. (C, C++, C#, Fortran, и Java).
  • Временная линия – Визуализация взаимодействия потоков, балансировка рабочих нагрузок, фильтрация данных.
  • Результаты фильтрации – устранение шума из данных. Выбор нужного представления.
  • Комментарии к задаче – добавление комментариев к источнику и добавление смысловых меток к задаче на временной линии.
  • Анализ фреймов – обнаружение фреймов DirectX* и фильтрация результатов для отображения медленного кода в медленных фреймах.
  • Intel® TBB, OpenMP* 4.0 – встроенная поддержка моделей параллельного программирования.
  • Выделение ключевых объектов – выделение потенциальных возможностей для настройки. При наведении курсора выводятся соответствующие предложения по отладке.
Функции, использующие большую часть времени, которую процессор затрачивает на операции с плавающей точкой, находятся вверху списка. Дважды щелкните на функции, чтобы увидеть источник с подробной информацией по профилю.

Основные особенности


Быстрое нахождение кода, потребляющего большое количество времени центрального (или графического) процессора

В результате анализа горячих точек вы получаете отсортированный список функций, использующих большое количество времени процессора. Именно здесь настройка дает наибольшее преимущество. Нажмите [+] для просмотра стека вызовов. Дважды щелкните для просмотра исходного кода. Новая функция! На последних моделях процессоров появилась возможность собирать данные графического процессора для настройки OpenCL-приложений.

Посмотрите результаты для Вашего исходного кода

При двойном нажатии на список функций открывается самая горячая точка функции.

Многопоточная настройка с анализом блокировок и ожиданий

Быстрое выявление общей причины низкой производительности при параллельном программировании: длительное время ожидания при блокировке, когда ядра недостаточно эффективно используются во время ожидания. Профили для горячей точки, а также блокировок и ожиданий используют программный сборщик, который работает на Intel® и совместимых процессорах. Новая функция! Поддержка OpenMP 4.0 и упрощение представления данных OpenMP.

Интеллектуальный анализ данных с фильтрацией временной линии

Выберите временной диапазон во временной линии и отфильтруйте данные (например, запуск приложения) для получения необходимой информации. При выполнении выбора и фильтрации во временной линии сетка, содержащая перечень функций, использующих большое количество времени процессора, обновляется для отображения списка, отфильтрованного для выбранного времени.

Визуализация поведения потока

Следите за выполнением потоков или их нахождением в режиме ожидания, а также за переходами. Балансировка рабочих нагрузок.

Профилировка удаленных систем - Профилировка работающих приложений

Профилировка удаленных систем. Используйте локальный графический интерфейс для настройки командной строки, выполняйте сбор удаленно, а затем анализируйте результаты при помощи графического интерфейса или командной строки. Профилировка без перезапуска приложения. Профилировка запущенного процесса или всей системы с выборкой аппаратных событий с последующей фильтрацией необходимых объектов.

Низкие издержки / Профилирование оборудования с высоким разрешением

Вдобавок к анализу горячих точек, который работает на Intel® и совместимых процессорах, Intel® VTune™ Amplifier XE оборудован расширенной функцией анализа горячих точек, которая использует блок мониторинга производительности (PMU) на процессорах Intel для сбора данных с очень малыми издержками. Увеличенное разрешение (1 мс против 10 мс) помогает обнаруживать горячие точки в небольших быстро выполняющихся функциях. Теперь есть возможность опционального сбора данных из стека для определения вызывающей последовательности.

Предварительно заданные профили событий оборудования

Получайте удовольствие от простоты профилирования для новых процессоров. Больше не требуется запоминать сложные имена событий. Усовершенствованные профили, например, анализ пропускной способности памяти, доступ к памяти и возможности настройки поиска ошибочности прогнозирования ветвления. Теперь с опциональным сбором данных из стека для определения вызывающей последовательности. Профили различаются по микроархитектуре.

Подсветка функциональных возможностей

Ячейка выделяется розовым цветом при наличии возможности настройки. При наведении курсора выводятся соответствующие предложения по отладке.

Подробная информация

Настройка параллельных (и последовательных) приложений

Профайлеры старого стиля предоставляют данные только для настройки последовательных приложений. Хотя это и важно, они являются недостаточными при необходимости в оптимизации современных последовательных приложений. Возможности VTune Amplifier XE анализа параллельности, блокировок и ожиданий в сочетании с потоковой временной линией предоставляют вам инструменты, необходимые для масштабируемости и параллельной производительности.

Мощный анализ данных

В отличие от большинства конкурирующих продуктов Intel VTune Amplifier XE выполняет не только отображение данных, но и позволяет их анализировать.

Выберите временной диапазон, используя временную линию, и отфильтруйте данные, чтобы исключить все ненужное за пределами данного временного диапазона. Это приведет к обновлению списка функций, потребляющих большую часть времени процессора для показа потребителей времени процессора на протяжении выбранного промежутка времени. Это позволит вам отфильтровать шум, например, при инициализации, или выделить падение производительности, которое имеет место только в определенный момент времени.

По умолчанию данные группируются по функциям, затем происходит вызов стека для получения списка функций, использующих большую часть времени процессора. Однако перегруппировка данных может выполняться различными способами. Например, перегруппировка по функции, а затем по потоку, чтобы оценить сбалансированность стандартного разделения на потоки.

Сочетание выбора и группирования может быть особенно эффективным. Настраиваете графическое приложение? Используйте перегруппировку по фрейму для поиска медленных фреймов. Выберите самые медленные фреймы и выполните фильтрацию. Затем выполните перегруппировку по функции. Теперь у вас имеется список функций, использующих большую часть времени в медленных фреймах. Это в точности то, что вам необходимо знать при настройке ускорения медленных фреймов.

Что нового?

Свойство Преимущество
Настройка встраивания вместе со счетом вызовов При частом вызове функции, возможно, имеет смысл "встроить" код, чтобы избежать издержек при вызове функции. Новая функция: статистические данные для счета вызовов помогут вам принять наилучшее решение по встраиванию.
Выборка из аппаратного стека Intel® VTune™ Amplifier XE теперь поддерживает выборку из стека из аппаратных и программных сборщиков. Расширенные аппаратные события, например ошибки кэш-памяти, могут также иметь стеки, что облегчает поиск возможностей для настройки.
Улучшенный анализ пропускной способности памяти VTune Amplifier XE выполняет более точный анализ пропускной способности памяти для операций чтения и записи в кэш и память. Также добавляется анализ для дополнительных типов процессора.
Профилирование Java Анализ Java-кода или смешанного Java- и собственного кода. Результаты отображаются в оригинальном исходном коде Java.
Профилировка запущенного приложения Java Прикрепление к запущенному процессу теперь работает и для приложений Java, что устраняет необходимость перезапускать эти приложения для профилировки.
Анализ пользовательских задач API для добавления комментариев к задаче используется для добавления комментариев к исходному коду, чтобы VTune Amplifier XE отображал информацию о выполняемых задачах. Например, если вы отмечаете сегменты вашего конвейера, то они будут маркироваться во временной линии, а также будет приводиться подробная информация. Это облегчает понимание данных профилирования.
Автоматическое обнаружение фреймов Microsoft DirectX* Наблюдается недостаточная производительность игрового окружения? Вам следует узнать, где вы тратите большое количество времени при малой частоте обновления кадров. Intel VTune Amplifier XE может автоматически обнаруживать фреймы Microsoft DirectX и осуществлять фильтрацию результатов, чтобы показать вам, что происходит в случае медленных фреймов. Не используется DirectX? Просто задайте критическую область, используя API, и анализ фреймов станет мощным инструментом для анализа задержки. Теперь поддерживается несколько регионов.
Настройка на сопроцессоры Intel® Xeon Phi™ Профилирование оборудования поддерживается для сопроцессоров Intel Xeon Phi. Может осуществляться сбор расширенных данных о горячих точках и событиях. Временные маркеры позволяют сопоставлять данные по нескольким картам. Предлагается для Windows* и Linux*.
Анализ MPI-приложений Анализ гибридных приложений с использованием MPI и OpenMP (или других потоков). Простая установка в кластер. Результаты сортируются в определенном порядке.
Данные профилирования ГП Сбор и анализ данных о производительности ГП для настройки OpenCL*. Сопоставляйте показатели производительности ГП/ЦП (новые модели процессоров, только для Windows*).
OpenMP 4.0 Упрощенное представление данных OpenMP благодаря управлению сходством потоков, задачами и анализу масштабируемости.
Окно вызывающего/вызываемого Упрощенный анализ первичных и вторичных функций для конкретной приоритетной функции.
Улучшенный вид сетки Возможность поиска, метрические показатели издержек и времени прокрутки и отображение иерархии циклов упрощают интерпретацию данных.
Анализ циклов Найдите горячие циклы, отнимающие большую часть времени. Их векторизация может значительно увеличить быстродействие.
Усовершенствование временных линий Сортировка временных линий, метрические показатели издержек и времени прокрутки, настраиваемая шкала времени упрощают анализ данных.
Поддержка новых процессоров VTune Amplifier XE постоянно добавляет поддержку новейших процессоров. Обновления появляются сразу после анонса новых процессоров.

– функция добавлена после первоначального выпуска. Новые функции постоянно добавляются в обновлениях и предлагаются бесплатно при наличии подписки.

Варианты приобретения: Пакеты программ, ориентированные на конкретный язык

Имеется несколько пакетов, объединяющих в себе программные средства для построения, верификации и настройки Вашего приложения. Программные продукты, включенные в настоящий обзор, выделены голубым цветом. Имеются однопользовательские и многопользовательские лицензии, а также предоставляются скидки при продаже большого количества товара, академические и студенческие скидки.

Покупка включает в себя годовую подписку на обновления продукта.

Технические характеристики

Краткое описание характеристик
Поддержка процессора Процессоры Intel® и совместимые процессоры при анализе приложений, содержащих инструкции Intel®. Многие функции профилирования работают как на оригинальных процессорах Intel®, так и на совместимых процессорах. Функции, использующие встроенный блок мониторинга производительности, требуют наличия оригинального процессора Intel® для сбора данных, однако анализ результатов может выполняться на совместимых процессорах.
Операционные системы Windows* и Linux*
Средства и среды разработки Библиотека совместима с компиляторами поставщиков продукции на стандартных платформах (например, Microsoft*, GCC, Intel). Может интегрироваться с Microsoft Visual Studio* 2008, 2010 и 2012. Подробную информацию можно получить по адресу: http://www.intel.com/software/products/systemrequirements
Языки программирования C, C++, C#, Fortran, ассемблер.
Системные требования http://www.intel.com/software/products/systemrequirements
Поддержка Цена включает в себя обновления продукта, услуги Intel® Developer Zone Support и форумы по технической поддержке (Support Forums) в течение одного года. Услуги Intel Developer Zone Support включают в себя конфиденциальную веб-поддержку соответствующими специалистами.
Сообщество Присоединяйтесь к сообществу Intel Developer Zone Support, где вы сможете учиться, делиться своим опытом или просто просматривать новости. http://software.intel.com/en-us/forums


Узнайте больше о Intel VTune Amplifier XE
  • Нажмите на приведенную ниже ссылку или введите ссылку в строку браузера: http://intel.ly/vtune-amplifier-xe
  • Или отсканируйте QR-код, приведенный слева

Скачайте бесплатную пробную версию со сроком тестирования 30 дней
  • Нажмите на приведенную ниже ссылку или введите ссылку в строку браузера: http://intel.ly/sw-tools-eval
  • Нажмите на ссылку "Профайлеры производительности"
Уведомление об оптимизации Редакция уведомления № 20110804
Компиляторы Intel могут не обеспечивать для процессоров других производителей такой же уровень оптимизации для оптимизаций, которые не являются присущими только микропроцессорам Intel. В число этих оптимизаций входят оптимизации для наборов команд SSE2, SSE3 и SSSE3, а также другие оптимизации. Корпорация Intel не гарантирует наличие, функциональность или эффективность оптимизаций микропроцессоров других производителей. Содержащиеся в данной продукции оптимизации, зависящие от микропроцессора, предназначены для использования с микропроцессорами Intel. Некоторые оптимизации, не относящиеся к микроархитектуре Intel, зарезервированы для микропроцессоров Intel. Более подробную информацию о конкретных наборах команд, предусмотренных настоящим уведомлением, можно найти в руководствах пользователя и справочных руководствах на соответствующую продукцию.