Московский государственный университет путей сообщения
Опубликован: 10.10.2014 | Доступ: свободный | Студентов: 866 / 193 | Длительность: 22:10:00
Лекция 11:

Роевые и муравьиные алгоритмы

11.5. Основные модификации РА

В настоящее время РА применяется при решении многих проблем, включая стандартные задачи численной и комбинаторной оптимизации, обучение нейронных сетей и т.д. и показал неплохие результаты. Но в некоторых случаях изложенная базовая версия РА имеет тенденцию к преждевременной сходимости и не находит оптимальные решения. Поэтому разработан ряд модификаций РА, основные из которых включают введение веса инерции, ограничение и сужение диапазона скорости частиц, различные способы определения персональных и глобальных позиций и различные модели скорости, которые будут рассмотрены ниже. При этом важнейшим аспектом, который определяет эффективность и точность алгоритма оптимизации является соотношение (exploration-exploitation) исследование-локализация пространства поиска. Исследование (exploration) характеризует способность алгоритма исследовать различные области пространства поиска (расширять его) для того, чтобы локализовать хорошее решение. С другой стороны локализация (exploitation – разработка, эксплуатация) определяет способность алгоритма концентрировать поиск в перспективной области для того, чтобы улучшить решение. Хороший алгоритм оптимизации должен поддерживать баланс между этими двумя противоположными свойствами.

Ограничение скорости является одним из основных методов повышения эффективности РА, где свойства исследования-локализации пространства поиска определяются уравнением изменения скорости (11.2) (или 11.5), которое содержит три слагаемых, регулирующих величину и направление изменения скорости частицы. Уже в ранних работах было обнаружено, что часто скорость частиц резко увеличивается, особенно это характерно для частиц, далеких от лучших локальных и глобальных позиций. В результате частицы получают большие положительные приращения и покидают границы "зоны интереса" в пространстве поиска (частицы расходятся). Поэтому желательно ограничить изменение скоростей частиц в некотором диапазоне. Если скорость частицы превышает некоторый порог, то она искусственно устанавливается в некоторое максимально допустимое значение. Пусть V_{\max,j} обозначает максимально допустимую скорость в j-й компоненте. Тогда скорость частицы регулируется (перед изменением позиции согласно уравнению (11.1)) следующим образом

v_{ij}(t+1)=\begin{cases}v'_{ij}(t+1)&\mbox{если $v'_{ij}(t+1)<$}V_{\max,j}\\V_{\max,j}&\mbox{если $v'_{ij}(t+1)\ge$}V_{\max,j}\end{cases}, ( 11.11)

где V'_{i,j} вычисляется в соответствии с (11.2) (или (11.5)). При этом значение V_{\max,j} имеет большое значение, поскольку оно определяет уровень разбиения пространства поиска путем ограничения увеличения скорости. Большое значение V_{\max,j} способствует глобальному исследованию пространства поиска, в то время как малое – локализации хорошего решения. Кроме этого, малые значения увеличивают число итераций при поиске решения. Более того, при этом рой может попасть в ловушку локального экстремума. С другой стороны большие значения V_{\max,j} увеличивают риск пропуска перспективной области. Частицы могут "перепрыгнуть" через хорошие решения и продолжать поиск в неперспективной области пространства поиска. Часто V_{\max,j} полагают

V_{\max,j}=\delta(x_{\max,j}-x_{\min,j}), ( 11.12)

где x_{\max,j} и x_{\min,j} соответственно максимальное и минимальное значение j-ой компоненты, а \delta\in(0,1]. Значение коэффициента \delta зависит от проблемной области и определяется экспериментально. Следует отметить следующие важные аспекты данной модификации РА:

  1. Удерживание скорости в некотором диапазоне не ограничивает явно позицию частицы и непосредственно влияет только на размер шага перемещения, который определяется скоростью.
  2. Максимальное значение скорости ассоциируется с каждой компонентой j и пропорционально ее области определения. Для упрощения предположим, что по компонентам (измерениям) значения скорости ограничены одной константой V_{\max}. Тогда, в случае x_{\max,j}-x_{\min,j}\ll V_{\max} в измерении j-ой частицы могут значительно отклониться от оптимума в компоненте j.

Данный подход имеет преимущество в том, что сдерживает резкое увеличение скорости, но пользователь должен следить за этим. Во-первых, ограничение скорости изменяет не только шаг изменения, но и направление движения частицы. Этот эффект показан на рис.11.4 для двумерного случая.

Эффект ограничения скорости

Рис. 11.4. Эффект ограничения скорости

На этом рисунке x_i(t+1) обозначает позицию i-ой частицы без ограничения скорости, а x'_i(t+1)– ее позицию в результате ограничения скорости по второй компоненте x_2. Заметим, что при этом направление поиска и величина шага изменились.

Кроме этого, существует другая проблема в случае равенства всех скоростей максимальных значений по всем компонентам. Если не предусмотрены измерения для предотвращения такой ситуации, то частицы остаются на границе гиперкуба, определяемого как [x_i(t)-V_{\max},x_i(t)+V_{\max}]. Возможно, что частицы могут задержаться в оптимуме, но в общем случае рою трудно искать решение в этой локальной области. Эта проблема может быть решена по-разному - например, путем ввода веса инерции или временным уменьшением значения V_{\max,j}[3].

Введение веса инерции является также популярной модификацией РА, где контролируется момент частицы путем регулирования вклада предыдущей скорости следующим образом:

v_{ij}(t+1)=wv_{ij}(t)+c_1r_{1j}(t)|y_{ij}(t)-x_{ij}(t)|+c_2r_{2j}(t)|\hat y_{j}(t)-x_{ij}(t)| ( 11.13)

для глобального РА. Аналогично это делается и для локального РА.

Значение коэффициента w играет большую роль и определяет компромисс между исследованием и локализацией в пространстве поиска. При w\ge 1 скорость частицы увеличивается (с учетом ранее рассмотренного ограничения) и рой "расходится". Частицам тяжело изменить направление движения для того, чтобы вернуться к перспективной области поиска решения. При w< 1 частицы замедляются до тех пор, пока их скорость не станет равной нулю. Таким образом, большие значения w способствуют исследованию пространства поиска, а малые - локализации решения. Однако слишком малые значения w лишают рой способности исследовать пространство поиска. Чем меньше w, тем больше влияние когнитивной и социальной компоненты. Как и остальные параметры, оптимальное значение w проблемно-ориентировано (зависит от задачи). В первых реализациях этого подхода использовались постоянные значения w. Далее стали использовать динамические w, где старт производится с большим значением w, которое далее постепенно уменьшается. Выбор значения w можно совместить с определением значений коэффициентов c_1 и c_2. Например, показано [3], что w>\frac{1}{2}(c_1+c_2)-1 гарантирует сходимость траектории частицы. Если это условие не выполняется, то возможно расхождение или зацикливание движения частиц.

При динамическом изменении веса инерции обычно применяются следующие методы:

  1. Случайное регулирование, где различные веса инерции случайно генерируются на каждой итерации. В некоторых случаях используется Гауссово распределение, где w\sim N(0.72,\sigma) и \sigma достаточно мало, чтобы w не превышало 1. Иногда полагают w=(c_1r_1+c_2r_2) без случайного изменения вклада когнитивной и социальной компонент [3].
  2. Линейное уменьшение веса инерции, например в соответствии с

    w(t)=(w(0)-w(n_t))\frac{(n_t-1}{n_t}+w(n_t),

    где n_t- максимальное число итераций выполнения алгоритма, w(0) – начальный вес, w(n_t) – конечный вес, w(t) – текущий вес на итерации t. Заметим, что w(0)>w(n_t).

  3. Нелинейное уменьшение веса инерции, которое часто позволяет сократить этап исследования пространства поиска и может быть выполнено по-разному:

    w(t+1)=\frac{(w(t)-0.4)(n_t-t)}{n_t+0.4}\quad\mbox{с } w(0)=0.9;\\w(t+1)=\alpha w(t')\quad\mbox{с } w(0)=0.975

    и другими методами [3].

  4. Нечеткие (fuzzy) веса инерции на основе нечетких множеств и правил регулирования [3].

Использование коэффициента сжатия (constriction coefficient) является модификацией РА, которая похожа на использование коэффициента инерции. Здесь уравнение изменения скорости частицы выполняется следующим образом:

v_{ij}=(t+1)=\chi[v_{ij}(t)+\phi_1(y_{ij}(t)-x_{ij}(t))+\phi_2(\hat y_j(t)-x_{ij}(t))],\\\mbox{где}\ \chi=\frac{2k}{|2-\phi-\sqrt{\phi(\phi-4)}|}\ \mbox{c }\phi=\phi_1+\phi_2,\phi_1=c_1r_1\ and\ \phi_2=c_2r_2.

Этот подход является альтернативой методу ограничения скорости и при \phi\ge 4\ and\ k\in[0,1] гарантирована сходимость роя [3].

Асинхронные версии РА также применяются на практике наряду с синхронными, к которым относится основной РА представленный выше.В синхронных РА изменение персональных лучших позиций и глобальных лучших позиций выполняется синхронно независимо от изменения позиций частиц. В асинхронных РА, напротив, изменение новой лучшей позиции производится после того как каждая частица роя изменила свою позицию.