Опубликован: 26.07.2006 | Доступ: свободный | Студентов: 2742 / 421 | Оценка: 4.00 / 3.77 | Длительность: 15:27:00
ISBN: 978-5-94774-818-5
Специальности: Программист, Математик
Лекция 14:

Алгоритмы нечеткого контроля и управления

< Лекция 13 || Лекция 14: 1234

Многошаговые процессы принятия решений

Для простоты будем полагать, что управляемая система A является инвариантной по времени детерминированной системой с конечным числом состояний. Именно каждое состояние x_{t}, в котором система A находится в момент времени t, t=0,1,2,\ldots, принадлежит заданному конечному множеству возможных состояний X= \{\sigma_{1},\ldots,\sigma_{n}\} ; при этом входной сигнал в момент времени t является элементом множества U=\{\alpha_{1},\ldots,\alpha_{m}\}. Динамика системы во времени описывается уравнением состояния

x_{t+1} = f(x_{t}, u_{t}),\quad   t=0,1,2,\ldots
в котором f — заданная функция, отображающая X\times
U в X. Таким образом, f(x_{t} , u_{t} ) представляет собой последующее состояние для x_{t} при входном сигнале u_{t}. Считается также, что заданы начальное состояние x_{0} и фиксированное время окончания процесса N.

Предполагается, что в каждый момент времени t на входную переменную наложено нечеткое ограничение C_{t}, являющееся нечетким множеством в U с функцией принадлежности \mu_{t}(u_{t}). Кроме того, считается, что цельнечеткое множество G_{N} в X, определяемое функцией принадлежности \(\mu _{G_N } (u_N )\). Задача заключается в нахождении максимизирующего решения.

Можно записать решение как нечеткое множество в U\times  \ldots\times
U в виде

D = C_0  \cap C_1  \cap \ldots \cap C_{N - 1}  \cap \bar
G_N ,
где G_{N}нечеткое множество в U\times  \ldots 
U, индуцируемое G_{N} в X. Для функции принадлежности имеем
\mu _D (u_0 ,\ldots,u_{N - 1} ) = \mu _0 (u_0 ) \wedge
\ldots \wedge
    \mu _{N - 1} (u_{N - 1} ) \wedge \mu _{G_N } (x_N ),

где x_{N} может быть выражено как функция от u_{1},\ldots,u_{N-1} и x_{0} путем последовательного применения уравнения x_{t+1} = f(x_{t},
u_{t}).

Для многошаговых процессов целесообразно представить решение в виде:

u_t  = \pi _t (x_t ),\quad t = 0,1,\ldots,N - 1,
где \pi_{t} — принятая "стратегия", или правило выбора входного воздействия u_{t} в зависимости от состояния системы x_{t}.

Таким образом, задача сводится к нахождению оптимальных стратегий \pi_{t} и соответствующей последовательности входных воздействий u_{1},\ldots,u_{N-1}, максимизирующих \mu_{D}. Для решения применяется метод динамического программирования:

\begin{gathered}
  \mu _D (u_0^M ,...,u_{N - 1}^M ) =  \\
   = \mathop {\max }\limits_{u_0 ,\ldots,u_{N - 2} } \;\mathop {\max }
    \limits_{u_{N - 1} } \;(\mu _0 (u_0 ) \wedge \ldots
        \wedge \mu _{N - 1} (u_{N - 1} ) \wedge \mu _{G_N } (f(x_{N - 1} ,
            u_{N - 1} ))) =  \\
   = \mathop {\max }\limits_{u_0 ,\ldots,u_{N - 2} } \;(\mu _0 (u_0 )
    \wedge \ldots \wedge \mu _{N - 2} (u_{N - 2} ) \wedge \mu _{G_{N - 1} }
        (x_{N - 1} )), \\
\end{gathered}
где \(\mu _{G_{N - 1} } (x_{N - 1} ) = \mathop {\max }\limits_{u_{N - 1} } (\mu
_{N - 1} (u_{N - 1} ) \wedge \mu _{G_n } (f(x_{N - 1} ,u_{N - 1} )))\) может рассматриваться как функция принадлежности нечеткой цели в момент t =
N-1, индуцированной заданной целью G_{N} в момент t = N.

Повторяя процесс обратных итераций, получаем систему рекуррентных уравнений

\mu _{G_{N - v} } (x_{N - v} ) = \mathop {\max
}\limits_{u_{N - v} } \;(\mu _{N - v} (u_{N - v} ) \wedge \mu _{G_{N - v + 1}
} (x_{N - v + 1} )),
где \(x_{N - v + 1}  = f(x_{N - v} ,u_{N - v} ),\quad v = 1,\ldots,N\), которая дает решение задачи. Таким образом, максимизирующее решение достигается последовательной максимизацией величин \(u_{N - v}\), причем \(u_{N - v}^M\) определяется как функция от \(x_{N - v} ,\quad v = 1,\ldots,N\).

В качестве простого примера рассмотрим систему с тремя состояниями \sigma_{1}, \sigma_{2} и \sigma_{3} и двумя входными сигналами \alpha_{1} и \alpha_{2}. Пусть N=2 и нечеткая цель в момент времени t=2 определяется функцией принадлежности, принимающей значения

\mu _{G_1 } (\sigma _1 ) = 0,3;\quad \mu _{G_2 } (\sigma _2
) = 1;\quad \mu _{G_3 } (\sigma _3 ) = 0,8.

Пусть далее, нечеткие ограничения в моменты t=0 и t=1 задаются функциями

\begin{gathered}
  \mu _0 (\alpha _1 ) = 0,7;\quad \mu _0 (\alpha _2 ) = 1; \\
  \mu _1 (\alpha _1 ) = 1;\;\quad \;\mu _1 (\alpha _2 ) = 0,6. \\
\end{gathered}

Допустим, что таблица изменения состояний, задающая функцию f, имеет следующий вид:

\sigma_{1} \sigma_{2} \sigma_{3}
\alpha_{1} 1 3 1
\alpha_{2} 2 1 3

Находим функцию принадлежности нечеткой цели в момент t=1:

\[
\mu _{G_1 } (\sigma _1 ) = 0,6;\quad \mu _{G_2 } (\sigma _2 ) = 0,8;\quad \mu
_{G_3 } (\sigma _3 ) = 0,6.

Соответствующее максимизирующее решение имеет вид:

\pi _1 (\sigma _1 ) = \alpha _2 ;\quad \pi _1 (\sigma _2 )
= \alpha _1 ;\quad \pi _1 (\sigma _3 ) = \alpha _2 .

Аналогично, для t = 0 имеем

\begin{gathered}
\mu _{G_1 } (\sigma _1 ) = 0,8;\quad \mu _{G_2 } (\sigma _2 ) = 0,6;\quad \mu
_{G_3 } (\sigma _3 ) =
0,6,
\\
\pi _0 (\sigma _1 ) = \alpha _2 ;\quad \pi _0 (\sigma _2 ) = \alpha _1  \vee
\alpha _2 ;\quad \pi _0 (\sigma _3 ) = \alpha _1  \vee \alpha _2 .
\end{gathered}

Итак, если начальное состояние в момент времени t=0 есть \sigma_{1}, то максимизирующим решением будет \alpha_{2}, причем соответствующее значение функции принадлежности \(\mu _{G_i }\) равно 0,8.

< Лекция 13 || Лекция 14: 1234
Владимир Власов
Владимир Власов

Зачем необходимы треугольные нормы и конормы? Как их использовать? Имеется ввиду, на практике.