НОУ ИНТУИТ | Основы теории нечетких множеств. Лекция 14: Алгоритмы нечеткого контроля и управления

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 26.07.2006 | Доступ: свободный | Студентов: 3071 / 549 | Оценка: 4.00 / 3.77 | Длительность: 15:27:00

ISBN: 978-5-94774-818-5

Темы: Алгоритмы и дискретные структуры, Искусственный интеллект и робототехника

Специальности: Программист, Математик

|

Вам нравится? Нравится 35 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Многошаговые процессы принятия решений

Для простоты будем полагать, что управляемая система является инвариантной по времени детерминированной системой с конечным числом состояний. Именно каждое состояние $x_{t}$ , в котором система находится в момент времени , $t=0,1,2,\ldots$ , принадлежит заданному конечному множеству возможных состояний $X= \{\sigma_{1},\ldots,\sigma_{n}\}$ ; при этом входной сигнал в момент времени является элементом множества $U=\{\alpha_{1},\ldots,\alpha_{m}\}$ . Динамика системы во времени описывается уравнением состояния

$x_{t+1} = f(x_{t}, u_{t}),\quad t=0,1,2,\ldots$

в котором

— заданная функция, отображающая $X\times U$ в

. Таким образом, $f(x_{t} , u_{t} )$ представляет собой последующее состояние для $x_{t}$ при входном сигнале $u_{t}$ . Считается также, что заданы начальное состояние $x_{0}$ и фиксированное время окончания процесса

.

Предполагается, что в каждый момент времени на входную переменную наложено нечеткое ограничение $C_{t}$ , являющееся нечетким множеством в с функцией принадлежности $\mu_{t}(u_{t})$ . Кроме того, считается, что цель — нечеткое множество $G_{N}$ в , определяемое функцией принадлежности $\mu _{G_N } (u_N )$ . Задача заключается в нахождении максимизирующего решения.

Можно записать решение как нечеткое множество в $U\times \ldots\times U$ в виде

$D = C_0 \cap C_1 \cap \ldots \cap C_{N - 1} \cap \bar G_N ,$

где $G_{N}$ — нечеткое множество в $U\times \ldots U$ , индуцируемое $G_{N}$ в

. Для функции принадлежности имеем

$\mu _D (u_0 ,\ldots,u_{N - 1} ) = \mu _0 (u_0 ) \wedge \ldots \wedge \mu _{N - 1} (u_{N - 1} ) \wedge \mu _{G_N } (x_N ),$

где $x_{N}$ может быть выражено как функция от $u_{1},\ldots,u_{N-1}$ и $x_{0}$ путем последовательного применения уравнения $x_{t+1} = f(x_{t}, u_{t})$ .

Для многошаговых процессов целесообразно представить решение в виде:

$u_t = \pi _t (x_t ),\quad t = 0,1,\ldots,N - 1,$

где $\pi_{t}$ — принятая "стратегия", или правило выбора входного воздействия $u_{t}$ в зависимости от состояния системы $x_{t}$ .

Таким образом, задача сводится к нахождению оптимальных стратегий $\pi_{t}$ и соответствующей последовательности входных воздействий $u_{1},\ldots,u_{N-1}$ , максимизирующих $\mu_{D}$ . Для решения применяется метод динамического программирования:

$\begin{gathered} \mu _D (u_0^M ,...,u_{N - 1}^M ) = \\ = \mathop {\max }\limits_{u_0 ,\ldots,u_{N - 2} } \;\mathop {\max } \limits_{u_{N - 1} } \;(\mu _0 (u_0 ) \wedge \ldots \wedge \mu _{N - 1} (u_{N - 1} ) \wedge \mu _{G_N } (f(x_{N - 1} , u_{N - 1} ))) = \\ = \mathop {\max }\limits_{u_0 ,\ldots,u_{N - 2} } \;(\mu _0 (u_0 ) \wedge \ldots \wedge \mu _{N - 2} (u_{N - 2} ) \wedge \mu _{G_{N - 1} } (x_{N - 1} )), \\ \end{gathered}$

где $\mu _{G_{N - 1} } (x_{N - 1} ) = \mathop {\max }\limits_{u_{N - 1} } (\mu _{N - 1} (u_{N - 1} ) \wedge \mu _{G_n } (f(x_{N - 1} ,u_{N - 1} )))$ может рассматриваться как функция принадлежности нечеткой цели в момент t =
N-1

, индуцированной заданной целью $G_{N}$ в момент t = N

.

Повторяя процесс обратных итераций, получаем систему рекуррентных уравнений

$\mu _{G_{N - v} } (x_{N - v} ) = \mathop {\max }\limits_{u_{N - v} } \;(\mu _{N - v} (u_{N - v} ) \wedge \mu _{G_{N - v + 1} } (x_{N - v + 1} )),$

где $x_{N - v + 1} = f(x_{N - v} ,u_{N - v} ),\quad v = 1,\ldots,N$ , которая дает решение задачи. Таким образом, максимизирующее решение достигается последовательной максимизацией величин $u_{N - v}$ , причем $u_{N - v}^M$ определяется как функция от $x_{N - v} ,\quad v = 1,\ldots,N$ .

В качестве простого примера рассмотрим систему с тремя состояниями $\sigma_{1}$ , $\sigma_{2}$ и $\sigma_{3}$ и двумя входными сигналами $\alpha_{1}$ и $\alpha_{2}$ . Пусть N=2 и нечеткая цель в момент времени t=2 определяется функцией принадлежности, принимающей значения

$\mu _{G_1 } (\sigma _1 ) = 0,3;\quad \mu _{G_2 } (\sigma _2 ) = 1;\quad \mu _{G_3 } (\sigma _3 ) = 0,8.$

Пусть далее, нечеткие ограничения в моменты t=0 и t=1 задаются функциями

$\begin{gathered} \mu _0 (\alpha _1 ) = 0,7;\quad \mu _0 (\alpha _2 ) = 1; \\ \mu _1 (\alpha _1 ) = 1;\;\quad \;\mu _1 (\alpha _2 ) = 0,6. \\ \end{gathered}$

Допустим, что таблица изменения состояний, задающая функцию , имеет следующий вид:

	$\sigma_{1}$	$\sigma_{2}$	$\sigma_{3}$
$\alpha_{1}$	1	3	1
$\alpha_{2}$	2	1	3

Находим функцию принадлежности нечеткой цели в момент t=1 :

$\[ \mu _{G_1 } (\sigma _1 ) = 0,6;\quad \mu _{G_2 } (\sigma _2 ) = 0,8;\quad \mu _{G_3 } (\sigma _3 ) = 0,6.$

Соответствующее максимизирующее решение имеет вид:

$\pi _1 (\sigma _1 ) = \alpha _2 ;\quad \pi _1 (\sigma _2 ) = \alpha _1 ;\quad \pi _1 (\sigma _3 ) = \alpha _2 .$

Аналогично, для t = 0 имеем

$\begin{gathered} \mu _{G_1 } (\sigma _1 ) = 0,8;\quad \mu _{G_2 } (\sigma _2 ) = 0,6;\quad \mu _{G_3 } (\sigma _3 ) = 0,6, \\ \pi _0 (\sigma _1 ) = \alpha _2 ;\quad \pi _0 (\sigma _2 ) = \alpha _1 \vee \alpha _2 ;\quad \pi _0 (\sigma _3 ) = \alpha _1 \vee \alpha _2 . \end{gathered}$

Итак, если начальное состояние в момент времени t=0 есть $\sigma_{1}$ , то максимизирующим решением будет $\alpha_{2}$ , причем соответствующее значение функции принадлежности $\mu _{G_i }$ равно 0,8.

Дальше >>

Авторизоваться

Основы теории нечетких множеств

Алгоритмы нечеткого контроля и управления

Многошаговые процессы принятия решений

Вопросы и ответы