НОУ ИНТУИТ | Компьютерное моделирование. Лекция 5: Планирование экспериментов

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 16.11.2010 | Доступ: свободный | Студентов: 5118 / 2816 | Оценка: 4.43 / 4.14 | Длительность: 27:21:00

Темы: Программирование, Алгоритмы и дискретные структуры

Специальности: Программист, Системный архитектор

Теги: анализ, имитационные модели, модели, GPSS World, синтез

|

Вам нравится? Нравится 50 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

4.3. Стандартные планы

Многие планы экспериментов в настоящее время стандартизованы. Они имеются в справочниках, математических пакетах программ и системах моделирования. Однако исследователь должен быть готов к модификации имеющихся планов и приспособлению их к специфическим условиям конкретных задач.

С полным факторным экспериментом мы уже знакомы. Это, как отмечалось ранее, самый информативный план, понятный по структуре, но и самый неэкономичный. Поэтому ПФЭ применяют, когда число факторов невелико. В приведенном примере 4.1 при k = 5 , q = 2 , p = 6000 , $t =\cfrac{2}{60}=\cfrac{1}{30} мин$ затраты времени на проведение компьютерного эксперимента ожидаются в 106 часов. Поэтому актуальной становится проблема более или менее обоснованного сокращения плана эксперимента (числа наблюдений). Способов сокращения плана и, следовательно, уменьшения затрат времени на проведение экспериментов, много, но все они, в конечном счете, основаны на пренебрежении эффектами парных, тройных и более взаимодействий факторов. Естественно, это снижает точность моделирования, но во многих случаях допустимо.

Рассмотрим несколько примеров.

Пример 4.2. Необходимо провести эксперимент с моделью, имеющей три двухуровневых фактора, с целью построения математической модели ("вторичной модели") процесса в виде:

$y = b_{0} +b_{1}x_{1} +b_{2}x_{2} + b_{3}x_{3} +b_{12}x_{1}x_{2} + b_{13}x _{1}x_{3} +b_{23}x_{2}x_{3} +b_{123}x _{1}x_{2}x_{3}.$

Уравнение имеет восемь коэффициентов, следовательно, достаточно провести восемь наблюдений. Это уравнение соответствует

ПФЭ типа N = 2^3 = 8 .

Полный факторный эксперимент дает возможность определить не только коэффициенты $b _{1},b_{2},b _{3}$ , соответствующие так называемым линейным эффектам (их также называют главными), но и коэффициенты $b_{12},b_{13},b_{23},b_{123}$ , соответствующие всем эффектам взаимодействия факторов, а также свободный член $b_{0}$ .

Эффекты взаимодействия двух и более факторов проявляются, если влияние каждого из них на отклик зависит от уровней, на которых установлены другие факторы.

Теперь допустим, что число наблюдений в эксперименте, равное восьми, неприемлемо и план надо сократить.

Вполне естественно предположить, что эффекты взаимодействия оказывают на реакцию системы существенно меньшее влияние, чем линейные, или даже отсутствуют вовсе, если факторы обладают свойством независимости.

Исключим их и тогда модель процесса (уравнение отклика, уравнение реакции, "вторичная модель") принимает вид:

$y = b_{0} +b_{1}x_{1} +b_{2}x_{2} +b_{3}x_{3} .$

Теперь число неизвестных коэффициентов $b_{i}$ сократилось вдвое и число необходимых наблюдений для их определения стало равно четырем.

Что это за наблюдения?

Четыре наблюдения достаточны для проведения ПФЭ при двух

факторной модели N = 2 . Этими факторами, например, могут быть $x _{1}, x_{2}$ или другая двухфакторная комбинация из трех факторов.

Уровни третьего фактора $x_{3}$ получают из первых двух с помощью, так называемого генерирующего соотношения:

Поскольку факторы двухуровневые, то в общем виде уровни принято обозначать так:

верхний уровень: +1;
нижний уровень: -1.

Новый, сокращенный план эксперимента называют полурепликой и обозначают $2^{3-1}.$ План приведен в табл. 4.1.

Таблица 4.1. План ПФЭ 2^2
№		План ПФЭ $2^{2}$		$x_{3} = x_{1}\cdot x_{2}$	Отклик $y_{i}$
№		$x_{1}$	$x_{2}$	$x_{3} = x_{1}\cdot x_{2}$	Отклик $y_{i}$
1	1	-1	-1	+1	$y_{1}$
2	1	+1	-1	-1	$y_{2}$
3	1	-1	+1	-1	$y_{3}$
4	1	+1	+1	+1	$y_{4}$

Единичный столбец $x_{0}$ обеспечивает вычисление свободного члена $b_{0}$ в модели процесса.

Таким же образом можно проводить дальнейшее сокращение планов типа $2^{k-1},$ получая четверть реплики $2^{k-2}$ и более мелкие реплики.

Естественно, такое сокращение числа экспериментов приводит к "огрублению" коэффициентов $b_{i}.$ Следовательно, полученную модель процесса y= f ( x) нужно проверять на адекватность, используя для этого "сэкономленные" наблюдения.

Рассмотренное планирование является основой и составной частью для разработки более сложных - несимметричных многоуровневых планов.

Не менее часто целью экспериментов является проверка разного рода гипотез о природе сравниваемых объектов. Например, однородны ли выходы двух систем в смысле законов распределения, характеристик этих законов. Поскольку обработка данных эксперимента ведется методами дисперсионного анализа, то и планы в данном случае называются планами дисперсионного анализа. Сущность дисперсионного анализа мы рассмотрим в следующей теме.

Планы дисперсионного анализа могут быть полные, если используются все возможные сочетания условий (аналогично ПФЭ), и неполные, которые применяются тогда, когда полные планы оказываются громоздкими и неэкономичными. Сокращение планов происходит, как и ранее, за счет исключения некоторых сочетаний факторов (взаимодействий) и уровней случайным или традиционным образом.

Наиболее популярными из неполных планов является симметричный план "латинский квадрат" или его вариации. Этот план целесообразно применять, когда из всех существенных факторов можно выделить один доминирующий (самый существенный).

В планах дисперсионного анализа часто факторы обозначают латинскими буквами $A, B, C, \ldots$ , а уровни - индексами при соответствующих факторах: $A_{1}, A_{2},B_{1}.$

Пример 4.3. Построить план "латинский квадрат" симметричного трехфакторного четырехуровневого эксперимента. Доминирующий фактор .

Решение

Исходные данные: k = 3, q =4 .

Введем обозначения факторов и уровней:

$A_{1}, A_{2}, A_{3}, A_{4}$ - уровни доминирующего фактора ;

$B_{1}, B_{2}, B_{3}, B_{4}$ - уровни фактора ;

$C_{1}, C_{2}, C_{3}, C_{4}$ - уровни фактора .

План приведен в табл. 4.2.

Таблица 4.2. План "латинский квадрат"
Уровни	Уровни
Уровни	$C_{1}$	$C_{2}$	$C_{3}$	$C_{3}$
$B_{1}$	$A_{1}$	$A_{2}$	$A_{3}$	$A_{4}$
$B_{2}$	$A_{2}$	$A_{3}$	$A_{4}$	$A_{1}$
$B_{3}$	$A_{3}$	$A_{4}$	$A_{1}$	$A_{2}$
$B_{4}$	$A_{4}$	$A_{1}$	$A_{2}$	$A_{3}$

В этом плане число наблюдений $N = 4\cdot 4 =16.$ В полном плане их было бы $N = 4^{3} = 64.$ Сокращение произошло за счет исключения некоторых комбинаций: $A_{1}B_{2}C_{1}$ , $A_{1}B_{2}C_{2}$ и др.

Заметим, что план может быть и несимметричным. В этом случае вместо квадрата будет прямоугольник. И еще: выделение доминирующего фактора не является существенным, то есть, внутри квадрата можно располагать уровни любого из действующих факторов.

В практике планирования экспериментов встречаются и такие неполные планы: один из факторов меняет свои значения при фиксированных значениях других. То есть исследуется поочередно влияние каждого фактора в отдельности.

Иногда применяются и так называемые рандомизированные планы. В таких планах сочетания факторов и уровней для каждого прогона модели выбираются случайно. Вид случайности и объем выборки определяется исследователем.

4.4. Формальный подход к сокращению общего числа прогонов

Рассмотренные способы сокращения общего числа прогонов носят эвристический (субъективный) характер. Они осуществлялись за счет исключения каких-то комбинаций уровней факторов.

Однако во многих случаях исследователь имеет свободу действий в выборе числа факторов числа уровней и числа прогонов модели в одном наблюдении. Каждый из этих аргументов в конкретной ситуации по-разному влияет на общее число прогонов модели

Исследуем эти влияния.

Как нам уже известно, общее число прогонов (реализаций) модели равно:

$N = pq^{k}.$

Рассмотрим относительное влияние аргументов p, q, k на число реализаций .

Сначала нужно получить выражения для вычисления скоростей изменения функции при изменении одного аргумента и неизменных остальных аргументах. Для этого последовательно найдем частные производные первого порядка от функции по этим аргументам:

$\cfrac{\partial N}{\partial k} = pq^k \ln{q}$
$\cfrac{\partial N}{\partial q} = pkq^{k-1}$
$\cfrac{\partial N}{\partial p} = q^k$

Теперь сравним попарно полученные производные:

$\left. \cfrac{\partial N}{\partial k} \right/ \cfrac{\partial N}{\partial q} = \cfrac{q\ln{q}}{k}$
$\left. \cfrac{\partial N}{\partial p} \right/ \cfrac{\partial N}{\partial q} = \cfrac{q}{kp}$
$\left. \cfrac{\partial N}{\partial p} \right/ \cfrac{\partial N}{\partial k} = \cfrac{1}{p\ln{q}}$

Из соотношений 1 и 2 следует: если $(kp\succ q}$ и $(k \succ q\ln{q})$ , то наибольшее влияние на число оказывает изменение числа уровней .

Из соотношений 3 и 1 следует: если $(p\ln{q}\succ 1)$ и $(k \prec q\ln{q})$ , то наибольшее влияние на число оказывает изменение числа факторов .

Из соотношений 2 и 3 следует: если $(q \succ kp)$ и $(1\succ p\ln{q})$ , то наибольшее влияние на число оказывает изменение числа реализаций модели на каждом уровне факторов (на каждом наблюдении).

Рассмотренный формальный подход к сокращению числа реализаций не совсем корректен, так как функция общего числа прогонов носит не непрерывный, а дискретный характер. Тем не менее, такой подход применяется с последующим округлением результатов до целых чисел.

Покажем применение формального подхода сокращения реализаций на примере.

Пример 4.4. На вход модели объекта действуют четыре трехуровневых фактора (k = 4, q = 3). В каждом наблюдении предполагаются восемь прогонов модели (p = 8). Полный факторный эксперимент потребует $N = pq^{k} =8\cdot 3^{4} =648$ прогонов или 81 наблюдение. Такие затраты ресурсов неприемлемы.

Требуется определить, какой из аргументов (k,q,p) следует уменьшить, чтобы достичь наиболее существенного уменьшения числа реализаций .

Решение

Подготовим данные для сравнений:

$q \ln{q} = 3\ln{3} = 3.3;\, kp = 4\cdot 8 = 32;\, p\ln{q} = 8\cdot {1.1} = 8.8.$

Соблюдается условие:

$(kp \succ q) \wedge (k \succ q \ln{q})$ , так как $(32 \succ 3) \wedge (4 \succ 3.3).$

Следовательно, наибольшее влияние на изменение оказывает изменение числа уровней .

Уменьшим на единицу: q = 3 -1 = 2 . В этом случае при ПФЭ потребуется выполнить $N = 8 \cdot 2 =128$ прогонов или 16 наблюдений, то есть в пять раз меньше.

Варьирование факторов на двух уровнях встречается часто и решение q = 2 будет приемлемо, если нет обстоятельств, не устраивающих это решение.

4.5. Элементы тактического планирования

Основной задачей тактического планирования является обеспечение результатам компьютерного эксперимента заданных точности и достоверности.

Рассмотрим случай, когда имитационная модель строилась для определения характеристик некоторых случайных величин.

Такими случайными величинами могут быть:

время обслуживания заявки в СМО;
численности противоборствующих сторон;
расход боеприпасов;
время наработки на отказ технического устройства и др. Из характеристик случайных величин, как правило, интересуют среднее значение (матожидание), дисперсия и характеристика связи случайных величин - коэффициент корреляции.

Характеристику случайной величины будем обозначать греческой буквой $\Theta$ .

С помощью имитационного моделирования точное значение $\Theta$ определить нельзя, так как число реализаций модели конечно. При конечном числе реализаций модели определяется приближенное значение характеристики. Обозначим это приближение $\overline{\Theta}.$

Приближенное значение $\overline{\Theta}$ называют оценка соответствующей характеристики: оценкой матожидания, оценкой дисперсии, оценкой коэффициента корреляции.

Точностью характеристики $\overline{\Theta}$ называют величину $\varepsilon$ в отношении

$|\overline{\Theta}-M[\Theta]| < \varepsilon,$

где $M[\Theta]$ - матожидание случайной величины.

Величина $\varepsilon$ представляет собой абсолютное значение ошибки в определении значения искомой характеристики.

Достоверность оценки характеристики $\overline{\Theta}$ называют вероятность $\alpha$ того, что заданная точность достигается:

$P(|\overline{\Theta}-M[\Theta]| < \varepsilon ) = \alpha.$

Достоверность характеризует повторяемость, устойчивость эксперимента и трактуется так: если для оценки $M[\Theta]$ использовать величину $\overline{\Theta},$ то в среднем на каждые 1000 применений этого правила в $1000\cdot\alpha$ случаев величина $\overline{\Theta}$ будет отличаться от $M[\Theta]$ на величину меньше $\varepsilon$ .

В ряде случаев целесообразно пользоваться понятием относительной точности $d=\cfrac{\varepsilon}{M[\Theta]}$

В этом случае достоверность оценки имеет вид:

$P\left ( \cfrac{\overline{\Theta}-M[\Theta]}{M[\Theta]} < d\right ) = \alpha$

Дальше >>

Авторизоваться

Компьютерное моделирование

Планирование экспериментов

4.3. Стандартные планы

4.4. Формальный подход к сокращению общего числа прогонов

4.5. Элементы тактического планирования

Вопросы и ответы