Опубликован: 20.01.2011 | Уровень: для всех | Доступ: платный | ВУЗ: Московский государственный открытый университет им. В.С. Черномырдина
Лекция 4:

Разработка "сквозных" математических моделей технологического процесса как основа АСНИ

< Лекция 3 || Лекция 4: 12 || Лекция 5 >

Проверка гипотезы нормального распределения исходной информации

Эта работа должна проводиться с целью корректного перехода к построению математических моделей (ММ). Дело в том, что используемый для построения ММ корреляционно-регрессионный анализ предполагает, что собранная для построения ММ информация должна подчиняться нормальному закону распределения. Поэтому на данном этапе необходима проверка гипотезы о нормальном законе распределения информации, собранной по результатам пассивного или активного эксперимента.

Блок-схема проверки гипотезы нормального распределения

увеличить изображение
Рис. 4.4. Блок-схема проверки гипотезы нормального распределения

Априори выдвигается гипотеза о нормальном законе ее распределения. Затем осуществляется проверка этой гипотезы (рис. 4.4).

Если гипотеза не подтвердилась, то увеличивают объем выборки (количество измерений) до тех пор, пока не получим нормальный закон распределения. В данном случае используется свойство нормального закона: он является предельным для других законов, т. е. с увеличением объема выборки другие законы стремятся к нормальному закону распределения.

Если гипотеза подтвердилась, то можно переходить к построению математической модели, в частности, использовать метод наименьших квадратов при поиске коэффициентов уравнений регрессии.

Преобразование распределений к нормальному закону

Если исследователь, использовав методы, изложенные ранее, убедился, что гипотеза нормальности распределения не может быть принята, то, возможно, с помощью существующих методов удастся так преобразовать исходные данные, что их распределение будет подчиняться нормальному закону. После получения окончательного результата необходимо выполнить обратное преобразование.

В самом начале операции преобразования данных большую помощь могут оказать гистограмма и полигон распределения. При обработке результатов наблюдений в медицине, биологии, материаловедении, экономике и других отраслях знаний встречаются логарифмические нормальные распределения, особенностью которых является крутая левая ветвь полигона и пологая правая (полигон явно асимметричен). Логарифмические нормальные распределения играют большую роль в математической статистике, так как встречаются очень часто в практике обработки наблюдений и легко преобразуются к нормальному распределению.

При логарифмировании исходных данных левая ветвь кривой распределения сильно растягивается, и распределение принимает приближенно нормальный характер. Если при преобразовании x' = \lg{x} получаются значения, расположенные между 0 и 1, то все вновь полученные значения для удобства расчетов и во избежание получения отрицательных параметров необходимо умножить на 10 в соответствующей степени, чтобы все цифры были больше единицы, т. е. выполнить преобразование x'' = \lg{x}\cdot 10^{a}

Асимметричное распределение с одной вершиной часто приводится к нормальному преобразованием x' = \lg{(x\pm a)}. В отдельных случаях можно применять и другие преобразования:

  • обратная величина
    х'=1/x; ( 4.12)
  • обратное значение квадратных корней
    х'=1/\sqrt{x}; ( 4.13)

Преобразование "обратная величина" является наиболее "сильным". Среднее положение между логарифмическим преобразованием и "обратной величиной" занимает преобразование "обратное значение квадратных корней".

Для нормализации смещенного вправо распределения служат тригонометрические преобразования, а также степенные преобразования х' = х^a. При этом а принимают значения: a = 1,5 при умеренном и а = 2 при сильно выраженном правом смещении.

Известны случаи, когда нормальный закон распределения не удается получить вообще.

Однако мы будем исходить из случаев, для которых закон больших чисел выполняется.

Контрольные вопросы

  1. Какие исходные данные необходимы для построения математических моделей?
  2. Какие схемы используются при построении математических моделей?
  3. Привести примеры определения контрольных точек и контролируемых параметров.
  4. Какие параметры называют информативными?
  5. Обосновать применение статистических методов для построения математических моделей технологических процессов.
  6. Что называется внешним проектированием?
  7. Что называют внутренним проектированием?
  8. Почему необходима предварительная обработка производственной информации?
  9. В чем сущность предварительной обработки производственной информации?
  10. Что принимается за грубые погрешности?
  11. Как учитываются грубые погрешности?
  12. Почему необходима проверка гипотезы о нормальном законе распределения исходной информации?
  13. Почему производственная информация должна подчиняться нормальному закону распределения?
  14. Как осуществляется проверка гипотезы о нормальном законе распределения?
  15. Как используется квантиль Стьюдента при проверке гипотезы?
  16. Как используется критерий Пирсона при проверке гипотезы?
  17. Что называется центрированной случайной величиной?
  18. Почему при расчете математического обеспечения, дисперсии и среднеквадратического отклонения говорят об их оценках?
  19. Запишите и поясните формулу для определения доверительного интервала.
  20. Покажите, как строится гистограмма и какова ее роль при проверке гипотезы.
  21. Опишите процедуру проверки гипотезы о нормальном распределении по блок-схеме (рис. 4.4).
  22. Как используется критерий Пирсона?
  23. Каковы выводы следует сделать в случае, если гипотеза о нормальном распределении подтвердилась?
  24. Какие меры следует применять, если гипотеза не подтвердилась?
  25. Какое свойство нормального закона распределения используется при проверке гипотезы?
  26. Какие преобразования используются для получения нормального закона распределения?
< Лекция 3 || Лекция 4: 12 || Лекция 5 >
Максим Троицкий
Максим Троицкий
Россия
Ярославй Грива
Ярославй Грива
Россия, г. Санкт-Петербург