Московский государственный университет путей сообщения
Опубликован: 12.09.2011 | Доступ: свободный | Студентов: 3129 / 119 | Оценка: 4.67 / 4.33 | Длительность: 18:55:00
Специальности: Программист
Лекция 1:

Модель нейронной сети

Лекция 1: 1234 || Лекция 2 >

Ввод и "разглядывание" эталонов и образов

Устройства ввода информации — эталонов, исходных ситуаций — имеют определяющее значение для нейросети. С их помощью формируются и поддерживаются возбуждения входного слоя . Сегодня успешно решается проблема видео-ввода. Однако ввести в компьютер "картинку" — это лишь часть дела. Картинку надо обработать — в целом и по частям, чтобы по максимуму интересующей информации получить полные и достоверные выводы – сформировать реакцию. Здесь мы ищем аналоги нашего восприятия действительности.

Мы совершаем обзор представляемой нам картины тремя способами:

  • сканированием сектора обзора, разбитого на элементарные сегменты (рис. 1.6);
  • спонтанным обзором, обусловленным привлечением внимания к цветовому или скоростному всплеску, быстрым увеличением размера (угрожающим приближением) объекта, указанием извне (целеуказанием) и т.д. (рис. 1.7);
  • сканированием сектора обзора с выделением зон особого внимания (рис. 1.8).

При первом и третьем способах анализ сложнее, т.к. требует согласования всего виденного по сегментам. Это, в свою очередь, требует включения высших уровней логического вывода (интеллекта).

Второй способ также требует сканирования сектора обзора, однако со значительно меньшими энергетическими затратами. При этом способе можно добиться избирательности, чрезвычайности реакции, например, на резкие движения, на бег, появление яркой расцветки в одежде и т.д. Это может с успехом использоваться в развлекательных, игровых системах.

Все способы реализуются легче, если речь идет о единственном объекте единовременного распознавания, например, буквы, хозяина квартиры, подписи и т.д. Ибо любая сцена, например, туристская группа, пришедшая полюбоваться "умным" монстром, требует не только детального, но и совместного анализа этим монстром всех (многих) ее составляющих.

Сканирование по строкам

Рис. 1.6. Сканирование по строкам
Реакция на внезапность

Рис. 1.7. Реакция на внезапность
Поиск зон особого внимания

Рис. 1.8. Поиск зон особого внимания

Говоря о туристах, можно говорить о конечной, усредненной реакции на всю группу. Ведя обзор, сеть постепенно, по критериям обучения "это хорошо — это плохо", воспринимая "настроение" как последовательное добавление элементов радости и огорчения, приходит к некоторому окончательному состоянию, обусловленному тем, сколько того и другого она увидела. Тогда для разных групп туристов или экскурсантов это состояние будет разным. Это может стать источником веселья и шутливого "поощрения" той группы, которая привела объект в радость, и "осуждение" группы, ввергнувшей его в печаль.

Итак, в каждом такте обзора, формируется сегмент, содержимое которого необходимо распознать. Чаще всего целесообразно допущение о том, что в элементарном сегменте при дискретном сканировании находится не более чем один значимый объект. Пусть это — максимальная область текста, вмещающая единственную букву, написанную с допустимой долей небрежности. Как помочь себе же разглядеть эту букву? По-видимому, следует пытаться разместить эту букву на входном слое так, чтобы она максимально соответствовала тому размещению эталонов, с помощью которых производилось обучение. Тогда распознавание заработает правильно (рис.1.9). Такой процесс "разглядывания" может предполагать:

  • поиск возможности совмещения условного центра элемента изображения и центра экрана — входного (рецепторного) слоя сети (фокусировка);
  • поиск варианта масштабирования элемента изображения (приближение — удаление);
  • поиск угла наклона и др.

В результате таких пробных действий может вдруг "запуститься" процесс распознавания, хотя, возможно, и ошибочного. Что ж, в жизни бывает и так.

Напомним, что работа нейросети тактируется. Тогда развитие сценария в увлекательной многофункциональной детской игре с обучаемым компьютерным человечком КОМПИ может быть таким, как представлено на рис.1.10.

Однако следует отметить, что обработка изображений, особенно – для распознавания, представляет сложную проблему компьютерного зрения, которой посвящено много исследований. Отметим здесь лишь монографию [11].

Поиск условия узнавания

увеличить изображение
Рис. 1.9. Поиск условия узнавания
Реакция на распознавание в реальном времени

увеличить изображение
Рис. 1.10. Реакция на распознавание в реальном времени
Лекция 1: 1234 || Лекция 2 >
Владислав Гладышев
Владислав Гладышев

А как проходить курс ? я же могу прямо сейчас все лекции прочитать и здать экзамен, к чему там даты ? 

Максим Куклин
Максим Куклин

Добрый день!

В лекции не отобразил определение персептрона, увидел его в дополнительных материалах.

Получается, что персептрон распознает образ по эталону, а логическая НС - по "пачке" признаков?

Михаил Алексеев
Михаил Алексеев
Россия, Уфа, УГАТУ, 2002
Павел Костицын
Павел Костицын
Россия, Лысьва, ЛФ ПНИПУ, 2013