НОУ ИНТУИТ | Модели поведения, восприятия и мышления. Лекция 12: Признаковые распознающие нейронные сети

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 14.12.2009 | Доступ: свободный | Студентов: 1881 / 368 | Оценка: 4.28 / 4.12 | Длительность: 17:36:00

ISBN: 978-5-9963-0249-9

Тема: Искусственный интеллект и робототехника

Специальности: Программист, Системный архитектор

|

Вам нравится? Нравится 22 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Формальная нейронная сеть как модель механизмов мозга

Таким образом, признаковая распознающая нейронная сеть - это пассивный признаковый распознаватель, обладающий всеми отмеченными нами недостатками признаковых распознавателей. Напомним, что эти недостатки в первую очередь определяются последовательной организацией процесса распознавания, отсутствием целостности восприятия, целенаправленности и активности. Еще одним важнейшим недостатком признаковых распознавателей, и в частности ПРНС, является то, что эти системы работают только в фиксированном пространстве признаков, одинаковых для всех объектов распознавания.

В то же время признаковая распознающая нейронная сеть не является серьезной нейронной моделью мозга. Не является она и удовлетворительной моделью специфических нейронных механизмов зрительного анализатора мозга. В этом плане признаковая распознающая нейронная сеть ничем не отличается от логической нейронной сети Мак-Каллока и Питтса и перцептрона Розенблатта. Все эти нейронные модели работают по схеме стимул-реакция. При этой схеме невозможна организация целенаправленного (двунаправленного) процесса восприятия, идущего одновременно "снизу вверх", т. е. от изображения к пониманию, и "сверху вниз", т. е. от понимания к изображению. Эти модели не имеют и других приведенных нами функций и свойств, которые необходимы для построения модели среды, эффективной в отношении задач восприятия и управления поведением.

Иногда говорят о принципиальной возможности построения в признаковой нейронной модели описаний целостных объектов с использованием разделяющих поверхностей в пространстве каких-то признаков или характеристик. Эта концепция представляется малопродуктивной и нефизиологичной по трем причинам.

Первая причина состоит в том, что описания целостных объектов в модели среды должны быть независимы и описывать объекты как таковые, а не строиться на функции разделения. Независимость описаний позволяет отличать объект от любых других, как известных (описанных в модели), так и неизвестных.

Вторая причина состоит в том, что разделяющие поверхности можно строить только в фиксированном пространстве характеристик, одинаковых для всех объектов восприятия. При этом все характеристики (признаки) должны использоваться при построении описаний (разделяющих поверхностей) всех объектов. Понятно, что это абсолютно нефизиологично и принципиально отличается от рассмотренного нами способа представления в модели объектов восприятия на основе индивидуальных целостных независимых описаний.

И наконец, главная причина состоит в том, что описания объектов с использованием строящихся в сетях из формальных нейронов разделяющих гиперплоскостей не подходят для реализации целенаправленного процесса "распознавания с пониманием".

Остановимся на вопросе о физиологичности и некоторых других функций, решаемых сетью из формальных нейронов. Как уже отмечалось, в основе работы ПРНС лежат две функции. Первая - построение на нейронах разделяющих гиперплоскостей в фиксированном пространстве признаков. Вторая - построение иерархии распознавателей, где распознаватель более высокого уровня строит разделяющие плоскости в пространстве некоторых характеристик, являющихся производными от результатов работы распознавателя более низкого уровня. Реализуются ли подобные свойства в мозге?

Предположение о том, что реальные нейроны строят разделяющие гиперплоскости в фиксированном, одинаковом для всех распознаваемых объектов пространстве каких-то признаков или характеристик, представляется весьма сомнительным или как минимум требующим подробного рассмотрения и определения места этой если и существующей, то, безусловно, частной функции в общей картине работы мозга. Весьма сомнительной является возможность формирования величин синаптиче-ских проводимостей отдельных нейронов (коэффициентов в уравнениях разделяющих гиперплоскостей) путем решения на сети общей (градиентной?) задачи, типа задачи поиска этих коэффициентов методом обратного распространения ошибки. Более чем сомнительной является привязка каких-либо логических функций к отдельному нейрону, в чем убеждают результаты большого количества нейрофизиологических работ, посвященных поиску энграмм памяти.

О необходимости иерархической организации строящейся в мозге модели среды мы говорили неоднократно. Однако в ПРНС возникает очень специфическая иерархия, определяемая первым свойством, то есть тем, что нейроны строят разделяющие гиперплоскости в пространстве признаков или каких-то характеристик, и необходимостью объединения этих результатов. Эта иерархия не является иерархией типа часть-целое. Не является она, скорее всего, и иерархией типа частное-общее. Переход от частного к общему реализуется в ПРНС еще в первом слое при построении разделяющих гиперплоскостей. В многослойных ПРНС на верхнем уровне к этому, по-видимому, добавляется только объединение результатов нижнего уровня за счет реализации простых функций, близких по смыслу логическим функциям И и ИЛИ. Отличие иерархии, реализуемой в ПРНС, от иерархии в строящейся в мозге модели проблемной среды состоит еще и в том, что при распознавании процессы в ПРНС разворачиваются только в одну сторону - снизу вверх. В формальных распознающих нейронных сетях не просматривается возможность создания иерархической модели среды, которая включала бы действия и процессы, определяющие переходы между ситуациями. Последнее представляется принципиально необходимым функциональным свойством моделей мышления.

В добавление к отмеченной функциональной нефизиологичности уточним, в чем состоит нефизиологичность и некоторых конкретных свойств приведенных выше формальных нейронных моделей. В этих моделях носителями информации являются отдельные нейроны. На отдельных нейронах реализуются логические функции в сети Мак-Каллока и Питтса, отдельные нейроны формируют выход в перцептроне и строят разделяющие плоскости в признаковых распознающих нейронных сетях. Разрушение одного-единственного нейрона в этих системах должно приводить к полному нарушению их работы. В живом мозге ничего подобного не происходит.

Уже отмечалось, что разработка формальных моделей нейронных сетей подтолкнула физиологов к проведению многих направленных экспериментов и в частности многочисленных экспериментов по поиску так называемых энграмм памяти. В этих работах ставилась задача соотнесения конкретной запоминаемой информации или функции с конкретным нейроном или местом в коре головного мозга. Эксперименты проводились на больных с частичными повреждениями мозга и на животных с экспериментальным разрушением отдельных нейронов или компактных областей коры головного мозга. Найти энграммы памяти не удалось. Локальные разрушения приводят не к забыванию конкретного объекта или к нарушению конкретной функции, а, например, к ухудшению качества распознавания многих объектов или к снижению качества выполнения разных функций.

Вывод, делающийся во многих работах, состоит в том, что единицей переработки и хранения информации в мозге является не отдельный нейрон, а ансамбль нейронов, объединенных взаимно возбуждающими связями. При этом нейроны одного ансамбля распределены не локально, а в некоторой области пространства коры головного мозга. К аналогичным выводам приходят и при построении некоторых растровых нейронных моделей.

Приведем и другие отличия. В формальных признаковых распознающих нейронных сетях нейрон подсчитывает взвешенную сумму входов и сравнивает ее с порогом. Это значит, что при решении задачи признакового распознавания на каждый вход нейрона поступает значение соответствующего этому входу признака, которое умножается на некоторый определенный при обучении постоянный коэффициент. Значение признака зависит от того, что поступило на вход распознающей системы, и может быть различным. В реальном нейроне в качестве коэффициента связи (входа) может рассматриваться величина синаптической проводимости. Второй сомножитель для конкретной связи является постоянным по амплитуде и как значение признака интерпретироваться не может. Сигналы, приходящие на нейрон по конкретной связи, могут иметь разную частоту. Это, конечно, может использоваться для построения логики какой-то распознающей нейронной схемы, но это будет уже совсем другая логика и совсем другие нейроны, т. е. не формальные нейроны, подсчитывающие взвешенную сумму значений признаков (входов), а что-то иное.

В формальных распознающих нейронных сетях, так же как в пер-цептроне и логических сетях Мак-Каллока и Питтса, время разбивается на такты, задержки при передаче сигналов по связям отсутствуют. Отсутствует временная суммация возбуждающих и тормозящих воздействий. Живой нейрон - это дискретный пороговый элемент, работающий по принципу "все или ничего". Ввдение в формальном нейроне плавной, например, сигмаобразной выходной характеристики делает элемент непрерывным. Понятия "порог возбуждения"("срабатывания"), "разряд", "выходной импульс", "серия импульсов" для такого формального нейрона теряют смысл.

Порог возбуждения (срабатывания) живого нейрона не является постоянным, а изменяется во времени в зависимости от предыстории срабатываний. Сразу после разряда нейрона возникают динамические составляющие порога - рефрактерность и экзальтация. Благодаря этому результатом возбуждения нейрона может быть как одиночный импульс, так и серия импульсов. Есть данные о том, что в зависимости от предыстории срабатываний изменяется и статическая составляющая порога возбуждения нейрона.

И наконец, необходимо еще раз отметить главное отличие описанных выше формальных нейронных моделей от живого мозга, отличие, состоящее в отсутствии синергичности и активности. Об этих свойствах живого мозга мы будем подробно говорить в дальнейшем.

Нейрокомпьютер

До сих пор мы говорили о перцептронах и признаковых распознающих нейронных сетях. К этому часто добавляется понятие "нейрокомпьютер". Термин "нейрокомпьютер" не очень удачен. Системы, к которым он обычно применяется, вычислительными машинами не являются.

Нейрокомпьютеры в каком-то приближении можно разделить на четыре группы. Первая группа - это просто уже упоминавшиеся формальные признаковые распознающие нейронные сети.

Вторая группа - это (по нашей классификации) перцептроны: растровые или ансамблевые системы. Возможности этих систем как в части распознавания образов, так и в части решения каких-то других задач пока еще весьма ограничены.

Третья группа - системы, построенные на формальных нейронах, но решающие специальные задачи. Это могут быть задачи, близкие по своему смыслу задаче распознавания, например, кластеризация. Это могут быть и совсем другие задачи. Общим в системах этой группы является то, что в них используются формальные нейроны, строящие чаще всего разделяющие гиперплоскости в многомерном пространстве каких-либо векторов, характеристик или признаков. С помощью гиперплоскостей и их объединения в конкретных задачах специальным образом организуется отделение или выделение каких-то входных или промежуточных векторов. На основе этого выделения и формируется результат. Специфика в этих системах и их особенности определяются как самой задачей, т. е. тем, что нужно выделить, так и способом выделения нужных объектов. В общем случае специфическими решаемыми проблемами в этих системах являются задача автоматического нахождения коэффициентов в уравнениях разделяющих гиперплоскостей и задача формирования общего результата на основе использования результатов работы нескольких (многих) нейронов. Последнее, так же как и при распознавании, решается введением дополнительных нейронных слоев и специфической организацией связей между нейронами.

Четвертая группа - специальные частные системы, строящиеся на особых элементах. Перечислять и пытаться обобщать эти изобретения не представляется необходимым, поскольку это могло бы увести нас слишком далеко в сторону от основной рассматриваемой темы. Отметим лишь, что чаще всего в основе специальных нейрокомпютеров лежит какой-то особый способ распознавания образов. Безусловно, интересный, оригинальный, тем более физиологичный способ распознавания может быть шагом в направлении понимания работы как отдельных механизмов мозга, так и мышления в целом. Но только первым или одним из первых шагов. К сожалению, часто такой шаг объявляется последним или одним из последних.

Оценивая современные нейрокомпьютеры как модели механизмов мозга, можно повторить все то же самое, что уже было сказано при оценке формальных распознающих нейронных сетей. Таким образом, в отличие от распространенного мнения, создание как признаковых, так и идущих от перцептрона растровых (ансамблевых) распознавателей и строящихся на их основе устройств или программ, называемых нейрокомпьютерами, не является пока еще заметным шагом в моделировании нейронных механизмов мозга.

Дальше >>

Авторизоваться

Модели поведения, восприятия и мышления

Признаковые распознающие нейронные сети

Формальная нейронная сеть как модель механизмов мозга

Нейрокомпьютер

Вопросы и ответы