Московский государственный университет путей сообщения
Опубликован: 12.09.2011 | Доступ: свободный | Студентов: 3731 / 301 | Оценка: 4.67 / 4.33 | Длительность: 18:55:00
Специальности: Программист
Лекция 14:

Перспективные нейросетевые технологии

< Лекция 13 || Лекция 14: 1234

Проблема понимания и создания текстов

Д.А. Поспелов [14] говорит: "Что значит понять текст? Ответ на этот вопрос, приемлемый в равной степени для лингвиста, психолога или философа, отсутствует. Феномен понимания во многом ещё остаётся загадочным. В интеллектуальных системах имеется способ уточнить интерпретацию этого термина. Можно, например, считать, что система понимает введённый в неё текст, если с точки зрения некоторого человека (или группы экспертов) она правильно отвечает на все вопросы, связанные с информацией, отражённой в тексте". И далее: "Сложность этой проблемы можно проиллюстрировать на следующем (весьма простом) примере. Пусть в систему введён текст: "Петя залез на стул, открыл дверцу заветного шкафа, достал конфеты и быстро, торопясь, съел несколько штук"… Вечером мать, доставая конфеты для чая, посмотрела на Петю и сказала: "Странно. Конфет стало меньше". Петя густо покраснел".

Предположим, что интеллектуальная система должна ответить на вопрос: "Почему Петя покраснел?" На основании какой информации она сможет это сделать? Как мы сами отвечаем на подобные вопросы?"

Исследуя процесс понимания абстрактного, формализованного изображения человеческой мысли, каким является текст, надо вскрыть исторические корни необходимости и развития средств такого изображения.

Первобытный человек поступал прямо, с присущей ему непосредственностью. Он изображал мамонта – объект своих вожделений – на стене пещеры. Глядя на это изображение, особенно перед охотой, он возбуждал в себе сложную гамму чувств: красоты, ярости, восторга силы, любовной жертвенности, борьбы, надежды и уверенности в победе и, наконец, - возбуждающего обострения голода. Если включить воображение, можно увидеть, что все человеческие чувства можно стимулировать, глядя на одно лишь наскальное изображение мамонта, сцены охоты, битвы (не говоря уже о благотворном, регулярном – не менее одного раза в год – посещении Третьяковской галереи). Изначально чувственный подход лежал в основе изображения и формализации мысли. Именно этот подход и развивался с появлением письменности.

Первые опыты письма основывались на образности и постепенном абстрагировании. С помощью изображения зверюшек, птичек, рыбок и человечков, с нехитрыми связками, формировалась и отображалась мысль – запись события, назидания, любовного послания и т.д. Целью, прежде всего, являлось ассоциативное возбуждение чувственности.

Дальнейшая формализация пошла по пути абстрагирования при изображении мысли: слова-символы, отображающие объекты, стали изображать комбинациями условных элементов из некоторого их набора, что характерно, например, для клинописи. Это уже подавляюще действовало на чувственность, отодвигало непосредственное воздействие на неё, требовало хладнокровных познаний, образования. Фонетическое разложение звукового языкового изображения (применение букв – звуков) всё далее уводило человека от чувственных основ мышления, превращая его в сложную информационно-логическую машину, использующую абстрактные представления.

Возможно, те народы, которые оказались в стороне от бурной языковой формализации, сохранившие образность мышления и языка, условность восприятия, ассоциативность, значительно более продвинулись в развитии чувственности, в утончённости своей интеллектуальной организации? Что в большей степени и непосредственно влияет на чувственное восприятие, на эмоциональное состояние: буква или иероглиф? Может быть здесь, на пути сохранения и развития образности мышления, кроются истоки высоких достижений в области тонкого, фантасмагорического, многообразного и чувственного искусства? Или – предрасположенность и достижения в области высоких технологий и микроминиатюризации? Может быть народы, пошедшие по пути фонетического разложения мысли на составляющие буквы и звуки, притупили своё чувственное восприятие, стали "толстокожими" и чёрствыми, с глупой уверенностью проповедуя своё превосходство?

Понимая, что ИИ является моделью "естественного" интеллекта, необходимо сформулировать целевую функцию. Что означает – понимание текста?

Возбуждение чувственности? Выполнение приказа? Запись новой логической цепочки "причина – следствие", "если – то"? В любом случае это адекватное реагирование, и участие в этом логических нейронных сетей (как и самого мозга) несомненно.

Известны исследования по смысловой обработке текстов. Простейшие из них касаются текущей (в данный исторический период) частоты появления некоторых значительных, определяющих, знаковых, символических слов и выражений, могущих быть положенными в основу определённых выводов на базе исторического опыта.

Несомненно, высокая частота появления имени важного должностного лица, в сочетании с некоторыми другими словами, определённо влияет на настроение общества, воскрешая воспоминания о культе личности. Слова "реформирование армии", "дедовщина", "контрактник", "антитеррористическая операция" и др. напрямую влияют на высокую привлекательность платного высшего образования, аспирантуры и т.д. Так создаётся значительная составляющая для автоматизированного содействия эксперту-политологу, а также политтехнологу, при прогнозировании общественного развития.

Не вызывает сомнений пособничество логической нейронной сети в лексико-графическом анализе текстов для повышения уровня осмысленного перевода на другие языки.

Если в сети используются обратные связи, то становится актуальным тактирование её работы и прослеживание её состояния на некотором интервале времени или до окончания процесса сходимости к некоторому устойчивому состоянию.

Какие ассоциативные механизмы предлагает логическая нейронная сеть для поиска релевантных (адекватных, соответствующих смыслу вопроса) знаний и, в частности, для логического объяснения необходимости наказания Пети-сладкоешки?

Пусть любящая мама, руководствуясь высокими современными требованиями к естественному интеллекту, использует широко рекламируемую базу знаний МОЯ СЕМЬЯ, предварительно адаптировав и заполнив её актуальными данными, а также логическими причинно-следственными связями и даже скорректированными весами. Несомненно, мама "ведёт" свою базу знаний, отслеживая условия жизни и семейные обстоятельства. Рассмотрим фрагмент этой базы знаний (рис.14.10).

В логической нейронной сети на входном, рецепторном слое отображены все действующие лица, предметы и даже обстоятельства. Нейронная сеть использует обратные связи, что развивает представление о рецепторном слое, т.к. установившееся возбуждение нейронов, в данном случае - двух слоёв, вносит свой вклад в решение.

 Фрагмент базы знаний МОЯ СЕМЬЯ

увеличить изображение
Рис. 14.10. Фрагмент базы знаний МОЯ СЕМЬЯ

Первоначально мама, обнаружив недостачу и не сомневаясь в совершении шкоды, сообщает значительное возбуждение нейрону "Шкода". Однако сообщённая величина возбуждения, соответствующая предполагаемой достоверности события всё же меньше единицы, т.к. мама самокритична, и по забывчивости могла сама съесть те конфеты.

Так как шкодливыми членами семьи являются Петя и Кот Вася, мама определяет их участие по принципу "фифти-фифти", полагая равными 0,5 величины возбуждения нейронов "Петя" и "Кот Вася". Но - факт, что конфет стало меньше, и мама максимально, до единичного значения, возбуждает нейрон "Конфеты".

Целесообразно, во избежание коллизии, исследовать только одно происшествие. Другое происшествие, например, связанное с оборванной занавеской, скорее всего, Котом Васей, мама собирается исследовать потом.

Мама "топает" мышью, запуская нейросеть. В соответствии с потактовой работой модели нейронной сети, рассчитываются значения возбуждения нейронов 1 – 5. Максимально возбуждается нейрон 1, обуславливая необходимость произнесения фразы, соответствующей первому этапу дознания. С помощью отрицательной обратной связи "нейрон 1 → "Кот Вася" уменьшается значение возбуждения нейрона "Кот Вася", принижая роль Кота Васи в данном происшествии. Так как укоризненное замечание высказано, наступает второй этап дознания. С помощью положительной обратной связи максимально возбуждается нейрон "Укор Пете". Чтобы не допустить зацикливание на этом этапе дознания, с помощью отрицательной связи "Укор Пете" → нейрон 1", исключается повторение высокого возбуждения нейрона 1. Теперь максимального возбуждения достигает нейрон 3, связанный с заявлением "Петя густо покраснел". Обратная связь "нейрон 3 → "Петя" призвана повысить достоверность участия Пети в исследуемом происшествии, т.е. достоверность его вины.

Теперь осталось выяснить, каким образом Петя достал конфеты. Мама максимально, до единичного значения, возбуждает нейрон "Шкаф", и с помощью высоких значений возбуждения нейронов "Петя" и "Конфеты" максимально возбуждается нейрон 5, выдающий текст соответствующего объяснения.

Нейросеть, несомненно, отражает текущий исторический период, ибо, когда Петя вырастет большой, ему не надо будет вставать на стул, чтобы воровать конфеты из шкафа. Так что мама должна постоянно отслеживать течение жизни и корректировать базу знаний.

Использование обратных связей повышает актуальность фактора времени и требует перехода от статического, аналитического описания СПР с помощью системы логических выражений, приведённой выше, к представлению алгоритмической, логической схемы имитационного моделирования. И хотя представленная здесь схема по-женски не слишком последовательна, но, - жить можно!

Продолжим рассмотрение приведённого выше примера, желая получить определённые обобщения, касающиеся формирования текстов умозаключений, и пытаясь подняться на более высокий уровень логического вывода.

В результате проделанных мамой усилий оказались максимально возбуждёнными, даже с единичным значением, несколько нейронов, и мы вспоминаем школьный урок детства.

Учительница говорит: "Дети, придумайте рассказ со словами "шкода", "шкаф", "конфеты", "ай-яй-яй", "густо покраснел". Дети усиленно ищут, перебирают, пробуют возможные связи, напрягая уже сложившиеся ассоциации и навыки.

Наконец, отличник Коля произносит рассказ – умозаключение, запомнившееся детьми на всю жизнь, как богатый источник творческого подражания: "Петя совершил шкоду. Он стал на стул и достал из шкафа конфеты. А когда мама сказала "Ай-яй-яй", он густо покраснел".

Согласимся, что это урок более высокого уровня мышления, хотя всего лишь дедуктивного. Однако в нём уже содержатся элементы индуктивного мышления, т.к. он предполагает анализ и обобщение не только сложившейся ситуации, но содержит и попытку абстрагирования - анализ причинно-следственных связей, присущих этой ситуации из жизни Коли.

Приведённая схема мышления порождает схему логическую, определяя действия алгоритмиста-исследователя. Значит, логическая схема – прообраз логической нейронной сети – в решении этой "горячей точки" занимает главное место.

Есть ли здесь место обобщению логической схемы до уровня логической нейронной сети? Есть, - в том случае, если цели и средства определены нечётко.

Например, "проектируемая" сказка, - насколько должна быть весёлой, грустной, назидательной, "страшной"? А на что должны быть похожи средства её выражения, - немножко баллада, немножко стихи? С неизбежностью возникают веса факторов, приводящие к столь же взвешенным решениям.

Приходится переходить в область вероятностей, нечётких множеств и других недетерминированных механизмов.

А это уж точно – логические нейронные сети.

Сивилла-прорицательница

В век всеобщей информатизации мы, нетерпеливо пропуская конкретику и детали, жадно ловим правду "между строк", ассоциативно формируя предвидение и прогноз: что будет с нами завтра, каковы тенденции и что предпринять?

Формализация обработки огромных потоков информации, в основном, в СМИ (а это — оперативная информация), всё более привлекает специалистов по прогнозу. Здесь огромные возможности для шарлатанов, и кажется удивительным, как незамеченными остаются "прогнозы" авторитетных, не сходящих с телеэкрана, "предсказателей", данные ими несколько лет назад и не заставляющие их покраснеть сегодня.

Основой прогнозирования является состав и частота появления слов и выражений, характеризующих политический этап или целый исторический период. Далее следует анализ исторического опыта, определяющий, к чему это приводило в прошлом и к чему может привести впредь…

… История помнит замечательные, навязчиво мелькающие, "новые" слова и выражения. Например — "конвергенция", выражающее сомнение и крах режима, "интернациональный долг" — саморазрушающая агрессия, "консенсус" — псевдодемократический, криминальный обвал, "экстрадиция" — мировой процесс очистительной ловли тараканов, "суверенитет" — самостоятельный выход из окружения. А что дальше? - говорят слова "наркомания", "терроризм", "сепаратизм", "курс доллара", "приватизация", "прожиточный минимум", "коррупция", "кризис", "Олимпиада" и т.д.

 Предвидение

Рис. 14.11. Предвидение

Комбинации и частота следования слов (рис.14.10) образовывали критическую массу для неотвратимой цепной реакции…

Ключевые термины

Парк фантасмагорий – парк развлечений, наполненный объектами "живого" натурного моделирования.

КОМПИ – детский компьютерный игровой объект "живого" моделирования, допускающий общение.

Диагностика – установление места неисправности в технике или установление диагноза болезни.

Тестирование – действия по установлению уровня знаний в процессе диалога "учитель – ученик".

Идентификация и аутентификация– установление подлинности пользователя, работающего в данное время в вычислительной сети и отклонение "чужого" пользователя.

"Почерк" пользователя – основные естественные или принудительные параметры и особенности его работы с клавиатурой компьютера (клавиатурный портрет).

Понимание текста – адекватное восприятие и реагирование на текст.

Краткие итоги

  1. Приведённые соображения по созданию систем принятия решений различного применения иллюстрируют универсальность подхода к построению логических нейронных сетей.
  2. Как можно установить на основе попыток реализации идей, достаточными для их воплощения являются однослойные логические нейронные сети, даже в случае необходимости обратных связей.

Вопросы

  • Как реализуются идеи "живого" моделирования при организации службы безопасности?
  • Какие фантазии обуревают нас при получении заказа (а главное, - средств) на создание в пойме Москвы-реки Парка фантасмагорий – для развития туристического бизнеса и развлекательной индустрии?
  • Какие идеи лежат в основе создания лучшего друга детей – компьютерного человечка КОМПИ?
  • Как на основе логических нейронных сетей реализуется техническая и медицинская диагностика?
  • Как промежуточные результаты тестирования влияют на его продолжение?
  • Какие идеи лежат в основе распознавания рукописного (нечёткого) текста?
  • Как работает система экстренного торможения локомотива на базе логической нейронной сети?
  • Как производятся идентификация и аутентификация на основе нечётких данных клавиатурного почерка; в вычислительной сети?
  • Как формируется понимание текста на основе базы знаний, отображаемой логической нейронной сетью?
  • Как осуществляется предвидение по частоте вхождения в тексты определённых слов и на основе исторического опыта?

Дополнительные материалы к лекции, Вы можете скачать здесь.

< Лекция 13 || Лекция 14: 1234
Кирилл Артамонов
Кирилл Артамонов

"Тогда как задать возбуждение рецепторов, если инспектор точно установил, что скорость автомобиля при наезде на пешехода была равна 114 км/час?
По-видимому, он рассуждает на основе близости скорости к границам указанного интервала: "Достоверность того, что скорость автомобиля составляет 100 км/час, я найду как (114 – 100):(120 – 100), а достоверность того, что скорость автомобиля составляет 120 км/час, я найду как (120 – 114):(120 – 100). Следует обратить внимание на то, что сумма найденных достоверностей равна единице."

Вопрос по расчёту скорости и сумме достоверности: этот математический (приведенный выше в виде контекста из материала лекции 1, страницы 3) метод справедлив к скоростным показателям выходящим за рамки диапазона 100-120. 
То есть, практически применяв к расчёту, скорости из диапазона 114-155, к диапазону 100-120, получал в результате суммирования достоверностей единицу.
Это похоже на то, как я видимые разные скоростные показатели своим рецептором, буду воспринимать линейно с помощью одного диапазона, так как он универсален. 
Правильно ли это ? 
И как манипулировать данными показателями, если есть универсальный диапазон, по результату выводящий в сумме постоянно единицу на разных скоростных показателях стремящегося.

Владислав Гладышев
Владислав Гладышев

А как проходить курс ? я же могу прямо сейчас все лекции прочитать и здать экзамен, к чему там даты ?