Спонсор: Microsoft
Опубликован: 23.07.2006 | Доступ: свободный | Студентов: 1457 / 260 | Оценка: 4.28 / 4.17 | Длительность: 21:37:00
Специальности: Системный архитектор
Лекция 7:

Восходящие анализаторы

Управляющая программа анализатора

Управляющая программа одинакова для всех LR-анализаторов, а таблица изменяется от одного анализатора к другому. Программа анализатора читает последовательно символы входной цепочки. Программа использует магазин для запоминания строки следующего вида s0X1s1X2…Xmsm, где s m - вершина магазина. Каждый Xi - символ грамматики, а si - символ, называемый состоянием. Каждое состояние суммирует информацию, cодержащуюся в стеке перед ним. Комбинация символа состояния на вершине магазина и текущего входного символа используется для индексирования управляющей таблицы и определения операции переноса-свертки. При реализации грамматические символы не обязательно располагаются в магазине; однако, мы будем использовать их при обсуждении для лучшего понимания поведения LR-анализатора.

Программа, управляющая LR-анализатором, ведет себя следующим образом. Рассматривается пара: s m - текущее состояние на вершине магазина, a i - текущий входной символ; после этого вычисляется action [s m, a i ]:, которое может иметь одно из четырех значений:

  1. shift s, где s - состояние,
  2. свертка по правилу A->β ,
  3. допуск (accept)
  4. ошибка.

Функция goto получает состояние и символ грамматики и выдает состояние. Функция goto , строящаяся по грамматике G , есть функция переходов детерминированного магазинного автомата, который распознает язык, порождаемый грамматикой G.

Управляющая программа выглядит следующим образом:

Установить ip на первый символ входной цепочки w$;


while (цепочка не закончилась)
{
   Пусть s - состояние на вершине магазина, 
   a - символ входной цепочки, на который указывает ip.
   if (action [s, a] == shift s')
   {
      push (a);
      push (s');
      ip++;
   }
   else if (action [s, a] == reduce A->β)
   {
      for (i=1; i<=| β |;  i++)
      {
         pop ();
         pop ();
      }
      Пусть s' - состояние на вершине магазина;
      push (A);
      push (goto [s', A]);
      Вывод правила (A->β);
   }
   else if (action [s, a] == accept)
   {
      return success;
   }
   else
   {
      error ();       
   }
}

Управляющая таблица LR(0)-анализатора

Обсудим подробно алгоритм построения управляющей таблицы на примере LR(0)-анализаторов.

Заметим, что LR(0)-анализатор принимает решение о своих действиях только на основании содержимого магазина, не учитывая символы входной цепочки. Для иллюстрации построения таблиц LR(0)-анализатора мы будем использовать грамматику G0:

(1) S -> (L)
(2) S -> x
(3) L -> S
(4) L -> L, S

Определение.Пусть G = (VT, VN, P, S) - КС-грамматика. Пополненной грамматикой (augmented grammar) будем называть грамматику G' = (VT, VN +{S'}, P+{S'->S}, S') , где S' - нетерминал, непринадлежащий множеству N.

Определение.Пусть G = (VT, VN, P, S) - КС-грамматика. Будем называть [A->w1.w2, u] LR(k)-ситуацией (LR(k)-item), если A-> w1w2 является правилом из P и u - цепочка терминалов, длина которой не превосходит k .

Понятно, что LR(0)-ситуации не должны содержать терминальной цепочки, то есть мы можем записывать их следующим образом: [A-> w1.w2] .

Далее мы рассмотрим поведение анализатора грамматики при разборе входной цепочки.

Оксана Пагина
Оксана Пагина
Россия, Москва
Александр Королёв
Александр Королёв
Россия