НОУ ИНТУИТ | Разработка компиляторов. Лекция 6: Синтаксические анализаторы. Нисходящие анализаторы

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Опубликован: 23.07.2006 | Доступ: свободный | Студентов: 2215 / 889 | Оценка: 4.28 / 4.17 | Длительность: 21:37:00

Тема: Программирование

Специальности: Системный архитектор

|

Вам нравится? Нравится 25 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Условия использования метода рекурсивного спуска

Метод рекурсивного спуска без возвратов можно использовать только для грамматик, правила которых удовлетворяют следующему условию: первого символа каждого правила должно быть достаточно для того, чтобы определить, какое правило применимо в данном случае. Более точно это условие можно формализовать путем определения множества FIRST.

Определение.Для КС-грамматики G и цепочки w, состоящей из терминальных и нетерминальных символов, определим множество FIRST_k (w) следующим образом:

FIRST_k (w) = {x | w =>* xv, |x| = k или w =>* x, |x| < k}, где k - натуральное число.

Иными словами, множество FIRST_k (w) состоит из всех терминальных префиксов длины k терминальных цепочек, выводимых из w.

Пример.Рассмотрим грамматику, порождающую подмножество типов языка Pascal.

$type \to imple \\ type \to \widehat{\ }\,\textbf{id} \\ type \to \textbf{array}\ [simple]\ \textbf{of}\ type \\ simple \to \textbf{integer} \\ simple \to \textbf{char} \\ simple \to \textbf{num .. num}$

Для этой грамматики мы имеем:

FIRST₁ (simple) = {integer, char, num}
FIRST₁ (^id) = {^}
FIRST₁ (array [simple] of type) = { array }

Понятно, что если цепочка w состоит только из терминалов, то FIRST_k (w) - это первые k символов цепочки w , если |w| >=, или это сама цепочка w, если |w| < k <

Алгоритм построения множества FIRST

Прежде всего, определим множество FIRST для всех символов грамматики:

если X - терминал, то FIRST (X) = X
для правила $X \to \varepsilon$ добавим $\varepsilon$ к множеству FIRST (X)
если X - нетерминал и $X \to Y_{1}Y_{2}{\ldots} Y_{k}$ - правило грамматики, то добавим терминал а в FIRST(X), если для некоторого i этот терминал a принадлежит $FIRST (Y_{i})$ и $\varepsilon$ принадлежит всем множествам $FIRST (Y_{1}), {\ldots}$ , $FIRST (Y_{i-1})$ , то есть $Y_{1} , {\ldots}, Y_{i-1}=>*\varepsilon .$ Если $\varepsilon$ принадлежит $FIRST (Y_{j})$ для всех $j =1, 2, {\ldots}, k$ , то добавим $\varepsilon$ в FIRST(Y).

Теперь сформулируем сам алгоритм построения множества FIRST(w).

Вход.КС-грамматика G=(N, T, P, S) и цепочка w терминальных и нетерминальных символов.

Выход. FIRST (w).

Метод.Добавим в FIRST (X ₁ X ₂ …X _k) все непустые символы из FIRST (X₁). Затем, если $\varepsilon$ принадлежит FIRST (X₁), то добавим все непустые символы из FIRST (X₂), и так далее. Наконец, если для всех j FIRST (X_j) содержит пустой символ, то мы добавим $\varepsilon$ в множество FIRST (X₁ X₂…X_k) .

Пример.Рассмотрим грамматику с правилами:

${S \to B A} \\ {A \to +B A } \\ {A \to \varepsilon } \\ {B \to D C} \\ {C \to * D C } \\ {C \to \varepsilon } \\ {D \to (S) } \\ {D \to a}$

Для этой грамматики множества FIRST определяются следующим образом:

$\begin{align*} &{FIRST (D) = {\{}(, a{\}}, \ \ FIRST (C) = {\{}*, }\varepsilon { {\}}, \ \ FIRST (B) = FIRST (D), \\ &FIRST (A)={\{}+, }\varepsilon { {\}}, } \ \ {FIRST (S) = {\{}(, a{\}}} \end{align*}$

Дальше >>

Авторизоваться

Разработка компиляторов

Синтаксические анализаторы. Нисходящие анализаторы

Условия использования метода рекурсивного спуска

Алгоритм построения множества FIRST

Вопросы и ответы