НОУ ИНТУИТ | Введение в схемы, автоматы и алгоритмы. Лекция 5: Регулярные языки и конечные автоматы

Учитесь и получайте официальные документы БЕСПЛАТНО. Вы можете поддержать наш проект.

Регистрация Вход

Твой путь к знаниям!

Тверской государственный университет

Опубликован: 21.08.2007 | Доступ: свободный | Студентов: 1684 / 243 | Оценка: 5.00 / 5.00 | Длительность: 14:18:00

ISBN: 978-5-94774-714-0

Тема: Алгоритмы и дискретные структуры

Специальности: Программист, Математик

|

Вам нравится? Нравится 36 студентам

| Поделиться |

Поддержать курс

| Скачать электронную книгу

Автоматы для регулярных языков

Покажем, что каждый регулярный язык можно распознать конечным автоматом.

Теорема 5.1. Для каждого регулярного выражения r можно эффективно построить такой недетерминированный конечный автомат M, который распознает язык, задаваемый r, т.е. L_M= L_r.

Доказательство Построение автомата M по выражению r проведем индукцией по длине r, т.е. по общему количеству символов алфавита $\Sigma,$ символов $\varnothing$ и $\varepsilon,$ знаков операций $+, \hat{} , ^{*}$ и скобок в записи r.

Базис. Автоматы для выражений длины 1: $\varnothing,$ $\varepsilon$ и $a \in \Sigma$ показаны на следующем рисунке.

Рис. 5.1.

Заметим, что у каждого из этих трех автоматов множество заключительных состояний состоит из одного состояния.

Индукционный шаг. Предположим теперь, что для каждого регулярного выражения длины <= k построен соответствующий НКА, причем у него единственное заключительное состояние. Рассмотрим произвольное регулярное выражение r длины k+1. В зависимости от последней операции оно может иметь один из трех видов: (r₁ + r₂), (r₁ r₂) или (r₁)^*. Пусть $M_{1}= <\Sigma , Q_{1}, q_{0}^{1}, \{ q_{f}^{1}\} , \Phi _{1} >$ и $M_{2}= <\Sigma , Q_{2}, q_{0}^{2}, \{ q_{f}^{2}\} , \Phi _{2} >$ - это НКА, распознающие языки L_r1 и L_r2, соответственно. Не ограничивая общности, мы будем предполагать, что у них разные состояния: $Q_{1} \cap Q_{2} = \varnothing$ .

Тогда НКА $M= <\Sigma , Q, q_{0}, \{ q_{f}\} , \Phi >$ , диаграмма которого представлена на рис. 5.2, распознает язык $L_{r} =L_{r1} + r_{2}=L_{r1} \cup L_{r2}$ .

Рис. 5.2.

У этого автомата множество состояний $Q = Q_{1} \cup Q_{2} \cup \{ q_{0}, q_{f}\}$ , где q₀ - это новое начальное состояние, q_f - новое (единственное !) заключительное состояние, а программа включает программы автоматов M₁ и M₂ и четыре новых команды $\varepsilon$ -переходов: $\Phi = \Phi _{1} \cup \Phi _{2} \cup \{ q_{0} \to q_{0}^{1}, q_{0} \to q_{0}^{2}, q_{f}^{1} \to q_{f}, q_{f}^{2} \to q_{f}\}$ . Очевидно, что язык, распознаваемый НКА M, включает все слова из L_{M₁} и из L_{M₂}. С другой стороны, каждое слово $w \in L_{M}$ переводит q₀ в q_f, и после первого шага несущий его путь проходит через q₀¹ или q₀². Так как состояния M₁ и M₂ не пересекаются, то в первом случае этот путь может попасть в q_f только по $\varepsilon$ -переходу из q_f¹ и тогда $w \in L_{M1}\}$ . Аналогично, во втором случае $w \in L_{M2}$ .

Для выражения $r = r_{1}\hat{} r_{2}$ диаграмма НКА $M= <\Sigma , Q, q_{0}, \{ q_{f}\} , \Phi >$ , распознающего язык L_r, представлена на следующем рисунке.

Рис. 5.3.

У этого автомата множество состояний $Q = Q_{1} \cup Q_{2}$ , начальное состояние q₀= q₀¹, заключительное состояние q_f =q_f², а программа включает программы автоматов M₁ и M₂ и одну новую команду - $\varepsilon$ -переход из заключительного состояния M₁ в начальное состояние M₂, т.е. $\Phi = \Phi _{1} \cup \Phi _{2} \cup \{ q_{f}^{1} \to q_{0}^{2}\}$ . Здесь также очевидно, что всякий путь из q₀= q₀¹ в q_f =q_f² проходит через $\varepsilon$ -переход из q_f¹ в q₀². Поэтому всякое слово, допускаемое M, представляет конкатенацию некоторого слова из L_M1} с некоторым словом из L_M2}, и любая конкатенация таких слов допускается. Следовательно, НКА M распознает язык $L_{r} =L _{r1} \hat{} r_{2}\} =L _{r1} L_{r2}$ .

Пусть r = r₁^*. Диаграмма НКА $M= <\Sigma , Q, q_{0}, \{ q_{f}\} , \Phi >$ , распознающего язык L_r=L_r1* = L_M1^* представлена на рис. 5.3.

Рис. 5.3. Диаграмма автомата M, распознающего язык Lr1*

У этого автомата множество состояний $Q = Q_{1} \cup \{ q_{0}, q_{f}\}$ , где q₀ - это новое начальное состояние, q_f - новое (единственное !) заключительное состояние, а программа включает программу автомата M₁ и четыре новых команды $\varepsilon$ -переходов: $\Phi = \Phi _{1} \cup \{ q_{0} \to q_{0}^{1}, q_{0} \to q_{f}, q_{f}^{1} \to q_{0}^{1}, q_{f}^{1} \to q_{f}\}$ . Очевидно, $\varepsilon \in L_{M}$ . Для непустого слова w по определению итерации $w \in L_{r1*} \Leftrightarrow$ для некоторого k >= 1 слово w можно разбить на k подслов: w=w₁w₂... w_k и все $w_{i} \in L_{M1}$ . Для каждого i= 1,... ,k слово w_i переводит q₀¹ в q_f¹. Тогда для слова w в диаграмме M имеется путь

$q_0 \stackrel{\varepsilon}{\longrightarrow} q_0^1 \stackrel{w_1}{\longrightarrow}q_f^1 \stackrel{\varepsilon}{\longrightarrow} q_0^1 \stackrel{w_2}{\longrightarrow}q_f^1 \ldots q_0^1 \stackrel{w_k}{\longrightarrow}q_f^1 \stackrel{\varepsilon}{\longrightarrow}q_f$

Следовательно, $w \in L_{M}$ . Обратно, если некоторое слово переводит q₀ в q_f, то либо оно есть $\varepsilon,$ либо его несет путь, который, перейдя из q₀ в q₀¹ и затем пройдя несколько раз по пути из q₀¹ в q_f¹ и вернувшись из q_f¹ в q₀¹ по $\varepsilon$ -переходу, в конце концов из q_f¹ по $\varepsilon$ -переходу завершается в q_f. Поэтому такое слово $w \in L _{M1}^{*}$ .

Из теорем 4.2 и 5.1 непосредственно получаем

Следствие 5.1. Для каждого регулярного выражения можно эффективно построить детерминированный конечный автомат, который распознает язык, представляемый этим выражением.

Это утверждение - один из примеров теорем синтеза: по описанию задания (языка как регулярного выражения ) эффективно строится программа (ДКА), его выполняющая. Справедливо и обратное утверждение - теорема анализа.

Теорема 5.2. По каждому детерминированному (или недетерминированному) конечному автомату можно построить регулярное выражение, которое представляет язык, распознаваемый этим автоматом.

Доказательство этой теоремы достаточно техническое и выходит за рамки нашего курса.

Таким образом, можно сделать вывод, что класс конечно автоматных языков совпадает с классом регулярных языков. Далее мы будем называть его просто классом автоматных языков.

Автомат M_r, который строится в доказательстве теоремы 5.1 по регулярному выражению r, не всегда является самым простым.

Например, для реализации выражения-слова a₁a₂ ... a_n, где $a_{i} \in \Sigma (i=1,2, \dots , n)$ , можно просто использовать автомат с (n+1) состоянием q_i (i=0,1,2, ... , n) и командами q_{i-1} a_i -> q_i, в котором нет пустых $\varepsilon$ -переходов, участвующих в общей конструкции для конкатенации. Также при построении автомата для объединения M₁ и M₂ можно сливать их начальные состояния в одно, если в них нет переходов из других состояний (тогда не потребуется новое начальное состояние). Можно также объединить их заключительные состояния, если из них нет переходов в другие состояния и алфавиты M₁ и M₂ совпадают. Если из заключительного состояния M₁ нет переходов в другие состояния, то при конкатенации его можно объединить с начальным состоянием M₂. Вместе с тем, утверждения задачи 5.9 показывают, что наша общая конструкция достаточно экономна.

Пример 5.7. Применим теорему 5.1 к регулярному выражению $r = (1 +01 +001)^{*}(\varepsilon + 0 +00)$ , которое, как мы заметили в примере 5.4, представляет язык, состоящий из всех слов, которые не содержат подслово '000'.

На рис. 5.5 представлены диаграммы автоматов M₁ и M₂, построенных по выражениям r₁ = (1 +01 +001) и $r_{2}= (\varepsilon + 0 +00)$ , соответственно, с помощью конструкций для конкатенации и объединения. Как мы отмечали выше, автомат M₁ можно было бы еще упростить, склеив начальные состояния q₂, p₁ и s₁, а также заключительные состояния q₃, p₃ и s₄.

Рис. 5.5.

Автомат M₃ для выражения r₁^* = (1 +01 +001)^* получается из M₁ добавлением нового начального состояния q₀ и заключительного состояния q₅ и $\varepsilon$ -переходов из q₀ в q₁ и q₅, из q₄ в q₅ и из q₅ в q₁. Затем результирующий автомат для исходного выражения r получается последовательным соединением M₃ и M₂. Он представлен ниже на рис. 5.6.

Рис. 5.6.

Дальше >>

Авторизоваться

Введение в схемы, автоматы и алгоритмы

Регулярные языки и конечные автоматы

Автоматы для регулярных языков

Вопросы и ответы