Попытка расширить сравнение LL и LR.

gsvgit · gsvgit · commit 1ced7c1963ba · 2026-06-05T17:04:01.000+03:00
diff --git a/book_structure.md b/book_structure.md
@@ -2,7 +2,7 @@
 
 
 Условные обозначения статусов:
-- ✅ — раздел полностью написан
+- ✅ — раздел полностью написан и готов к внимательной вычитке. Могут потребоваться доработки, связанные с добавлением новых частей.
 - ⚠️ — раздел присутствует частично или требует доработки
 - ❌ — содержание раздела отсутствует, есть только заготовка
 
@@ -79,9 +79,9 @@
 ### Глава 6. Контекстно-свободные языки и грамматики — `Context-Free_Languages.tex` — ⚠️
 
 - ✅ Раздел "Основные определения"
-- ⚠️ Раздел "Расширенная форма Бэкуса-Наура"
+- ✅ Раздел "Расширенная форма Бэкуса-Наура"
 - ✅ Раздел "Рекурсивные автоматы и сети"
-- ⚠️ Раздел "Дерево вывода"
+- ✅ Раздел "Дерево вывода"
 - ⚠️ Раздел "Сжатое представление леса разбора"
 - ✅ Раздел "Пустота КС-языка"
 - ✅ Раздел "Нормальная форма Хомского"
diff --git a/tex/part_02_Foundations/chapter_07_ClassicalParsing/06_LLvsLR.tex b/tex/part_02_Foundations/chapter_07_ClassicalParsing/06_LLvsLR.tex
@@ -1,4 +1,8 @@
 \section{Сравнение классов LL и LR}
+\label{sec:LLvsLR}
+\tikzsetfigurename{LLvsLR_}
+
+\mytodo{Перечитаь раздел. Провреить корректность. Поправить вёрстку.}
 
 Иерархию языков, распознаваемых различными классами алгоритмов, можно представить как изображено на рисунке~\ref{fig:ll_lr_comparison}.
 
@@ -10,9 +14,85 @@ \section{Сравнение классов LL и LR}
 \label{fig:ll_lr_comparison}
 \end{marginfigure}
 
-Из диаграммы видно, что класс языков, распознаваемых LL(k) алгоритмом уже, чем класс языков, распознаваемый LR(k) алгоритмом, при любом конечном $k$. Приведём несколько примеров.
-\begin{enumerate}
-\item $L = \{a^mb^nc \mid m \geq n \geq 0\} $ является LR(0), но для него не существует LL(1) грамматики.
-\item $L = \{ a^n b^n + a^n c^n \mid n > 0\}$ является LR, но не LL.
-\item Больше примеров можно найти в работе Джона Битти~\cite{BEATTY1980193}.
-\end{enumerate}
+Из диаграммы видно, что класс языков, распознаваемых $LL(k)$ алгоритмом, уже, чем класс языков, распознаваемых $LR(k)$ алгоритмом, при любом конечном $k$. Ниже мы разберём два классических примера языков, демонстрирующих данное различие.
+
+\begin{example}
+\label{ex:ll_lr_ambnc}
+Рассмотрим язык $L_1 = \{ a^m b^n c \mid m \geq n \geq 0\}$. Покажем, что он является $LR(0)$, но не является $LL(1)$.
+
+Язык $L_1$ порождается следующей грамматикой $G_1 = \langle \{S, T\}, \{a, b, c\}, P, S \rangle$, где $P$ состоит из правил:
+\begin{align*}
+  S &\to a S \mid T c \mid c \\
+  T &\to a T b \mid a b
+\end{align*}
+
+Интуитивно, $T$ порождает $a^n b^n$ (n \geq 1), $S \to a S$ добавляет <<лишние>> $a$, а $S \to T c$ и $S \to c$ завершают вывод, добавляя терминальный символ $c$.
+
+Покажем, что $G_1$ является $LR(0)$. Расширим грамматику, пронумеровав продукции:
+\begin{align*}
+  (0)\; S' &\to S \$        & (3)\; S &\to c \\
+  (1)\; S  &\to a S          & (4)\; T &\to a T b \\
+  (2)\; S  &\to T c          & (5)\; T &\to a b
+\end{align*}
+
+$LR(0)$-автомат для расширенной грамматики $G_1$ \fixit{изображён}{Нормально разложить автомат. Провреить, что он кореектен.} \fixit{на рисунке}{Нормально оформить оисунок и ссылку на него (через figure и т.д.)}
+
+\begin{center}
+  \input{part_02_Foundations/chapter_07_ClassicalParsing/figures/06_LLvsLR/example1_automaton}
+\end{center}
+
+Состояния, содержащие пункты свёртки~--- это 3 ($S \to c\cdot$), 5 ($S \to aS\cdot$), 7 ($T \to ab\cdot$), 8 ($T \to aTb\cdot$) и 9 ($S \to Tc\cdot$). Каждое из них содержит ровно один такой пункт и не содержит пунктов сдвига. Конфликтов нет~--- грамматика $LR(0)$.
+
+Теперь покажем, что $G_1$ не является $LL(1)$. Вычислим множества $\first$:
+\[
+\first(S) = \{a, c\}, \qquad \first(T) = \{a\}.
+\]
+Для продукций $S$ \fixit{имеем:}{Поправить вёрстку}
+\[
+\first(a S) = \{a\}, \qquad \first(T c) = \first(T) \cup (\first(c) \text{ т.к. } \varepsilon \notin \first(T)) = \{a\}.
+\]
+Пересечение $\first(a S) \cap \first(T c) = \{a\}$ непусто. При предпросмотре символа $a$ $LL(1)$-анализатор не может выбрать между продукциями $S \to a S$ и $S \to T c$~--- конфликт.
+
+Более того, $L_1$ не является $LL(k)$ ни для какого фиксированного $k$. Действительно, в любой момент разбора, когда прочитано несколько $a$, необходимо решить, будут ли эти $a$ впоследствии спарены с символами $b$ или останутся <<лишними>>. Разница между числом $a$ и числом $b$ может быть сколь угодно большой, поэтому для принятия верного решения требуется заглянуть за все символы $a$~--- предпросмотр неограниченной глубины. Следовательно, язык принадлежит классу $LR(0)$, но не принадлежит классу $LL(k)$ ни при каком $k$.
+\end{example}
+
+\begin{example}
+\label{ex:ll_lr_anbnancn}
+Рассмотрим язык $L_2 = \{ a^n b^n \mid n > 0\} \cup \{ a^n c^n \mid n > 0\}$. Покажем, что он является $LR(0)$, но не является $LL(k)$ ни для какого $k$.
+
+Язык $L_2$ порождается грамматикой $G_2 = \langle \{S, A, B\}, \{a, b, c\}, P, S \rangle$, где $P$:
+\begin{align*}
+  S &\to A \mid B \\
+  A &\to a A b \mid a b \\
+  B &\to a B c \mid a c
+\end{align*}
+
+Интуитивно, $A$ порождает $a^n b^n$, а $B$~--- $a^n c^n$ ($n > 0$).
+
+Пронумеруем продукции расширенной грамматики:
+\begin{align*}
+  (0)\; S' &\to S \$     & (3)\; A &\to a A b    & (5)\; B &\to a B c \\
+  (1)\; S  &\to A         & (4)\; A &\to a b       & (6)\; B &\to a c \\
+  (2)\; S  &\to B
+\end{align*}
+
+$LR(0)$-автомат для расширенной грамматики $G_2$ \fixit{изображён}{Нормально разложить автомат. Провреить, что он кореектен.} \fixit{на рисунке}{Нормально оформить оисунок и ссылку на него (через figure и т.д.)}.
+
+\begin{center}
+  \input{part_02_Foundations/chapter_07_ClassicalParsing/figures/06_LLvsLR/example2_automaton}
+\end{center}
+
+Состояния, содержащие пункты свёртки~--- это 2 ($S \to A\cdot$), 3 ($S \to B\cdot$), 8 ($A \to ab\cdot$), 9 ($B \to ac\cdot$), 10 ($A \to aAb\cdot$) и 11 ($B \to aBc\cdot$). Как и в первом примере, каждое из них содержит ровно один пункт и не содержит пунктов сдвига. Конфликтов нет~--- грамматика $LR(0)$.
+
+Покажем, что $G_2$ не является $LL(k)$ ни для какого $k$. Вычислим $\first$:
+\[
+\first(A) = \first(B) = \{a\}.
+\]
+Поскольку $\first(A) \cap \first(B) = \{a\} \neq \varnothing$, $LL(1)$-анализатор не может выбрать между $S \to A$ и $S \to B$ при предпросмотре символа $a$.
+
+Более того, при любом фиксированном $k$ предпросмотр $k$ символов не помогает: для $n > k$ первые $k$ символов цепочки~--- это $a^k$, и на основании них невозможно определить, с каким символом~--- $b$ или $c$~--- эти $a$ должны быть спарены. Различающий символ находится на позиции $n$, которая может быть сколь угодно большой. Таким образом, $L_2$ не является $LL(k)$ ни для какого конечного $k$.
+
+Данный пример особенно наглядно демонстрирует принципиальное различие между восходящими и нисходящими анализаторами: $LR$-анализатор принимает решение о свёртке, уже увидев различающий символ ($b$ или $c$), в то время как $LL$-анализатор вынужден предсказывать, какую продукцию применять, до того как релевантная информация становится доступной.
+\end{example}
+
+Больше примеров языков, разделяющих классы $LL(k)$ и $LR(k)$, можно найти в работе Джона Битти~\sidecite{BEATTY1980193}.
diff --git a/tex/part_02_Foundations/chapter_07_ClassicalParsing/figures/06_LLvsLR/example1_automaton.tex b/tex/part_02_Foundations/chapter_07_ClassicalParsing/figures/06_LLvsLR/example1_automaton.tex
@@ -0,0 +1,93 @@
+\begin{tikzpicture}[> = stealth,node distance=3.25cm, on grid, scale=0.8, every node/.style={scale=0.8}]
+  \node[r_state] (s0)
+  {
+    $
+    \begin{aligned}
+      S' &\to \cdot S\$ \\
+      S  &\to \cdot aS \\
+      S  &\to \cdot Tc \\
+      S  &\to \cdot c \\
+      T  &\to \cdot aTb \\
+      T  &\to \cdot ab
+    \end{aligned}
+    $
+  };
+  \node[r_state] (s1) [right=of s0]
+  {
+    $ S' \to S \cdot \$ $
+  };
+  \node[r_state] (s2) [right=of s1]
+  {
+    $ S' \to S\$ \cdot $
+  };
+  \node[r_state] (s3) [below=2.5cm of s0]
+  {
+    $
+    \begin{aligned}
+      S  &\to a \cdot S \\
+      T  &\to a \cdot Tb \\
+      T  &\to a \cdot b \\
+      S  &\to \cdot aS \\
+      S  &\to \cdot Tc \\
+      S  &\to \cdot c \\
+      T  &\to \cdot aTb \\
+      T  &\to \cdot ab
+    \end{aligned}
+    $
+  };
+  \node[r_state] (s4) [right=of s3]
+  {
+    $ S \to aS \cdot $
+  };
+  \node[r_state] (s5) [right=of s4]
+  {
+    $ T \to aT \cdot b $
+  };
+  \node[r_state] (s6) [right=of s5]
+  {
+    $ T \to aTb \cdot $
+  };
+  \node[r_state] (s7) [below=2.5cm of s3, xshift=-1.5cm]
+  {
+    $ S \to T \cdot c $
+  };
+  \node[r_state] (s8) [below=2.5cm of s4]
+  {
+    $ S \to c \cdot $
+  };
+  \node[r_state] (s9) [below=2.5cm of s5]
+  {
+    $ T \to ab \cdot $
+  };
+  \node[r_state] (s10) [below=2.5cm of s6]
+  {
+    $ S \to Tc \cdot $
+  };
+
+  \node[num_state] at (s0.north west) {0};
+  \node[num_state] at (s1.north west) {1};
+  \node[num_state] at (s2.north west) {acc};
+  \node[num_state] at (s3.north west) {4};
+  \node[num_state] at (s4.north west) {5};
+  \node[num_state] at (s5.north west) {6};
+  \node[num_state] at (s6.north west) {8};
+  \node[num_state] at (s7.north west) {2};
+  \node[num_state] at (s8.north west) {3};
+  \node[num_state] at (s9.north west) {7};
+  \node[num_state] at (s10.north west) {9};
+
+  \path[->]
+    (s0) edge [above]                node {$S$}  (s1)
+         edge [left]                 node {$a$}  (s3)
+         edge [right, bend right=25] node {$c$}  (s8)
+         edge [left,  bend left=25]  node {$T$}  (s7)
+    (s1) edge [above]                node {$\$$} (s2)
+    (s3) edge [loop below]           node {$a$}  ()
+         edge [above]                node {$S$}  (s4)
+         edge [above, bend left=15]  node {$T$}  (s5)
+         edge [above right, bend left=15]  node {$c$}  (s8)
+         edge [above right, bend right=20] node {$b$}  (s9)
+    (s5) edge [above]                node {$b$}  (s6)
+    (s7) edge [above, bend left=20]  node {$c$}  (s10)
+    ;
+\end{tikzpicture}
diff --git a/tex/part_02_Foundations/chapter_07_ClassicalParsing/figures/06_LLvsLR/example2_automaton.tex b/tex/part_02_Foundations/chapter_07_ClassicalParsing/figures/06_LLvsLR/example2_automaton.tex
@@ -0,0 +1,99 @@
+\begin{tikzpicture}[> = stealth,node distance=3.25cm, on grid, scale=0.8, every node/.style={scale=0.8}]
+  \node[r_state] (s0)
+  {
+    $
+    \begin{aligned}
+      S' &\to \cdot S\$ \\
+      S  &\to \cdot A \\
+      S  &\to \cdot B \\
+      A  &\to \cdot aAb \\
+      A  &\to \cdot ab \\
+      B  &\to \cdot aBc \\
+      B  &\to \cdot ac
+    \end{aligned}
+    $
+  };
+  \node[r_state] (s1) [right=of s0]
+  {
+    $ S' \to S \cdot \$ $
+  };
+  \node[r_state] (s2) [right=of s1]
+  {
+    $ S' \to S\$ \cdot $
+  };
+  \node[r_state] (s3) [below=2.5cm of s0]
+  {
+    $
+    \begin{aligned}
+      A  &\to a \cdot Ab \\
+      A  &\to a \cdot b \\
+      B  &\to a \cdot Bc \\
+      B  &\to a \cdot c \\
+      A  &\to \cdot aAb \\
+      A  &\to \cdot ab \\
+      B  &\to \cdot aBc \\
+      B  &\to \cdot ac
+    \end{aligned}
+    $
+  };
+  \node[r_state] (s4) [right=of s3]
+  {
+    $ S \to A \cdot $
+  };
+  \node[r_state] (s5) [right=of s4]
+  {
+    $ S \to B \cdot $
+  };
+  \node[r_state] (s6) [below=2.5cm of s3]
+  {
+    $ A \to aA \cdot b $
+  };
+  \node[r_state] (s7) [below=2.5cm of s4]
+  {
+    $ B \to aB \cdot c $
+  };
+  \node[r_state] (s8) [below=2.5cm of s6]
+  {
+    $ A \to ab \cdot $
+  };
+  \node[r_state] (s9) [right=2cm of s8]
+  {
+    $ A \to aAb \cdot $
+  };
+  \node[r_state] (s10) [below=2.5cm of s7]
+  {
+    $ B \to ac \cdot $
+  };
+  \node[r_state] (s11) [right=2cm of s10]
+  {
+    $ B \to aBc \cdot $
+  };
+
+  \node[num_state] at (s0.north west) {0};
+  \node[num_state] at (s1.north west) {1};
+  \node[num_state] at (s2.north west) {acc};
+  \node[num_state] at (s3.north west) {4};
+  \node[num_state] at (s4.north west) {2};
+  \node[num_state] at (s5.north west) {3};
+  \node[num_state] at (s6.north west) {6};
+  \node[num_state] at (s7.north west) {7};
+  \node[num_state] at (s8.north west) {8};
+  \node[num_state] at (s9.north west) {10};
+  \node[num_state] at (s10.north west) {9};
+  \node[num_state] at (s11.north west) {11};
+
+  \path[->]
+    (s0) edge [above]                node {$S$}  (s1)
+         edge [left]                 node {$a$}  (s3)
+         edge [above, bend left=10]  node {$A$}  (s4)
+         edge [above, bend right=10] node {$B$}  (s5)
+    (s1) edge [above]                node {$\$$} (s2)
+    (s3) edge [loop below]           node {$a$}  ()
+         edge [left]                 node {$A$}  (s6)
+         edge [left, bend right=20]  node {$b$}  (s8)
+         edge [above, bend left=15]  node {$B$}  (s7)
+         edge [above left, bend left=25] node {$c$}  (s10)
+    (s6) edge [right]                node {$b$}  (s9)
+    (s7) edge [above]                node {$c$}  (s11)
+    ;
+\end{tikzpicture}
diff --git a/tex/part_02_Foundations/chapter_07_ClassicalParsing/main.tex b/tex/part_02_Foundations/chapter_07_ClassicalParsing/main.tex
@@ -2,6 +2,8 @@
 \chapter{Классические алгоритмы синтаксического анализа для строк}
 \tikzsetfigurename{ClassicalParsing_}
 
+\mytodo{Унифицировать вёрстку стеков в примерах для LL и LR}
+
 В данной главе мы рассмотрим классические алгоритмы синтаксического анализа для строк.
 Эти алгоритмы составляют фундамент, на котором далее будут построены алгоритмы поиска путей с контекстно-свободными ограничениями в графах (главы~\ref{chpt:CFPQ_CYK}--\ref{chpt:GLR}).