Лемма о разрастании для контекстно-свободных языков

Материал из Википедии — свободной энциклопедии
Перейти к навигации Перейти к поиску

Лемма о разрастании для контекстно-свободных языков (или uvwxy теорема) — аналог одноименной леммы для регулярных языков позволяющая относительно несложно доказывать, что данный язык не порождается контекстно-свободной грамматикой.

Формулировка

[править | править код]

Пусть  — контекстно-свободный язык над алфавитом V. Тогда


.

Иначе говоря, любую достаточно длинную строчку в можно разбить на пять частей так, что повторение второй и четвёртой частей произвольное количество раз (возможно, 0) не приведут к выходу за пределы языка.

Доказательство

[править | править код]

Пусть задан КС-язык (V, N, S, G), причем грамматика языка приведена (то есть не содержит правил вида A → ε или A → B).

Поскольку количество нетерминальных символов конечно, равно как и длина каждого правила вывода, то длина цепочки, высота дерева вывода для которой не превышает |N|, также ограничена сверху неким числом n.

Рассмотрим цепочку . В силу вышесказанного высота дерева её вывода превысит |N|, то есть найдется путь из аксиомы в один из терминальных символов, длина которого будет больше, чем количество нетерминальных символов грамматики. Поскольку на каждом шаге заменяется один нетерминальный символ, как минимум один нетерминальный символ Q на этом пути будет заменён дважды. Из этого следует, что существует цепочка xQy с непустыми x или y, выводящаяся из Q. Следовательно, в процессе вывода S →* α процесс вывода Q →* xQy можно повторять сколь угодно много раз или опустить.

Следствия и примеры использования

[править | править код]
  • В любом бесконечном КС-языке найдется бесконечное подмножество цепочек, длины которых образуют возрастающую арифметическую прогрессию.
  • Язык не является КС-языком: в нём невозможно выбрать две цепочки и накачивать их, не выходя за пределы языка (необходимо одновременно накачивать три цепочки).
  • Язык также не является КС-языком, но доказать это «накачиванием» уже не получится: можно накачивать «зоны» символов a и b, воспользовавшись тем, что символов c в цепочке может быть меньше. Но если рассмотреть принадлежащую языку цепочку , то или исключение накачиваемых цепочек выведет за пределы языка, что противоречит лемме о накачке.
  • Язык также не является КС-языком, так как он противоречит следствию из леммы.

Литература

[править | править код]
  • Кук Д., Вейз Г. Компьютерная математика / Пер, с англ. Г. М. Кобелькова. — М.: Наука, 1990. — 384 с. — ISBN 5-02 014216-6.
  • Джон Хопкрофт, Раджив Мотвани, Джеффри Ульман. Введение в теорию автоматов, языков и вычислений = Introduction to Automata Theory, Languages, and Computation. — М.: «Вильямс», 2002. — С. 528. — ISBN 0-201-44124-1.
  • А. И. Белоусов, С. Б. Ткачев. Дискретная математика / под ред. д.т.н. проф. В. С. Зарубина, д.ф.м.н. проф. А. П. Крищенко. — 4-е изд, испр.. — М.: изд-во МГТУ им. Н. Э. Баумана, 2006. — 744 с. — (математика в техническом университете). — 2000 экз. — ISBN 5-708-2886-4.