7
ИНФОРМАЦИОННЫЕ СТРУКТУРЫ И ИХ
ПРЕОБРАЗОВАНИЕ
1.1. Элементы теории языка и их грамматика. Символы, цепочки и
операции над ними
Языком
в алфавите
Σ
называют множество цепочек, состоящих из
элементов этого алфавита.
Алфавит-
любое множество символов.
В общем случае алфавит не обязан быть конечным, но мы будем иметь
дело только с конечным.
Цепочка
- последовательность символов алфавита.
Цепочка и слово - синонимы.
Символы: a,b,c,d - элементы алфавита,
M,Q,S,T - переменные, обозначающие любой символ алфавита,
u, w, v, x, y, z, t - обозначают цепочки символов. u=аbc.
Причем сцепление цепочек xy
yx (сон
нос).
Пример:
U=abcd - цепочка,
X=cb - цепочка.
λ
х=х
λ
=х, где
λ
-
пустая цепочка
- цепочка, не содержащая ни одного
символа (обозначается
λ
или е).
Цепочка, содержащая
i
одинаковых символов –
a
i
=
aa…a
(i штук).
|a
i
|=i.
Если x=ab и y=cd, то w=xy=abcd называется
конкатенацией
цепочек
x и y.
Обращение цепочки
x обозначается x
r
.Если x=abc, то x
r
=cba.
Пусть x,y,z – произвольные цепочки в
Σ
.И пусть имеется цепочка
w=xyz
.
Цепочку x называют
префиксом
, цепочку z-
суффиксом
цепочки w,
цепочка y-
инфикс
цепочки w.
Пусть имеется цепочка
x=s…, s-
голова цепочки,
x=…s, s –
хвост
цепочки
x
.
Если A={a,b},B={c,d}-2 алфавита, то множество AB={ac,bc,ad,bd} и
других комбинаций быть не может. Коммутативный закон здесь не
приемлем.
Пусть L
1
-язык в алфавите
Σ
1
,а L
2
-язык в алфавите
Σ
2
.Тогда язык L
1
L
2
конкатенация языков.
Сцепление произвольного числа цепочек языка L охватывается
понятием
итерация
и обозначается L
=L
0
L
1
…, L
0
=
λ
, L
+
-
усечённая
итерация
. L
\L
+
=
λ
. Пусть
Σ
1
и
Σ
2
-алфавиты. Гомоморфизмом называют
любое отображение h=
Σ
1
→Σ
2
.
Пример
:
Σ
1
={a,b},
Σ
2
={0,1}.Тогда h(a)=1,h(b)=0.
1,2,3,4,5,6,7,8 10,11,12,13,14,15,16,17,18,19,...88