Прагматика досліджує проблеми цінності висловлювань для адресата в спілкуванні з погляду розв’язання його проблем.

Математика забезпечує лінгвістику і семіотику ефективними засобами визначення й оброблення мов.

2. Алфавіти і мови. Спробуємо дати формальне означення мови. Природно, за означенням, розпочати зі знака. Як уже підкреслювалося, мова - знакова система. Сукупність мовних знаків, що називаються далі символами, є алфавітом.

Алфавіт може бути нескінченним, але ми далі в цьому розділі будемо розглядати тільки скінченні алфавіти.

Приклади:

- латинський алфавіт;

- російський алфавіт;

- український алфавіт;

- двійковий алфавіт {0,1}.

Послідовно виписуючи символи, розташовуючи їх один за одним на папері, ми одержуємо послідовності символів. Приклади послідовностей символів в двійковому алфавіті:

1111111.

Існує низка термінів для цих послідовностей - слово, вираз, рядок, ланцюжок, речення. Ми будемо використовувати термін "слово". Слово, що не містить жодного символу, назвемо порожнім і будемо позначати e. Далі будемо розглядати алфавіт Е і його символи е₁, е₂,е₃.… Наприклад, словами будуть:

е₁е₂е₁

е₂е₂е₂е₃

Якщо ми позначимо порожнє слово через ε, то й інші слова, записані як послідовності символів алфавіту Е, можемо позначати символами іншого алфавіту. Далі за такий алфавіт приймемо грецький алфавіт.

Наприклад, слово е₁е₂е₁ ми могли б позначити γ, слово е₂е₂е₂е₃- δ і так далі.

Означення слова в алфавіті Е:

1) ε - слово в алфавіті Е;

2) якщо α - слово в алфавіті Е, e_i - символ алфавіту Е, те αe_i - слово в алфавіті E;

3) β - слово в алфавіті Е тоді і тільки тоді, коли воно побудовано за правилами 1) і 2).

Означення відноситься до типу індуктивних означень і дозволяє будувати слова в алфавіті Е.

Нехай ε - слово. Воно не містить символів, е₁ - символ алфавіту Е. Тоді е₁ - також слово. Отже, e₂ - слово, е₃ - слово і т д.; е₁е₂ - слово, тому що отримано приписуванням символу e₁ до слова e₂; e₁e₂e₂ - слово, тому що отримано приписуванням символу e₂ до слова е₁e₂ і т.д. Таким чином, слова одержуються приписуванням символу до вже існуючих (побудованих) слів.

Довжиною слова назвемо число символів у ньому. Будемо позначати довжину слова α через |α|. Наприклад, слово e₁e₂e₁ має довжину 3. За означенням |ε| = 0.

Якщо слова α і β мають однакову довжину, причому на кожнім кроці їхньої побудови, починаючи зі слова ε, виконувалося приписування однакового символу, то назвемо їх рівними.

Очевидно, що рівність слів - відношення рефлексивне, симетричне, транзитивне, тобто відношення еквівалентності.

Операцію приписування можна узагальнити.

Визначення. Нехай α і β - слова в алфавіті Е. Назвемо слово αβ, отримане посимвольним приписуванням слова β до слова α, конкатенацією слів α і β.

Приклад. Нехай e₁e₂e₂ – слово α; e₂e₂ – слово β. Тоді e₁e₂e₂e₂e₂ – слово αβ.

Легко установити, що εα = αε = α, а також те, що αβ = βα у загальному випадку невірно, що підтверджується попереднім прикладом:

e₁e₂e₂e₂e₂≠ e₂e₂e₁e₂e₂.

Визначення. Нехай α - слово е_i1e_i2…e_in, довжини n. Тоді слово е_in,е_in-1…е_i1 назвемо обертанням слова α і позначимо α^-1.

Приклад. Нехай e ₁e₂e₂ - це слово α, тоді e₂e₂e₁- це слово α^-1.

Легко установити, що α ≠ α^-1 у загальному випадку.

Розглянемо декілька термінів, що будуть використовуватися пізніше.

Нехай α, β, γ - слова в алфавіті Е. Тоді в слові αβ назвемо: α - префіксом, а β – суфіксом, а в слові αβγ, причому α чи γ можуть бути порожніми, β назвемо підсловом.

Наприклад, у слові e₁e₂e₂:

e₁, e₁e₂, e₁e₂e₂ - префікси;

e₂, e₂e₂, e₁e₂e₂ - суфікси;

e₂, e₁e₂ - підслова.

Слово ε є префіксом, суфіксом, і підсловом будь-якого слова.

Назвемо префікс (суфікс) α власним префіксом (суфіксом) слова β, якщо α ≠ β і α - префікс (суфікс) β.

Наприклад, для слова e₁e₂e₃ слово е₁ - власний префікс.

Визначення. Назвемо мовою в алфавіті Е будь-яку множину слів в алфавіті Е.

Мови програмування Паскаль, Сі, Бейсік і інші задовольняють цьому означенню, якщо вважати словом програму. Природна мова також задовольняє означенню, якщо вважати словом речення.

Приклад: Нехай Е= {0,1}. Тоді наступні множини слів:

L₁= {ε,0,1,01,10};

L₂= {0,00,000,...};

L₃= {1,11,111,...};

L₄= {0,1}

за означенням є мовами. Крім того, за означенням L = {ε} - також мова. Більш того, Æ - також мова, причому {ε} і Æ - різні мови. Нехай Е* - множина, що містить усі слова в алфавіті Е, включаючи символи самого алфавіту Е. Тоді будь-яка мова в алфавіті Е є підмножиною Е*.

Приклад. Нехай заданий алфавіт Е = {0,1}. Тоді

Е* ={ε,0,1,00,1,01,10,000,001,010,100,011,101,110,111,...}.