Математический словарь
" 0 C F G H K L N P S T W Z А Б В Г Д Е Ж З И Й К Л М Н О П Р С Т У Ф Х Ц Ч Ш Э Ю Я

МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА

Значение МАТЕМАТИЧЕСКАЯ ЛИНГВИСТИКА в математической энциклопедии:

математическая дисциплина, предметом к-рой является разработка и изучение понятий, образующих основу формального аппарата для описания строения естественных языков (т. е. метаязыка лингвистики). Возникновение М. л. можно отнести приблизительно к 50-м гг. 20 в.; она была вызвана к жизни прежде всего внутренними потребностями теоретич. лингвистики, в к-рой к этому времени назрела необходимость уточнения основных понятий, а также задачами, связанными с автоматизацией переработки языковой информации (см. Автоматический перевод). В М. л. широко используются методы теории алгоритмов, теории автоматов и алгебры. Сохраняя свое прикладное значение, М. л. постоянно эволюционирует по пути превращения в теоретическую математич. дисциплину, являющуюся по сути дела одним из ответвлений математич. логики. В то же время круг приложений М. л. расширился - ее методы нашли применение в теории программирования.

Лингвистич. концепции, лежащие в основе формальных методов описания строения языка, принадлежат структурной лингвистике. Главнейшая из этих концепций - представление о языке как о "системе чистых отношений", сближающее язык с абстрактными системами, изучаемыми в математике. Это представление конкретизируется в концепции функционирования языка как преобразования нек-рых абстрактных объектов - "смыслов" - в объекты другой природы - "тексты" и обратно. Такая концепция приводит к мысли об изучении указанного преобразования (после уточнения понятий "смысла" и "текста") математич. средствами. Использование этого подхода затруднительно, если пытаться рассматривать преобразование "в целом", ввиду его чрезвычайной сложности, а также ввиду трудности формализации понятия "смысла". Однако содержательные соображения подсказывают расчленение преобразования на этапы. Напр., при одном из наиболее грубых членений нек-рый этап может состоять в переходе от "смыслов" предложений к "синтаксическим структурам без линейного порядка" - наборам элементов предложений, соединенных "синтаксическими связями", но еще не расположенных в линейные последовательности; на следующем этапе получаются линейные последовательности слов, потом они превращаются в цепочки звуков. При более тонких членениях вводятся синтаксич. структуры нескольких уровней, все более отдаляющиеся от "смыслового" и приближающиеся к "текстовому"; "послесинтаксические" этапы также подвергаются дальнейшему расчленению. Такие этапы уже легче описывать математически, уточняя представления об объектах промежуточных уровней и моделируя переходы от одних уровней к другим эффективными отображениями. Правда, рассматриваемое преобразование неоднозначно, и таковы же все или почти все (в зависимости от способа членения) промежуточные этапы; это связано с одной из важнейших особенностей языка - наличием в нем явления синонимии, т. е. возможности выражать одно и то же содержание разными способами. Поэтому приходится строить не детерминированные эффективные системы (алгоритмы), а недетерминированные (исчисления), позволяющие либо для данного объекта нек-рого уровня перечислять отвечающие ему объекты соседнего уровня или объекты (того же уровня), ему синонимичные, либо перечислять множество "правильных" объектов заданного уровня (т. е. таких, к-рые известным регулярным способом сопоставляются объектам предыдущего уровня), либо перечислять множество пар отвечающих друг другу объектов двух заданных соседних уровней (напр., "предложение + его синтаксическая структура") и т. п. Такого рода исчисления известны как грамматики формальные. Одновременно с формальными грамматиками, моделирующими преобразования языковых объектов, возникают конструкции, предназначенные для формального описания самих этих объектов. Кроме того, на множествах объектов одного уровня возникают классификации и отношения, во многом сходные с категориями традиционной грамматики (такими, как часть речи, род, падеж и т. п.) и в ряде случаев совпадающие с ними; без введения таких классификаций и отношений реальное построение формальных грамматик для естественных языков фактически невозможно.

Таким образом, можно выделить три аспекта формального описания языка: описание строения языковых объектов различных уровней, описание нек-рых специальных отношений и классификаций на множествах этих объектов и описание преобразований одних объектов в другие, а также строения множеств "правильных" объектов. Этим аспектам отвечают три основных раздела М. л.: 1) разработка и изучение способов описания строения отрезков речи; 2) изучение лингвистически значимых отношений и классификаций на множествах языковых объектов (построенные для этой цели формальные системы обычно называют аналитическими моделями языка);3) теория формальных грамматик.

Для описания строения отрезков речи используются синтаксич. структуры, представляющие собой графы или биграфы специального вида, обычно с помеченными вершинами и/или дугами. Лучше всего разработана теория описания "поверхностных" уровней (т. е. наиболее далеких от "смыслового"); на этих уровнях структуры обычно являются деревьями. Интенсивно разрабатываются способы описания более "глубинных" уровней. Для этого, в частности, предложен аппарат т. н. лексических функций, играющих при описании смысловой сочетаемости слов роль, сходную с той, к-рую традиционные категории рода, падежа, числа и т. п. играют при описании синтаксич. сочетаемости. Средств строгого описания "смыслового" уровня пока нет, но многим исследователям представляется вероятным, что на таком пути "последовательного приближения" можно надеяться выработать подход к формальному описанию смысла. Это не исключает и иных подходов; в частности, много исследований посвящено способам выражения в естественных языках предикатов, пропозициональных связок, кванторов, "переводу" с формально-логич. языков на естественные и обратно. Сюда же примыкают работы по конструированию так наз. семантических языков, в к-рых смыслы сопоставляются текстам простыми и строго формальными способами.

Аналитич. модели языка важны, в частности, ввиду того, что они позволяют уточнить логич. природу многих понятий и категорий традиционного языковедения. Эти модели не всегда носят характер эффективных процедур, поскольку в них могут входить такие понятия, как (бесконечное) множество грамматически правильных предложений нек-рого языка, считающееся заданным. Однако в ряде моделей все исходные данные представляют собой конечные множества и финитные отношения; в этих случаях входящие в модель процедуры эффективны. К теории аналитич. моделей языка примыкает теория лингвистической д е ш и ф р о в к и: ее предметом является построение процедур, применяемых, подобно аналитич. моделям, к "неупорядоченным" эмпирич. данным о языке, но всегда эффективных и позволяющих получать не только абстрактные определения, но и конкретные сведения о строении конкретных языков (напр., алгоритмы, осуществляющие автоматич. разбиение множества фонем языка на классы гласных и согласных без использования каких-либо сведений о языке, кроме нек-рого достаточно длинного текста).

Теория формальных грамматик занимает в М. л. центральное место, т. к. она позволяет моделировать наиболее существенный аспект функционирования языка - переработку смыслов в тексты и обратно - и благодаря этому служит связующим звеном между остальными разделами М. л. По характеру своего аппарата теория формальных грамматик во многом близка к теории алгоритмов и теории автоматов. Более других разработаны те типы формальных грамматик, к-рые служат для характеризации множества грамматически правильных предложений языка и приписывания этим предложениям синтаксич. структур. Предложения при этом моделируются цепочками (словами) в конечном алфавите, элементы к-рого интерпретируются как слова естественного языка (поэтому в М. л. термин "цепочка" предпочитают термину "слово", а алфавит часто называют также словарем), и моделью множества грамматически правильных предложений служит нек-рый формальный язык. К этому типу относятся, в частности, грамматики порождающие. Порождающая грамматика представляет собой по существу частный случай исчисления Поста: она состоит из конечного алфавита, разделенного на две части - основной и вспомогательный алфавиты, конечного множества правил вывода, представляющих собой правила подстановки вида (- цепочки) и одной аксиомы (обычно состоящей из одного вспомогательного символа, называемого начальны м). (Формальный) язык, порождаемый такой грамматикой,- это множество цепочек в основном алфавите, выводимых из аксиомы. Наиболее важный для лингвистич. приложений класс порождающих грамматик - грамматики составляющих, у к-рых каждое правило имеет вид где - цепочки в объединении основного и вспомогательного алфавитов, А - вспомогательный символ и 6 непуста. Грамматика составляющих позволяет естественным образом сопоставлять цепочкам порождаемого ею языка размеченные системы составляющих. Этот класс грамматик наиболее важен и в чисто математич. отношении, т. к. языки, порождаемые грамматиками составляющих, представляют собой простой и весьма важный подкласс класса примитивно рекурсивных множеств. Среди грамматик составляющих в свою очередь особенно важны как в теоретическом, так и в прикладном аспектах грамматики бесконтекстные, у к-рых правила имеют вид где А - вспомогательный символ. К бесконтекстным грамматикам близки грамматики доминационные, также порождающие формальные языки, но сопоставляющие цепочкам этих языков деревья подчинения, и грамматики категориальные, характеризующиеся особым способом задания информации о синтаксич. свойствах слов. Принципиально иной тип формальных грамматик представляют собой грамматики трансформационные;. они служат для осуществления преобразований синтаксич. структур, не "привязанных", вообще говоря, К цепочкам; эти грамматики представляются наиболее перспективными для описания строения естественных языков, т. к. позволяют рассматривать синтаксические и линейные отношения между словами раздельно, что лучше отражает языковую реальность.

Теория формальных грамматик наряду с "традиционными" для нее лингвистич. приложениями нашла применение в теории программирования для описания языков программирования и трансляторов. Особенно широко применяются для этих целей бесконтекстные грамматики, но используются и грамматики более общего вида.

Лит.:[1] Xомский Н., в кн.: Новое в лингвистике, в. 2, М., 1962, с. 412-527; [2] Гладкий А. В., Мельчук И. А., Элементы математической лингвистики, М., 1969.

А. В. Гладкий.