поддержка
проекта:
разместите на своей странице нашу кнопку!И мы
разместим на нашей странице Вашу кнопку или ссылку. Заявку прислать на
e-mail
код нашей кнопки:
Математическая лингвистика
Прикладная дисциплина, направленная на создание точных методов
исследования особенностей естественных языков, а также моделей, носящих
по отношению к явлениям языка объяснительный характер.
Казалось бы, что может быть менее формализовано, чем естественный язык и
тексты, написанные на нем. Но усилиями лингвистов и математиков были
вскрыты многие формализмы, которые лежат в основе языковой системы и
делают язык в его проявлениях таким, каким он используется людьми.
Любой, знающий русский язык, уверен, что фраза "Петя сидит за столом"
грамматически правильна, а фраза "Петя сидит за стол" неверна. Во второй
фразе неверно использованы грамматические правила, синтаксис ее явно
нарушен. Но, по-видимому, неверна и фраза "Петя сидит за тарелкой". А,
собственно, почему? Ведь вполне уместны фразы "Петя сидит за столом",
"Петя сидит за роялем", "Петя сидит за партой". Фраза "Петя сидит за
тарелкой" синтаксически верна. Нарушено в ней иное, связанное с тем, как
устроена семантика языка.
Законы синтаксиса родного языка изучают в школе. А вот законы
сочетаемости слов, законы семантики, постигаются носителями языка в
процессе обучения бессознательно. Математическая лингвистика одну из
своих центральных задач видит в том, чтобы эти законы сделать явными и
доступными для описания в точных терминах.
Потребность в решении задач такого рода возникла в середине 50-х гг.
нашего века, когда потребовалось автоматизировать деятельность
переводчиков текстов с одного языка на другой. Любое общение
руководителей государств, спортсменов, туристов, ученых не может
обойтись без переводчика. Но особую сложность представляют нарастающие,
как снежный ком, печатные тексты, издаваемые на различных языках.
Художественная и научная литература, газеты и журналы, документы и
фирменные каталоги... И многое из этого надо своевременно перевести на
другие языки.
Необходимость в машинном переводе стала тем толчком, который вызвал к
жизни математическую лингвистику, ибо всякая автоматизация, а тем более
автоматизация с помощью компьютера, требует формализации и уточнения
качественных понятий, имевших хождение в лингвистике.
По ходу дела в математической лингвистике было формализовано понятие
синтаксиса, созданы формальные модели построения синтаксически
правильных фраз. Эти модели получили название формальные грамматики.
Оказалось, что модели такого типа близки к тем, которые изучаются в
теории алгоритмов и теории автоматов. Это связало математическую
лингвистику с теоретической информатикой.
Попытки формализации семантики естественных языков привели к созданию
новых моделей. Одна из них носит название "Модель Смысл-Текст" (МСТ). В
МСТ предполагается, что кроме обычного естественного языка существует
специальный глубинный язык смыслов, выражения на котором позволяют
однозначно интерпретировать смысл фразы. Вот хороший пример того, как
используется такой внутренний язык. Предположим вы прочитали фразу:
"Иван чуть не убил Петрова". Возникает вопрос: "Понятна ли эта фраза?"
На первый взгляд кажется, что ответить на данный вопрос невозможно, ибо
сам термин "понимание" весьма неопределен. В статье "Диалоговая система"
об этом говорится достаточно много.
Примем следующее рабочее определение того, что некоторая фраза
естественного языка понята слушающим или читающим: будем говорить, что
понимание произошло, если восстановлена та ситуация, которая описывается
данной фразой. Тогда к приведенной выше фразе об Иване и Петрове вопрос
надо поставить так: "Какую ситуацию вы себе представили, когда прочитали
эту фразу?" Тут-то и выясняется, что ситуации могут быть весьма
различными.
Например: А. Иван чистил снег на крыше дома и сбивал сосульки. А внизу
по тротуару шел Петров, которого Иван не видел. И сбитая им сосулька
чуть не угодила по голове Петрову. К счастью, она лишь слегка задела
его.
Б. Петров - начальник Ивана, и Иван ему чем-то не нравится. Петров все
время унижает его. Вот и сейчас Иван зашел к Петрову по делу, а тот
опять нагрубил ему. У Ивана внутри все закипело, кровь бросилась в
голову. "Возьму сейчас пресс-папье и убью подлеца", - подумал Иван. Но
сдержался. Повернулся, промолчал и вышел из кабинета, хлопнув дверью.
В. Иван спускается во двор и видит, что здоровый хулиган Петров избивает
сына Ивана. Иван бросается на Петрова. Подоспевшие соседи еле успели
оттащить Ивана.
Все три ситуации, которые приведены, вполне пригодны, чтобы, кратко
описывая их, сказать фразу "Иван чуть не убил Петрова". Но смысл,
заключенный в ситуациях, совсем разный. В случае "Л" у Ивана не было
намерения убивать Петрова. В случае "?" такое желание у Ивана было, но
оно осталось нереализованным. А в случае "Я" и было желание "убить
Петрова", и было реализовано само действие по достижению этой цели.
Таким образом, за простой на первый взгляд фразой стоят совершенно
разные по смыслу интонации.
В МСТ представление этих ситуаций различно. Вот примерно как они
выглядят. А. Иван не хотел начать процесс сделать мертвым Петрова, но
начал его. Б. Иван хотел начать процесс делать Петрова мертвым, но не
начал его. В. Иван хотел начать процесс сделать мертвым Петрова, начал
его, но не закончил.
В МСТ предполагается, что каждой фразе, которая, по мнению носителей
языка, имеет смысл, соответствует некоторая фраза в МСТ У. Это
соответствие обладает двумя свойствами. Первое из них утверждает, что
если фразы f1и f2
имеют различный смысл, то они отображаются в разные записи У1
и У2 в МСТ. Второе гарантирует для двух фраз F1
и F2, имеющих одинаковый смысл, что они
отображаются либо в одно и то же представление У, либо в разные У1 и У2,
но такие, что Y и Yj эквивалентны в МСТ.
Другими словами, в МСТ имеется формальная система эквивалентных
преобразований, трансформирующая эквивалентные представления друг в
друга.
К сожалению, пока не удалось построить сколь-нибудь исчерпывающую МСТ
для какого-нибудь естественного языка, что пока не позволяет говорить о
формализации семантики языка.
Другим примером модели, изучаемой в матетической лингвистике, является
универсальный мантический код (УСК). Подобно МСТ в УСК разработано
специальное формальное представление текстов, записанных на естественном
языке, но это представление, в отличие от представлений в УСК, не носит
языкового характера. Например, фраза "Петя читает книгу" в УСК
записывается как (SAO), где S есть позиция субъекта, реализующего
действие, А - позиция агента (действия), а О - озиция объекта, на
который направлено действие.
Рассмотрим теперь фразу "Книга читается Левей". Ее представление в УСК
будет иметь такой же вид, что и для предшествующей фразы (SAO). рот
пример показывает, что при переходе в пред-авление в виде УСК внешние
грамматические падежи заменяются на глубинные падежи, обладающие
универсальностью и присутствующие в любых естественных языках,
обладающих или не обладающих внешними падежами. В первой фразе про Петю
"книга" стояла в дательном падеже, а "Петя" - в именительном. Во второй
фразе "книга" стоит в именительном падеже, а "Петя"- в творительном. А в
УСК и в том, и в другом случае
"Петя" находится в глубинном субъектном падеже, а "книга" - в глубинном
объектном.
Вот еще один пример записи в УСК. Возьмем фразу "Петя рубит дрова
топором". Ее представление в УСК имеет вид: (Si Ах (S2 А2 О)). Здесь
активный субъект "Петя" воздействует на пассивный субъект "топор" с
помощью действия а "топор" в свою очередь с помощью действия А2
воздействует на объект - "дрова". Глубинный падеж, в котором в данном
представлении находится "топор", носит название инструментального.
Приведенные примеры моделей семантики показывают, что они направлены на
решение задачи выявления смысла текстов на естественном языке, без чего
невозможен процесс понимания и генерации правильных текстов (см.
Диалоговая система и Синтез текста). Это определяет практическую
значимость достижений математической лингвистики не только для самой
науки о языке, но и для создания систем, понимающих человеческий язык и
обладающих способностью поддерживать общение с человеком на привычном
для него языке.
Методы и модели математической лингвистики используются также в
прикладной лингвистике.