Языковые способности человека по Хомскому
История развития генеративной грамматики Хомскго. Автоматизиция изучения языка с помощью моделей "Синтактических структур" и "Аспектов". Особенности математических методов изучения формальных языков. Классы грамматик и их синтаксическое соотношение.
Рубрика | Иностранные языки и языкознание |
Вид | реферат |
Язык | русский |
Дата добавления | 29.03.2015 |
Размер файла | 34,1 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Содержание
Введение
1. История развития генеративной (порождающей) грамматики Хомского
2. Начальные понятия теории формальных языков
3. Классы грамматик
Заключение
Список литературы
Введение
Генеративная лингвистика (трансформационная порождающая грамматика, трансформационно-генеративная грамматика, хомскианская лингвистика) - наиболее популярное с конца 1950-х гг. направление в мировом языкознании, которое ставит целью разработать теорию языка по образцу естественных наук; основоположник и лидер - Ноам Хомский (США).
Цель лингвистической теории по Хомскому заключается в том, чтобы объяснить факт поразительно быстрого усвоения родного языка ребенком на основе явно недостаточного внешнего стимула, то есть той информации, которая может быть извлечена из речи окружающих.
В основе языковой способности человека лежит врожденный биологически обусловленный компонент, который определяет основные параметры человеческого мышления и, в частности, структуру языкового знания.
При взаимодействии врожденного компонента, общего у всех людей, и внешнего стимула (конкретного языка, на котором говорят окружающие, - английского, русского, китайского и т. д.) у ребенка формируется полноценное владение своим родным языком - процесс, который, по Хомскому, представляет собой частный случай роста живых организмов.
В последнее время Хомский упоминает и третий фактор - свойства, которые объединяют язык с другими биологическими и когнитивными системами (например, принцип, согласно которому при построении сложных единиц из простых структура простых единиц не видоизменяется).
В центре внимания генеративной лингвистики находится теория грамматики, но она оказала определяющее влияние также на многие направления в фонологии, семантике, психолингвистике и философии языка.
Начиная с 1960-х гг. генеративная лингвистика - безраздельно господствующее лингвистическое направление в США и наиболее влиятельное - в Европе и Азии. Основными оппонентами её выступают сторонники функциональной и когнитивной лингвистики. Описательные методы генеративной лингвистики оказали влияние на развитие формальных направлений в советском языкознании 1960-х гг.; влияние её на российскую лингвистику значительно усилилось начиная со второй половины 1990-х гг.
1. История развития генеративной (порождающей) грамматики Хомскго
Хомский, (Chomsky, Noam Avram), или Ноэм Чомски, американский лингвист и общественный деятель. Родился в Филадельфии 7 декабря 1928.
Хомский - создатель системы грамматического описания, известной как генеративная (порождающая) грамматика; соответствующее течение лингвистической мысли часто называется генеративизмом. Основы его были сформулированы Хомским в середине 1950-х годов; в настоящее время генеративизм прошел уже более чем сорокалетний путь развития, успев приобрести всемирную популярность, в значительной мере утратить эту популярность на рубеже 1960-х и 1970-х годов под влиянием критики со стороны представителей «порождающей семантики» и восстановить свои позиции в 1980-х и 1990-х годах.[3]
За время своего существования генеративизм прошел несколько этапов. Наиболее крупные из них следующие.
Стандартная теория. Ее можно разделить на два подэтапа: модель «Синтактических структур» и модель «Аспектов».
Модель «Синтактических структур», называемая так по имени первой монографии Хомского, в которой было реализовано представление о языке как механизме порождения бесконечного множества предложений с помощью конечного набора грамматических средств, для чего он предложил понятия глубинной (скрытой от непосредственного восприятия и порождаемой системой рекурсивных, т.е. могущих применяться многократно, правил) и поверхностной (непосредственно воспринимаемой) грамматических структур, а также трансформаций, описывающих переход от глубинных структур к поверхностным.
Модель «Аспектов», или стандартная теория, изложенная в книге Хомского Аспекты теории синтаксиса (Aspects of the Theory of Syntax, 1965, рус. пер. 1972) и представляющая собой прежде всего попытку введения в формальную модель семантического компонента - так называемых правил семантической интерпретации, приписывающих значение глубинным структурам. В «Аспектах» было введено противопоставление языковой компетенции (системы процессов порождения языковых высказываний) и употребления языка (performance), принята так называемая гипотеза Катца - Постала о сохранении смысла при трансформации, в связи с чем исключено понятие факультативной трансформации, а также введен аппарат синтаксических признаков, описывающих лексическую сочетаемость.
Теория управления и связывания, формировавшаяся в течение 1970-х годов и в суммарном виде представленная в книге Хомского Лекции об управлении и связывании (Lectures on Government and Binding, 1981); по первым буквам английских слов она часто называется GB-теорией. Основным изменением при переходе к этой теории стал отказ от специфических правил, описывающих синтаксические структуры конкретных языков, и замена их некоторыми универсальными ограничениями. Все трансформации были заменены одной универсальной трансформацией перемещения. В рамках GB-теории были выделены частные модули (Х-штрих-теория, теория ограничивания, теория связывания, теория управления, теория падежа, Тета-теория), каждый из которых отвечает за свою часть грамматики, действует в соответствии со своими принципами и имеет ряд настраиваемых параметров, определяющих конкретно-языковую специфику. Поскольку понятия принципов и параметров сохранились и на следующем этапе развития генеративизма, иногда говорят о теории принципов и параметров как особой стадии, охватывающей второй и третий этапы генеративизма.
Минималистская программа, основные положения которой были изложены Хомским в нескольких статьях, собранных впоследствии в одноименной книге (The Minimalist Program, 1995). Эта программа (не модель и не теория) предполагает минимизацию языковых представлений и описание их взаимодействия с другими когнитивными системами, постулируя в языковом аппарате человека две главных подсистемы: лексикон и вычислительную систему, а также два интерфейса - фонетический и логический.
Аппарат и многие теоретические постулаты генеративизма за четыре десятилетия изменились почти до неузнаваемости; достаточно указать на то, что теория, в 1960-е годы называвшаяся чаще всего трансформационной и формулировавшаяся как система правил, в настоящее время ни понятия трансформации, ни даже понятия правила не использует. Из новейшей версии генеративизма были исключены и понятия глубинной и поверхностной структур, когда-то занимавшие центральное место в порождающей теории. Принято считать, что неизменными в генеративизме остались лишь постулаты о врожденности языковой способности человека, о единстве базовых принципов устройства различных языков, различающихся лишь установкой некоторых частных параметров, и об автономности грамматики. Это верно, но, во-первых, эти постулаты, в особенности первые два, отнюдь не являются отличительными чертами генеративизма; они, порой неявно, принимались во многих лингвистических теориях и раньше, а главное - есть основания полагать, что эти постулаты могут быть выведены из некоторых более общих соображений.
Реальным инвариантным ядром генеративизма Хомского является прежде всего так называемый методологический монизм, т.е. требование, в соответствии с которым объяснение во всех науках должно быть построено одинаково - по образцу естественных наук и прежде всего физики как их эталона. В качестве же законов природы выступают грамматические правила и принципы - автономный и невыводимый синтаксис (в широком понимании), задающий формальные структуры, которые, также по некоторым правилам, переводятся в звуковую форму и которым по определенным правилам приписывается значение.
Из методологического монизма вытекают и автономность синтаксиса (его ничем не надо объяснять), и постулат о врожденной языковой способности (она дана человеку в готовом виде так же, как ему даны законы природы), а из тезиса о врожденности естественным образом выводится тезис о глубинном единстве всех языков.
Генеративная теория Хомского, несомненно, представляет собой выдающееся интеллектуальное достижение. На первом (до своего кризиса рубежа 1960-1970-х годов) этапе она оказала огромное влияние на развитие формальных грамматик и вычислительной лингвистики, предоставив исследователям экономный и более мощный по сравнению с грамматиками непосредственных составляющих аппарат описания формальных языковых структур. Синтаксические структуры Хомского считается одним из трудов, заложивших основы современной когнитивной науки.[2]
2. Начальные понятия теории формальных языков
Формальные языки являются упрощенными моделями реально существующих естественных и искусственных языков. Как и реальные языки, формальный язык состоит из множества слов, составленных из букв. Прежде чем дать точное определениеформального языка, рассмотрим некоторые вспомогательные понятия.
Коротко говоря, формальный язык -- это математическая модель реального языка. Под реальным языком здесь понимается некий способ коммуникации (общения) субъектов друг с другом. Для общения субъекты используют конечный набор знаков (символов), которые проговариваются (выписываются) в строгом временном порядке, т.е. образуют линейные последовательности. Такие последовательности обычно называют словами или предложениями. Таким образом, здесь рассматривается только т.н. коммуникативная функция языка, которая изучается с использованием математических методов. Другие функции языка здесь не изучаются и, потому, не рассматриваются.
Чтобы лучше разобраться в том, как именно изучаются формальные языки, необходимо сначала понять, в чем заключаются особенности математических методов изучения. Согласно Колмогорову и др. (Александров А.Д., Колмогоров А.Н., Лаврентьев М.А. Математика. Ее содержание, методы и значение. Том 1. М.:
Издательство Академии Наук СССР, 1956.), математический метод, к чему бы он ни применялся, всегда следует двум основным принципам:
Обобщение (абстрагирование). Объекты изучения в математике -- это специальные сущности, которые существуют только в математике и предназначены для изучения математиками. Математические объекты образуются путем обобщения реальных объектов. Изучая какой-нибудь объект, математик замечает только некоторые его свойства, а от остальных отвлекается. Так, абстрактный математический объект «число» может в реальности обозначать количество гусей в пруду или количество молекул в капле воды; главное, чтобы о гусях и о молекулах воды можно было говорить как о совокупностях. Из такой «идеализации» реальных объектов следует одно важное свойство: математика часто оперирует бесконечными совокупностями, тогда как в реальности таких совокупностей не существует.
Строгость рассуждений. В науке принято для выяснения истинности того или иного рассуждения сверять их результаты с тем, что существует в действительности, т.е. проводить эксперименты. В математике этот критерий проверки рассуждения на истинность не работает. Поэтому выводы не проверяются экспериментальным путем, но принято доказывать их справедливость строгими, подчиняющимися определенным правилам, рассуждениями. Эти рассуждения называются доказательствами и доказательства служат единственным способом обоснования верности того или иного утверждения.
Таким образом, чтобы изучать языки с помощью математических методов, необходимо сначала выделить из языка его свойства, которые представляются важными для изучения, а затем эти свойства строго определить. Полученная таким образом абстракция будет называться формальным языком -- математической моделью реального языка. Содержание конкретной математической модели зависит от того, какие свойства важны для изучения, т.е. что планируется в данный момент выделить и изучать.
В качестве известного примера такой можно математической абстракции можно привести модель, известную под неблагозвучным для русского уха названием «мешок слов». В этой модели исследуются тексты естественного языка (т.е. одного из тех языков, которые люди используют в процессе повседневного общения между собой). Основной объект модели мешка слов -- это слово, снабженное единственным атрибутом, частотой встречаемости этого слова в исходном тексте. В модели не учитывается, как слова располагаются рядом друг с другом, только сколько раз каждое слово встречается в тексте. Мешок слов используется в машинном обучении на основе текстов в качестве одного из основных объектов изучения.
Но в теории формальных языков представляется важным изучить законы расположения слов рядом друг с другом, т.е. синтаксические свойства текстов. Для этого модель мешка слов выглядит бедной. Поэтому формальный язык задается как множество последовательностей, составленных из элементов конечного алфавита. Определим это более строго.
Алфавит представляет собой конечное непустое множество элементов. Эти элементы будем называть символам.
Для обозначения алфавита обычно будем использовать латинское V, а для обозначения символов алфавита -- начальные строчные буквы латинского алфавита. Например, выражение
V = {a,b}
обозначает алфавит из двух символов a и b.
Цепочка представляет собой конечную последовательность символов. Например, abc -- цепочка из трех символов. Часто при обозначении цепочек в символах используют индексы.
Сами цепочки обозначают строчными символами конца греческого алфавита. Например,
omega = a1...an
цепочка из n символов. Цепочка может быть пустой, т.е. не содержать ни одного символа. Таким цепочки будем обозначать греческой буквой эпсило.
Наконец, формальный язык L над алфавитом V -- это произвольное множеств цепочек, составленных из символов алфавита V. Произвольность здесь означает тот факт, что язык может быть пустым, т.е. не иметь ни одной цепочки, так и бесконечным, т.е. составленным из бесконечного числа цепочек. Последний факт часто вызывает недоумение: разве имеются реальные языки, которые содержат бесконечное число цепочек? Вообще говоря, в природе все конечно. Но мы здесь используем бесконечность как возможность образования цепочек неограниченной длины. Например, язык, который состоит из возможных имен переменных языка программирования C++, является бесконечным. Ведь имена переменных в C++ не ограничены по длине, поэтому потенциально таких имен может быть бесконечно много. В реальности, конечно, длинные имена переменных не имеют для нас особого смысла т.к. к концу чтения такого имени уже забываешь его начало. Но в качестве потенциальной возможности задавать неограниченные по длине переменные, это свойство выглядит полезным.
Итак, формальные языки -- это просто множества цепочек, составленных из символов некоторого конечного алфавита. Но возникает вопрос: как можно задать формальный язык? Если язык конечен, то можно просто выписать все его цепочки одну за другой (конечно, можно задуматься, имеет ли смысл выписывать цепочки языка, имеющего хотя бы десять тысяч элементов и, вообще, есть ли смысл в таком выписывании?). Что делать, если язык бесконечен, как его задавать? В этот момент на сцену выходят грамматики.
Способ задания языка называет грамматикой этого языка. Таким образом, грамматикой мы называем любой способ задания языка. Например, грамматика
L = {a^nb^n}
(здесь n -- натуральное число) задает язык L, состоящий из цепочек вида ab, aabb, aaabbb и т.д. Язык L представляет собой бесконечное множество цепочек, но тем не менее, его грамматика (описание) состоит всего из 10 символов, т.е. конечна.
Назначение грамматики -- задание языка. Это задание обязательно должно быть конечным, иначе человек не будет в состоянии эту грамматику понять. Но каким образом, конечное задание описывает бесконечные совокупности? Это возможно только в том случае, если строение всех цепочек языка основано на единых принципов, которых конечное число. В примере выше в качестве такого принципа выступает следующий: «каждая цепочка языка начинается с символов a, за которыми идет столько же символов b». Если язык представляет собой бесконечную совокупность случайным образом набранных цепочек, строение которых не подчиняется единым принципам, то очевидно для такого языка нельзя придумать грамматику. И здесь еще вопрос, можно или нет считать такую совокупность языком. В целях математической строгости и единообразия подхода обычно такие совокупности языком считают.
Итак, грамматика языка описывает законы внутреннего строения его цепочек. Такие законы обычно называют синтаксическими закономерностями. таким образом, можно перефразировать определение грамматики, как конечного способа описания синтаксических закономерностей языка. Для практики интересны не просто грамматики, но грамматики, которые могут быть заданы в рамках единого подхода (формализма или парадигмы). Иначе говоря, на основе единого языка (метаязыка) описания грамматик всех формальных языков. Тогда можно придумать алгоритм для компьютера, который будет брать на вход описание грамматики, сделанное на этом метаязыке, и что-то делать с цепочками языка.
Такие парадигмы описания грамматик называют синтаксическими теориями. Формальная грамматика -- это математическая модель грамматики, описанная в рамках какой-то синтаксической теории. Таких теорий придумано довольно много. Самый известный метаязык для задания грамматик -- это, конечно, порождающие грамматики Хомского. Но имеются и другие формализмы. Один из таких них -- окрестностные грамматики, будет описан чуть ниже.
С алгоритмической точки зрения грамматики можно подразделить по способу задания языка. Имеются три основных таких способа (вида грамматик). грамматический математический формальный язык
Распознающие грамматики. Такие грамматики представляют собой устройства (алгоритмы), которым на вход подается цепочка языка, а на выходе устройство печатает «Да», если цепочка принадлежит языку, и «Нет» -- в противном случае.
Порождающие грамматики. Этот вид устройств используется для порождения цепочек языков по требованию. Образно говоря, при нажатии кнопки будет сгенерирована некоторая цепочка языка.
Перечисляющие грамматики. Такие грамматики печатают одну за другой все цепочки языка. Очевидно, что если язык состоит из бесконечного числа цепочек, то процесс перечисления никогда не остановится. Хотя, конечно его можно остановить принудительно в нужный момент времени, например, когда будет напечатана нужная цепочка.
Интересным представляет вопрос о преобразовании видов грамматики друг в друга. Можно ли, имея порождающую грамматику, построить, скажем, перечисляющую? Ответ -- да, можно. Для этого достаточно генерировать цепочки, упорядочив их, скажем по длине и порядку символов. Но превратить перечисляющую грамматику в распознающую в общем случае нельзя. Можно использовать следующий метод. Получив на вход цепочку, запустить процесс перечисления цепочек и ждать, напечатает ли перечисляющая грамматика эту цепочку или нет. Если такая цепочка напечатана, то заканчиваем процесс перечисления и печатаем «Да». Если цепочка принадлежит языку, то она обязательно будет напечатана и, таким образом, распознана. Но, если цепочка не принадлежит языку, то процесс распознавания будет продолжаться бесконечно. Программа распознающей грамматики зациклится. В этом смысле мощность распознающих грамматик меньше мощности порождающих и перечисляющих. Это следует иметь ввиду, когда сравнивают порождающие грамматики Хомского и распознающие машины Тьюринга.
3. Классы граммитик
Грамматика представляет собой конечное описание формального языка. Формальный язык, в свою очередь, является произвольным множеством цепочек, составленных из символов некоторого конечного алфавита. Произвольность множества здесь понимается в том смысле, что оно может быть бесконечным, конечным или пустым.
Формализм порождающих грамматик Хомского был введен Ноамом Хомским в конце 50-х годов прошлого века. За короткое время этот формализм обрел необычайную популярность. Некоторое время порождающие грамматики рассматривались как панацея -- универсальный подход для задания всевозможных языков, в том числе и естественных (т.е. языков, которые люди используют для повседневного общения между собой). Но время показало, что порождающие грамматики для описания естественных языков не очень удобны. Сейчас порождающие грамматики применяются, в основном, для описания синтаксиса формальных языков, подобных языкам программирования и другим компьютерным языкам.
Порождающая грамматика Хомского задается как множество «правил порождения» (продукций). Каждое правило является просто парой цепочек(w', w'') и задает возможность замены левой цепочки на правую при генерации цепочек языка, задаваемого грамматикой. По этой причине, правила обычно записывают в виде w' --> w'', указывая конкретно, что на что можно заменять. Множество правил в грамматике должно быть непустым и конечным, и обычно обозначается латинской P.
Цепочки в правилах грамматики могут быть составлены из символов двух алфавитов: алфавита терминальных символов (терминалов) и алфавита нетерминальных символов (нетерминалов). Алфавит терминалов обозначают через T. Этот алфавит на самом деле совпадает с алфавитом того формального языка, который задает данная грамматика. Смысл термина «терминальный» состоит в том, что в правилах грамматики в левой части не может быть цепочек, которые составлены только из терминальных символов. Поэтому, если такая цепочка получилась в результате подстановки, то следующая процесс порождения цепочки остановится (terminate). Нетерминальные символы используются в промежуточных порождениях цепочек. Смысл нетерминала в задании алгоритма порождения цепочки может быть самый разный и обычно зависит от типа грамматики, в которой этот символ используется. Различные примеры использования нетерминальных символов будут рассмотрены ниже.
Но один нетерминальный символ всегда имеет один и тот же смысл -- он обозначает все цепочки языка. Называется этот нетерминал «начальным нетерминальным символов порождающей грамматики» и обычно обозначается посредством латинского S (start или sentence). В каждой порождающей грамматике обязательно должно быть правило, к которого левая часть состоит из единственного начального нетерминала, иначе в данной грамматике нельзя будет породить даже одной цепочки.
Итак, порождающая грамматика Хомского -- это четверка
G = {N, T, P, S},
N -- конечный алфавит нетерминальных символов.
T -- конечный алфавит терминальных символов (совпадает с алфавитом языка, задаваемого грамматикой).
P -- конечное множество правил порождения.
S -- начальный нетерминал грамматики G.
Ноам Хомский ввел классы грамматик (и соответствующие классы языков) задавая ограничения на вид правил порождающей грамматики. Каждый класс грамматик имеет свою описательную мощность. Описательную мощность класса грамматик можно охарактеризовать, как возможность выражений в правилах грамматики определенных синтаксических отношений. Рассмотрим, как классы грамматик задают синтаксические отношения.
Грамматики типа 3
Этот класс грамматик задает алгоритм порождения цепочек присоединением некоторого количества терминальных символов с правого или левого края порождаемой цепочки. Очевидно, что правила для такого метода порождения должны иметь вид A --> alpha B или A --> B alpha, где alpha -- цепочка, состоящая из терминальных символов. В этом случае, если имеется промежуточная (в процессе порождения) цепочка X1..Xn A, то замена в соответствии с правилом A --> alpha B даст цепочку X1..Xn alpha B. Например, для правил S --> aaaA, A --> abcA и A --> bbb можно задать порождение S => aaaA => aaaabcA => aaaabcbbb.
Синтаксическое отношение, которое задается грамматиками типа 3, можно обозначить термином «быть рядом». Под «рядом» здесь подразумевается как непосредственно рядом, если это задано в правой части какого-то правила порождения, так и опосредованно рядом, через нетерминальные символы в связанных между собой правилах порождения.
Для математической строгости строку терминальных символов в правилах грамматик типа 3 разбивают на несколько правил с одним терминальным символом в правой части. Например, если имеется правило A --> abcB, то его можно заменить на следующие правила, применение которых в результате порождает ту же цепочку:
A --> a A1, A1 --> b A2, A2 --> cB.
Иначе говоря, подстановка
A => abc
эквивалентна последовательности подстановок
A => a A1 => a b A2 => abcB.
Такие грамматики, где нетерминальный символ стоит справа в правой части правила, называют праволинейными грамматиками, если в правой части нетерминальный символ стоит слева от терминала, то грамматику называют леволинейной.
Зададим, например леволинейную грамматику для языка
A = {a+a, a+a+a, a+a+a+a, ...}.
Правила грамматики типа 3, как было рассмотрено выше, это:
S --> aA, A --> +aA, A --> +a.
Здесь цепочки порождаются присоединением пары символов справа. Изменим грамматику так, чтобы символы присоединялись слева, а также добавим нетерминальные символы, чтобы каждый раз добавлять только по одному символу. Получим грамматику:
S --> Aa
A --> B+
B --> Aa
B --> a
Вот как выглядит порождение цепочки
a+a+a: S => Aa => B+a => Aa+a => B+a+a => a+a+a.
Внимательный читатель вероятно заметил, что грамматика типа 3 похожа на попрождающий автомат, в котором роль состояний играют нетерминальный символы грамматики. Одна из возможных интерпретаций этой грамматики -- это, действительно, конечный автомат.
Контекстно-свободные грамматики
Контекстно-свободные грамматики имеют правила вида: A --> alpha. В левой части правила должен стоять один символ (конечно, нетерминальный), а справа может быть любая цепочка из терминальных и нетерминальных символов (в том числе и пустая).
КС-грамматики задают два вида синтаксических отношений: отношение «быть рядом» и отношение «быть частью» или отношение иерархии. Отношение иерархии наиболее естественно для человеческого ума. Человеку свойственно типизировать вещи, т.е. рассматривать конкретные объекты своего мышления как части какого-то общего типа (класса). Каждая вещь, о которой думает человек, является экземпляром некоторого класса. Например, конкретный стул является экземпляром класса «стул» с соответствующими признаками. Человеческому уму также свойственно разделять типы на подтипы, двигаясь от более конкретных типов к более абстрактным. Скажем, стул есть подтип типа мебель, мебель есть подтип типа предмет, предмет есть подтип типа объект и т.п. Отношение «тип-подтип» и есть отношение иерархии.
КС-грамматика может быть проинтерпретирована как категориальная грамматика, т.е. грамматика типов. Символы грамматики в этом случае могут мыслиться как типы, а правила тогда задают отношение иерархии между типами. Нетерминальные символы выступают как сложные типы, а терминальный символы -- как атомарные типы, у которых не может быть подтипов. Такая интерпретация КС-грамматики очень популярна и часто используется при создании трансляторов языков. Но, задавая класс КС-грамматик, Хомский имел ввиду нечто другое.
Ввиду того, что КС-грамматика является порождающей, она задает алгоритм (строго говоря, не алгоритм, но исчисление -- многовариантный алгоритм) порождения цепочек языка. Порождение здесь задается не только присоединением цепочек справа или слева имеющейся цепочки, но и вставкой цепочки куда-нибудь внутрь имеющейся. Вставка производится заменой нетерминального символа в цепочке на цепочку, которая стоит в правой части некоторого правила, в левой части которого находится этот нетерминал. Скажем, цепочку aabBBACbbb можно преобразовать в цепочку aabBBaaaCbbb, если есть правило A --> aaa. В этом смысле, порождаемая цепочка растет не равномерно с какого-то края, но как-бы «пухнет» изнутри.
Проиллюстрируем сказанное на примере.
Рассмотрим язык
L = {a^n b^n | n = 1, 2, 3,...}.
Выражение a^n здесь означает повторение n раз символа a. Таким образом, язык L состоит из цепочке вида ab, aabb, aaabbb и т.д. Зададим КС-грамматику для этого языка. Для этого заметим, что из цепочки языка можно получить другую цепочку языка, присоединяя к первой слева символ a, а справа символ b. Скажем, если имеется цепочка aabb, то из нее можно получить цепочку aaabbb. Это замечание дает правило порождения S --> aSb (напомним, что цепочки языка порождаются из начального нетерминала грамматики и, значит, могут быть обозначены этим символом). Есть еще специальный случай цепочки, которая не дробится на более мелкие -- это цепочка ab. Введем для ее порождения правило S --> ab. Итак, грамматика языка имеет правила:
S --> aSb и S --> ab.
Зададим порождение цепочкиaaabbb:
S => aSb => aaSbb => aaabbb.
Контекстно-зависимые грамматики и грамматики без ограничений
В правилах КС-грамматики нетерминальный символ в левой части правила порождения можно менять на правую часть в любом месте порождаемой цепочки, где бы этот символ не встретился. Но иногда хотелось бы различать контексты, в которых находится символ в цепочке, и в одних случаях производить замену символа, в других -- нет. Правила КС-грамматики этого делать не позволяют, поэтому для таких случаев необходимы правила специального вида.
Контекстно-зависимая грамматика имеет правила вида w' A w'' --> w' alpha w''. Здесь w' и w'' -- цепочки (может быть пустые), составленные из терминальных и нетерминальных символов грамматики, alpha -- непустая цепочка из тех же символов. Иначе говоря, нетерминальный символ Aзаменяется на цепочку alpha в контексте цепочек w' и w''.
С КЗ-грамматикой связан другой класс грамматик -- неукорачивающие грамматики. Правила в таких грамматиках должны удовлетворять одному условию: длина правой части должна быть не меньше длины левой части. Так как в правилах КЗ-грамматик имеется условие, чтобы цепочка alpha была непустая, то эти грамматики также являются неукорачивающими. Но, самое интересное состоит в том, что для каждого языка, заданного неукорачивающей грамматикой, может быть придумана КЗ-грамматика, задающая тот же язык. Иначе говоря, классы языков, задаваемых КЗ-грамматиками и неукорачивающими грамматиками, совпадают.
Зачем так необходимо выделять класс языков, задаваемых неукорачивающими грамматиками? Дело в том, что для таких языков можно задать распознающий автомат. Распознающая грамматика конструируется следующим образом: получая на вход цепочку, последовательно делаем порождения, упорядочивая их по длине порождаемой цепочки. Т.к. грамматика неукорачивающая, то таких порождений будет конечное множество и, если среди них не нашлось совпадения с данной на вход цепочкой, то напечатать «нет».
Для грамматики без ограничений на вид правил такой алгоритм распознавания в общем случае построить нельзя. Порождаемая цепочка может вести себя как «гармошка», раздуваясь и сдуваясь в процессе порождения. Поэтому достижение порождаемой цепочкой определенной длины не гарантирует, что далее в процессе порождения не будет получена поданная на вход цепочка.
Действительно ли КЗ-языки образуют собственный класс, не совпадает ли этот класс с классом КС-языков. Иначе говоря, есть ли язык, для которого гарантировано нельзя задать КС-грамматику, но можно задать КЗ-грамматику? Ответ: да, такие языки есть. В качестве примера такого языка можно привести следующий язык
L = {ww}
Цепочки этого языка составлены из двух повторяющихся цепочек над каким-то алфавитом. Доказывать, что для этого языка нельзя построить КС-грамматики мы здесь не будем. КЗ-грамматику можно задать на основе следующего соображения. Сначала сгенерировать цепочку w и нетерминальный символ, скажем A, т.е. получить цепочку Aw. Затем продвинуть символ A сквозь цепочку w, генерируя по ходу копии символов этой цепочки, после чего продвинуть эти символы направо. Примерно то же, как это будет реализовано в примере ниже.
Рассмотрим пример задания грамматики для языка
L = {a^n^2 | n = 1, 2, 3, ...}.
Цепочки этого языка состоят из символов a, причем число этих символов есть квадрат натурального числа: 1, 4, 9, 25 и т.д. Мы зададим для этого языка грамматику без ограничений. Генерация цепочек будет состоять из следующих этапов:
Генерация n символов для некоторого натурального числа n.
Порождение из этого числа символов n^2 символов.
Преобразование этих символов в символы a.
Для реализации первого этапа добавляем правила
S --> LS'R
S' --> AS'B
S' --> AB
Первым правилом оборачиваем порождаемую цепочку в ограничители L и R. Они нам понадобятся в дальнейшем для реализации третьей фазы генерации. Оставшиеся два правила просто генерируют цепочку вида AA...ABB...B, где число символов A и B совпадает.
Теперь необходимо породить n^2 символов на основе цепочке AA...ABB...B. Это делает простым приемом. Двигаем символы B налево и, при каждом переходе через символ A, порождать еще один символ C. Через символы C символ A может свободно проходить направо, а символ B -- налево. Правила для этого этапа следующие:
AB --> BAC
AC --> CA
CB --> BC
Когда все символы B дойдут до левого края, перейдя символы A, символов Cбудет ровно n^2.
Теперь надо освободиться от символов L, A, B и R, а также преобразовать символы C в символы a. Для этого аннигилируем символ B при его проходе до левого края, т.е. до символа L. Соответственно поступаем и с символом A на правом крае. При реализации такой стратегии останется цепочка видаLCC....CR. Чтобы избавится от символов L и R, начинаем двигать левый ограничитель к правому и, при их соприкосновении, уничтожаем эти символы. Заодно, при прохождении через символы L, преобразуем их в символы a.
Приведем правила для этой фазы генерации.
LB --> L
AR --> R
LC --> aL
LR --> epsilon
Здесь epsilon обозначает пустую цепочку.
Приведем в качестве примера порождение цепочки aaaa:
S => LS'R => LAS'BR => LAABBR => LABACBR => LBACACBR => LACACBR => LACABCR => LACBACCR => LABCACCR => LBACCACCR => LACCACCR => LCACACCR => LCCAACCR => LCCACACR => LCCACCAR => LCCACCR => LCCCACR => LCCCCAR => LCCCCR => aLCCCR => aaLCCR => aaaLCR => aaaaLR => aaaa
Заключение
Хомский уже около двух десятилетий является самым знаменитым лингвистом мира; ему и его теории посвящено множество статей, ряд монографий и даже полнометражный документальный фильм, а развитие науки о языке в последней трети 20в. многими авторами описывается как «хомскианская революция».
Следует заметить, что Хомский одним из первых объявил лингвистику частью когнитивной психологии - однако на практике как раз максимально автоматизировал изучение языка, введя для этого представление о модульности человеческих когнитивных способностей и относительной независимости «модулей». Попытка соотнести языковую способность с другими когнитивными способностями человека появилась лишь в минималистской программе, а также в работах Р. Джэкендоффа (р. 1945), небезуспешно пытающегося на практике выстроить «мост» между генеративизмом и когнитивной лингвистикой.
Сложные слова не являлись объектом анализа с позиций последних теорий генеративной грамматики, тем более в сопоставительно-типологическом аспекте. Сложное слово, будучи лексической единицей, состоящей из двух полнозначных основ, представляет собой объединение слов, а это ставит вопрос о том, насколько такое объединение подчиняется синтаксическим закономерностям Ноам Хомский, касаясь проблем словообразования, указывает, что Ѕпроцессы словообразования представляют довольно сложную проблему для любого типа порождающей грамматикиЅ. Решению данного вопроса посвящены работы Хомского в изучении лингвистики.
Список литературы
1. Валгина Н. С., Розенталь Д. Э. Современный русский язык. М., 2003.
2. Лингвистический энциклопедический словарь / под ред. В.Н. Ярцева. - М.,1990
3. Русский язык и культура речи: Учебник для студентов вузов / под ред. проф. В. И. Максимова. - М., 2006.
4. Рыбин Сергей Витальевич, кандидат физико-математических наук, доцент кафедры ВМ-2 СПбГЭТУ «ЛЭТИ». Брошюра «компьютерные инструменты в образовании.» № 1, 2007 г.
Размещено на Allbest.ru
...Подобные документы
Сущность и цель лингвистической теории по Хомскому. История развития генеративной (порождающей) грамматики Хомского. Этапы существования генеративизма. Представление о конечном наборе правил (приемов), порождающих все правильные предложения языка.
реферат [151,0 K], добавлен 22.10.2011Пути, особенности влияния различных факторов в совокупности на развития германских языков. Фонетические их особенности. Специфика развития морфологической системы древнегерманских языков. Языковые преобразования: некоторые аспекты лингвистической науки.
курсовая работа [33,7 K], добавлен 13.09.2015История английского языка. Классификация грамматики английского языка, его морфология и стилистика. Язык как индикатор этнического менталитета. Авторские методы изучения английской грамматики. Формы личных местоимений. Времена английского глагола.
курсовая работа [51,4 K], добавлен 10.09.2010Изучение грамматики английского языка путем выполнения специальных заданий. Пути пополнения личного словарного запаса. Особенности использования специальной литературой для изучения грамматики английского языка. Написание топика на тему "Family".
контрольная работа [30,6 K], добавлен 05.10.2012Немецкий язык как один из основных языков мира и самый распространенный язык в ЕС. Основные методы изучения немецкого языка. Необходимость изучения немецкого языка и перспективы, которые он открывает. Мотивация относительно обучения детей немецкому языку.
эссе [51,2 K], добавлен 12.01.2012Классификация древнегерманских племён и их племенных языков. Происхождение и история рун. Свидетельства о германских языках в дописьменный период. Начало изучения германских языков. Понятие родства языка. Индоевропейские черты германских языков.
контрольная работа [27,8 K], добавлен 12.12.2009Основные этапы эпохи возрождения. Эпоха возрождения применительно к проблеме языка. Становление окситанских грамматик. Французские грамматики. Грамматика немецкого языка. Истоки славянской лингвистики. Генеалогическая классификация языков.
курсовая работа [34,7 K], добавлен 25.04.2006Определение искусственных языков и их положение в современной лингвистике. Теория лингвистической относительности в контексте изучения артлангов. Характеристика исследования грамматики новояза. Основные фонетические особенности дотракийского говора.
дипломная работа [116,9 K], добавлен 26.07.2017Сравнение различных древних и новых языков. Позиция общего языкознания. Подчинение элементов языка законам общей аналогии. Упрощение изучения иностранных языков как главная цель создания энциклопедии всех языков. Опыт анализа мексиканского языка.
реферат [28,7 K], добавлен 04.07.2009Язык и общество. Возникновение наций и национальных языков. Возникновение литературных языков. Языковые отношения при капитализме. Языковые проблемы в России. Заимствование как путь обогащения языка. Место языка среди общественных явлений.
курсовая работа [47,3 K], добавлен 25.04.2006Место испанского языка среди языков мира. Образование испанского литературного языка, периоды вестготского, арабского и франко-провансальского влияния. Особенности лексики, словообразования, фонетики и грамматики испанского языка в Латинской Америке.
курсовая работа [47,3 K], добавлен 20.04.2011Классификации языков мира, их критерии и факторы. Сущность типологической и генеалогической классификации языков, их разновидности и отличительные характеристики. Языковые семьи, ветви и группы в современном мире. Возникновение индоевропейских языков.
контрольная работа [19,7 K], добавлен 03.02.2010История синтаксических исследований. Предложение как основная единица синтаксиса. Структурный аспект изучения предложения, члены предложения и проблемы их изучения. Синтаксический уровень в учении Теньера. Работа Теньера "Основы структурного синтаксиса".
курсовая работа [64,3 K], добавлен 26.02.2011Современная характеристика распространенного предложения. Предложение - единица синтаксиса. Структура распространенного предложения. Связь в предложении. История изучения распространенного предложения. Трудности изучения русского языка.
курсовая работа [155,5 K], добавлен 22.10.2004Характеристика структурно-семантических особенностей устойчивого сравнения в английском языке. Выделение устойчивых сравнений, обозначающих физические особенности человека. Исследование теоретических аспектов изучения категории оценки в лингвистике.
курсовая работа [60,4 K], добавлен 03.05.2012Рассмотрение особенностей изучения грамматики в современных условиях в средней школе. Анализ сущности информационных технологий, их роли в учебном процессе, влияния на мотивацию обучения. Применение Интернет-ресурсов на уроках английского языка.
дипломная работа [249,5 K], добавлен 26.04.2015Краткая история развития изучения языка как научной дисциплины в Древней Греции. Лингвистический анализ произведений Платона: правильность имен и образование слов. Проблематика изучения языка в трудах Аристотеля: слово и словесная многозначность.
реферат [30,2 K], добавлен 14.06.2014Особенности обучения китайскому языку. Различия между понятиями "изучение языка" и "овладение языком". Общеметодологические подходы к разработке методики обучения. Этапы развития китайской грамматики. Учёт особенности китайской грамматики в обучении.
курсовая работа [56,9 K], добавлен 07.08.2011Исследование роли изучения иностранных языков в развитии международного туризма и межкультурных коммуникациях. История создания варшавским врачом-окулистом Людвигом Заменгофом первого в мире искусственного языка эсперанто; его популярность в ХХ веке.
курсовая работа [10,3 K], добавлен 18.05.2011История развития и структура языка в Австрии. Лексические особенности австрийского варианта немецкого языка. Лексические заимствования в словарном составе. Словообразование, грамматические и фонетические особенности австрийского варианта немецкого языка.
курсовая работа [32,9 K], добавлен 15.11.2014