Главная Коллекция "Revolution" Иностранные языки и языкознание Апокопы в современном французском языке: образование, распространение, автоматический поиск

Апокопы в современном французском языке: образование, распространение, автоматический поиск

Понятие терминов "аббревиация", "апокопа". Причины распространения аббревиатур. Классификации апокоп, формулирование правил их образования. Разработка алгоритма, способного находить апокопы, подготовка системы к использованию для других типов аббревиатур.

Рубрика	Иностранные языки и языкознание
Вид	дипломная работа
Язык	русский
Дата добавления	30.07.2016
Размер файла	2,4 M

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Страница:

Чтобы продемонстрировать интересные статистические данные, были построены разные графики по некоторым словам из корпуса. Так, на Рисунке 12 построены суммы частот употребления апокоп и их полные формы за последние 500 лет.

Рисунок 12. История употребления апокоп и их полных форм в 1500-2000 гг.

Из графика видно, что употребление усечённых слов наблюдало за все эти годы совсем небольшие колебания, в то время как использование полных форм линейно возрастало всё время. Данная тенденция явилась для нас неожиданной, однако мы связываем её с тем, что полные формы с годами приобрели широкие семантические поля, в то время как апокопы потеряли свою просторечную маркированность не так давно, и их стабильно низкое употребление можно объяснить двумя предположениями:

1) Всё это время мог существовать ряд апокоп, вошедших в употребление, который не претерпевал значительных изменений. При этом появление многих современных апокоп ещё не засвидетельствовано во многих словарях и литературных источниках, из-за чего мы не можем проследить современные тенденции.

2) Возможно, новые апокопы сменяли старые всё время, однако суммарная частота их употребления не изменяла своего значения. Иначе говоря, в языке сформировалась определённая ниша для апокоп предельного размера.

Заметно возрастающее число полных форм может быть также связано с тем, что среди них есть значительное количество слов из таких семантических классов, как техника, наука и современные термины, употребление которых с годами растёт за счёт закрепления этих понятий в языке. Чтобы проверить это предположение, мы решили составить графики отдельных апокоп и их полных форм и проследить их историю употребления.

Изначально для выполнения этой задачи мы составили несколько классов слов, связанных с наукой и техникой - средствами передачи информации, передвижения, изобретениями. Однако мы заметили, что большинство апокоп омонимичны - например, bac может являться как апокопой от baccalaurйat «бакалавриат», так и обозначать такие понятия, как «паром», «ящик»- это может затруднять анализ данных и наводить на неправильные результаты. Чтобы максимально избежать такой ситуации, мы выбрали для анализа наименее многозначные формы.

На Рисунке 13 представлены слова cinйma «кино», tйlйvision «телевидение» и их апокопы cinй и tйlй. Как видно из графика, апокопы этих слов стали получать распространение только после 1950 года, в то время как полные формы существовали ещё в 1910-1930-х гг. После 1965 года наблюдается особый скачок в употреблении полных форм. Важно также отметить, что форма cinй так и не набрала особой популярности к 2000 году, в то время как частотность формы tйlй стабильно растёт, а её полной формы - начала падать после 1995 года. Это говорит о том, что у этой апокопизированной формы есть все шансы вытеснить полную форму. То, что апокопа tйlй более популярна апокопы cinй, может быть связано с длиной их полных форм: коэффициент отсечения в первом случае - 60%, а во втором - 33%.

Рисунок 13. История возникновения слов cinйma, cinй, tйlйvision и tйlй.

На Рисунке 14 показаны тенденции, происходившие со словами automobile «автомобиль», и mйtropolitain «метрополитен» и их апокопами mйtro и auto. Интересно, что обе апокопизированные формы сначала были мало распространены, а затем в 1960-х годах резко обогнали свои полные формы. При этом форма automobile стала настолько снижать свою частотность, что можно предсказать, что когда-нибудь она и вовсе выйдет из употребления. Резкий скачок вверх частотности данной формы в 1930 году может быть связан с появившейся в 1913 году конвейерной технологией и значительно развившейся к тому периоду. Данная технология позволила сделать автомобилестроение массовым, в связи с чем резко возросла необходимость в описании этого объекта. Одновременный спад популярности полных форм и вытеснение их усечёнными формами, возможно, связано с изменением конвенций журналов и газет, всё больше поощрявших использование аббревиатурных моделей.

Рисунок 14. История возникновения слов auto, automobile, mйtro и mйtropolitain.

Рисунок 15 иллюстрирует зависимости, наблюдавшиеся в форме photographie «фотография» и её апокопе photo. Резкий спад полной формы после 1895 года может быть связан с созданием в это время кинематографа братьями Люмьер. Данное событие ввело новый способ передачи действительности, который резко набрал популярность и отвёл научное обсуждение фотографии на второй план. При этом апокопа photo в это время повышала свою частотность, имея разговорный оттенок, и в 1942 году, возможно, в связи с появлением первой цветной плёнки, наблюдался её заметный скачок вверх. Усечение данной апокопы происходит более, чем в 2 раза, что говорит об оправданности его применения. Мы можем предположить, что данная апокопа когда-нибудь окончательно вытеснит свою полную форму.

Рисунок 15. История возникновения слов photo и photographie.

Нам было также интересно изучить историю слов с греческими суффиксами. Мы взяли в качестве примера апокопу crypto и две её возможные полные формы - cryptographie «криптография» и cryptologie «криптология», изображённые на Рисунке 16. Форма cryptographie находилась всё время в конкуренции с апокопой, при этом резкий скачок употребления формы crypto наблюдался в период Второй Мировой войны. Это, вероятно, было связано с необходимостью передавать сообщения между отрядами войск и защищать их от прочтения. Короткая форма могла быть более употребимой для экономии времени, ведь любые задержки могли существенно изменить ход военных событий. При этом в конце 90-х годов в связи с развитием Интернета появилась необходимость в информационной безопасности - в шифровании данных, защите паролей. Так, в связи с этим формы cryptographie и cryptologie стали гораздо чаще упоминаться в литературных источниках. При этом апокопа crypto, имеющая коэффициент сокращения 50% и 45% соответственно, после военного периода так и осталась на первом месте по популярности.

апокопа аббревиатура алгоритм

Рисунок 16. История возникновения слов crypto, cryptographie и cryptologie.

Существуют и такие тенденции, когда апокопа какое-то время боролась за право вытеснения полной формы, однако так и не смогла выйти на первое место по частотности. Подобная ситуация представлена на Рисунке 17 для слова stйnographie «стенография» и её апокопы stйno. Так, до 1900 года наблюдался рост полной формы, что могло быть связано с развитием судебной системы. В 1900-1920-х годах частотность употребления полной формы начала постепенно снижаться, а апокопы - повышаться. Возможно, этому способствовало появление прессы, где явление стенографии стало обсуждаться с помощью более экономных языковых средств. Причиной дальнейшего спада употребления обеих форм может являться устаревание стенографии как метода вследствие появления других средств записи, как, например, звукозапись, видеозапись. Тем не менее, данный метод иногда используется и на сегодняшний день, в особенности, на закрытых заседаниях.

Рисунок 17. История возникновения слов stйno и stйnographie.

Мы также решили построить графики пятидесяти наиболее и наименее частотных пар апокоп с их полными формами за 500-летний период. На Рисунке 18 проиллюстрированы наиболее популярные пары, а на Рисунке 19 - наименее популярные. Так, среди самых частотных слов оказались слова разных классов: общей лексики: pre < premier («первый»), soce < sociйtй («общество»), prod < produit («продукт»), page < pageot («кровать»), административной: gйnй < gйnйral («генерал»), autor < autoritй («власть»), admin < administration («администрация»), passe < passeport «паспорт», криминальной: es < escroc («мошенник»), crime < criminelle («преступница»), proc < procureur («прокурор»), учебно-научной: philo < philosophie («философия»), exo < exercice («упражнение»), fac < facultй («факультет»), uni < universitй («университет»), exam < examen («экзамен»), aca < acadйmie («академия»), prof < professeur («профессор»), а также самые популярные из нашего корпуса имена собственные: Phil < Philippe (2 место), Alex < Alexandre (23 место), Al < Alain (4 место), которые занимают 2, 23 и 4 места соответственно в списке самых частотных французских имён с 1940 года по 2011 год (Wikipedia 2015).

Рисунок 18. Наиболее частотные слова за период 1500-2008 гг.

Среди наименее популярных имён (Рисунок 19) встречаются слова иностранного происхождения: expat < expatriate англ. «экспатриант», kalash < kalashnikov (рус. «Калашников»), специальные термины: balnйo < balnйothйrapie «бальнеотерапия, или лечение минеральными водами», perco < percolateur «перколятор, или кипятильник для кофе», perfo < perforeuse «перфоратор» и слова разговорного стиля: scato < scatologie «грубая шутка», grand-ma < grand-maman «бабушка», prisu < prisunic «дешёвый магазин», rasta < rastaquouиre «подозрительный тип», impec < impeccablement «безукоризненно». В этот же список попали такие современные понятия как skate < skateboard «скейтборд», cyber < cybercafй «Интернет-кафе», scoot < scooter «скутер», quinqua < quinquagйnaire «пятидесятилетний человек».

Таким образом, все апокопы, представленные на данном графике, имеют слишком просторечную окраску для использования в серьёзных литературных источниках, а их полные формы редко употребимы либо в силу принадлежности к разговорному стилю, либо специализированности той области, к которой они относятся, либо относительно недавнего появления в языке.

Рисунок 19. Наименее частотные слова за период 1500-2008 гг.

Так как графики, представленные выше, отображают среднюю частотность вне зависимости от года популярности той или иной формы, мы построили ещё два графика со средневзвешенной популярностью новых апокоп (Рисунок 20) и старых апокоп (Рисунок 21). Данный параметр рассчитывался по следующей формуле:

где P - популярность данной формы в заданном году, а Y - год

На Рисунке 20 можно увидеть, что последние десятилетия новые апокопы формируются в основном от слов, связанных с открытиями науки и техники: cyber < cybercafй «Интернет-кафе», schizo < schizophrйnie «шизофрения», crypto < cryptologie «криптология», hйlico < hйlicoptиre «вертолёт» и многие другие, большая часть из которых вошла в график наименее частотных слов. Это может быть связано с тем, что новые апокопы ещё не успели укрепиться в языке и стать достаточно популярными.

Рисунок 20. Средневзвешенная популярность самых новых апокоп в нашем корпусе.

Среди старых апокоп, изображённых на Рисунке 21, можно увидеть как слова из учебно-научной сферы, являющиеся наиболее частотными во всём корпусе, но более популярными в старые времена, но и слова из области профессиональной терминологии (reco < recommandation «рекомендация», pro < profession «профессия», patro < patronage «патронат», deb < dйbutante «начинающая», promo < promotion «повышение») и военной (infi < infirmerie «санчасть», reco < reconnaissance «разведка»). Таким образом, те слова, которые оказались высокочастотными на предыдущих графиках, являются на самом старыми словами.

Рисунок 21. Средневзвешенная популярность самых старых апокоп в нашем корпусе.

Сравнивая новый и старый графики, можно увидеть, что продуктивность апокопизации заметно повысилась. Так, на первой половине Рисунка 21 умещается более ста лет, а на второй половине Рисунка 20 уместилось всего двадцать. То, что на левой половине Рисунка 20 под конец периода интервал появления новых апокоп увеличился, обуславливается, скорее всего, тем, что только что сформированные апокопы ещё не попали в словари, используемые нами как источники. Ещё одним фактором, влияющим на вышеупомянутую тенденцию, является тот факт, что большинство слов были в хождении в течение долгого периода времени, и поэтому их средневзвешенная дата использования находится ближе к середине исследуемого нами периода, то есть около 1880 года.

3.4 Доработка алгоритма

Базовая часть нашего алгоритма продемонстрировала хороший показатель полноты и в то же время очень низкий показатель точности, поэтому алгоритм требовал доработки.

3.4.1 Выявление неточностей

После выполнения самого первого теста, проведённого по корпусу словаря Le Grand Robert, из 80828 слов корпуса апокопами посчиталось 15641 слово (20% корпуса). При этом в сумме было найдено 260348 полных форм, от которых могли образоваться найденные «апокопы».

Чтобы постепенно добиться улучшения работы алгоритма, необходимо было составить ряд новых правил. Мы просмотрели результаты работы алгоритма в файле-отчёте, каждая запись которого представлена из слова, которое наш алгоритм посчитал апокопой, и списка полных форм, для которых было принято такое решение. Нашей целью было выявление некоторых общих закономерностей, которые могли бы позволить предложить новые правила.

3.4.2 Первый этап: чёрный список

Первое, что мы увидели после просмотра отчёта об ошибках - это то, что наш алгоритм зачастую считал аббревиацией случаи словообразования (например, прилагательные, оканчивающиеся на -able считал апокопыми от наречий, оканчивающихся на -ablement). Так, мы решили составить ряд исключающих правил относительно окончаний апокопы и полной формы. В Таблице 6 показаны данные правила: если одна из ячеек таблицы для апокопы или полной формы пуста, это значит, что ограничение применяется только к заполненной ячейке (например, первая строка таблицы говорит о том, что мы не считаем апокопами слова, заканчивающиеся на -ion), если же заполнены обе ячейки таблицы, то ограничения применяются одновременно (например, первая запись с заполненными двумя ячейками в строке указывает на то, что мы не считаем апокопами слова, заканчивающиеся на -que, если их полная форма заканчивается на -quement).

Таблица 6. Ограничения на окончания апокопы и полной формы.

Апокопа	Полная форма
-ion
-ie
	-ette
	-oche
	-alement
	-inement
-que	-quement
-able	-ablement
-ent	-entement

После запуска алгоритма с предложенными правилами наблюдались некоторые улучшения (количество полных форм сократилось на несколько сотен), но совсем незначительные, что требовало создания правил, затрагивающих более объёмные классы слов.

3.4.3 Второй этап: отрезаемая часть

Следующим нашим шагом был анализ некоторой статистики о распределении различных параметров в апокопах и полных формах. Наиболее релевантной статистикой нам показалась информация о встречаемости отрезанных частей в полных формах.

Мы решили составить список отрезанных частей, которые не могут встречаться у слов, от которых образованы апокопы. Для этого мы взяли список отрезанных окончаний с их частотностью из тестового корпуса словаря и из нашего корпуса апокоп, нашли массив разности этих подмножеств и взяли его в качестве чёрного списка для нашего алгоритма. Этот этап сократил количество полных форм более, чем на 10000, но не уменьшил значительно количество апокоп. Это связано с тем, что для одной потенциальной апокопы наш алгоритм на этом этапе мог выдавать до 30 полных форм, среди которых с большой вероятностью встречается окончание из массива, общего для двух корпусов. Таким образом, алгоритм по-прежнему требовал доработки.

3.4.4 Третий этап: ресуффиксация

Ресуффиксация - это процесс добавления аффиксов к апокопе после её усечения (см. раздел 3.3.4). Мы решили проверить, зависит ли добавляемый суффикс от финали апокопы. Иначе говоря, мы задались вопросом, может ли происходить ресуффиксация с апокопой, оканчивающейся на гласный. Полученная статистика по нашему корпусу апокоп подтвердила наши предположения о том, что добавление окончаний в данном случае имеет вероятность, стремящуюся к нулю. Тогда мы дополнили наш алгоритм правилом о том, что если сокращённое слово не находится полностью в изначальной форме и при этом заканчивается на гласный, то оно не является апокопой. Данное правило может быть немного жёстким и исключить из апокоп некоторые реальные апокопы, однако, как мы заметили по нашему корпусу, апокопы, исключившиеся по этому правилу, имели аналоги без ресуффиксации.

В итоге было отсечено ещё более 500 апокоп и более 35000 полных форм.

3.4.5 Четвёртый этап: стеммер

В качестве эксперимента мы решили применить стеммер для получения большей информации о морфологическом составе слов. Изначальной идеей было предположение о том, что реальные апокопы с очень высокой вероятностью отрезают часть корня, а если не отрезают, то отсекают часть суффикса полной формы. Таким образом, мы рассчитывали, что ситуация, когда апокопа образована усечением суффикса с полным сохранением корня, наименее вероятна.

После долгого поиска французских стеммеров мы решили обратиться к модулю nltk.stem.snowball (Stahl et al. 2015). С помощью данного стеммера мы находили корень как апокопы, так и её полной формы и сравнивали их: если отстеммленные части оказывались одинаковыми, то мы не считали это усечением.

В результате этого улучшения количество слов, считаемых нашим алгоритмом апокопами, уменьшилось на 4000, а количество полных форм - на 10000.

3.4.6 Результаты улучшений

Таким образом, были последовательно применены четыре этапа улучшений, состоявших из ограничений на 1) окончания полной и усечённой формы, 2) отрезаемую часть, 3) ресуффиксацию, 4) основу (определяемую стеммером).

В результате всех улучшений количество слов в тестовом корпусе, которые наш алгоритм считает апокопами, снизилось на 30%, а количество полных форм для них - на 60%. Рисунок 22 показывает эффективность наших методов по улучшению алгоритма.

Рисунок 22. Рост точности алгоритма на разных этапах улучшений.

Так, самым эффективным по отсечению полных форм стал этап ограничения отрезаемых частей, а апокопизированных форм - этап применения стеммера.

3.5 Корпус французских текстов

3.5.1 Сбор корпуса

В качестве корпуса текстов для оценки работы алгоритма были выбраны статьи из французского новостного журнала Le Point (Le Point 2015). Чтобы была возможность постоянно обновлять данные, как корпуса статей, так и корпуса апокоп при нахождении новых слов, принятых нашим алгоритмом, было необходимо написать крауле. Такой краулер был написан нами на Python с использованием библиотеки lxml, собирающий для каждого автора текстовые файлы с его статьями. В итоге был получен корпус из 53899 уникальных словоформ. В данном случае это не лексемы, как было в корпусе словаря, а именно словоформы, так что в дальнейшем было бы целесообразно найти или разработать грамотную систему, лемматизирующую французские тексты.

3.5.2 Проверка работы алгоритма

После завершения сбора текстов было необходимо оценить работу нашего алгоритма на корпусе статей. Запуск алгоритма дал результаты, близкие к полученным нами на корпусе словаря. Это неудивительно, так как все сравнения с полными формами мы приводили по-прежнему по корпусу словаря.

Чтобы сравнить работу алгоритма на двух корпусах и оценить эффективность проведённых этапов, мы построили график (Рисунок 22) для двух корпусов, иллюстрирующий количество слов, которые наш алгоритм посчитал апокопами, на разных этапах улучшений. Так, при запуске алгоритма без всех улучшений было найдено 406951 для 17273 апокоп.

Рисунок 22. Сравнение эффективности улучшений алгоритма на корпусе словаря и корпусе статей.

Монотонность кривых свидетельствует о стабильности работы нашего алгоритма. Причём, заметно, что при увеличении тестового корпуса этап отрезанных частей показывает ещё большую эффективность для уменьшения количества найденных полных форм. Однако наш алгоритм на сегодняшний день находит слишком большое число апокоп, чтобы можно было автоматически пополнять их корпус. Возможно, задача автоматического сбора апокоп на основе обычных текстов неразрешима в принципе и требует всегда ручной обработки, но мы склонны полагать, что при увеличении количества новых правил точность алгоритма может быть повышена до необходимого и приемлемого уровня.

Мы уверены, что на данном этапе количество возможных новых правил не исчерпано, однако ограниченность во времени не позволила нам продвинуться дальше. Вместе с тем в будущем, при постепенном увеличении корпуса апокоп за счёт появления новых словарных статей о них, задача поиска новых закономерностей будет становиться проще и проще за счёт получения более репрезентативных статистических данных.

3.6 Будущие доработки

Настоящее исследование может быть дополнено новыми результатами как посредством сбора новых данных из новых источников, как сбором новой статистики по полученному корпусу, так и дополнением алгоритма новыми правилами для повышения точности его работы. Последнее особенно важно, так как может позволить в будущем автоматически находить апокопы во французских текстах при минимальной ручной работе.

В будущем было бы также интересно расширить алгоритм для работы с другими типами сокращений, а также с другими языками. Из числа других сокращений наиболее близкую к нашей систему возможно разработать для начальных сокращений, или аферез. При этом этапы чёрных списков и стеммера не подошли бы для её обработки, но можно было бы предложить, например, правила выбора первых букв.

Заключение

Аббревиация сегодня является продуктивным способом словообразования во многих языках и настолько сложно систематизируемым, что исследователи в этой области до сих пор не ввели единую терминологию. Мы провели анализ различных отечественных и зарубежных источников для сопоставления терминологии и рассмотрели 4 типа аббревиаций: 1) усечения, 2) инициализмы, 3) акронимы и 4) слияния. В силу трудоёмкости исследования каждого вида, подчиняющегося индивидуальному набору правил, мы остановились на наиболее распространённом виде усечений во французском языке - апокопах (или финальном усечении).

Количество новых апокоп, появляющихся во французском языке, значительно выросло за последние десятилетия, и большинство словарей не успевают засвидетельствовать изменения, происходящие в языке. В связи с этим область исследования апокоп мало изучена и требует более детального и объёмного анализа, чем могут позволить ручные методы обработки данных. Так, в настоящем исследовании нашей целью было создание системы, способной автоматически распознавать апокопы во французских текстах.

Мы разработали алгоритм, способный определять, является ли слово апокопой от заданной полной формы и является ли слово вообще апокопой, опираясь при этом на словарь полных форм. Мы довольно быстро добились высокой полноты алгоритма - что означает, что наша система находит все слова, являющиеся на самом деле апокопами, но, несмотря на все приложенные усилия, не смогли повысить его точность до необходимого для автономной работы уровня, так как во французском языке преобладают короткие слова, многие из которых похожи на апокопы по формальным признакам.

Задача повышения точности алгоритма была выполнена нами в четыре этапа. В результате всех улучшений количество слов в тестовом корпусе, которые наш алгоритм считает апокопами, снизилось на 30%, а количество полных форм для них - на 60%. Тем не менее, алгоритм по-прежнему требует доработки, которую можно было бы осуществить при наличии большего количества ресурсов, чем было выделено на данное исследование.

Таким образом, в результате проделанной работы было получено:

1) Система краулеров, собирающая данные для корпуса апокоп из семи найденных источников. Каждый источник был проанализирован на предмет наличия в нём апокоп, не представленных в других источниках. С этой точки зрения наиболее полезными оказались статья «Apocope» (Languefranзaise 2015), словарь Le Grand Robert (Le Robert 2015) и статьи из французского вики-словаря Wiktionnaire (Wiktionnaire 2015a, 2015b).

2) Корпус, насчитывающий 1295 пар апокоп с их полными формами, которые наш алгоритм посчитал допустимыми, среди которых 1078 уникальных апокоп.

3) Базовый алгоритм, определяющий, является ли заданное слово апокопой от заданной полной формы. Данный алгоритм состоял из ограничений на длину и добавляемые окончания апокоп, а также осуществлял ряд фонетических замен.

4) Статистика по собранному корпусу и выводы:

- длины полных и усечённых форм: большинство апокоп состоят из 4-5 букв, а их полные формы - от 9-11 буквенных форм;

- соотношение длин апокопизированной и полной формы: большая часть слов усекает от половины до двух третей своей длины; отрезается минимум 20% длины слова;

- окончания апокоп: количество апокоп с вокалической и консонантной финалью примерно равное; при этом самыми распространёнными окончаниями апокопы являются -o (с большим отрывом), -e, -a и -i;

- добавленные части: 80% апокоп нашего корпуса образованы простым усечением без добавления окончаний; среди оставшихся 20% апокоп самыми популярными добавляемыми окончаниями являются -e и -o;

- усечённые части: самым распространённым отрезаемым окончанием является -tion; усечение окончаний -iste, -ard, -ot и -ball образует преимущественно апокопы с консонантной финалью, а усечение окончаний -chiste, -mentaire и -sexuel - апокоп с вокалической финалью;

- части речи: среди существительных и прилагательных встречается равное количество апокоп с консонантной или вокалической финалью, среди наречий, глаголов и междометий преобладают апокопы с консонантной финалью; если часть речи для полной формы определена заранее, возможно по отрезаемой части определить, может ли от неё образоваться заданная апокопа.

5) Статистика об истории возникновения апокоп на основе анализа данных из проекта Google Ngram (Ngram Viewer 2010).

6) Корпус из 80828 слов французского языка, составленный из французского словаря Le Grand Robert (Le Robert 2015).

7) Множество правил, позволяющих распознавать апокопы с обращением к словарю полных форм.

8) Система краулеров, собирающая корпус текстов из (Le Point 2015).

9) Алгоритм, осуществляющий распознавание апокоп в тексте (базируется на свежих статьях, найденных краулерами).

Уникальность нашего исследования состоит в том, что полученный нами корпус и алгоритм его сбора и анализа находятся в открытом доступе. Это может позволить в будущем дополнить его новыми данными, получить новую статистику, а также описать другие виды сокращений, в том числе в других языках.

Список литературы

1. Арнольд 2013 - И. Арнольд. Лексикология современного английского языка: учебное пособие. 3-е изд., перераб. и доп. М.: Высш. шк., 1986.

2. Блох 2014 - М. Я. Блох, Т. С. Сергеева. Аббревиация как продуктивный способ словообразования в истории европейских языков. // В.И. Волчихин (ред.). Известия высших учебных заведений. Поволжский регион. Гуманитарные науки 1 (29), 2014. С. 186-199.

3. Криворот 2012 - В. В. Криворот. Особенности аббревиации в русском, английском и французском языках // О. И. Уланович (ред.). Язык, речь, общение в контексте диалога языков и культур, 2012. С. 42-50.

4. Мартине 1963 - А. Мартине. Основы общей лингвистики // В. А. Звегинцев (ред.). Новое в лингвистике, вып. III. M., 1963. С. 532-538.

5. Сергеева 2013 - Т. С. Сергеева. Аббревиатура в системе лексических сокращений. // Е. В. Рябцева (ред.). Филологические науки. Вопросы теории и практики 6 (2), 2013. С. 174-179.

6. Bouzidi 2009 - B. Bouzidi. Crйativitй lexicale par rйduction en franзais contemporain. // S. Aouadi (ed.). Synergies Algйrie, 2009. P. 111-117.

7. CNTRL 2012 - -O, finale et finale par apocope. Портал CNTRL. http://www.cnrtl.fr/definition/ap%C3%A9ro

8. Dister 1997 - A. Dister. Aspects phonйtiques et morphologiques de l'apocope en francais contemporain. // C. Caouette, P. Larrivйe (eds.). Actes des 11^e Journйes de linguistique. Quйbec, 1997. P. 53-60.

9. Echolalistes 2014 - Liste d'apocopes. Портал Echolalistes. http://www.echolalie.org/wiki/index.php?ListedApocopes

10. Fridrichovб 2013a - R. Fridrichovб. La prйsence des mots tronquйs dans des dictionnaires franзais - йtude statistique // Studia Romanistica Vol. 13, 1, 2013. P. 39-51.

11. Fridrichovб 2013b - R. Fridrichovб. Quelques observations sur les mots tronquйs dans le franзais contemporain // Romanica Olomucensia 1, 2013. P. 1-13.

12. Haley 2009 -- A. Haley. Ampersand (электронный документ). Портал fonts.com. http://www.fonts.com/content/learning/fontology/level-1/type-families/ampersand

13. Kerleroux 1999 - F. Kerleroux. Sur quelles bases opиre l'apocope. Silexicales 2: la morphologie des dйrivйs йvaluatifs, 1999. P. 95-106.

14. Languefranзaise 2015 - Apocope. Портал Languefranзaise. http://www.languefrancaise.net/Morphologie/2

15. Le Point 2015 - Статьи. Новостной журнал Le Point. http://www.lepoint.fr/

16. Le Robert 2015 - Словарь Le Grand Robert. http://www.lerobert.com/espace-numerique/telechargement/le-grand-robert-pc.html

17. Lйvy 2009 - F. Lйvy. Abrйviations - Apocope + suffixe (noms communs). Блог «N»ayons plus peur des mots». http://www.finallyover.com/article-4901064.html

18. NGramViewer 2012 - Google NGram Viewer. https://books.google.com/ngrams.

19. Piechnik 2009 - I. Piechnik. Йconomisation lexicale en franзais et en polonais // Romanica Cracoviensia 9(1), 2009. P. 180-189.

20. Stahl et al. 2015 - M. Stahl, M. Porter, P. Ljunglof. Snowball Stemmer. Natural Language Toolkit. http://www.nltk.org/_modules/nltk/stem/snowball.html

21. Wikipedia 2015 - Liste des prйnoms les plus donnйs en France. Портал Wikipedia. http://fr.wikipedia.org/w/index.php?title=Liste_des_pr%C3%A9noms_les_plus_donn%C3%A9s_en_France&oldid=115151505.

22. Wiktionnaire 2015a - Apocopes en franзais. Портал Wiktionnaire. https://fr.wiktionary.org/wiki/Cat%C3%A9gorie:Apocopes_en_fran%C3%A7ais

23. Wiktionnaire 2015b - Apocopes familiиres en franзais. Портал Wiktionnaire. https://fr.wiktionary.org/wiki/Cat%C3%A9gorie:Apocopes_famili%C3%A8res_en_fran%C3%A7ais

Размещено на Allbest.ru

...

Страница:

дипломная работа "Апокопы в современном французском языке: образование, распространение, автоматический поиск" скачать

Подобные документы

Аббревиация как способ словообразования во французском языке (на материале языка современной прессы)
Исследование аббревиации в современном французском языке. Понятие словообразования, типы аббревиации, усечение, инициальные слова, композитная аббревиация. Определение термина дискурс. Использование аббревиатур в дискурсе на материале печатных изданий.

дипломная работа [115,7 K], добавлен 03.07.2009
Аббревиатуры в современном русском языке (на материале СМИ)
Активизация аббревиации как способа образования новых слов. Классификация аббревиатур по структуре, их использование для экономии места и времени. Способы аббревиации, применение заимствований-аббревиатур в языке средств массовой информации (СМИ).

курсовая работа [33,0 K], добавлен 27.11.2009
Английские аббревиатуры и способы их перевода на русский язык
Аббревиация как объект лингвистического исследования. Семантика и виды аббревиатур, способы их перевода с английского на русский язык. Функционально-семантический анализ перевода аббревиатур в английском языке на материале профессиональной литературы.

дипломная работа [129,8 K], добавлен 03.11.2015
Аббревиация в журнале "Цены"
Основные способы словообразования. Аббревиация как продуктивный способ словообразования. Характеристика журнала "Цены". Виды аббревиатур, используемые в рекламных объявлениях журнала: аббревиатуры в названиях организаций, строительных материалов.

курсовая работа [30,9 K], добавлен 15.04.2010
Аббревиатуры в современном газетном тексте
Активные тенденции в нынешнем русском словообразовании. Компрессия как способ образования новых слов. Аспекты изучения аббревиации в современной дериватологии. Некоторые особенности газетного текста. Анализ аббревиатур с точки зрения сферы употребления.

дипломная работа [185,7 K], добавлен 02.06.2017
Типология, состав и особенности функционирования современных сокращений
Определение термина "стиль речи". Особенности газетно-публицистического стиля. Понятие "аббревиация", ее функции в языке прессы. Аббревиатуры в качественной и бульварной прессе. Особенности употребления аббревиатур в языке современной британской прессы.

дипломная работа [122,1 K], добавлен 06.08.2017
Особенности перевода аббревиатур и сокращений с английского на русский язык
Аббревиации и сокращения как объект лингвистического исследования. Функционально-семантический анализ перевода аббревиатур и сокращений на материале научно-технической и профессиональной литературы. Передача иностранных сокращений на русском языке.

дипломная работа [70,2 K], добавлен 30.10.2008
Формально-функциональные особенности акронимов в современном русском языке
Аббревиация как способ словообразования. Причины и особенности возникновения сокращенных лексических единиц. Аббревиация в разноструктурных языках. Акронимы как разновидность аббревиации. Формальные особенности акронимов в современном русском языке.

дипломная работа [143,0 K], добавлен 23.03.2014
Аббревиация как характерная черта языка виртуальной коммуникации
Аббревиация как способ словообразования. Причины создания и классификация сокращений. Аббревиация во французском, английском и русском языках. Лингвистические аспекты виртуальной коммуникации. Аббревиация в виртуальном тексте, влияние на нормативный язык.

дипломная работа [69,0 K], добавлен 09.05.2010
Формирование заимствованных аббревиатур в русском и английском языках
Заимствования как отражение языковых изменений в условиях глобализации. Понятие, сущность и природа образования аббревиатуры в русском и английском языках. Анализ английских аббревиатурных заимствований в русском языке и сферы их распространения.

курсовая работа [64,8 K], добавлен 03.12.2013
Аббревиатура в словообразовательной системе английского языка
Сокращение и его место в современной лексикологии, типы аббревиатур. Структурно-семантические классификации английских сокращений и их место в словообразовательной системе. Основные способы перевода и переноса аббревиатур с английского языка на русский.

дипломная работа [55,4 K], добавлен 29.10.2010
Фразеологизмы с компонентом-библеизма во французском языке
Фразеология как наука, предмет и методы ее исследования, отличительные особенности. Понятие и свойства фразеологизма. Принципы классификации фразеологизмов во французском языке. Сущность и разновидности библеизмов, характер и условия их применения.

курсовая работа [38,4 K], добавлен 23.03.2011
Свойства модальных глаголов в современном французском языке
Понятие о модальности во французском языке. Отношение пропозитивной основы содержания высказывания к действительности по доминирующим признакам реальности. Грамматические характеристики и лексико-семантические потенции глагола волюнтативности vouloir.

курсовая работа [47,9 K], добавлен 22.03.2013
Сослагательное наклонение во французском языке
Образование сослагательного наклонения во французском языке от основы глагола путем прибавления окончаний. Глаголы 3-й группы, изменяющие основу при образовании. Основные правила употребления сослагательного наклонения в придаточных предложениях.

презентация [495,3 K], добавлен 04.05.2012
Словообразование в английском языке
Виды словообразования: конверсия, аффиксация, компрессия, основосложение, аббревиация, дезаффиксация, обособление значения. Употребление префиксов прилагательных. Аффиксация как способ образования новых слов путем присоединения к основе слова аффиксов.

курсовая работа [50,8 K], добавлен 01.06.2010
Специфические черты однородности сказуемых в английском и французском языках
Проблема однородности членов предложения в современной лингвистике. Ряды однородных сказуемых в английском языке, сказуемых первого, второго, третьего структурного типа. Природа предложения с однородными сказуемыми в современном французском языке.

курсовая работа [63,0 K], добавлен 11.11.2011
Проблемы аббревиации в английском языке
Аббревиация как следствие тенденции к экономии языковых средств. Отечественные и зарубежные ученые об изучении сокращений. Комплексный анализ структуры и функционирования инициальных сокращений в английском языке, выявление основных способов их перевода.

курсовая работа [122,0 K], добавлен 25.10.2016
Функционирование префиксальных глаголов в современном английском и французском языках
Семантическая структура префиксальных производных. Характер взаимодействия префиксов и производящих основ разных лексико-семантических групп. Функционирование префиксальных глаголов в английском языке. Префиксальное словообразование во французском языке.

дипломная работа [72,0 K], добавлен 25.11.2011
Использование медицинских терминов в аннотациях лекарств
Место терминологической лексики в современном русском языке. Способы образования терминов. Терминология заболеваний и терминология химического состава как структурные элементы медицинской терминологии. Анализ терминологии аннотаций медицинских лекарств.

курсовая работа [51,9 K], добавлен 22.04.2011
Особенности использования юридических терминов в английском языке
Характеристика терминологических систем как объекта активного и интенсивного изучения в лингвистике. Обзор способов образования юридических терминов в английском языке. Анализ особенностей фразеологической номинации в форме глагольных словосочетаний.

дипломная работа [94,3 K], добавлен 08.04.2012

Другие документы, подобные "Апокопы в современном французском языке: образование, распространение, автоматический поиск"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.