Разработка словаря фонем и морфем узбекского языка на основе информации в Uznet (Для дальнейшего внедрения в Google translator)

Специфика узбекского языка. Корпусное исследование подъязыка предметной области. Обоснование выбора средств и технологий разработки. Программная реализация морфологического словаря. Структура базы данных. Интеллектуальный морфологический анализатор.

Рубрика Программирование, компьютеры и кибернетика
Вид диссертация
Язык русский
Дата добавления 24.05.2018
Размер файла 930,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

государственный комитет связи, информатизации И ТЕЛЕКОММУНИКАЦИОННЫХ ТЕХНОЛОГИЙ

РЕСПУБЛИКИ УЗБЕКИСТАН

ТАШКЕНТСКИЙ УНИВЕРСИТЕТ ИНФОРМАЦИОННЫХ ТЕХНОЛОГИЙ

Диссертация

на соискание академической степени магистра

Разработка словаря фонем и морфем узбекского языка на основе информации в Uznet (Для дальнейшего внедрения в Google translator)

5А330201 - Компьютерные системы и их программное обеспечение

На правах рукописи

Дусмухамедов Улугбек Суратбекович

Научный руководитель

Рахимов Дж.К.

Ташкент - 2014 г.

АННОТАЦИЯ

Обоснование актуальности темы. Проблема обработки текстов на узбекском языке, «понимания» языка компьютером была и остается актуальной. Раньше исследователь мог лишь просматривать тексты и вручную выписывать из них нужные примеры; эта предварительная (но абсолютно неизбежная) деятельность была очень трудоемкой и не позволяла обрабатывать большие массивы материала. Существующая практика разработки программного обеспечения в Узбекистане базируется в основном на статическом подходе и мало освоена отечественными программистами.

Цель и задачи исследования. Целью работы является разработка методов морфологического анализа текстов на узбекском языке, а так же методов корпусного исследования текстов и создания предметных словарей.

Задачами исследования являются:

- Изучение морфологии узбекского языка, выделение морфологических классов, исследование структур парадигм.

- Разработать алгоритм морфологического анализа словоформ.

- Реализация программного модуля позволяющий производить морфологический анализ.

Объект и предмет исследования. Объектом исследования является программная система «Словарь морфем узбекского языка» в виде WEB-портала. Предметом исследования является исследование по анализу текста узбекского языка.

Методы и средства исследования. Метод морфологического анализа текстов на узбекском языке, а так же метод корпусного исследования текстов и создания предметных словарей. Средствами исследования являются инструменты Angular JS, Framework Kohana, Microsoft Excel, СУБД MySQL, язык PHP с библиотекой Angular Framework.

Гипотеза исследования. Возможность разработки морфологического анализатора текстов узбекского языка.

Научная и практическая значимость. Полученные результаты развивают научные и практические аспекты разработки интеллектуальных словарей анализа текстов.

Научная новизна. Научная новизна работы состоит в применении метода корпусного исследования текстов и интеллектуального анализа.

Состав диссертационной работы. Диссертационная работа состоит из введения, трех глав, заключения, списка использованной литературы и приложения.

ABSTRACT

The actuality of the thesis.The problem of word processing in the Uzbek language, "understanding" first computer was and remains relevant. Previously, a researcher could only view the text and manually write out their dates examples; this preliminary (but absolutely inevitable) activity was very time-consuming and can not handle large amounts of material. The existing practice of software development in Uzbekistan is mainly based on a static approach and few mastered domestic programmers.The existing practice of software development in Uzbekistan is mainly based on the structural-functional approach and is mastered by domestic programmersa little.

The purpose and tasks of the thesis. The aim is to develop a morphological analysis of the texts in the Uzbek language, as well as the body of research methods texts and create subject vocabularies.

The objectives of the study are:

- Study of the morphology of the Uzbek language, the selection of morphological classes, structures research paradigms.

- Develop an algorithm morphological analysis of word forms.

- Implementation of a software module allows to perform morphological analysis.

The object and subject of the thesis. Object of study is a software system "morpheme dictionary Uzbek language" as WEB-portal. The subject of research is the study of the analysis of the text of the Uzbek language.

The methods and techniques of the research. Morphological analysis of texts in the Uzbek language, as well as the method of study of the body text and create subject slovarey. Sredstvami research tools are Angular JS, Framework Kohana, Microsoft Excel, database MySQL, PHP language library Angular Framework.

The hypothesis of the thesis. Possibility of developing a morphological analyzer Uzbek language texts.

Scientific and practical importance. Results develop scientific and practical aspects of the design of intelligent text analysis dictionaries.

Scientific novelty in the thesis. Scientific novelty of the method consists in the application of the body of research texts and mining.

The structure of the thesis. The dissertation consists of an introduction, three chapters, conclusion, list of references and applications.

Введение

Глава нашего государства Ислам Каримов, постоянно развивает данную сферу, разрабатывая различные программы и определяя перспективы направления дальнейшей деятельности. Для этого наш Президент принял постановление «О мерах по дальнейшему внедрению и развитию современных информационно - коммуникационных технологий». В данном документе были утверждены программы дальнейшего внедрения и развития информационно - коммуникационных технологий в стране на 2012-2014 годы и перечень ИС органов государственного и хозяйственного управления, органов государственной власти на местах, интегрируемых в Национальную ИС в период 2012-2014 годов. В Узбекистане были подведены итоги развития ИКТ за первый квартал. 25 апреля 2014 года состоялась заседание Коллегии Государственного комитета связи, информатизации и телекоммуникационных технологий, посвященных итогам работы отрасли за первый квартал 2014 года, ходу внедрения и развития информационно-коммуникационных технологий, определению перспектив и направлений дальнейшей деятельности. Было уделено особое внимание развитию современных ИКТ в сфере образования.

Существенную поддержку в проведении лингвистических исследований оказывают программные средства, позволяющие автоматически находить в исследуемых текстах нужные словоформы. Эту задачу отчасти решают специальные программы, которые выполняют поиск словосочетаний, используя сделанную заранее лингвистическую разметку текстов корпуса.

Важным, едва ли не центробразующим звеном цепи автоматической обработки текста на естественном языке является технология нахождения основы слова (стемминг), родственный ей по целям алгоритм (лемматизация), позволяющий определить, что некоторая цепь словоформ составляет одно «словоизменительное гнездо» (имеет одну лемму). Конечным продуктом, способным на эти операции, является программа, в автоматическом режиме осуществляющая морфологический разбор слова.

Актуальность темы исследования.Проблема обработки текстов на узбекском языке, «понимания» языка компьютером была и остается актуальной. Среди множества задач, которые сводятся к решению данной проблемы, можно назвать такие, как общение с компьютером на естественном языке, информационный поиск, машинный перевод, извлечение содержательной информации из текстов, пополнение баз знаний и создание конкордансов - словарей, содержащих слова из всех работ одного автора. Достаточно рутинная работа - проанализировать стилистику какого - либо автора по его работам. Благодаря автоматическому разбиению слов на морфемы и статистическим данным, которые рассчитывает программа, появляется возможность автоматизированного анализа авторских текстов и составления готовых конкордансов.

Правильное понимание состава слова, умение определить образующие его компоненты имеют большое значение при изучении языка. В слове отражены особенности строя языка, его лексика - семантические и функционально - грамматические законы. Узбекский язык по своей типологии и морфологической структуре значительно шире, чем просто набор элементов лексики, и отличается относительной регулярностью, позиционной и грамматической стабильностью морфологической структуры различных словоформ. Образование слов происходит последовательного присоединения к основе слова грамматических частиц - аффиксов.

В целях построении модели морфологии узбекского языка была проведена морфемно - морфологическая разметка (ММР) корпуса узбекских текстов.

Целью работы является разработка словаря методов морфологического анализа текстов на узбекском языке, а так же методов корпусного исследования текстов и создания предметных словарей.

Объект и предмет исследования. Объектом исследования является программная система «Словарь морфем узбекского языка» в виде WEB-приложения. Предметом исследования является исследование по анализу текста узбекского языка.

Для разработки приложения были поставлены следующие задачи:

1.Изучение морфологии узбекского языка, выделение морфологических классов, исследование структур парадигм.

2. Исследование существующих систем морфологического анализа текстов тюркских языков.

3. Построение морфологической таблицы для узбекского языка.

4.Построение иерархии семантических признаков для разметки научных текстов.

5. Создание морфемно - морфологической разметки корпуса текстов на узбекском языке на основе разработанной морфологической таблицы.

6.Разработать словарь аффиксов и начальных форм слов обеспечивающие эффективную обработку словоформы.

8. Разработать алгоритм морфологического анализа словоформ.

9.Разработать пользовательский интерфейс, позволяющий редактировать словарь основ, а так же проводить анализ словоформ.

10. Реализация программного модуля позволяющий производить морфологический анализ.

Научная новизна работы заключается в следующем:Раньше исследователь мог лишь просматривать тексты и вручную выписывать из них нужные примеры; эта предварительная (но абсолютно неизбежная) деятельность была очень трудоемкой и не позволяла обрабатывать большие массивы материала. Теперь ограничений на объем анализируемого материала и скорость поиска информации в нем по существу нет, а это означает, что в распоряжении исследователя оказываются колоссальные массивы текстов самого разного типа. Это не замедлило сказаться на развитии наших знаний о языке: возможность массовой -- в том числе статистической -- обработки текстов, недоступная прежде, позволила обнаружить в структуре и развитии языка такие закономерности, о существовании которых наука раньше или не подозревала, или лишь смутно догадывалась, но не могла строго обосновать. Теперь подлинно научные описания грамматического строя языков, а также авторитетные академические словари -- практически все без исключений -- должны составляться на основе корпусов этих языков. Учет корпусных данных оказывается крайне желательным (если не строго обязательным) и при многих других более специальных научных исследованиях.

Методы исследования. Создание методов разметки узбекского языка будет реализовано в веб приложении для подключения к другим системам или интернет сервисам. Основное назначение, которой является выделение «значимых» фрагментов текста, их сопоставление заданным категориям, поддержка функций редактирования, поиска, визуализации.Для формализации правил добавления суффиксов и окончаний предлагается использовать семантическую нейронную сеть. С помощью такой сети генерируются словоформы узбекского языка, и порождается структура словаря начальных форм в виде синхронизированного линейного дерева.

Практическая значимость и внедрение. Создаваемый с помощью данной среды размеченный корпус текста может быть использован другими программными инструментами для автоматизирования создания различных лингвистических ресурсов, к примеру, в Google translator. Другой немаловажной возможностью является «ручной» анализ экспертной разметки с целью выявления типичных понятий, фактов, отношений и их выражения в тексте. На основе анализа формируется система семантических категорий, описываются универсальные структуры (шаблоны) ситуаций.

Диссертационная работа состоит из введения, трех глав, заключения и приложения. Имеются четыре таблицы, две блок схемы и двенадцать рисунков.

интеллектуальный морфологический узбекский анализатор

Глава 1. Представление структуры языка и системы анализа текста

1.1 Специфика узбекского языка

В узбекском языке как и в русском языке имеются все виды аффиксального словообразования, а также словосложение, но суффиксальное словообразование является преобладающим, что касается префиксального и префиксально-суффиксального способов занимают незначительное место.

Суффиксальный способ словообразования - это образование новых слов присоединением к производящей основе суффиксов. Например: глаз - глазное, суббота - субботник, шанба - шанбалик,, Москва - Москвалик.

Структурно - типологическая характеристика узбекского языка связана с его принадлежностью к агглютинативным языкам. Для описания языков агглютинативного типа применяется набор признаков, учитывающих не только морфологические, но и синтаксические и фонетические особенности. Морфологические признаки агглютинации: Сохранение постоянного фонетического облика корневой морфемы.

В узбекском языке шесть самостоятельных частей речи: ot(существительное), sifat (прилагательное), son (числительное), olmosh(местоимение), fe'l (глагол), ravish (наречие); три служебных частей речи: кo`makchi (послелог), bоg` lovchi (союз), yuklama (частица).Кроме того в узбекском языке три особых групп слов: undov (междометие), modal so`z (модальные слова), taqlidiy so`z(подражательные слова).

От (Имена существительные)

Имена существительные называют лицо, предмет, место иливремя. Они отвечают на вопросы: kim (кто), nima (что), qayer (какоеместо).

Atoqli otlar - имена собственные: Anvar,Zuhra, Mars.

Turdosh otlar - имена нарицательные: kitob, daftar, qalam.

Mavhum otlar - (абстрактные имена существительные); do`stlik

(дружба), baxt (счастье), omad (удача) и т.д.

Jamlovchi otlar - (собирательные имена существительные): xalq(народ), qo`shin (войско), to`da (шайка, стадо) и т.д.

Имена существительные в узбекском языке имеют триграмматических категорий две из них kelishik (падеж) и son (число)является постоянными, egalik (принадлежность) не постоянной, т.е.имена существительные всегда находятся в форме того или иногопадежа, в единственном или множественном числах. Принадлежность может указываться, может нет.

Gul - именительней падеж, единст. ЧислоGulim - именит. падеж. единст. число. принадлежность 1лицу

Egalik qo`shimchalari(Аффиксы принадлежности)

Аффиксы принадлежности указывают на принадлежность предмета одному из трех лиц и прибавляются к существительным следующим образом:

Таблица - 1.1 Виды аффиксов

Birlik

Ko`plik

ota- m (мой отец)

ota- miz (наш отец)

ota- ng (твой отец)

ota- ngiz (ваш отец)

ota- si (его отец)

ota- si (их отец)

С прибавлением аффиксов принадлежности в корне словпроисходят следующие изменения:

В словах: o`rin (место), qorin (живот), bo`yin (шея), bо`g`iz(гортань), og`iz (рот), burun (нос), shahar, singil, ko`ngil (душа) гласнаяво втором слоге выпадает: bоg`zim, shahri, singling.Звуки q и k в конце многосложных слов переходят на g` и g:kerak - keragi (yo`q) (нет необходимости). Qishloq - qishlog`i.

Исключение составляют такие слова как: ishtirok (участие),

idrok (разум), peshtoq (фасад), ishtiyoq (страсть).

Иногда во множественном числе в 1 - 2 лицах аффикспринадлежности может быть пропущен. В этом случае обьязательноупотребляют соответствующие личные местоимения: bizning ko`cha,sizning maktab.

Склонение имен существительных

Склонение - это изменение слова в падежах.

В узбекском языке 6 падежей:

Таблица - 1.2 Падежи в узбекском языке

Падеж

1

Bosh kelishik (Hачальный падеж)

2

Qaratqich kelishigi (Притяжательный падеж)

3

Tushum kelishigi (Винительный падеж)

4

Jo`nalish kelishigi (Направительный падеж)

5

O`rin-payt kelishigi (Местно-временной падеж)

6

Chiqish kelishigi (Исходный падеж)

Bosh kelishik является начальной формой имен существительных.

Слова в этом падеже отвечают на вопросы kim? (кто?), nima? (что?).

Этот падеж не имеет специального окончания: mo`jiza (чудо), tarix (история), echim (решение) и т.д. В предложении слова в форме данного падежа могут являться:

Ega (подлежащим); O`zbekiston - serquyosh o`lka.

Kesim (сказуемым): Navro`z - yangilanish bayrami.

Aniqlovchi (определением):

Kumush qishdan, zumrad bahordan.

Qolishmaydi kuzning ziynati.

Undalma (обращением): Bahor, ketma mening bog`imdan.

Qaratqich kelishigi(Притяжательный падеж)

Qaratqich kelishigi имеет окончание -ning. Слово в этом падежеуказывает на принадлежность другого предмета, т.е. притягивает ксебе идущее за ним словo:

Karimning kitobi - книга Карима

kitob varag`i - страница книги.

Слова в этом падеже отвечают на вопросы kimning? (чей?кого?), nimaning? (чего?), qayerning? (kакого местa?).Слова в этом падеже всегда в предложении являютсяпритяжательными определениями (qaratqich aniqlovchi)

Kamolaning dadasi -- adabiyot o`qituvchisi.

Отец Камолы -- учитель литературы.

Притяжательный падеж может быть belgili (оформленный) иbelgisiz (неоформленный).В следующих случаях употребляется неоформленный

притяжательный падеж:

1. Если принадлежность нoсит общий характер:

maktab hovlisi - двор школы (школьный двор)

korxona rahbari - руководитель предприятия

maktab bozori - школьный базар и т.д.

2. При обозначании временных отношений:

Toshkent bahori - весна Тошкента

bahor tongi - утро весны (весеннее утро)

tong shamoli - утренный ветерок

3. В именах существительных абстрактных:

burch hissi - чуство долга

vijdon amri - веление совести

birdamlik tuyg`usi - чуство солидарности (единства).

4. Если слово в притяжательном падеже указывает на вид (сорт)предмета :

paxta yog`i - хлопковое масло

o`simlik yog`i - растительное масло

kungaboqar yog`i - подсолнечное масло

qo`y go`shti - баранина

mol go`shti - говядина

cho`chqa go`shti - свинина

5. Если слова в этом падеже идут подряд оформляется последний

или ни один не оформляется:

Rus va koreys filologiyasi fakultetining dekani (декан факультетарусской и корейской филологии).

Если слово в притяжательном падеже и слово, связанное с ним находятся в дистантном отношении, т.е. между ними идет другое, слово в притяжательном падеже оформляeтся объязательно:

Toshkent ko`chalari (улицы Ташкента) --Toshkentning Navoiy ko`chasi (улица Навои Ташкента).

Maktab direktori (директор школы) - maktabning sobiq direktori

(бывший директор школы).

Tushum kelishigi (Винительный падеж).

Слова в винительном падеже имеют окончание -ni, отвечают на вопросы kimni? (кого), nimani (что?), qayerni? (какого места?) и указывают лицо, предмет, на который непосредственно переходит действие: she'rni yod oldim (я выучил стихотворение), Matnni tarjima qildim (я перевел текст).

Винительный падеж также может быть оформленным и не оформленным: - kitobni o`qimoq - kitob o`qimoq Не оформленный винительный падеж употребляется в основном когда означает однородные предметы. И особо подчеркивать их нетнеобходимости:

Murotali qazib qo`ygan chuqurlarga ko`chat o`tkazardi. (Sh.Rashidov) -

Муротали сажал саженцы.

Bir kishi ariq qaziydi, ming kishi suv ichadi. (Maqol) - Один роет арык,

тысяча людей пьют из него. Слова в винительном падеже в поэзии могут иметь аффикс -n:

Har fasl o`z ishin qilsin,

Qishboy qishligin qilsin.

Слово в винительном падеже всегда в предложении является прямым дополжением.

Jo`nalish kelishigi (Направительный падеж)

Слова в направительном падеже обозначают предмет, на который направлено действие, место и время и отвечают на вопросы: kimga? (кому?), nimaga? (чему?), qayerga? (куда?), qachonga? (на какое время?). Например: O`zbek tili kitobimni kursdoshimga berdim. (Книгу по узбекскому языку я отдал своему однокурснику). Misollarni avval sinf taxtasiga, so`ng daftarga yozdim. (Примеры я написал сперва на доске, затем в тетради). Darsdan keyin kutubxonaga boramiz (После занятий пойдем в библиотеку). Kafedra yig`ilishi chorshanbaga belgilandi (Заседание кафедры назначено на среду). При прибавлении аффиксов данного падежа происходят следующие изменеия:

Если слово закончивается на звук k то аффикc этого падежа произносится и пишется в форме -kа: to`garakka (в кружок) chelakka (в ведро), tilakka (пожеланию). Если словo закaнчивается на звук g то обa звука g (и в корне и в аффиксе) произносятся и пишутся как k: barg+ga - barkka (на листок).

Если словo закaнчивается на звук q аффикс падежа пишется как -qa: o`tloq-qa (нa лужайку), qishloqqa (в ceло), buloqqa (на родник). Если слово заканчивается на звук g` то этот звук и звук g в аффиксе падежа переходят на q: tog`-ga -toqqa (в горы), bog`-ga - boqqa (в сад).

Примечание: данные орфографические правила относятся ко всем аффиксам, начинающимся на звук g, и словам заканчивающимся на звуки g, k, g`,q.

ek+gan - ekkan (посеявший);

eg+gan - eggan (согнувшийи);

og`+gan - og'gan (согнувшийся);

oq+gan - oqqan (текущий) и т.д.

Слова в этом падеже отвечающие: на вопросы kimga? nimaga?

являются косвенным дополнением; на вопрос qayerga?

обстоятельством места; на вопрос qachonga? Обстоятельствомвремени.

O`rin-payt kelishigi (Местно-временной падеж)

Данный падеж указывает на место и время совершения действия, место наxождение предмета или лица. Слова в этом падеже имеют аффикс -da и отвечают на вопросы: kimda? (у кого?, на ком?),nimada? (на чем?, в чем?), qaerda? (где?), qachon? (когда?):

Например:

Mening lug`at daftarim o`rtog`imda. (Мой словарь у моего друга). Shunaqa ko`ylakni o`qituvchimda ko`rdim. (Такую же сорочку видел на своем преподавателе). U doim trolleybusda o`qishga keladi. (Он научебу всегда приезжает на троллейбусе). U ko`ylakda tug`ilgan. (Онродился в рубашке). Bahorda dala ishlari qizib ketadi. (Весной на полях кипит работа).

Слова в этом падеже могут является в предложении косвенным дополнением (отвечая на вопросы: kimga?, nimada?), обстоятельством места (отвечая на вопрос qaerda?) и времени (отвечая на вопрос qachon?), а так же сказуемым.

Chiqish kelishigi (Исходный падеж)

Слова в исходном падеже указывают на место или время начала действия, а так же на материал из чего сделан предмет. Образуются они с помощью аффикса -dan, отвечают на вопросы kimdan? (от кого?, у кого?), nimadan? (из чего? от чего?), qaerdan?(откуда?), qachondan? (с каких пор?). Например: Uyat o`limdan qattiq (Стыд страшнее смерти). Ko`zacha toza tuproqdan yasalgan (Кувшинчик изготовлен из чистого грунта). Men bu haqda oyimdan eshitdim (Об этом я узнал от матери). Bugun biznikiga qishloqdan mehmonlar kelishdi (Сегодня к нам приехали гости из деревни).

O`qishlar dushanbadan boshlanadi (Учеба начинается с понеденьника) и т.д.

Слова в этом падеже также могут являться дополнением, обстоятельством места и времени, сказуемым. Иногда в словах, корень или основа которых заканчивается на глухие согласние, аффикс слышится как -tan, но всeгда пишется -dan. К примеру: Shu paytdan (с этого времени), uyatdan (со стыда, стыдясь) и т.д. При прибавлении аффикса -dan, а также -ga, -da к местоимениям u (oн), bu, shu, (этот), o`sha (тот) перед аффиксами прибавляется буква -n: bunga, shunga и т.д.

Существительные в узбекском языке образуются двумяспособами: прибавлением аффиксов и сложением двух и болеекорней. Наиболее часто употребляются аффиксы:

-chi: ishchi (рабочий), gilchi (цветовод), betonchi (бетонщик);

-dosh: vatandosh (соотечественник), sinfdosh (одноклассник);

-dor: chorvador (животновод), aybdor (виновник);

-lik: yaxshilik (доброта), yomonlik (зло), rostgo`ylik (правдивсть),do`stlik (дружба).

-kor: paxtakor (хлопкороб), g`allakor (хлебороб);

-zor: paxtazor (хлопково поле), olmazor (яблоневый сад), terakzor(тополиная роща);

-goh: o'yingoh (стадион), sihatgoh (сонаторий);

-chilik: paxtachilik (хлопководство), o`rmonchilik (лесоводство);

-xona: oshxona (столовая, кухна), korxona (предприятие);

-noma: taklifnoma (пригласительний билет), tabriknoma

(паздравление), tavsifnoma (характеристика);

-shunos: adabiyotshunos (литературовед), xorshunos (хоровед);

Сложные имена существительные могут образовываться

следующими сочетаниями:cуществительное+существительное:

oshqozon (желудок),ko`zoynak (очки), toshoyna (трюмо); nрилагательное+существительное: Ko`kterak, Qiziltepa, Issiqko`l, O`rtachirchiq; ислительное+существительное:

to`rtburchak (прямоугольник),To`rtko`l, Beshyog`och.

Парные имена существительные образуются от слов синонимов:

do`st - yor (друзья), или слов - антонимов: ota - ona (родители) и чаще

имеют собирательное значение.

Sifat (Имя прилагательное)

Часть речи, обозначающая признак лица или предмета называют

прилагательным. В узбекском языке они отвечают на вопросы

qanday? qanaqa? (какой?), qaysi? (который?).

Прилагательные в узбекском языке делят на следующие разряды:

1. Xususiyat bildiruvchi. Означаюшие свойство; они означают свойство как человeка так и предметов: kamtarin (скромный), ayyor (хитрый), yuvosh (смирный), yaxshi (хороший);

2. Holat bildiruvchi. Означающие состояние: xursand (веселый, радостный), xafa (грустный), keksa (старый), sovuq (холодный), tinch (спокойный, тихий);

3. Shakl bildiruvchi. Означающие форму - вид: novcha (высокий), yassi (плоскый), gavdali (роcлый);

4. Rang- tus bildiruvchi. Означающие цвет: pushti (оранжевый), zangori (голубой);

5. Maza- ta'm bildiruvchi. Означающие вкус: shirin (сладкий), nordon (горький), achchiq (острый), sho`r (солёный).

6. Hajm - o`lchov bildiruvchi. Oзнaчающие меру- обьём: keng (широкий), tor (узкий), uzun (длинный), og`ir (тяжёлый);

7. Hid bildiruvchi Ознaчающие запах, их всего несколько: xushbo`y (приятный), badbo`y, sassiq, qo`lansa (неприятный).

Sifat yasalishi (Образование имен прилагательных)

Имена прилагательные в узбекском языке образуются двумя способами: с помощью словоoбразующих аффиксов и сложением основ.

Наиболее активними являются аффиксы:

-li: aqlli (умный), chiroyli (красивый), gulli (цветочный), qiziqarli(интересный).

-siz: savodsiz (неграмотный), suvsiz (безводный).

-chan: ishchan (деловой), uyatchan (стеснительный).

-aki: yuzaki (поверхностный), og`zaki (устный).

-ma: yozma (письменный), qovurma (жареный).

be-: beodob (невоспитанный), bebaho (бесценный).

ba-: badavlat (богатый), baodob (воспитанный).

ser-: sersuv (многоводный), serhosil (плодородный).

no-: notinch (неспокойный), noxush (непритяный).

-gin: horg`in (усталый), keskin (резкий).

-choq: erinchoq (ленивый), maqtanchoq (хвастливый).

-gir: o`tkir , olg`ir (хваткий), sezgir (чутkий).

-gi: kuzgi (осенный), bugungi (сегодняшний).

Сложные имена прилагательные образуются следующими способами:

1) прилагательное + прилагательное: оch sariq, to`q qizil;

2) прилагательное + существительное: оchko`z (жадный), ochiq ko`ngil (добрый);

3) существительное+глагол: muzyorar (ледoкол);

4) существительное +существительное: havo rang (голубой), sheryurak (храбрый), toshyurak (жестокий);

5) наречие + существительное: hozirjavob (быстрый), kamgap

(молчаливый).

Olmosh (Местоимение)

Слова, употребляемые вместо существительных прилагательных, числительных и иногда нaречий называют местоимениями. В узбекском языке 7 разрядов местоименний: таблица №1.3

Местоимения так же классифицируют по тому, вместо каких частей речи они употребляются. Например, личные местоимения употребляются вместо существительных, указательные вместо прилагательных и соответственно имеют те же грамматические свойства, что и слова, вместо которых они употребляются. Личные местоимения склоняются по падежам, а указательные могут субстантивироваться и т.д.

Таблица - 1.3 Разряды местоимений

Разряд местоименния

1

Kishilik olmoshlari

2

O`zlik olmoshlari

3

Ko`rsatish olmoshlari

4

So`roq olmoshlari

5

Jamlash olmoshlari

6

Bo`lishsizlik olmoshlari

7

Gumon olmoshlari

Fe'l (Глагол)

Слова, обозначающие действие или состояние, называются глаголом. Начальной формой глагола в узбекском языке является harakat nomi - имя действия с аффиксом -moq . Все глаголы в словарях даются в этой форме. Глагол в узбекском языке не имеет категорию вида и все глаголы отвечают на вопрос nima qilmoq? (что делать? Что сделать?). Глаголы бывают o`timli (переходными) и o`timsiz (непреходными). Переходные глаголы означают действие непосредственно переходящие на другой предмет и сочетаются со словами в форме tushum kelishigi (винительный падеж).

Fe'l yasalishi (Образoвание глаголов)

Глаголы образуются с помошью специальных аффиксов, а так же сложеним двух или более основ.

Наиболее употребительны аффиксы:

-la: ishla, o`yla, oqla, moyla va boshqalar:

-a: sana, ata, yasha, bo'sha;

-(a)y: qoray, sog`ay, toray.;

-(a)r: ko`kar, qisqar, eskir;

-i: chang`I, tinchi, boyi;

-illa: g`izilla, chirilla;

-lan: otlan, lazzatlan;

-lash: maslahatlash, suhbatlash;

-sira: suvsira, uyqusira.

Этим способом глаголы образуются лишь из других частейречи.

Ravish (Наречие)

Наречие - часть речи, обозначающая признак действия, качества, реже предмета. В узбекском языке наречия делятся:

1. Holat (tarz) ravishlari - наречия образа действия

2. Payt ravishlari - наречия времени

3. O`rin ravishlari - наречия места

4. Maqsad ravishlari - наречия цели

5. Daraja-miqdor ravishlari - наречия меры и степени

6. Sabab ravishlari - наречия причины

Наречия образа действия отвечают на вопросы qanday? - как?, qanday qilib, qay tarzda? - каким образом? и указывают на способ совершения действия. К ним относятся: jim (спокойно), to`satdan (вдруг), tez (быстро), sekin (медленно), yayov (пешком), ketma-ket (вслед), astoydil (от души) и.т.д.

Наречие времени отвечают на вопросы: qachon? - когда?

qachongacha - до каких пор? qachondan (beri) - с каких пор?

Обозначают время совершения действия: bugun (сегодня), indinga (послезавтра), o`tgan yili (в прошлом году), oyda-yilda (изредка), kechasi (ночью) и.т.д. Наречия места отвечают на вопросы: qayerda? - где?, qayerga? куда?, qayerdan? - откуда?, qayergacha? - до куда? Обозначают место совершения действия: oldinda (впереди), olisda (в дaли), olisdan (издaли), yuqoriga (вверх) и т.д. Наречия цели ограничены в количестве: ataylab, jo`rttaga, atay, atayin (нарочно, специально). Так же ограничены в количестве наречия причины: noiloj, ilojsizlikdan, chorasiz, chorasizlikdan (находясь в безвыходном положении). Наречия меры могут указывать как на количество действия, так и на количество предмета: ko`p (много), kam (мало), ancha (много), jindak (мало) и.т.д. Наречия степени указывают на степень как действия, так и признака: eng (самый), juda (очень), a'lo (отлично), zo`r (прекрасно) и.т.д.

Ravishlarning yasalishi(Образование наречий)

Наиболее активны следующие аффиксы, образующие наречия:

-cha: yaxshilikcha (по-хорошему), o`zbekcha (по узбекски);

-larcha: bolalarcha (по-детски), mardlarcha (мужественно);

-chasiga: dehqonchasiga (по дехкански), yigitchasiga (по

мужески);

-siga: tikkasiga (по вертикали), ko`tarasiga (оптом);

-ona: qahramonona (героически), do`stona (дружески);

-lab: oylab (месяцами), yillab (годами);

-an: majburan (насильно), tasodifan (случайно);

-siz: to`xtovsiz (беспрерывно), tinimsiz (неустанно).

В образовании сложных наречий активно участвуют слова har, hech, bir: har qachon (всегда), har vaqt (всегда), hech mahal (никогда), biroz (немного), bir yo`la (сразу) и т.д.

1.2 Образование слов

Морфема - значимая часть слова. Различают корневую иаффиксальную морфему.O`zak. Корень слова выражает основное лексическое значениеслова и не имеет в своем составе других морфем. В отличии отрусского, в узбекском языке корень может употреблятьсясамостоятельно во всех случаях.

Qo`shimcha. Аффиксы выполняют различные функции: so`zyasash - словообразующую и shakl yasash формообразующую.Словообразующие аффиксы меняют лексическое значениеслова:

Gul - (цветок).

Gul-chi - (цветовод).

Gul-la - (цвети).

Gul-don - (ваза для цветов).

Формообразующие аффиксы меняют лишь форму слова:

Gul - (единственное число, именительный падеж).

Gul-lar - (множественное число, именительный).

В узбекском языке аффиксы обычно к корню прибавляются в следующем порядке: сначaла словообразующие,затем формообразующие:

gul-chi-lar-imiz

Иногда формообразующие аффиксы прибавляются передсловообразующими:

o`qi-t-uv-chi.

Аффиксы в узбекском языке могут быт простые и сложные.

gul-chi-lik, o`zbek-chilik.

so`z-la-sh (moq) ot-lash (moq).

Суффиксальное словообразование имен существительных занимает неисключительное место, количество суффиксов, при помощи которых образуются новые слова, в нем значительно меньше, чем в русском языке, и потому функции одного и того же словообразующего суффикса в узбекском языке иногда бывают несколько шире, чем в русском языке. Так, например суффикс - лик в узбекском языке может употребляться для следующих целей.

а) Для образования существительных, обозначающих положение или отношения лиц. Например: оталик - отцовство, болалик - детство.

б) Для образования существительных, обозначающих отвлеченные понятия, например: тозалик - чистота, ёл?излик - одиночество, тезлик - скорость и т.д.

в) Для образования существительных с другими значениями (беш йиллик, пятилетка, шанбалик - субботник, Тошкентлик - из Ташкента и т.д.)

Отличительной чертой русского словообразования существительных является то, что здесь для выражения одного и того же значения часто употребляется несколько словообразующих суффиксов. Так, для образования названия лица (по роду его деятельности профессии) применяются суффиксы - тель, - щик, - чик, - ник, - ист значения которых в узбекском языке передаются обычно одним суффиксом - чи. Например:

Писатель - ёзувчи

Летчик - учувчи

Колхозник - колхозчи

Тракторист - тракторчи

Рыбак - бали?чи

Моряк - денгизчи и т.д.

Вместе с тем надо отметить, что и в русском языке тоже имеют место случаи, когда один и тот же словообразующий суффикс имен существительных может употребляться в разных значениях.

Приведем примеры:

1. Суффикс - ник выражает следующие значения

А) Имена лиц муж. пола (колхозник, мясник).

Б) Названия предметов (чайник, приемник).

В) Названия растений (подснежник, подорожник, ельник).

Префиксальный способ словообразования - это образование новых слов присоединением к производящему слову приставок: группа- подгруппа, ехать - уехать, бе-бош, но-ўрин, бе-?ам.

Префиксально - суффиксальный способ словообразования это образование новых слов присоединением к производящей основе одновременно приставки и суффикса. Например: беззаботный, ?амдардлик, бесўро?. Сложение - это способ словообразования новых слов соединением двух или более основ или слов. В зависимости от того, что объединяется при образовании новой лексической единицы, различают основосложение и словосложения.

При словосложении образуются составные слова как в русском, так и в узбекском языке. Например: диван - кровать, вагон - ресторан, ?авм - карндаш, ози?-ов?ат.

При основосложении образуются сложные слитные слова. В русском языке такие как снегопад, головокружение и т.д. а в узбекском языке тоже имеются такие слова как тошба?а, отбо?ар, то??айчи и другие(toshbaqa, otboqar, tokqaychi). В словарном составе узбекского языка возникли слова, заимствованные из русского языка,слова образованные способом аббревации. Например: медпункт,филфак и другие.

Безаффиксальный способ словообразования действует среди имен существительных записать - запись, зеленый - зелень:

Югурмо? - югуриш,yugurmoq - yugurish

Кроме этих в русском языке нередко употребляются такие способы, как изменение места ударения и чередования гласных и согласных, которых почти нет в узбекском языке.

Друг - дружба, свет - свеча

Москва - Москвич .

Морфология, части речи, самостоятельные части речи, служебные части речи, классификация слов, морфологические и синтаксические свойства частей речи, предлоги, послеслоги.

По своим грамматическим свойствам все слова русского и узбекского языков распределяются по классам, которые называются частями речи. Однако в русском языке осуществление распределения слов по частям речи происходит гораздо проще, чем в узбекском языке. В русском языке распределение слов по частям речи осуществляется с учетом их категориального значения, морфологических признаков, синтаксических свойств и словообразовательных особенностей.

Под категориальным (классифицирующим) значением приняты понимать общее значение слов каждой части речи. Например: у имен существительных это значение предметности, у прилагательных - признака: в узбекском языке, отлар - предметнинг номини, сифатлар - белгисини ва бош?алар.Эти значения отличают слова одной части от другой, поэтому они используются для распределения слов по частям речи.

К морфологическим признакам, используемым при классификации слов на части речи относятся: 1) изменяемость (неизменяемость слов, тип и особенности изменения их склонения) 2) набор грамматических категорий слов и их специфика.Как известно, русский язык относится к языкам флективного типа, где морфологические признаки (флексии - окончание) являются важным критерием при классификации слов.

В узбекском же языке отсутствует флексия, поскольку он относится к языкам агглютинативного типа (некоторые показатели слов (суффикс) в нем могут служить основанием для классификации их по частям речи).

К синтаксическим свойствам частей речи относится

1) способы синтаксической связи их с другими словами

2) синтаксические функции.

Различные части речи обладают разными способами синтаксической связи с другими словами. Так, иногда не сочетаются между собой причастие и прилагательное, приложение и глагол, предлог и наречие, приложение и глагол.У слов каждой части речи есть свои типичные синтаксические функции. В узбекском языкознании вопрос о частях речи остается одной из нерешенных, спорных проблем.

При классификации слов по частям речи учитываются главным образом лексико - семантическое значение слов, словообразовательные морфемы и синтаксические свойства слов (функции) в словосочетаниях и предложениях.В грамматике современного узбекского языка выделяются двенадцать частей речи. В связи с тем, что слова албатта, балки и так далее выделены в особую группу модельных слов.

В остальном классификация частей речи в узбекском языке целиком и полностью копирует русскую классификацию.В узбекском языке проблема классификации слов по частям речи гораздо сложнее, чем в русском. Есть такие слова так называемые слова - ононимы, в исходной формекоторых отсутствует внешние морфологические показатели, поэтому трудно установить, к какой части речи они относятся. Например: yoz - существительное (ёз келди - настало лето), ёз глагол (хат ёз - пиши письмо, гиламни ёз - расстели ковер). Ўт (огонь) - существительное (ўт ёнаяпти - огонь горит), ўт (трава) - существительное (ўт ўсаяпти - трава растет), ўт (желчь) существительное (ўт ёрилди - разлила желчь), ўт (проходи) - глагол (бу ердан ўт - проходи здесь).

В словах tom, oq, qizil, yashil, yomon, temir, yer и других нет морфологических признаков как в русском языке: камень железо, белый, красный, хороший, плохой, земля.Таким образом, в узбекском языке отношение какого - либо слова к той или иной части речи по внешним признакам определить невозможно.

Для узбекского языка по сравнению с русским характерны:

1) более задняя артикуляционная база образования звуков.

2) произношение гласных и согласных при более низком подъеме.

Сопоставив эти формы ОТАМ (мой отец) и ОТАНГ (твой отец) выделяем общую лексическую единицу ОТА и элементы - М и НГ, которые уточняют грамматическую форму слова ОТА и являются в данном случае разными фонемами. Так, в русском языке твердые и мягкие парные согласные являются разными самостоятельными фонемами (за исключением некоторых спорных вопросов), потому что только противопоставлением твердых и мягких согласных могут различаться слова формы слов:

В узбекском языке тоже гласных фонем 6 а именно:

(а), (о), (э), (и), (у), (у). Различие между русскими и узбекскими гласными фонемами можно увидеть в следующей таблице.

Таблица - 1.4 Различие между русскими и узбекскими гласными фонемами

Ряд подъем

Передний

Средний

Задний

Верхний

(й), (и)

(ы)

(у), (у)

Средний

(э), (э)

(о), (у)

Нижний

(а)

(а)

(о)

Не лабиализованные

лабиализованные

Гласные фонемы (и), (й).

Фонема (и) в узбекском языке часто встречается после согласных. После глубокозаднеязычных фонем (i) произносится в роде простого (ы)

Например:

?ир? - (и), ?ишт-(и), о?ир-(и).

Таким образом, выделение и классификация фонем производится в первую очередь по функциональному принципу с точки зрения функций звуков в речи и в языке.

Артикуляционные и акустические признаки звуков учитываются при этом во вторую очередь. Изучение звуков в речи в функциональном аспекте называется- фонологией. Функция звуков-различать материальную оболочку слов, в следствии этого вести к различению лексического и грамматического значения слов, словоформ.

С другой стороны, если какие-то звуки не способствуют различению смысла слов, то они относятся не к разным фонемам, а к одной и той же фонеме или её разновидности.Например: фонема литературного узбекского языка в зависимости от соседних звуков в произношении имеет различные оттенки, которые однако не служат препятствием для взаимного понимания говорящих на данном языке. Произношение этого звука и всловах qil(?ил) -делай, g`isht(?ишт) - кирпич, xilmaxil (хилмахил)- разнообразный отличается произношением его в словах ишлади, билди. И не смотря на это, мы говорим об одной фонеме и в литературном узбекском языке, оттенки произношения её рассматриваем как в языке, так в комбинаторно-позиционном варианте.

Гласные и согласные фонемы отличаются друг от друга акустическими и артикуляционными признаками. Гласные звуки характеризуются звучностью, которые образуются вибрацией голосовых связок и отсутствием смычки органов речи в полости рта, ввиду, чего воздушная струя свободно проходит через канал.

Согласные звуки характеризуются меньшей степенью звучности.

В конце некоторых имен прилагательных арабского происхождения встречается долгий гласный (и):

На письме он обозначается двумя буквами ИЙ:

siyosiy - сиёсий - (i) и

markaziy - марказий - (й) y

Гласные фонемы (э), (э). (e)

Русская гласная (э) произносится более четко под ударением а именно: (э) - ЭХ, ЭТО, ЭРА, ЭПОС (в начале слова).(э) - шест, (хода, узун таё?), тест (в середине слова после твердых согласных).Для артикуляции гласного (э) кончик языка нужно опустить к нижним губам, после мягких согласных (э) произносится более узко, т.е. язык поднимается выше, а полость рта суживается, ?ИЙ?ОС (ы), ?ИР?ИЗ (ы). Нелегко усваивается узбекскими школьниками звук (ы), нужно объяснить им не только артикуляционное, и проиллюстрировать это в контрастных упражнениях, типа: был-бил, мыло-мило.

1. В узбекском языке 25 согласных фонем.

Узбекские согласные произносятся твердо, хотя иногда перед гласными (э), (и) могут значительно смягчиться. Мягкие согласные представляют для узбекских школьников трудность.

2. Трудны для учащихся узбеков и такие твердые фонемы, как (х), (т), (ц) отсутствующие в исконно узбекских словах.Узбекский (ж) - мягкий.

3. Узбекский согласный (г) и (к) мягче, чем русский (и) и (г).

4. Узбекский согласных (?), (?), (?) в русском языке нет. (q), (`g), (h)

5. Узбекский дифтонг (нг) является заднеязычным носовым звуком, сонорным. В русском языке отсутствует.

например:

кенг - широкий, энг - самый, тонг - рассвет и др.

6. Узбекское (в) произносится преимущественно губами, без участия зубов. В русском же языке при произношении звука нижняя губа прикасается к зубам.

например:

вой! - эй!, ва и (союз), вайрон - разрушение, виждон - совесть.

Не чуждо литературному узбекскому языку и губно-зубное произношение (в), особенно в русских словах и вышедших через русский язык.В узбекском языке изменение ударения в слове не влечет за собою искажения, в словах выражает лишь эмоциональные оттенки, не изменяет лексические, грамматические значения слов.

В узбекском языке как и в русском языке имеются все виды аффиксального словообразования, а также словосложение, но суффиксальное словообразование является преобладающим, что касается префиксального и префиксально-суффиксального способов занимают незначительное место.

Суффиксальный способ словообразования - это образование новых слов присоединением к производящей основе суффиксов. Например: глаз - глазное, суббота - субботник, шанба - шанбалик, Москва - Москвалик.

В узбекском языке суффиксальное словообразование имен существительных занимает неисключительное место, количество суффиксов, при помощи которых образуются новые слова, в нем значительно меньше, чем в русском языке, и потому функции одного и того же словообразующего суффикса в узбекском языке иногда бывают несколько шире, чем в русском языке. Так, например суффикс - лик в узбекском языке может употребляться для следующих целей.

а) Для образования существительных, обозначающих положение или отношения лиц. Например: оталик - отцовство, болалик - детство.

б) Для образования существительных, обозначающих отвлеченные понятия, например: тозалик - чистота, ёл?излик - одиночество, тезлик - скорость и т.д.

в) Для образования существительных с другими значениями (беш йиллик-пятилетка, шанбалик - субботник, Тошкентлик - из Ташкента и т.д.). Отличительной чертой русского словообразования существительных является то, что здесь для выражения одного и того же значения часто употребляется несколько словообразующих суффиксов. Так, для образования названия лица (по роду его деятельности профессии) применяются суффиксы - тель, - щик, - чик, - ник, - ист значения которых в узбекском языке передаются обычно одним суффиксом - чи. Например:

Писатель - ёзувчи

Летчик - учувчи

Колхозник - колхозчи

Тракторист - тракторчи

Рыбак - бали?чи

Моряк - денгизчи и т.д.

Вместе с тем надо отметить, что и в русском языке тоже имеют место случаи, когда один и тот же словообразующий суффикс имен существительных может употребляться в разных значениях.

Приведем примеры:

1. Суффиксе - ник выражает следующие значения

А) Имена лиц муж. пола (колхозник, мясник).

Б) Названия предметов (чайник, приемник).

В) Названия растений (подснежник, подорожник, ельник).

Префиксальный способ словообразования - это образование новых слов присоединением к производящему слову приставок: группа- подгруппа, ехать - уехать, бе-бош, но-ўрин, бе-?ам.

Префиксально - суффиксальный способ словообразования это образование новых слов присоединением к производящей основе одновременно приставки и суффикса. Например: беззаботный, ?амдардлик, бесўро?. Сложение - это способ словообразования новых слов соединением двух или более основ или слов. В зависимости от того, что объединяется при образовании новой лексической единицы, различают основосложение и словосложения.

При словосложении образуются составные слова как в русском, так и в узбекском языке. Например: диван - кровать, вагон - ресторан, ?авм - ?ариндош, ози?-ов?ат.

При основосложении образуются сложные слитные слова. В русском языке такие как снегопад, головокружение и т.д. а в узбекском языке тоже имеются такие слова как тошба?а, отбо?ар, то??айчи и другие(toshbaqa, otboqar, tokqaychi). В словарном составе узбекского языка возникли слова, заимствованные из русского языка,слова образованные способом аббревации. Например: медпункт,филфак и другие.

Безаффиксальный способ словообразования действует среди имен существительных записать - запись, зеленый - зелень:

Югурмо? - югуриш,yugurmoq - yugurish

Кроме этих в русском языке нередко употребляются такие способы, как изменение места ударения и чередования гласных и согласных, которых почти нет в узбекском языке.

Друг - дружба, свет - свеча

Москва - Москвич.

В узбекском языке нaиболее эффективно используютсяследующие способы словообразавания:

Qo`shimcha qo`shib so`z yasash - аффиксация;

O`zaklarni qo`shib so`z yasash - композиция.

В узбекском языке можно образовывать именасуществительные, прилагательные, глагол и наречие. Другиечасти речи могут служить основой для словообразования, но самиони не образуются.

Аффиксaция gul-don (ваза), tog`-li (горный), bel-lash(moq) (состязаться), qo`lla (используй)

Композицияguldasta (букет), tog`olcha (алыча), belkurak (лопата), qo`l qo`ymoq(подписать).

1.3 Общее описание морфологического анализа слова

Морфология (от греч. morphe - форма, logos - учение) - это раздел науки о языке, рассматривающий грамматические формы и грамматические значения частей речи.Морфология рассматривает отдельные слова, но, в отличие от лексикологии, исследующей лексические значения слов, морфология изучает грамматические свойства слов.Поскольку задачей морфологического разбора является описание морфологической формы слова и её синтаксической роли в предложении, то морфологическому разбору не подвергаются изолированно взятые слова: для анализа предлагаются слова в контексте предложения. Рассмотрев такое слово, нужно определить, к какой части речи оно относится и восстановить начальную (словарную) форму слова. Далее называются морфологические признаки: сначала - постоянные, неизменяемые, потом - непостоянные, изменяемые. Затем определяется, каким членом предложения является слово, т.е. определяется его синтаксическая роль в предложении. Поскольку морфологические признаки у слов разных частей речи разные, то схемы разбора и списки признаков у них различны. Это и понятно: глагол не похож на числительное, местоимение - на предлог, существительное - на союз и т.д.

1.4 Специализированный корпус

Корпус -- это информационно - справочная система, основанная на собрании текстов на некотором языке в электронной форме. Специализированный корпус содержат тексты определенного типа при создании такого корпуса текста производится лингвистическое аннотирование (морфологическое, синтаксическое), не зависящее от ПО и осуществляемое автоматически и/или вручную.. Применяется два вида аннотирования: терминологическая разметка которая фиксирует присутствие в тексте понятий ПО, разметка отношений(в частности ситуационная разметка). Разметка -- главная характеристика корпуса; она отличает корпус от простых коллекций (или «библиотек») текстов, в изобилии представленных в современном интернете. От степени разнообразия разметка, зависит научная и учебная ценность корпуса. Размеченные фрагменты текста используются для наполнения предметного словаря.

Отмеченная лексика обрабатывается морфологическим и синтаксическим компонентами 11 словарной технологии, нормализуется, вносится в словарь и снабжается семантическими признаками в соответствии с разметкой. Ситуационная разметка планируется использовать для анализа контекстов предикатных лексем с целью автоматизированного наполнения словаря семантико -синтаксических шаблонов [6]. Раньше исследователь мог лишь просматривать тексты и вручную выписывать из них нужные примеры; эта предварительная (но абсолютно неизбежная) деятельность была очень трудоемкой и не позволяла обрабатывать большие массивы материала. Теперь ограничений на объем анализируемого материала и скорость поиска информации в нем по существу нет, а это означает, что в распоряжении исследователя оказываются колоссальные массивы текстов самого разного типа. Это не замедлило сказаться на развитии наших знаний о языке: возможность массовой -- в том числе статистической -- обработки текстов, недоступная прежде, позволила обнаружить в структуре и развитии языка такие закономерности, о существовании которых наука раньше или не подозревала, или лишь смутно догадывалась, но не могла строго обосновать. Теперь подлинно научные описания грамматического строя языков, а также авторитетные академические словари -- практически все без исключений -- должны составляться на основе корпусов этих языков. Учет корпусных данных оказывается крайне желательным (если не строго обязательным) и при многих других более специальных научных исследованиях [7]. Слово состоит из корня слова (болалар) и аффикса.

...

Подобные документы

  • Анализ предметной области "Ремонт часов", с использованием СУБД MySQL, языка HTML, технологии PHP и ADO и выбора скриптовых языков VBScript или JavaScript. Нормализация базы данных. Пошаговое описание нормализации базы данных (методом ER-диаграмм).

    курсовая работа [782,4 K], добавлен 18.06.2010

  • Проблемы внедрения информационных технологий. Автоматизация работы пользователя. Основные этапы проектирования базы данных. Функционирование предметной области. Специализированные языки обработки данных. Обоснование выбора основных технических средств.

    курсовая работа [61,9 K], добавлен 08.02.2012

  • Главные составные части среды программирования. Требование к надежности, к составу и параметрам технических средств. Табличные базы данных. Выбор и обоснование выбора системы управления базами данных. Высокопроизводительный компилятор в машинный код.

    курсовая работа [793,5 K], добавлен 31.01.2016

  • Функции автоматического рабочего места инженера АТС, структура соответствующей базы данных и обоснование выбора языка программирования. Разработка алгоритмического обеспечения. Программная реализация, основное содержание и принципы работы с таблицами.

    дипломная работа [449,8 K], добавлен 06.01.2014

  • Исследование технологии проектирования базы данных. Локальные и удаленные базы данных. Архитектуры и типы сетей. Программная разработка информационной структуры предметной области. Обоснование выбора архитектуры "клиент-сервер" и операционной системы.

    дипломная работа [1,1 M], добавлен 15.02.2017

  • Осуществление анализа предметной области и определение модели базы данных. Реализация базы данных в среде Microsoft Access. Создание и исследование формы ввода информации, запросов с условиями выбора, диаграмм по результатам вычислений и отчетов.

    курсовая работа [246,1 K], добавлен 19.10.2013

  • Анализ предметной области с использованием моделей методологии ARIS и разработка ER-диаграммы. Описание входной и выходной информации для проектирования реляционной базы данных. Разработка управляющих запросов и связей между ними с помощью языка SQL.

    курсовая работа [975,2 K], добавлен 30.01.2014

  • Анализ предметной области объекта автоматизации "Компьютерные курсы". Обзор информационных технологий, подходящих для разработки информационной системы. Требования к разрабатываемой базе данных и ее проектирование, особенности ее программной реализации.

    курсовая работа [369,8 K], добавлен 30.05.2013

  • Разработка словаря, содержащего термины по патентоведению, в виде базы данных. Систематизация данных путем разделения текста на отдельные файлы по буквам алфавита. Создание файла "Содержание" с гиперссылками для обеспечения быстрого доступа к информации.

    презентация [278,1 K], добавлен 16.10.2013

  • Общая характеристика киноиндустрии как предметной области работы. Разработка базы данных и дерева вопросов для получения информации для выбора фильма. Программная реализация экспертной системы. Тестирование системы и создание руководства пользователя.

    курсовая работа [1,9 M], добавлен 19.05.2014

  • Создание программного обеспечения, организующего базу данных тренажёрного зала. Описание предметной области; предикаты языка Пролог для работы с БД: ввод/вывод, управление окнами. Разработка структуры базы данных, интерфейс; содержание файла "Zal.ddb".

    курсовая работа [821,6 K], добавлен 07.06.2013

  • Анализ предметной области - магазин "Канцелярские товары". Проектирование и реализация базы данных в MS SQL Server. Перечень хранимой информации: таблицы, поля, типы. Моделирование предметной области. Выделение сущностей, атрибутов, ключей, связей.

    курсовая работа [2,2 M], добавлен 05.02.2015

  • Обзор программных средств разработки приложений и обоснование выбора языка программирования. Классификация приложений для работы с базами данных. Функциональная структура базы данных с указанием назначения программных модулей, руководство пользователя.

    дипломная работа [645,3 K], добавлен 21.11.2010

  • Анализ предметной области, этапы проектирования автоматизированных информационных систем. Инструментальные системы разработки программного обеспечения. Роль CASE-средств в проектировании информационной модели. Логическая модель проектируемой базы данных.

    курсовая работа [410,6 K], добавлен 21.03.2011

  • База данных как поименованная совокупность структурированных данных, относящихся к определенной предметной области. Ее типы и структура, особенности архитектуры. Функциональные особенности языка структурированных запросов (SQL). Разработка базы данных.

    курсовая работа [639,8 K], добавлен 14.12.2022

  • Разновидности систем управления базами данных. Анализ предметной области. Разработка структуры и ведение базы данных. Структурированный язык запросов SQL. Организация выбора информации из базы данных. Общие принципы проектирования экранных форм, макросов.

    курсовая работа [3,1 M], добавлен 26.02.2016

  • Системный анализ предметной области. Требования к программе и программному изделию, к функциональным характеристикам, к надежности, составу и параметрам технических средств. Обоснование выбора средств выбора для хранения и обработки базы данных.

    реферат [403,8 K], добавлен 02.02.2014

  • Базы данных - важнейшая составная часть информационных систем. Проектирование базы данных на примере предметной области "Оргтехника". Сбор информации о предметной области. Построение информационно-логической модели данных. Разработка логической структуры.

    курсовая работа [318,6 K], добавлен 24.12.2014

  • Нормализация предметной области "Сайт знакомств" и ее программная реализация с использованием СУБД MySQL, языка HTML, технологии PHP и ADO, скриптовых языков VBScript или JavaScript. Руководство программиста, тестирование, исходный текст приложения.

    реферат [29,0 K], добавлен 09.09.2010

  • Определение автоматизированных информационных систем. Обоснование выбора среды разработки информационной системы. Создание запросов для выбора информации. Логическая и физическая структура реляционной базы данных. Разработка интерфейса пользователя.

    курсовая работа [2,1 M], добавлен 16.04.2017

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.