Зняття морфологічної омонімії

Огляд проблеми багатозначності англійської мови. Етапи синтаксичного аналізу систем автоматичної обробки текстів. Аналіз методів контекстного аналізу обробки морфологічної омонімії. Обґрунтування вибору мови і середовища програмування. Охорона праці.

Рубрика Программирование, компьютеры и кибернетика
Вид курсовая работа
Язык украинский
Дата добавления 29.05.2014
Размер файла 432,7 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

ЗМІСТ

  • ВСТУП
  • 1. АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ І ПОСТАНОВКА ЗАВДАННЯ
    • 1.1 Огляд проблеми багатозначності англійської мови
      • 1.1.1 Багатозначні слова в англійській мові
    • 1.2 Огляд морфологічного та синтаксичного аналізу тексту
      • 1.2.1 Автоматичний синтаксичний аналіз тексту
      • 1.2.2 Автоматичний морфологічний аналіз тексту
    • 1.3 Этапи синтаксичного аналізу систем автоматичної обробки текстів природньої мови
  • 2. АНАЛІЗ МЕТОДІВ КОНТЕКСТНОГО АНАЛІЗУ ОБРОБКИ МОРФОЛОГІЧНОЇ ОМОНІМІЇ
    • 2.1 Сутність контекстного аналізу тексту
    • 2.2 Правила контекстного аналізу, які дозволяють зняти морфологічну омонімію
      • 2.2.1 Правила контекстного аналізу іменників
      • 2.2.2 Правила контекстного аналізу прикметників
      • 2.2.3 Правила контекстного аналізу дієслів
    • 2.3 Існуючі методи та алгоритми рішення задачі зняття морфологічної омонімії
      • 2.3.2 Метод контекстного вирішення функціональної омонімії: словникові ресурси
  • 3. ПРОГРАМНА РЕАЛІЗАЦІЯ ЗАДАЧІ ЗНЯТТЯ МОРФОЛОГІЧНОЇ ОМОНІМІЇ ПЕРШОГО ПОРЯДКУ МЕТОДОМ КОНТЕКСТНОГО
    • 3.1 Обґрунтування вибору мови і середовища програмування
    • 3.2 Програмна реалізація задачі зняття морфологічної омонімії першого порядку методом контекстного аналізу
      • 3.3 Інструкція для користувача
  • 4. ОХОРОНА ПРАЦІ ТА НАВКОЛИШНЬОГО СЕРЕДОВИЩА
    • 4.1 Загальні положення охорони праці
    • 4.2 Небезпечні та шкідливі виробничі фактори
    • 4.3 Виробнича санітарія
      • 4.3.1 Мікроклімат
      • 4.3.2 Освітлення
      • 4.3.3. Іонізація повітря
      • 4.3.4. Шум та заходи для його нормалізації
      • 4.3.5. Випромінювання
    • 4.4 Електробезпека
    • 4.5 Пожежна безпека
    • 4.6 Ергономічна безпека
    • 4.7 Охорона навколишнього природного середовища
  • ВИСНОВКИ
  • СПИСОК ДЖЕРЕЛ ІНФОРМАЦІЇ
  • ДОДАТОК А ТЕКСТ ПРОГРАМНОГО КОДУ

ВСТУП

Перебуваючи в постійному русі, мова безперервно розвивається, удосконалюється, таким чином, має своє сучасне, минуле та майбутнє. Одним із важливих чинників і доказів її динамічного характеру є збагачення словника. Поява нових слів можлива в мові завдяки її внутрішній потенційній здатності до деривації, однак словотворення не завжди означає створення нової одиниці і за значенням, і за формою, але й повторну реалізацію слів.

Проблема зняття морфологічної багатозначності вирішувалась різними способами. Перші створені алгоритми були засновані на правилах. Пізніше для вирішення цього завдання були застосовані статистичні алгоритми.

Зняття омонімії корисно в багатьох додатках комп'ютерної лінгвістики, зокрема, в пошукових системах може підвищити точність обробки деяких класів запитів і або скоротити обсяг збереженої інформації.

Вся робота щодо зняття морфологічної омонімії передбачає врахування контексту, в якому вжите слово, і використання даних з зовнішніх джерел інформації. Також передбачено, що комп'ютер повинен навчитися співвідносити значення слова і саме слово в контексті, використовуючи машинне навчання або правила, які створив дослідник.

текст синтаксичний автоматичний програмування

1. АНАЛІЗ ПРЕДМЕТНОЇ ОБЛАСТІ І ПОСТАНОВКА ЗАВДАННЯ

1.1 Огляд проблеми багатозначності англійської мови

Одним із важливих чинників і доказів динамічного характеру мови єзбагачення словника. Поява нових слів можлива в мові завдяки її внутрішній потенційній здатності до деривації, однак словотворення не завжди означає створення нової одиниці і за значенням, і за формою. Дослідники говорять про таку лінгвістичну універсалію, як закон економії мовних засобів (О. Єсперсен), або закон економії мовних зусиль (А. Мартіне), який дає змогу мовцям полегшити власні мовні зусилля, підвищити ефективність передавання інформації та швидкість її оброблення шляхом добору "найбільш раціональних і коротких для цілей комунікації мовних засобів. Економія виявляється, зокрема, і в повторній реалізації словотвірної моделі.

Полісемія - це явище багатозначності слова. Мовленнєва багатозначність безпосередньо пов'язана з поліфункціональністю контексту щодо певного слова. Для розуміння тексту чи навіть окремих висловлювань дуже важливим є визначення правильного значення слів відносно контексту.

Багатозначні слова - це слова, які мають декілька значень і можуть нести різне смислове навантаження. Людська мова неоднозначна, тому багато слів можуть інтерпретуватись по-різному. Дляприкладу, розглянемодваречення:

1. I can hear bass sounds.

2. They like grilled bass.

Слово bass в двох реченнях має різні значення: низькочастотні тони і вид риби. У більшості випадків людина не думає про неоднозначності в мові, а ось комп'ютер повинна обробляти неструктуровану текстову інформацію і перетворювати її на структуровані дані, які аналізуються для визначення основного значення слова чи вислову[12].

Омоніми - це слова, що мають однакове написання, але абсолютно різне смислове значення. Омоніми в англійській мові:

1. Англійське слово “Ear”, в перекладі на російську мову, може мати значення “вухо” та “колос”.

2. Англійське слово “Fine”- має значення штраф, але в контексті може перекладатись як виразне “добре!!!”.

3. Англійське слово “Club” перекладається як “клуб”, але можливий і інший переклад цього слова - “дубина”.

1.1.1 Багатозначні слова в англійській мові

Як один з найяскравіших прикладів багатозначних слів, можна привести дієслово "make". Перше, що приходить на думку з шкільної програми по англійській мові, що це дієслово в перекладі російською мовою несе смислове навантаження слова "робити" і складного в перекладі "make" нічого не немає. Насправді ж, дієслово "make" так само перекладається, як "приписувати", "вводити", "встановлювати", "видавати звук", "готувати", "складати", "виграти", "заробляти", "стати", "бути", "рівнятись" і це ще не повний список значень цього дієслова, все залежить від того, в якому місці речення знаходиться "make", та в якому саме контексті використовується. Так само дієслово "make", дивним чином може трансформуватися в іменник "make", що характерно для багатьох слів в англійській мові. Як іменник слово "make" перекладається, як "стиль" або "характер" людини або предмету, а так само може означати "статуру". У Американській мові, яка схожа з англійською мовою лише частково, слово "make" вживається при здобутті інформації про якусь людину (установка особи) з досьє, що знаходяться в поліцейських відділеннях.

Нижче приведені приклади мофологічної омонімії іменників, дієслів і прикметників в англійській мові.

1. Butcher - мясник; забивати, різати.

2. Bypass - обхід; обходити.

3. Call - дзвінок, крик; телефонувати, кричати.

4. Comb - гребінь; розчісувати.

5. Dainty - делікотес; вишуканий.

6. Defeatist - пораженець; той, хто несе поразку.

7. Elbow - лікоть; штовхати ліктем.

8. Eldest - старший (n); старший (най)(adj).

9. Fry - смаженина; смажити.

10. Funk - страх; трясти.

11. Grace - грація; удостоювати.

12. Grave - могила; серйозний.

13. Continent- континент; стриманий.

14. Deadly - смертельный;смертельно.

15. Deal - угода; наносити, сдавати.

16. Ear - вухо; колос.

17. Early - рано; ранній.

18. Feast - свято; святкувати.

19. Glint - блиск; блиснути.

20. Park - парк;паркувати.

Нижче в таблиці 1.1 приведені приклади, в яких розглянута морфологічна омонімія іменників і дієслів в реченні в англійській мові.

Таблиця 1.1 - Приклади омонімії іменніків і дієслів

Іменник

Приклад

Дієслово

Приклад

1

2

3

4

Comb

Where is my comb?

To comb

My sister doesn't like to comb her hair.

Fry

The best dishes for me isfry.

To fry

I don't want to fry this meat

1

2

3

4

Butcher

Mr. Smith is a butcher.

To butcher

I don't know how to butcher this pork.

Park

It is the best park, I've ever seen.

To park

I need to park my car.

call

I heard somebody's call.

To call

Please, call your mother.

Нижче на таблиці 1.2 приведена таблиця, в якій розглянуто практичні приклади морфологічної омонімії іменників і прикметників в реченні в англійській мові.

Таблиця.1.2 Таблиця прикладів омонімії іменніків і прикметників

Іменник

Приклад

Прикметник

Приклад

1

2

3

4

Continent

I dream to have a trip on this continent.

continent

I've never seen such continent person.

Grave

He went to brothers grave yesterday.

grave

Her face is so grave.

Defeatist

You look like a defeatist.

defeatist

His words are defeatist.

Dainty

The caviar is a dainty.

dainty

This cake is so dainty

Eldest

Who is the eldest here?

the eldest

I am the eldest brother.

1.2 Огляд морфологічного та синтаксичного аналізу тексту

Припустимо, що весь процес аналізу під час автоматичного перекладу поділяється на два основних етапи: морфологічний аналіз та синтаксичний аналіз.

Зрозуміло, що наше знання про синтаксичну структуру речення, тобто про лексико-граматичні зв'язки слів у ньому передати ЕОМ неможливо, оскільки в алгоритми аналізу речення не можна ввести команди типу "знайди підмет", "знайди прикметник, який визначає іменник" тощо, якщо немає детальних, автоматично виконуваних правил про те, як це робити. Адже машина розуміє тільки мову команд, а не мову їхнього розв'язання. Для того, щоб ці правила створити, необхідно пізнати ті закони, які діють у процесі побудови речення[2].

Існує два підходи щодо дослідження цього процесу. Мову можна уявити у вигляді кібернетичної системи, на вході якої є сума речень, а на виході - класи мовних одиниць і правила їх сполучуваності. Або навпаки: на вході системи - породжувані цією системою речення. Ці два підходи пізнання структури мови лежать в основі побудови синтаксичних моделей (індуктивних та дедуктивних) та розробляються у методиці структурних лінгвістичних досліджень. Метод моделювання змусив переглянути існуючі синтаксичні теорії, а також точніше визначити основні поняття синтаксису, розробляти нові методи його вивчення. Заново були поставлені основні проблеми синтаксису: проблема його об'єкта, співвідношення із семантикою й морфологією; проблема слова, групи, фрази як синтаксичних одиниць, а також проблема основних понять синтаксису: відношення (зв'язку), функції, структури, формальних показників.

1.2.1 Автоматичний синтаксичний аналіз тексту

Чимало цікавих ідей, використаних для розробки автоматичного синтаксичного аналізу (АСА), висловили представники дескриптивної школи структурної лінгвістики: із суми спостережень над текстом лінгвіст здобуває первісну уяву про спосіб організації тексту й у вигляді чітких процедур - правил алгоритму - повідомляє автомату свої дії, а потім за його допомогою одержує на більшому матеріалі дані, що цікавлять дослідника[5].

У роботах з АСА прийнято два способи опису синтаксичної структури:

1. Опис за безпосередніми складниками (БС).

2. Опис за допомогою дерев залежностей, які називають деревами синтаксичного підпорядкування.

Ці два способи допомагають описати синтаксичну структуру на двох рівнях:

- - за допомогою БС описуються в явному вигляді словосполучення, але не розпізнається "хазяїн" і "слуга";

- - дерева залежностей дають можливість розрізнити характер зв'язків між словами;

Якщо в результаті роботи алгоритму АСА встановлюються зв'язки, які більш-менш відповідають інтуїтивним уявленням носіїв мови, значить синтаксична структура речення "визначена" правильно. Завдання АСА полягає у тому, щоб, використовуючи морфологічну інформацію про словоформи, одержану на попередньому морфологічному етапі, побудувати синтаксичну структуру вхідного речення. Об'єктом аналізу є речення, яке до моменту синтаксичного аналізу подається у вигляді інформаційних ланцюжків до словоформ. Виконувати синтаксичний аналіз повинен алгоритм СА, тобто інструкція, яка складається зі стандартних елементів, що здійснюють певну послідовність операцій над словоформами. Результатом аналізу є синтаксична структура речення, представлена як сукупність даних про синтаксичні зв'язки між його одиницями.

1.2.2 Автоматичний морфологічний аналіз тексту

Автоматичний морфологічний аналіз тексту (АМА) є одним із етапів роботи систем автоматичного аналізу тексту. У результаті роботи АМА кожному слововживанню приписуються значення граматичних категорій (частина мови, рід, число, відмінок, час, вид, тощо).

Морфологічний аналіз - це обробка взятих окремо словоформ. Морфологічний аналіз полягає в такому: словоформа розбивається на морфеми (за умови, якщо таке розбиття можливе) шляхом пошуку морфем у спеціальних списках, де кожній морфемі відповідає певна інформація; потім із інформацій до морфем будується загальна інформація до словоформи[11].

Правильність і повнота результатів аналізу тексту в системах обробки інформації залежить від кількох факторів:

1. Від рівня знань про мову і мовлення, тобто правильності лінгвістичної моделі, покладеної в основу АМА.

2. Від рівня формалізації цих знань у створюваній "машинній" граматиці.

"Машинна" граматика створюється у різних системах АМА по-різному, а вибір принципів «машинної» граматики зумовлений кількома факторами:система мови, система письма і друку, закономірності породження мовлення і тематика тесту.

Система мови. У мові існує обмежений набір засобів вираження граматичних значень, і залежно від морфологічного типу мови визначається і шлях АМА. Якщо у мові переважають синтетичні засоби внутрішньослівного вираження граматичних значень, тобто словозміна, то за початковий етап визначення значень граматичних морфологічних категорій обирається аналіз структури слова. Якщо ж структура слова проста і морфологічні значення виражаються аналітично, за допомогою сполучення різних слів, то аналіз слова обмежуються тільки пошуком за словником визначених завчасно його морфологічних характеристик.

Система письма і друку. АМА звичайно створюється для писемного різновиду мовлення - текстів. Різні мови користуються різними системами письма (буквеними, складовими та ін.). Крім того, важливими є також дані про те, як співвідносяться усне та писемне мовлення (наприклад, у письмовому тексті можуть пропускатися деякі голосні, вказівка на місце наголосу та висоту тону, які мають статус морфологічних значень).

Закономірності породження мовлення. Закономірності розуміються у широкому сенсі - як закономірності організації мовних одиниць, їх порядку у тексті.

Тематика тесту. Кожному тексту, як результату мовленнєвої діяльності та засобу комунікації відповідає певна система понять, що відбиває його тематичну спрямованість. Дослідження лексичного складу, морфологічних характеристик, синтаксичних структур текстів різної тематичної спрямованості виявили розбіжності у використанні лінгвістичних одиниць, що необхідно враховувати при автоматизації автоматичного аналізу.

"Байдужість" ЕОМ до змісту інформації, яка їй надається, зумовила спрощення процесу розпізнавання морфологічних характеристик словоформ за допомогою введення так званих квазіодиниць, які одержуються емпірично із звичайних мовних одиниць і аналогічно до них. Квазіодиниці вибираються при аналізі буквеної структури словоформ за формальними правилами: буквосполучення повинні відповідати морфологічному значенню. Крім квазіодиниць (квазіфлексій, квазіоснов, квазісуфіксів, і т.п.) у "машинну мову" вводяться спеціальні лексико-граматичні класи (ЛГК), у які потрапляють словоформи-омоніми (їх розмежування можливе лише у контексті). У машинному аналогові природної мови співіснують як звичайні мовні одиниці, так і особливі "машинні". Списки цих одиниць використовуються при аналізі формальної структури словоформ для розпізнавання їх морфологічних характеристик, шляхом порівняння різних частин словоформи з одиницями списків. Власне АМА починається на етапі флективного аналізу. На цьому етапі словоформам приписуються значення граматичних категорій, передбачених у словнику квазіфлексій[9].

Усі слововживання тексту насамперед поділяються на:

- словоформи;

- слова, які не вимагають аналізу за словником квазіфлексій (етап доморфологічного аналізу). Це числа, символи, формули, іноземні слова.

Словоформи-омоніми після етапу флективного аналізу одержують коди відповідних омонімічних ЛГК та їх форм, а потім аналізуються на наступному етапі контекстного аналізу. За допомогою позиційного аналізу розмежовується більшість омонімічних словоформ, отже АМА передбачає два етапи - флективний та контекстний.

1.3 Этапи синтаксичного аналізу систем автоматичної обробки текстів природньої мови

Синтаксичний розбір (розпізнавання) є початковим етапом синтаксичного аналізу. Саме при його виконанні здійснюється підтвердження того, що вхідний ланцюжок символів є програмою, а окремі підланцюжки складають синтаксично правильні конструкції у цій програмі. Слідом за розпізнаванням окремих підланцюжків здійснюється аналіз їх семантичної коректності на основі накопиченої інформації. Далі проводиться додавання нових елементів у проміжне представлення програми.

Розбір призначений для доведення того, що аналізований вхідний ланцюжок, що записаний на вхідній стрічці, належить чи не належить множині ланцюжків, породжуваних граматикою даної мови. Виконання синтаксичного розбору здійснюється розпізнавачами (автоматами). Тож мета доведення полягає в тім, щоб відповісти на запитання: чи належить аналізований ланцюжок множині правильних ланцюжків заданої мови. Відповідь "так" дається, якщо така приналежність встановлена. У супротивному випадку дається відповідь "ні". Одержання відповіді "ні" зв'язано з поняттям відмовлення. Єдине відмовлення на будь-якому рівні веде до загального відмовлення.

Щоб одержати відповідь "так" щодо всього ланцюжка, треба його одержати для кожного правила, що забезпечує розбір окремої підланцюжки. Оскільки множина правил утворять ієрархічну структуру, можливо з рекурсіями, то процес одержання загальної позитивної відповіді можна інтерпретувати як збір за певним принципом відповідей для листів, що лежать в основі дерева розбору, що дає позитивну відповідь для вузла, що містить ці листи. Далі аналізуються оброблені вузли, і вже в них отримані відповіді складаються в загальну відповідь нового вузла. І так далі до самої вершини. Так піднімається наверх інформація, що підтверджує виконання вказівки начальника організації[4].

Мета синтаксичного аналізу побудова синтаксичної структури речення вхідного тексту. Вхідними данними синтаксичного аналізу (СА) є вихідні дані морфологічного аналізу і правила синтаксису вхідної мови.

В результаті морфологічного аналізу кожної словоформи вхідної фрази прописується певний комплекс морфологічної інформації, при цьому словоформи розглядаються ізольовано, поза зв'язком з іншими словами та реченнями (часто ця інформація омонімічна). Отримані дані не відображають структурних зв'язків між елементами фрази. Разом з цим слова в реченні не можуть слідувати у довільному порядку и передавати при цьому певну думку. Кожна мова має свій власний синтаксис. Задача СА - описати цей синтаксис, тобто описати допустиму структуру фраз. На етапі синтаксичного аналізу необхідно, використовуючи морфологічну інформацію про словоформи (отриману на етапі МА) і відомості із словника, побудувати синтаксичну структуру вхідного тексту. Результатом СА є уявлення речень в категоріях синтаксису (підмет, присудок, прямий додаток та інш.).

Синтаксичний аналіз взагалі проходить три етапи:

1. Встановлення синтаксичного зв'язку між словоформами в реченні (контекстний аналіз), який проводиться на рівні словосполучень.

2. Побудова формалізованої структури синтаксичного відношення у фразі, який проводиться на рівні речення.

3. Побудова міжфразової синтаксичної структури (на рівні дискурсу).

Контекстний аналіз.Як вказувалося раніше, результатом морфологічного аналізу є приписання кожній словоформі морфологічної інформації: частина мови, рід, число, відміна і т.д. Оскільки дана інформація формується поза зв'язку словоформ у реченні, дуже часто вона є багатозначною (омонімічною). Тоді як в реченні словоформа може виконувати тільки одну функцію і утримувати тільки один набір морфологічної інформації, який відповідає цій функції. Морфологічна багатозначність може проявлятися на двух основних рівнях.

Перший рівень проявлення багатозначності - багатозначність на рівні розпізнавання частин мови.

Наприклад, в англійській мові:

1. Дієслово третьої особи однини теперішнього часу і іменник множини мають однакові форми.

Thechanges - эти изменения,

Heneverchangesanything - он никогда ничего не меняет;

2. Основна форма дієслова може співпасти з іменником і прикметником.

Hiswork- его работа,

Wework - мы работаем,

Theymustworkhard - они должны много работать;

3. Особове дієслово в минулому часі - з дієприкметником ІІ.

Have brought - принёс,

Thecreatedsystem - созданнаясистема.

В російській мові:

- Іменники на ла, ло, л - и діэслово минулого часу:

Большое село - солнце село,

Прозрачное стекло - стекло варенье;

- Іменники на -в - і дієприкметники:

Военно-полевой устав - устав трудится;

Разлив реки - разлив молоко, і т.д.

Другий рівень проявлення багатозначності - багатозначність на рівні розпізнання граматичних категорій, які відповідають одній частині мови. Цей вид багатозначності проявляється більшою частиною у флективних мовах. В російській мові:

1. Іменники-істоти однини і множини у родовому і знахідному відмінку:

Родовий відмінок (нема кого?) хлопчика (одн.), хлопчиків (множ.);

Знахідний відмінок (бачу кого?) хлопчика (одн.), хлопчиків (множ.);

2. Іменники-неістоти ч.р., одн. і мнж. в називному і знахідному відмінку:

Називний відмінок (що?) стіл (одн.), столи (мнж.),

Знахідний відмінок (бачу що?) стіл (одн.), столи (мнж.);

3. Іменники жіночого роду на -ия:

Називний відмінок (що?) лінія (одн.), лінії (мнж.),

Родовий відмінок (нема чого?)линии (одн.),

Давальний відмінок (кому?чому?) лінії (одн.),

Знахідний відмінок (бачу що?) лінії (мнж.),

Місцевий відмінок (про що?) лінії (одн.);

Для рішення любих типів омонімії взагалі, необхідні потужні мовні засоби , навіть такі як семантичні і предметні. Однак у деяких ситуаціях для зняттяморфологічноъ омонімії словоформ достатньо звернутися до їх ближчого лінійного контексту (контекстний аналіз). Для аналітичних мов вводять спеціальний блок правил, які усувають із речення, яке перекладається більшу кількість «паразитичних» омонімів. Наприклад, для правельної інтерпретації слова work(як інфінітива, а не як іменника) у разі theymustworkhardдостатньо переконатися в тому, що зліва від нього знаходиться модальне дієслово must. Наявність зліва від словоформи, яка обробляється особового займенника третьої особи однини безперечно доказує її дієслівний статус і дозволяє усунути омонімію[6].

2. АНАЛІЗ МЕТОДІВ КОНТЕКСТНОГО АНАЛІЗУ ОБРОБКИ МОРФОЛОГІЧНОЇ ОМОНІМІЇ

2.1 Сутність контекстного аналізу тексту

Результатом морфологічного аналізу є приписання кожній словоформі морфологічної інформації: частина мови, рід, число, відміна і т.д. Оскільки дана інформація формується поза зв'язку словоформ у реченні, дуже часто вона є багатозначною (омонімічною). Тоді як в реченні словоформа може виконувати тільки одну функцію і утримувати тільки один набір морфологічної інформації, який відповідає цій функції.

Морфологічна багатозначність може проявлятися на двух основних рівнях:

- перший рівень проявлення багатозначності - багатозначність на рівні розпізнавання частин мови.

- другий рівень проявлення багатозначності - багатозначність на рівні розпізнання граматичних категорій, які відповідають одній частині мови. Цей вид багатозначності проявляється більшою частиною у флективних мовах.

Контекстне зняття омонімії. Якість морфологічного аналізу можна підвищити за допомогою контекстного аналізу. Це дозволить в більшості випадків позбутися морфологічної омонімії. Модуль контекстного аналізу можна налаштовувати на довільну предметну область. Для цього необхідно навчаючій програмі модуля надати безліч текстів - документів цільової предметної області. На цій множині навчальна програма виділить найбільш характерний контекст для значущих з точки зору омонімії слів і буде використовувати його в подальшому для рішення проблеми омонімічної неоднозначності.

Контекстний аналіз, мабуть, не вирішить всіх проблем омоніміі. Наприклад, в російській мові у багатьох іменниках збігається написання в знахідному і називномувідмінках (при цьому можливий контекст лексеми практично не змінюється); те саме стосується власних назв. Але існує багато випадків, коли контекстний аналіз відсіює нерелевантні омоніми.Зарубіжні аналоги показують високу точність роботи морфологічних процесорів при використанні технології, основаній на прихованих Марковських моделях і правилах спеціального виду. Існують реалізації як для супервізорного навчання, так і для навчання «без вчителя».

Представлення контексту. Текст - це неструктуроване джерело інформації, тому для зручності використання його, якправило, перетворюють на структурований формат.

Для цього попередньо обробляють вхіднийтекст, що передбачає такі етапи:

- токенізація - поділ тексту на токени (зазвичай слова);

- морфологічний аналіз - визначення частин мови (наприклад, “the/DTbar/NNwas/VBDcrowded/JJ”, де DT, NN, VBD, JJ позначають артикль, іменник, дієслово та прикметник);

- лематизація - визначення початкової морфологічної основи слова (наприклад, was > be,bars > bar);

- чанкінг - поділ тексту на синтаксичні частини (наприклад, поділ [thebarwascrowded] на[thebar]NP [wascrowded]VP , відповідно іменникову та дієслівну фрази);

- синтаксичний аналіз речень - побудова синтаксичного дерева відповідно до структуриречення[3].

Послідовність та результати попередньої обробки тексту наведено нижчена рисунку 2.1.

Рисунок. 2.1 - Послідовність та результати попередньої обробки тексту

2.2 Правила контекстного аналізу, які дозволяють зняти морфологічну омонімію

Часто частини мови в англійськіймові використовуються в комбінації зі словами, які вказують на те, що це конкретна частина мови. Слова-вказівники - це певні модифікатори, які пов'язують конкретну частину мови з навколишнім контекстом.

2.2.1 Правила контекстного аналізу іменників

Іменник - це головна частина мови, яка означає предмет у широкому сенсі. Наприклад, іменники можуть позначати речі (car, pen), живих істот (cat, human), місця (Norway, mountain, Moscow), матеріали (copper, cloth), процеси (life, laughter), стан (rest, sleep), абстрактні поняття (beauty, evil) і якості (kindness, bravery). За морфологічним складом іменники можна розділити на прості, похідні та складові.

1. Прості іменники (simplenouns) складаються з одного кореня: gnome, rock, sky.

2. Похідні іменники (derived nouns / derivatives) складаються з кореня і однієї або декількох морфем (приставок або суфіксів):friendship, richness, teacher. Для іменників характерні такі суфікси, як -ant/-ent,-dom, -er/-or/-ar,-hood,-ion,-ity,-ment,-ness,-ship.

3. Складові іменники (compound nouns) складаються принаймні з двох коренів: seaman, editor-in-chief.

Слова, що вказують на іменник в англійській мові. Часто англійські іменники використовуються в комбінації зі словами, що вказують на те, що це іменник[13]. Слова-виявники - це певні модифікатори, які пов'язують іменник з навколишнім контекстом. Наприклад, в їх число входять:

- - артиклі a / an та the, які вказують на те, що предмет вже відомий слухачу. Itisanapple;

- займенники some / any:We have some milk left.(У нас ще залишилося трохи молока.) Do you have any hobby?-(У тебе є якесь хобі?);

- займенники that, this, these, those: This painting is lovely. (Ця картина чудесна);

- присвійні займенники my, his, her, its, our, your, their: Call the Hendersons, their house is on fire!( Подзвони Хендерсон, їх будинок горить!);

- невизначені займенники much, many, little, few, each, every, either, neither: Every passer-by is staring at our car. (Кожен перехожий вирячився на нашу машину.);

- питальні займенники what, which і whose: What dish did you like most? (Яке блюдо вам сподобалося найбільше?);

- іменником у родовому відмінку: Fred's wife seems upset. (Дружина Фреда здається засмученою).

Варто відзначити, що разом з іменником може використовуватися тільки одне слово-вказівник, присутність одного виключає використання іншого. Слова-вказівники розташовуються перед відповідним їм іменником і перед його визначеннями, при їх наявності: My first car was Mini Cooper. (Моєю першою машиною був Міні Купер.) This old green house will be demolished next week. (Цей старий зелений будинок знесуть на наступному тижні).

2.2.2 Правила контекстного аналізу прикметників

Прикметник - це самостійна частина мови, яка вказує на ознаку предмета і відповідає на питання «який?», «Який?», «Чий?». Англійські прикметники, на відміну від російських, не змінюються ні за відмінком, ні за родом, ні за числом: small boy, small girl, small children (маленький хлопчик, маленька дівчинка, маленькі діти). Будова англійських прикметників. За своєю будовою англійські прикметники поділяються на прості, похідні та складні. Прості прикметники не мають у своєму складі суфіксів і приставок: green, left, happy. У складі похідних прикметників є суфікс і / або приставка: helpful, international, unreasonable. Складні прикметники складаються з двох або більше основ: red-hot, colour-blind, snow-white.

Для англійських прикметників характерні наступні суфікси:

- -able (adorable); -al (epochal); -ant (pursuant); -ary (documentary);-ed (barbed);

- -en (silken); -ful (colourful); -ible (accessible); -ic (optimistic); -ish (Scottish);

- -ive (creative); -ive (innovative); -less (lifeless); -like (lifelike); -ly (yearly);

- -ous (courageous); -y (funny). И наступні префікси:un- (unguarded); in- (incomplete); il- (illegal); im- (immoral).

За значенням англійські прикметники поділяються на два види - якісні і відносні. Якісні прикметники позначають якості предмета прямо: warm, dark, long. На відміну від відносних, вони можуть бути виражені в більшій чи меншій мірі і тому мають ступені порівняння (warmer-warmest, darker-darkest, longer-longest). Від якісних прикметників часто можна утворити відповідний абстрактне іменник (warmth, darkness). Відносні прикметники описують якості предмета через його відношення до матеріалів (wooden, leathern), місця (Eastern, Swedish), часу (daily, monthly) або зв'язку (heavenly, motherly). Вони не мають ступенів порівняння. Іноді відносні прикметники можуть виконувати роль якісних (iron will) і навпаки.

Порядок прикметників в англійській мові. Прикметники вживаються перед іменниками (бажано не більше трьох), то для того, щоб вони звучали природно, вони повинні дотримуватися певного порядку:

1. Артикль або інший визначник (a, the, his).

2. Оцінка, думка (good, bad, terrible, nice).

2. Розмір (large, little, tiny).

3. Вік (new, young, old).

4. Форма (square, round).

5. Колір (red, yellow, green).

6. Походження (French, lunar, American, eastern, Greek).

7. Матеріал (wooden, metal, cotton, paper).

8. Призначення (sleeping).

Наприклад:

1. A silly young English man (молодий дурний англієць) - артикль, оцінка, вік, походження.

2. A huge round metal bowl (величезна кругла металева чаша) - артикль, розмір, форма, матеріал.

Якщо англійські прикметники важко віднести до якої-небудь категорії, то можна використати інший спосіб визначення порядку: прикметники, які позначають більш постійна ознака, ставляться ближче до іменника: funny little children (забавні маленькі діти). Прикметники в порівняльній і вищій степені завжди стоять перед рештою прикметників: one of the oldest American towns (одне з найстаріших міст Америки)[14].

2.2.3 Правила контекстного аналізу дієслів

Дієслово - це самостійна частина мови, що позначає дію або стан предмета або особи. В англійській мові ознакою дієслова в невизначеній формі є частинка to: to sing, to draw, to exist, to stand (співати, малювати, існувати, стояти). Найчастіше саме дієслово є ключовою основою, навколо якої будується пропозицію, тому дієслова майже у всіх мовах слідують складним правилам граматики і мають велике число форм.

Структура англійських дієслів. За структурою англійські дієслова поділяються на прості, похідні, складні і складені.

1. Прості дієслова складаються тільки з одного кореня: walk, play, eat (йти, грати, є).

2. У похідних дієсловах, крім кореня, є приставка і / або суфікс: unleash, reread, replay (розв'язати, перечитати, переграти).

3. Складні дієслова складаються з двох основ: underline, whitewash.

Складові (фразові) дієслова складаються з дієслова і прислівника або прийменника: look out, stand up (видивлятися, витримувати). За значенням англійські дієслова поділяються на смислові та службові.

Смислові (самостійні) дієслова мають власним лексичним значенням, вони позначають певну дію або стан: I work at the zoo. ( Я працюю в зоопарку).

Службові дієслова не мають самостійного значення. Вони використовуються тільки для побудови складних форм дієслова або складових присудків. У складених присудків відмінюються саме службові дієслова, тобто за їх допомогою можна виразити особу, число і час: I am going, Jim is going, people were going (Я йду, Джим йде, люди йшли).

Службові англійські дієслова:

- дієслова-зв'язки, які служать для утворення складних дієслівних форм (to be, to become, to remain, to grow, to get, to turn, to look, to keep та інші);

- допоміжні дієслова, які служать для побудови складеного присудка: (to be, to do, to have, to let, shall, will та інші);

- модальні дієслова, які відображають ставлення мовця до даного дії: (can, may, must, ought, need та інші).

Основні форми англійського дієслова: інфінітив (to sing, to travel), минулий невизначений час (sang, travelled), прислівник минулого часу (дієприкметник друге) (sung, travelled). Іноді їх називають відповідно першої, другої і третьої формою англійського дієслова. Ці основні форми служать для побудови всіх інших дієслівних форм, простих і складних.

2.3 Існуючі методи та алгоритми рішення задачі зняття морфологічної омонімії

Актуальність проблеми визначається тим, що практично всі існуючі алгоритми зняття омонімії включаються до складусинтаксичного аналізу, що створює важковирішаюче протиріччя,коли для успішного зняття омонімії необхідні точні результатисинтаксичного аналізу, для отримання яких, у свою чергу, потрібно попередньо зняти омонімію[5].

2.3.1 Алгоритм прихованої Марківської моделі

Існує широко відомий імовірнісний підхід, який єалгоритмом, заснованим на використанні прихованої Марківської моделі(Hidden Markov Model (HMM) tagging). Основна ідея алгоритмуполягає в тому, щоб для кожного слова, що входить у речення,вибрати граматичний клас (тег) таким чином, щоб максимізуватифункцію:P(word|tag)*P(tag|previous n tags), деP (tag | previous n tags) - умовна ймовірність (обчислена за розміченим корпусом), появи даного тега tag, за умови, щопопередні n тегів вже визначені.P (word | tag) - умовна ймовірність (також обчислена за корпусом)появи в даному місці слова word, за умови, що це слово маєданий граматичний клас tag.Алгоритм HMM має досить високу обчислювальну складність(реалізується класичним методом динамічного програмування Витерби, подібному використовуваному при обчисленні відстаніЛевенштейна) і на практиці зазвичай застосовуються різні спрощуючі припущення, спрямовані на її зниження (наприклад, використання небільш ніж трислівних послідовностей).

Точність алгоритму HMM для англійської мови складає 96%.Застосування даної моделі для російської мови може бути складним,оскільки вимагатиме розмічених корпусів дуже великого обсягу,враховуючи багатство російського словотворення і словозміни порівняно з англійською мовою[2].

2.3.2 Метод контекстного вирішення функціональної омонімії: словникові ресурси

Спочатку метод контекстного дозволу функціональної омонімії включав кілька етапів:

1. Побудова повної класифікації типів функціональних омонімів.

2. Виділення мінімальної безлічі дозвільних контекстів для кожного типу.

Мінімальність безлічі означає, що для кожного типу функціонального омоніму слід оцінити складність розпізнавання кожної частини мови, що належить даному типу. Потім необхідно побудувати безліч дозволяючих контекстів (МРК), що мають мінімальну складність розпізнавання. У алгоритмічному запису дана вимога виражається наступним правилом: якщо для функціонального омоніма Х, що має тип Т1 або Т2, застосоване правило із МРК, то тип омоніма Х визначається застосованим правилом, інакше приписується альтернативний тип.

3. Побудова керуючої структури узагальненого правила, що забезпечує максимальну точність розпізнавання.

Подальші дослідження привели до ускладнення структури методу вирішення омонімії, до перерахованих вище основних етапів додався ряд нових, що дозволяють розпізнавати і враховувати при вирішенні омонімії більш складні синтаксичні конструкції.

Розглянемо деякі основні проблеми, що ускладнюють застосування контекстного методу. Безумовно, важливим етапом є етап 1, який вимагає побудови максимально повної класифікації омонімів та уточнення граматичних характеристик омонімів різних типів.

Ускладнена структура правил методу контекстного дозволу функціональної омонімії. Для кожного типу функціональної омонімії розробляється узагальнене правило вирішення омонімії даного типу. Узагальнене правило являє собою упорядковану сукупність правил, записаних на спеціальному формальній мові. Кожне правило усередині сукупності фіксує деякий дозволяючий контекст. Структура задає порядок застосування правил, який базується на оцінці частотності контекстів.

Дане правило застосовується до підгрупи регулярних омонімів зазначеного типу, тобто омонімів, які умовно рівночастотно є іменниками або особистими формами дієслова, при цьому правило фактично спрямоване на розпізнавання типу Vf, тобто якщо знайдені відповідні дозвільні контексти, то омонім розпізнається як Vf, інакше - як N. Однак, розпізнавання омоніма як N має два дуже частотних контекстів, тому відповідні контексти включені в структуру узагальненого правила (правила 1 і 2). Для запису контекстних правил використовується формальна мова з наступною системою позначень: X - функціональний омонім; P - прийменник; Con - моделі управління (або синтаксичні конструкції), в якихомонім X однозначно дозволяється. У записі правила може бути присутнім вираз виду (Z), яке означає можливість наявності вставних конструкцій деяких спеціальних типів. Як приклад дамо пояснення до правила 1 у складі узагальненого правила 1.

Правило 1. дозволяє розпізнати омонім X як іменник (N *), якщо в лівому контексті довжиною не більше 3 слів виявлено узгоджене за родом, числом і відмінком з X прикметник (дієприкметник або займенниковий прикметник) і немає іншого узгодженого з тими ж характеристиками іменника.

Наведена структура узагальненого правила, в цілому, є прикладом простої структури. Фактично, кожне правило в структурі даного узагальненого правила встановлює наявність або відсутність в певному чисельному інтервалі слова певних частин мови. Подальший розвиток методу пов'язаний з урахуванням контекстів складної синтаксичної природи, зокрема, з аналізом однорідних груп. Виділення однорідної групи дозволяє шукати дозволяючий елемент за межами однорідної групи; тим самим, реально збільшується чисельний інтервал дозволяючого контексту. Такого роду правила аналізу омонімів у складі однорідної групи були включені до складу узагальнених правил різних типів, зокрема, для типів D / Abr (прислівник / короткий прикметник), D / Abr / Vsp (прислівник / короткий прикметник / предикатив), N * / A * (іменник - займенниковий іменник / прикметник - причастя - займенниковий прикметник). Наприклад, у реченні"Однако, разбить программу на отдельные подсистемы одним из определенных и корректных способов вполне возможно, важно и даже выгодно" присутствует однородная группа омонимов " присутня однорідна група омонімів " вполне возможно, возможно и даже выгодно", що містить омоніми возможно, возможно, выгоднотипу "прислівник / короткий прикметник / предикатив ", які за допомогою спеціального правила аналізу однорідної групи, заданого для даного типу, вирішуються як предикативи.

З іншого боку, синтаксична однорідність тягнеться до семантичної однорідності, тобто метод приписує всім членам однорідної групи одні й ті ж характеристики по частинах мови, розглядаючи члени однорідної групи як елементи однієїмножини. Так у реченні "Среди них были богатые и бедные, красивые и страшные, образованные и невежды " завдяки наявності однорідної групи з парними членами " красивые и страшные ", " богатые и бедные ", " образованные и невежды " омоніми типу N * / A * багаті і бідні вирішаться як іменники, тому одним з членів пари є однозначне іменник невігласи. Такий дозвіл здійснюється на основі спеціального правила аналізу однорідної групи з парними членами, яке включено до складу узагальненої групи вказаного типу. При цьому замінимо, що в складі узагальненого правила типу N * / A * містяться також і інші правила, в тому числі і для аналізу однорідних груп іншої будови. Ще однією перешкодою методу контекстного дозволу омонімії є явище Еліпсис, яке має найважливіше значення для описуваного способу вирішення омонімії. Як уже згадувалося раніше, приписування омоніму тієї чи іншої характеристики частини мови здійснюється на основі аналізу наявності або відсутності в контексті певної довжини слів тих чи інших частин мови. Опущення цих слів у контексті служить серйозною перешкодою для здійснення синтаксичного аналізу і може істотно спотворити результати.

Тісно пов'язане з еліпсисом явище субстантивації. Наприклад, у реченні "В магазине не было черного хлеба, а лишь дорогой белый" застосування правил дозволу омонімії може приписати словоформі білий характеристики іменника. Щоб вирішити його як прикметник, правило повинно знайти узгоджене іменник хліб, яке в даному контексті еліптично опущено. Уникнути такої помилки можна, якщо не розглядати білий як потенційний субстантив. Можливо, деяким виходом із цієї ситуації - розглядати як субстантиви або слова, стійко вживаються в якості іменників (хворий, морозиво), або прикметники середнього роду, вживаються без обумовленого слова, часто як підмет або пряме доповнення ('носити біле', 'вірити в надприродне '). Однак і таке рішення не виключає помилки.

Порівняємо два речення:

1. Она не любит блеклость, даже носит только красное- субстантив.

2. Я не люблю белое вино, я пью только красное - еліпсис.

Таким чином, проблема Еліпсиса є вельми значущою для синтаксичного вирішення омонімії і вимагає пошуку нових шляхів вирішення[6].

3. ПРОГРАМНА РЕАЛІЗАЦІЯ ЗАДАЧІ ЗНЯТТЯ МОРФОЛОГІЧНОЇ ОМОНІМІЇ ПЕРШОГО ПОРЯДКУ МЕТОДОМ КОНТЕКСТНОГО

3.1 Обґрунтування вибору мови і середовища програмування.

C++-- універсальна мова програмування високого рівня з підтримкою декількох парадигм програмування: об'єктно-орієнтованої, узагальненої та процедурної. Розроблена Б'ярном Страуструпом в AT&T Bell Laboratories у 1979 році. Базується на мові С. У 1990-х роках С++ стала однією з найуживаніших мов програмування загального призначення. Переваги мови C++:

1. Продуктивність. Швидкість роботи програм на С++ практично не поступається програмам на С, хоча програмісти отримали в свої руки нові можливості і нові засоби.

2. Масштабованість. На мові C++ розробляють програми для самих різних платформ і систем.

3. Можливість роботи на низькому рівні з пам'яттю, адресами, портами.

Можливість створення узагальнених алгоритмів для різних типів даних, їх спеціалізація, і обчислення на етапі компіляції, з використанням шаблонів.

Реалізації С++ тепер є на всіх машинах, починаючи з найскромніших мікроком'ютерів - до найбільших супер-ЕОМ, і практично для всіх операційних систем.

Існують три причини, без яких неможливо написати гарну програму мовою С++ без використання показників.

По-перше, показники дозволяють функціям змінювати свої аргументи.

По-друге, за допомогою показників здійснюється динамічний розподіл пам'яті.

По-третє, показники підвищують ефективність багатьох процедур [2].

C++ має в своєму розпорядженні свій власний файл заголовків IOSTREAM.H, що містить набір засобів введення-виведення, специфічних для цієї мови. Потокове введення-виведення в C++ організовується за допомогою комплекту стандартних класів, що підключаються за допомогою файлу IOSTREAM.H. Ці класи містять перевантажені оператори введення >> і виведення <<, які підтримують роботу з даними різних типів. Мова Java є чисто об'єктно-орієнтованою, тоді як C++ підтримує як об'єктно-орієнтоване, так і процедурне програмування. В C++ відсутня повноцінна інформація про типи під час виконання RTTI. Цю можливість можна було б реалізувати в C++, маючи повну інформацію про типи під час компіляції CTTI. У C++ є можливість введення призначеного для користувача синтаксису за допомогою #define, що може привести до того, що модулі у великих пакетах програм стають сильно пов'язані один з одним. Це різко знижує надійність пакетів і можливість організації розділених модулів. З іншого боку, С++ надає достатньо засобів (константи, шаблони, вбудовані функції) для того, щоб практично повністю виключити використання #define.

Мова С++ з появою перших трансляторів знайшла відразу ж дуже широке розповсюдження, на ній було створено величезну кількість програм і застосувань. У міру накопичення досвіду створення великих програмних систем спливли недоліки, які спонукали до пошуку альтернативних рішень. Таким альтернативним рішенням стала мова Java, яка в деяких областях стала конкурувати у популярності з C++, а фірма Майкрософт запропонувала мову C# як нову мову, що розвиває принципи C++ і що використовує переваги мови Java.

Програмний продукт розроблювався за допомогою інтегрованого середовища програмування Microsoft Visual Studio 2008 під платформу .NET Framework 3.5. База даних, що використовувалась у проекті - Microsoft Access. Технологія роботи з базою даних - DAO.

Microsoft Access була вибрана для зручності и доступності роботи зі словником. Технологія DAO перевірена і надійна для роботи з базою даних Access.

Класи DAO мають наступні переваги:

- більш висока продуктивність в окремих випадках, особливо при використанні баз даних Microsoft Jet (MDB);

- сумісність з класами ODBC, а також з Microsoft Access Basic і Microsoft Visual Basic;

- доступ до правил перевірки;

- можливість вказівки відношень між таблицями.

Розширена модель доступу до даних з підтримкою мови опису даних DDL і мови обробки данних DML.(MSDN).

Платформа, на якій проходила розробка програмного забезпечення, була вибрана враховуючи декілька причин. По-перше, платформа .NET Framework на даний момент є однією з найпоширеніших у світі платформ. Ця платформа встановлена на багатьох комп'ютерах, тому можливість використання розробленого програмного продукту на інших комп'ютерах висока. Крім того, платформа .NET Framework для реалізації функцій даної системи пропонує велику кількість програмних засобів та технологій, що є великою допомогою у роботі.

Середовищем розробки було обрана Microsoft Visual Studio 2008. Саме це надає можливість програмувати на платформі .NET Framework 3.5 та використання технологій, що були перелічені вище.

Visual Studio Team System - набір інструментів від Microsoft для розробки програмних додатків, спрощення спільної роботи над проектами, інструментів для тестування і налагодження розроблювальних програм, а також побудови звітів. Visual Studio Team System складається з 5 основних продуктів, які можна розділити на серверні і клієнтські програми. Microsoft використовувати Microsoft Solutions Framework (метамодель, що описує бізнес-процеси та процеси інженерії програмного забезпечення) для спрощення реалізації ефективного процесу розробки програмного забезпечення. Team System підтримує дві основних концепції розробки программного забезпечення: гнучку (Agile) і CMMI. Також передбачено додавання інших фреймворків для підтримки інших концепцій і методик.

Visual Studio Team System (VSTS) використовує Team Foundation Server (TFS) в якості сховища даних і серверної інфраструктури для спільної роботи над проектами. TFS забезпечує репозиторій контролю коду, контроль за робочими елементами і службамии звітності. TFS грунтується на понятті «робочий елемент», який являє собою окрему одиницю роботи, що потребує виконання. Самі по собі елементи можуть бути кількох різних типів, як наприклад, Помилка, Завдання, Вимога якості, Сценарій і т. д. Обраний фреймворк в TFS для конкретного проекту визначає які саме типи робочих елементів будуть доступні і які у них будуть атрибути. На додаток до Team Foundation Server Microsoft також пропонує серверний компонент Team Test Load Agent (модуль командного навантажувального тестування). Цей інструмент, який ліцензується окремо від Team Foundation Server і Visual Studio, призначений для використання тестувальниками для виконання автоматизованого тестування навантаження веб-або Windows-додатків. Microsoft обіцяє, що «звичайний комп'ютер» може підтримувати симуляцію 1,000 користувачів, що працюють одночасно. Результати навантажувальних тестів зберігаються у сховищі Team Foundation Server і можуть бути прив'язані до певних зборках, завдяки чому тестування продуктивності може відслідковуватися протягом усього життєвого циклу проекту.

Microsoft Access - це система управління базами даних (СКБД), призначена для створення і обслуговування баз даних, забезпечення доступу до даних та їх обробки.

База даних (БД) представляє собою організовану структуру, що використовується для зберігання даних, тобто будь-яких відомостей про явища, процеси, діях і т.д. Дані несуть у собі інформацію про події, що відбуваються в матеріальному світі, і, по суті, є зареєстрованими сигналами, що виникли в результаті цих подій. Дані стають інформацією, якщо користувач обробить їх і осмислить, застосувавши при цьому адекватні цими даними методи. Сьогодні більшість СУБД розміщують в своїх структурах не лише дані, але і методи (програмні коди), тому можна стверджувати, що Microsoft Access - це СУБД, що пропонує широкий діапазон засобів для зберігання інформації та ефективного управління цією інформацією.

Бази даних містять різні об'єкти, основними з яких є таблиці. Структура найпростішої бази даних відповідає структурі її двомірноїтаблиці, яка містить стовпці і рядки. Їх аналогами в структурі найпростішої бази даних є поля і запису. Отже, мова С++ є достатньо розвинутою і зручною на данний момент і продовжує розвиватися, щоб відповідати сучасним вимогам.

...

Подобные документы

  • Поняття мови програмування С++, її сутність та особливості, призначення та використання. Структура програми, її основні елементи та загальні правила роботи. Охорона праці при роботі з обчислювальною технікою. Апаратні вимоги для виконання програми.

    курсовая работа [126,2 K], добавлен 29.03.2009

  • Дослідження класифікації автоматизованих інформаційних систем. Обґрунтування вибору мови і системи програмування. Програмне забезпечення та опис компонентів середовища. Інтерфейс програмного комплексу. Розрахунок повної собівартості програмного продукту.

    дипломная работа [584,1 K], добавлен 26.06.2015

  • Розробка фільтру для обробки цифрових сигналів. Блок обробки реалізується на цифрових мікросхемах середньої ступені інтеграції. Аналіз вхідного сигналу, ідеального сигналу та шуму. Обґрунтування вибору фільтрів та алгоритму обробки вхідного сигналу.

    курсовая работа [504,4 K], добавлен 18.09.2010

  • Аналіз особливостей мови програмування Java та середовища Android Studio. Розробка програмного забезпечення для якісного та ефективного вивчення іноземних слів. Побудова базових алгоритмів і структури даних. Вибір мови програмування, реалізація програми.

    курсовая работа [335,3 K], добавлен 11.01.2015

  • Основні відомості про історію розвитку мови Object Pascal, середовища Delphi, їх основні технології та застосування для роботи з файлами. Опис основних особливостей мови, основних елементів програмної мови. Принципи об'єктно-орієнтованого програмування.

    курсовая работа [471,5 K], добавлен 12.04.2010

  • Огляд переваг та недоліків мови Пролог, історія її створення. Числення предикатів як математична основа її функціонування. Порівняльна характеристика середовищ програмування Prolog. Алгоритми розв’язування математичних задач за допомогою цієї мови.

    курсовая работа [504,5 K], добавлен 23.12.2014

  • Головні параметри і характеристики технології Wi-Fi. Огляд її стандартів та частотних каналів. Робота з компонентами Windows Forms. Техніко-економічне обґрунтування програми. Охорона праці та забезпечення безпечних, нешкідливих і сприятливих умов праці.

    дипломная работа [1,4 M], добавлен 24.07.2014

  • Модель аналізу-синтезу компіляції. Формальний опис вхідної мови програмування. Вибір технології програмування, проектування таблиць транслятора та вибір структур даних. Опис програми реалізації лексичного аналізатора. Розробка дерев граматичного розбору.

    курсовая работа [75,8 K], добавлен 26.12.2009

  • Комплексна обробка просторово-розподілених ресурсів мережі Інтернет. Системи інформаційного моніторингу в мережі. Обґрунтування технологій, розробка системи інтеграції Інтернет-контенту для конкурентного середовища ринку праці. Оцінювання систем аналізу.

    дипломная работа [763,8 K], добавлен 14.07.2013

  • Схема виявлення атак на основі сигнатур. Сучасні тенденції у галузі розподілених систем виявлення комп’ютерних атак. Обґрунтування вибору програмного середовища та мови програмування для розробки підсистеми. Фізичне проектування бази даних підсистеми.

    дипломная работа [2,2 M], добавлен 19.07.2014

  • Сучасні тенденції у галузі розподілених систем виявлення комп’ютерних атак. Обґрунтування вибору програмного середовища та мови програмування для розробки підсистеми. Розробка узгодженого інтерфейсу взаємодії користувача з підсистемою, візуалізації даних.

    дипломная работа [2,4 M], добавлен 16.07.2014

  • Сутність і структурні елементи бінарного дерева, характеристика методів його обходу (в прямому, симетричному та зворотному порядку). Вибір мови програмування, середовища розробки та технічних засобів. Структура даних і модулів системи, порядок її роботи.

    дипломная работа [1,4 M], добавлен 12.07.2013

  • Аналіз предметної області та відомих реалізацій гри 2048. Універсальна мова моделювання UML в процесі проектування гри. Розробка алгоритмів функціонування модулів гри "2048". Оператори мови програмування Python. Особливості середовища Visual Studio.

    курсовая работа [1,2 M], добавлен 17.02.2021

  • Аналіз інформаційних систем, етапів обробки інформації, Web-програмування. Огляд засобів ідентифікації користувача в САТДН. Розробка інформаційної і адміністративної підсистем для системи автоматизованого тестування для дистанційного навчання (САТДН).

    дипломная работа [10,3 M], добавлен 21.04.2014

  • Сутність і призначення мови програмування С++, історія її створення та розвитку, значення на сучасному етапі. Створення програм на мові С++, її структура та особливості. Охорона праці при роботі з обчислювальною технікою, вимоги до техніки безпеки.

    курсовая работа [1,2 M], добавлен 29.03.2009

  • Проблеми розробки компонентного програмного забезпечення автоматизованих систем управління. Сучасні компонентні технології обробки інформації. Аналіз вибраного середовища проектування програмного забезпечення: мова програмування PHP та Apache HTTP-сервер.

    дипломная работа [2,8 M], добавлен 11.05.2012

  • Проектування і програмування обробки деталей на верстатах з числовим програмним управлінням. Проектування технологічної оперції обробки заготовки: вибір інструменту, ескізи наладок. Керуюча програма обробки деталей "кришка" та "вал". Верифікація програми.

    курсовая работа [1,7 M], добавлен 29.11.2011

  • Широкі можливості по використанню комп'ютерних навчальних систем. Розробка навчальної системи мультимедійного посібника з дисципліни "Інформатика і ОТ" на тему "Особливості мови програмування С++. Вказівники". Вимоги до розробки навчальної програми.

    курсовая работа [2,9 M], добавлен 23.11.2010

  • Основні принципи об’єктно-орієнтованого програмування. Типові середовища програмування та особливості мови С++. Етапи проектування БД. Розробка програмного забезпечення для реалізації створення бази відеофільмів. Основні положення та моделі БД.

    курсовая работа [2,7 M], добавлен 24.03.2011

  • Принцип роботи СТО. Аналіз існуючих теоретико-практичних розробок по створенню інформаційних систем. Модель аналізу виконання робіт з ремонту й обслуговування на СТО. Розробка автоматизованої системи обробки інформації, опис програмного забезпечення.

    дипломная работа [1,3 M], добавлен 11.10.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.