Моделі та методи лінгвістичного аналізу тексту інтелектуальної системи оцінювання знань

Основні підходи до інформатизації та інтелектуалізації систем оцінювання знань. Проблеми автоматичного лінгвістичного аналізу тексту в контексті систем оцінювання знань. Специфіка методики дослідження моделювання процедур лінгвістичного аналізу тексту.

Рубрика Иностранные языки и языкознание
Вид дипломная работа
Язык украинский
Дата добавления 20.10.2018
Размер файла 5,2 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

1

1

0

1

1

стійкост

1

1

1

0

1

зростан

1

0

0

0

1

ресурс

0

0

1

0

0

розвитк

0

0

1

0

0

грош

0

0

0

1

0

4. Далі визначаємо кореляцію між стовпчиками матриці (відповідями студентів та еталонною відповіддю), використовуючи рангову кореляцію Спірмена:

(3.4)

Результати оцінки кореляції наведено у табл. 3.6.

Таблиця 3.6 - Кореляція уривків у вихідній матриці

Е

В1

В2

В3

В4

Е

1

В1

0.97

1

В2

0,77

0,78

1

В3

0,38

0,43

0,25

1

В4

0,88

0,89

0,73

0,5

1

5. Сингулярний розклад матриці (SVD) й апроксимація її з матрицею з меншим рангом. Для покращення результатів роботи системи потрібно позбутися зайвої інформації, так званих “шумів”, що містяться у великих масивах документів, тобто потрібно здійснити сингулярне розкладання вихідної матриці вживаності та апроксимувати її матрицею з меншим рангом (у нашому прикладі - третім рангом, хоча в реальній дійсності, у процесі опрацювання великого масиву документів, розмірність є значно більшою, і, відповідно, результати роботи методу - значно точнішими) [201].

Результат сингулярного розкладу вихідної матриці M:

M = UЧSЧVT;

6

6

3

1

4

1

1

0

0

1

2

1

1

0

0

2

2

1

0

1

1

1

0

0

0

1

1

0

0

0

M =

1

1

0

0

0

;

1

1

0

1

1

1

1

1

0

1

1

0

0

0

1

0

0

1

0

0

0

0

1

0

0

0

0

0

1

0

-0.877

0.019

0.165

-7.529Ч10-3

-0.152

-0.143

0.265

3.024Ч10-3

0.31

-0.052

-0.191

-0.389

-0.396

-0.184

0.624

-0.278

-0.128

-0.15

0.089

-0.119

-0.109

0.062

-0.404

-0.089

-0.069

-0.109

0.062

-0.404

-0.089

-0.069

U =

-0.109

0.062

-0.404

-0.089

-0.069

;

-0.151

0.465

0.211

-0.363

0.136

-0.169

-0.19

0.254

0.178

-0.05

-0.09

0.208

0.163

0.435

0.708

-0.026

-0.455

0.251

-0.132

0,00134

-0.026

-0.455

0.251

-0.132

0,00134

-0,0081

0.2

0.208

-0.672

0.188

11.283

0

0

0

0

0

1.851

0

0

0

S =

0

0

1.675

0

0

;

0

0

0

1.245

0

0

0

0

0

0.958

-0.628

8.429Ч10-3

-0.408

0.045

0.662

-0.603

0.106

-0.268

-0.156

-0.727

VT =

-0.294

-0.843

0.42

-0.164

1.282Ч10-3

.

-0.092

0.369

0.349

-0.837

0.18

-0.385

0.377

0.681

0.496

0.016

Таблиця 3.7 - Результат екстраполяції матрицею нижчого рангу:

B1

B2

B3

B4

B5

A1

6,11258

-0,31582

4,14063

-0,48828

-6,57751

A2

0,68049

0,17662

0,66364

-0,47299

-1,35524

A3

2,00364

0,38020

0,71370

0,31587

-0,94527

A4

2,17637

0,20123

1,27641

-0,15573

-1,88461

A5

0,91229

0,53141

0,14814

0,13048

-0,91842

Таблиця 3.8 - Новий розрахунок коефіцієнтів рангової кореляції Спірмена:

Е

В1

В2

В3

В4

Е

1

0

0

0

0

В1

0,98913

1

0

0

0

В2

-0,30286

-0,39832

1

0

0

В3

-0,58793

0,45575

-0,68943

1

0

В4

0,98035

0,72408

-0,99844

0,42018

1

Як видно з таблиці, в апроксимованій матриці значно збільшилось значення коефіцієнтів кореляції між семантично-релевантними уривками, і, відповідно зменшилась кореляція між семантично-відмінними текстами.

Отже, за результатами застосування латентно-семантичного аналізу встановлено, що правильній відповіді (Е) найбільше відповідає варіант відповіді В1 і найменш релевантною є відповідь В3.

3.2 Розроблення моделі штучного інтелекту для порівняння текстової інформації за змістом

Одним з інноваційних напрямів подальшого вдосконалення систем тестового контролю є застосування методів штучного інтелекту. На жаль, аналіз сучасних методик, математичного та програмного забезпечення в цій галузі свідчить, що завершених моделей і методів, які на основі використання методів штучного інтелекту були б здатні повною мірою опрацьовувати (порівнювати) отримані з тексту елементи “знань”, сьогодні не існує навіть для англійської мови. Таке становище обумовлене двома причинами. Перша, полягає в недостатньому рівні відомих і досяжних до прикладних застосувань систем лінгвістичного аналізу тексту, здатних інтерпретувати відношення між одиницями тексту й видобувати знання як певні елементи з внутрішньою структурою. Подібні системи лише почали з'являтись (Net Owl (www.netowl.com), Attensity (www.attensity.com), RCO FactExtractor (www.rco.ru)) і їх ще не встигли інтегрувати до прикладних застосувань. Друга причина полягає в низькій достовірності автоматичної екстракції знань, що пов'язано з недосконалістю сучасних методів та алгоритмів інтерпретації тексту [34, с. 51].

Розроблена в рамках дослідження лінгвістична підсистема аналізу текстової відповіді інтелектуальної системи оцінювання знань побудована з використанням моделей штучного інтелекту для порівняння текстової відповіді студента на запитання тесту із еталонними варіантами відповіді.

Незважаючи на численні дослідження в галузі штучного інтелекту, універсального вирішення більшості прикладних задач обробки текстів досі не існує. Це обумовлено проблемами формалізації природної мови.

Вибір моделі штучного інтелекту лінгвістичної підсистеми автоматизованої системи контролю знань. При проведенні тестування можуть використовуватись завдання різних типів. Практично у всіх сучасних системах реалізовані завдання в яких використовується вибір одного, або декількох фіксованих варіантів відповідей. Однак, для більш об'єктивної оцінки знань, доцільно використовувати тип запитань, який передбачає текстову відповідь на природній мові. Проте подібний підхід в сучасних системах тестування практично не використовується, оскільки алгоритмічна реалізація автоматичної перевірки природно мовної відповіді є складним завданням.

У підрозділі (3.1) було запропоновано алгоритмічну реалізацію перевірки текстової відповіді, яку було використано в системі тестування. Алгоритм перевірки ґрунтувався на нечіткому порівнянні тексту відповіді зі зразками правильної відповіді. При проведенні порівняння враховувалось не лише наявність слів, але і їх порядок у тексті. Тобто певною мірою враховувалась структура речення.

У ході обробки тексту можливо виділити наступні етапи аналізу: графематичний; морфологічний; синтаксичний; семантичний. Саме останній вид аналізу - семантичний дає можливість з довільного тексту виділити його змістову структуру (знання). На цьому етапі відбувається виявлення змісту речень, або окремих їх частин. З усіх етапів обробки текстової інформації, семантичний аналіз є найбільш складним. Він важко піддається формалізації. Звичайно, кожна мова має свої особливості, і їх необхідно враховувати при проведенні семантичного аналізу.

У роботі запропоновано здійснювати лінгвістичний аналіз тексту на основі використання формалізму нейромереж [123]. Існує думка, що нейромережу можна навчити проводити порівняння текстової інформації на різних мовах приблизно так як це робить її біологічний прототип - мозок людини. У ході внутрішніх прихованих процесів, що відбуваються при роботі нейромережі, проводиться як первинна обробка інформації (морфологічний, синтаксичний аналіз), так і семантичний аналіз. Однак для забезпечення можливості вирішення таких складних задач як семантичний аналіз нейромережа повинна мати достатньо велику місткість. Проблематичною є також процедура навчання, в процесі якої формуються вагові коефіцієнти, що визначають пам'ять нейромережі. Для навчання лише з однієї предметної галузі необхідно побудувати значну кількість фраз, які використовуються при порівнянні. Зазначені фрази повинні містити всі терміни, що використовуються в предметній галузі. У них мають бути висвітлені всі поняття, які необхідно занести до пам'яті нейромережі. Для більш надійного запам'ятовування при порівнянні необхідно підбирати не тільки суттєво різні текстові пари, але й близькі за написанням, проте відмінні за змістом.

Загальна структура нейромережі наведена на рисунку 3.4. Перший, відкритий шар нейромережі представлено двома групами з N нейронів. У цей шар заноситься вхідна інформація. В першу групу нейронів - текст відповіді, який звіряється зі зразком, у другу групу нейронів - сам зразок.

Для первинної обробки інформації в нейромережі використовуються шар нейромережі з двох груп з М нейронів. Між нейронами вхідного і першого шару кожної з двох груп встановлено зв'язки. Для підвищення якості первинної обробки (морфологічного, синтаксичного аналізу) можливо до складу нейромережі включити ще один аналогічний шар нейронів.

Основна обробка інформації реалізується в наступному прихованому шарі нейронів 1, ..., К. До кожного нейрона цього шару надходить інформація з кожного нейрона двох груп попереднього шару. З метою нарощування інформаційної потужності нейромережі, покращення можливостей семантичного аналізу, можливо збільшувати число нейронів К у цьому шарі, та включати додаткові проміжні шари.

Размещено на http://www.allbest.ru/

Рисунок 3.4 - Загальна структура нейромережі для порівняння текстової інформації

Для отримання результату перевірки використовується останній шар, який складається з одного нейрона. Один з двох його можливих станів відповідає ідентичності двох текстів за змістом; інший стан вказує на те, що тести відрізняються за змістом.

Перевагами використання нейромережі для вирішення задачі порівняння текстів за змістом є універсальність. Незмінна за структурою нейромережа може бути пристосована (навчена) для порівняння текстів різними мовами з різних предметних галузей. Однак суттєвим недоліком є складність навчання. Причому навчання необхідно проводити усіма мовами з усіх предметних галузей, де буде використовуватись нейромережа.

За відсутності апаратної реалізації нейромережу можна змоделювати програмно, що суттєво зменшує її швидкодію. Збільшити швидкість роботи нейромережі можливо за рахунок ефективного використання обчислювальних ресурсів комп'ютера (багатопроцесорності) [47, с. 142].

Другий напрямок семантичного аналізу - використання алгоритмічного підходу. При його використанні на етапі семантичного опрацювання тексту алгоритмічними засобами проводиться виявлення змісту речень або їх окремих частин. Для визначення семантичних відношень між окремими словами зазвичай використовується тезаурус мови предметної галузі. Природно, що такий тезаурус має враховувати специфіку кожної мови. Проблема створення якісного тезаурусу є однією з основних при використанні алгоритмічного підходу. Хоча зараз існують комерційні продукти, де використовуються тезауруси для різних мов, вони насправді включають лише їх підмножини (англійської, російської, …).

Одним з алгоритмічних підходів при семантичному аналізі можливий також статистичний підхід, який дозволяє визначити ключові слова тексту, враховуючи частотність їх уживання. При визначенні ключових слів потрібно враховувати семантичну близькість слів за їхніми значеннями. Виконання цього завдання дозволяє побудувати шкали відстаней між словами в тексті [23].

Для вирішення задачі семантичного аналізу потрібно:

- розробити методи обробки вихідного тексту;

- розробити фільтр для селекції слів, специфічних для природної мови;

- автоматизувати виділення ключових слів.

Відомі алгоритми виділення ключових слів поділяються на дві групи: міжтекстової фільтрації (базуються на використанні інформації про частотні характеристики в певному наборі текстів) і внутрішньотекстової фільтрації (використовується частотна інформація в межах одного тексту).

Алгоритм виявлення контексту [45] зазвичай має такі етапи:

визначення абсолютної і відносної частот для кожної словоформи;

пошук частин тексту, які містять певне слово;

визначення абсолютної і відносної частот для визначених у попередньому кроці частин;

порівняння відносних частот, визначених у першому і попередньому кроці. Якщо відносна частота, визначена в першому кроці менша - словоформа відноситься до семантичного поля слова.

У результаті семантичного аналізу будується семантична мережа - структура для представлення знань у вигляді вузлів пов'язаних дугами (зв'язками). Властивості отриманої семантичної мережі:

вузли мережі представляють собою поняття, предмети, події, стани;

дуги семантичних зв'язків створюють відношення між вузлами - поняттями (відношення можуть бути різних типів);

певні відношення між вузлами є лінгвістичними, інші - просторовими, часовими, логічними та ін.;

поняття організовані за рівнями відповідно до ступеня узагальненості.

Таким чином, у результаті аналізу тексту з нього автоматично видобувається інформація (“знання”) у вигляді мережі основних понять і зв'язків з ваговими коефіцієнтами. Змістовий “портрет” тексту при подальшому порівнянні подається не просто списком ключових слів, а набуває вигляду мережі понять, що в певному сенсі є “відбитком” його змісту. Кожне поняття має певну вагу, яка відображає значимість цього поняття в тексті. Зв'язки між поняттями також мають вагові коефіцієнти [47, с. 143]. Незалежно від побудови речень, наявності додаткових суджень, несуттєвих якісних характеристик, які можуть бути наявні у відповіді, з неї виділяється основний “зміст” у формі семантичної мережі. Аналогічна процедура проводиться зі “зразком” вірної відповіді. Порівняння двох семантичних мереж (тексту відповіді і зразка) дозволяє достовірно оцінити ступінь їх тотожності і в результаті виставити об'єктивну оцінку.

Алгоритми навчання системи штучного інтелекту автоматизованої системи контролю знань побудовані на таких алгоритмах: зворотного поширення; навчання без вчителя; навчання нейронних мереж Хопфілда і Хеммінга. Мережі Хопфілда, Хеммінга дозволяють просто і ефективно вирішити завдання відтворення образів по неповній та спотвореній інформації. Невисока ємність мереж (число запам'ятовування образів) пояснюється тим, що, мережі не просто запам'ятовують образи, а дозволяють проводити їх узагальнення, наприклад, за допомогою мережі Хеммінга можлива класифікація за критерієм максимальної правдоподібності [86, с. 69]. Разом з тим, легкість побудови програмних і апаратних моделей роблять ці мережі привабливими для застосування у багатьох сферах.

Таким чином у роботі запропоновано алгоритм, який може використовуватись для проведення оцінювання текстових відповідей при проведенні комп'ютерного тестуванняЕкспериментальна перевірка показала достатню ефективність запропонованого алгоритму при перевірці питань тесту, в яких відповідь потрібно навести у вільному викладенні. В рамках НДР [48] розроблено програмне забезпечення, що реалізує розглянуті алгоритми.

3.3 Алгоритми оцінювання знань та переведення оцінки в інші системи оцінювання знань

Методологія оцінювання знань студентів є невід'ємним елементом системи освіти. Критерієм ефективності освіти може виступати лише об'єктивне оцінювання. Матеріали Лісабонської конвенції (Лісабон, 1997) та Болонської декларації (Болонья, 1999) демонструють досвід оцінювання, накопичений протягом століть. Використання системи модульного контролю знань із відповідною шкалою оцінювання є важливою умовою для повноцінної участі державної системи освіти у Болонському процесі. Саме тому, для оцінювання знань сьогодні використовують різні підходи. У початковій школі залишено 4-бальну шкалу оцінювання. У середній освіті використовується 12-бальна шкала. Оцінювання у вищих навчальних закладах поєднує традиційні підходи із оцінюванням відповідно до ECTS [48, c. 80].

За традиційною чотирибальною шкалою оцінки виставляються в такий спосіб [30, с. 96-97]:

“відмінно” - якщо студент показує повні, міцні, глибокі та системні знання програмного матеріалу; грамотно та логічно його викладає; самостійно і швидко оцінює різноманітні ситуації та приймає правильні рішення; аргументовано використовує знання у стандартних та нестандартних практичних ситуаціях, при виконанні творчих завдань; робить логічні висновки, узагальнення; бездоганно володіє прийомами роботи зі спеціальними технічними засобами; вміє знаходити інформацію та аналізувати її, ставити та розв'язувати проблемні завдання;

“добре” - якщо студент знає програмний матеріал, грамотно його викладає; правильно знає істотні ознаки понять, явищ, зв'язки між ними, вміє пояснити основні закономірності; його відповідь логічна, хоча студент допускає незначні помилки у формулюванні термінів і категорій; йому бракує власних суджень; самостійно використовує одержані знання при вирішенні практичних стандартних ситуацій; вміє аналізувати, систематизувати і узагальнювати інформацію, робить правильні висновки; використовує загальновідомі докази, самостійно і правильно аргументує, підтверджує практичними прикладами; правильно володіє прийомами практичної роботи зі спеціальними технічними засобами;

“задовільно” - якщо студент має знання тільки основного навчального матеріалу, але не засвоїв його детально, може з помилками (неточностями) дати визначення основних понять, не допускає грубих помилок у відповіді, потребує в окремих випадках додаткових питань для прийняття правильного рішення; може повторити певну практичну дію (операцію) за зразком; практичні стандартні ситуації вирішує за зразком;

“незадовільно” - якщо студент допустив грубі помилки, відповідає неправильно, не може застосовувати одержані знання на практиці.

Таблиця 3.7 - Виставлення оцінок у дванадцятибальній шкалі

Бали

Характеристика оцінки

1

Студент володіє навчальним матеріалом на рівні елементарного розпізнавання і відтворення окремих фактів, елементів, об'єктів, що позначаються учнем окремими словами чи реченнями

2

Студент володіє матеріалом на елементарному рівні засвоєння, викладає його уривчастими реченнями, виявляє здатність викласти думку на елементарному рівні

3

Студент володіє матеріалом на рівні окремих фрагментів, що становлять незначну частину навчального матеріалу

4

Студент володіє матеріалом на початковому рівні, значну частину матеріалу відтворює на репродуктивному рівні.

5

Студент володіє матеріалом на рівні, вищому за початковий, здатний з допомогою вчителя логічно відтворити значну його частину

6

Студент може відтворити значну частину теоретичного матеріалу, виявляє знання і розуміння основних положень, з допомогою вчителя може аналізувати навчальний матеріал, порівнювати та робити висновки, виправляти допущені помилки

7

Студент здатний застосовувати вивчений матеріал на рівні стандартних ситуацій, частково контролювати власні навчальні дії, наводити окремі власні приклади на підтвердження певних тверджень

8

Студент вміє зіставляти, узагальнювати, систематизувати інформацію під керівництвом учителя, самостійно застосовувати її на практиці, контролювати власну діяльності, виправляти помилки і добирати аргументи на підтвердження певних думок

9

Студент вільно (самостійно) володіє вивченим обсягом матеріалу, в тому числі і застосовує його на практиці; вільно розв'язує задачі в стандартних ситуаціях, самостійно виправляє допущені помилки, добирає переконливі аргументи на підтвердження вивченого матеріалу

10

Студент виявляє початкові творчі здібності, самостійно визначає окремі цілі власної навчальної діяльності, оцінює окремі нові факти, явища, ідеї; знаходить джерела інформації та самостійно використовує їх

11

Студент вільно висловлює власні думки, визначає програму особистої пізнавальної діяльності, самостійно оцінює різноманітні явища і факти, виявляючи особисту позиції щодо них; без допомоги викладача знаходить джерела інформації і використовує одержані відомості відповідно до мети та завдань власної пізнавальної діяльності. Використовує набуті знання і вміння в нестандартних ситуаціях, переконливо аргументує особисту життєву позицію, узгоджуючи її із загальнолюдськими цінностями

12

Студент виявляє особливі творчі здібності, самостійно розвиває власні обдаровання і нахили, вміє самостійно здобувати знання

Необхідно відмітити, що отримавши оцінку за будь-якою шкалою, її можна достатньо легко перевести в оцінки інших систем. Конвертація оцінки, зазвичай, відбувається з шкали з більшою кількістю рівнів в шкалу з меншою кількістю. Це пояснюється тим, що наявність більшої кількості рівнів дозволяє оцінювати знання більш точно.

Шкала ECTS, відповідно, надає більше можливостей для проведення оцінювання (див. табл. 1.1). Для деяких оцінок за ECTS у табл. 1.1 було використано дробові п'ятибальні оцінки. Звичайно таких оцінок у цій шкалі немає, тому оцінювання за шкалою ECTS є більш гнучким. Шкала розрізняє такі рівні знань як добре і дуже добре, задовільно і достатньо, що у чотирибальній шкалі було неможливо.

Дванадцятибальна система оцінювання (табл. 3.7), яка знайшла застосування в середній школі, має ще більше рівнів, що дозволяє більш точно оцінити знання тих, хто навчається [48, c. 82]. Однак для уніфікації оцінювання можна використати шкалу, в якій кількість рівнів оцінювання апріорі більша за потрібну. Це дозволить, за необхідності, коректно провести конвертування з неї в усі інші шкали.

Сьогодні набуває поширення стобальна шкала. У ній можна провести аналогію з відсотками. 100 балів відповідає відмінним знанням, 0 балів - незадовільним знанням. Цю шкалу можна використовувати і у випадках, коли система оцінювання передбачає накопичення поточних оцінок.

Система конвертації оцінок у шкалу ECTS у Львівському Національному університеті імені Івана Франка використовує таку шкалу:

Оцінка

ECTS

Визначення

90-100

А

Відмінно

81-89

В

Дуже добре

71-80

С

Добре

61-70

D

Задовільно

51-60

E

Достатньо

Оцінки можна переводити з однієї шкали в іншу. При цьому, вихідна оцінка повинна бути виставлена в шкалі з більшою кількістю рівнів. Саме тому, більш доречним у цьому випадку є використання 100-бальної шкали. Вона дає можливість більш точного оцінювання, без втрат, пов'язаних з дискретизацією у шкалах з меншою кількістю рівнів. В ІСОЗ застосовано автоматичну конвертацію оцінки в усі основні шкали (п'ятибальну, ECTS та дванадцятибальну) [48, c. 84-86].

Під час використання 100-бальної шкали відбувається підсумовування балів, набраних в ході тестування за всі питання тесту. Оцінка за кожне питання тесту виставляється також по 100-бальній шкалі. Відповідно до типу питання застосовуються різні підходи для проведення оцінювання. Найпростішим є оцінювання відповідей на традиційні для систем тестування питання (одна вірна відповідь з багатьох, декілька вірних відповідей). Для виставлення оцінки в цих випадках використовуються тривіальні алгоритми, які передбачають чітке порівняння наданої відповіді зі зразком і виставлення відповідної кількості балів. Найскладнішим для комп'ютерної реалізації є виставлення оцінки на питання з можливістю відповіді на природній мові. Для цього використано алгоритми з елементами “штучного інтелекту” нечіткого порівняння текстової інформації наданої у відповіді з еталонною відповіддю у зразку.

Таким чином, у ході тестування проводиться сумування кількості балів набраних за кожне питання (N). Окрім цього обчислюється максимально можлива кількість балів, яка може бути набрана за тест (Nm). Остаточна кількість балів за тест за стобальною шкалою (M) обчислюється наступним чином:

,

де: бi - ваговий коефіцієнт і-го запитання; Ni - бали набрані за і-те питання тесту; Nm - максимально можлива кількість балів за тест.

Для переведення оцінки з 100 бальної шкали в інші шкали з меншою кількістю рівнів потрібно провести передискретизацію оцінки. Для цього потрібно порівняти оцінку з граничними рівнями для виставлення оцінок у новій шкалі. Оскільки ці рівні можуть законодавчо змінюватись, у системі передбачено їх гнучке налаштування для різних шкал. Алгоритм переведення оцінки має вигляд, зображений на рисунку 3.5.

Размещено на http://www.allbest.ru/

Рисунок 3.5 - Структура алгоритму переведення оцінки в іншу шкалу (М - оцінка за 100 бальною шкалою, О - остаточна оцінка, Ri - граничні рівні переведення у нову шкалу, Mi - оцінки у новій шкалі)

Таким чином, в інтелектуальній системі оцінювання автоматично здійснюється конвертація оцінок в інші системи оцінок (чотирибальну, ECTS та дванадцятибальну).

Висновки до розділу 3

1. Одним із важливих завдань у системах, що використовують електронні інформаційні засоби навчання, є автоматизований контроль перевірки знань, які студенти подають у вигляді тексту. Одним із перспективних методів, що надають можливість порівнювати за змістом тексти, є метод латентного семантичного аналізу, який дозволяє на підставі оцінки кореляції між словами та текстами зробити висновок щодо ступеня близькості змісту цих слів чи групи слів. Проте, метод ЛСА для цілей цієї роботи необхідно вдосконалити, оскільки він не враховує суттєву лінгвістичну інформацію (порядок слів у реченні, ключові слова, помилки, логіку та морфологію).

2. У рамках дисертаційної роботи розроблено метод нечіткого семантичного порівняння за змістом розгорнутих відповідей студентів, що подані в електронному вигляді, з варіантами правильних відповідей в XML-форматі. Розроблений алгоритм передбачає автоматизовану екстракцію лексичних одиниць тексту з подальшим здійсненням морфологічного, синтаксичного, семантичного та прагматичного аналізу. Для порівняння нечітких лексичних одиниць використовується метрика Левенштейна.

Застосування розробленого алгоритму дозволяє усунути можливі помилки у вихідному тексті (неправильні закінчення, нестандартні скорочення тощо), визначати належність вихідного тексту до певної предметної галузі, сформувати загальну оцінки відповіді на питання тестових завдань на основі комплексного показника, у якому враховується наявність у відповіді слів присутніх у зразку (з урахуванням нечіткості), відповідність структур зразка і відповіді (порядку слів, структури речення). Цей алгоритм у подальшому використовується при здійснені латентно-семантичного аналізу.

3. Удосконалено алгоритми аналізу рядків. У розробленій системі оцінювання знань удосконалено алгоритми аналізу рядків. Кожний текстовий рядок подається вектором у N-вимірному просторі, де N - кількість символів у рядку. Для нечіткого порівняння текстової інформації у відповідях під час тестування було удосконалено алгоритм, у якому і зразок і відповідь розбиваються на окремі слова. Після чого проводиться нечіткий пошук збігу слів у зразку і відповіді, для чого застосовується метрика Левенштейна.

4. Удосконалено алгоритм латентно-семантичного аналізу. У результаті виконання дослідження було удосконалено алгоритм методу латентно-семантичного аналізу, що передбачає на етапі формування частотної матриці індексованих слів застосування алгоритму нечіткого семантичного порівняння текстової інформації, внаслідок чого індексовані слова (терми) замінюються лексичними одиницями із баз даних. Процедуру стемінга замінено лематизацією на основі результатів автоматичного морфологічного аналізу текстів задля забезпечення більш високої якості дії алгоритму. Застосовано алгоритми нечіткого пошуку, а саме удосконаленого варіанту метрики Левенштейна для виправлення некоректних слів. Запропоноване суттєво розширює прикладне та наукове значення удосконаленого методу латентно-семантичного аналізу.

На відміну від відомих підходів щодо автоматизованого контролю знань застосування запропонованих нових та удосконалених методів, моделей та алгоритмів дозволяє наступне: виявлення латентних асоціативно-семантичних залежностей у множині документів; часткове зняття омонімії, полісемії та синонімії; виправлення слів, що написані студентом із орфографічними та технічними помилками; врахування порядку слів у документах та їх значень; логіку побудови терм у контексті предметної сфери тощо.

5. Розроблено моделі штучного інтелекту для порівняння текстової інформації за змістом на етапах семантичного та прагматичного аналізу. За результатами семантичного аналізу будується семантична мережа - структура для представлення знань у вигляді вузлів пов'язаних дугами (зв'язками). Під час прагматичного аналізу визначається належність відповіді до визначеної предметної галузі. Семантичний і прагматичний аналіз запропоновано проводити на основі використання нейромережі. На відміну від відомих методів семантичного й прагматичного аналізу, розроблені алгоритми на основі моделей штучного інтелекту дають можливість з більшою достовірністю автоматизовано проводити перевірку відповідей, поданих у довільній текстовій формі природною мовою. Незалежно від побудови речень, додаткових суджень, несуттєвих якісних характеристик, які можуть бути у відповіді та зразку, з них виділяється основний “зміст” у формі семантичної мережі. Порівняння змісту тексту відповіді і зразка дозволяє достовірно оцінити ступінь їх тотожності, що підвищує об'єктивність оцінки. Експериментальна перевірка показала достатню ефективність запропонованого алгоритму при перевірці питань тесту, в яких відповідь потрібно навести у вільному викладенні.

6. Розроблені моделі й алгоритми істотно підвищують ефективність і достовірність роботи системи тестування, яка може використовуватись для проведення поточного, модульного, рейтингового та підсумкового контролю. На відміну від систем оцінювання з використанням тестів розроблена система надає можливість оцінювати природномовні відповіді студентів, подані в довільній формі. Крім традиційних тестів розроблена інтелектуальна автоматизована система контролю знань на підставі використання штучного інтелекту дозволяє оцінювати:

завдання, що передбачають коротку вільну відповідь у вигляді числа або одного слова;

завдання, що передбачають точну відповідь у вигляді правила, визначення, теореми тощо;

завдання, що передбачають логічну відповідь (вибір із множини, впорядкування за ознакою, доведення тощо);

завдання, відповідь на які повинні бути подані у вигляді довільної текстової відповіді.

7. В інтелектуальній автоматизованій системі контролю знань для виставлення і зберігання оцінки використовується 100 бальна шкала. Достатньо велика кількість рівнів оцінювання в цій шкалі дозволяє сформувати оцінку з високою точністю без втрат пов'язаних з дискретизацією у шкалах з меншою кількістю рівнів. Однак, оскільки у багатьох навчальних закладах використовуються і інші системи оцінювання, в системі реалізується автоматична конвертація оцінки у всі основні шкали (п'ятибальну, ECTS та дванадцятибальну). Автоматизоване переведення оцінки в усі існуючі у вищій школі системи оцінювання значно спрощує роботу користувачів (викладачів), яким не потрібно самостійно обчислювати бали, проводити переведення оцінок. Усі оцінки зберігаються у базі даних системи тестування. У базі даних також зберігається структура дисципліни. Усе це дає можливість автоматизувати процес узагальнення всіх оцінок (обчислення середньої арифметичної оцінки, набраних балів) за предмет.

Основні положення розділу відображено у публікаціях автора [50; 52?54; 62; 64; 65; 67; 69].

РОЗДІЛ 4. ФУНКЦІОНАЛЬНІ СТРУКТУРИ МОДУЛІВ ТА СИСТЕМА КЕРУВАННЯ БАЗАМИ ДАНИХ (ЗНАНЬ) ІНТЕЛЕКТУАЛЬНОЇ СИСТЕМИ ОЦІНЮВАННЯ ЗНАНЬ. АПРОБАЦІЯ РЕЗУЛЬТАТІВ ДОСЛІДЖЕННЯ

4.1 Функціональні структури модулів лінгвістичної підсистеми інтелектуальної системи оцінювання знань

Процес (перетворення) запиту (вхідного речення) з природної мови у внутрішнє представлення розкладається на чотири стадії, яким відповідають чотири рівні розуміння вхідної інформації (рисунок 4.2): морфологічний, синтаксичний, семантичний, прагматичний.

Размещено на http://www.allbest.ru/

Завдання усіх чотирьох стадій полягає в зменшенні ступеня невизначеності мовних одиниць, їхніх параметрів та взаємозв'язків у контексті однозначного потрактування вхідної інформації. Основну роль при аналізі речення відіграє інтегрована база даних, в якій реалізовано морфологічні, синтаксичні, семантичні та прагматичні моделі.

Для побудови функціональних структур лінгвістичного аналізатора (морфологічного, синтаксичного, семантичного, прагматичного) скористаємося підходами, розглянутими в роботах [4; 34; 87; 95; 150].

Попереднім етапом аналізу тексту є його нормалізація, що здійснюється за допомогою графематичного аналізу (токенізації) та передбачає виконання таких завдань: видалення нетекстових символів, виділення слів, цифр, формул, скорочень, заголовків, приміток та інших елементів тексту, розподіл тексту на речення, абзаци за допомогою дескрипторів. Робота цього модуля виглядає наступним чином. Спершу графематичний аналізатор за заданими критеріями виділяє абзаци. Далі виділяється рядок до першого розділового елемента. У разі, якщо рядок складається лише із цифр, то його помічають частиною мови “числівник” та відправляють у проміжний масив. У решті випадків рядок надходить до етапу ділення складених слів у морфологічному блоці. Для усунення неоднозначності крапки, що окрім ознаки кінця речення сигналізує про наявність скорочень у тексті, необхідно вводити правила аналізу скорочень, враховуючи їх змінні та незмінні параметри. Після усунення зайвих крапок і встановлення маркерів про можливе закінчення речення відбувається його поділ на окремі слова та нерозривні словосполучення.

Для того, щоб встановити граматичні параметри мовних одиниць та взаємозв'язки між ними потрібно здійснити морфологічний та синтаксичний аналіз вхідного тексту. Це досягається шляхом використання баз даних із граматичними та морфологічними словниками української мови, допоміжних баз даних, баз знань із правилами визначення синтаксичних параметрів.

Обов'язковою процедурою обробки природномовного тексту є, на наш погляд, автоматичний морфологічний аналіз (рисунок 4.4), метою якого є: визначення частин мови слів відповіді (частиномовний тегінг), який ґрунтується на аналізі словозмінних елементів (флексій); його повний морфологічний аналіз, що передбачає приписування граматичних характеристик (грамем) кожній вхідній словоформі (рід, число, відмінок тощо); і операцію лематизації, тобто виділення леми (канонічної форми) слова, вжитого у тексті, під якою розуміємо послідовність графем словоформи, яка є спільною для усіх словоформ словозмінної парадигми цього слова.

Размещено на http://www.allbest.ru/

Вхідними даними для процедури морфологічного аналізу є еталонні моделі, які складаються зі словозмінного словника, словника морфем (квазізакінчень, суфіксів, префіксів тощо), додаткових словників, що містять перелік абревіатур, скорочень, власних назв.

У розробленій інтелектуальній системі робота морфологічного аналізатора передбачає виконання таких етапів:

У першу чергу потрібно з'ясувати, чи є в таблиці бази даних “Словозмінний словник” елемент, ідентичний вхідній словоформі. Для цього виконується умова Wi, де Словозмінний словник”, базою для якого слугував електронний граматичний словник української мови (ЕГС) розроблений в Українському мовно-інформаційному фонді (УМІФ). Словник складається з двох частин: ліва частина вміщує множину слів у канонічний формі, так звані реєстрові слова; у правій частині знаходиться множина всіх словозмінних парадигм (словоформи із складу словозмінної парадигми - парадигматичні форми). Застосування такого словника дозволяє розв'язати проблему граматичної ідентифікації, що передбачає формалізацію процесів парадигматизації та лематизації. Отже, якщо умова підтверджується наявністю відповідної аналізованому елементу відповіді словоформи у словнику, тоді вхідному слову приписується увесь набір граматичних параметрів відповідної словоформи із бази даних.

У тому випадку, коли умова не підтверджується, тобто ідентичність не встановлено, потрібно визначити причину виникнення такої проблеми і виконати операції щодо її усунення.

Отже, відсутність однозначної відповіді на задану умову може виникнути через низку причин. Однією з таких проблем здійснення адекватного морфологічного аналізу природномовної відповіді є можливість написання студентом слів у тексті з помилками, які можуть виявлятися у вигляді пропуску, вставки, заміни, транспозиції графеми. Тоді модуль морфологічного аналізу не може правильно інтерпретувати вхідну словоформу та, відповідно, ідентифікувати її з існуючими елементами із таблиці бази даних. Для розв'язання проблеми обробки неправильно написаних слів у дисертаційному дослідженні запропоновано використовувати метрику Левенштейна, удосконалений алгоритм якої (див. розділ 3) дозволяє здійснити аналіз таких словоформ, виправити їх і привести до словникового вигляду. Після виконання зазначеної процедури виправлена словоформа отримує набір граматичних характеристик ідентичної словоформи зі словника бази даних.

Поряд із неправильним написанням слова, студент, відповідаючи на запитання тесту, може вжити абревіатуру, скорочення, власну назву тощо. Проте робота стандартного морфологічного аналізатора/лематизатора має такі недоліки:

під час обробки абревіатур, система приводить їх до нижнього регістру і, відповідно, далі аналізує їх як звичайні словоформи, що призводить до некоректних результатів;

під час обробки скорочень програма відкидає розділові знаки (у тому числі крапку) і аналізу підлягає лише частина словоформи;

зникає окремий клас власних назв, оскільки великі літери замінюють на малі, що в деяких випадках може спричинити неправильну інтерпретацію семантики тексту.

Тому для ідентифікації та коректної обробки таких словоформ було створено відповідні таблиці бази даних: “Абревіатури” (Ta)“Скорочення” (Tsk), “Власні назви” (Tv). Вхідний текст у вигляді відповіді студента, в цьому випадку підлягає перевірці на наявність мовних одиниць із вищезгаданих баз даних, за рахунок чого усуваються наведені вище недоліки морфологічного аналізатора і підвищується ефективність та об'єктивність оцінювання. Тобто в розглянутому випадку додатково перевіряються умови Wi Ta, Wi Tsk і Wi Tv. Якщо належність до баз даних встановлено, вхідним словам приписується граматична інформація їх відповідників із вищезгаданих таблиць.

Існує ще одна проблема, яка надає неоднозначності процесу інтерпретації природномовних елементів, зокрема явище омонімії флективної мови. Тоді вхідна словоформа може зустрічатися в декількох таблицях бази даних “Словозмінний словник” або декілька разів зустрічатися в одній і тій самій таблиці, коли словоформи за написанням збігаються, але при цьому мають різні граматичні характеристики. Таку проблему запропоновано подолати шляхом застосування додаткової бази даних що містить морфологічний словник української мови, в якому перераховані всі формальні ознаки (квазіфлексії, префікси), за допомогою яких весь набір лексичних одиниць української мови поділяється на підмножини слів з відповідними властивостями - ці підмножини носять назву парадигматичних класів. Адже кожна лексема може бути представлена у вигляді комбінації незмінної та змінної складових:

де незмінна частина лексеми (квазіоснова); - змінна частина лексеми (квазіфлексія); конкатенація [79, с. 223].

До одного парадигматичного класу входять лексеми, які мають однакові набори квазіфлексій для всіх граматичних форм, а відрізняються лише незмінною складовою (квазіосновою). Отже, слова з одного класу еквівалентності мають й однакові правила словозміни [79, с. 225].

Базу даних лінгвістичної підсистеми інтелектуальної системи оцінювання знань організовано у вигляді сукупності таблиць, що мають реляційну структуру, тобто репрезентують відношення між елементами бази даних.

Таким чином, результатом здійснення морфологічного аналізу текстової відповіді є набір словоформ, для кожної з яких визначено його частиномовну належність і такі граматичні характеристики як відмінок, число, рід, час, спосіб, особа, тобто морфологічна інформація, за допомогою якої встановлюються синтагматичні відношення між словами, необхідні для здійснення наступного етапу синтаксичного аналізу. У результаті роботи лематизатора у кожного слова у вхідній інформації виділяються основи (леми), які в подальшому підлягають обробці за допомогою латентно-семантичного аналізу.

У роботі модуля морфологічного аналізу ми застосували метрику Левенштейна для розпізнавання та виправлення слів, написаних з помилками (вставки, заміни, пропуску, транспозиції). Перевагою даного методу також є те, що він дозволяє встановлювати обмеження на кількість можливих у відповіді помилок, що сприяє адекватному оцінюванню знань того, хто навчається.

Однак для усунення певних помилок необхідно враховувати лексичний контекст за допомогою синтаксичного аналізу.

Результати роботи морфологічного блоку надходять на вхід роботи синтаксичного аналізатора (рисунок. 4.5) у вигляді набору лексико-граматичних характеристик словоформ. Метою блоку синтаксичного аналізу є побудова синтаксичної структури речень тексту відповіді і передбачає встановлення функціональної ролі кожної лексеми в реченні й аналіз зв'язків між ними.

Размещено на http://www.allbest.ru/

На етапі передсинтаксичного аналізу є доцільним проведення синтаксичної сегментації, завданням якої є, насамперед, зменшення кількості омонімів, які відповідають кожній словоформі. Наприклад, якщо певне дієслово може бути як дієприкметником так і прикметником, тоді слід проаналізувати наступне після нього слово. Якщо воно виявиться дієсловом, то слово буде дієприкметником, якщо ж наступне слово є прикметником або іменником, то дане слово швидше за все буде прикметником. За подібними правилами відбувається скорочення кількості можливих варіантів.

Також на даному етапі відбувається виділення синтаксичних конструкцій за низкою заданих параметрів пошуку фрагментів, формування фрагментів та списку виключень.

Після виконання процедури сегментації речення здійснюється встановлення зв'язків між словами в цих сегментах. На даному етапі важливо подолати явище синтаксичної омонімії, спричинені лексико-морфологічною багатозначністю і неоднозначністю правил синтаксичного аналізу [161, с. 48].

Синтаксична структура речення в результаті синтаксичного аналізу подається у вигляді дерева залежностей. Для кожного елемента-вершини аналізованого ланцюжка вказується елемент, що ним керує, і тип зв'язку між ними (окрім джерела-вершини графа). Під час створення наборів зв'язків між словами використовується метод фільтрів. Для встановлення синтаксичних зв'язків між словами речення аналізуються пари слів та відсіюються неіснуючі зв'язки між словоформами. Щоб покращити ефективність роботи синтаксичного аналізатора доцільно поєднувати його з процедурами семантичного аналізу тексту.юб, що дозволяє за рахунок розуміння семантичної інформації тексту частково долати явища неоднозначності синтаксичних та почасти і морфологічних характеристик. Зауважимо, що синтаксичний аналіз у нашій роботі здійснюється лише фрагментарно та у досить елементарній формі; удосконалення синтаксичного аналізатора ми залишаємо на перспективу.

Найбільш складною та проблематичною є процедура семантичного аналізу вхідної текстової інформації, основним завданням якої є екстракція семантики із природно мовної відповіді студента і вираження її внутрішньою мовою системи. Семантична характеризація тексту неможлива без інтерпретації предметної сфери, що у свою чергу сприяє зменшенню багатозначності предметної сфери.

Вважається, що проблема семантичної багатозначності теоретично принципово повністю вирішена бути не може, оскільки смисл (семантика) - поняття безперервне, яке вирішується за допомогою мови, що є дискретною структурою. Практично ця проблема вирішується на відносному рівні, що визначається глибиною семантичного аналізу.

При традиційно-лінгвістичному підході для зменшення або усунення багатозначності вводять семантичні категорії і посилання, що одержані із бази знань предметної сфери. Семантичні категорії є наступним по глибині шаром під синтаксичним. Якщо при синтаксичному аналізі використовують класи іменників, прикметників і т. д., то при першому рівні семантичного аналізу вводять підкласи, наприклад, істота, неістота, абстрактний, фізичний тощо. Можна створювати і наступні рівні, що деталізують предметну сферу.

Семантичний аналіз здійснюється у нашій праці також у рамках удосконаленого алгоритму методу латентно-семантичного аналізу, який описаний у попередньому розділі дисертаційного дослідження.

Функціональні структури модулів морфологічного, синтаксичного, семантичного та прагматичного аналізу побудовані таким чином, що вихідна інформація (дані) попереднього модуля є вхідною для наступного.

4.2 Системи керування базами даних

В основу побудови сучасних інформаційно-комунікаційних систем покладено принцип централізованого зберігання (значною мірою і обробки) інформації. Використання цього принципу суттєво спрощує побудову таких систем. Зокрема, в такий спосіб розв'язується проблема синхронізації, оскільки вся інформація зберігається централізовано і окремі автоматизовані робочі місця отримують, за необхідності, до неї доступ. Завдяки централізованому зберіганню інформації суттєво симпліфікується адміністрування системи (ведення обліку користувачів, розмежування прав доступу, облік класифікаторів тощо) [48].

Головною технологією, що реалізує принцип централізованого зберігання інформації, є технологія баз даних, доступ до яких забезпечується засобами систем керування базами даних (СКБД). Всі центральні компоненти керування розміщуються на сервері. Загальну структуру ІСОЗ зображено на рисунку 4.4.

Размещено на http://www.allbest.ru/

Рисунок 4.4 - Загальна структура ІСОЗ

Бази даних. У якості платформи для побудови інформаційної бази даних ІСОЗ було обрано систему керування реляційними базами даних MS SQL Server 2008 Express Edition. Вибрана платформа може забезпечити вирішення допоміжних задач, таких як автоматичне резервування інформації. СКБД MS SQL Server має можливість кластеризації, яка дозволяє розподілити базу даних на декілька серверів, що прискорює швидкість роботи з базою і підвищує стійкість до пошкоджень інформації. Основна мова запитів, яка використовується в Microsoft SQL Server - Transact-SQL, надає можливість використовувати додатковий синтаксис для процедур і забезпечуватиме підтримку транзакцій (взаємодію бази даних с додатками). Для підвищення ефективності адміністрування в SQL Server були включені бібліотеки Declarative Management Framework, які дозволяють розподіляти повноваження для баз даних або окремих таблиць. Були покращені методи компресії даних. Установка в якості платформи сервера баз даних MS SQL Server Express Edition дозволяє реалізувати підтримку всіх сучасних технологій СКБД [48].

Розробка інформаційного центру системи тестування передбачає, окрім вибору і встановлення СКБД, розробку бази (баз) даних. Розробка реляційної бази даних передбачає, в першу чергу формування таблиць з визначенням зв'язків (відношень) між ними. Таблиці описують окремі інформаційні об'єкти. Тому, при побудові бази (баз) даних системи тестування потрібно їх визначити.

Для забезпечення більшої гнучкості пропонується розділити зберігання інформації в декількох базах даних. У першій базі даних зберігається основна інформація, котра необхідна для проведення тестування (списки користувачів, назви тестів, перелік питань, варіантів відповідей тощо). Друга база даних виконує додаткові функції, що є корисними для навчального закладу. У цій базі зберігається інформація про предмети, їх тематику, навчальні заняття, викладачів та їх закріплення за навчальними групами тощо. Для забезпечення цілісності в таблицях визначені ключові поля і між окремими таблицями задані зв'язки (відношення). Наявність зв'язків (відношень) дозволяє навіть у випадку помилки попередити виконання некоректної операції з інформацією в базі даних.

Рисунок 4.5 - Структура бази даних з інформацією про тести

У табл. 4.1 наведено призначення основних полів.

Таблиця 4.1 - Опис полів бази даних ІСОЗ

Поле

Таблиця

Опис

Name

users

Ім'я користувача тестової системи

Famil

users

Прізвище користувача тестової системи

Otch

users

По-батькові користувача тестової системи

Login

users

Умовне ім'я користувача для входу в систему

Pass

users

Пароль користувача для входу в систему

isAdmin

users

...

Подобные документы

  • Проблеми лінгвістичного аналізу художніх творів. Мета лінгвостилістичного тлумачення - вивчення засобів мови у тексті. Методи проведення лінгвістичного аналізу на прикладі оповідання класика американської літератури XX ст. Дж. Стейнбека "The Pearl".

    курсовая работа [74,4 K], добавлен 28.10.2014

  • Теоретичні засади дослідження компресії як лінгвістичного явища при перекладі публіцистичного тексту. Механізм стиснення тексту на синтаксичному рівні. Єдність компресії та декомпресії під час перекладу газетних текстів з англійської мови українською.

    курсовая работа [63,8 K], добавлен 21.06.2013

  • Основні характеристики казки та значення цього виду літературного твору. "Морфологія казки" Проппа. Надсинтаксичні рівні одиниць тексту: супрасинтаксичний, комунікативний. Закони компресії тексту. Переклад як складова частина утворення вторинних текстів.

    дипломная работа [104,3 K], добавлен 06.12.2015

  • Принципи вибору перекладацьких стратегій при перекладі текстів типу інструкцій до технічного обладнання. Сучасний стан лінгвістичного та перекладацького аналізу в галузі дослідження перекладу тексту-інструкції як особливого виду міжнародного документу.

    курсовая работа [66,0 K], добавлен 29.11.2009

  • Основні аспекти лінгвістичного тексту, його структура, категорії та складові. Ступінь уніфікації текстів службових документів, що залежить від міри вияву в них постійної та змінної інформації. Оформлення табличних форм, опрацювання повідомлення.

    статья [20,8 K], добавлен 24.11.2017

  • Проблеми фразеології у світлі наукових парадигм. Аспекти лінгвістичного аналізу фразеологічних одиниць у мовознавстві. Класифікація фразеологічних одиниць. Культурологічний аспект аналізу фразем, які не мають лексичних відповідників, у системі слів.

    дипломная работа [105,4 K], добавлен 19.08.2011

  • Основні категорії та ознаки тексту, поняття типу тексту. Функціонально-семантичні особливості загадок, питання їх класифікації. Структурно-типологічні особливості загадки. Лінгвопоетична специфіка і особливості метафоричного переносу в німецьких загадках.

    дипломная работа [69,0 K], добавлен 21.03.2012

  • Головна, загальна мета створення будь-кого тексту - повідомлення інформації. Поняття іформаційної насиченості тексту та інформативності. Визначення змістовності тексту - встановлення співвідношення між висловлюванням і ситуацією, відбитою в ньому.

    реферат [28,3 K], добавлен 08.04.2011

  • Аналіз фонових знань перекладача, необхідних для роботи із текстами у галузі неврології. Переклад тексту з англійської мови на українську (історія хвороби). Розгляд головних перекладацьких прийомів, застосованих для перекладу термінологічних сполук.

    курсовая работа [95,1 K], добавлен 09.05.2012

  • Огляд проблеми багатозначності англійської мови. Морфологічний та синтаксичний аналіз тексту. Правила контекстного аналізу, які дозволяють зняти морфологічну омонімію. Коротка характеристика головних особливостей алгоритму прихованої Марківської моделі.

    курсовая работа [119,3 K], добавлен 06.06.2013

  • Порівняльно-історичне мовознавство другої половини XIX ст. продовжує вдосконалення прийомів наукового лінгвістичного аналізу. Встановлюються зв'язки мовознавства з іншими науками, формуються нові школи: натуралізм, психологізм, молодограматизм.

    реферат [27,9 K], добавлен 14.08.2008

  • Основні поняття лінгвістики тексту, його категорії, ознаки та проблема визначення. Функціонально-семантичні та структурно-типологічні особливості загадок, їх класифікація. Поняття типу тексту. Особливості метафоричного переносу в німецьких загадках.

    дипломная работа [129,6 K], добавлен 01.02.2012

  • Ресурси реалізації лексико-семантичних аспектів у перекладах художніх творів на українську мову шляхом їх порівняно-порівняльного аналізу. Національно-культурні та мовні особливості тексту аналізованого твору, способи їх передачі на українську мову.

    курсовая работа [133,1 K], добавлен 24.03.2015

  • Текст як спосіб організації значень, структуризації смислової інформації. Закономірності формування когнітивної структури в семантичній пам'яті на підставі стосунків інтерпретації і репрезентації. Когерентні засоби. Критерії оцінювання зв'язності тексту.

    реферат [17,8 K], добавлен 08.04.2011

  • Ознаки релігійного дискурсу. Протестантська проповідь як тип тексту. Лінгвокультурна адаптація тексту релігійного характеру при перекладі. Особливості використання перекладацької адаптації англомовної проповіді при відтворенні українською мовою.

    дипломная работа [166,6 K], добавлен 22.06.2013

  • Проблема лінгвістичного аналізу художнього твору як одна з найактуальніших у сучасній філології. Функціональна літературно-книжкова лексика як неоднорідні групи слів, роль та значення в ній поетизмів. Місце фразеологічних поетизмів в англійській мові.

    контрольная работа [21,9 K], добавлен 28.07.2009

  • Лексика і лексикологія. Термінологія як наука про слова фахової лексики. Особливості перекладу термінів у професійному мовленні. Дослідження знань термінів напрямку "Машинобудування". Специфіка аналізу способів перекладу термінів технічної терміносистеми.

    курсовая работа [63,4 K], добавлен 06.03.2015

  • Опис психологічних особливостей сприйняття тексту. Тлумачення змісту малозрозумілих елементів тексту. Трактування поведінки персонажа та його мотивів, виходячи з власного досвіду та існуючих теорій. Проектування своїх уявлень, відчуттів на художні образи.

    презентация [228,6 K], добавлен 03.03.2016

  • Підструктури тексту як моделі комунікативного акту. Співвідношення авторського та читацького дискурсів на основі аналізу поетичних творів. Дискурс як складова комунікативного акту. Особливості поетичного твору. Проблематика віршованого перекладу.

    дипломная работа [89,2 K], добавлен 16.09.2011

  • Текст як добуток мовотворчого процесу, що володіє завершеністю. Історія формування лінгвістики тексту. Лінгвістичний аналіз художнього тексту. Інформаційна самодостатність як критерій тексту. Матеріальна довжина текстів. Поняття прототипових текстів.

    реферат [25,1 K], добавлен 30.01.2010

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.