О модели семантических связей для дидактического двуязычного словаря

Описание формального языка для представления лексики с учетом структурных семантических связей между лексическими единицами. Проект создания интеллектуальной системы обучения иностранному языку с использованием электронного семантического словаря.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 17.01.2018
Размер файла 28,9 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

О МОДЕЛИ СЕМАНТИЧЕСКИХ СВЯЗЕЙ ДЛЯ ДИДАКТИЧЕСКОГО ДВУЯЗЫЧНОГО СЛОВАРЯ

Н.О. Подмаркова

В работе описывается формальный язык для представления лексики с учетом структурных семантических связей между лексическими единицами. Данная работа - часть проекта по созданию интеллектуальной системы, которая должна стать вспомогательным средством при изучении иностранного языка. Система должна основываться на семантическом словаре, тематически группировать изучаемую лексику и генерировать некоторые словосочетания и предложения.

язык формальный лексика электронный словарь

Введение

Конечной целью проекта, теоретические аспекты которого рассматриваются в данной работе, является создание интеллектуальной системы для обучения иностранному языку. В основе такой системы должен лежать электронный семантический словарь. Предполагается, что система будет включать генератор простых текстов (предложений и словосочетаний).

1. Формальный язык для семантического словаря

Постулат 1: Мы предполагаем, что существует внеязыковой универсум разнородных сущностей; каждая сущность имеет некоторый непустой набор свойств.

Мы рассматриваем сущности, как совокупности присущих им свойств, при этом и «сущности» и их «свойства» понимаются в очень широком смысле. Каждому уникальному свойству мы сопоставляем некоторый маркер метаязыка. Множество маркеров метаязыка конечно, но его границы a priori не заданы. Назовем такие маркеры базовыми термами. По индукции из базовых термов при помощи вводимых ниже обозначений операций строятся другие термы. Подразумевается, что каждому уникальному имени терма сопоставлен уникальный смысл. Каждому смыслу терма соответствует множество его потенциальных референтов, которое можно считать значением терма. Из термов и символов вводимых ниже отношений строятся атомарные формулы.

Зададим алгебраическую систему A=<V;Op;R>, где:

V - множество «смыслов» термов

Op - конечное множество операций {, [], |, л,,~}

R - конечное множество отношений {«=», «есть», «структурно связан с», «структурно связано с» … «посредством» …}

1.1 Отношения

1.1.1 Отношение «=». Отношение равенства понимается «обычным» образом. Оно является рефлексивным, симметричным и транзитивным и обладает свойством подстановочности.

1.1.2 Отношение «есть». Ранее говорилось о том, что сущности внеязыкового универсума обладают свойствами. Запись a «есть» b в частности значит, что «a обладает свойством b». Выражение а «есть» b верно тогда и только тогда, когда справедливо следующее утверждение: если х принадлежит множеству возможных референтов а, то х принадлежит множеству возможных референтов b.

Констатация того факта, что некоторое х принадлежит множеству возможных референтов терма t осуществляется экспертами: про каждые две сущности a и b эксперт должен сказать, верно, ли, что a «есть» b или нет. Тип связи «есть» -- это пример связи «is_a», широко используемой в семантических сетях, тезаурусах и классификационных информационных системах. Отношение «есть» является отношением нестрогого частичного порядка, т.е. оно рефлексивно (например, человек «есть» человек), транзитивно (например, если врач «есть» человек и человек «есть» живое существо, то врач «есть» живое существо) и антисимметрично (если a «есть» b и b «есть» a то a = b).

Верны следующие соотношения:

a = b a «есть» b,

а = b b «есть» а.

1.1.3 «Структурные» отношения. Понятие структуры

Пусть одна или более сущностей F1,…,Fn как-либо связанны по смыслу с некоторой сущностью K таким образом, что при элиминации K объяснить смысл сущностей F1,…,Fn будет сложно или невозможно, и при этом данная связь отлична от связи отношения «есть». Тогда мы будем называть такую совокупность сущностей структурой с ядром K, а сущности F1,…,Fn - структурными составляющими. Структуру с ядром К будем для краткости называть структурой К.

Любая сущность может быть ядром (или играть роль ядра) некоторой структуры, состоящей из других сущностей, и при этом любая сущность сама может быть частью (или играть роль части) иной структуры. Структуры можно понимать, как фреймы, у которых есть некоторое заранее неизвестное количество слотов. Чаще всего структуры - это продукт мысли, особый способ рассмотрения некоторой части реальности. Структурными являются отношения между целым и частями, между действием и его актантами. Сущность A структурно связана с сущностью B, если, например, сущность B выполняет какую-то функцию по отношению к A, или является внешним проявлением A, или является направленным на A типичными действием и проч.

1.1.3.1 Отношение «структурно связан с». Для любой структурной составляющей Fi некоторой структуры K имеет место бинарное отношение Fi «структурно связано с» K. Это отношение является отношением эквивалентности, т.е., оно рефлексивно, транзитивно и симметрично (A структурно связано с A; если A связано с B и B связано с C, то A связано с C; если A связано с B, то B связано с A) .

1.1.3.2 Отношение «структурно связан с»… «посредством…». Для любой структуры K и её структурной составляющей Fi существует «свойство» G, описывающее то, каким образом связаны K и Fi. Эту связь мы обозначаем тернарным отношением: Fi «структурно связано с» K «посредством» G.

Если мы фиксируем G, то мы получаем новое отношение Fi «G-связано c» K. Это отнашение обладает свойством транзитивности и как правило является иррефлексивным. То есть, вообще говоря, это отношение будет отношением предпорядка, в некоторых случая оно будет отношением строгого или нестрогого частичного порядка.

Пример 1. Некоторые структуры и их составляющие (напомним, что названием структуры служит «ядро»):

Табл. 1.

Пример составляющей (Fi)

Название связи (G)

Ядро структуры (K)

яблоко

плод

яблоня

родитель

активный участник, Agence

рождение

ребенок

(в некотором смысле) пассивный участник, Pacience

рождение

женоненавистник

ненавидящий субъект

женщина

лечить

делать (change to)

здоровый

«ква»

приписываемый звук

лягушка

клаустрофобия

боязнь

паук

крышка

закрыватель

кастрюля

Верно, что:

t «структурно связан с» b и b «есть» d t «структурно связан с» d (например, если: яблоко «структурно связано с» яблоня и яблоня «есть» дерево, то яблоко «структурно связано с» деревом).

f «структурно связан с» k «посредством» g f «есть» g (например, яблоко «есть» плод, клаустрофобия «есть» боязнь).

1.2 Операции

1.2.1 Операция (семантическое сложение). На «смыслах» термов задана бинарная операция «» : VЧV>V, интуитивно понимаемая, как «добавление смысла». Множество возможных референтов терма ab является пересечением множеств потенциальных референтов терма a и терма b .

Правила:

c «есть» a b c «есть» a,

c «есть» a b c «есть» b,

с «есть» a и с «есть» b с «есть» a b.

То есть, если a и b - это некоторые смыслы и c = a b , то с - это некоторый смысл, включающий в себя смыслы a и b и ничего кроме них.

Перечисленные правила можно рассматривать, как правила вывода некоторого исчисления атомарных формул.

Операция «» идемпотентна, коммутативна и ассоциативна.

Пример 2. Пусть описание лексической единицы мужчина выглядит следующим образом: мужчина «есть» человек мужского пола. Тогда по правилам верно также, что: мужчина «есть» человек и мужчина «есть» мужского пола.

1.2.2 Операция [] (выбор структурной составляющей). Для описания связи между структурами и структурными составляющими на «смыслах» термов задается бинарная операция [] : VЧV> V.

Запись f «есть» g[h] означает, что верно, что f «структурно связан с» h «посредством» g.

Для «…[...]» верно, что:

f «есть» t[b] f «есть» t,

f «есть» t[b] f «структурно связан с» b,

f «есть» t и f «структурно связан с» b «посредством» t f «есть» t[b].

Операция …[…] является аналогом операции аппликации в -исчислении, используемом в формальной семантике.

Пример 3. Пусть имеется такое описание лексической единицы яблоко: яблоко «есть» плод[яблоня]. Тогда верно также, что: яблоко «есть» плод и яблоко «структурно связан с» яблоня.

Пример 4. Пусть имеется терм судостроитель, такой, что судостроитель «есть» строитель[cудно]. Тогда верно и то, что судостроитель «есть» строитель и судостроитель «структурно связан с» cудно.

1.2.3 Операция | : VЧV> V. На «смыслах» термов задана бинарная операция |. Если для множества F возможных референтов терма f и множества T возможных референтов терма t верно, что их объединение является подмножеством множества возможных референтов S терма s, то есть, FT S, то верно, что f|t «есть» s. Если FT и S совпадают, то s=f|t.

Для операции «|» верно, что:

a|b «есть» c a «есть» c и b «есть» c.

Пример 5. Дрозд|канарейка|ласточка|синица «есть» птица.

Эта операция позволяет при необходимости давать денотативные определения понятий через перечисление их представителей, как, например, «птица - это синица, ласточка, канарейка, дрозд или др.»

Операция | идемпотентна, коммутативна и ассоциативна

1.2.4 Унарный оператор отрицания ~. На «смыслах» термов задан унарный оператор ~ : V>V. Для терма t запись ~ t означает, что ни один из элементов множества возможных референтов терма t не входит в множество возможных референтов терма ~t.

Пример 6.

брат[y] = ~ y сын[отец[y]] сын[мать[y]]

сводный_брат_по_матери[y] = ~yсын[мать[y]] ~сын[отец[y]]

Для оператора «~» верны утверждения:

a = b[n] и c = b[n] а «есть» с,

a = b[n] и c = b[n] с «есть» а.

Определение: Назовем вхождение переменнной х в терм t связанным, если оно находится в выражении лх.t или х.t (операторы л и будут описаны ниже). В ином случае вхождение переменной х в терм t назовем свободным.

Введем следующее обозначение: если нас интересует некоторый терм t в связи с вхождениями в него переменной х, то мы будем обозначать его через t(х). Тогда через t(a) будем обозначать результат замены в терме t переменной х на терм а во всех свободных вхождениях. Заметим, что t и t(х) это один и тот же терм. (Например, терм t = брат[х] можно обозначить, как t(х) подчеркнув тем самым наличие в этом терме переменной. )

1.2.5 Лямбда-оператор л (оператор абстракции). Если х-переменная, t-терм, то через лх.t или лx.t(x) или лx{t(x)} мы обозначим функцию F такую, что F[a] = t(a), т.е (лx.t(x))[a] = t(a).

Пример 7. брат = лy{брат[y]}

1.2.6 Йота-оператор (оператор дескрипции). Если х - переменная, содержащаяся в терме t, то запись х.t(х) или х{t(х)} понимается, как «именно тот х, который есть t». Для йота-оператора верно уверждение:

y = х.t(x) y «есть» t(y).

Пример 8. Если отцеубийца = x{убийца[отец [x]]} то также верно, что отцеубийца «есть» убийца отца[отцеубийцы] .

2. Числовые термы. Антонимия

Для определения некоторых семантических соотношений, в частности, антонимии, в метаязык в качестве базовых термов мы вводим обозначения вещественных чисел. Числа в качестве термов нас интересуют потому, что они обладают выразительными свойствами для описания порядка и отношения «оппозиции».

Пусть считается, что два терма s6 и s9 находятся в оппозиции по отношению друг к другу, способны разбивать некоторое множество обозначаемых сущностей на непересекающиеся подмножества (например, правое» - «левое», «верх» - «низ»). Тогда в метаязык вводится некоторый терм s0 (который может быть не выражен в естественном языке, и тогда нам нужно «придумать» его). Терм s0 понимается, как некоторый домен свойств s6 и s9, при этом s6=s0 [n1], а s9=s0[n2], где n1 и n2 -- это числовые термы, такие, что они равны по модулю и противоположны по значению. Для любого числового терма n верно, что: - n ~ n.

Пример 9.

мужск_ «есть» пол[+1] ,

высоченн_«есть» рост[+1.5]

высок_ «есть» рост[+1] ,

средн_ «есть» рост[0] ,

женск_ «есть» пол[-1],

низк_ «есть» рост[-1],

низенький_ «есть» рост[-1.1] ,

небольшой_ «есть» рост[-0.9]

3. Термы и слова естественного языка. Части речи

Термы строятся таким образом, чтобы их можно было сопоставить словам естественного языка. Полисемия слов разрешается путем приписывания различным смыслам слов уникальных индексов, как это принято делать в словарях. Понятие частей речи, выраженные в естественном языке грамматически, в нашем метаязыке выражены на семантическом уровне, то есть, для соответствующих частей речи у нас заданы термы noun, verb, adjective и др. Тогда терму t = t1 noun будет сопоставляться некоторое существительное, терму t = t1 verb - некоторый глагол и т.д.

4. Генерация предложений

Напомним, что практической целью данной работы является создание интеллектуальной системы для обучения иностранному языку. При изучении языка распространен такой дидактический принцип, как тематическая группировка лексики. Так, можно изучать «лексику цвета», дни недели, названия месяцев, названия основных человеческих чувств, эмоций, названия профессий и проч. Для «отработки» новой лексики часто предлагаются упражнения, состоящие из простых предложений, основанных на этой лексике.

Пример 10. Предложения на запоминание лексики, связанной с темой «одежда»:

Маша надела платье.

Сергей надел костюм.

Иван Петрович надел пальто и шляпу. и др.

Такие предложения можно представить в виде цепочки Х V С Y, где X принадлежит типу ЧЕЛОВЕК, V - это глаголы, относящиеся к типу ОДЕВАНИЯ, С - факультативная позиция для прилагательного ЦВЕТА, а Y - одно или несколько слов, относящихся к типу ОДЕЖДА.

Чтобы определить, какие лексические единицы относятся к типу ЧЕЛОВЕК, мы должны найти все термы ti, для которых верно, что ti «есть» ЧЕЛОВЕК. Тогда для любого терма t, если t «есть» ЧЕЛОВЕК, то существительное, сопоставленное этому терму может занять позицию Х в вышеприведенной цепочке. Аналогично для других позиций (Y, C и V).

Используя введенный в данной работе формализм, мы можем представлять в словаре лексику, сохраняя существующие в языке структурные семантические связи. По запросу мы сможем автоматически получать необходимые лексико-семантические группы, и по некоторому шаблону генерировать нужные для дидактических целей предложения.

Список литературы

[Апресян, 1970] Апресян Ю.Д. Лексическая семантика. Синонимические средства языка. - М.: Наука, 1970.

[Арутюнова, 1980] Арутюнова Н. Д. Аспекты семантических исследований. - М.: Наука, 1980

[Борщев, Кнорина, 1990] Борщев В. Б., Кнорина Л. В. Типы реалий и их языковое восприятие // Вопросы кибернетики. Язык логики и логика языка.

[Заде, 2001] Заде Л.А. Роль мягких вычислений и нечеткой логики в понимании, конструировании и развитии информационных/интеллектуальных систем // Новости искусственного интеллекта, №2-3, 2001.

[Карнап, 2000] Карнап Р. Значение и необходимость : Исследование по семантике и модальной логике / Рудольф Карнап ; пер. с англ. Н. В. Воробьев; общ. ред. Д. А. Бочвар ; предисл. С. А. Яновская . - Биробиджан : Тривиум, 2000.

[Кобозева, 2004] Кобозева И. М. Лингвистическая семантика: Учебник. Изд. 2-е. Едиториал УРСС, 2004.

[Кронгауз, 2001] Кронгауз, М.А. Семантика : Учебник для вузов. - М.: РГГУ, 2001.

[Лайонз, 2004] Лайонз Дж. Язык и лингвистика. Вводный курс: Пер. с англ. И.А. Муравьевой и Е.Г. Устиновой. - М.: Едиториал УРСС, 2004.

[Мельчук, 1974] Мельчук И.А. Опыт теории лингвистических моделей "Смысл-текст". - М.: Наука, 1974.

[Парти, 1983] Парти Б.Х. Грамматика Монтегю , мысленные представления и реальность / Пер. с англ. В.З.Демьянков // Семиотика . Сост. Ю.С.Степанов. - М.: Радуга, 1983.

[Эко, 2005] Эко У. Роль читателя: Исследования по семиотике текста. / Пер. с англ. и итал. Серебряного С. - СПб.: symposium, - М.: РГГУ, 2005.

Размещено на Allbest.ru

...

Подобные документы

  • Классы и группы моделей представления знаний. Состав продукционной системы. Классификация моделей представления знаний. Программные средства для реализации семантических сетей. Участок сети причинно-следственных связей. Достоинства продукционной модели.

    презентация [380,4 K], добавлен 14.08.2013

  • Необходимость создания словаря по технологии для школьников. Основные этапы, требования и особенности создания электронного словаря. Использование морфологического анализа для оформления и дизайна. Принципы создания веб-страниц в Microsoft Publisher.

    творческая работа [2,0 M], добавлен 17.11.2009

  • Представление знаний в когнитологии, информатике и искусственном интеллекте. Связи и структуры, язык и нотация. Формальные и неформальные модели представления знаний: в виде правил, с использованием фреймов, семантических сетей и нечетких высказываний.

    контрольная работа [29,9 K], добавлен 18.05.2009

  • Этапы разработки синтаксических и лексических анализаторов, семантических процедур для сканера, а также проектирование алгоритма, реализующего синтаксический анализ методом простого предшествования с помощью языка программирования высокого уровня.

    курсовая работа [286,6 K], добавлен 24.09.2010

  • Анализ существующих программных решений для обучения студентов и контроля их знаний. Обзор лингвопроцессорных средств и обоснование их выбора. Алгоритмы решения и проверки упражнений на именную часть русского языка. Применение правил преобразования.

    курсовая работа [97,0 K], добавлен 29.01.2015

  • Семантические сети как модели представления знаний. Основные методы определения сходства графовых моделей систем. Метод решения задач определения сходства семантических сетей на основе их сложности. Разработка алгоритмов и их программная реализация.

    дипломная работа [1,3 M], добавлен 17.12.2011

  • Описание проектного решения стратегической системы, этапы объектно-ориентированного анализа и проектирования. Описание связей между объектами. Программная реализация, построение модели состояний объекта. Руководство пользователя и описание программы.

    курсовая работа [388,8 K], добавлен 17.11.2011

  • Учебный процесс современных обучающих технологий. Использование компьютерных технологий на уроках иностранного языка. Преимущества и недостатки обучения с помощью ПК. Методические функции, выполняемые компьютером при обучении иностранному языку.

    реферат [28,9 K], добавлен 27.05.2009

  • Описание сервиса электронного кафе и определение основных требований к системе. Модели вариантов использования, состояний, последовательности, классов, компонентов и развертывания. Описание алгоритмов, реализующих бизнес-логику серверной части.

    курсовая работа [3,3 M], добавлен 23.12.2014

  • Описание сервиса электронного кафе и определение требований к системе. Модели представления данных и их описание. Обоснование оригинальных решений по использованию технических и программных средств. Результаты тестирования разработанной системы.

    курсовая работа [6,1 M], добавлен 20.12.2014

  • Обзор образовательных стандартов педагогического образования в области искусственного интеллекта. Построение модели предметной области в виде семантических сетей. Характеристика проблемного обучения. Основные средства языка программирования Пролог.

    дипломная работа [387,8 K], добавлен 01.10.2013

  • Необходимость разработки технологий для оптимального использования компьютерных возможностей. Эффективность гипертекста в экономике на примере словаря экономических терминов, возможности Excel, ознакомление с языком программирования Visual Basic.

    курсовая работа [391,3 K], добавлен 14.01.2009

  • Понятие иерархической структуры декомпозиции работ. Определение, просмотр и изменение кода структуры проекта. Типы связей между работами, их редактирование при помощи программы MS Project. Изменение формы и параметров представления суммарной задачи.

    презентация [4,0 M], добавлен 15.03.2014

  • Анализ предметной области с использованием моделей методологии ARIS и разработка ER-диаграммы. Описание входной и выходной информации для проектирования реляционной базы данных. Разработка управляющих запросов и связей между ними с помощью языка SQL.

    курсовая работа [975,2 K], добавлен 30.01.2014

  • История создания методологии SADT, ее сущность и процедура. Состав, типы связей между функциями. Построение IDEF0 модели для автоматизации деятельности магазина "Ластик". Описание предметной области. Применение SADT для моделирования деятельности.

    контрольная работа [450,1 K], добавлен 24.12.2013

  • Проектирование экспертной системы выбора нейронной сети. Сущность семантических сетей и фреймов. MatLab и системы Фаззи-регулирования. Реализация программы с использованием пакета fuzzy logic toolbox системы MatLab 7. Составление продукционных правил.

    курсовая работа [904,4 K], добавлен 17.03.2016

  • Определение понятия CASE-технологий. Использование комплексного инструментария ER/Studio для создания логической и физической модели данных, генерирования баз данных на платформе СУБД Access. Процедура добавления атрибутов и сущностей, создания связей.

    контрольная работа [2,2 M], добавлен 21.12.2011

  • Разработка словаря, содержащего термины по патентоведению, в виде базы данных. Систематизация данных путем разделения текста на отдельные файлы по буквам алфавита. Создание файла "Содержание" с гиперссылками для обеспечения быстрого доступа к информации.

    презентация [278,1 K], добавлен 16.10.2013

  • Изучение особенностей структурного программирования и процесса применения многомодульности оконного интерфейса приложения. Описание внутренних переменных модуля. Рассмотрение и характеристика преимуществ современных интегрированных сред разработки.

    контрольная работа [487,0 K], добавлен 05.07.2017

  • Создание электронного филологического словаря. Использование не реляционной базы данных. Средства JavaScript для создания интерактивности на странице. Серверный язык программирования PHP. Специфика словарной статьи. Взаимодействие с базой данных.

    курсовая работа [689,9 K], добавлен 26.02.2015

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.