Моделирование процесса обучения человека с помощью построения графа модели мира
Описание подхода к моделированию обучения человека с помощью построения графа модели мира на примере обучения системы переводу с естественного языка на другой. Обработка массива пар текстов. Программное принятие решений в условиях неопределенности.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 21.12.2021 |
Размер файла | 2,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Моделирование процесса обучения человека с помощью построения графа модели мира
Курьян В.Е.
Аннотация
В работе описан подход к моделированию обучения человека с помощью построения графа модели мира на примере обучения системы переводу с одного естественного языка на другой. Построение модели мира производится автоматически на основе обработки массива пар текстов на входном и выходном языках. В основе подхода лежит представление ситуации, описываемой во входном тексте, в виде поддерева общей модели мира на входном языке. По этому поддереву на входном языке выбирается поддерево модели мира на выходном языке. Поддерево на выходном языке преобразуется в обычный текст, который и является переводом исходного текста.
Ключевые слова
Дерево модели мира, машинный перевод, генерация текста.
Annotation
Kuryan V.E.
MODELING THE PROCESS OF HUMAN LEARNING BY CONSTRUCTING A GRAPH MODEL OF THE WORLD
The paper describes an approach to modeling human learning by constructing a graph of a world model using the example of teaching a system to translate from one natural language to another. Building a model of the world is made automatically based on the processing of an array of pairs of texts in the input and output languages.The approach is based on the representation of the situation described in the input text as a subtree of the general model of the world in the input language. From this subtree in the input language, select the subtree of the world model in the output language. The subtree in the output language is converted into plain text, which is the translation of the source text.
Keywords
World model tree, machine translation, text generation.
Введение
В настоящее время одной из актуальных задач при разработке систем искусственного интеллекта является создание систем, обучающихся действовать во внешнем реальном мире аналогично человеку. Схематично интеллектуальную систему (естественную или искусственную) можно представлять состоящей из нескольких весьма общих компонент: рецепторов (сенсоры, которые получают информацию о состоянии внешнего мира и самой системы), эффекторов (исполнительные механизмы, которые производят действие системы на внешний мир), устройства, принимающего решение (мозг или компьютер), действий, которые должны произвести эффекторы на основе полученной от рецепторов информации. Если в качестве рассматриваемой системы выступает человек, то в качестве рецепторов можно рассматривать органы чувств человека, а в качестве эффекторов - тело человека (в частности, конечности, которые выполняют перемещения и другие действия). Если речь идет об искусственной системе, к примеру о беспилотном автомобиле, то в качестве рецепторов выступают его видеокамеры, лидары, прочие датчики, в качестве эффекторов - исполнительные механизмы регуляторов, такие как регулятор скорости, угла поворота и т.п. В этом случае задача построения интеллектуальной системы управления беспилотного автомобиля сводится к построению системы, которая по информации от рецепторов (датчиков автомобиля) будет выдавать команды эффекторам (менять скорость, угол поворота и другие параметры автомобиля). В случае применения предлагаемого подхода к сложной народнохозяйственной системе в качестве входных сигналов с рецепторов можно рассматривать статистические данные, характеризующие социально-экономические явления, экономическую конъюнктуру, деловую активность, тренды и циклы развития социально-экономических процессов и явлений. В качестве выходных сигналов можно рассматривать управленческие и инвестиционные решения. Можно сказать, что система управления осуществляет перевод входных сигналов, полученных с рецепторов, на язык выходных сигналов (управляющих воздействий на эффекторы). Иными словами, мы хотим построить функцию, отображающую входные сигналы в выходные. При этом считаем, что состояние самой системы описывается входными параметрами (часть входных параметров описывает состояние самой системы), выходные параметры зависят не только от текущих значений входных параметров, но и от истории изменения входных параметров. Это самая общая постановка задачи. Мы хотим, чтобы такое отображение было максимально похожим в некотором смысле на отображение, которое осуществляет человек.
К такой постановке задачи сводятся очень важные с практической точки зрения проблемы: разработка перспективных вариантов развития предприятий и организаций, отраслей экономики, управление беспилотными транспортными средствами, медицинская диагностика, перевод с одного естественного языка на другой и многие другие задачи. К примеру, в случае медицинской диагностики входными параметрами являются результаты медицинских анализов, данные ЭКГ, томографии, прочие сведения о самочувствии пациента, выходными параметрами являются набор диагнозов и методов лечения обнаруженных заболеваний. В случае перевода с одного языка на другой входным параметром является текст на исходном языке, выходным параметром - текст на выходном языке. С обобщенной точки зрения, описанной выше, все эти задачи принципиально одинаковы, поэтому далее мы будем рассматривать принципы построения обучающейся системы на примере обучения переводу с одного языка на другой. С одной стороны, построение самообучающейся системы машинного перевода с одного естественного языка на другой имеет несомненную практическую значимость, с другой стороны, эта задача позволяет достаточно полно смоделировать процесс обучения человека переводу с одного языка на другой.
Практическую значимость для решения экономических задач можно проиллюстрировать на примере принятия инвестиционного решения. Пусть, к примеру, имеется инвестиционный проект строительства жилья. Мы хотим оценить риски и доходность вложений. Ограничиваться изучением заключений даже наиболее авторитетных аудиторских фирм и других подобных экспертов нельзя, так как даже наличие положительных отзывов подобных компаний не гарантирует отсутствие возникновения проблем в ближайшей перспективе, как это было в случае банкротства банка Lehman Brothers. Помимо учета подобных данных необходимо принимать во внимание и множество других факторов, например риски возможности возникновения стихийных волнений, беспорядков, криминогенную обстановку в районе застройки и его окрестностях, престижность района и прочие подобные субъективные факторы. Данные по этим факторам можно получить из исследования местной прессы, анализа информации, размещенной на местных сайтах. Имеются программы для оценки факторов риска на основе анализа потока текстов и использования методов искусственного интеллекта. Эти программы настроены для обработки текстов на одном языке, поэтому для их использования необходимо переводить все тексты на этот язык. Имеющиеся алгоритмы перевода недостаточны для решения этой задачи. Описанный в настоящей работе подход позволяет адекватно решить проблему перевода с местных языков и при необходимости построить систему оценки рисков на основе анализа текстов на разных языках.
Целью настоящей работы является построение алгоритма, моделирующего процесс обучения человека на примере обучения переводу с одного языка на другой.
Задача построения системы машинного перевода была сформулирована давно, и к настоящему времени есть несколько подходов к ее решению. Первый поход к решению задачи машинного перевода с одного естественного языка на другой основан на синтаксическом анализе текстов и их переводе на основе грамматических правил. Этот подход очень трудоемкий и требует ручного задания правил, зависящих от входного и выходного языков. Для новой пары языков задание правил требуется начинать независимо от сделанного для других пар языков. Второй подход основан на вероятностном методе, при котором сочетание слов переводится наиболее вероятным способом (на основе некоторого предварительного статистического анализа массива обучающих текстов) [1, 2]. Этот метод дает относительно неплохие результаты для перевода коротких фраз. При работе с более длинными фразами качество перевода значительно снижается. Достоинством этого метода является то, что система может обучаться автоматически на основе анализа параллельных текстов. При этом обучение системы не похоже на то, как происходит обучение человека. Третий подход к решению задачи машинного перевода основан на методе аналогий [3]. В этом методе производится поиск в обучающей выборке похожей фразы (которая отличается от переводимой одним или несколькими словами), для которой известен перевод, и выдается перевод известной фразы с заменой отличающихся слов на перевод слов из исходной. Этот подход больше похож на то, как обучается человек переводу с одного языка на другой. Недостатком этого подхода является необходимость иметь очень большую обучающую выборку. Размер этой выборки резко растет с ростом числа слов в языке и увеличением длины переводимой фразы. Кроме того, этот метод относительно неплохо работает на парах близких языков (английский - французский) и гораздо хуже на парах далеких (английский - японский).
Общим для всех этих методов является подход к решению задачи машинного перевода на основе парадигмы «последовательность слов преобразуется в последовательность». Эта парадигма сильно ограничивает прогресс в решении задачи машинного перевода. В данной работе предложен подход к построению алгоритма автоматического перевода текста, основанный на использовании модели мира на естественных языках. Подобное направление работ развивается компанией ABBYY и использует модель мира на основе онтологий [4]. Эта модель мира в их подходе строится вручную с некоторыми элементами автоматизации. В настоящей работе изложен более общий подход, использующий граф модели мира на произвольном языке. В отличие от подхода компании ABBYY, граф модели мира строится программой автоматически на основе анализа параллельных текстов. Важной особенностью предлагаемого подхода является то, что качество перевода практически не зависит от длины переводимой фразы, а процесс обучения сходен с процессом обучения человека и легко может быть им понят. Кроме того, предлагаемый подход может быть использован человеком при изучении иностранного языка.
Для начала попробуем разобраться, когда возможен перевод и когда он невозможен. Предположим, что имеется некоторый текст на входном языке и требуется его перевести на выходной язык (к примеру, с русского на английский). Всегда ли такой перевод возможен? Ответ очевиден: нет, не всегда. В качестве примера можно рассмотреть перевод описания состояния снежного покрова на языке коренных народов севера, в котором для описания состояния снежного покрова существует очень много разных понятий, на язык коренных народов, проживающих в тропической зоне, где снега нет. В языке южных народов нет понятия «снег» за ненадобностью, и поэтому описание снежного покрова сделать невозможно. Следовательно, перевод в этом случае невозможен. Для того, чтобы перевод был возможен, необходимо, чтобы входной и выходной языки могли описывать ту ситуацию (или ту часть мира), о которой идет речь в переводимом тексте.
Постановка задачи
Уточним постановку первоначальной задачи. Имеется некоторая ситуация, которая описывается на входном и выходном языках. Мы имеем описание ситуации на входном языке, которое можно считать отображением реальной ситуации на некоторый упорядоченный набор символов входного языка (этим набором могут быть буквы алфавита, слова, иероглифы, математические символы, показания измерительных датчиков, симптомы болезней и т.п.). Описание ситуации на выходном языке представляет собой отображение той же самой ситуации с помощью другого языка с другим набором символов (буквы другого алфавита, команды исполнительным механизмам, диагноз болезни или рекомендация врача по ее лечению и т.п.). В качестве примера можно рассмотреть простейший случай перевода текста с одного языка на другой (например, с русского на английский или наоборот). Пример из области медицины: есть набор симптомов заболевания пациента и результаты его анализов, нужно поставить диагноз. Здесь входным языком служит описание симптомов и результатов анализов, а выходным - набор диагнозов и (или) методов лечения.
Алгоритм перевода и принцип построения модели мира не зависит от выбора конкретных языков (естественные языки, язык симптомов болезней и т.п.), поэтому далее для иллюстрации будем использовать примеры на естественных языках. Описываемый подход был реализован в виде компьютерной программы. Программа была реализована на языке FORTRAN, исходный код программы занимает порядка 5 тысяч строк.
Для простоты далее будем предполагать, что входной и выходной языки имеют конечный набор слов и словоформ. Разные словоформы считаем разными словами. Эти словоформы можно пронумеровать и далее работать с номерами слов в некотором фиксированном списке слов языка. С тем же успехом можно было бы работать и с номерами букв (алфавита языка). Эти два варианта дают разные представления одной и той же модели мира. Для рассматриваемых алгоритмов это не имеет значения, результат получится тот же самый.
Будем говорить, что описание ситуации на выходном языке является переводом описания на входном языке. Ключевым моментом в таком подходе является то, что оба описания на входном и выходном языке соответствуют одной и той же ситуации. Таким образом, мы устанавливаем соответствие между отображением реальной ситуации на разных языках (разных наборах символов), а не просто между наборами символов из разных языков. Отображение ситуации из внешнего мира на каком-то языке может быть неоднозначным из-за использования синонимов. Это приводит к тому, что перевод в принципе является неоднозначным. Просто перевод набора символов на входном языке в набор символов на выходном языке также неоднозначен из-за неоднозначности отображения описания на входном языке в ситуацию в реальном мире (из-за наличия омонимов). В качестве простого примера можно привести фразу «Я вижу замок». Эту фразу на английский язык можно перевести по-разному: «I see a lock» или «I see a castle». Каждый и этих вариантов перевода отвечает своей ситуации в зависимости от того, о чем идет речь - о замкЕ или о зАмке ( тут ударная гласная обозначена прописной буквой).
Основная идея модели процесса обучения
Для иллюстрации основной идеи подхода к обучению системы рассмотрим в качестве примера обучение ребенка процессу приготовления чая. Обучение проводим с помощью демонстрации того, как решаем эту задачу мы сами. Чтобы приготовить чай, мы наливаем воду в чайник, ставим его на газовую плитку, зажигаем спичку, поворачиваем газовый кран и после зажигания горелки ждем, пока вода в чайнике закипит. После этого наливаем кипяток в чашку и бросаем пакетик с заваркой. Это одна из возможных последовательностей действий. Если ребенок ее повторит, то получит нужный результат. Это означает, что он научился готовить чай. Но навык его работает только в узкой конкретной ситуации. На кухне может не быть спичек, но иметься пьезоэлектрическая зажигалка. В этом случае мы показываем ребенку другой вариант действий. Мы наливаем воду в чайник, ставим его на газовую плитку, поворачиваем газовый кран, поджигаем газ с помощью пьезоэлектрической зажигалки и после зажигания горелки ждем, пока вода в чайнике закипит. И далее как в предыдущей ситуации. Когда ребенок освоит эту последовательность действий, он осознает, что различие ситуаций сводится к разным способам зажигания газовой горелки. Он выделит общую часть - наливание в чайник воды, установка его на плитку, открывание газового крана, поджиг горелки, ожидание закипания воды и различия - разные способы поджига горелки. Потом он сможет догадаться, что горелку можно поджечь и с помощью другой зажигалки. Теперь представим себе, что ребенок очутился в ситуации, когда на кухне вместо газовой плиты есть только электрическая. При этом последовательность действий для включения плитки будет другая. Ребенок освоит способ приготовления чай и в такой ситуации. При этом он сделает следующее обобщение: воду надо нагреть на любой плитке. Это уже обобщение более высокого уровня по сравнению обобщением способа включения плитки. Произошло обобщение общих навыков включения разных типов плиток. Следующим этапом может быть освоение способов нагрева воды с помощью кипятильника или электрочайника (без применения плитки). При этом навыки нагрева на плитках, в чайнике и др. способы обобщаются до просто нагрева воды (более простые навыки обобщились в один сложный более высокого уровня иерархии). Аналогичным образом заполнение чайника водой обобщается до просто заполнения емкости (можно заполнять, к примеру, кастрюлю или кружку). Можно наливать воду из-под крана или из бутыли. Таким способом в результате обучения формируется иерархическая модель навыков действий ребенка. Эта иерархическая модель может легко быть продолжена. Аналогично можно научить ребенка готовить разные блюда. Обобщение навыков приготовления разных блюд обобщается в навык приготовления обеда. Важной особенностью модели является то, что один навык высокого уровня обобщения (приготовление обеда) может использовать несколько раз навыки более низкого уровня (навык включения конфорки плитки). При этом навык включения конфорки, полученный при обучении приготовлению чая, может с успехом применяться и для приготовления компота или другого блюда. Это означает, что нет нужды при обучении перебирать все возможные сочетания навыков. Достаточно освоить навыки определенного уровня. Потом их можно будет использовать в более сложных действиях более высокого уровня обобщения. Заметим важный принципиальный момент: длинная сложная последовательность действия при обучении естественным образом разделяется на несколько более коротких (простых) последовательностей более низкого уровня. В дальнейшем мы работаем уже с этими новыми более короткими последовательностями. Рассмотренный подход аналогичен тому, как происходит обучение в различных западных бизнес-школах (на основе рассмотрения множества кейсов).
Следует отметить, что при выполнении действий в общем случае важна последовательность их выполнения, хотя иногда последовательность можно менять не меняя полученный результат. В рассматриваемом нами примере надо вначале налить воду и включить плитку, а потом ждать, когда нагреется вода, а не наоборот. Но можно вначале налить воду и потом включить плитку или вначале включить плитку, а потом налить воду и поставить чайник на огонь. Результат от этого не изменится. Такие разные последовательности действий мы будем считать различными, но допустимыми в смысле получения необходимого результата.
Построенная таким способом модель мира позволяет ребенку совершать необходимое действие. Его действие можно рассматривать как перевод поручения приготовить чай (входной язык) в конкретную последовательность действий (выходной язык), приводящих к выполнению поручения. При этом входной язык - это обычный естественный язык, а выходной язык - это последовательность действий.
Этот подход можно использовать и для обучения диалоговых ботов. При этом входным языком являются вводимые человеком реплики, а выходным - выдаваемые системой ответы на естественном языке.
Выше для иллюстрации идеи использовалась искусственная ограниченная упрощенная модель мира. Практической ценности она не представляет. Далее будем проводить развитие основной идеи на примере решения актуальной задачи, имеющей большое практическое значение, а именно будем моделировать изучение иностранного языка (обучение переводу с одного естественного языка на другой).
Графическое представление модели мира
Для наглядного представления получаемой модели удобно использовать граф, в котором имеются вершины разных типов. Первый тип вершин несет информацию о последовательности действий. Такие вершины будем называть вершинами структурного S-типа. Второй тип вершин несет информацию о том, какой именно из навыков более низкого уровня должен использоваться. Вершины этого типа будем называть вершинами K-типа (конкретизации). Вершины связаны между собой ссылками. Вершина более высоко уровня связана с вершиной более низкого уровня ссылкой D-типа (down). Каждой ссылке D -типа соответствует ссылка U-типа (up), идушая в обратном направлении - от вершины более низкого уровня к вершине более высокого уровня. Вершины S- и K-типов могут иметь много ссылок D-типа. При этом в вершинах структурного типа важен порядок ссылок, а в вершинах конкретизации порядок ссылок D-типа не имеет значения. Вершины структурного типа несут информацию о строении предложения (о грамматических правилах) или последовательности действий, а вершины конкретизации определяют, какие понятия могут использоваться в определенном месте. На нижнем уровне иерархической модели вершины конкретизации указывают в конечном счете на конкретные слова, понятия или элементарные действия. На более высоких уровнях иерархии модели вершины конкретизации указывают на более общие или сложные понятия (приготовить чай, приготовить обед ).
Такие графы строятся для описания модели мира на разных языках. Вершины графов на разных языках могут быть связаны между собой ссылками типа T (translate). При этом вершины, связанные ссылками T-типа, считаются переводом друг друга. Они описывают одно и то же понятие или последовательность действий во внешнем мире на разных языках.
Правила построения графа модели мира
По входным и выходным текстам (текстам на входном и выходном языках), описывающим одну и ту же ситуацию во внешнем мире, будем строить граф модели мира. Это построение графа модели мира и представляет собой процесс обучения. В процессе обучения производится изменение графа (его перестройка или преобразование). Эти преобразования выполняются по определенным правилам. Эти правила будем называть аксиомами обучения. В этой работе будет проиллюстрирована идея выделения общей части и различий в описании ситуаций в реальном мире на конкретных примерах. Более точное и формальное описание аксиом обучения будет приведено в последующих работах.
Для простоты будем обрабатывать одно предложение (это не принципиальный момент, и алгоритм позволяет естественным образом обрабатывать целые группы предложений, абзацы и т.д.). Будем считать, что у нас имеется полный список всех слов языка со всеми словоформами. Разные словоформы считаются разными словами. Каждому слову соответствует свой номер в словаре. Далее будем работать с номерами слов в словаре. При этом предложение превращается в упорядоченную последовательность номеров слов, из которых состояло исходное предложение. Для входного и выходного языков имеются свои независимые друг от друга словари, в которых каждой словоформе сопоставляется целое число - номер в словаре. Преобразование «слово - число» и обратное преобразование взаимнооднозначны и могут выполняться простым образом.
Для обучения системы используется ввод пары предложений на входном и выходном языках, описывающих одну и ту же ситуацию во внешнем мире. Эти предложения считаются переводом друг друга. По введенным предложениям строятся соответствующие графы на входном и выходном языках.
Будем прослеживать процесс обучения с самого начала (с того момента, когда обучаемая система вообще не получала никакой информации и ничего не знает о внешнем мире, кроме заложенных в нее аксиом обучения). Для определенности выберем в качестве входного языка русский, а в качестве выходного языка - английский.
В качестве примера предположим, что обучающей системе подали такую пару обучающих предложений:
Петя ходит в магазин.
Pit goes to the shop.
В результате будут построены такие графы на входном и выходном языках (рис. 1). Структурные вершины будем обозначать темно-серым цветом. Выделим в специальный тип вершин вершины, которые имеют ровно одну ссылку D-типа (и соответственно, ровно одну ссылку и-типа). Вершины такого типа будем называть вершинами Р-типа (подстановки). Вершины типа подстановки будем обозначать светло-серым цветом, а вершины конкретизации - черным. В вершинах структурного типа ссылки упорядочены слева направо (самая левая ссылка D-типа является первой, а самая правая - последней). Возле вершины будем указывать ее номер. Вершины, соответствующие графам модели мира на разных языках, могут быть соединены между собой ссылками Т- типа (горизонтальными линиями). Будем считать, что в левой части рисунка располагается граф модели мира на входном языке, а в правой - на выходном. Для наглядности возле вершин самого низшего уровня, соответствующих словам, выписано само слово, а не его номер. По построению переводом вершины 1 во входном дереве является вершина 1 в выходном дереве. Верно и обратное: переводом вершины 1 в выходном дереве является вершина 1 во входном дереве. Как переводятся отдельные слова, система пока не знает.
Теперь введем вторую пару обучающих предложений:
Коля ходит в магазин.
Nick goes to the shop.
После их представления в виде графа получится результат, представленный на рисунке 2.
Рисунок 1 Граф модели мира после ввода первой пары предложений
Рисунок 2 Граф модели мира после ввода второй пары предложений
Во входном дереве вершины 1 и 7 описывают похожие ситуации, которые отличаются друг от друга только первой ссылкой (вершины 2 и 8 указывают на разные нижележащие вершины, а вершины 3-5 и 9-11 указывают на одинаковые нижележащие вершины соответственно). В соответствии с общей идеей выделения общей части и различающихся частей граф модели мира преоразуется следующим образом (рисунок 3).
В преобразованном графе вершины 17 (во входной и выходной частях графа модели мира) соответствуют различиям ситуаций. Эта обобщенная вершина содержит информацию о том, какие вершины более низких уровней могут соответствовать различиям ситуаций. При этом устанавливается, какой из нижележащих вершин во входном графе соответствует вершина в выходном графе (устанавливается перевод - ссылка T-типа). В нашем примере система установила, что слово Петя переводится как Pit, а слово Коля как Nick. Вершина 17 описывает множество одинаково употребляющихся слов. Вершина 18 описывает одинаковую часть ситуаций. Для этих вершин также устанавливается ссылка T-типа (перевод). При этом устанавливается правило перевода только для фрагмента целиком.
Если мы введем еще похожую пару обучающих предложений:
Сергей ходит в магазин.
Sergey goes to the shop.
То после соответствующих преобразований получится похожий граф модели мира, в котором в вершине 18 добавится ссылка D-типа, указывающая на слова Сергей (Sergey) на соответствующих языках, и между этими словами будет установлена ссылка T-типа (перевод). На этом этапе работы алгоритма обучение аналогично тому, как происходит в подходе перевода по аналогии [3]. При дальнейшем обучении системы в предлагаемом подходе происходит поиск сходных ситуаций (фрагментов графа) на всех уровнях дерева модели мира. Это приводит к тому, что сравниваются структурные вершины с числом ссылок D-типа не больше, а, как правило, значительно меньше, чем число слов в обучающих предложениях. Это приводит к значительному сокращению необходимой обучающей выборки и уменьшению времени обучения.
Продолжим пример обучения вводом очередной пары обучающих предложений:
Рисунок 3 Граф модели мира после выделения общей части предложений
Петя ходит в зоопарк.
Pit goes to the zoo.
На первом этапе обработки этих предложений будут добавлены вершины, соответствующие введенной информации. На частях графа модели мира, соответствующих входному и выходному языкам, построения и преобразования частей графа проводятся аналогично, поэтому будем более детально отслеживать изменения графа, соответствующие входному языку. После ввода очередной пары обучающих предложений получится граф, изображенный на рисунке 4.
Рисунок 4 Часть графа модели мира на входном языке после ввода очередного обучающего предложения
Новому предложению соответствует вершина 19. Теперь используем обобщения, имеющиеся в графе модели мира. Заменим вершины нижних уровней вершинами более высоких, которые ссылаются ссылками D-типа на вершины, соответствующие новому обрабатываемому предложению. В результате граф модели мира будет иметь вид, изображенный на рисунке 5.
В вершине обрабатываемого предложения (вершина 19) выделена часть, соответствующая ранее сделанным обобщениям (вершина 17), и все остальное (вершина 25). При этом число ссылок D-типа у вершины 25 меньше числа ссылок D-типа исходного предложения. Вершина 25 соответствует части фразы «ходит в зоопарк». Ранее в процессе построения графа модели мира была выделена вершина 18 , соответствующая части фразы «ходит в магазин». В части графа модели мира на выходном языке этим вершинам будут сопоставлены аналогичные вершины, описывающие части фраз «goes to the shop» и «goes to the zoo» соответственно. И между этими вершинами на входном и выходном языках будут установлены ссылки T-типа (перевод). Теперь к вершинам 18 и 25 (и соответствующим их аналогам - переводам) можно применить тот же подход, что и к вводимым обучающим предложениям, описанный выше. В результате выполнения процедуры преобразования к вершинам 18 и 25 будет выделена общая часть (вершина 29) «ходит в» и различающиеся части (вершина 26) «магазин» и «зоопарк». После такого преобразования получим граф модели мира на входном языке, изображенный на рисунке 6.
Аналогичные преобразования пройдут и в части графа модели мира, соответствующей выходному языку. В ней будут выделены общие части «goes to the» и различные части «shop» и «zoo» и будут установлены ссылки T-типа (переводы) между соответствующими вершинами.
Рисунок 5 Часть графа модели мира на входном языке после выделения первой общей части
Рисунок 6 Часть графа модели мира на входном языке после выделения различий в оставшейся части предложения
Если теперь введем обучающие предложения:
Рисунок 7 Часть графа модели мира на входном языке после завершения преобразований
Петя бегает в магазин.
Pit runs to the shop.
То после проведения преобразования дерева модели мира на входном языке слова «Петя» и «магазин» будут заменены ссылками на вершины обобщений 17 и 25, а на выходном языке будут заменены вершины «Pit» и «shop». Будет установлено соответствие фрагмента «бегает в» на входном языке фрагменту «runs to the». Использование принципа преобразований, примененного к этим фрагментам и выделенным ранее вершине 29 на входном языке (и соответствующей на выходном), даст граф модели мира, изображенный на рисунках 7 и 8. На рисунке 7 изображена часть графа, соответствующая входному языку, а на рисунке 8 - выходному.
При этом между вершинами входной и выходной частей графа модели мира установлены ссылки T-типа (перевод) для пар вершин (не отображены на рисунках) с одинаковыми номерами и парами вершин Петя - Pit, Коля - Nick, Ходит - Goes, Бегает - Runs, Магазин - Shop, Зоопарк - Zoo.
Анализ получившегося графа модели показывает, что для входного и выходного языков получились графы с разным числом вершин. Не для всех вершин нижнего уровня найден перевод. Тем не менее этот граф модели мира позволяет получать правильный перевод даже тех фраз, которые не встречались в процессе обучения.
Рисунок 8 Часть графа модели мира на выходном языке после завершения преобразований
Для построения графа модели мира достаточно было ввести число пар обучающих предложений, пропорциональное числу использовавшихся различных слов. Число возможных правильных вариантов фраз, которые могут быть построены с помощью этого графа, превышает число фраз, использованных при обучении. Описание алгоритма перевода с использованием построенного графа модели мира будет приведено в следующих работах.
Заключение
В работе предложен подход, моделирующий обучение человека с помощью построения графа модели мира. На примере обучения переводу с одного естественного языка на другой показано, что обучаемая система может строить обобщающие понятия, обучается переводить не встречавшиеся ранее предложения, точность перевода не ухудшается при обработке длинных предложений, принципы обучения не зависят от выбора входного и выходного языков. Построенный граф модели мира может быть использован не только для перевода предложений, но и для генерации текста по нескольким заданным словам. Предложенный подход может использоваться для таких приложений, как машинный перевод, генерация текстов, управление беспилотными системами, медицинская диагностика, управление сложными экономическими системами - предприятиями, организациями, отраслями экономики стран, а также для принятия решений в условиях неопределенности.
граф обучение перевод язык
Библиографический список
1. Марчук Ю. Проблемы машинного перевода. - М.: Наука, 1982. - 233 с.
2. Cho K. Learning Phrase Representations using RNN Encoder-Decoder
3. for Statistical Machine Translation. 2014. arXiv:1406.1078v3.
4. Makoto Nagao A framework of a mechanical translation between Japanese and English by analogy principle // Artificial and Human Intelligence. Elsevier Science Publishers. B.V / Ed. A. Elithorn and R. Banerji.
5. Анисимович К. и др. Синтаксический и семантический Парсер, основанный на лингвистических технологиях abbyy compreno. Abbyy. - М., 2012.
Bibliographic list
1. Marchuk Yu. Machine translation problems. - М.: Nauka, 1982. - 233 с.
2. Cho K. Learning Phrase Representations using RNN Encoder-Decoder for Statistical Machine Translation. 2014. arXiv:1406.1078v3.
3. Makoto Nagao A framework of a mechanical translation between Japanese and English by analogy principle // Artificial and Human Intelligence. Elsevier Science Publishers. B.V / Ed. A. Elithorn and R. Banerji.
4. Anisimovich K. et al. Syntactic and semantic Parser based on linguistic technologies abbyy compreno. Abbyy. - Moscow, 2012.
Размещено на Allbest.ru
...Подобные документы
Роль и возможности адаптивной модели в организации образовательного процесса. Структура и механизм навигации в адаптивной модели обучения АЯП Prolog. Программная реализация адаптивной модели обучения. Демонстрация созданного программного продукта.
курсовая работа [1,6 M], добавлен 19.06.2015GPSS (General Purpose System Simulation) как язык для имитационного моделирования, его принципы и используемые методы, инструменты и средства. Метод построения модели с помощью GPSS, порядок составления блок-схемы данного процесса. Листинг модели.
курсовая работа [32,1 K], добавлен 20.12.2013Обзор существующий решений в области электронного обучения. Исследование архитектурных и технологических аспектов построения виртуальных корпоративных университетов. Анализ возможностей системы дистанционного обучения Sakai, отличительные особенности.
дипломная работа [2,7 M], добавлен 09.04.2011Управление электронным обучением. Технологии электронного обучения e-Learning. Программное обеспечение для создания e-Learning решений. Компоненты LMS на примере IBM Lotus Learning Management System и Moodle. Разработка учебных курсов в системе Moodle.
курсовая работа [146,6 K], добавлен 11.06.2009Порядок описание процесса разработки модели для разрешения задачи программирования с помощью средств языка программирования. Структуры данных и основные принципы их построения. Этапы компьютерного моделирования. Этапы и значение написания программы.
курсовая работа [19,5 K], добавлен 19.05.2011Преимущества применения компьютера в учебной деятельности. Перспектива применения автоматизированной системы обучения: информационное и математическое обеспечение. Пути обучения медсестер сестринскому делу с помощью автоматизированной системы обучения.
дипломная работа [3,4 M], добавлен 11.02.2013Понятие дистанционного обучения, его сущность и особенности, содержание и цели. Разновидности дистанционного обучения и их характерные черты. Эффективность дистанционного обучения на современном этапе. Основные требования к программному обеспечению.
научная работа [40,2 K], добавлен 29.01.2009Появление искусственных систем, способных воспринимать и понимать человеческую речь. Автоматическая обработка естественного языка. Анализ, синтез текстов. Системы автоматического синтеза. Проблема понимания, оживление текстов. Модели коммуникации.
реферат [19,0 K], добавлен 02.11.2008Создание имитационной модели системы массового обслуживания с помощью языка имитационного моделирования GPSS/PC - моделирование обработки на участке 500 деталей. Определение загрузки второго станка на вторичной обработке и вероятности появления отходов.
курсовая работа [602,3 K], добавлен 30.11.2010История и термины теории графов. Описание алгоритма Дейкстры. Математическое решение проблемы определения кратчайшего расстояния от одной из вершин графа до всех остальных. Разработка программы на объектно-ориентированном языке программирования Delphi 7.
контрольная работа [646,9 K], добавлен 19.01.2016Теоретические основы обучения 3d моделированию на основе практикума с использованием Autodesk. Роль 3D-моделирования в повышении эффективности учебного процесса. Основные принципы создания практикума по 3D-моделированию в программной среде Autodesk.
дипломная работа [1,2 M], добавлен 13.12.2017Обзор методов составления математических моделей систем автоматического управления. Математические модели системы в векторно-матричной форме записи. Моделирование в пакете программы Simulink. Оценка устойчивости системы, рекомендации по ее применению.
курсовая работа [514,5 K], добавлен 10.11.2011Базовые принципы дистанционного обучения. Система управления базами данных Oracle. Технология Java. Принципы построения клиент-серверных систем. Даталогическое проектирование, таблицы и связи между ними. Разработка учебных курсов и процесс обучения.
дипломная работа [11,4 M], добавлен 22.04.2009Понятие сетей Петри, их применение и возможности. Сетевое планирование, математические модели с использованием сетей Петри. Применение сетевых моделей для описания параллельных процессов. Моделирование процесса обучения с помощью вложенных сетей Петри.
курсовая работа [1,0 M], добавлен 17.11.2009Понятие компьютерной модели и преимущества компьютерного моделирования. Процесс построения имитационной модели. История создания системы GPSS World. Анализ задачи по прохождению турникета на стадион посредством языка имитационного моделирования GPSS.
курсовая работа [291,3 K], добавлен 11.01.2012Разработка программного обеспечения по моделированию рельефа местности на основе топографических карт и прочих объектов на ней. Цифровые модели рельефа. Бикубическая интерполяция высотных данных. Технические требования к программному изделию.
отчет по практике [246,4 K], добавлен 06.04.2013Сущность понятия "имитационное моделирование". Подклассы систем, ориентированных на системное и логическое моделирование. Способы построения моделирующего алгоритма. Имитационные модели производственных процессов. Структура обобщенной имитационной модели.
реферат [453,5 K], добавлен 26.10.2010Компьютер как средство обучения. Классификация учебно-программных средств. Роль интерактивных технологий в обучении школьников. Эффективное управление познавательной деятельностью учащихся первой ступени обучения с помощью интерактивной доски Smart.
курсовая работа [856,7 K], добавлен 10.02.2012Machine Learning как процесс обучения машины без участия человека, основные требования, предъявляемые к нему в сфере медицины. Экономическое обоснование эффективности данной технологии. Используемое программное обеспечение, его функции и возможности.
статья [16,1 K], добавлен 16.05.2016Разработка модели, имитирующей работу экономической системы (станции технического обслуживания автомобилей). Определение вероятностных характеристик системы; закрепление навыков в построении имитационной модели с помощью языка моделирования GPSS.
курсовая работа [713,6 K], добавлен 05.06.2013