Алгоритм идентификации речевых фреймов

Идентификация предложений с прямой речью. Построение алгоритма, с помощью которого некая автоматизированная система сможет обрабатывать заданный публицистический текст, находить в нем речевые фреймы и выводить значения определенных параметров в слоты.

Рубрика Иностранные языки и языкознание
Вид статья
Язык русский
Дата добавления 16.01.2019
Размер файла 30,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Алгоритм идентификации речевых фреймов

Назаретян Нелли Вартановна

Северо-Кавказский федеральный университет, г. Ставрополь

Статья предполагает изучение формально-семантических признаков, присутствующих в предложениях с прямой речью, с целью составления на их основе алгоритма для автоматической обработки таких предложений. Основное содержание статьи составляет подробное описание каждого шага составляемого алгоритма на естественном языке. Результатом работы стало построение алгоритма, с помощью которого некая автоматизированная система сможет обрабатывать заданный публицистический текст, находить в нем речевые фреймы и выводить значения определенных параметров в соответствующие слоты.

Ключевые слова и фразы: автоматическая обработка текста; алгоритм; иллокутивный глагол; прямая речь; публицистический дискурс; семантические признаки; речевой фрейм; слот; формальные признаки.

речевой фрейм публицистический слот

Стремительно возрастающие потоки языковой информации, представленные в виде электронных источников, а также желание автоматизировать процесс перевода текстов с одного языка на другой привели к идее о создании автоматизированных систем обработки больших текстовых массивов с целью извлечения из текстов семантической информации по заранее заданным параметрам.

Системы распознавания фреймов, репрезентированных в текстах, существенно облегчают процесс извлечения семантической информации, из чего следует, что создание алгоритмов идентификации и формирования фреймов представляет собой одну из наиболее актуальных задач современной когнитивной лингвистики.

Настоящая статья посвящена написанию алгоритма, с помощью которого некая автоматизированная система сможет обрабатывать заданный публицистический текст, находить в нем речевые фреймы и выводить значения определенных параметров в соответствующие слоты.

В тексте нашего исследования мы ограничимся словесным способом записи алгоритмов, последовательно описывая этапы обработки данных в произвольном изложении на естественном языке.

Алгоритм идентификации речевых фреймов должен быть ориентирован, прежде всего, на поиск иллокутивного глагола в заданном тексте. При составлении алгоритма мы будем работать только с теми предложениями, в которых есть прямая речь, так как в рамках нашего исследования мы работаем с публицистическим текстом и нас интересует иллокутивный глагол не в речи персонажа, а в речи автора статьи.

Для точной идентификации предложений с прямой речью необходимо знать формальные признаки, обозначающие прямую речь, главным из которых, безусловно, является наличие определенных знаков препинания, различающих речь автора и речь персонажа. Таким образом, составление алгоритма следует начать с поиска предложений с этими знаками препинания в заданном тексте. Постановка знаков препинания в предложениях с прямой речью зависит, во-первых, от оформления прямой речи в печатных текстах. В русском языке существует два варианта оформления прямой речи на письме.

1. Выделение прямой речи в абзац.

Если запись прямой речи идет с новой строки (с абзаца), то перед прямой речью ставится знак тире (-):

- Несовершеннолетние, независимо от возраста, могут доставляться в ОВД для выяснения всех обстоятельств произошедшего, - поясняет старший помощник прокурора Ростовской области Оксана Сухарева [2].

2. Запись прямой речи в строку, без выделения в абзац.

В случае записи прямой речи в строчку в начале и в конце прямой речи ставятся кавычки (« »):

Для лидеров это уже вторая встреча в этом году. Приоритетное внимание Владимир Путин и Милош Земан уделили экономическим связям. «В этом году общими усилиями удалось преодолеть спад во взаимной торговле», - сказал журналистам Путин [9].

Во-вторых, постановка знаков препинания в предложениях с прямой речью зависит от соотношения прямой речи и слов автора.

В русском языке существует 4 варианта соотношения слов автора и прямой речи.

Прямая речь после слов автора.

Если слова автора предшествуют прямой речи, после них ставится двоеточие, а прямая речь заключается в кавычки. Первое слово прямой речи пишется с прописной буквы, в конце прямой речи употребляется соответствующий знак конца предложения. При этом вопросительный и восклицательный знаки, а также многоточие ставятся перед кавычками, точка - после них:

На вопрос журналиста о том, что было бы, знай он в момент ареста о своей судьбе в течение последующих десяти лет, Ходорковский ответил: «Тогда? Боюсь, застрелился бы. Для меня тогдашнего мой нынешний опыт стал бы шоком» [4].

Прямая речь перед словами автора.

Если прямая речь находится перед словами автора, то она заключается в кавычки и пишется с прописной буквы, после неё ставится запятая и тире. В случае если прямая речь представляет собой вопрос, восклицание или незаконченное предложение, то перед закрывающей кавычкой ставится соответствующий знак, а после кавычек - тире. Слова автора пишутся со строчной буквы:

«Если мы хотим быть впереди, если мы хотим побеждать, нужно быть лучше», - заявил президент участникам совещания [8].

Слова автора внутри прямой речи.

Если слова автора разрывают прямую речь, то возможны три варианта постановки знаков препинания:

а) если прямая речь представляет собой одно предложение, то после первой её части ставятся запятая

и тире, слова автора пишутся со строчной буквы, после них ставятся запятая и тире, вторая часть прямой речи пишется со строчной буквы; кавычки ставятся только в начале и в конце прямой речи и не ставятся между прямой речью и словами автора. Завершается прямая речь соответствующим знаком. При этом вопросительный и восклицательный знаки, а также многоточие ставятся перед кавычками, точка - после них:

«Пришло время понять, - обратился Ходорковский к россиянам, - что нефтяная халява заканчивается, и мы, граждане России, должны своими руками и своим умом изменить нашу страну» [4];

б) если прямая речь состоит из нескольких предложений и слова автора стоят между ними, после первой части прямой речи ставится запятая и тире (если в конце предложения прямой речи должна стоять точка), восклицательный, вопросительный знак или многоточие и тире; слова автора пишутся со строчной буквы, после них ставятся точка и тире; вторая часть прямой речи начинается с прописной буквы. Кавычки ставятся только в начале и в конце прямой речи. Знаки препинания в конце второй части прямой речи регулируются правилами, описанными выше:

«Впервые за три предыдущих года мы принимаем бюджет, где у нас рост более 2%. Бюджет роста, - заявил Володин. - И мы еще подчеркиваем, что впервые в бюджете мы видим рост зарплаты, рост денежного довольствия военнослужащих, реализация указов президента, которая нацелена именно на решение этих задач» [3];

в) если в словах автора внутри прямой речи имеются два иллокутивных глагола, из которых один отно-

сится к первой части прямой речи, а другой - ко второй, то после слов автора ставятся двоеточие и тире, причем первое слово второй части пишется с прописной буквы:

«Нет, ничего, прекрасно, - отвечал Павел Петрович и погодя немного прибавил: - Брата не обманешь, надо будет сказать ему, что мы повздорили из-за политики» [14, с. 187].

Прямая речь внутри слов автора.

Если прямая речь находится внутри слов автора, то перед ней после слов автора ставится двоеточие, прямая речь заключается в кавычки, а после неё ставится тире или запятая или запятая и тире (в зависимости от контекста), слова автора пишутся со строчной буквы:

В первые часы после провала футболист вообще не стал комментировать результат матча с Грецией:

«Пока мне нечего сказать», - приводит слова Аршавина его официальный сайт [1].

Рассмотрев правила расстановки знаков препинания в предложениях с прямой речью, мы можем перечислить все знаки, которые встречаются в таких предложениях: -; « »; :; !; ?; ...; .; ,.

Найденные по отдельности, перечисленные знаки препинания будут неинформативны для составляемого нами алгоритма.

Вероятность нахождения интересующих нас предложений возрастет во много раз, если мы будем искать не один знак препинания, а определенное сочетание знаков, характерное для предложений с прямой речью. Рассмотрим сочетания знаков, которые мы можем встретить в предложениях с прямой речью: , -; », -; : «; » -; ! -; ? -; … -; : -.

Принимая во внимание тот факт, что в русском языке существует четыре варианта соотношения слов автора и прямой речи, мы разделили исполнение алгоритма на два блока, совместив попарно варианты, обладающие схожими формальными признаками. В первом блоке мы будем обрабатывать предложения, в которых прямая речь предшествует словам автора, и предложения, в которых слова автора находятся внутри прямой речи, а во втором блоке будем обрабатывать предложения, в которых прямая речь следует после слов автора или находится внутри слов автора.

При вводе публицистического текста на первом этапе в первом блоке задаем условие: «Если в предложении есть знаки “ ” -; “ ”, -; , - ; ? - ; ! -; … -; : -, то перейти к следующему шагу алгоритма, иначе перейти ко второму блоку алгоритма и искать в предложении знаки : “. Если в предложении есть знаки : “, то перейти к следующему шагу алгоритма, иначе вернуться к первому условию и повторить команды, проверяя следующее предложение и так до тех пор, пока не будет обработан весь заданный текст. Когда все предложения заданного текста будут проверены, прекратить исполнение алгоритма, перейдя к команде “Выход”».

Далее переходим ко второму этапу - поиску иллокутивного глагола в предложении с прямой речью. Формальным признаком, ориентируясь на который можно идентифицировать иллокутивный глагол в предложении, является его положение, а также наличие окончания, характерного для глагола. В предложениях с прямой речью есть 4 варианта положения иллокутивного глагола соответственно вариантам соотношения слов автора и прямой речи.

Иллокутивный глагол может предшествовать прямой речи (в случае, когда слова автора предшествуют прямой речи):

И вот, что она рассказала: «Мы живем в доме на двух хозяев, и наша половина - в критическом состоянии, разрушается фундамент...» [13].

Иллокутивный глагол может следовать за прямой речью (в случае, когда прямая речь предшествует словам автора):

«Когда у вас больше пяти тысяч вопросов, становится бессмысленно их зубрить, легче выучить школьный курс», - пояснил господин Кузьминов [15, c. 5].

Иллокутивный глагол может разделять прямую речь на две части (в случае, когда слова автора находятся внутри прямой речи):

«Пришло время понять, - обратился Ходорковский к россиянам, - что нефтяная халява заканчивается и мы, граждане России, должны своими руками и своим умом изменить нашу страну» [4].

В предложении с прямой речью может быть два иллокутивных глагола, первый из которых относится к прямой речи, стоящей перед словами автора, второй - к прямой речи после слов автора (в случае, когда прямая речь заключена внутри слов автора):

«Нет, ничего, прекрасно, - отвечал Павел Петрович и погодя немного прибавил: - Брата не обманешь, надо будет сказать ему, что мы повздорили из-за политики» [14, с. 187].

В предложениях, в которых иллокутивный глагол следует за прямой речью или разделяет ее на две части, перед иллокутивным глаголом ставится знак «тире». Таким образом, при поиске иллокутивного глагола в первом блоке нам нужно вывести в слот «иллокутивный глагол» слово, которое следует за знаком «тире», предварительно убедившись, что это слово является глаголом. В публицистическом дискурсе, в предложениях с прямой речью глаголы употреблены преимущественно в форме прошедшего времени, а также в форме настоящего времени. Употребление иллокутивного глагола в форме будущего времени крайне редко и характерно для художественного дискурса, поэтому при написании алгоритма мы не будем принимать во внимание этот факт. Иллокутивный глагол в словах автора может быть в форме 3 лица. Примем во внимание и тот факт, что глагол обладает категорией числа, а в прошедшем времени, в единственном числе - категорией рода. Итак, мы имеем 5 вариантов грамматических форм иллокутивного глагола, которые могут встречаться в публицистическом дискурсе в словах автора:

глагол в настоящем времени, 3-м лице, единственном числе;

глагол в настоящем времени, 3-м лице, множественном числе;

глагол в прошедшем времени, единственном числе, женском роде;

глагол в прошедшем времени, единственном числе, мужском роде;

глагол в прошедшем времени, 3-м лице, множественном числе.

Для того чтобы проверить, является ли слово после знака «тире» в обрабатываемом предложении глаголом, мы сопоставим окончание этого слова с возможными вариантами окончаний глагола. Приведем окончания, характерные для глагола в перечисленных грамматических формах: ет, ёт, ит, ут, ют, ат, ят; суффикс л, суффикс л + окончание а, суффикс л + окончание и.

Таким образом, второе условие в первом блоке алгоритма будет звучать так: «Если слово после знака “тире” заканчивается на: ет, ёт, ит, ут, ют, ат, ят, л, ла или ли, то вывести это слово в слот “иллокутивный глагол”, иначе перейти к проверке первого условия во втором блоке».

В предложениях, где иллокутивный глагол предшествует прямой речи, а также в предложениях, где есть два иллокутивных глагола, и один из них относится к прямой речи, которая следует после слов автора, идентифицировать его сложнее. Дело в том, что иллокутивный глагол не всегда стоит непосредственно перед знаком «двоеточие», часто он может быть отделен от знака «двоеточие» другими словами, например:

О своём заключении Ходорковский говорит без негатива: «Тюрьмы не надо бояться, абсолютное большинство здесь живёт “нормально” - без голода и побоев» [4].

Перед нами встает вопрос о том, как искать иллокутивный глагол в таких случаях. Решение этого вопроса мы видим в том, чтобы при исполнении алгоритма во втором блоке искать иллокутивный глагол не непосредственно перед знаком «двоеточие», а в определенной части предложения. Так же как и в первом блоке, искать глагол мы будем, ориентируясь на возможные варианты окончаний.

Второе условие во втором блоке алгоритма звучит так: «Если в части предложения от начала до знака “двоеточие” или от второго слова после знака “тире” до знака “двоеточие” есть слово с окончанием ет, ёт, ит, ут, ют, ат, ят, ла, л, ли, то вывести это слово в слот “иллокутивный глагол”, иначе перейти к проверке следующего предложения или завершить исполнение алгоритма».

Перейдем к следующему этапу алгоритма - поиску слов, обозначающих участников речевого акта. Мы снова просмотрели отобранные нами в случайном порядке 100 статей из качественных изданий и 100 статей из «желтой» прессы с целью найти и описать формальные признаки, с помощью которых автоматизированная система сможет находить в тексте слова, обозначающие автора прямой речи. Мы выделили из текстов только предложения, содержащие прямую речь, затем мы выделили в каждом предложении слово или слова, обозначающие автора прямой речи, и на основании этих слов разделили предложения на категории.

Общее количество предложений с прямой речью в качественных изданиях составило 250 предложений. Ниже приведем категории, которые мы обозначили в качественных изданиях, по убыванию количества предложений.

Автор прямой речи обозначен именем, фамилией или именем и фамилией - 64 предложения (25,5%).

Автор прямой речи обозначен должностью, профессией и фамилией или должностью, профессией, именем и фамилией - 55 предложений (22%).

Автор прямой речи обозначен профессией, должностью или другим социальным статусом - 52 предложения (21%).

Автор прямой речи обозначен местоимением - 37 предложений (14,5%).

Автор прямой речи обозначен словом «господин» или «госпожа» в сочетании с фамилией - 22 предложения (9%).

Автор прямой речи анонимен - 10 предложений (4%).

Автор прямой речи обозначен названием учреждения - 10 предложений (4%).

Среди предложений, выделенных из статей качественных изданий, наибольшее число составили предложения, в которых автор прямой речи обозначен именем, фамилией или именем и фамилией.

Общее количество предложений, содержащих прямую речь в «желтой» прессе, составило 160 предложений. Приведем категории, которые мы обозначили, в порядке убывания количества предложений.

Автор прямой речи обозначен именем, фамилией или именем и фамилией - 61 предложение (38,5%).

Автор прямой речи обозначен должностью, профессией и фамилией или должностью, профессией, именем и фамилией - 42 предложения (26,5%).

Автор прямой речи обозначен профессией, должностью или другим социальным статусом - 33 предложения (20,5%).

Автор прямой речи обозначен местоимением - 19 предложений (11,5%).

Автор прямой речи обозначен названием учреждения - 4 предложения (2,5%).

Автор прямой речи анонимен - 1 предложение (0,5%).

В «желтой» прессе, так же как и в качественных изданиях, наибольшее число составили предложения, в которых автор прямой речи обозначен именем, фамилией или именем и фамилией.

Итак, первые четыре категории предложений расположены в одинаковом порядке как в качественных изданиях, так и в «желтой» прессе. Существенные различия мы видим, прежде всего, в общем количестве предложений, содержащих прямую речь. В 100 статьях из качественных изданий мы выявили 250 предложений с прямой речью, а в «желтой» прессе таких предложений оказалось 160. Это различие легко объяснить, принимая во внимание тот факт, что в «желтой» прессе все больше проявляется тенденция замещать текстовую информацию визуальной. «Желтые» газеты ориентированы на массовую аудиторию и поэтому стараются составлять максимально простые для восприятия тексты развлекательного характера, заменяя текст информационной графикой.

Далее нам необходимо выяснить, есть ли в каждой выявленной категории какие-либо формальные признаки, по которым мы можем составить команду алгоритма, которая будет идентифицировать и выводить в определенный слот слово или слова, обозначающие автора прямой речи.

Во всех категориях предложений, содержащих прямую речь, при поиске слов, обозначающих автора прямой речи, помимо других формальных признаков можно ориентироваться на порядок слов в предложении. Такой порядок слов, при котором слово или слова, обозначающие автора прямой речи, стоят непосредственно рядом с иллокутивным глаголом, относящимся к прямой речи (перед иллокутивным глаголом, если иллокутивный глагол предшествует прямой речи, либо после иллокутивного глагола, если он следует за прямой речью или разделяет ее на две части), встречается в подавляющем большинстве случаев, что позволяет нам использовать этот факт при поиске данного слова или слов. Но тем не менее встречаются предложения, в которых слова, обозначающие автора прямой речи, отделены от иллокутивного глагола другим словом. В качестве примера рассмотрим следующее предложение:

Когда В. Путин слушал доклад о причинах наводнения, он несколько раз переспрашивал: «Так был сброс из водохранилища или не был?», «Было оповещение о паводке или не было?» [5, с. 6].

Учитывая этот факт, мы будем задавать условие так, чтобы искать автора прямой речи во всем отрезке от иллокутивного глагола до запятой или точки или от начала предложения до иллокутивного глагола, в зависимости от положения иллокутивного глагола.

При написании алгоритма на этом этапе расположим команды таким образом, чтобы максимально полно и правильно заполнить слот «автор прямой речи» и свести возможные ошибки и погрешности к минимуму.

Первое условие на данном этапе в первом блоке будет звучать так: «Если в отрезке предложения от иллокутивного глагола до знака “запятая” или “точка” есть слово “он”, “она” или “они”, то вывести это слово в слот “Автор прямой речи”, иначе перейти к следующему условию».

Во втором блоке условие будет звучать так: «Если в отрезке от начала предложения до иллокутивного глагола есть слово “он”, “она” или “они”, то вывести это слово в слот “Автор прямой речи”, иначе перейти к следующему условию».

Далее напишем условие для тех предложений, в которых автор прямой речи обозначен словом «господин» или «госпожа» в сочетании с фамилией.

Учтем, что в некоторых случаях слово «господин» или «госпожа» заменяются сокращением «г-н» или «г-жа». Итак, следующее условие в первом блоке будет звучать так: «Если в отрезке предложения от иллокутивного глагола до знака “запятая” или “точка” есть слово “г-н”, “г-жа”, “господин” или “госпожа”, то вывести это слово и слово после него в слот “Автор прямой речи”, иначе перейти к следующему условию». Аналогичное условие зададим для предложений, обрабатываемых во втором блоке, переместив поиск нужных слов в отрезок предложения от его начала до иллокутивного глагола.

Следующее условие будет направлено на поиск имени и фамилии, обозначающих автора прямой речи. Формальным признаком, который поможет выявить автора прямой речи, будет заглавная буква, с которой начинается имя или фамилия. Для того чтобы избежать ошибок и потери части информации при заполнении слота «Автор прямой речи», данное условие следует написать таким образом, чтобы искать слова с заглавной буквы непосредственно перед иллокутивным глаголом или после него.

В качестве примера рассмотрим следующее предложение:

«- Сейчас вовсю идет строительство центра ядерной высокотехнологичной медицины в Димитровграде, поскольку рядом находится предприятие НИИ атомных реакторов, - рассказывает декан факультета экспериментальной и теоретической физики Национального исследовательского ядерного университета “МИФИ” профессор Владимир Беляев» [6, с. 38].

Если мы зададим условие так, чтобы искать слово с заглавной буквы на всем отрезке от иллокутивного глагола до знака «запятая» или «точка», то при обработке приведенного выше предложения слот «Автор прямой речи» будет заполнен словом «Национального».

Таким образом, в первом блоке третье условие будет звучать так: «Если слово после иллокутивного глагола начинается с заглавной буквы, то вывести его в слот “Автор прямой речи” и проверить следующее за ним слово - если оно начинается с заглавной буквы, то и его вывести в слот “Автор прямой речи”, иначе перейти к следующему условию».

Во втором блоке зададим аналогичное условие, но искать слова с заглавной буквы будем перед иллокутивным глаголом.

Следующее условие на данном этапе будет направлено на обработку предложений, в которых автор прямой речи анонимен. Среди рассмотренных нами примеров газетных статей анонимность автора отмечается словами «собеседник», «собеседник в (название учреждения или организации)», «собеседник издания», «собеседник “(название издания)”», «источник», «источник в (название учреждения или организации)», «источник “(название издания)”», «один из источников», «один из источников в (название учреждения или организации)», «один из источников “(название издания)”».

Для данной категории предложений мы напишем ряд условий, которые поочередно будут проверять наличие одного из слов или фраз, перечисленных выше в нужной части предложения, в котором была идентифицирована прямая речь.

В первом блоке условие будет звучать следующим образом: «Если после иллокутивного глагола есть слово “собеседник”, “источник” или фраза “один из источников”, то вывести их в слот “Автор прямой речи”, иначе перейти к следующему условию».

«Далее проверить, если после этих слов есть предлог “в”, то вывести этот предлог и слово после него в слот “Автор прямой речи”, иначе проверить, есть ли после этих слов слово “издания”, если есть, то вывести это слово в слот “Автор прямой речи”, иначе проверить есть ли знак “кавычки” после этих слов, если есть, то вывести слово в кавычках в слот “Автор прямой речи” и перейти к следующему шагу алгоритма».

Во втором блоке зададим аналогичные условия для проверки части предложения от начала до иллокутивного глагола.

Далее напишем условие для обработки предложений, в которых автор прямой речи обозначен названием учреждения или организации. В качестве ключевого формального признака используем предлог «в», который в большинстве случаев связывает иллокутивный глагол и название учреждения:

«- У пострадавших черепно-мозговые травмы, ушибы, рваные раны, у одного мужчины перелом конечностей, состояние средней тяжести, - сообщили в областном Центре медицины катастроф» [7].

При написании предыдущих условий мы могли прогнозировать, сколько слов нужно вывести в слот «Автор прямой речи». Если автор прямой речи обозначен местоимением, очевидно, что это будет одно слово, если словами «господин» или «госпожа», нам ясно, что в рассматриваемый слот нужно вывести два слова, так как далее всегда следует фамилия. Что касается данной категории предложений, то мы не можем заранее предугадать, сколько слов нужно вывести в слот «Автор прямой речи», поэтому мы выведем всю фразу после иллокутивного глагола или всю фразу до иллокутивного глагола (в зависимости от его положения).

Итак, следующее условие в первом блоке: «Если после иллокутивного глагола есть предлог “в”, то вывести всю фразу после иллокутивного глагола до знака “точка” или “запятая”, иначе перейти к следующему условию».

Во втором блоке мы будем искать предлог «в» в части предложения от начала до иллокутивного глагола, а в слот «Автор прямой речи» будем выводить фразу от предлога «в» до иллокутивного глагола.

В рассматриваемой категории в качестве автора прямой речи часто выступают такие организации, как компания, пресс-служба, прокуратура или информационные агентства:

«Но все же мы расстроены и находимся в неловком положении, мы удвоим усилия, чтобы гарантировать, что подобное никогда не повторится», - заявляет компания, уже рассылающая пострадавшим пользователям уведомления о случившемся [12].

Поэтому для данной категории предложений мы напишем еще одно условие. Для первого блока: «Если после иллокутивного глагола есть слово “компания”, “прокуратура”, “пресс-служба”, то вывести это слово в слот “Автор прямой речи”, иначе перейти к следующему условию».

Для второго блока: «Если перед иллокутивным глаголом есть слово “компания”, “прокуратура”, “прессслужба”, то вывести это слово в слот “Автор прямой речи”, иначе перейти к следующему условию».

Итак, мы рассмотрели те категории предложений, в которых найти необходимую информацию об авторе прямой речи и вывести ее в соответствующий слот можно с помощью определенных формально-семантических признаков, присутствующих в этих предложениях. Далее рассмотрим случаи, в которых будет сложнее найти слова, обозначающие автора прямой речи, и вывести их в соответствующий слот.

В случае, когда автор прямой речи обозначен профессией, должностью, статусом или профессией и именем с фамилией, мы не можем предсказать, сколько слов будет предшествовать или следовать за иллокутивным глаголом. В предыдущих категориях при поиске нужной информации мы руководствовались такими формальными признаками, как заглавная буква, наличие определенного предлога или слова, но слова, обозначающие профессии, не обладают такими формальными признаками, которые помогли бы составить условие для идентификации этих слов. Исключение могут составить лишь некоторые профессии, заканчивающиеся на характерные окончания, такие как -ор, -ист, -ик. Но такой алгоритм, ориентированный на поиск слова по его окончанию, был бы неэффективным, так как обрабатывал бы лишь некоторые предложения и те частично, так как мы видим, что в большинстве предложений среди отобранных нами примеров название профессии не ограничивается одним словом, а представляет собой ряд слов:

«- Сейчас вовсю идет строительство центра ядерной высокотехнологичной медицины в Димитровграде, поскольку рядом находится предприятие НИИ атомных реакторов, - рассказывает декан факультета экспериментальной и теоретической физики Национального исследовательского ядерного университета “МИФИ” профессор Владимир Беляев» [6, с. 38].

По этой же причине нецелесообразным было бы и составление списка профессий. В данной категории предложений правильным действием было бы выводить в слот «Автор прямой речи» всю фразу до иллокутивного глагола (если он предшествует прямой речи или разделяет ее) или всю фразу после него до знака «запятая» или «точка» (если иллокутивный глагол следует за прямой речью). При таком подходе, конечно, не избежать вывода в соответствующий слот лишней информации. Для примера рассмотрим следующее предложение:

«Сейчас мы не ждём три месяца, а точно знаем, есть туберкулёз или нет, в течение одного-двух дней. При некоторых методиках это всего полтора часа. Кроме того, мы получаем информацию об устойчивости болезни к препаратам. Более детальный анализ можно получить с помощью ускоренной диагностики в пробирках. Результаты придут за 2-3 недели. Это позволяет лечить заболевание адресно», - рассказала о прорыве в этой области заведующая отделением фтизиатрии [11].

Следуя заданной нами команде, при обработке этого предложения в слот «Автор прямой речи» будет выведена следующая фраза «о прорыве в этой области заведующая отделением фтизиатрии», где слова «о прорыве в этой области» будут неактуальной информацией для данного слота, а слова «заведующая отделением фтизиатрии» актуальной информацией.

О сложности глубокого и точного анализа М. Г. Мальковский пишет: «…по причине специфичности подъязыка различных областей человеческой деятельности достаточно глубокий анализ достигается пока только для определенных узких предметных областей. Во многих коммерческих системах, существующих на сегодняшний день, ввиду того, что предназначаются они для большого количества пользователей и разных предметных областей, принята концепция поверхностного анализа. Положительной стороной подобного анализа является быстрота» [10, с. 7].

Итак, в результате написания статьи мы разработали алгоритм, с помощью которого можно обрабатывать заданный публицистический текст, находить в нем речевые фреймы, а также находить и выводить в соответствующие слоты такие параметры речевого фрейма, как иллокутивный глагол и автор прямой речи.

Дальнейшее усовершенствование разработанного нами алгоритма подразумевает постоянное обеспечение его описаниями и моделями для более полного анализа.

Список источников

1. Костиков В. Когда сошла вода // Аргументы и Факты. 2012. 18 июля.

2. Кудрявцева Е. Пристальное излучение // Огонёк. 2013. № 28.

3. Мальковский М. Г., Грацианова Т. Ю., Полякова И. Н. Прикладное программное обеспечение: системы автоматической обработки текстов. М.: МГУ, 2000. 52 c.

4. Тургенев И. С. Отцы и дети. М.: Астрель, 2004. 240 с. 15. Черных А. Общественная палата подготовила сочинение на тему ЕГЭ // Коммерсантъ. 2013. 23 июля.

Размещено на Allbest.ru

...

Подобные документы

  • Коммуникативно-прагматические особенности вопросительных предложений в английском языке. Средства выражения вопроса. Классификация и анализ вопросительных высказываний, выражение ими речевых действий. Вопросительные высказывания как косвенно-речевые акты.

    курсовая работа [46,1 K], добавлен 22.04.2016

  • Стилистическая оценка способов передачи чужой речи. Фиксация способов и примеров передачи чужой речи в тексте. Знаки препинания в предложениях с прямой речью. Виды чужой речи. Предложения с косвенной речью. Строй простого и сложного предложения.

    курсовая работа [32,4 K], добавлен 19.12.2010

  • Ретрактивные речевые акты сквозь призму прагматического направления лингвистики. Классификация иллокутивных актов. Интерактивный подход к рассмотрению и классификации речевых актов. Ретрактивные речевые акты с позиций теории коммуникативных неудач.

    дипломная работа [111,8 K], добавлен 07.03.2011

  • Система жанров газетно-публицистического стиля: заметка, хроника, репортаж, интервью и отчет. Специфика информационного текста, его особенности в английском и корейском языке. Понятие стилистического анализа текста косвенных и пассивных конструкций.

    курсовая работа [67,1 K], добавлен 02.08.2015

  • Речевые акты просьбы, совета, распоряжения, требования и приказа как основные средства управления поведением собеседника в российской коммуникативной культуре. Типология недирективных речевых актов, суть их применения, функциональные варианты директивов.

    реферат [29,0 K], добавлен 21.08.2010

  • Виды и причины речевых ошибок. Непонимание значения слова. Границы лексической сочетаемости. Стилистическая окраска синонимов. Использование лишних слов, тавтология. Усвоение значения фразеологизмов. Термины в научном тексте и правила их использования.

    контрольная работа [43,3 K], добавлен 02.11.2009

  • Сущность понятий "стиль речи", "тема текста", "основная мысль". Особенности публицистического стиля речи, его отличия от художественного и научного стилей. Средства связи предложений в тексте. Применение сочетания книжных и разговорных слов и инверсии.

    презентация [75,6 K], добавлен 30.09.2013

  • Перевод предложений на английский язык. Построение предложений с применением предложенного текста. Определение правильных и неправильных высказываний. Построение вопросительных предложений. Написание существительных во множественном и единственном числе.

    контрольная работа [15,8 K], добавлен 07.06.2012

  • Основные положения теории речевых актов. Речевой акт, его классификация, косвенные речевые акты, стратегии уклонения. Ориентация высказываний на лицо в косвенных побудительных речевых актах. Способы выражения речевого акта приказа в английском языке.

    дипломная работа [68,4 K], добавлен 23.06.2009

  • Фактические ошибки, связанные с пониманием и формулировкой проблемы. Что такое проблема. Как понять исходный текст. Способы формулировки проблемы. Речевые клише, основные проблемы и авторская позиция. Вопросно-ответное единство и риторический вопрос.

    презентация [321,8 K], добавлен 22.10.2013

  • Коммуникативно-прагматический аспект речевых актов admonishing и rebuking, роль в речевом общении. Изучение особенностей эксплицитных способов выражения оценочного значения в речевых актах, зависимости вербальных способов выражения от иллокутивной цели.

    дипломная работа [100,1 K], добавлен 11.10.2014

  • Семиотические истоки прагматики. Сущность речевых актов в стандартной теории, прагматических типов предложения. Основы классификации речевых актов. Характеристика директивного речевого акта. Типичные модели перформативного высказывания в английском языке.

    курсовая работа [40,9 K], добавлен 08.11.2012

  • Понятие и структура односоставных предложения, их классификация и основные разновидности, особенности и назначение. Отличительные признаки одно- и двусоставных предложений. Классификационные черты данного вида предложений, принципы их поиска в тексте.

    презентация [81,7 K], добавлен 09.11.2011

  • Стилистическая организация речи как система языковых элементов внутри литературного языка. Реализация cтилей в определенных формах и типах текстов. Совокупность лексических, грамматических и синтаксических особенностей письменной речи в различных жанрах.

    реферат [25,2 K], добавлен 23.05.2009

  • Характеристика лексических, морфологических, синтаксических, стилистических и коммуникативных ошибок. Анализ конкретных речевых материалов с точки зрения орфографии и грамматики. Изучение основных нарушений коммуникативных норм: неуважение, грубость.

    контрольная работа [37,8 K], добавлен 29.01.2010

  • Текст как объект лингвистики. Становление лингвистики текста как самостоятельной научной дисциплины. Объект и предмет лингвистики текста. Характеристика и реализация газетно-публицистического стиля. Использование артикля в газетно-публицистическом стиле.

    реферат [34,3 K], добавлен 09.03.2011

  • Газетнo-публицистический cтиль кaк система пропаганды и агитации. Осoбенность ключевых слов в немецком политическом языке. Использование политического дискурса в коммуникации. Пoлитический диcкурс как сфера функционирования ключевых слов политики.

    дипломная работа [45,4 K], добавлен 06.08.2017

  • Лексические и фразеологические единицы языка. Значение и речевые ошибки в употреблении фразеологизмов как речевых оборотов. Стилистическая окраска синонимов. Сущность и качество эпитетов. Специфика определения функционально-стилевой принадлежности слова.

    практическая работа [13,5 K], добавлен 12.01.2010

  • Деловые переговоры как часть профессиональной деятельности деловых людей. Мотивы, цели и участники делового общения. Этикетно-речевые формулы и ролевые установки делового общения. Позы и жесты, которые демонстрируют внутреннее состояние собеседников.

    реферат [23,8 K], добавлен 24.07.2011

  • Когнитивный подход к языку. Исследование языковых проявлений человеческого сознания. Метод фреймовой семантики. Формирование лексического значения. Суть концепции М. Минского. Теория схемного понимания. Взаимосвязь и взаимопроникновение фреймов.

    реферат [18,4 K], добавлен 29.11.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.