Методика и инструментарий атрибуции текста в автороведческой экспертизе

Исследование методики атрибуции текста на основе лексических, морфологических, синтаксических и фоносемантических параметров текста, получаемых, с помощью использования компьютерных программ. Главная особенность применения фоносемантических оценок.

Рубрика Иностранные языки и языкознание
Вид статья
Язык русский
Дата добавления 01.11.2018
Размер файла 15,6 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

УДК 81

Северо-Кавказский федеральный университет

МЕТОДИКА И ИНСТРУМЕНТАРИЙ АТРИБУЦИИ ТЕКСТА В АВТОРОВЕДЧЕСКОЙ ЭКСПЕРТИЗЕ

Красса Сергей Иванович

Процедура атрибуции текста представляет собой классическую филологическую проблему, вместе с тем общепринятой методики установления авторства пока не создано (см., например, [3]). В целом мы не разделяем и оптимизма Т. А. Литвиновой, полагающей, что «в настоящее время имеется достаточное количество работ ученых-криминалистов, посвященных разработке методик проведения такого рода экспертиз» [7, с. 75]: что считать в этом случае достаточным количеством? В то же время интеграция смежных дисциплин позволяет сочетать качественно апробированные методики атрибуции текста с использованием компьютерных технологий. Именно такое направление представляет, на наш взгляд, доступный и эффективный инструмент для установления авторства текста в практике автороведческой экспертизы.

Определение авторства текстов проводится путем сопоставления текстов с известным авторством с текстом (текстами), авторство которого необходимо определить. Ввиду того, что программы используют различные алгоритмы, которые основываются на тех или иных теориях, в исследовании должны применяться различные программные средства там, где это возможно, с целью минимизации погрешностей авторизации. Получаемая в результате анализа числовая характеристика того или иного параметра «должна быть достаточно “массовой”, интегральной, чтобы слабо контролироваться автором на сознательном уровне. Другими словами, она должна быть его “бессознательным параметром”, коренящимся настолько глубоко, что автор даже не задумывается о нем» [1].

Мы предлагаем оптимальное, на наш взгляд, сочетание текстовых параметров, слабо контролируемых автором, и программного компьютерного инструментария, способного обеспечить объективность анализа большого массива данных и высокую производительность такого анализа.

Процедуру атрибуции в автороведческой экспертизе предлагается проводить по следующим текстовым параметрам:

1) лексическим (длина слова, слова с непредметным значением);

2) морфологическим (частеречный профиль текстов);

3) синтаксическим (длина предложения, части речи, начинающие предложение);

4) стилистическим (комплексные показатели стиля автора);

5) фоносемантическим (подсознательное восприятие звуковой стороны текста).

Эти параметры исследуются с помощью различных инструментальных средств.

Лексика: длина слова. С помощью стандартной программы Microsoft Word (сервис «Статистика») определяется средняя длина слова: общее количество слов делится на количество знаков без пробелов. Погрешность в данном случае обусловливается включением знаков препинания в подсчет, однако это имеет место для всех анализируемых текстов, поэтому может быть проигнорировано.

Программа «Худломер» [10] в нашей экспертной практике показывает несколько иные значения для длины слова, чем полученные с помощью сервиса «Статистика», что позволяет иметь в распоряжении большее число данных. Кроме того, эта программа выявляет показатели дисперсии, характеризующие степень разброса значений величин статистической выборки относительно среднего значения.

Кроме того, может быть использована программа Style Recognition System - система распознавания стиля. Основанием программы служит алгоритм, принцип работы которого базируется на определении и сопоставлении двух показателей: средней длины слова и потенциальной полисемантичности текста. Потенциальная полисемантичность текста при этом рассматривается как мера его неопределенности (т.е. энтропия), которая образуется в результате суммирования неопределенностей лексических единиц, входящих в состав исследуемого текста [4].

Лексика: слова с непредметным значением. Анализ частоты словоупотреблений выявляется с помощью, например, сервиса сайта «Мультитран» [11]. Из результатов исключаются «слова с предметным значением, частота употребления которых определяется конкретной проблемной областью» [2, с. 46]. Затем выбираются частотные характеристики предлогов, союзов, частиц и других слов, которые не имеют денотативного значения, а выполняют преимущественно служебные функции, как правило, грамматические. Употребление таких слов, во-первых, не связано с темой текста, во-вторых, они существенным образом коррелируют с авторским стилем.

Морфология. В данном параметре анализируется частеречный состав исследуемых текстов. На основе проведенного анализа частоты словоупотреблений выделяются все словоформы в тексте. Далее осуществляются определение частей речи словоформ и подсчет их количества (с использованием программного средства Microsoft Office Excel). Затем проводится сравнение в таблице и с помощью диаграмм, построенных также с помощью данной программы. Возможно исследование длины слов для различных частей речи. Сравнение средней длины слова в каждой части речи также свидетельсвует об авторском стиле.

Синтаксис. С позиции синтаксиса могут рассматриваться различные параметры, среди которых длина предложения и позиция различных частей речи в предложении. Позиция различных частей речи в предложении представляет собой параметр, который успешно применяется для дифференциации текстов при установлении авторства: «Есть все основания ожидать, что для русских текстов, где порядок слов является свободным, такой анализ будет весьма результативным» [8, c. 65].

Стиль. В данном параметре рассматриваются комплексные характеристики, представляющие стиль автора как целое и идентифицирующие его в том или ином отношении. Такую идентификацию осуществляют, в частности, программы «Худломер», «Лингвоанализатор», а также «Сервис анализа текстов и сайтов».

Программа «Худломер» определяет значение инварианта Фоменко (авторского инварианта) [10].

Целью анализа текста программы «Лингвоанализатор» «является определение близости любого из предлагаемых пользователем Интернета текста к одному из авторских эталонов, определенных заранее» [12], следовательно, результаты указывают на степень близости анализируемого текста к имеющимся в базе эталонам, что может служить интегрированной характеристикой стиля исследуемого текста.

В программе «Сервис анализа текстов и сайтов» используется понятие стоп-слов, или, как их образно называют авторы программы, «водных» слов. В него включаются все слова длиной в 1-2 символа, вводные слова, оценочные эпитеты и прочие слова, которые обычно не несут денотативной нагрузки, а помогают воспринять текст или оценивают те или иные его качества. При анализе текста эти слова отбрасываются, и процент отброшенных слов составляет так называемую «водность» текста [9], что на более строгом языке может рассматриваться как антоним фактуальности текста, содержания в нем фактуальной информации.

В целом параметр «Стиль» может рассматриваться как показатель «экспертиз с формированием пробного арсенала методик» [6, c. 89].

Фоносемантика также относится к показателям подобного рода. В данном случае мы предлагаем использовать фоносемантические оценки не как характеристику текста в аспекте воздействия, а как проявление авторского стиля посредством неосознаваемых фоносемантических характеристик. Инструментом фоносемантического исследования могут быть программы Диатон 1.2 и VAAL, основанные, в частности, на алгоритме А. П. Журавлева [5]. атрибуция текст лексический фоносемантический

В заключение исследования проводится суммирование его итогов с выделением показателей, которые свидетельствуют в пользу одного автора исследуемых текстов, в пользу разных авторов, а также демонстрируют неоднозначные результаты. На основании принятых теоретических оснований, избранных для анализа методик и применяемого инструментария делаются окончательные выводы. Сочетание слабо контролируемых автором текста параметров и аналитических компьютерных программ, проводящих исследование больших массивов с наименьшей степенью субъективности, представляет на сегодняшний день оптимальное сочетание, позволяющее получать максимально возможные объективные результаты.

Список литературы

1. Хьетсо Г., Густавссон С., Бекман Б., Гил С. Кто написал «Тихий Дон»? (Проблема авторства «Тихого Дона»). М.: Книга, 1989. 263 с.

2. Баранов А. Н. Введение в прикладную лингвистику: учебное пособие. Изд. 2-е. М.: Едиториал УРСС, 2003. 360 с.

3. Верхозин С. С. К вопросу о лингво-теоретических основах методик авторизации текста // Вестник Иркутского государственного лингвистического университета. 2013. № 1. С. 24-28.

4. Головко Н. В. Формально-семантический анализ многозначной лексики как средство оптимизации систем автоматизированной обработки текстов: дисс. ... к. филол. н. Ставрополь, 2011. 194 с.

5. Журавлев А. П. Звук и смысл. 2-е изд. М.: Просвещение, 1991. 160 с.

6. Красса С. И. Методы судебной лингвистической экспертизы: практическая типология // Сборник научных трудов Sworld по материалам международной научно-практической конференции. 2012. Т. 40. № 4. С. 88-91.

7. Литвинова Т. А. Лингвистические основы неидентификационной судебно-автороведческой экспертизы // Вестник Челябинского государственного университета. 2012. № 20 (274). Филология. Искусствоведение. Вып. 67. С. 74-78.

Аннотация

В статье предлагается методика атрибуции текста на основе лексических, морфологических, синтаксических и фоносемантических параметров текста, получаемых, как правило, с помощью использования компьютерных программ. Сочетание слабо контролируемых автором текста характеристик и их анализа с помощью компьютерных программ представляет оптимальное сочетание, позволяющее получать результаты экспертизы с относительно высокой степенью объективности.

Ключевые слова и фразы: автороведческая экспертиза; атрибуция текста; параметры атрибуции; методика анализа; инструментарий.

In the article text attribution methodology based on lexical, morphological, syntactic and phono-semantic text parameters, which may be received, as a rule, with the help of computer programs use is suggested. The combination of the characteristics weakly controlled by the text author and their analysis using computer programs is optimal as it allows getting expertise results with rather high level of objectivity.

Key words and phrases: authorship expertise; text attribution; attribution parameters; analysis methodology; instruments.

Размещено на Allbest.ru

...

Подобные документы

  • Изучение особенностей процесса редактирования, в который входит проверка и обработка текста. Описания правки лексических, морфологических и синтаксических ошибок. Характеристика литературного оформления рукописи. Прогноз воздействия текста на аудиторию.

    реферат [25,9 K], добавлен 17.06.2012

  • Структура текста, морфологический уровень. Исследование текста с лингвистической точки зрения. Прямонаправленная и непрямонаправленная связность текста. Важность морфологического уровня текста в понимании структуры текста и для понимания интенции автора.

    реферат [30,4 K], добавлен 05.01.2013

  • История отечественного терминоведения. Выявление лексических и семантических особенностей специального текста для применения этих знаний в практике моделирования семантики специального текста. Требования к терминам, их анализ. Понятие фоновой лексики.

    курсовая работа [106,3 K], добавлен 14.11.2009

  • Фундамент синтаксического анализа. Словоизменительные морфологические средства. Структура системы синтаксического анализатора текста и используемая методика анализа текста. Графематический и фрагментационный анализ. Структура морфологического словаря.

    курсовая работа [194,3 K], добавлен 24.06.2012

  • Теоретические основы изучения текста. Разграничение текста и дискурса. Понятие текста и подходы к его анализу. Употребление терминов texte и discours во французском языке. Сравнительно-сопоставительное исследование текста астрологического прогноза.

    дипломная работа [204,5 K], добавлен 03.07.2009

  • Понятие текста в концепциях лингвистов и психолингвистов, его основные характеристики, свойства и функции. Подходы к его описанию. Природа и процесс порождения текста. Механизмы и особенности его восприятия на примере анализа художественного произведения.

    курсовая работа [47,8 K], добавлен 15.01.2014

  • Современные подходы интерпретации анализа художественно-прозаического текста с учетом его специфики, базовых категорий и понятий. Рассмотрение художественного текста как единства содержания и формы. Практический анализ текста "A Wicked Woman" Дж. Лондона.

    курсовая работа [48,5 K], добавлен 16.02.2011

  • Специфика научного (академического) стиля текста. Основные правила цитирования и оформления ссылок в научных текстах. Планы, тезисы, конспекты как разновидности научных текстов и методика их выполнения. Выводы как неотъемлемая часть научного текста.

    контрольная работа [74,9 K], добавлен 24.02.2015

  • Понятие и специфика композиции, сферы применения данного термина. Композиционная структура текста документа. Требования к композиции документа и порядок ее формирования, сущность рубрикации. Правила разбивки текста. Варианты организации текста письма.

    контрольная работа [36,8 K], добавлен 15.10.2010

  • Признаки классификации стиля текста, понятие о его гибридности. Типы связи в тексте, способы изложения материала в нем. Примеры служебно-делового общения. Языковые средства выразительности рекламных слоганов. Анализ и исправление лексических ошибок.

    контрольная работа [30,0 K], добавлен 29.01.2015

  • Англоязычные тексты инструкций, контрактов и рекламные тексты, их типологические характеристики. Коммуникативное задание текста, источник текста, получатель текста, тип информации (когнитивная, эмоциональная, эстетическая) и доминанты перевода.

    учебное пособие [1,8 M], добавлен 12.12.2010

  • Разновидности структуры текста. Основные правила написания введения, основной части и заключения. Выбор названия и заголовков. Логичность текста, правильная организация его частей, связность предложений между собой. Простые и сложные предложения.

    презентация [55,2 K], добавлен 23.11.2015

  • Понятие перевода как текста. Содержательная структура текста их переводческая типология. Ценность информации и сообщения. Формальные и смысловые связи между высказываниями. Последовательность и связность изложения. Формальная связность текста.

    презентация [44,7 K], добавлен 29.07.2013

  • Проведение адекватного перевода оригинального английского текста на русский язык. Определение и анализ лексических, грамматических и стилистических средств выразительности языка научно-популярного стиля, понятия и эмоционально–образные приёмы текста.

    дипломная работа [53,8 K], добавлен 05.07.2012

  • Лингвостилистические особенности эпистолярного текста. Приемы реорганизации субъектной структуры текста письма при переводе с английского языка на русский. Анализ писем с точки зрения лингвистических и коммуникативно-прагматических особенностей.

    дипломная работа [97,5 K], добавлен 29.07.2017

  • Герменевтические принципы и категории исследования текста в лингвистике. Система отношений автор-текст-читатель. Прецедентные структуры языка как способы выражения скрытых смыслов у И.А. Бунина. Пространственно-временной континуум художественного текста.

    дипломная работа [104,7 K], добавлен 18.07.2014

  • Порядок логического построения текста – синтаксической единицы с последовательностью предложений. Анализ классификации текста, отличающейся по форме материала (устный, письменный), по социальному предназначению (учебные, научные, художественные, деловые).

    творческая работа [15,9 K], добавлен 27.03.2010

  • Работа с текстом на английском языке. Чтение и устный перевод текста, усправление неверных утверждений. Ответы на вопросы по содержанию текста. Образование словосочетаний, обозначающих методы тестирования и оценки, используемые при отборе кандидатов.

    контрольная работа [20,9 K], добавлен 08.03.2015

  • Определение эмоционально-экспрессивной и функционально-стилевой окраски понятий, подбор к ним нейтральных синонимов. Исправление стилистических ошибок в предложениях. Исследование функционального стиля текста, его лексических, и синтаксических отличий.

    контрольная работа [26,2 K], добавлен 02.02.2010

  • Анализ лексико-грамматических трансформаций при переводе художественного текста с немецкого на русский язык. Характеристика новеллы "Превращение". Рассмотрение особенностей применения и функционирования лексических трансформаций в художественном тексте.

    дипломная работа [281,0 K], добавлен 13.06.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.