Роботожурналистика в русскоязычном контексте: анализ современного состояния и перспективы развития
Основные этапы развития роботожурналистики. Принципы восприятия аудиторией текстов, сгенерированных роботами. Морфологические и синтаксические особенности языков. Рекомендации по разработке алгоритмов автоматической генерации русскоязычных текстов.
Рубрика | Журналистика, издательское дело и СМИ |
Вид | магистерская работа |
Язык | русский |
Дата добавления | 23.09.2018 |
Размер файла | 1,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://allbest.ru
Федеральное государственное автономное образовательное учреждение высшего образования
«Национальный исследовательский университет
«Высшая школа экономики»»
Факультет коммуникаций, медиа и дизайна
Выпускная квалификационная работа
Роботожурналистика в русскоязычном контексте: анализ современного состояния и перспективы развития
направлению подготовки 42.04.02 Журналистика
Выполнил: студент магистратуры
Таргонская Мария Викторовна
Руководитель: Доцент Ильвовский Д.А.
Москва - 2018
Содержание
Введение
Глава 1.Теоретические основы роботожурналистики
1.1 История развития роботожурналистики
1.2 Основные термины
1.3 Этапы развития автоматизированной журналистики
1.4 Математические модели и методы роботожурналистики
1.4.1 Шаблонный тип алгоритмов
1.4.2 Нейросетевые алгоритмы
1.4.3 Требования к разработке роботов-журналистов
1.5 Лингвистические особенности роботожурналистики
1.6 Примеры алгоритмов автоматической генерации текстов
1.7 Восприятие аудиторией текстов, сгенерированных автоматически
1.7.1 Методология исследования Клерволла
1.8 Характеристики роботов-журналистов
Глава 2. Типологический анализ языков
2.1 Общие сведения
2.2 Методология исследования
2.3 Морфологические особенности русского, английского и немецкого языков
2.4 Синтаксические особенности русского, английского и немецкого языков
Выводы по 2 главе
Глава 3. Анализ текстов, сгенерированных роботами
3.1 Общие сведения
3.2 Первый этап. Формирование коллекции текстов
3.3 Второй этап. Жанр, структура, актуальность
3.4 Морфологический анализ текстов
3.5 Синтаксический анализ текстов
3.6 Рекомендации по усовершенствованию алгоритмов автоматической генерации русскоязычных текстов
Заключение
Список использованных источников
Приложения
Введение
Актуальность. Новая бизнес-модель журналистики принимает массовый характер в зарубежных СМИ. Благодаря применению алгоритмов автоматической генерации текстов, редакции увеличивают объемы производства, трафик и, соответственно, рекламные доходы.
В 2014 году газета Los Angeles Times первая опубликовала заметку о землетрясении спустя три минуты после подземных толчков на основе данных, полученных из оперативных отчетов геологических служб. Ежеквартально роботы Associated Press пишут более 3500 текстов, основанных на данных финансовых отчетов различных компаний. В 2017 году робот The Washington Post Heliograf написал 850 статей, 500 из которых были посвящены выборам президента США и набрали полмиллиона просмотров.
По сравнению с данными 2012 года, в период проведения предыдущих выборов главы государства, материалы авторов The Washington Post принесли газете лишь 15% от трафика, обеспеченного алгоритмом Мирошниченко А. Робот-журналист: плюсы, минусы, подводные камни // Журналист: журн. 2017. URL: http://jrnlst.ru/robojournalism (дата обращения: 20.12.2017)..
На российском медиарынке роботы-журналисты появились в 2015 году. Запуск проекта «Яндекс для медиа» одноименной IT-компании послужил началом развития нового направления - автоматизированной журналистики. На сегодняшний день с пишущими роботами «сотрудничают» и другие представители индустрии. Алгоритмы спортивного издания Sports.ru генерируют заголовки текстов и публикуют статистику матчей. Осенью 2017 года информационное агентство ТАСС заявило о запуске алгоритма, генерирующего заметки о событиях в области финансов и экономики. роботожурналистика автоматический генерация текст
Последствия развития технологий, применяемых в журналистской среде, порождают потребность изучения ее новых аспектов. Авторы статей о роботожурналистике анализируют современное состояние направления в разных странах, выявляют его преимущества и недостатки. Ключевые функции, которые исследователи отнесли к «плюсам», - увеличение скорости и объемов производства материалов, а также возможность передать алгоритмам рутинную работу.
В числе «минусов»: дороговизна, сухое изложение фактов, отсутствие чувства юмора и навыков интервьюирования (Грефе А., Замков А.В., Крашенинникова М.А., Лукина М.М., Цынарёва Н.А., Иванов А.Д., Миллер Р.).
Зарубежные исследователи перешли к проведению опросов и экспериментов, направленных на оценку качества заметок, написанных роботами-журналистами (Джанг Дж., Сонг Х., Ким Ю., Им Х., Ох С., Клерволл К.), в то время как российское научное сообщество продолжает исследовать возможности пишущих роботов и последствия их применения в редакциях СМИ. Отчасти это связано с отсутствием материалов для анализа, ведь объем текстов, опубликованных роботами, у нас сравнительно небольшой.
Проблема исследования. Что мешает отечественным медиа применять алгоритмы? Во-первых, разработка, тестирование и дальнейшее обеспечение работы алгоритма требует больших финансовых затрат. Во-вторых, барьером для IT-специалистов являются морфологические, синтаксические и др. особенности русского языка как языка синтетического флективного типа, в числе которых склонение и спряжение слов, изменение глаголов по лицам, словообразование, исключения из правил грамматики, препятствующие универсализации алгоритма.
В этой связи возникает исследовательский вопрос: влияет ли тип языка на сложность развития роботизированной журналистики?
Цель исследования (в ней заключается новизна): разработать рекомендации по усовершенствованию алгоритмов автоматической генерации русскоязычных текстов.
К задачам исследования относятся:
1. Анализ динамики развития роботов-журналистов за рубежом и в России;
2. Сравнение математических моделей и методов, применяемых в автоматизированной журналистике;
3. Типологический анализ языков и выявление их особенностей на морфологическом, синтаксическом и семантическом уровнях;
4. Анализ текстов, сгенерированных роботами;
5. Написание рекомендаций по усовершенствованию алгоритмов автоматической генерации текстов.
Гипотеза: тип языка влияет на трудоемкость разработки алгоритма автоматической генерации текстов.
Объектом исследования является автоматизированная журналистика, предметом - продукты, производимые роботами-журналистами.
Методы исследования: морфологический анализ текстов на русском и английском языках, сгенерированных автоматически; применение описательных, сравнительных и логических методов, а также проведение интервью с экспертами с целью разработки рекомендаций по усовершенствованию алгоритмов автоматической генерации текстов.
Позиционирование: целевая аудитория выпускной квалификационной работы - сотрудники редакций СМИ и разработчики, заинтересованные в применении алгоритмов автоматической генерации текстов; медиаисследователи и студенты, для которых теоретическая и эмпирическая базы настоящей работы послужат источником информации для описания новых аспектов автоматизированной журналистики.
Структура работы: магистерская диссертация состоит из введения, трех глав - теоретической, методологической и эмпирической - заключения, списков литературы и использованных источников.
Теоретическая глава представляет собой синтез концепций исследователей. Грефе А., Иванов А.Д., Фанта А., Дорр К., Замков А.В. и другие сконцентрировались на описании этапов развития направления, характеристике пишущих роботов с точки зрения экономики и менеджмента СМИ. Рейтер Э., Дейл Р., Дьякополус Н., Колиска М., Дьюз М. и Пратт-Хартман И. рассматривают математические модели и методы автоматизированной журналистики. Дорр К., Тойвонен Х., Манизеро М. - примеры шаблонов, используемых пишущими роботами. Клерволл К., Андерсон К., Крамер Э., Кунерт Дж., Джанк Дж., Сонг Х. и др. исследуют восприятие аудиторией текстов, сгенерированных автоматически.
В методологической главе описан сценарий сбора и анализа текстов, сгенерированных автоматически, перечислены инструменты для работы с текстами, а также проведен сравнительный анализ морфологических и синтаксических норм русского, английского и немецкого языков.
В практической части магистерской диссертации описаны процессы формирования коллекции текстов и морфологического анализа с помощью программного кода, определен жанр публикаций роботов-журналистов и проведен анализ их структуры, сформирован перечень рекомендаций по усовершенствованию алгоритмов автоматической генерации русскоязычных текстов.
Апробация промежуточных результатов исследования. Промежуточные результаты работы докладывались на Международной научно-практической конференции «Культура коммуникаций в условиях цифровой и социокультурной глобализации: глобальный и региональный аспекты» (Москва, 2017), по результатам которой опубликован сборник тезисов и статей. Также тезисы исследования включены в сборник «Медиа в современном мире. Молодые исследователи: материалы 17-й международной конференции студентов, магистрантов и аспирантов (14-16 марта 2018 года)» под ред. А.С. Смоляровой.
Глава 1. Теоретические основы роботожурналистики
1.1 История развития роботожурналистики
Одно из последних достижений искусственного интеллекта в области работы с текстами - умение отвечать на вопросы. В феврале 2018 года компания Microsoft совместно с Оборонным научно-техническим университетом Китая (NUDT) представила систему, выполняющую задачу поиска ответа по тексту. Алгоритм дал правильные ответы в 82,849 процента случаев. Для сравнения, результат человека в среднем равен 82,304.
Система представляет собой алгоритм, обученный на опубликованной части базы SQuAD, сформированной исследователями Стэнфордского университета в 2016 году и состоящей из небольших фрагментов англоязычных статей Википедии. Статьи разбиты на абзацы, к каждому из которых заданы вопросы, и там же, во фрагментах, содержатся ответы. Вопросы сформулированы в рамках проекта Amazon Mechanical Turk, участником которого мог стать любой желающий. Задача - придумать вопрос и указать ответ на него, кликнув на начало и конец подходящего фрагмента текста.
Все предложенные системы были протестированы на неопубликованной части SQaUD. С 2016 года разработчики предложили более 50 систем, предпоследний рекорд был установлен в январе 2018 компаниями Microsoft и Alibaba. «Турнирная таблица» постепенно обновляется The Stanford Question Answering Dataset. 2016. URL: https://rajpurkar.github.io/SQuAD-explorer/ (дата обращения: 21.02.2018) .
С одной стороны, умение алгоритма отвечать на вопросы - большой прорыв с точки зрения автоматизации работы с текстами. Однако разработанные системы являются решением конкретной задачи и утверждение, что алгоритмы научились отвечать на любые вопросы, будет неверным Щуров И.В. Компьютеры научились понимать тексты лучше людей? Не все так просто! // N + 1: интернет-издание. 2018. URL: https://nplus1.ru/blog/2018/01/17/reading-ai-antihype (дата обращения: 21.02.2018)..
По аналогичному принципу разрабатываются новые технологии в сфере автоматизированной журналистики. Они выполняют конкретную задачу редакции и за редким исключением являются универсальными инструментами обработки данных и генерации текстов.
Задачи алгоритмов в контексте роботожурналистики:
1. Написание заметок.
2. Генерация заголовков.
3. Генерация статистики спортивных матчей.
4. Создание сводок новостей.
5. Выбор цитат.
6. Тегирование.
7. Подбор изображений.
1.2 Основные термины
Под автоматизированной журналистикой понимают «процесс применения программного обеспечения для автоматической генерации новостей без участия человека» Graefe A. Guide to automated journalism. 2016. URL: https://towcenter.org/research/guide-to-automated-journalism/ (дата обращения: 13.11.2017). . Синонимичны ей термины алгоритмическая и роботизированная журналистика, значение которых «сводится к указанию на использование особых автоматизированных инструментов («роботов», «ботов», и в том числе «алгоритмов») для выполнения журналистских функций по сбору и обработке информации, а также для написания готовых текстов без участия человека» Иванов А.Д. Роботизированная журналистика и первые алгоритмы на службе редакций международных СМИ // Знак: проблемное поле медиаобразования. 2015. URL: https://cyberleninka.ru/article/n/robotizirovannaya-zhurnalistika-ipervye-algoritmy-na-sluzhbe-redaktsiy-mezhdunarodnyh-smi (дата обращения: 13.11.2017). Авторы статьи о влиянии развития автоматизированной журналистики на высшее профильное образование подразумевают под термином «алгоритмическую обработку программами-роботами семантических связей между единицами текста, включая автоматизированную генерацию журналистских текстов» Замков А.В., Крашенинникова М.А., Лукина М.М., Цынарёва Н.А. Роботизированная журналистика: от научного дискурса к журналистскому образованию // Медиаскоп. 2017. Вып.2. URL: http://www.mediascope.ru/2295 (дата обращения: 14.11.2017) . Генерация текстов, в свою очередь, является одной из прикладных задач компьютерной лингвистики.
1.3 Этапы развития автоматизированной журналистики
Далее рассмотрим основные этапы развития автоматизированной журналистики в хронологическом порядке.
2009 год. Прообразом роботожурналистики считается сайт StatsMonkey, созданный в 2009 году. Это совместный проект школы журналистики Медилл и инженерной школы Маккормик американского Северо-западного университета при Центре инноваций в области технологий, медиа и журналистики. Цель проекта - публикация статистики игр по софтболу и бейсболу в стиле газетных отчетов Крёмер Ж. Автоматизированная журналистика // Mediakritika.by: информационно-аналитический ресур. 2014. URL: http://mediakritika.by/article/2254/avtomatizirovannaya-zhurnalistika (дата обращения: 15.11.2017)..
Система основана на двух технологиях. Во-первых, она применяет статистические модели бейсбола для выявления знаковых событий: «Используя счет, алгоритм воссоздает динамику игры, выделяет ключевые моменты, ключевых игроков, ищет соответствующие цитаты и генерирует из этих элементов текст. А также ставит заголовок и фото главного игрока» Биргер П. Я не верю в роботов-журналистов, но знаю, что часть журналистской работы могут выполнять роботы // Republic: онлайн-журнал. 2010. URL: https://republic.ru/future/ya_ne_veryu_v_robotov_zhurnalistov_no_znayu_chto-397142.xhtml (дата обращения: 15.11.2017).. Во-вторых, система включает в себя библиотеку сценариев, позволяющих описать процесс и результаты мачта с разных ракурсов Stats Monkey // Intelligent information laboratory Northwestern university. URL: http://infolab.northwestern.edu/projects/stats-monkey.html (дата обращения: 23.02.2018).. Первоначально для обучения алгоритма было обработано более 10 тысяч статей на тему спорта. Впоследствии их количество возрастало. Скорость создания заметки зависела от способа передачи данных: или робот получал информацию автоматически, посредством современных судейских систем, внедренных сразу в нескольких лигах, или репортер через интерфейс сайта вручную вводил результаты матча, после чего начиналась генерация текста.
В этом же году немецкая компания Aexea создает сервис автоматической генерации текстов AX Semantics, основное преимущество которого перед современными платформами заключается в знании нескольких иностранных языков. Робот-журналист способен писать заметки о погоде, спортивных событиях, финансах и развлечениях на немецком, английском, французском, испанском, датском, норвежском, шведском и других языках. Услугами компании пользуются не менее пяти клиентов из медиасферы, однако подробности сотрудничества не разглашаются Dцrr K. Mapping the field of algorithmic journalism // Digital Journalism. 2015. С. 700-722. URL: https://www.tandfonline.com/doi/full/10.1080/21670811.2015.1096748 (дата обращения: 23.02.2018). .
Первый шаг в работе с сервисом - выгрузка данных. Алгоритм определяет валидность массива данных и приступает к классификации переменных для подготовки структуры будущего текста. Затем он формулирует подходящие по контексту фразы, определяет порядок предложений будущей заметки и синонимы. Финальный этап - генерация текста.
2010 год. После двухлетнего перерыва редакция газеты Los Angeles Times возобновила работу над проектом об убийствах, впервые применяя алгоритмы автоматической генерации текстов.
Журналисты начали реализацию проекта еще в январе 2007 года, желая наиболее полно и объективно отразить статистику убийств в городе. Они вручную публиковали в блоге краткую информацию о жертве, времени и месте убийства, позже создали интерактивную карту, однако впоследствии осознали, что по техническим причинам не способны освещать каждое преступление. В 2008 проект был приостановлен, а в январе 2010 в Los Angeles Times запустили алгоритм, генерирующий рудиментарные заметки, опираясь на структурированные данные окружного коронерского офиса. Они включали в себя такую информацию, как: дату, время и место убийства, пол, возраст, расовую или этническую принадлежность жертвы, юрисдикцию и сводку о ранее совершенных убийствах в этом районе.
Автоматизация процессов сбора, обработки и генерации текстов позволила журналистам сконцентрироваться на поиске дополнительных сведений: о прошлом жертвы, о семье, близких людях и увлечениях, возможных конфликтах и прочем. Сотрудники газеты продолжили и реализацию проекта, в рамках которого на интерактивную карту наносилась статистика убийств. В случае превышения порогового значения в том или ином районе, автоматически формировалось предупреждение об опасности Graefe A. Op. cit. P. 21..
Кроме того, в 2010 году компания StatSheet, ранее специализирующаяся на статистическом анализе футбольных, баскетбольных и матчах по другим видам спорта, сообщает о запуске платформы StatSheet Network, алгоритмы которой автоматически генерировали заметки о проведенных играх. Они выгружали данные с веб-сайтов спортивных команд, формировали структуру заметки, используя текстовые шаблоны и базу, насчитывающую около 5000 фраз Stross R. When the software is the sportswriter // The New York Times. 2010. URL: https://www.nytimes.com/2010/11/28/business/28digi.html (дата обращения: 25.02.2018). . В 2011 году компания StatSheet была переименована в Automated Insights, в настоящее время специализирующуюся на разработке программного обеспечения для генерации текстов на естественном языке (Natural Language Generation).
Также 2010 год ознаменован появлением чикагской компании Narrative Science, основной функцией которой является создание и развитие систем искусственного интеллекта по технологии, разработанной преподавателями информатики и профессорами журналистики Северо-Западного университета. Первые клиенты компании, в частности, телевизионные сети Big Ten Network и Fox Cable, отметили эффективность системы с точки зрения логистики, поскольку при автоматизированной обработке спортивной статистики и генерации текстов у редакций больше не возникала острая необходимость отправлять на матч репортера. По окончании игры на компьютеры Narrative Science по электронной почте поступали данные, которые в течение пары минут превращались в историю. Тексты представляли собой набор фактов без эмоций и оценок, в связи с чем одной из задач, поставленных перед разработчиками, являлось «оживление» языка.
После экспериментов с автоматизированным созданием текстов на основе результатов спортивных матчей, IT-специалисты заявили о готовности работать с криминальной статистикой, опросами, финансовыми данными и результатами медицинских исследований Bachman J. Are sportswriters really necessary? // Bloomberg. 2010. URL: https://www.bloomberg.com/news/articles/2010-04-29/are-sportswriters-really-necessary (дата обращения: 25.02.2018). .
2012 год. Данное решение положило начало сотрудничеству Narrative Science с редакцией журнала Forbes. В 2012 году журналисты стали использовать сервис автоматической генерации текстов Quill для создания заметок о доходах компаний Gani A., Haddou L. Could robots be the journalists of the future? // The Guardian. 2014. URL: https://www.theguardian.com/media/shortcuts/2014/mar/16/could-robots-be-journalist-of-future (дата обращения: 25.02.2018). . Программный продукт способен диагностировать и описывать явления, а также причины его возникновения. Сервис применяет обучаемую объектную модель, содержащуюся внутри его базы знаний. Интерактивность используемых методов обучения позволяет улавливать и интегрировать описания и характеристики понятий, данных конкретным пользователем. Quill отслеживает вносимые им правки, на основе которых настраивает языковые параметры, выстраивает связи между данными, опираясь на информацию о местах, людях, характеристиках и периодах времени. Программа способна осуществлять коммуникацию с пользователями, задавать вопросы и, например, на основе ответов искать подходящие для пользовательской истории источники данных. Технологии платформы извлекают из информационных потоков только ключевые сигналы и распространяют их среди определенных аудиторий.
Применение программного продукта в работе редакции Forbes позволило увеличить объемы производства текстов (по сравнению с заметками, написанными журналистами вручную), что привело к расширению охвата аудитории, увеличению трафика на сайте и рекламных доходов.
2013 год. Некоммерческое издание ProPublica, специализирующееся на расследованиях, также начинает использовать Quill в собственном новостном приложении Opportunity Gap для генерирования текстов, описывающих более 52 тысяч школ Graefe A. Op. cit. P. 20..
Radio Hamburg, FussiFreunde, Neue Osnabrьcker Zeitung, Weser-Kurier и другие немецкие издания применяют в работе редакций алгоритм Rtr text engine местной компании Retresco, автоматически генерирующий предварительные отчеты о футбольных матчах в рамках крайслиги (Kreisklasse) Dцrr K. Op. cit. P. 20. .
Параллельно команда журналистов и разработчиков из Los Angeles Times расширяет тематический диапазон и создает алгоритм Quakebot, извлекающий данные из оперативных отчетов геологических служб. Свою известность Quakebot получил в 2014 году, опубликовав на сайте Los Angeles Times заметку о землетрясении спустя три минуты после подземных толчков Neal R. Robo-journalism: LA Times bot writes and publishes earthquake article in 3 minutes // International Business Times. 2014. URL: http://www.ibtimes.com/robo-journalism-la-times-bot-writes-publishes-earthquake-article-3-minutes-1562397 (дата обращения: 25.02.2018). . Эта новость заняла первую строчку в информационном поле благодаря оперативной публикации материала.
Алгоритм обрабатывает данные и заменяет определенными значениями переменные в текстовых шаблонах, затем робот отправляет готовую заметку выпускающему редактору сайта, после чего тот вносит коррективы или сразу публикует материал. Журналисты практиковали публикацию кратких заметок и последующее расширение новости вручную по мере поступления новой информации о произошедшем.
Использование робота-журналиста удобно для написания сводок о чрезвычайных происшествиях, требующих оперативной передачи информации в медиа. Однако ограниченный функционал алгоритмов не позволяет закрепить за ними обязанности корреспондентов в полной мере. В частности, Quakebot не способен совершать звонки для уточнения информации, брать интервью, оценивать ущерб после землетрясения и перепроверять данные, поступившие из отчетов геологических служб. В практике случались сбои в системе USGS, и Quakebot генерировал заметки, оперируя ложными фактами Oremus W. The first news report on the L.A. earthquake was written by a robot // Slate. 2014. URL: http://www.slate.com/blogs/future_tense/2014/03/17/quakebot_los_angeles_times_robot_journalist_writes_article_on_la_earthquake.html (дата обращения: 25.02.2018). .
2014 год. Это период, когда еще два медиагиганта передали часть рутинной работы роботам-журналистам. С июля 2014 в информационном агентстве Associated Press алгоритмы стали генерировать ежеквартальные отчеты о доходах компании. Это не внутренняя разработка агентства, а привлечение сторонних ресурсов: функции робота-журналиста в Associated Press выполняет сервис Wordsmith, произведенный уже упомянутой компанией Automated Insights, поставщик данных - Zacks Investment Research Caswell D., Dцrr K. Automated journalism 2.0: event-driven narratives // Journalism Practice. 2017. P. 5..
Разработчики Wordsmith предлагают пользователям загрузить файл с базой данных в формате CSV, затем подготовить шаблон текста, выстроив логику и определив ключевые слова для имеющихся переменных. Когда шаблон готов, необходимо обновить данные для генерации статей или заметок Miller R. The company behind the AP's “robot journalist” is opening up its technology for everyone // The Verge. 2015. URL: https://www.theverge.com/2015/10/20/9572975/automated-insights-wordsmith-natural-language (дата обращения: 25.02.2018). .
Впоследствии редакция AP расширила тематическую направленность, и наряду с финансовой отчетностью автоматической генерации подверглись спортивные новости Национальной коллегиальной атлетической ассоциации (National Collegiate Athletic Association) Dцrr K. Op. cit. P. 20..
На сегодняшний день агентство ежеквартально публикует более чем 3700 финансовых отчетах о 400 американских, канадских и европейских компаниях Miller R. AP's “robot journalist” are writing their own stories now // The Verge. 2015. URL: https://www.theverge.com/2015/1/29/7939067/ap-journalism-automation-robots-financial-reporting (дата обращения: 25.02.2018)..
Вторым средством массовой информации, которое в 2014 году стало использовать алгоритмы, является газета The Guardian. Программист ежедневного британского издания Уилл Франклин разработал робота, подставляющего определенные значения в пропуски специально созданных текстовых шаблонов. Guardbot специализируется на криминальной хронике, в его основу легли система работы с архивными данными газеты и библиотека символьной и статистической обработки естественного языка (Natural Language Generation Toolkit). Предложение, которое обрабатывает Guardbot, выглядит ориентировочно так: «SENTENCE NNP was last seen RB VB with NNP», что значит: «ИМЯ СОБСТВЕННОЕ последний раз видели НАРЕЧИЕ ГЛАГОЛ с ИМЯ СОБСТВЕННОЕ», где NNP - имя собственное, VB - глагол, RB - наречие» Иванов А.Д. Указ. соч. .
Другой алгоритм The Guardian выполняет функции не журналиста, а агрегатора, составляющего еженедельный дайджест наиболее популярных информационных материалов, опубликованных на сайте газеты Jung J., Song H., Kim Y., Im H., Oh S. Intrusion of software robots into journalism: the public's and journalist's perceptions of news written by algorithms and human journalists // Computers in Human Behavior. 2017. №71. P. 291-298. .
2015 год. Очередная немецкая компания Textomatic производит одноименный алгоритм, пишущий для ежедневной деловой газеты Handelsblatt и регионального издания новости на тему спорта (футбол), финансов (отчеты о фондовой бирже), путешествий (рекомендации) и погоды (прогнозы по персонализированным запросам). Преимущество сервиса в мультиязычности. Робот-журналист способен генерировать тексты на немецком, английском, испанском, французском, итальянском и других языках Dцrr K. Op. cit. P. 20..
Особенность 2015 года в том, что рынок автоматизированной журналистики стал расширяться не только технологически, но и географически. Роботы-корреспонденты выходят за пределы Европы и Америки, постепенно осваивая новые территории и языки.
В частности, в сентябре 2015 был опубликован первый бизнес-отчет на тему индекса потребительских цен в августе, в течение минуты написанный на китайском языке алгоритмом Dreamwriter Jung J., Song H., Kim Y., Im H., Oh S. Op. cit. P. 291.. Его разработчики - сотрудники технологической компании Tencent.
Спустя два месяца стартовал проект «Яндекс для медиа», разработанный российской IT-компанией «Яндекс». Он предлагает готовые информационные материалы о заторах на дорогах, прогноз погоды для 1115 городов России, анализ запросов пользователей поисковой системы Yandex, обзор цен на товары, данные по сборам и рейтингу фильмов, вышедших в прокат, а также музыкальный рейтинг по исполнителям и композициям.
Формат, в котором редакция получит контент, зависит от вида СМИ. В частности, радиостанциям «Яндекс для медиа» предоставляет доступ к веб-интерфейсу. При его настройке на экране отображаются отчеты, которые можно отредактировать либо зачитать в эфире в исходном виде. Телеканалы получают графические и текстовые данные о метеорологической ситуации или заторах на дорогах. Информационным агентствам «Яндекс» предлагает встроить в свою ленту оперативные отчеты сервиса. Печатные и сетевые медиа могут получать информацию об обновлениях по электронной почте или в формате RSS Яндекс открыл проект для медиа // Новости компании. 2015. URL: https://yandex.ru/company/services_news/2015/1110 (дата обращения: 13.11.2017). .
Данные поступают от сервисов «Яндекс.Пробки», «Погода» и «Поиск» в автоматическом режиме, затем обрабатываются с помощью специальных алгоритмов.
2016 год. В январе 2016 года появляется сообщение о запуске корейского робота-журналиста. Редакция газеты The Financial News использует IamFNBOT для генерации профильных статей (Южная Корея).
Ежедневно, после закрытия корейского фондового рынка, компьютерная программа собирает данные о местной бирже, пропускает их через алгоритм, выявляет значимые события и генерирует текст на 600 слов. Выполнение перечисленных операций происходит менее, чем за секунду. Недостаток алгоритма IamFNBOT в ограничении ресурсов, поставляющих данные для анализа. В этой связи он публикует заметки лишь раз в день Lee T.-h. Will robot reporters replace humans? // The Korea Observer. 2016. URL: http://www.koreaobserver.com/will-robot-reporters-replace-humans-63057/ (дата обращения: 02.03.2018). .
2017 год. Китай снова выходит к общественности с новостью об автоматизации редакционных процессов. В январе 2017 робот-журналист Xiao Nan опубликовал свой первый материал в газете Southern Metropolis Daily, посвященный увеличению поездок в преддверии китайского Нового года - Чуньцзе. Текст, состоящий из 300 иероглифов, был создан в течение секунды.
Робот способен генерировать разного объема тексты, а также анализировать значительно большее количество данных по сравнению с человеком. Однако заменить журналистов невозможно - на данный момент робот не умеет проводить интервью и выбирать наиболее интересный «ракурс» для освещения историй Lee T.-h. Op. cit..
Осенью 2017 года информационное агентство ТАСС заявило о тестовом запуске алгоритма, задачей которого является автоматическая генерация текстов в области финансов и экономики. На регулярной основе публиковались краткие заметки о курсах валют, сообщающие об отклонениях в большую или меньшую сторону относительно порогового значения. На момент написания выпускной квалификационной работы реализация проекта была временно приостановлена по техническим причинам.
«Яндекс» и ТАСС - не единственные представители российских медиа и компаний, занимающихся развитием автоматизированной журналистики. Редакция спортивного издания Sports.ru не первый год применяет в своей практике автоматическую генерацию заголовков. Условно, «Начался матч «Арсенал-Тула» - ЦСКА», затем «ЦСКА выходит вперед» или фиксируются другие события в ходе игры. Алгоритмы, в основе которых шаблоны заголовков, используются в целях оперативности. Сами тексты пишут сотрудники либо происходит автоматическая генерация «сухих» данных: счет матча, дата проведения, авторы голов и прочее.
Однако даже с заголовками возникают проблемы. Трудности вызывает склонение слов, и в этом смысле генерация на английском языке проще, чем на русском. Пример из практики издания: алгоритм просклонял название команды «Крылья Советов» по принципу имени собственного Илья Петров, что является грамматической ошибкой. Сотрудникам редакции пришлось вручную исправлять текст заголовка. И если внутри заметки ошибка привлечет внимание меньшего количества читателей, то некорректный заголовок способен вызвать резонанс среди аудитории издания.
Написание алгоритма автоматической генерации заголовков менее трудозатратно: «достаточно десятка строчек кода в отличие от разработки робота-журналиста». На данном этапе изданию невыгодно привлечение компьютеров для создания полноценных материалов. Во-первых, Sports.ru - это узкоспециализированное СМИ, публикующее материалы на русском языке. Во-вторых, разработка алгоритма требует высоких финансовых затрат: оплата труда разработчиков, тестирование и поддержание работы софта превосходят размер заработной платы еще одного автора. В-третьих, в текущей ситуации наиболее вероятна работа с шаблоном, а это однотипно и сухо, к тому же есть риск выбросов, слов, которые не подходят по смыслу. Роботы могут расставлять теги, подбирать изображения.
Представители Sports.ru озвучили и другие возможные проблемы: в случае неполадок в Интернет-соединении робот не сможет кому-либо делегировать свои обязанности в отличие от журналиста. Не сможет он и проверить достоверность данных. Это серьезный недостаток, поскольку нередко статистика матчей поступает с задержкой или содержит ошибку Таргонская М.В. Автоматизированная журналистика в спортивной сфере: курсовая работа // НИУ «ВШЭ». Москва. 2017..
1.4 Математические модели и методы роботожурналистики
«Начинкой» роботов-журналистов являются классические технологии генерации естественного языка или «динамические шаблоны» - NLG (Natural Language Generation system) Deemter K.V., Krahmer E., Theune M. Real versus template-based natural language generation: a false opposition? // Computational Linguistics. 2005. № 31. P. 15-24.. Это программное обеспечение или компьютерные системы, которые автоматически производят из репрезентативной вычислительной информации понятный человеку (естественный) язык Reiter E., Dale R. Building natural language generation systems // Cambridge: Cambridge University Press. 2000. . Несмотря на то, что первые системы появились еще в 1990-е годы и могли выполнять простейшие функции, сегодняшние алгоритмы имеют схожую структуру McRoy S.W., Channarukul S., Ali S.S. An augmented template-based approach to text realization // Natural Language Engineering. 2003. №9. P. 381-420. . Их основная задача - автоматическое создание текстов из цифровых структурированных данных Caswell D., Dorr K. Op. cit..
Существует два типа роботов-журналистов: шаблон и система, в основе которой нейронная сеть.
1.4.1 Шаблонный тип алгоритмов
Данный тип роботов-журналистов наиболее распространен в редакциях СМИ (Грефе А., Иванов Д., Фанта А.). Алгоритм выгружает данные с определенного сайта или базы, выполняет обработку с точки зрения статистики и анализа данных и заменяет переменные на слова или числа, полученные в ходе обработки массива. Отклонение показателей от нормы влияет на сюжет заметки и может создать информационный повод. Предположим, речь пойдет о скачке курса валют, наиболее успешной игре за всю историю существования спортивного клуба, автомобильном коллапсе на дорогах или аномальном похолодании в регионе. В большинстве случаев шаблонные алгоритмы основаны на простых грамматических и синтаксических правилах, генерируют тексты на одном языке и адаптированы под определенную тему. Их разрабатывают в редакциях СМИ (Reuters, Bloomberg, ТАСС, Los Angeles Times, The Guardian) или создают в виде сервисов и приложений в частных компаниях Graefe A. Op. cit. .
К 2016 году в мире насчитывалось 11 специализированных компаний, разрабатывающих сервисы автоматической генерации текстов с достаточно понятным в использовании интерфейсом (Automated Insights, Narrative Science, Retresco, Text-On, Tencent, Arria, Syllabs и другие). Большинство из них работает по шаблонному принципу, как описано выше. Однако есть и модифицированные версии роботов-журналистов. В частности, алгоритм AX Semantics выгружает и обрабатывает данные, затем формирует структуру текста на основе словарей и правил (знания получены в процессе машинного обучения) и полностью генерирует заметку с учетом показателей, выявленных при статистическом анализе. В работе данной платформы используется язык разметки (текста) ATML3 - Automated Text Markup Language (version) 3.
В основе Quill (продукт компании Narrative Science) онтология данных и пользовательский ввод, применение шаблонов минимизировано. Учитывая, что сервисы разрабатываются частными компаниями, детальное описание их структуры и принципа работы является конфиденциальной информацией и не раскрывается широкому кругу лиц.
Выделим распространенные типы шаблонов, применяемых для автоматического создания заметок.
1. Синонимайзер. Блоки синонимов заключаются в фигурные скобки «{}», внутри которых разделяются специальной чертой «|». Это примитивный шаблон, основная задача компьютера выбрать наиболее подходящее слово или фразу. Пример: «Падение курса рубля приведет к {росту | увеличению| повышению} цен на авиабилеты».
2. Перестановка. Удобна в использовании при наличии однородных членов предложения, в частности, для повышения уникальности текста. Перечисление функций, характеристик через черту «|» заключается в квадратные скобки «[]». Пример: «Футбольная команда отличилась [рекордным количеством забитых голов | профессиональной игрой | стойкостью]». На выходе будет получено предложение с такой же или иной последовательностью употребления однородных членов предложения.
3. Вставка. Представляет собой переменную, на место которой алгоритм должен подставить слово или значение из базы данных. Пример: «Ухудшение ситуации на дорогах вызвано непогодой и проведением ремонтных работ. Сервис оценивает автомобильные заторы в [value] баллов». Или «Курс доллара снизился на [value_1] % и равен [value_2] руб. [value_3] коп.».
4. Условные функции. Это конструкции, позволяющие логически вычислить, какой фрагмент текста необходимо вставить. В частности, при генерации заметки о футбольном матче в случае, если команда А забила больше шайб, чем команда Б, то написать: «Команда А одержала победу». В случае выигрыша команды Б процедура будет аналогичной. При завершении матча вничью актуально третье условие: «В сегодняшнем матче не удалось выявить победителя, так как игра завершилась с равным счетом».
1.4.2 Нейросетевые алгоритмы
Второй тип пишущих журналистов имеет более сложное строение системы генерации естественного языка (NLG system). Алгоритмы подчиняются не набору элементарных правил выгрузки и обработки данных, а нейросетям, представляющим собой множество организованных нейронов (перцептронов), похожих на устройство человеческого мозга.
Нейросети - это «системы, состоящие из многих простых вычислительных элементов, работающих параллельно, функция которых определяется структурой сети, силой взаимосвязанных связей, а вычисления производятся в самих элементах или узлах» Филатова Т.В. Применение нейронных сетей для аппроксимации данных // Вестник Томского государственного университета. 2004. С. 121-125. URL: https://cyberleninka.ru/article/v/primenenie-neyronnyh-setey-dlya-approksimatsii-dannyh (дата обращения: 14.03.2018). . На начальном этапе нейроны имеют веса, распределенные практически случайным образом. Затем «в самом простом случае нейрон получает маленький кусочек входных данных (обычно это число), домножает его на свой вес и передает дальше по сети. При этом нейрон совершенно не представляет, что с его данными происходит дальше, от него требуется только простая эта операция. Если в итоге оказывается, что какой-то нейрон отвечает за очень важный кусок входных данных, ему присвоят вес побольше» Молотилин Т. На выставке Ван Гога // N + 1: интернет-издание. 2016. URL: https://nplus1.ru/material/2016/05/10/likemonet (дата обращения: 16.12.2017). .
В контексте работы с музыкой, текстами применимы рекуррентные нейронные сети. Они не имеют заранее определенного числа аргументов и формата ответа. В «обычных» нейросетях информация передается только вперед, от слоя к слою. В случае с рекуррентными, нейроны обмениваются данными друг с другом: «вдобавок к новому кусочку данных нейрон также получает некоторую информацию о предыдущем состоянии сети». То есть, РНС обладает памятью (долгосрочной), благодаря чему можно анализировать любые последовательности данных, в которых важен порядок значений.
В случае работы с языковыми моделями, рекуррентные нейронные сети должны запоминать грамматику языка, его стилистические особенности, что будет использовано при анализе контекста и общей связи слов в предложениях, последовательность которых фиксируется в памяти РНС Молотилин Т. Азбука ИИ: «Рекуррентные нейросети» // N + 1: интернет-издание. 2016. URL: https://nplus1.ru/material/2016/11/04/recurrent-networks (дата обращения: 26.12.2017). . Нейросети способны предлагать свои варианты завершения словосочетаний и предложений, а также анализировать изображения.
В целом нейронные сети составляют системы машинного обучения, задача которого, - работать с данными, опираясь на некий шаблон. Чем больше исходных данных, тем сильнее эффект: алгоритм учится выявлять общие признаки, соотносить их и проводить операции в зависимости от условия задачи. Сравнительно недавние примеры применения машинного обучения - приложения для смартфонов: Prisma (обработка изображений), Shazam (распознавание музыкальных композиций), поиск человека в интернете по фотографии и другие.
1.4.3 Требования к разработке роботов-журналистов
Зарубежные исследователи выделяют шесть критериев, которые необходимо учитывать при разработке алгоритмов автоматической генерации текстов для редакций средств массовой информации.
С точки зрения журналистских процессов важны:
1. Прозрачность, обеспечивающая возможность людей, как имеющих, так и не имеющих отношение к журналистике, контролировать, критиковать и даже вмешиваться в процесс подготовки текста Deuze M. What is journalism? Professional identity and ideology of journalists reconsidered // Journalism. 2005. № 6(4). 442-464. . Применительно к автоматизированной журналистике, под прозрачностью понимают публикацию пошагового описания действий, предпринятых для обработки данных, код, статистическую модель или выводы, а также источник данных Diakopoulos N., Koliska M. Algorithmic transparency in the news media // Digital Journalism. 2016. P. 1-20. . Очевидно, что это конфиденциальная информация, и ее размещение в открытом доступе невыгодно разработчикам. Исполнение требования в части алгоритмов, управляемых нейросетями, зачастую технически невозможно, поскольку конструкция «черного ящика» препятствует наблюдению процесса генерации, позволяющего отслеживать решения системы.
2. Точность - отсутствие фактических ошибок в данных и построение понятных, недвусмысленных предложений.
Характеристики, необходимые для самой системы:
1. Модификация системных компонентов в целях внедрения новых знаний и умение их адаптировать к нескольких тематическим направлениям.
2. Свободное владение языком, позволяющее писать тексты на уровне журналистов.
Требования к наполнению:
1. Доступность данных и возможность их обработки в автоматическом режиме. Это критерий, определяющий сферы специализации роботов-журналистов. На данный момент к таковым относятся: спорт, финансы, погода, дорожная ситуация и другие. Количество тем весьма ограничено. Кроме того, от валидности базы данных зависит скорость ее обработки алгоритмом, а значит и время, затраченное на генерацию текста.
2. Актуальность новостей. Чтобы обеспечить интерес пользователей, новости должны быть актуальными и в некоторой степени иметь отношение к читателю, например, по территориальному признаку Arjen V.D. The algorithms behind the headlines: How machine-written news redefines the core skills oh human journalists // Journalism Practice. 2012. №6 (5-6). P. 648-658.. Еще один способ - сосредоточиться на узкой аудитории, проявляющей интерес к определенной теме.
1.5 Лингвистические особенности роботожурналистики
На сегодняшний день за рубежом и в России широко распространено применение алгоритмов, способных распознавать и трансформировать тексты. Это онлайн-переводчики, сервисы сетевого маркетинга, интернет-магазины, функции перевода подписей к фото и постов в социальных сетях. Зачастую тексты выглядят бессмысленно, встречаются неверное употребление синонимов, нарушение морфологических и синтаксических норм.
Системы автоматической обработки текстов являются прерогативой компьютерной лингвистики - науки, объединяющей в себе математику, лингвистику, компьютерные науки и искусственный интеллект. Ее развитие зависит от результатов в области языкознания, изучающего фонологию, морфологию, синтаксис, семантику, прагматику и лексикографию Большакова Е.И., Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика: учеб. пособие // М.: МИЭМ. 2011. URL: https://www.hse.ru/data/2012/04/05/1251263483/%D0%BF%D0%BE%D1%81%D0%BE%D0%B1%D0%B8%D0%B5%20%D1%88%D0%BA%D0%BE%D0%BB%D0%B0%20%D0%BF%D0%BE%20%D0%BA%D0%BE%D0%BC%D0%BF%D1%8C%D1%8E%D1%82%D0%B5%D1%80%D0%BD%D0%BE%D0%B9%20%D0%BB%D0%B8%D0%BD%D0%B3%D0%B2%D0%B8%D1%81%D1%82%D0%B8%D0%BA%D0%B5%20-%20%D0%BA%D0%BE%D0%BF%D0%B8%D1%8F.pdf (дата обращения: 03.05.2018). , и от технологических решений.
Основные барьеры:
1. Особенности естественного языка как сложной многоуровневой системы знаков: уровень предложений - синтаксический, уровень слов - морфологический, уровень фонем - фонологический (для устной речи), уровень символов (для письменной речи) и т.д.
2. Морфологические, синтаксические, лексические и иные различия в существующих естественных языках, что препятствует разработке универсального алгоритма.
Также исследователи говорят об особенностях естественного языка в сравнении с искусственным, выделяя42:
1. Открытость системы естественного языка - на протяжении всего своего развития язык претерпевает различные изменения под влиянием лингвистических, исторических, экономических факторов. В результате появляются новые грамматические нормы, устойчивые фразы, заимствования и др.
2. Нестандартная сочетаемость единиц на каждом уровне естественного языка. Пример: крепкий чай и heavy tea - синонимичные словосочетания, однако при дословном переводе с английского на русский получается тяжелый чай, что не соответствует нормам русского языка.
3. Большая системность естественного языка: уровни, о которых шла речь выше, и ассиметричная связь между единицами языка (полисемия, омонимия, синонимия и т.д.), проявляющаяся на данных уровнях.
Во второй главе настоящей работы мы рассмотрим особенности флективного синтетического (русский), флективного аналитического (английский) и флективного синтетического, приобретающего аналитические черты (немецкий) типов языков. В частности, морфологические нормы, которые необходимо учитывать при создании алгоритмов автоматической генерации текстов, различия в средней длине слов и предложений, характерные для русского, немецкого и английского языков, специфику построения предложений.
Отметим, что к прикладным задачам компьютерной лингвистики также относятся: машинный перевод, реферирование и аннотирование текстов, формирование ответов на вопросы, организация информационного поиска, создание диалогов и чат-ботов, text mining (классификация текстов, выявление из них информации, ключевых слов, терминов, анализ мнений и оценка тональности предложений), что также актуально для роботизированной журналистики.
1.6 Примеры алгоритмов автоматической генерации текстов
В 2015 году была опубликована статья немецкого исследователя Константина Дорра, в которой дается характеристика технологии NLG. Начальное действие работы алгоритма - обращение к базе данных, которая ляжет в основу будущей заметки. Генерация текста производится в соответствии с определенными лингвистическими и статистическими правилами. Язык в данном случае представляет собой множество строк алфавита, подчиняющихся правилам грамматики Pratt-Hartmann I. Computational complexity in natural language // Handbook of computational linguistics and natural language processing. Oxford: Wiley-Blackwell. 2010. P. 43-73. . Языки закодированы таким образом, чтобы была возможность автоматической генерации текстов на разных языках.
Фактически процесс создания заметки происходит в три этапа: планирование документа, микропланирование и реализация Reiter E. Natural language generation // Handbook of computational linguistics and natural language processing. Oxford: Wiley-Blackwell. 2010. P. 574-598. . На первом этапе происходит выгрузка данных посредством API или из частной базы данных, определение наиболее значимой информации, кодирование и адаптация словарей и правил. На втором этапе, микропланировании, налаживается связь между входными данными (input) и конечным результатом (output): NLG обрабатывает данные, определяет структуру текста (слова, синтаксис, предложения). В финале - выбор форм слова и генерация заметки о бейсбольном матче, курсе валют, погоде и т.д.
Группа исследователей департамента компьютерных наук университета Хельсинки в статье Data Driven News Generation for Automated Journalism аналогичным образом описала архитектуру системы генерации естественного языка на примере алгоритма, используемого для написания заметок о муниципальных выборах в Финляндии в 2017 году.
Для более широкого применения алгоритмов и независимости от темы, все факты представляются с использованием идентичных структур данных. Фактом является триплет, содержащий информацию о событии: что произошло, где и с кем. Его можно расширить, добавив сведения о том, когда произошло действие, и прочее. Аспекты делятся на типы и категории. Предположим, «кто» относится к типу «человек» и категории - «политическая партия».
...Подобные документы
Краткая история средств массовой информации. Свойства, обуславливающие привлекательность радиовещания среди прочих СМИ. Основные этапы развития радиовещания в Советском Союзе. Особенности современного радиовещания, его основные проблемы и перспективы.
курсовая работа [166,3 K], добавлен 17.06.2011Классификация и жанрообразующие признаки внешних PR текстов. Понятие и содержание пресс-релиза в системе жанров PR-текса, принципы их написания для опубликования в сети Интернет. Типология оперативно-новостного и аналитико-публицистического жанров.
курсовая работа [33,3 K], добавлен 10.01.2016Анализ особенностей текстов модульной рекламы в печатных средствах массовой информации. Основные виды, типы текстов, структура модульной рекламы. План анализа модульных структур в журнале "Story". Характеристика журнала, анализ его рекламных модулей.
курсовая работа [72,6 K], добавлен 17.03.2015Пропаганда и массовая информация в русскоязычных СМИ за рубежом. Проблемы и перспективы развития русскоязычного Интернета и русскоязычных средств массовой информации в странах СНГ. Возможности обмена информацией между соотечественниками по всему миру.
курсовая работа [62,3 K], добавлен 24.10.2010Проблема пропагандистской составляющей русскоязычных средств массовой информации, ее влияние на зарубежную аудиторию. Оценка современного состояния русскоязычной прессы в странах СНГ. Роль русскоязычных Интернет СМИ в системе всемирной коммуникации.
дипломная работа [64,4 K], добавлен 20.10.2010Феномен и исторические последствия комсомольских газет с точки зрения влияния на молодежь того времени, особенности их печатных текстов. Анализ динамики развития комсомольской прессы по пути развития общества. Современное состояние комсомольских изданий.
курсовая работа [41,8 K], добавлен 13.01.2010Общие правила набора на русском языке. Основные виды текстов. Верстка текстов и иллюстраций с соответствующими примерами, правильного и неправильного расположения. Спуск полос и сбор брошюры. Способы размещения изображений, текста, формул, таблиц.
курсовая работа [2,0 M], добавлен 15.05.2013Виды издания документных текстов. Оценка текста с логической стороны. Выявление логико-смысловых связей. Виды логических ошибок. Устранение смысловых ошибок. Анализ и оценка композиции произведения. Корректурные знаки, используемые при редактировании.
курсовая работа [90,9 K], добавлен 24.05.2014Общая характеристика журналистских текстов и способов подачи новостей в средствах массовой информации. Выборочный анализ подачи информации в BusinessWeek и анализ рейтинговых публикаций издания. Рассмотрение основных проблем журналистских текстов.
курсовая работа [45,8 K], добавлен 27.11.2012Массовые коммуникации, средства массовой информации и принципы PR. Основные принципы Паблик Рилейшнз. Общие правила подготовки PR текстов. Проведение новостных PR-мероприятий, пресс-конференций. Этапы управления информацией. Правила взаимодействия со СМИ.
курсовая работа [56,5 K], добавлен 09.05.2011Композиция журналистского текста как неотъемлемая часть литературного произведения, её отличие от литературных текстов. Особенности аналитических жанров журналистики в российских изданиях. Комментарий как аналитический жанр на примере газеты "Ведомости".
курсовая работа [40,8 K], добавлен 02.04.2017Политический дискурс и особенности его интерпретации в медиасфере. Методы дискурс-анализа в средствах массовой информации. Формирование представлений о политической реальности Украины в русскоязычных СМИ. Специфика информационного пространства страны.
автореферат [59,7 K], добавлен 26.11.2014Типологические особенности печатных СМИ. Журнал как тип периодического издания. Исторические предпосылки появления и развития колумнистики. Специализированная пресса: общие характеристики. Анализ специфики колумнистских текстов в журнале "Журналист".
дипломная работа [814,8 K], добавлен 30.04.2015Источники цитирования прецедентных текстов в соответствии с классификацией А.Б. Лихачевой. Определение особенностей использования прецедентных текстов в заголовках газет местного издания. Употребление в заголовке стереотипного для собеседника изречения.
курсовая работа [62,1 K], добавлен 08.03.2015Характеристика и специфика качественных и популярных типов газет, способы представления информации. Место русскоязычных газет в эмигрантской прессе Великобритании. Этапы развития и современное состояние русскоязычной газетной периодики в Великобритании.
дипломная работа [127,3 K], добавлен 17.01.2014Умения и навыки редактирования текстов. Виды изданий: рекламные; информационные, научные, учебные, переиздания. Требования по редактированию газетно-журнальных изданий. Работа редактора с рекламными изданиями. Редактирование информационных изданий.
реферат [28,9 K], добавлен 15.12.2010Общая характеристика процессов зарождения и развития книгопечатания. Особенности формирования производства бумаги и техники полиграфии. Специфика развития и роль полиграфии в XX веке. Значение современного полиграфического бизнеса в рыночной экономике.
курсовая работа [39,1 K], добавлен 17.06.2012Новостной редактор телевидения: характеристика "невидимой" профессии. Лексические, морфологические и синтаксические особенности новостного языка. Требования к составлению телевизионной информационной заметки: редакторский анализ и работа над текстом.
дипломная работа [458,5 K], добавлен 28.07.2014Сущность и разновидности очерка. Исследование особенностей структурной организации очерков различных видов. Художественные элементы очерка: пейзаж, деталь, портретная характеристика. Лексические, морфологические, синтаксические особенности жанра.
курсовая работа [60,7 K], добавлен 07.12.2008Отличительные особенности PR-текстов. Медиа-тексты, их своеобразие и место в современных СМИ. Имиджевое интервью: основные признаки и отличия от интервью традиционного. Особенности имиджевых интервью на примере публикаций в газете "Континент Сибирь".
дипломная работа [73,9 K], добавлен 27.06.2012