Роботожурналистика в русскоязычном контексте: анализ современного состояния и перспективы развития
Основные этапы развития роботожурналистики. Принципы восприятия аудиторией текстов, сгенерированных роботами. Морфологические и синтаксические особенности языков. Рекомендации по разработке алгоритмов автоматической генерации русскоязычных текстов.
Рубрика | Журналистика, издательское дело и СМИ |
Вид | магистерская работа |
Язык | русский |
Дата добавления | 23.09.2018 |
Размер файла | 1,6 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Так как факты поступают неким набором и имеют схожую структуру, у них равные шансы занять место главного звена в цепочке событий. Как правило, последовательность изложения задана архитектурой текстового шаблона. Ценность события определяется двумя факторами: сравнительным анализом показателей, относящихся к одному типу, и специальной настройкой параметров алгоритма, определяющих вес «лица» (entity_types), «местоположения» (location_types) и «значения» (value_types). Наиболее приоритетный факт становится ядром первого абзаца заметки, к которому по смыслу добавляются из списка другие факты-спутники.
Языковые правила должны быть адаптированы для всех языков, на которых предусмотрена автоматическая генерация текстов выбранным сервисом или редакционным роботом-журналистом. Они включают в себя лексику, синтаксис, морфологические компоненты.
В финале истории применяется так называемое микропланирование. Для завершения текста используются небольшие шаблоны, которые, как правило, актуальны для определенного факта и генерируются в зависимости от входных данных и информационного повода.
В более позднем исследовании, результаты которого опубликованы в 2017 году, Дэвид Касвелл и Константин Дорр, описали принцип работы алгоритма Wordsmith, созданного компанией Automated Insights.
Как и в предыдущих примерах, в основу сервиса заложены «динамические шаблоны» (natural language generation system) - сложные логические структуры и блоки связного текста. Каждый шаблон предназначен для работы с конкретной моделью данных и затем будет использоваться платформой для сборки блоков в заметку. Эти шаблоны, по сути, представляют собой иерархическую структуру, подчиняющуюся условной логике «если-то-иначе» (if-then-else), и предназначены для разных вариантов развития событий. Например, если поле данных 1 равно X, тогда напишите «this», в противном случае, если поле данных 1 равно Y, то напишите «that». Этот метод нетривиальный, зато удобный в использовании для редакций СМИ, сотрудники которых не являются экспертами в сфере технологий и искусственного интеллекта.
Основная задача NLG - генерация шаблона, упрощающего взаимодействие между логическими структурами, массивами данных и текстовыми блоками. В частности, Wordsmith представляет набор инструментов, с помощью которых можно создавать триггерные процедуры для работы с данными, чтобы, например, отслеживать события или выявлять тенденции, сравнивать значения, использовать в тексте синонимы и другие функции, обеспечивающие удобство в среде разработки Caswell D., Dцrr K. Op. cit..
1.7 Восприятие аудиторией текстов, сгенерированных автоматически
В данном параграфе рассматриваются статьи К. Клерволла, групп корейских, голландских и немецких научных сотрудников, в которых описаны методология и результаты исследований, направленных на оценку качества текстов, сгенерированных алгоритмами.
Эксперимент №1. Кристер Клерволл Clerwall C. Enter the robot journalist // Journalism Practice. 2014. №8 (5). P. 519-531., прежде чем перейти к эксперименту, резюмировал результаты исследований его предшественников. Фланагин и Метцгер изучили, что влияет на восприятие пользователями достоверности сайтов и какие «процедуры проверки информации» они проводят, чтобы оценить достоверность контента сайта Flanagin A., Metzger M.J. The role of site features, user attributes, and information verification behaviors on the perceived credibility of web-based information // New Media and Society. 2007. №9 (2). P. 319-342. . В подобном исследовании Фогг и другие сфокусировались на том, какие факторы оценки достоверности контента веб-сайтов пользователи считают наиболее значимыми Fogg B.J., Soohoo C., Danielson D.R., Tauber E.R. Stanford J., Marable L. How do users evaluate the credibility of web sites? A study with over // Proceedings of the 2003 Conference on Designing for user experiences. New York: ACM. 2003. P. 1-15. . Согласно результатам исследования, среди наиболее популярных ответов: «дизайн», «информационный дизайн/структура» и «информационный фокус». В исследование включены различные сайты, но именно в группе новостных сайтов «информационная предвзятость» упоминается чаще, чем в среднем по исследованию (30% к 12%).
Вестервик исследовал, как достоверность онлайн-информации влияет на качество, точность сообщения, а также какую роль играет функционал сайта Westerwick A. Effects of sponsorship, web site design, and Google ranking on the credibility of online information // Journal of computer-mediated communication. 2013. №18 (2). P. 194-211.. Ньюган и Насс изучали критерии оценивания новостей в газетах и на телевидении Newhagen J., Nass C. Differential criteria for evaluating credibility of newspapers and TV news // Journalism Quarterly. 1989. №66. P. 277-284. . Выявили зависимость от типа СМИ. В случае с газетами это критерии, относящиеся к газете как к учреждению, институту (доверие к конкретной газете), в случае с телеканалом - доверие к лицам на экране.
В работе, посвященной оценке новостного контента, Сандер сформировал набор компонентов, полученных в результате факторного анализа. В их числе: достоверность, привлекательность, качество, репрезентативность Sundar S. Exploring receivers' criteria for perception of print and online news // Journalism & Mass Communication Quarterly. 1999. №76 (2). P. 373-386.. Слатер и Роунер определили, что на восприятие текстов влияют структура и стиль Slater M.D., Rouner D. How message evaluation and source attributes may influence credibility assessment and belief change // Journalism & Mass Communication Quarterly. 1996. №73 (4). P. 974-991..
1.7.1 Методология исследования Клерволла
Чтобы выяснить, как аудитория воспринимает тексты, сгенерированные автоматически, относительно текстов, написанных журналистами, был проведен эксперимент. Он состоит из трех этапов: предварительный тест, опрос и проверка на практике. Автор исследования сформулировал два исследовательских вопроса. Как читатели воспринимают тексты роботов с точки зрения качества и достоверности? И заметна ли разница между заметками алгоритмов и журналистов?
Респондентам было необходимо прочесть текст и присвоить ему пять слов или фраз из списка предложенных: интересный, скучный, объективный, патриотичный, привлекательный, важный, хорошо написанный, глубокий, основанный на фактах, чувственный, правдивый и проч.
Далее проводился опрос. Среди 17 студентов курса веб-производства случайным образом распределили заметки с краткими итогами игры в американский футбол, написанные человеком или алгоритмом. Респонденты оценили тексты по 12 характеристикам. Можно было добавить и новые параметры, однако им этого не потребовалось.
В третьем этапе исследования приняли участие студенты бакалавриата медиа и коммуникаций. Из 46 респондентов, принявших приглашение по электронной почте, большую часть составили женщины: 30 человек. Самому младшему участнику эксперимента 20 лет, старшему - 32. Средний возраст 23 года. 19 респондентов попали в первую группу (автор - журналист), 27 - во вторую (автор - алгоритм).
Источником текста о результатах матча по американскому футболу, сгенерированного автоматически, является сайт Bolts Beat. Новостной текст о национальной футбольной лиге, написанный журналистом, - взят с сайта газеты Los Angeles Times. Организаторы эксперимента сократили объем заметки корреспондента, чтобы он был эквивалентен объему текста, сгенерированного автоматически.
Респонденты прочли статью и оценили качество и достоверность контента по 12 характеристикам: объективно, достоверно, точно, скучно, интересно, удобно читать, понятно, информативно, хорошо написано, полезно, описательно, последовательно. Затем ответили на вопрос, кто автор: журналист или робот.
Результаты эксперимента. Для ответа на первый исследовательский вопрос при сравнении групп респондентов рассчитывались средние ранги с использованием теста Манна-Уитни для каждой характеристики. У журналистского текста выше оценки за «последовательно», «хорошо написано», «понятно», «легко читается» и менее «скучно».
При этом у текстов, сгенерированных автоматически, выше оценки за «описательно», «объективно», «информативно» и «достоверно». Также в исследовании показана оценка баланса для каждой характеристики. Она рассчитана путем вычитания среднего значения ранга текста, сгенерированного автоматически, из среднего значения ранга журналистского текста. Результаты аналогичны. Значительной разницы между результатами в обеих группах нет. Только характеристика «легко читается» дала статистически значимую разницу (U=143, r = -0,39).
Ответ на второй исследовательский вопрос был получен следующим образом. Из 27 респондентов, которые прочли текст робота, 17 верно определили автора. Из 18 участников, которым досталась заметка корреспондента, восемь определили автора верно, десять посчитали, что текст сгенерирован автоматически. Используя тест Манна-Уитни, исследователи сочли, что статистически значимой разницы в результатах эксперимента нет Clerwall C. Op. cit..
Эксперимент №2. Его организовала группа корейских исследователей. Цель - выявить, как журналисты и общественность оценивают качество новостных текстов, написанных алгоритмом и журналистами, какую роль сыграло упоминание автора. Интересно, что общественность поставила более высокие оценки текстам алгоритмов и более низкие - текстам журналистов.
Это подчеркивает негативное отношение к журналистам в Корее и лояльность к внедрению технологий. Кстати, журналисты оценили тексты аналогично Jung J., Song H., Kim Y., Im H., Oh S. Op. cit. P. 1..
На первом этапе исследования был проведен литературный обзор. Андерсон установил, что со временем человек становится более жестким, а подача материалов приобретает намеренность, предвзятость, в связи с чем растет внимание к влиянию алгоритмов и данных на журналистику Anderson C.W. Towards a sociology of computational and algorithmic journalism // New Media & Society. 2013. №15 (7), P. 1005-1021. . Некоторые современные работы сфокусированы на вычислительной журналистике, использующей качественные интервью и текстовый анализ.
В других исследованиях рассматривается связь между журналистикой и данными. Парази обратил внимание на то, что обработка больших объемов данных позволила бы журналистам производить новые типы расследовательских и разоблачительных материалов, основанных на эпистемологических (знание как таковое) подходах Parasie S. Data-driven revelation? // Digital Journalism. 2015. №3 (3). P. 364-380. .
В связи с ростом количества статей, написанных роботами, ученые проанализировали результаты предшествующих экспериментов.
Первой стала работа Кристера Клерволла, описание которой представлено выше. Далее были выявлены уровень доверия к автоматически созданным новостям, различия между ответами журналистов и аудитории новостных СМИ на основе результатов эксперимента, проведенного в Нидерландах в 2014 году. 168 носителей голландского языка и 64 голландских журналиста оценивали достоверность новостей, написанных роботами на тему финансов и спорта.
Как и в предыдущем исследовании, новости воспринимались одинаково обеими группами. Различие лишь в том, что журналисты ставили более высокую оценку текстам, созданным роботами, автором которых указан журналист, что по факту является неправдой.
На втором этапе корейские исследователи определили, каково отношение общества к журналистам и технологиям. По результатам литературного обзора, они сформировали имидж журналиста: агрессивный, амбициозный, циничный, дерзкий.
В частности, Бриджер проанализировал 59 фильмов, содержащих портреты фотожурналистов. Персонажи изображены жадными, агрессивно и непорядочно добывающими материалы ради собственного профессионального успеха, что априори вызывает у зрителей негативное отношение Bridger E. From the ridiculous to the sublime: Stereotypes of photojournalists in the movies // Visual Communication Quarterly. 1997. №4 (1). P. 4-11. .
Аудитория СМИ Южной Кореи также склонна обвинять журналистов в неэтичности. Одной из причин послужило событие, произошедшее в апреле 2014 года.
Тогда в Сеуле перевернулся паром, перевозящий 476 человек (в основном школьников), более 300 пассажиров и членов экипажа погибли. Журналисты распространили недостоверные факты, а также опубликовали провокационные истории, вызвав общественный резонанс. Судя по результатам исследований, их репутация по-прежнему не восстановлена.
Кроме того, фонд «Корейская пресса» дважды в год исследует мнение аудитории средств массовой информации. В выборке более 5000 граждан. С 2006 по 2014, несмотря на то, что уровень социального влияния был выше среднего, оценка этичности и доверия низкая. Низкие результаты показал и опрос о потреблении новостей, проведенный институтом Рейтер.
Также важно оценить отношение корейских потребителей к технологиям. В феврале 2015 Корея достигла самого высокого уровня проникновения смартфонов в мире: благодаря хорошо построенной беспроводной сетевой системе, широкому ассортименту и культурной склонности к ИКТ.
На основании вышеизложенных фактов, авторы исследования выдвинули первую гипотезу: независимо от того, кто на самом деле является автором заметки, респонденты поставят более высокую оценку текстам, автором которых указан робот, а не журналист.
Для того чтобы сформулировать вторую гипотезу исследования, авторы проследили за реакцией журналистов на изменения в сфере.
В первую очередь, они обратили внимание на страх потерять рабочее место, вызванный тем, что с развитием технологий сокращался штат редакции.
Во-вторых, возникновение Интернета и увеличение объемов разного рода информации наглядно продемонстрировали разделение журналистики на профессиональную и гражданскую, и свои материалы сотрудники редакций СМИ считают более надежными.
Однако, в контексте автоматизированной журналистики, Ван Дален в 2012 году изучил реакцию журналистов, проанализировав 68 газетных статей и сообщений в блогах.
Выяснилось, что большинство авторов «за» развитие технологий и автоматизацию. Ван Дален выделил такие аспекты, как:
1. Роботов воспринимают как «ранних последователей».
2. Автоматизация в основном применяется в спортивной журналистике, и алгоритмы не способны конкурировать с людьми в политике или международных отношениях.
3. Роботы в значительной степени не влияют на деятельность журналистов.
Отметим, что более ранние исследования отражают как позитивную (инновационные проекты), так и негативную (уход от традиций) реакцию на изменения в сфере.
Таким образом, группа корейских исследователей выдвинула вторую гипотезу: независимо от того, кем является автор заметки, журналисты выше оценят статью журналиста и ниже - робота.
Методология эксперимента. Исследователи отобрали десять статей о бейсболе, сгенерированных компьютером. Задачей респондентов, которых насчитывалось 20, расставить оценки за тексты по пятибалльной шкале Ликерта. Статистически значимых различий в результатах нет. Для проведения следующего этапа исследования случайным образом был выбран один текст из ранее предложенных.
Аналогичным образом были отобраны десять материалов журналистов из разных СМИ о результатах бейсбольного матча, опубликованных в один день. Объем заметок сокращен с целью соответствия текстам роботов. Респонденты вновь оценили статьи без статистически значимой разницы в результатах. Затем исследователи оставили один текст для перехода на второй этап эксперимента.
Задачей участников было сравнить работы алгоритма и журналиста без указания автора. Количество респондентов увеличилось до 201 человека, в числе которых 103 мужчины и 98 женщин.
Опрос проводила профессиональная исследовательская компания, сотрудники которой отправили респондентам анкеты по электронной почте. Участники прочли одну из двух статей, автор которой не указан, и оценили качество изложения, ясность, профессионализм автора, достоверность по пятибалльной шкале. Статистической разницы в результатах нет.
На следующем этапе была выполнена проверка первой гипотезы. Задачей 400 респондентов, в числе которых равное количество мужчин и женщин, было прочесть заметку журналиста или робота и ответить на вопросы.
Тексты разбиты на четыре группы. К первой группе относится заметка, сгенерированная автоматически, и ее автором указан алгоритм. Автором этой же заметки во второй группе указан журналист. Текст для третьей группы написан журналистом, однако автором указан алгоритм. Автора этой же заметки для четвертой группы обозначили корректно. Респонденты, получив тексты, оценивали их качество по пятибалльной шкале Ликерта.
В результате эксперимента из первых двух групп наибольшее количество баллов получил текст компьютера, автором которого он и указан. В третьей и четвертой группах также победу одержал алгоритм. Таким образом, первая гипотеза, выдвинутая корейскими исследователями, подтверждена.
Для проверки второй гипотезы, что журналисты выше оценят тексты своих коллег, была проведена следующая процедура. Респондентами стали 164 журналиста, в числе которых 111 мужчин и 53 женщины, отобранных по принципу снежного кома.
Участники получили ссылку на статью, выбранную случайный образом. Задача аналогична - прочесть текст и ответить на вопросы. Интересно, что такие же, как при проверке первой гипотезы. Вывод - вторая гипотеза опровергнута.
В силу того, что общественность не различила авторов, исследователи отметили: автоматизированная журналистика в Корее на начальном этапе развития, однако качество текстов высокое.
Опровержение второй гипотезы они объясняют тем, что сотрудники СМИ воспринимают софты не как свою замену, а как дополнение. Их ожидания от текстов роботов были ниже, чем от заметок коллег. Вовсе не обязательно, что к представителям других групп, в данном случае к роботам-журналистам, будет враждебное отношение Allport G.W. The nature of prejudice. Cambridge, MA: Addison-Wesley. 1954..
Также группа корейских исследователей выявила преимущества алгоритмов, в числе которых: беспристрастность, высокая скорость, меньшее количество ошибок, мультиязычность, функция анализа данных в соответствии с индивидуальными предпочтениями читателя, а также возможность сосредоточиться на расследованиях и глубинном анализе, предоставленная журналистам. Главным недостатком они назвали неумение алгоритма проверять достоверность базы данных.
По итогам эксперимента, исследователи предположили, что так как алгоритм, который был протисторан, разработан для текстов на тему спорта, статьи о политике и экономике, сгенерированные автоматически, могут восприниматься респондентами иначе. В опросе участвовали лишь граждане Южной Кореи, поэтому не следует обобщать результаты на другие страны. Журналисты попали в выборку методом снежного кома. Возможно это не самый удачный способ отбора участников данного эксперимента.
Эксперимент №3. Его авторы - нидерландские исследователи. Участниками стали 232 человека, являющиеся носителями голландского языка, среди которых 64 журналиста. 45% респондентов составили мужчины, остальные - женщины, возраст участников от 19 до 65 лет. Материалы - четыре новостные заметки, две из которых о футбольном матче, еще две - о ценах на акции. Соответственно, и робот, и журналист написали по одной заметке на заданные темы.
Каждый респондент получил по одному тексту, автор которого был указан, и оценил его по 12 пунктам относительно пятибалльной шкалы Ликерта (от 1 - низкой оценки до 5 - самой высокой оценки), в том числе: точность, достоверность, качество текста, предвзятость и другие. Затем исследователи провели факторный анализ полученных значений.
В результате они выявили, что в ответах потребителей новостей статистически значимой разницы нет, однако к текстам роботов респонденты относятся более лояльно. Тем временем ответы журналистов показали, что они больше доверяют коллегам, чем роботам, однако более эрудированы, по их мнению, компьютеры Van der Kaa H.A.J., Krahmer E.J. Journalist versus news consumer: The perceived credibility of machine written news // Proceedings of the Computation + Journalism conference New York. 2014..
Эксперимент №4. В 2016 году немецкие исследователи провели онлайн-эксперимент с целью выявления того, как аудитория воспринимает новостные заметки, сгенерированные компьютером. Используя дизайн 2х2х2, они внесли корректировки в темы статей и информацию об авторстве, в некоторых случаях намеренно указав автора недостоверно. По результатам исследования было определено, что заметки журналистов получают более высокую оценку. Однако тексты роботов, даже если таковыми не являются, но автором указан алгоритм, показались респондентам более достоверными Graefe A., Haim M., Brosius H.-B., Haarmann B. Perception of automated computer-generated news: credibility, expertise, and readability // Journalism. 2016. URL: https://www.researchgate.net/publication/289529002_Perception_of_Automated_Computer-Generated_News_Credibility_Expertise_and_Readability (дата обращения: 14.03.2018). .
1.8 Характеристики роботов-журналистов
Российскими и зарубежными исследователями сформирован некий перечень преимуществ роботов-журналистов и тех навыков, которые им необходимо освоить.
В частности, в 2012 году Ван Дален проанализировал реакцию журналистов на запуск StatSheet, сети сайтов, где генерируются новости о спортивных матчах, изучив 68 блогов журналистов и газетных статей Thurman N., Dцrr K., Kunert J. When reporters get hands-on with robo-writing: professionals consider automated journalism's capabilities and consequences // Digital Journalism. 2017. URL: https://www.tandfonline.com/doi/full/10.1080/21670811.2017.1289819 (дата обращения: 29.03.2018). . Два года спустя аналогичный метод применил исследователь Карлсон, который проверил, каково отношение журналистов к сервису автоматической генерации текстов, произведенному компанией Narrative Science. Янг и Хермида провели интервью с семью сотрудниками Los Angeles Times Young M.L., Hermida A. From Mr. and Mrs. Outlier to central tendencies // Digital Journalism. 2015. №3 (3). P. 381-397. . Андреас Грефе совместно с коллегами разработал гид по автоматизированной журналистике, включив в него характеристики современных роботов-журналистов.
В числе преимуществ исследователи выделяют: высокую оперативность создания заметок, так как на генерацию текста уходит от пары секунд до трех минут. Отсутствует необходимость в начислении заработной платы роботу-журналисту и выполнении других платежных обязательств (больничный, отпуск).
Если алгоритмы написаны корректно, то они не допускают ошибок в вычислениях, опечаток и прочее. Обрабатывая данные и генерируя тексты, компьютеры освобождают корреспондентов от рутинной работы в пользу задач, требующих экспертных знаний в определенной сфере, умения вести диалог или проведения более глубокого анализа данных. Заметка, написанная роботом, может стать драфтом аналитического материала, который впоследствии дополнит журналист. Она объективна и не содержит оценок.
Несмотря на массу возможностей алгоритмов, практики и исследователи выделяют недостатки, которые препятствуют развитию роботожурналистики в полной мере.
Во-первых, это высокие затраты на производство сервисов и алгоритмов автоматической генерации текстов. Разработчики не называют определенные суммы, однако в редакциях СМИ отмечают, что на данный момент выгоднее нанять дополнительного автора, чем заниматься написанием, тестированием и поддержкой алгоритма. Компьютеры намного хуже справляются с неструктурированными данными, более того, не умеют эти данные проверять.
В случае выгрузки датасета с некорректными значениями, будет сгенерирован текст, содержащий фактическую ошибку. Пример из практики: в системе геологической службы произошел сбой, алгоритм газеты Los Angeles Times Quakebot мгновенно получил ложные данные о землетрясении и без проверки сведений опубликовал заметку, вызвавшую общественный резонанс. Сотрудники издания были вынуждены вручную исправить заметку.
Большие сложности возникают у разработчиков при обучении алгоритма грамматическим и синтаксическим правилам. Типологические особенности языков затрудняют написание универсального алгоритма. Зачастую роботы-журналисты обучены ограниченному количеству правил и только в соответствии с ними генерируют тексты. Данный фактор определяет условные границы «в творчестве» алгоритмов с точки зрения структурирования предложений и лексического разнообразия. Ограничены и темы, на которые компьютеры могут писать заметки. Основные критерии - наличие структурированных баз данных, поэтому чаще всего компьютеры пишут о спорте, финансах, погоде, криминальной статистике, медицине и дорожной ситуации.
Также алгоритмы проигрывают журналистам в развитии коммуникативных навыков: они не способны вести диалог, продумывать структуру интервью, задавать вопросы, вытекающие из ответов собеседника. У компьютеров нет чувства юмора, тексты написаны сухим языком, выявлять из готовых текстов потенциально интересные темы, основываясь на словах, а не цифрах, они не умеют (Грефе, Фанта, Дорр).
Помимо обсуждения преимуществ и недостатков, в научной среде поднимают актуальные вопросы, касающиеся развития автоматизированной журналистики. В частности, исследователей беспокоит вопрос об авторском праве, моральной ответственности за опубликованные материалы перед обществом и отсутствии согласованной политики алгоритмов.
В некоторых случаях за критикой следуют предложения. В частности, Дьякополус и Колиска выступают за «прозрачные» алгоритмы, позволяющие журналистам и читателям отслеживать процесс генерации текста. Александер Фанта рекомендует редакциям СМИ создавать собственные базы данных, а не получать их из общедоступных источников, чтобы повысить уникальность материалов Fanta A. Putting Europe's robots on the map: automated journalism in news agencies // Reuters Institute Fellow Paper. 2017. URL: https://reutersinstitute.politics.ox.ac.uk/our-research/putting-europes-robots-map-automated-journalism-news-agencies (дата обращения: 09.04.2018)..
Глава 2. Типологический анализ языков
2.1 Общие сведения
Редакции СМИ проявляют интерес к технологиям автоматической генерации текстов, но в то же время объективно соотносят свои потребности и возможности с уровнем развития роботожурналистики. Литературный обзор продемонстрировал степень вовлечения пишущих софтов в редакционные процессы за рубежом и в России. Их применение выгоднее международным изданиям, в задачи которых входит подготовка материалов на основе финансовых отчетов, статистики спортивных матчей и т.д., а территориальный охват аудитории выходит за пределы одной страны.
На данном этапе большая часть заметок генерируется по шаблону. Это несколько вариантов полноценных текстов, написанных человеком, с использованием переменных, место которых, после обработки массива данных, займет слово или числовое значение. В более сложных версиях алгоритм создает структуру, используя для разных сценариев предварительно заготовленные словосочетания и предложения. Недостаток шаблонов в том, что они не универсальны: конечные продукты (тексты), произведенные в одной редакции, мало различимы между собой; для написания текста необходимо загрузить достаточно много правил, перенастроить шаблон на решение иной задачи практически невозможно. Подобные алгоритмы удобны в генерации текстов на языках с фиксированным количеством слов в предложениях, к которым относятся большинство западноевропейских языков, если речь идет не о примитивных шаблонах-вставках Власова Н.А. Подход к автоматическому извлечению информации о назначениях и отставках лиц (на материале новостных сообщений) // RCDL. 2012. URL: https://www.semanticscholar.org/search?q=%D0%BC%D0%BE%D1%80%D1%84%D0%BE%D0%BB%D0%BE%D0%B3%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%B8%D0%B9%20%D0%B0%D0%BD%D0%B0%D0%BB%D0%B8%D0%B7&sort=relevance&page=3 (дата обращения: 01.05.2018). .
Алгоритмы, в основе которых нейросети, способные обучаться сбору и анализу неструктурированных данных, имеют более высокий творческий потенциал, однако менее востребованы. Во-первых, их разработка требует более серьезных компетенций, а также финансовых затрат и временных ресурсов. Во-вторых, на сегодняшний день нейросети не являются механизмом решения задач автоматической обработки текста без всякого вмешательства человека. Более того, как шаблонные, так и построенные на нейросетях алгоритмы, не гарантируют защиты от некорректных выбросов синонимов или значений. Риск выбросов повышается при сбоях систем сбора и передачи данных по API или при некачественном формировании массива данных.
На основе анализа научных статей и материалов в СМИ мы сделали вывод, что роботы-журналисты получили наибольшее распространение в англоязычных изданиях, львиная доля текстов генерируется по шаблонам, количество тем, освещаемых компьютерами, весьма ограничено: спорт, финансы, погода, поисковые запросы, криминальная статистика, музыкальные рейтинги.
Для сравнения: работу с шаблонами осуществляют алгоритмы StatsMonkey, Los Angeles Times, Narrative Science, Rtr text, Associated Press (Wordsmith), The Guardian, Textomatic, IamFNBOT, Яндекс, Sports.ru, ТАСС. Более продвинутые технологии генерации текстов на естественном языке применяются в сервисе AX Semantics. Менее половины роботов-журналистов, о которых шла речь в первой главе выпускной квалификационной работы, пишут на иностранных языках.
Тематическое распределение выглядит следующим образом (в скобках указано, сколько сервисов или алгоритмов, разработанных в редакциях СМИ, из 14 предложенных, освещают данную тему): спорт и финансы (7), криминальная хроника и погода (3), путешествия (2), результаты медицинских исследований, опросы, землетрясения, заторы на дорогах, музыкальные рейтинги, информация о кинофильмах в прокате, поисковые запросы интернет-пользователей и развлечения (1).
Далее опишем методологию исследования. Для более полного представления в нее включены все виды анализа текстов в рамках компьютерной лингвистики, однако в магистерской диссертации сделан акцент только на морфологическом анализе.
2.2 Методология исследования
Цель исследования - написать рекомендации по усовершенствованию алгоритмов автоматической генерации текстов. Для этого необходимо определить структуру заметок, публикуемых в СМИ, оценить навыки пишущих роботов с точки зрения жанрового разнообразия текстов, усвоения компьютерами грамматических, морфологических и синтаксических норм.
Первый этап. Формирование коллекции текстов на русском и английском языках. Поиск ограничен тремя темами для анализа динамики развития алгоритмов как внутри одной редакции, так и среди СМИ разных стран. Источники: сайты отечественных и зарубежных информационных агентств, газет, а также узкоспециализированных медиа.
Второй этап. Характеристика текстов:
1. Определение жанра. За основу взята жанровая классификация А.А. Тертычного: информационный, аналитический, художественно-публицистический и их подвиды Тертычный А.А. Жанры периодической печати: учебное пособие. М.: Аспект Пресс, 2000. URL: http://evartist.narod.ru/text2/01.htm (дата обращения: 30.04.2018)..
2. Описание структуры текста (шаблона): объем, составные элементы.
3. Оценка актуальности темы.
Третий этап. Анализ выбранных журналистских продуктов. Сценарий анализа:
1. Графематический анализ. Разбивка входного текста по токенам (словам или предложениям), выделение заголовков, устойчивых оборотов, дат, имен файлов, электронных адресов и т.д. Данный метод служит опорой для последующего морфологического и синтаксического анализа Митина О.В., Евдокименко А.С. Методы анализа текста: методологические основания и программная реализация // Вестник Южно-Уральского государственного университета. Серия психология. № 40 (216). 2010. Стр. 29-38. URL: https://cyberleninka.ru/article/v/metody-analiza-teksta-metodologicheskie-osnovaniya-i-programmnaya-realizatsiya . Основная задача - выявить лексемы.
2. Морфологический анализ текста. Определение исходной формы слова (леммы) и его основных параметров. Указываются имя и значение. Именем параметра могут быть род, лицо, склонение, число, падеж, время, форма прилагательного. Значением - именительный, родительный падеж и т.д., единственное или множественное число, первое, второе или третье лицо, женский, мужской или средний род и прочее. Список морфологических параметров зависит от части речи. Например, у существительных, исходная форма которых во множественном числе, невозможно определить род (часы, ножницы, очки), соответственно значение параметра принимает фиксированное значение - «0» Большакова Е.И., Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. Указ. соч.. Процесс осложняют языковые особенности, в частности, омонимия, при которой правописание двух слов не имеет различий, а часть речи, лексическое значение и другие характеристики индивидуальны. Для сравнения: «белки содержат в своем составе аминокислоты» и «в лесу появились белки». В данном случае при определении части речи и иных характеристик необходимо опираться на контекст. Более подробно - в следующем параграфе. Реализация метода морфологического анализа текста осуществляется посредством использования программных продуктов и систем: ATLAS.ti, SVMTool, Textanz, TextArc, TreeTagger, Stanford POS tagger, Pymorphy, TnT, Mystem, HunPos, Lapos, Morfette и Citar Dereza O.V., Kayutenko D.A., Fenogenova A.S. Automatic morphological analysis for Russian: a comparative study. 2016. URL: https://www.semanticscholar.org/paper/Automatic-Morphological-Analysis-for-Russian%3A-a-dereza/5cf3ebb5d8ad7bb4e9e2a6a32b65adc68f7b3387?tab=abstract (дата обращения: 01.05.2018). .
При морфологическом анализе алгоритм получает на вход словоформу текста на естественном языке. Виды морфологической обработки:
· Лемматизация - приведение к нормальной форме слова. Пример: больше - большой, домашний - дом.
· Стемминг - выявление основы слова. Пример: закрыть - крыт, переутомление - том.
· Полный морфоанализ - анализ, при котором на выходе будет получена лемма с соответствующими ей морфологическими характеристиками. Пример: зимних - зимний + прилагательное, множественное число, родительный падеж.
Барьерами для морфологического анализа являются две категории лексических единиц Е. Черняк, Д. Ильвовский. Материалы лекции по морфологическому анализу неструктурированных данных // НИУ ВШЭ. 2017.:
1. Новые слова. К таковым относятся заимствования или лексические единицы, изменившие в ходе развития словоформу.
2. Слова с морфологической неоднозначностью. Это лексические единицы, которые при одинаковом правописании имеют разные значения и/или относятся к разным частям речи. Пример: столовая (прилагательное и существительное), белила (существительное и глагол), замок (многозначное существительное).
При омонимии возможно проведение нескольких вариантов анализа. Способы ее снятия (разрешения): корректный выбор леммы, уточнение морфологических характеристик. Основные методы, которые применяются для выполнения задачи: машинное обучение и написание лингвистических правил (удаление всех омонимов слова с падежами, не соответствующие возможным падежам предшествующего предлога, например, у дома - возможен предложный, но не именительный падеж).
3. Синтаксический анализ текста. Выявление синтаксических связей между словами, построение дерева зависимостей. Анализ осуществляется с помощью Profiler Plus, DictaScope, SyntaxNet и других средств.
Схема анализа: на вход поступают предложение на естественном языке и результат морфологического анализа. На выход алгоритм выдает синтаксическое дерево предложения, которое может быть построено по двум моделям Большакова Е.И. Автоматическая обработка текстов: задачи, подходы, ресурсы // Материалы Летней школы по АОТиАД. 2017. URL: https://www.hse.ru/data/2017/07/24/1173868389/%D0%9A%D0%9B_%D0%97%D0%B0%D0%B4%D0%B0%D1%87%D0%B8_%D0%9F%D0%BE%D0%B4%D1%85%D0%BE%D0%B4%D1%8B_%D0%A0%D0%B5%D1%81%D1%83%D1%80%D1%81%D1%8B.pdf (дата обращения: 03.05.2018).:
· Деревья подчинения или зависимостей. В основе - подчинительная связь слов. Состоит из узлов (слов) и дуг (подчинительная связь). Особенность модели: должен быть задан порядок слов.
· Деревья составляющих. Синтаксическими единицами являются составляющие или отрезки текста: слова, сочетания слов, полноценные предложения. Как правило, структура фиксируется КС-грамматикой (по Хомскому). Пример: S > NP VP NP или AnV > Aux V, где S - предложение, NP - именная группа, VP - глагольная группа, AnV - аналитическая форма глагола, Aux V - вспомогательный глагол плюс глагол.
4. Семантический и дискурсивный анализ текста. Выявление смысла внутри одного и между несколькими предложениями текста. Определение семантики слов, включая разрешение их многозначности. Позволяет найти семантически несвязные словосочетания и конструкции. На вход алгоритм получает синтаксическое дерево, на выходе образуется семантическая структура. Моделями представления смысла являются семантические сети или формулы исчисления предикатов Большакова Е.И. Указ. соч.. Анализ основан на актантно-аргументной структуре предложения, полученной на предыдущем уровне анализа текста (синтаксическом). Корнем синтаксического дерева зависимостей является слово-предикат (сказуемое), имеющее валентности (количество типов актантов, которые глагол может присоединить). Например, построить: что? (1) где? (2) кому? (3) как? (4). Под дискурсивным анализом текста понимают определение тематической целостности, а также композиционной структуры текста.
Четвертый этап. Резюме по итогам анализа текстов, сгенерированных автоматически.
2.3 Морфологические особенности русского, английского и немецкого языков
Каждому языку свойственен индивидуальный набор норм и правил, позволяющий выявлять как общие, так и уникальные признаки. Во избежание ошибок и выбросов, а также с целью генерации согласованных предложений, не отличающихся от написанных журналистами, данные характеристики необходимо учитывать при разработке алгоритмов автоматической обработки текстов на естественном языке. Сравнительный анализ языков позволит также оценить влияние лингвистических особенностей на текущее состояние и перспективное развитие пишущих роботов.
Несмотря на то, что с течением времени типологические границы языков размываются, а в речь проникают заимствования, каждый язык уникален, а его лингвистические параметры усложняют либо упрощают процесс создания роботов-журналистов. Английский язык относится к флективному аналитическому типу (однако постепенно приобретает черты агглютинативного). Главную роль в предложении играют глагол и его грамматические категории. В системе русского и немецкого языков преобладают флексии (окончания), так как это языки флективного синтетического типа. Многие лингвисты отмечают, что в ходе своего развития немецкий язык приобретает свойства языков аналитического типа.
Морфема - это значимая часть слова, выраженная в виде основы слова или аффикса (разделяют на словообразовательные и словоизменительные). Проведем сравнительный анализ русского, английского и немецкого языков на морфологическом уровне.
1. Знаменательные слова. Это слова, имеющие самостоятельное лексическое значение, выполняющие номинативную функцию и являющиеся членом предложения. В английском языке, как правило, к таковым относятся одноморфемные слова. Примеры корневой морфемы, основы и производного слова: brother - brother - brotherhood, friend - friend - friendship, speak - speak - speaker.
В русском языке распространены слова, состоящие из двух или трех морфем. Примеры корневой морфемы, основы, словообразовательной морфемы и производного слова: город - город - ск - городской, весн - весн - н - весенний. Одноморфемные слова также встречаются, однако они неизменяемы. К таковым относятся предлоги, союзы, частицы, заимствования. Пример: еще, жалюзи, вдруг, киви, кенгуру, как, зачем, если.
Принципы немецкого языка аналогичны нормам русского. К одноморфемным относятся неизменяемые слова (Tisch, Ruf, Tuch), в устной и письменной речи преобладают знаменательные слова, состоящие из двух и более морфем. Пример: Freund - Freundschaft, Ministerium - Innenministerium.
2. Имя существительное. В английском языке характеризуется наличием двух грамматических категорий: род, категория детерминативности (определенности или неопределенности), выраженная артиклем.
В русском и немецком в полном объеме представлены три категории: род, число, падеж. Важное типологическое отличие немецкого и английского языков от русского в наличии категории определенности/неопределенности, выражаемой с помощью артикля (a, an, the; der, das, die, ein, eine).
В русском языке множественное число выражается с помощью окончаний (флексий), присоединяемых к основе слова, в немецком - аффиксов и внутренней флексии. Кроме того, в обоих языках возможно изменение служебных слов, стоящих рядом с существительным (предлоги, артикли), что говорит о проявлении свойств аналитического типа. Пример: этот кенгуру - эти кенгуру, das Wappen - die Wappen. Форма множественного числа задается окончанием s (-es), в ряде слов исключений происходит замена гласной буквы. Пример: woman - women, mouse - mice.
Склонение существительных имеет определенные сходства в русском и немецком языках. В то время как для английского языка характерно определение морфологических признаков по служебным словам, стоящим рядом с существительным.
Важно отметить, что с течением времени претерпевает изменения падежная система языков. На сегодняшний день в русском языке шесть падежей вместо восьми (именительный, родительный, дательный, винительный, творительный, предложный), в немецком - четыре (именительный, родительный, дательный, винительный), в английском - два (именительный, притяжательный).
Типологические сходства в русском и немецком языках относительно имени существительного однозначно преобладают. В большинстве своем это связано с общностью происхождения языков. Различия состоят в составе грамматических категорий, их внутреннего членения, средств функционирования и выражения.
3. Имя прилагательное. В отличие от английского языка, в котором прилагательное не согласуется с именем существительным, а лишь прилегает к нему, в русском языке имя прилагательное согласовано с существительным в падеже, роде, числе и категории степени качества.
Различия русского и немецкого языков - в изменении формы прилагательного. В частности, краткое прилагательное в немецком языке совпадает с однокорневым наречием, то есть они омонимичны. Помощь в выявлении грамматических признаков оказывает определение того, какую функцию выполняет слово: предикативную (прилагательное) или функцию обстоятельства (наречие).
4. Глагол. В английском языке характеризуется наличием семи грамматических категорий: лицо, число, время, наклонение, залог, вид, временная отнесенность, представленная видами перфекта. В русском языке их число аналогично: вид, время, залог, наклонение, лицо, число, грамматический род в формах единственного числа прошедшего времени. В немецком языке представлены пять грамматических категорий глагола: лицо, число, время, залог, наклонение. Система формообразования глагола в русском языке более гибка, в немецком - однообразна.
5. Словообразование. Для языков флективного типа (русский, немецкий) характерны словосложение, аффиксация и субстантивация. Первый способ наиболее распространен в немецком языке, второй - преимущественно суффиксальный - в русском. Суффиксы выражают различные оттенки значений, бывают: уменьшительно-ласкательные (-ик - котик, -ичек - дождичек, -оньк - целехонький), пренебрежительно-уменьшительные (-ишк - делишки), увеличительные (-ищ - ручища) или образуют другую часть речи (-им - гонимый ветром, причастие образовано от глагола гнать). Отметим, что в русском языке более разнообразны способы образования новых слов, чем в других языках.
Для сравнения, в немецком языке существует всего два суффикса субъективной оценки, соединяющих в себе оттенки ласкательности, уменьшительности, уничижительности: -chen, -lein. Пример: die Дuglein des Kindes (глаза ребенка) - ласкательное, Na, Freundchen (Ну, друг) - ирония. При этом в языке полностью отсутствуют суффиксы увеличительные.
В английском языке полностью отсутствуют суффиксы субъективной оценки, их заменяют лексические показатели: a little house (домик, дословно: маленький дом) Анохина С.П., Кострова О.А. Сравнительная типология русского и немецкого языков: учебное пособие // Флинта-наука. 2012. С. 208. URL: http://olgakostrova.narod.ru/books/CompTypology/CompTypology.pdf (дата обращения: 03.05.2018). .
Особенности словосложения в немецком языке: сложные слова заключают в себе отдельные понятия, а также выражают отношения между ними.
Пример: Gastwirtssohn (сын трактирщика), Zwischenlieferanten (посредник, дословно - между поставщиками). Словосложение немецкого языка отличается от русского широтой действия, поскольку распространяется не только на существительные, но и на прилагательные и глаголы.
Слово-определитель может выражаться не только существительным, но также: глаголом, наречием, прилагательным, числительным (Schuhputz - чистка обуви, Nдhmaschine - швейная машина), эквивалентом большинства слов в русском языке будет словосочетание. Мы видим, что в немецком происходит смешение морфологического и синтаксического уровней.
На уровне словоизменения для обоих языков характерна флективность - изменение окончания. Особенность немецкого в том, что флективную функцию выполняет другое слово: артикль, вспомогательный глагол, что придает языку черты аналитического типа. И в русском, и (преимущественно) в немецком применяется нулевая флексия. Только в немецком - нейтральная флексия, а также широкое распространение морфологической омонимии.
В английском языке словообразование осуществляется с помощью суффиксов, префиксов, словосложения и сокращения: active - activity, use - useful - usefulness, mother-in-low. Кроме того, для языка характерна конверсия - переход из одной части речи в другую: to work (работать, глагол) - a work (работа, существительное).
6. Система частей речи. Особенности русского языка: есть деепричастия, характерна «категория состояния» - несклоняемо-именные и наречные слова, употребляемые в сочетании с глаголом быть (ей было страшно, ему стало неприятно). В немецком и английском языках, в отличие от русского, существуют определенные и неопределенные артикли, которые выполняют функцию служебных частей речи. В немецком языке, помимо прочего, они указывают на род существительного: der Schьler (школьник, мужской род) - die Schьlerin (школьница, женский род).
2.4 Синтаксические особенности русского, английского и немецкого языков
1. Типы предложений. Предложения дифференцируются по двум типам: односоставные (употребляется один главный член предложения - подлежащее или сказуемое) и двусоставные (есть как подлежащее, так и сказуемое). Говоря об односоставных предложениях, важно отметить сходства русского и немецкого языков с точки зрения семантики: имеются личные, безличные, неопределенно-личные и другие виды предложений. Различия заключаются в форме и структуре таковых значений. В английском языке односоставные предложения типологического значения не имеют, преобладает двусоставный тип.
2. Структура предложения. Основное различие языков на синтаксическом уровне в том, что в английском и немецком задан строгий порядок слов, в то время как для русского языка характерна инверсия. По этой причине русский относится к языкам автономно-собранного строя (к нему же относятся греческий, латинский и др.), для немецкого и английского (а также для французского) характерен закрепленно-напряженный строй предложения, что обусловлено недостаточным развитием флективной системы.
Синтаксические нормы языков тесно связаны с нормами морфологическими. Отсутствие системы флексий в английском языке обуславливает строгую фиксацию места слова в предложении. В немецком языке оно частично автономно на уровне словосочетания, что является причиной расположения немецкого языка между языками с ярко выраженным закрепленно-напряженным строем и языками с автономно-собранным строем. Автономность каждого слова в предложении русского языка объясняется развитой системой флексий и, тем самым, его типологической принадлежностью.
Однако в русском языке, как и в английском, используются открытые структурные схемы предложения. Это значит, что употребление некоторых компонентов предложения опционально. Для немецкого языка, напротив, характерна закрытая структурная схема предложения, каждый компонент которой является обязательным: «подлежащее + связочный или вспомогательный глагол + предикатив или именная часть глагольной формы, или и то, и другое вместе» Анохина С.П., Кострова О.А. Указ. соч. С. 71. .
...Подобные документы
Краткая история средств массовой информации. Свойства, обуславливающие привлекательность радиовещания среди прочих СМИ. Основные этапы развития радиовещания в Советском Союзе. Особенности современного радиовещания, его основные проблемы и перспективы.
курсовая работа [166,3 K], добавлен 17.06.2011Классификация и жанрообразующие признаки внешних PR текстов. Понятие и содержание пресс-релиза в системе жанров PR-текса, принципы их написания для опубликования в сети Интернет. Типология оперативно-новостного и аналитико-публицистического жанров.
курсовая работа [33,3 K], добавлен 10.01.2016Анализ особенностей текстов модульной рекламы в печатных средствах массовой информации. Основные виды, типы текстов, структура модульной рекламы. План анализа модульных структур в журнале "Story". Характеристика журнала, анализ его рекламных модулей.
курсовая работа [72,6 K], добавлен 17.03.2015Пропаганда и массовая информация в русскоязычных СМИ за рубежом. Проблемы и перспективы развития русскоязычного Интернета и русскоязычных средств массовой информации в странах СНГ. Возможности обмена информацией между соотечественниками по всему миру.
курсовая работа [62,3 K], добавлен 24.10.2010Проблема пропагандистской составляющей русскоязычных средств массовой информации, ее влияние на зарубежную аудиторию. Оценка современного состояния русскоязычной прессы в странах СНГ. Роль русскоязычных Интернет СМИ в системе всемирной коммуникации.
дипломная работа [64,4 K], добавлен 20.10.2010Феномен и исторические последствия комсомольских газет с точки зрения влияния на молодежь того времени, особенности их печатных текстов. Анализ динамики развития комсомольской прессы по пути развития общества. Современное состояние комсомольских изданий.
курсовая работа [41,8 K], добавлен 13.01.2010Общие правила набора на русском языке. Основные виды текстов. Верстка текстов и иллюстраций с соответствующими примерами, правильного и неправильного расположения. Спуск полос и сбор брошюры. Способы размещения изображений, текста, формул, таблиц.
курсовая работа [2,0 M], добавлен 15.05.2013Виды издания документных текстов. Оценка текста с логической стороны. Выявление логико-смысловых связей. Виды логических ошибок. Устранение смысловых ошибок. Анализ и оценка композиции произведения. Корректурные знаки, используемые при редактировании.
курсовая работа [90,9 K], добавлен 24.05.2014Общая характеристика журналистских текстов и способов подачи новостей в средствах массовой информации. Выборочный анализ подачи информации в BusinessWeek и анализ рейтинговых публикаций издания. Рассмотрение основных проблем журналистских текстов.
курсовая работа [45,8 K], добавлен 27.11.2012Массовые коммуникации, средства массовой информации и принципы PR. Основные принципы Паблик Рилейшнз. Общие правила подготовки PR текстов. Проведение новостных PR-мероприятий, пресс-конференций. Этапы управления информацией. Правила взаимодействия со СМИ.
курсовая работа [56,5 K], добавлен 09.05.2011Композиция журналистского текста как неотъемлемая часть литературного произведения, её отличие от литературных текстов. Особенности аналитических жанров журналистики в российских изданиях. Комментарий как аналитический жанр на примере газеты "Ведомости".
курсовая работа [40,8 K], добавлен 02.04.2017Политический дискурс и особенности его интерпретации в медиасфере. Методы дискурс-анализа в средствах массовой информации. Формирование представлений о политической реальности Украины в русскоязычных СМИ. Специфика информационного пространства страны.
автореферат [59,7 K], добавлен 26.11.2014Типологические особенности печатных СМИ. Журнал как тип периодического издания. Исторические предпосылки появления и развития колумнистики. Специализированная пресса: общие характеристики. Анализ специфики колумнистских текстов в журнале "Журналист".
дипломная работа [814,8 K], добавлен 30.04.2015Источники цитирования прецедентных текстов в соответствии с классификацией А.Б. Лихачевой. Определение особенностей использования прецедентных текстов в заголовках газет местного издания. Употребление в заголовке стереотипного для собеседника изречения.
курсовая работа [62,1 K], добавлен 08.03.2015Характеристика и специфика качественных и популярных типов газет, способы представления информации. Место русскоязычных газет в эмигрантской прессе Великобритании. Этапы развития и современное состояние русскоязычной газетной периодики в Великобритании.
дипломная работа [127,3 K], добавлен 17.01.2014Умения и навыки редактирования текстов. Виды изданий: рекламные; информационные, научные, учебные, переиздания. Требования по редактированию газетно-журнальных изданий. Работа редактора с рекламными изданиями. Редактирование информационных изданий.
реферат [28,9 K], добавлен 15.12.2010Общая характеристика процессов зарождения и развития книгопечатания. Особенности формирования производства бумаги и техники полиграфии. Специфика развития и роль полиграфии в XX веке. Значение современного полиграфического бизнеса в рыночной экономике.
курсовая работа [39,1 K], добавлен 17.06.2012Новостной редактор телевидения: характеристика "невидимой" профессии. Лексические, морфологические и синтаксические особенности новостного языка. Требования к составлению телевизионной информационной заметки: редакторский анализ и работа над текстом.
дипломная работа [458,5 K], добавлен 28.07.2014Сущность и разновидности очерка. Исследование особенностей структурной организации очерков различных видов. Художественные элементы очерка: пейзаж, деталь, портретная характеристика. Лексические, морфологические, синтаксические особенности жанра.
курсовая работа [60,7 K], добавлен 07.12.2008Отличительные особенности PR-текстов. Медиа-тексты, их своеобразие и место в современных СМИ. Имиджевое интервью: основные признаки и отличия от интервью традиционного. Особенности имиджевых интервью на примере публикаций в газете "Континент Сибирь".
дипломная работа [73,9 K], добавлен 27.06.2012