Главная Коллекция "Revolution" Маркетинг, реклама и торговля Факторы, определяющие распространение рекламных сообщений на платформе YouTube

Факторы, определяющие распространение рекламных сообщений на платформе YouTube

Коммуникации в сетях как база для понимания распространения информации. Анализ графов распространения информации. Классические и современные подходы к прогнозированию распространения информации. Рекомендации по работе с рекламой и трендами в YouTube.

Рубрика	Маркетинг, реклама и торговля
Вид	дипломная работа
Язык	русский
Дата добавления	23.09.2018
Размер файла	2,2 M

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Страница:

В случае с Versus баттлом, псевдоним рэпера Славы КПСС был заменен на его более употребимый в сообществе: Гнойный. На выдачу это не влияет, т.к. YouTube выдает по этому запросу и сам баттл.

Таблица 1

Параметры для поиска видео-сообщений

Сообщение	Ключевые слова	Дата начала	Дата окончания
Вжух	вжух, veet	27 апреля 2017	16 апреля 2017
Вжух 2.0	вжух, veet	17 апреля 2017	-
Реклама Клинского	клинское	13 июля 2017	-
Новогодняя реклама Кока-Колы	кока кола, новый год	20 ноября 2017	-
Клип “Блокеры”	блокеры, джарахов	20 апреля 2017	-
Клип “Мега-звезда”	марьяна ро, мега звезда	11 декабря 2017	-
Дисс на Атеву	лиззка, атева, дисс	18 июня 2017	-
HypeCamp	хайпкэмп, hypecamp"	20 июля 2017	-
Oxxxymiron vs. Слава КПСС	оксимирон, гнойный, версус	13 августа 2017	-

Для сбора данных был написан небольшой цикл, который перебирал все страницы выдачи результатов по поиску (у API было ограничение на максимум 50 результатов на одной странице). Функции вызова API для Python мы взяли на сайте YouTube, а код формирования базы выглядел следующим образом (на примере версуса):

versus = {}

end = 0

nextPage = “”

while end == 0:

arr = search_list_by_keyword(client,

part='snippet',

q='оксимирон, гнойный, версус',

type='video',

pageToken=nextPage,

publishedAfter='2017-08-13T00:00:00Z',

maxResults=50)

for i in range(0, len(arr['items'])):

v = arr['items'][i]

print(v['snippet']['title'])

versus[v['id']['videoId']] = v

try:

nextPage = arr['nextPageToken']

except:

end = 1

На запрос API возвращает данные, которые имеют следующую структуру:

Таблица 2

Структура разультата по запросу search().list()

kind	Тип запрашиваемого ресурса
etag	etag запрашиваемого ресурса
nextPageToken	Код следующей страницы с результатами
prevPageToken	Код предыдущей страницы с результатами
regionCode	Код региона, который использовался для запроса
pageInfo.totalResults	Количество всех результатов
pageInfo.resultsPerPage	Количество результатов на 1 странице
items[]	Лист с результатам по запросу

Распаковывая полученный массив, мы включаем нужные нам данные в словарь, где ключ - это ID видео, а значение - словарь с данными об этом видео. Ниже представлены некоторые элементы словаря:

Таблица 3

Структура данных о видео

kind	Определяет тип ресурса. В данном случае youtube#video.
etag	Etag данного ресурса.
id	ID видео, по которому YouTube его определяет
snippet.publishedAt	Дата публикации. Данные представлены в формате ISO 8601 (YYYY-MM-DDThh:mm:ss.sZ)
snippet.channelId	ID канала автора
snippet.title	Название видео
snippet.description	Описание видео.
snippet.thumbnails	Картинки, связанные с видео
snippet.channelTitle	Название канала автора
snippet.tags[]	Тэги (ключевые слова) видео
snippet.categoryId	ID категории видео
contentDetails.duration	Продолжительность видео
statistics.viewCount	Количество просмотров
statistics.likeCount	Количество лайков.
statistics.dislikeCount	Количество дизлайков
statistics.commentCount	Количество комментариев

В результате вернулось следующее количество сообщений:

- первая реклама Veet - 452 видео;

- Вжух 2.0 - 165 видео;

- реклама Клинского - 460 видео;

- новогодняя реклама Кока-Колы - 512 видео;

- клип “Блокеры” - 469 видео;

- клип “Мега-звезда” - 533 видео;

- дисс на Атеву - 421 видео;

- HypeCamp - 516 видео;

- Версус-баттл - 473 видео.

Далее для каждого канала в выборке видеозаписей (всего их оказалось 2680 из тех, которых еще не было в нашей базе) мы собрали данные для построения графа. Процесс описан в следующем подразделе.

2.3 Сбор данных о каналах

Частью нашей модели для выявления значимых факторов в распространении сообщений на YouTube являются структурные данные сети в русскоязычном сегменте платформы. Для их сбора нам нужно построить граф. Узлами в нем будут каналы. А за связь мы изначально предполагали взять наличие канала в избранных другого. Но, по какой-то причине, API YouTube не возвращает эти данные для всех каналов, поэтому мы решили ставить связь между каналами, если один из них лайкал видео другого. Зачастую блогеры лайкают не только видео, которые им интересны, но и видео своих друзей и те, в которых они принимали участие. А это как раз и означает близость между каналами, то есть увеличивает вероятность, что новость от одного перейдет к другому.

Для начала мы собрали базу русскоязычным каналов, которые не связаны напрямую с нашими сообщениями, чтобы не делать перевес в их сторону. Отправной точкой сбора данных стал лист трендовых видео в России на 31 марта 2018 года. Стандартно этот лист содержит 50 записей, которые меняются в зависимости от динамики набора популярности ролика. Для каждого из видео мы собрали также подходящие записи. YouTube определяет их или на основе общей темы, или схожести каналов, или предлагает другие ролики данного канала. И для каждого относящегося видео мы повторили ту же процедуру. Здесь мы использовали методы API videos().list() и search().list(). Код для Python выглядит так:

arr = videos_list_most_popular(client,

part='id,snippet,contentDetails,statistics',

chart='mostPopular',

regionCode='RU',

videoCategoryId='',

maxResults=50)

related = []

for i in range(0, 50):

ID = arr['items'][i]['id']

r = search_list_related_videos(client,

part='snippet',

relatedToVideoId=ID,

type='video',

maxResults=50)

related.append(r)

related1 = []

for i in range(0, 50):

for j in range(0, len(related[i]['items'])):

ID = related[i]['items'][j]['id']['videoId']

r = search_list_related_videos(client,

part='snippet',

relatedToVideoId=ID,

type='video',

maxResults=50)

related1.append(r)

По запросу система возвращает данные о видео, структура которых описана выше. Далее на основе полученных записей мы формируем словарь с каналами. Для каждого из трех полученных массивов мы применяли следующий цикл:

channels = {}

for i in range(0, len(arr['items'])):

key = arr['items'][i]['snippet']['channelId']

value = {'id': arr['items'][i]['snippet']['channelId'],

'name': arr['items'][i]['snippet']['channelTitle']}

channels[key] = value

Ключом в полученном словаре выступает ID канала, значением - другой словарь с атрибутами канала. Далее с помощью метода channels().search() мы собрали данные о статистике каждого канала. Также в структуре данных о канале есть ID плейлиста с его понравившимися видео. В том же цикле, используя данный ID мы формируем списки понравившихся видео. Код для Python выглядит так:

names = []

for j in channels:

c = channels_list_by_id(client,

part='snippet,contentDetails,statistics',

id=j)

if len(c['items']) != 0:

if c['items'][0]['snippet']['localized']['title'] in names:

pass

else:

names.append(c['items'][0]['snippet']['localized']['title'])

channels[j]['views'] = c['items'][0]['statistics']['viewCount']

channels[j]['videos'] = c['items'][0]['statistics']['videoCount']

channels[j]['subscribers'] = c['items'][0]['statistics']['subscriberCount']

try:

channels[j]['likes'] = ['items'][0]['contentDetails']['relatedPlaylists']['likes']

channels[j]['playlist'] = []

end = 0

nextPage = ''

while end == 0:

p = playlist_items_list_by_playlist_id(client,

part='snippet,contentDetails',

maxResults=50,

playlistId=channels[j]['likes'],

pageToken=nextPage)

for i in range(0, len(p['items'])):

v = p['items'][i]['contentDetails']['videoId']

channels[j]['playlist'].append(v)

try:

nextPage = p['nextPageToken']

except:

end = 1

nextPage = ''

except:

pass

else:

print len(c['items'])

Обратим внимание, что нам пришлось делать дополнительную проверку, чтобы избежать повтора каналов в словаре. Это связано с тем, что YouTube, по всей видимости присваивает ID не отдельному каналу, а его состоянию во времени. Поэтому во время скачивания мы сталкивались с проблемой, что если у канала изменилось число подписчиков или просмотров, то система определяла его как другой и присваивала новый ID. Чтобы этого избежать, мы проверяли каналы по листу с названиями тех, которые уже есть в базе. Это, на наш взгляд, уместная проверка, так как крупные и активные каналы имеют уникальное название.

В итоге для каждого канала у нас появился список понравившихся видео. Далее необходимо составить список каналов, которым эти видео принадлежат. Для этого мы использовали снова метод videos().search(), из результатов которого забирали название канала и его ID. Несмотря на то, что ID канала не совсем уникален для самого канала, нам необходима эта информация, т.к. только по ней возможно делать запросы к API. Код для Python:

for i in channels:

channels[i]['playlistAuthorsId'] = []

channels[i]['playlistAuthors'] = []

for j in channels[i]['playlist']:

v = videos_list_by_id(client,

part='snippet',

id=j)

if len(v['items']) > 0:

try:

if v['items'][0]['snippet']['channelTitle'] in channels[i]['playlistAuthors']:

pass

else: channels[i]['playlistAuthors'].append(v['items'][0]['snippet']['channelTitle'])

channels[i]['playlistAuthorsId'].append(v['items'][0]['snippet']['channelId'])

except:

pass

Таким образом у нас получается словарь каналов, в котором ключ - это ID канала, а значение - словарь с атрибутами:

- id - ID канала;

- name - название канала;

- views - количество просмотров на канале;

- videos - количество видео;

- subscribers - количество подписчиков;

- likes - ID плейлиста с понравившимися видео;

- playlist - лист c ID понравившихся видео;

- playlistAuthors - список названий каналов, чьи видео понравились данному каналу;

- playlistAuthorsId - список ID каналов, чьи видео понравились данному каналу.

Первоначально у нас получился 501 канал. Далее мы собрали информацию для тех каналов, которые попали в списки понравившихся, и в итоге у нас вышло 15404 канала, большинство из которых - русскоязычные. Также к ним добавились 2680 каналов, у которых выходили видео, связанные с нашими сообщениями. Итого в нашей базе находится 18084 канала, на основе которых мы будем строить граф и модель.

2.4 Построение и анализ графа

Как мы уже сказали, связи в нашей сети показывают, нравились ли когда-нибудь ролики одного канала другому. Для первичного анализа мы строим ненаправленный граф, т.к. такой граф кластеризуется большим числом алгоритмов. Создание итогового графа происходит через Python с помощью пакета networkx:

import networkx as nx

G = nx.Graph()

# add nodes from channels

for i in allChannels:

G.add_node(allChannels[i]['name'], label=allChannels[i]['name'],

title=allChannels[i]['name'],

subscribers=allChannels[i]['subscribers'],

videos=allChannels[i]['videos'],

views=allChannels[i]['views'])

# create list of edges

edges = []

for i in allChannels:

related = allChannels[i]['playlistAuthors']

for r in related:

pair = (allChannels[i]['name'], r)

edges.append(pair)

# add edges

G.add_edges_from(edges)

Здесь allChannels - это наш датасет со всем каналами. За ID узла мы берем название канала, а не его ID. Причина этого - возможность разных ID для одного и того же канала в базе.

Чтобы сделать граф динамическим, каждому узлу мы добавляем атрибут сообщения, который равен дате, когда узел отреагировал на одно из видео в нашей базе. Если узел не был активирован, то значение не присваивается. Код на Python для присвоения атрибута времени (на примере реакции на HypeCamp):

dates_dict = {}

for date in dates:

for c in dates[date]:

if c in dates_dict:

pass

else:

dates_dict[c] = date

nx.set_node_attributes(G, dates_dict, 'hypecampstart')

Для проведения кластерного анализа по нашей базе мы использовали R и пакет igraph. Данный пакет есть и для Python, но его документация для R написана подробнее и яснее. Для этого весь датасет с данными о каналах мы сохранили в .txt, а далее работали с ним в R.

Во-первых, нам снова пришлось создавать граф (на этот раз с помощью igraph):

library("igraph")

library("rjson")

db <- fromJSON(file = "data.txt")

edges <- c()

for (i in db) {

related <- i$playlistAuthors

for (r in related) {

if (i$name != r) {

name = i$name

edges <- append(edges, name)

edges <- append(edges, r)

}

g <- graph(edges=edges)

Далее мы проводили кластерный анализ. Для сравнения мы использовали три алгоритма.

- Через короткие случайные блуждания (функция cluster_walktrap в пакете): алгоритм ищет плотно связанные подграфы с помощью случайных блужданий. Идея состоит в том, что короткие случайные блуждания, как правило, остаются в одном сообществе.

- Основываясь на коэффициенте битвинности (функция cluster_edge_betweenness в пакете): идея состоит в том, что многие сети состоят из модулей, которые плотно связаны друг с другом, но редко связаны с другими модулями.

- Основываясь на ведущем собственном векторе (eigen vector) матрицы сообщества (функция cluster_leading_eigen в пакете): эта функция пытается найти плотно связанные подграфы, вычисляя главный неотрицательный собственный вектор матрицы модульности графа.

Все параметры в при запуске алгоритмов оставлены по умолчанию.

Для визуализации графа мы использовали Gephi. Для него созданный граф необходимо сохранить в подходящий формат, например, .gefx. Из-за того, что в названиях узлов присутствует кириллица, сохранить граф через R нам не удалось. Поэтому мы добавили получившиеся кластеры как переменные в датасет и сохранили его в формате .json:

new_db <- list()

for (i in db) {

i$wc <- tryCatch({as.character(membership(wc)[[i$name]])}, error=function(error_condition) {"0"})

i$eb <- tryCatch({as.character(membership(eb)[[i$name]])}, error=function(error_condition) {"0"})

i$le <- tryCatch({as.character(membership(le)[[i$name]])}, error=function(error_condition) {"0"})

new_db[[i$id]] <- i

}

# SAVE IN JSON

exportJson <- toJSON(new_db)

write(exportJson, "test.json")

Далее мы присоединили получившиеся переменные к основному датасету в Python:

import json

with open("test.json") as data_file:

data=json.load(data_file, encoding="windows-1251")

for i in data:

allChannels[i]['wc'] = data[i]['wc']

allChannels[i]['le'] = data[i]['le']

allChannels[i]['eb'] = data[i]['eb']

Снова создали граф (как показано выше) и сохранили его в формате .gexf:

nx.write_gexf(G, "clustered.gexf", encoding="utf-8")

2.4 Сбор «фич» и их анализ

Подходя к анализу данных и построению моделей, выделим гипотезы, которые мы хотим проверить:

1. Структура сети русскоязычных блогеров влияет на распространение информации;

2. Для ранних последователей факторы, связанные с структурой более значимы, чем для остальных пользователей.

Для проверки данных гипотез мы используем модели регрессии и классификации с переменными, которые мы перечислили в конце теоретического обоснования. В этом разделе мы опишем, как мы собирали переменные из данных.

Зависимая переменная в данной работу - это степень активации узла сообщением. По нашей шкале “0” говорит о том, что канал никак не отреагировал на сообщение. “100” - это автор сообщения. Числа от 0 до 100 - это степень остальных участников, где чем быстрее автор опубликовал ответное видео, тем ближе это число к сотне.

Чтобы посчитать данную величину, мы использовали цикл. Каждой видеозаписи из баз записей по запросам мы присваивали новый аргумент, равный отношению разницы даты данного видео с меньшей датой в базе к разнице максимальной даты к минимальной. Предварительно мы собирали массив всех дат, в которые публиковалась реакция на сообщение. Код для Python на примере базы видеозаписей по диссу Лиззки:

for i in lizzka:

s = lizzka[i]['snippet']['publishedAt'][0:10]

date = time.mktime(datetime.datetime.strptime(s, "%Y-%m-%d").timetuple())

minDate = min(dates)

maxDate = max(dates)

lizzka[i]['activatedStatus'] = (date-minDate)/(maxDate-minDate)

Для алгоритмов классификации мы также специально посчитали другой вариант зависимой переменной. Она равная классу степени активации узла от 0 до 11. “0” значит, что узел проигнорировал сообщение или оно не дошло до него. “11” говорит о том, что узел - автор сообщения. Классы мы просчитывали, когда добавляли атрибут степени активации к записи узла в базе каналов. Для этого сначала мы создали словарь, где ключ - это название канала, а значение - степень его активации. Далее в цикле мы перенесли эту информацию в базу каналов. Перенести напрямую в базу каналов не выходило, т.к. словарь каналов был создан с ключом в виде ID. Код для Python на примере versusbattle:

versusTitle = []

for i in versus:

name = versus[i]['snippet']['channelTitle']

status = versus[i]['activatedStatus']

if name in versusTitle.keys():

pass

else:

versusTitle[name] = status

for i in allChannels:

name = allChannels[i]['name']

if name in versusTitle:

allChannels[i]['versus'] = versusTitle[name]

allChannels[i]['versusCat'] = int(10*versusTitle[name])+1

else:

allChannels[i]['versus'] = 0

allChannels[i]['versusCat'] = 0

В среднем у нас в базе каждый узел был активирован примерно 0 раз, т.к. Доля активированных узлов (примерно 2600) мала среди почти 17000. Поэтому, возможно, придется рассматривать активированные узлы в модели отдельно. Максимально же один узел в нашей базе был активирован 6 разными сообщениями.

Далее мы извлекали факторы, связанные с сообщением. Для этого мы снова работали с базой видеороликов. На ее основе мы извлекали нужные данные и клали в новый словарь “meta”. В новом словаре ключ - это кодовое название ролика, а значение - словарь с искомыми фичами. Код для Python на примере клипа “Блокеры”:

meta = {}

meta['blockers'] = {}

## length of title and description

meta['blockers']['id'] = 'emF_t_rIHcE'

meta['blockers']['title'] = blockers['emF_t_rIHcE']['snippet']['title']

meta['blockers']['desc'] = blockers['emF_t_rIHcE']['snippet']['description']

meta['blockers']['lendesc'] = len(meta['blockers']['desc'])

meta['blockers']['lentitle'] = len(meta['blockers']['title'])

## capital letters in title

meta['blockers']['uppercase'] = sum(1 for c in meta['blockers']['title'] if c.isupper())

## number of http

meta['blockers']['http'] = meta['blockers']['desc'].count('http')

## ad status

meta['blockers']['ad'] = 0

Статистику о ролику мы дополнительно запрашивали через API YouTube:

## statistics

c = videos_list_by_id(client,

part='statistics',

id='emF_t_rIHcE')

meta['blockers']['comment'] = c['items'][0]['statistics']['commentCount']

meta['blockers']['dislike'] = c['items'][0]['statistics']['dislikeCount']

meta['blockers']['like'] = c['items'][0]['statistics']['likeCount']

meta['blockers']['view'] = c['items'][0]['statistics']['viewCount']

Далее мы работали с факторами, связанными с автором сообщения. Все статистики канала (количество просмотров, видео и подписчиков) мы получили при загрузке данных через API. Номер кластера по нескольким типам кластеризации был выделен с помощью R и пакета igraph (описано выше). Также мы с помощью R просчитали средний путь узла до других узлов и параметр PageRank. Код для R:

library(igraph)

# COUNT SHORTEST PATHS

distMatrix <- shortest.paths(g, v=V(g), to=V(g))

average_paths <- rowMeans(distMatrix*is.finite(distMatrix),na.rm=TRUE)

#PAGE RANK

pagerank <- page.rank(g)

Page Rank - это алгоритм, который используется в Google Search. По нему просчитывается важность каждого узла в зависимости от того, как много на него ссылаются (сколько связей он имеет). Таким образом, данный показатель выступает аналогом показателя LeaderRank, который использовали в своем исследовании Чжу, Инь, Ма и Ху (2016).

Для узлов, которые принимают сообщения, мы помимо показателей, описанных выше, мы считали еще два: путь до автора и совпадение кластеров. Пути до автора мы считали в R:

library(igraph)

blockers_paths <- distMatrix[, 'УСПЕШНАЯ ГРУППА']

klinsky_paths <- distMatrix[, 'Клинское']

lizzka_paths <- distMatrix[, 'лиззка']

ro_paths <- distMatrix[, 'Maryana Ro']

versus_paths <- distMatrix[, 'versusbattleru']

hypecamp_paths <- distMatrix[, 'HYPE CAMP']

Совпадение кластеров мы указывали при финальной распаковке массивов. Показатель равен 0, если группы не совпадают, и 1, если они одинаковы.

В итоге мы составили словарь с итоговым набором данных для модели. Ключ в нем - это название канала с добавлением кодового названия сообщения через нижнее подчеркивание. Таким образом, запись в словаре - это положение канала в условиях отдельного сообщения. И в итоге таких записей получилось более 140 тысяч. Значение в словаре выступает словарь с переменными, описание которых приводим ниже:

? факторы сообщения:

? ad: число; бинарная переменная, “0” - нерекламное сообщение, “1” - рекламное;

? http: число; количество ссылок в описании ролика;

? uppercase: число; количество заглавных букв в заголовке ролика

? lentitle: число; количество символов в заголовке ролика;

? lendesc: число; количество символов в описании ролика;

? view: число; количество просмотров ролика на май 2018 года;

? like: число; количество лайков на май 2018 года;

? dislike: число; количество дизлайков на май 2018 года;

? comment: число; количество комментариев на май 2018 года;

? факторы автора сообщения:

? authorViews: число; количество просмотров у канала автора на май 2018 года;

? authorSubs: число; количество подписчиков на канале автора на май 2018 года;

? authorVideo: число; количество роликов на канале автора на май 2018 года;

? shortest: число; средний кратчайший путь от автора до других узлов сети;

? authorPG: число; показатель PageRank автора сообщения;

? характеристики узла:

? wcMatch: число; бинарная переменная, 1, если кластер автора и кластер узла по алгоритму wc совпадают;

? leMatch: число; бинарная переменная, 1, если кластер автора и кластер узла по алгоритму le совпадают;

? ebMatch: число; бинарная переменная, 1, если кластер автора и кластер узла по алгоритму eb совпадают;

? channelSubs: число; количество подписчиков на канале на май 2018;

? channelViews: число; количество просмотров на канале на май 2018 года;

? channelVideo: число; количество роликов на канале на май 2018 года;

? shortest: число; средний кратчайший путь от данного узла до других узлов сети;

? pagerank: число; показатель PageRank;

? authorPath: число; длина пути до автора сообщения.

Зависимые переменные закодированы так:

? status: число; степень активации узла от 0 до 1;

? statusCat: число; класс активации узла от 0 до 11.

Для анализа данных мы будем использовать алгоритмы регрессии и классификации. В первом случае подразумевается, что мы предсказываем статус, а во втором - определяем его из набора имеющихся. Мы выбрали следующие алгоритмы:

? линейная регрессия;

? дерево решений;

? случайный лес;

? SVM (support vector machine).

Проверять алгоритмы мы будем как на всех данных, так и на выборке из только активированных сообщений. В случае с SVM мы будем экспериментировать с разными ядрами, чтобы добиться наилучшего результата. Эффективность алгоритма оценивается по показателям R-квадрат, среднего остатка и визуально по графику сопоставления реальных значений и полученных алгоритмом.

Таким образом, мы получаем двухступенчатую схему анализа сети блогеров на YouTube. На первом этапе мы используем сетевой анализ (в том числе, кластеризацию) и другие статистики для выявления возможных факторов. На втором этапе мы используем алгоритмы регрессии и классификации для оценки выбранных «фичей». Также имеется и предварительный этап анализа, который заключается в сборе данных о предыдущих взаимодействиях внутри сообщества. В результате мы делаем вывод о том, на какие факторы и каким способом компаниям нужно обратить внимание.

Глава 3. Оценка факторов на основе моделей и рекомендации по работе с ними

информация коммуникация сеть реклама

3.1 Структурный анализ графов распространения информации

В данном исследовании мы используем сетевой анализ для двух целей:

- сбор атрибутов для дальнейшего моделирования;

- рассмотрение и описание процессов между блогерами.

Для этого мы построили направленный граф, где узлами выступают каналы в русскоязычном сегменте YouTube, а связи между ними показывают, что один из блогеров когда-то лайкал видео другого блогера. Чтобы ограничить размеры графа, в сеть мы включали только те каналы из понравившихся, которые уже в нее входили. Это не влияет на анализ, т.к. при выделении хабов мы учитываем входящую мощность узлов.

Рис. 6. Отфильтрованная сеть каналов YouTube

Для визуализации сети мы использовали программу Gephi. Изначальный граф включал в себя 17510 узлов с 71512 связями. Диаметр графа равен 17, а средний путь от одного узла до другого примерно 5. Мы имеем дело со связанной сетью, где самая крупная компонента включает в себя 6789 узлов. При этом плотность графа равна 0.002 - между большинство узлов связей нет. То есть здесь представлена сеть по типу маленького мира. То есть в сети нет ярко выраженных центров и почти все узлы имеют связи между собой в нескольких шагах.

Для улучшения визуализации мы отфильтровали узлы по входящей мощности: от 20 входящих связей. Таким образом у нас получилось 804 канала с 1585 связями между ними. Для укладки мы использовали алгоритм Fruchterman Reingold (для наилучшего отображения). Таким образом, узлы с большим числом связей между собой стянулись в центр. Размер узлов и лейблов выставлен в зависимости от количества входящей мощности. В результате мы получили следующий граф (рис. 6).

В выбранной укладке мы видим разделение структуры графа: сплоченный центр и периферия. В центре находятся каналы, которые признаны сообществом. И чем крупнее их заголовок и размер названия, тем авторитетнее блогер на платформе и заметнее его деятельность. И мы здесь говорим не о зрителях, а именно о других членах сообщества. Скопления же ребер у узла, чей размер мал, говорит о том, что канал активно лайкает видео коллег и признается сообществом, но еще не обрел достаточного числа подписчиков. Как, например, канал “ДА НИЛ”

При этом в центре можно найти и новые каналы, которые только набирают популярность и не взаимодействуют активно с другими каналами, но уже признаются крупными игроками. Таким, например, можно назвать канал Satyr.

Для кластеризации мы использовали несколько алгоритмов: на основе случайных блужданий, коэффициента битвинности, ведущего собственного вектора матрицы сообщества. В каждом случае у нас получилось разное количество сообществ. Больше всего на основе случайных блужданий, меньше - на основе собственного вектора. При этом большая часть узлов - от 60 до 80 процентов - при каждом алгоритме собираются в 3-4 кластера. Для дальнейшего визуального анализа мы будем использовать результаты алгоритма по вектору, т.к. меньшее количество кластеров легче интерпретировать. При построении модели в следующей части мы используем показатели всех алгоритмов.

Для каждого сообщения мы выделили отдельные графы из каналов, которые выкладывали ролики по данной теме. По структуре сети получились похожими. В каждом присутствовал связанный подграф, который включает от 20 до 50% всех каналов. Все остальные каналы в выборке не имеют между собой связей.

Рис. 7. Сеть каналов, говоривших о ролике Лиззки (справа) и рекламе Кока-Колы (слева)

Объем связанного компонента разнится для у каждого сообщения. Самый плотный можно видеть на ролике Лиззки. Слабее плотность у рекламных роликов. Самый небольшой связанный компонент у графа с новогодними роликами Кока-Колы (рис. 7). На графе видны каналы с основными роликами блогеров (Клава Кока, Мари Сенн, Костя Павлов). Возникший на почве ролика последнего конфликт в графе никак не отражен.

Рис. 8. Сеть каналов, упоминавшихся первую рекламу Veet (слева) и клип “Мега звезда” (справа)

При этом это нельзя соотнести напрямую с каналом публикации, т.к. у нас есть пример рекламы на канале Марьяны Ро и ее собственного клипа (рис. 8). И в случае нерекламного проекта на ролик больше реагировали блогеры, которые тесно связаны между собой.

То есть, мы можем сказать, что в каждом случае реакции можно разделить на две большие группы: коммьюнити и остальные пользователи. В коммьюнити входят популярные и значимые в сообществе блогеры, а остальные - это небольшие каналы на YouTube. Эти каналы могут быть как lifestyle, так и специализироваться на обзорах и реакциях. Это видно и по кластеризации каналов. Используя разделение по основному вектору, мы получили 11 сообществ. Среди них выделилось 3 крупных: 38.74%, 35.19%, 16.96% от общего числа узлов. И в третье сообщество входит большинство узлов, входящих в связанный компонент. И большинство узлов на периферии графа входят в первое коммьюнити. Можем предположить, что это группа каналов с обзорами, реакциями и перезаливами (повторно опубликованный ролик одного блогера на другом канале).

Также в связанный компонент графов входят узлы не только из одного кластера, но в целом встречаются одинаковые узлы. Например, каналы Кузьмы, Юлика, Ларина, Хованского, Дани Кашина, Соболева, Джарахова, Приятного Ильдара, канал “Тренды Ютуба” , “ЮТУБЕР”, “VSRAP”. Смотря на графы всех сообщений (Приложения А-И) мы можем выявить лидеров мнений.

При этом лидер мнений не всегда оказывается среди первых последователей. Так, например, в случае первой рекламы Veet среди первых последователей оказались 2 популярных канала: Лиззки и Дани Кашина. А в случае с HypeCamp, первые ролики были от каналов участников проекта. И только спустя неделю тренд подхватили популярные блогеры. То есть в движении информации не наблюдается волны-распространения по типу эпидемии от центра к краю графа. Это можно объяснить структурой сети. Инфоповод скорее будет обсуждаться внутри комьюнити, чем распространяться от лидера мнений к другим каналам.

В целом, динамика распространения сообщения не имеет ни возрастающей, ни угасающей волны. Есть несколько каналов-первопроходцев. А далее в течение нескольких недель-месяцев публикуются по несколько роликов в день. Для примера возьмем график реакций на клип “Блокеры” (рис. 10) - на нем нельзя выявить тренда.

Рис. 10. Упоминание клипа “Блокеры” по датам со дня публикации

В целом, мы можем видеть разницу между тем, кто реагирует на сообщения в сети в зависимости от того, рекламные они или нет. В первом случае реагируют стримеры, обзорщики и те, кто снимают пародии. Во втором случае подключаются лидеры мнений сообщества. По сути это похоже на профессиональную реакцию. Рекламу профессиональные блогеры могут воспринимать как издержку профессии и не предавать ей особого значения. Тогда как новые проекты, которые могут задать формат, стандарт качества или привлечь новых инвесторов, они оценивают. Или же, т.к. часто к инфоповоду на YouTube причастен скандал, они стремятся высказать свое мнение.

Но тем не менее мы не можем точно сказать, что рекламный статус сообщения влияет на распространение сообщения. Это вместе с другими факторами мы проверим в следующей части.

3.2 Сравнение моделей регрессии и классификации в оценке факторов

В этой части мы проверим данные на нескольких моделях: линейная регрессия, случайный лес, SVM и дерево решений. Сравнивая эффективность моделей на по показателям R-квадрат и средней ошибке мы выявим лучшие и на их основе сделаем вывод о значимости факторов в распространении сообщения на YouTube. Все модели мы обучали на случайной выборке в 60% от общего числа наблюдений и проверяли на оставшихся 40%.

Начнем с обычной линейной регрессии. В данном случае зависимой переменной будет степень активации узла. Построим модель для всех данных и получим следующий результат (оставлены только значимые переменные на 5% уровне значимости):

Residuals:

Estimate Std. Error t value Pr(>|t|)

channelViews 1.921e-11 8.461e-12 2.271 0.0232 *

channelVideo -1.994e-11 8.442e-12 -2.362 0.0182 *

shortest -2.108e-03 1.355e-04 -15.559 < 2e-16 ***

wcMatch 2.558e-03 6.303e-04 4.059 4.94e-05 ***

leMatch 6.349e-03 6.714e-04 9.456 < 2e-16 ***

ebMatch 2.467e-03 6.159e-04 4.005 6.21e-05 ***

---

Residual standard error: 0.05762 on 84032 degrees of freedom

Multiple R-squared: 0.005646, Adjusted R-squared: 0.005468

F-statistic: 31.81 on 15 and 84032 DF, p-value: < 2.2e-16

Модель получилась значима, но нельзя сказать, что она что-то объясняет: R-квадрат меньше 1%. Такой же результат дает нам использование логарифма статуса в качестве зависимой переменной. Поэтому дальше в моделях мы будем использовать обрезанный датасет, где будут присутствовать только активированные узлы. Большое количество “пустых” каналов не дают моделям работать.

На обрезанном датасете простая линейная регрессия дает следующие результаты:

Estimate Std. Error t value Pr(>|t|)

(Intercept) -3.963e+06 3.345e+05 -11.847 <2e-16 ***

ad -1.428e+00 9.969e-02 -14.324 <2e-16 ***

authorPath 1.389e+06 1.172e+05 11.847 <2e-16 ***

authorSubs -8.722e-01 7.362e-02 -11.847 <2e-16 ***

authorPG -1.337e+09 1.129e+08 -11.847 <2e-16 ***

authorViews 1.134e-02 9.569e-04 11.847 <2e-16 ***

authorVideo -9.251e+03 7.808e+02 -11.847 <2e-16 ***

comment -2.599e-05 1.855e-06 -14.007 <2e-16 ***

---

Residual standard error: 0.231 on 823 degrees of freedom

Multiple R-squared: 0.3443, Adjusted R-squared: 0.3331

F-statistic: 30.87 on 14 and 823 DF, p-value: < 2.2e-16

В данном случае модель также значима и ее результат значительно выше: 34% объясненной дисперсии. И рассматривая значимые переменные для полного датасета и обрезанного, мы можем увидеть разницу между неактивированными узлами и активированными. Для того, чтобы узел принял сообщение, достаточно структурных факторов: кластер узла и автора, расположение узла в сети, и факторов самого узла: количество просмотров и видео (то есть показателей того, насколько активно пользователь ведет свой канал). При этом показатель среднего пути влияет отрицательно на быстроту реакции. Это не значит, что узлы на периферии реагируют быстрее. Скорее это значит, что узлы из среднего кольца реагируют оперативнее. У них больше связей, чем у крайних узлов, но при этом они не являются центрами или лидерами мнений, поэтому у них мало коротких связей.

Для того, чтобы повлиять на степень активации, учитываются уже характеристики автора и сообщения. Негативно на скорость реакции влияет рекламный статус видео и почти все характеристики автора. Кроме длины пути от узла до него и количества просмотров на канале автора. Просмотры сложно учитывать, т.к. Они включают в себя и просмотры возможно популярного ролика, на который узел еще только решает реагировать. Но ситуация с путем до автора сложна, т.к. получается, что чем дальше от автора находится узел, тем скорее он воспримет сообщение. Но если смотреть на данные, то ситуация не критична: минимальный путь равен 2, а максимальный 3. То есть скорее всего на ролик не реагируют в первую очередь те блогеры, которые плотно связаны с автором, если мы говорим о реакциях. Чаще всего ближайшие каналы к автору могут выложить бэкстейдж или другой, не критично настроенный контент, который не может быть у всех.

Модель делит степени на 3 группы: до 50%, примерно 70% и около 100% (рис. 11). Из положительного: видны группы значений, которые определяются близко к линии тренда. При использовании категории статуса активации в модели регрессии результаты получились хуже.

Рис. 11. Реальные и предсказанные значения в простой линейной регрессии.

Также результаты хуже показал алгоритм «случайный лес». На нашей выборке активированных сообщений он показал процент объясненной дисперсии - 28.04%. А на графике реальных-предсказанных значений (рис. 12) нет выраженного тренда. И если линейная регрессия выделяла группы узлов, то случайный лес наоборот, разделяет группы реальных данных на разные. Но опять в пределах 50%, 70% и почти 100%.

Рис. 12. Реальные и предсказанные значения при использовании случайного леса.

Далее мы рассмотрим алгоритмы классификации. Сначала мы проверили дерево решений при зависимой переменной классе степени активации. Получили хороший результат по R-квадрату - больше 40%. Но очень высокую ошибку. При смене зависимой переменной процент дисперсии упал до примерно 10%, ошибка так и осталась высокой, но меньше 1:

Variables actually used in tree construction:

authorSubs authorVideo comment

Root node error: 807/838 = 0.96301

Поэтому результаты данного алгоритма мы в итоге не рассматриваем.

Для следующего алгоритма - SVM (support vector machines) - выделим значимые независимые переменные с помощью алгоритма RFE (recursive feature elimination). Алгоритм выделяет «фичи» с помощью алгоритма линейной регрессии таким образом, чтобы достичь минимальной ошибки. В результате мы получили 15 характеристик, на основе которых будем строить следующую модель: authorPG, authorPath, authorVideo, ad, authorSubs, wcMatch, ebMatch, authorViews, shortest, leMatch, comment, channelSubs, channelVideo, channelViews, dislike.

SVM позволяет настроить ядро, с которым будет запускать алгоритм. Мы проверили результаты со всеми (рис. 13) и получили, что лучше всего модель работает с линейным или радиальным ядром.

А Б В Г

Рис. 13. результаты SVM: А - с линейным ядром, Б - с радиальным ядром, В - полиномиальное, Г - сигмоидное

В случае линейного ядра алгоритм точно разделяет степени на категории: 20, выше 30, выше 40, выше 60 и почти 100 процентные уровни активации. В случае с радиальным ядром алгоритм делает то же самое, но концентрирует данные у линии тренда и “размазывает” их вертикально. Это связано с функцией ядра - экспонентой, тогда как у линейного используется простая линейная функция. При этом у радиального ядра средняя ошибка меньше, но не значительно: 0.242 против 0.243, при шкале от 0 до 1. А при изменении параметра gamma до 50000000000000 в модели можно достичь ошибки меньше 0.1. Но мы не включаем данные манипуляции в исследование, т.к. Это приводит к предвзятости модели. В этом же диапазоне находятся ошибки всех предыдущих алгоритмов. Но в любом случае, SVM с радиальным ядром выделяет больше групп узлов, близких к тренду. В том числе и по сравнению с обычной линейной регрессией.

Таким образом, факторы всех групп влияют на распространение сообщения в сети. Наиболее значимые из них по алгоритму RFE связаны с характеристиками автора. 6 из 15 данных факторов связаны с структурой сети, что не опровергает нашу первую гипотезу. Особенно учитываю найденную разницу в значимых переменных при линейной регрессии на всем датасете и только активированных узлах.

Это же различие показывает, что активированные узлы отличаются между собой через факторы, связанные с сообщением и его автором. То есть мы не можем подтвердить вторую гипотезу о том, что ранним последователям важнее структурное положение. И анализ структуры динамических графов не дает нам утверждать о ярко выраженных первых последователях в сети: группе первопроходцев, после которых к обсуждению подключаются массы. Скорее всего, YouTube работает на наблюдениях за чужим опытом в целом, а не только в случае конкретного сообщения.

И если говорить о факторах, связанных с сообщением, система выделят количество дизлайков. Как мы описывали выше, на дизлайки влияет не только качество контента, но и репутация его автора. Поэтому даже если степень активации коррелирует положительно с с количеством дизлайков, это не тот показатель за которым стоит стремиться компании. Как мы писали, образ бренда в случае коллаборации будет ассоциироваться с блогером. И мимолетный “хайп” на YouTube не стоит подпорченной репутации.

Таким образом, за счет переменных, связанных с сетью, узел получает сообщение. А то, когда он откликнется зависит от других факторов. В следующей части мы разберемся, как с ними работать и реагировать на них.

3.3 Рекомендации по работе с рекламой и трендами в YouTube

Полученный нами список факторов на основе моделей нельзя напрямую применять в реальной работе. Он не учитывают контекст платформы, стоимость рекламы у того или иного блогера, его репутацию и тематику контента. Полученный набор «фичей» и модели на их основе скорее можно применять для прогнозирования распространения информации, когда канал уже выбран.

Однако, в совокупности с сетевым анализом мы можем выявить правило, как выбирать канал. Ключевая характеристика, которая появлялась во всех наших моделях - это длина пути до автора и его PageRank. При этом в случае с длиной пути зависимость получилась отрицательной. Поэтому необходимо искать такой канал для сотрудничества, у которого много связей в радиусе 2-3 и более шагов, т.к. на этом расстоянии можно прогнозировать быструю реакцию соседей. Ближайшие каналы или реагируют долго, или игнорируют сообщение.

При оценке распространения также нужно учитывать, что рекламу предсказать будет сложнее. Она будет распространятся как раз на уровне дальше 3 шагов, а узлов, связанных в центральное коммьюнити будет меньше. Но стоит учитывать, что мы говорим о сообщениях, которые задумываются виральными и трендовыми, то есть не специализированными. Возможно, если рассматривать спонсорский контент, то ситуация будет другой.

В целом, для работы с полученными факторами можно создать простое веб-приложение, которое будет: а) подбирать подходящих авторов по фильтру; б) показывать список последователей для выбранного автора. Первая функция будет искать таких авторов, чтобы максимизировать охват первых последователей (уровень активации от 75%). Вторая - оценивать все узлы сети с помощью полученного нами алгоритма SVM с радиальным ядром.

Для создания приложения можно использовать Python для серверной части и HTML+CSS+JavaScript для клиентской. Дизайн простой: в левой части показана сеть, в правой - панель с фильтрами. Сеть загружена на сайт как SVG файл (который можно получить из Gephi).

Функционал простой. При настройке параметров в правой панеле: количество подписчиков на канале автора, его видео и просмотров подбирается список каналов, с которых можно начать кампанию. Они выводятся в списке, разделенные по кластерам и упорядоченные по количеству подписчиков. Также эти узлы выделяются в сети. Остальные параметры, значимые для модели, не используются в фильтре а подбираются нейтральными в случае с сообщением, т.к. мы не можем задать это заранее. С технической точки зрения функция работает через AJAX: при нажатии кнопки “Подобрать” на сервер отправляется запрос, после успешного завершения которого на странице происходят изменения. Сама страница при этом не перезагружается, только показывается анимация.

Чтобы посмотреть узлы, которые активируются при помещении сообщения в данный узел, достаточно нажать на нужный канал в сети. На сервер также отправляется запрос через AJAX. При положительном ответе в сети подкрашиваются зеленым те каналы, которые отреагировали со степень от 75%. И синим те, которые от 50%. Остальные узлы остаются серыми. В правой панели появляется список каналов из синей и зеленой зон, упорядоченные по числу подписчиков.

Таким образом, мы получаем инструмент, который может помочь маркетологам искать оптимальный вариант канала для старта кампании и к тому же находить новые каналы на платформе. Но, в любом случае, результаты системы необходимо соотносить со здравым смыслом, т.к. она не учитывает контекста и специфику каждого блогера.

Заключение

В данной работе мы рассмотрели факторы, влияющие на распространение сообщений в русскоязычном сегменте YouTube. Перед нами стояла цель выявить значимые характеристики и описать их влияние. Для этого в работе рассматривались предыдущие исследования, проводился сетевой анализ и строились модели регрессии и классификации для оценки факторов. Как результат мы планировали составить список рекомендаций для компаний по работе с рекламой в YouTube.

Исследование затрагивало не рекламные сообщения и те из рекламных, которые представляют собой полноценный ролик блогера, посвященный бренду или снятый при его спонсорстве. Только в данном случае было возможно оценивать влияние блогера на результат распространения ролика. Итого, в нашу выборку попало 8 сообщений: реклама Veet с Марьяной Ро, серия роликов для Клинского, новогодняя реклама Coca-Cola с блогерами, ролики проекта HypeCamp, клипы “Блокеры” и “Мега звезда”, дисс Лиззки, versus-баттл между Оксимироном и Славой КПСС.

Современные модели распространения информации в сети используют несколько уровней анализа и включают данные о предыдущих взаимодействиях между пользователями. Факторы, используемые в анализе, можно разделить на три группы: характеристики сообщения, его автора и черты узла, которое принимает или отвергает сообщение. Всего в нашем исследовании использовалось 23 фактора.

Предыдущее взаимодействие мы учитывали при построении графа блогеров. Связи между узлами в сети показывали, что одному каналу когда-то понравился ролик другого. Всего в сети оказалось более 17 тысяч узлов с более чем 70 тысячами связей.

Сетевой анализ показал, что граф блогеров на YouTube склонен к структуре маленького мира. Это означает, что в сообществе ярко выраженных центров, а практически все члены могут достичь друг друга. Выделив из сети узлы с входящей мощностью от 20, мы получили 2 структурные группы: тесно связанные между собой комьюнити блогеров и периферию. И рассматривая графы блогеров, которые распространяли то или иное сообщение, эта структурная особенность сохранялась и включала в себя близкие или одинаковые каналы.

При сетевом анализе мы выявили только влияние рекламного статуса сообщения на его распространение. Если это сообщение рекламное, то каналов-последователей с периферии у него больше, чем каналов из связанного коммьюнити. Для детальной оценки факторов мы использовали модели регрессии и классификации. В качестве зависимой переменной мы использовали степень активации узла сообщением, где “0” - узле не активирован, а число, близкое к 100, - первый последователь после автора. Хороший результат показала линейная регрессия и SVM с радиальным ядром.

С помощью моделей мы хотели проверить две гипотезы, одна из которых подтвердилась. Факторы, связанные со структурой сети, влияют на степень активации и, следовательно, на распространение информации. Мы сравнивали две линейных регрессии: одна на всех узлах, а другая только на активированных. Для всех узлов значимыми переменными стали те, которые связаны с путем от узла до автора, и показателем PageRank автора. При анализе только активированных узлов в значимые переменные добавляются факторы сообщения. Последний момент не подтверждает нашу вторую гипотезу, по которой факторы сообщения и автора должны были быть первичными (активировать узел), а факторы структуры - вторичными (повысить степень активации).

Основной момент, который мы вынесли из анализа, то, что апеллируя данными автора сообщения (канала, на котором публикуется видео) и его положением в сети при оптимальных показателях сообщения и принимающего узла, можно объяснить около 30% успеха распространения сообщения. Таким образом, на основе созданной модели можно создать веб-приложение, которое будет определять подходящих блогеров для старта кампании и предсказывать движение сообщения в первый период времени.

Показатели эффективности модели можно было бы улучшить. Причина, по которой это не сделали авторы, - недостаточная техническая оснащенность. Во-первых, можно было бы собрать третий круг данных о каналах. Но в таком случае увеличивается база графа и алгоритм кластеризации через случайные пути отказывается работать на локальном компьютере. Во-вторых, можно было бы проанализировать ключевые слова каждого сообщения и сопоставлять их с ключевыми словами каждого канала. Эти два пункта дополнили бы контекст анализа.

Дальнейшие исследования русскоязычного YouTube и распространения информации в нем можно связать с анализом других платформ, на которых присутствуют блогеры: ВКонтакте, Twitter, Instagram.

Список литературы

Учебники, учебные пособия, монографии

1. Андрианов М. С. (2007). Невербальная коммуникация: психология и право. Москва: Институт Общегуманитарных Исследований.

2. Бодрийяр, Ж. (1981) Симулякры и симуляция. Тула: Тульский полиграфист

3. Губанов, Д.., Новиков, Д.,, Чхартишвили А. (2010). Социальные сети: модели информационного влияния, управления и противоборства. Москва: Физматлит

4. Кастельс, М. (2009) Власть коммуникации. Москва: Издательский дом Высшей школы экономики

5. Кин, Дж. (2015) Демократия и декаданс медиа. Москва: Издательский дом Высшей школы экономики

6. Лемов А. В. (2000). Система, структура и функционирование научного термина (на материале русской лингвистической терминологии). Саранск: Изд-во Мордов. Ун-та

7. Маклюэн, Г. М. (1964). Понимание медиа: Внешние расширения человека. Москва: «КАНОН-пресс-Ц», «Кучково поле»

8. Цукерман, Э. (2015). Новые соединения. Цифровые космополиты в коммуникативную эпоху. Москва: Ад Маргинем Пресс

9. Eco U. (1994). Does the Audience Have Bad Effect on Television? Bloomington: Indiana University Press

10. Neuman R. (1991). The Future of the Mass Audience. Cambridge: Cambridge University Press

Статьи из сборников и коллективных монографий

11. Барт Р. (2003). Рекламное сообщение. Система моды. Статьи по семиотике культуры, 219-222

12. Барт Р. (2003). Структура «происшествия». Система моды. Статьи по семиотике культуры, 214-219

13. Лотман Ю. М. (1992). Семиотика культуры и понятие текста. Лотман Ю.М. Избранные статьи, 129-132

Статья в журнале

14. Ванеян С. (2015). Каким образом воображать образ? Художественный журнал № 94, 11-25

15. Джозелит Д. (2015). Против репрезентации. Художественный журнал № 94, 47-51

16. Сосна Н. (2015). Образ и материальное: к трансформации связей. Художественный журнал № 94, 41-45

17. Bastos, M., Piccardi, C., Levy, M., McRobert, N., Lubell, M. (2017). Core-periphery or decentralized? Topological shifts of specialized information on Twitter. Social Networks, 52, 282-293.

18. Belanche, D., Flavian, C., Perez-Rueda, A. (2017). User adaptation to interactive advertising formats: The effect of previous exposure, habit and time urgency on ad skipping behaviors. Telematics and Informatics, 34, 961-972.

19. Daley, D., Kendall D. (1965). Stochastic rumors. J. Inst. Math. Appl., 142, 42-55

20. Kermack, W., McKendrick, A. (1927). A Contribution to the Mathematical Theory of Epidemics. Mathematical, Physical and Engineering Sciences, 115, 700

21. Ferchaud, A., Grzeslo, J., Orme, S., LaGoue, J. (2018). Parasocial attributes and YouTube personalities: Exploring content trends across the most subscribed YouTube channels. Computers in Human Behavior, 80, 88-96.

22. Li, Ch., Lin, Y., Yeh, M. (2017). Forecasting participants of information diffusion on social networks with its application. Information Sciences, 422, 432-446.

23. Park, S., Lim, Y., Park, H. (2015). Comparing Twitter and YouTube networks in information diffusion: The case of the “Occupy Wall Street” Movement. Technological Forecasting & Social Change, 95, 208-217.

Wu, T., Chen, L., Xian, X., Guo, Y. (2016). Evolution prediction in multi-scale information diffusion dynamics. Knowledge-Based System, 113, 186-198.

24. Zhu, H., Yin, X., Ma, J., Hu, W. (2016). Identifying the main paths of information diffusion in online social networks. Physica A, 452, 320-328.

Интернет

25. Лотман Ю. (1998). Структура художественного текста. [электронный ресурс] - Режим доступа. - URL: [http://www.gumer.info/bibliotek_Buks/Literat/Lotman/_15.php]

...

Страница:

дипломная работа "Факторы, определяющие распространение рекламных сообщений на платформе YouTube" скачать

Подобные документы

Каналы распространения рекламы
Современные подходы к выбору каналов информации. Способы выбора эффективного канала размещения рекламы и ее подразделения. Совершенствование системе массовых коммуникаций и других каналов распространения информации и рекламы. Рекламная кампания.

курсовая работа [45,1 K], добавлен 29.05.2014
Каналы распространения рекламы - достоинства и недостатки
Изучение сущности и значения каналов распространения рекламных сообщений. Преимущества и недостатки основных носителей рекламы, классификация и сравнительная характеристика. Степень восприятия рекламных сообщений, их положительные и отрицательные стороны.

курсовая работа [707,5 K], добавлен 26.09.2010
Выбор средства передачи рекламного сообщения
Рекламная деятельность в системе маркетинга: сущность, значение, возможные цели и особенности восприятия рекламных сообщений. Основные виды и средства распространения рекламы. Печатные и электронные средства распространения, их достоинства и недостатки.

курсовая работа [382,0 K], добавлен 04.09.2014
Роль "посредника" в рекламных коммуникациях
Исследование рекламы как части социальной коммуникации. Изучение основных каналов распространения рекламной информации. Анализ видов посредников в рекламных коммуникациях. Характеристика особенностей и перспектив развития посредников в российской рекламе.

курсовая работа [715,2 K], добавлен 11.03.2014
Жанры рекламы в печатных средствах массовой информации
Понятие печатной рекламы как основного канала распространения рекламных обращений, ее сущность, виды, применение и достоинства. Развитие современной рекламы в российских печатных средствах массовой информации. Классификация и сравнение рекламных жанров.

курсовая работа [2,0 M], добавлен 12.11.2009
Средства распространения туристской рекламы
Особенности рекламы в сфере туризма, факторы, влияющие на ее действенность. Отличительные черты рекламы как одного из средств маркетинговых коммуникаций. Виды туристской рекламы, выбор средств ее распространения. Периодичность рекламных обращений.

контрольная работа [1,2 M], добавлен 08.12.2011
Сетевое распространение товара
Сущность и содержание идеи сетевого распространения товара, ее распространенность на современном этапе. Оценка преимуществ и недостатков данного метода продажи, требования, предъявляемые к его реализации. Сетевое распространение информации о компании.

реферат [554,9 K], добавлен 16.11.2010
Экономическое обоснование выбора каналов распространения рекламы
Рекламные средства как материальные способы распространения сообщений для достижения необходимого эффекта. Преимущества и недостатки каналов распространения рекламы: печатные СМИ, интернет, телевидение и радио, реклама в местах торговли и в транспорте.

курсовая работа [1,3 M], добавлен 02.04.2011
Роль посредника в рекламной коммуникации. Общие требования к рекламе
Виды посредников в рекламной деятельности. Услуги, предоставляемые агентствами. Пути повышения восприятия рекламы. Классификация печатных изданий. Телевидение – идеальный канал распространения информации. Правовое регулирование рекламной деятельности.

контрольная работа [26,2 K], добавлен 06.03.2012
Массовая коммуникация
Понятие, структура, функции и эффективность массовой коммуникации. Процесс распространения информации с помощью технических средств (пресса, радио, телевидение и др.) на численно большие, рассредоточенные аудитории.

курсовая работа [38,0 K], добавлен 26.03.2005
Наружная реклама как важный канал распространения рекламы
Средства массовой информации (СМИ) как один из каналов распространения рекламного продукта. Особенности и технология его продвижения: телевизионная реклама, в прессе, на радио, рассылаемая по почте, Интернет-реклама. Роль наружной рекламы на аудиторию.

курсовая работа [48,8 K], добавлен 21.05.2009
Исследование эффекта использования рекламы в медиа-пространстве
Оценка психологической, экономической и торговой эффективности рекламы. Преимущества и недостатки ее распространения в медиа-средствах: в прессе, на радио, телевидении. Наружная и компьютеризованная реклама. Решения о средствах распространения информации.

курсовая работа [52,0 K], добавлен 25.01.2011
Изучение среды распространения рекламы
Общая характеристика, цели и задачи медиаисследования как исследования различного рода средства массовой информации на предмет целесообразности и эффективности размещаемой в них рекламы. Составление макета анкеты для получения информации от потребителей.

курсовая работа [2,3 M], добавлен 03.11.2014
Разработка рекламных мероприятий связанных с открытием летней террасы в ресторане "Васаби"
Каналы распространения информации. Общее понятие о public relations. Реклама в целях расширения сбыта. Анализ хозяйственной деятельности ресторана "Васаби". Тренинг по теме: "Профессиональное общение". Смета затрат на проведение рекламных мероприятий.

курсовая работа [3,3 M], добавлен 29.11.2012
Реклама в Интернете
Средства получения информации, среда ее распространения и влияния на потребителя. Сеть Интернет как возможность создания благоприятного имиджа современной фирмы или продукции, повышение доступности информации о предприятии, сокращение издержек на рекламу.

курсовая работа [29,8 K], добавлен 23.02.2015
Исследование рекламы в автоцентре ООО "Лидер"
Реклама как средство распространения информации. Ее классификация и задачи, функции и цели. Краткая характеристика автосалона. Организация рекламных кампаний в продвижении предприятия. Сравнительный анализ конкурентов, спроса и продаж, работы рекламы.

курсовая работа [228,4 K], добавлен 17.11.2014
Специфика каналов распространения рекламы: достоинства и недостатки
История формирования современной системы средств массовой информации. Сравнительный анализ преимуществ и недостатков основных носителей рекламы. Влияние выбора средств массовой информации на успешность рекламной компании на примере компании "Coca–Cola".

курсовая работа [4,0 M], добавлен 23.10.2014
Телевидение как средство распространения и размещения рекламы
История рекламных роликов, характеристика, виды, преимущества и недостатки, функции. Исследование их эффективности на примере бренда "Домик в деревне". Особенности телевизионного воздействия. Проблемы рекламных сообщений, размещенных на телевидении РФ.

дипломная работа [129,6 K], добавлен 17.06.2013
BTL-реклама: виды и практика применения
BTL-реклама как один из комплексов маркетинговых мероприятий. Выбор каналов распространения информации (кроме СМИ). Стимулирование сбыта среди торговых посредников, потребителей. Часто используемые методы работы BTL-рекламы, их преимущества и недостатки.

презентация [5,8 M], добавлен 08.12.2015
Наружная реклама и информация в социально-культурном сервисе и туризме
Преимущества использования наружной рекламы для распространения информации о предприятиях социально-культурной сферы и туризма. Требования, предъявляемые к стационарным и временным средствам наружной рекламы. Размещение рекламной информации в транспорте.

контрольная работа [30,9 K], добавлен 27.07.2013

Другие документы, подобные "Факторы, определяющие распространение рекламных сообщений на платформе YouTube"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.