Анализ целевой аудитории социальных сетей
Разработка метода определения ключевых отличительных характеристик целевой аудитории компании от конкурентов на примере трех косметических брендов с использованием данных из социальных сетей. Его преимущества и недостатки, рекомендации по использованию.
Рубрика | Маркетинг, реклама и торговля |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 12.08.2018 |
Размер файла | 129,2 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Далее была произведена попытка произвести кластерный анализ пользователей, чтобы определить, на какие близкие по характеристикам группы можно разделить пользователей, однако, проанализировать таким образом базу в 1,2 млн наблюдений оказалось невыполнимым на персональном компьютере.
Анализ данных проводился с помощью статистической программы SPSS Statistics.
Несмотря на множество ограничений, таких как частотные и количественные ограничения запросов с помощью интерфейса VK API, ограничения функций пакета vkR, ограничения оперативной памяти и мощностей персонального компьютера, методология данного исследования позволяет предоставить результаты примера анализа аудиторий косметических компаний AVON, Oriflame и Faberlic, а также описать метод определения ключевых отличительных характеристик целевой аудитории компании от конкурентов на основе данных из социальной сети ВКонтакте, проанализировать и описать его преимущества и недостатки, разработать список рекомендаций по его использованию, а также предложить варианты развития данной темы в рамках возможных будущих исследований.
3. Описание результатов
На основе рассмотренных работ, проведенных исследователями ранее в области анализа целевой аудитории, а также в смежных областях, связанных с анализом данных из социальных сетей, предсказанием посещения мероприятий, определением ключевых отличий работы социальной сети ВКонтакте для маркетинговой деятельности той или иной компании, с помощью методов и инструментов сбора и анализа данных, таких как сбор данных из социальной сети ВКонтакте посредством запросов к API с помощью создания кода на языке программирования R, перекодирование данных и подготовка к обработке, анализ данных с помощью описательных статистик, регрессионного анализа, факторного анализа и кластерного анализа, были получены следующие результаты: был разработан метод определения ключевых отличительных характеристик целевой аудитории компании от конкурентов на примере косметических брендов (AVON, Oriflame, Faberlic) с использованием данных из социальных сетей (в том числе разработан метод сбора данных для подобных исследований), составлен список преимуществ и недостатков данного метода, разработан список рекомендаций по его использованию, а также возможные направления для развития данной темы в рамках последующих исследований. Однако, перед этим был рассмотрен пример трех косметических компаний.
Что касается общего массива данных, то он обладает следующими характеристиками: преобладают пользователи женского пола (88,4%), состоящие в браке (61%). Пользователи из выборки склонны не заполнять данные о себе (свыше 90% не указали ничего в разделе «жизненная позиция», свыше 94% не заполнили вкладку «интересы», свыше 80% не указали данные об образовании и месте работы, свыше 84% не указали контактную информацию) и ограничивать доступ к стене. Из тех пользователей, что заполнили информацию о себе 57% получили высшее образование и 37% сейчас являются студентами, 35% указали место работы, обладают умеренными политическими взглядами (68,2%), считают, что главное в человеке - доброта и честность (64,2%), а главное в жизни - семья и дети (70,1%), с негативным (65%) и компромиссным (22,3%) отношением к курению и по большей части негативным отношением к алкоголю (53%).
Что касается распределения пользователей между группами, то 37,1% подписаны только на группу AVON, 23,6% - только на Oriflame, 34,9% - только на Faberlic, 4,1% подписаны на любые две из перечисленных групп (равномерное распределения между вариантами), 0,4% - на все три группы, что показывает, что большинство пользователей интересуются лишь одним брендом из трех. Стоит отметить, что видимой разницы, согласно описательным статистикам, между пользователями, подписанными на ту или иную группу или на комбинацию тех или иных групп практически нет. Можно отметить, что доля мужчин меньше всего в подписчиках бренда AVON, а больше всего в сочетании Oriflame и Faberlic, а по возрасту во всех группах 50% пользователей сосредоточены в границах возраста от 24 до 32 лет, кроме пользователей, подписанных только на Faberlic - размах по показателю «возраст» у этой группы больше, а 50% наблюдений сосредоточены в области от 24 до 38 лет.
Уже исходя из описательных статистик можно сделать предположение, что по регрессиям получится такой же результат, подтверждающий, что статистической разницы между подгруппами, основанными на подписке на ту или иную официальную группу одного из трех косметических брендов или на комбинацию из групп, нет.
Далее были построены 7 регрессий, в качестве зависимой переменной в каждой из них была указана одна из бинарных переменных, соответствующая комбинации из трех групп (пользователь подписан только на AVON, только на Oriflame, только на Faberlic, на комбинацию AVON и Oriflame, AVON и Faberlic, Oriflame и Faberlic или на все три группы одновременно). В качестве независимых переменных были указаны все фиктивные переменные и метрические, которые не содержат те же данные, что и зависимые переменные.
Процент объясненной дисперсии всех семи полученных моделей колеблется от 1 до 10%, что указывает на то, что есть значимые отличия между группами, однако, они не являются существенными. В каждую из моделей были включены от 5 до 11 значимых переменных.
Так регрессия, построенная для зависимой переменной, где 1 - пользователь состоит только в официальной группе AVON, 0 - другое, включает в себя переменные женский пол (если пользователь женщина, то вероятность того, что он состоит только в официальной группе AVON увеличивается на 0,243), женат / замужем (если пользователь состоит в браке, то вероятность снижается на 0,06), дистанционное обучение (повышает вероятность на 0,078), доктор наук (увеличивает вероятность на 0,061), число подписчиков (каждый подписчик увеличивает вероятность на 0,06), Москва/СПб и встречаюсь (проживание в Москве и Петербурге, а также семейное положение «встречаюсь» увеличивают вероятность того, что пользователь состоит только в официальной группе AVON на 0,057). Регрессия, построенная для зависимой переменной, где 1 - пользователь состоит только в официальной группе Oriflame, 0 - другое, включает в себя переменную женский пол (если пользователь женщина, то вероятность того, что он состоит только в официальной группе Oriflame уменьшается на 0,085), заполнение графы «меня вдохновляют» увеличивает вероятность на 0,09, а заполнение графы «мировоззрение» уменьшает ее на 0,61, как и если пользователь указал, что главное в жизни для него карьера и деньги. Регрессия, построенная для зависимой переменной, где 1 - пользователь состоит только в официальной группе Faberlic, 0 - другое, включает в себя переменную женский пол (если пользователь женщина, то вероятность того, что он состоит только в официальной группе Faberlic уменьшается на 0,2), заполнение графы «меня вдохновляют» уменьшает вероятность на 0,08, как и степень заполнения контактов, каждый год возраста увеличивает вероятность на 0,075, а если пользователя студент-специалист, то вероятность увеличивается на 0,087.
Однако, тот факт, что процент объясненной дисперсии всех семи полученных моделей колеблется от 1 до 10%, показывает, что по сути большой разницы между пользователями трех брендов нет, поскольку по большей части аудитории совпадают, согласно переменным, которые были использованы в анализе.
После был проведен факторный анализ, однако, стоит отметить, что и без проведения факторного анализа переменные можно разделить на группы по смыслу по блокам на личных страницах в социальной сети ВКонтакте: общие сведения, интересы, контакты, образование, карьера, жизненная позиция. Согласно графику каменной осыпи, можно разбить все переменные на 5 групп, поскольку увеличение количества факторов на один ненамного увеличивает eigenvalue.
Рисунок 1. График каменной осыпи
Стоит отметить, что разделение на группы совпадает с блоками информации на личной странице пользователя, только интересы и жизненная позиция объединены в одну группу.
Результатов кластерного анализа в данном исследовании нет, поскольку оперативной памяти обычного компьютера для обработки свыше миллиона наблюдений оказалось недостаточно.
Итак, в ходе проведения пробного исследования по анализу целевых аудиторий трех брендов косметики был разработан метод сбора данных, описаны методы анализа собранных данных, их параметры, составлен список преимуществ и недостатков данного метода, разработан список рекомендаций по его использованию, а также возможные направления для развития данной темы в рамках последующих исследований.
3.1 Метод сбора и анализа данных
Что касается метода сбора данных, то предлагается проводить сбор с помощью кода, написанного на языке программирования R с помощью функций из пакета vkR, позволяющего извлекать данные из социальной сети ВКонтакте с помощью интерфейса API. Сбор и обработку данных перед анализом можно условно разделить на несколько этапов:
1. Сбор перечня id пользователей, которые подписаны на группу или сообщество в социальной сети ВКонтакте;
2. Сбор данных о пользователях, чьи id были собраны на первом этапе и перекодировка данных для корректного отображения кириллических символов;
3. Сбор данных в одну базу, перекодирование переменных, создание новых переменных, запись в формате.csv для возможности анализа данных с помощью понятных для пользователя программ с точки зрения интерфейса типа SPSS Statistics.
Что касается первого этапа, то сначала необходимо подгрузить необходимые папки с функциями, запустив команду library(vkR). После этого необходимо установить связь с VK API, для этого необходимо создать пустое приложение в социальной сети ВКонтакте (либо использовать существующее, если вы являетесь разработчиком приложения), зайти в настройки приложения и скопировать оттуда идентификационный номер приложения. Если используется пустое приложение, то частотное ограничение по запросам будет составлять 3 запроса в секунду, если используется действующее приложение, у которого есть пользователи, то этот параметр будет увеличиваться: если приложением пользуются свыше 10 тысяч человек, то 8 запросов в секунду, больше 100 тысяч - 20 запросов, больше 1 млн. - 35 запросов в секунду.
Для установления связи необходимо сначала зайти в браузер и войти на свою страницу ВКонтакте, затем запустить команду vkOAuth(1), где вместо числа 1 необходимо подставить идентификационный номер приложения, после чего откроется окно браузера, в адресной строке которого нужно выделить и скопировать набор знаков, который располагается между «access_token=» и «&expires_in=», и вставить в скобки функции setAccessToken('n') вместо символа n.
После необходимо запустить цикл, который выглядит следующим образом:
x < - data.frame (getGroupsMembers(group_id = «name»))
for (m in 1:z) {
y < - data.frame (getGroupsMembers(group_id = «name», offset = (1000*m + 1)))
x < - rbind (x, y)
}
Где вместо z нужно подставить количество тысяч участников в группе или сообществе, округленное в большую сторону, а в функциях group_id = «name» вместо name необходимо вставить id группы или сообщества, пользователей которого необходимо проанализировать. После этого данные стоит сохранить с помощью функции saveRDS (x, file = «urls_1.rds»), где вместо urls_1.rds можно вставить любое название, составленное с помощью латинских букв и различных символов.
Такую операцию нужно провести для каждой группы, использующейся в анализе, при этом названия файлов для сохранения стоит указывать разные.
После можно перейти к следующему этапу, в рамках которого будут собраны данные о пользователях, чьи id были выкачаны на первом этапе.
Сначала нужно подкачать еще две папки функциями, помимо той, которая была подгружена ранее, выполнив функции library(plyr) и library(dplyr). Далее необходимо подгрузить один из файлов, полученных на первом этапе с помощью функции df < - readRDS (file = «urls_1.rds»), где вместо urls_1.rds подставить название одного из файлов, сохраненных по итогам первого этапа. Далее необходимо запустить цикл, который выгрузит данные по пользователям. Стоит отметить, что делать он это будет частями по 1000 пользователей, создавая под них отдельный файл и сохраняя его. Вместо z снова нужно поставить количество тысяч участников в группе или сообществе, округленное в большую сторону (можно посмотреть по количеству наблюдений в df).
for (i in 0:z) {
abc_add < - as.list (df$items[(i*1000 + 1): (i*1000 + 1000)])
abc_info_add < - getUsers (abc_add, fields = 'first_name, last_name, deactivated, hidden, verified, sex, bdate, city, country, home_town, lists, domain, has_mobile, contacts, site, education, universities, schools, status, followers_count, common_count, counters, occupation, nickname, relatives, relation, personal, connections, exports, wall_comments, activities, interests, music, movies, tv, books, games, about, quotes, can_post, can_see_all_posts, can_see_audio, can_write_private_message, timezone, screen_name', flatten = TRUE)
saveRDS (abc_info_add, file = paste («user_info_», i,».rds»))
}
Далее необходимо объединить данные в один массив данных с помощью следующих строчек кода:
rbind.all.columns < - function (x, y) {
x.diff < - setdiff (colnames(x), colnames(y))
y.diff < - setdiff (colnames(y), colnames(x))
x [, c(as.character (y.diff))] < - NA
y [, c(as.character (x.diff))] < - NA
return (rbind(x, y))
}
urls < - readRDS (file = paste («user_info_ 0.rds»))
#for (i in 1:z)
for (i in 1:z) {
url_add < - readRDS (file = paste («user_info_», i,».rds»))
urls < - rbind.all.columns (urls, url_add)
}
Где вместо z снова нужно подставить количество тысяч участников в группе или сообществе, округленное в большую сторону.
После каждую из переменных, где могут содержаться кириллические символы, необходимо перекодировать, чтобы эти символы отображались верно.
urls$first_name < - iconv (urls$first_name, «utf-8», «windows-1251»)
Encoding (urls$first_name) < - «latin1»
Encoding (urls$first_name) < - «UTF-8»
urls$last_name < - iconv (urls$last_name, «utf-8», «windows-1251»)
Encoding (urls$last_name) < - «latin1»
Encoding (urls$last_name) < - «UTF-8»
urls$nickname < - iconv (urls$nickname, «utf-8», «windows-1251»)
Encoding (urls$nickname) < - «latin1»
Encoding (urls$nickname) < - «UTF-8»
urls$facebook_name < - iconv (urls$facebook_name, «utf-8», «windows-1251»)
Encoding (urls$facebook_name) < - «latin1»
Encoding (urls$facebook_name) < - «UTF-8»
urls$site < - iconv (urls$site, «utf-8», «windows-1251»)
Encoding (urls$site) < - «latin1»
Encoding (urls$site) < - «UTF-8»
urls$status < - iconv (urls$status, «utf-8», «windows-1251»)
Encoding (urls$status) < - «latin1»
Encoding (urls$status) < - «UTF-8»
urls$university_name < - iconv (urls$university_name, «utf-8», «windows-1251»)
Encoding (urls$university_name) < - «latin1»
Encoding (urls$university_name) < - «UTF-8»
urls$faculty_name < - iconv (urls$faculty_name, «utf-8», «windows-1251»)
Encoding (urls$faculty_name) < - «latin1»
Encoding (urls$faculty_name) < - «UTF-8»
urls$home_town < - iconv (urls$home_town, «utf-8», «windows-1251»)
Encoding (urls$home_town) < - «latin1»
Encoding (urls$home_town) < - «UTF-8»
urls$interests < - iconv (urls$interests, «utf-8», «windows-1251»)
Encoding (urls$interests) < - «latin1»
Encoding (urls$interests) < - «UTF-8»
urls$music < - iconv (urls$music, «utf-8», «windows-1251»)
Encoding (urls$music) < - «latin1»
Encoding (urls$music) < - «UTF-8»
urls$activities < - iconv (urls$activities, «utf-8», «windows-1251»)
Encoding (urls$activities) < - «latin1»
Encoding (urls$activities) < - «UTF-8»
urls$movies < - iconv (urls$movies, «utf-8», «windows-1251»)
Encoding (urls$movies) < - «latin1»
Encoding (urls$movies) < - «UTF-8»
urls$tv < - iconv (urls$tv, «utf-8», «windows-1251»)
Encoding (urls$tv) < - «latin1»
Encoding (urls$tv) < - «UTF-8»
urls$books < - iconv (urls$books, «utf-8», «windows-1251»)
Encoding (urls$books) < - «latin1»
Encoding (urls$books) < - «UTF-8»
urls$games < - iconv (urls$games, «utf-8», «windows-1251»)
Encoding (urls$games) < - «latin1»
Encoding (urls$games) < - «UTF-8»
urls$about < - iconv (urls$about, «utf-8», «windows-1251»)
Encoding (urls$about) < - «latin1»
Encoding (urls$about) < - «UTF-8»
urls$quotes < - iconv (urls$quotes, «utf-8», «windows-1251»)
Encoding (urls$quotes) < - «latin1»
Encoding (urls$quotes) < - «UTF-8»
urls$education_form < - iconv (urls$education_form, «utf-8», «windows-1251»)
Encoding (urls$education_form) < - «latin1»
Encoding (urls$education_form) < - «UTF-8»
urls$education_status < - iconv (urls$education_status, «utf-8», «windows-1251»)
Encoding (urls$education_status) < - «latin1»
Encoding (urls$education_status) < - «UTF-8»
urls$mobile_phone < - iconv (urls$mobile_phone, «utf-8», «windows-1251»)
Encoding (urls$mobile_phone) < - «latin1»
Encoding (urls$mobile_phone) < - «UTF-8»
urls$home_phone < - iconv (urls$home_phone, «utf-8», «windows-1251»)
Encoding (urls$home_phone) < - «latin1»
Encoding (urls$home_phone) < - «UTF-8»
urls$city.title < - iconv (urls$city.title, «utf-8», «windows-1251»)
Encoding (urls$city.title) < - «latin1»
Encoding (urls$city.title) < - «UTF-8»
urls$country.title < - iconv (urls$country.title, «utf-8», «windows-1251»)
Encoding (urls$country.title) < - «latin1»
Encoding (urls$country.title) < - «UTF-8»
urls$personal.religion < - iconv (urls$personal.religion, «utf-8», «windows-1251»)
Encoding (urls$personal.religion) < - «latin1»
Encoding (urls$personal.religion) < - «UTF-8»
urls$personal.inspired_by < - iconv (urls$personal.inspired_by, «utf-8», «windows-1251»)
Encoding (urls$personal.inspired_by) < - «latin1»
Encoding (urls$personal.inspired_by) < - «UTF-8»
urls$occupation.name < - iconv (urls$occupation.name, «utf-8», «windows-1251»)
Encoding (urls$occupation.name) < - «latin1»
Encoding (urls$occupation.name) < - «UTF-8»
urls$relation_partner.first_name < - iconv (urls$relation_partner.first_name, «utf-8», «windows-1251»)
Encoding (urls$relation_partner.first_name) < - «latin1»
Encoding (urls$relation_partner.first_name) < - «UTF-8»
urls$relation_partner.last_name < - iconv (urls$relation_partner.last_name, «utf-8», «windows-1251»)
Encoding (urls$relation_partner.last_name) < - «latin1»
Encoding (urls$relation_partner.last_name) < - «UTF-8»
В качестве завершения этапа стоит сохранить полученный массив данных с помощью функции saveRDS (urls, file = «urls_1_info.rds»), где вместо urls_1_info.rds может быть указано другое имя файла с использованием латинских букв, цифр и символов. Данный этап необходимо выполнить для всех групп.
Следующий этап заключается в объединении массивов данных в один и в преобразовании переменных. Это необходимо для подготовки данных для дальнейшего анализа, в том числе для запуска регрессий. Для этого сначала нужно подгрузить все полученные на втором этапе файлы (указан пример для трех массивов данных), заменив в функциях названия файлов на указанные ранее:
df_1 < - readRDS (file = «urls_1_info.rds»)
df_2 < - readRDS (file = «urls_2_info.rds»)
df_3 < - readRDS (file = «urls_3_info.rds»)
Далее создаем переменные, соответствующие участию в группе:
df_1 $group_1 < - 1
df_2 $group_2 < - 1
df_3 $group_3 < - 1
При этом названия переменных group_1, group_2 и group_3 можно изменить по своему желанию и удобству. После чего необходимо объединить массивы данных в один без потери столбцов.
rbind.all.columns < - function (x, y) {
x.diff < - setdiff (colnames(x), colnames(y))
y.diff < - setdiff (colnames(y), colnames(x))
x [, c(as.character (y.diff))] < - NA
y [, c(as.character (x.diff))] < - NA
return (rbind(x, y))
}
df_all < - rbind.all.columns (df_1, df_2)
df_all < - rbind.all.columns (df_all, df_3)
Стоит отметить, что теперь наблюдения (пользователи) будут повторяться, поэтому необходимо запустить следующие функции, чтобы избежать повторений:
df_unique < - df_all [! duplicated(df_all$id),]
a < - select (df_1, id, group_1)
b < - select (df_2, id, group_2)
c < - select (df_3, id, group_3)
df_unique_2 < - select (df_unique, - group_1, - group_2, - group_3)
df_unique_2 < - left_join (df_unique_2, a, by = «id»)
df_unique_2 < - left_join (df_unique_2, b, by = «id»)
df_unique_2 < - left_join (df_unique_2, c, by = «id»)
df_unique_2 $group_1 [is.na (df_unique_2 $group_1)] < - 0
df_unique_2 $group_2 [is.na (df_unique_2 $group_2)] < - 0
df_unique_2 $group_3 [is.na (df_unique_2 $group_3)] < - 0
Дальше будет использован большой набор строчек кода, который позволяет перекодировать переменные, создать новые, а также поменять столбцы местами для удобства. Так кодируем переменную deactivated, чтобы 1 соответствовала удаленному пользователю, 2 - забаненному, 0 - активному:
df_unique_2 $deactivated [is.na (df_unique_2 $deactivated)] < - 0
df_unique_2 $deactivated [df_unique_2 $deactivated == «deleted»] < - 1
df_unique_2 $deactivated [df_unique_2 $deactivated == «banned»] < - 2
После создаем переменную domain_1, которая будет принимать значение 1, если домен пользователя отличается от id, и 0, если не отличается:
df_unique_2 $domain_1 < - NA
df_unique_2 = df_unique_2 [, c(1:6, 95, 7:94)]
df_unique_2 $domain_1 [df_unique_2 $domain == paste («id», df_unique_2 $id, sep = «»)] < - 0
df_unique_2 $domain_1 [is.na (df_unique_2 $domain_1)] < - 1
Затем создаем переменную domain_2, которая считает количество символов в домене, если он отличается от id, а в лругом случае принимает значение 0:
df_unique_2 $domain_2 < - nchar (df_unique_2 $domain
df_unique_2 = df_unique_2 [, c(1:7, 96, 8:95)]
df_unique_2 $domain_2 [df_unique_2 $domain_1 == 0] < - 0
Поскольку функции, выкачивающие данные, могли возвращать пустые строчки, необходимо заменить всех их пропущенными значениями - NA:
require(dplyr)
empty_as_na < - function(x) {
if («factor»%in% class(x)) x < - as.character(x) ## since ifelse wont work with factors
ifelse (as.character(x)!= «», x, NA)
}
df_unique_2 < - mutate_each (df_unique_2, funs (empty_as_na))
Далее создаем переменную nickname_1, которая принимает значение 1, если пользователь указа никнейм, и 0, если не указал:
df_unique_2 $nickname_1 < - NA
df_unique_2 = df_unique_2 [, c(1:11, 97, 12:96)]
df_unique_2 $nickname_1 [is.na (df_unique_2 $nickname)] < - 0
df_unique_2 $nickname_1 [is.na (df_unique_2 $nickname_1)] < - 1
Также создаем переменную nickname_2, которая считает количество символов в никнейме, если он указан, либо возвращает 0 в противоположном случае:
df_unique_2 $nickname_2 < - nchar (df_unique_2 $nickname)
df_unique_2 = df_unique_2 [, c(1:12, 98, 13:97)]
df_unique_2 $nickname_2 [df_unique_2 $nickname_1 == 0] < - 0
Далее убираем переменную screen_name, так как она не отличается от переменной domain:
df_unique_2 = df_unique_2 [, c(1:13, 15:98)]
После создаем переменные facebook_1, instagram_1, site_1 и status_1, которые принимают значение 1, если указан аккаунт на Facebook, аккаунт в Instagramб сайт или статус соответственно, либо 0 в противоположном случае:
df_unique_2 $facebook_1 < - NA
df_unique_2 = df_unique_2 [, c(1:19, 98, 20:97)]
df_unique_2 $facebook_1 [is.na (df_unique_2 $facebook)] < - 0
df_unique_2 $facebook_1 [is.na (df_unique_2 $facebook_1)] < - 1
df_unique_2 $instagram_1 < - NA
df_unique_2 = df_unique_2 [, c(1:21, 99, 22:98)]
df_unique_2 $instagram_1 [is.na (df_unique_2 $instagram)] < - 0
df_unique_2 $instagram_1 [is.na (df_unique_2 $instagram_1)] < - 1
df_unique_2 $site_1 < - NA
df_unique_2 = df_unique_2 [, c(1:23, 100, 24:99)]
df_unique_2 $site_1 [is.na (df_unique_2 $site)] < - 0
df_unique_2 $site_1 [is.na (df_unique_2 $site_1)] < - 1
df_unique_2 $status_1 < - NA
df_unique_2 = df_unique_2 [, c(1:25, 101, 26:100)]
df_unique_2 $status_1 [is.na (df_unique_2 $status)] < - 0
df_unique_2 $status_1 [is.na (df_unique_2 $status_1)] < - 1
Далее убираем переменные, которые во время сбора данных сработали неверно:
df_unique_2 = df_unique_2 [, c(1:28, 30:101)]
df_unique_2 = df_unique_2 [, c(1:82, 98:100)]
После создаем переменные interests_1, music_1, activities_1, movies_1, tv_1, books_1, games_1, about_1, quotes_1, которые принимают значение 1, если пользователь заполнил графу «интересы», «любимая музыка», «деятельность», «любимые фильмы», «любимые тв шоу», «любимые книги», «любимые игры», «о себе», «любимые цитаты», соответственно, и 0 в противном случае, а также переменную pers_info, которая считает среднее значение по данным переменным, характеризуя степень заполнения информации об интересах:
df_unique_2 $interests_1 < - NA
df_unique_2 = df_unique_2 [, c(1:36, 86, 37:85)]
df_unique_2 $interests_1 [is.na (df_unique_2 $interests)] < - 0
df_unique_2 $interests_1 [is.na (df_unique_2 $interests_1)] < - 1
df_unique_2 $music_1 < - NA
df_unique_2 = df_unique_2 [, c(1:38, 87, 39:86)]
df_unique_2 $music_1 [is.na (df_unique_2 $music)] < - 0
df_unique_2 $music_1 [is.na (df_unique_2 $music_1)] < - 1
df_unique_2 $activities_1 < - NA
df_unique_2 = df_unique_2 [, c(1:40, 88, 41:87)]
df_unique_2 $activities_1 [is.na (df_unique_2 $activities)] < - 0
df_unique_2 $activities_1 [is.na (df_unique_2 $activities_1)] < - 1
df_unique_2 $movies_1 < - NA
df_unique_2 = df_unique_2 [, c(1:42, 89, 43:88)]
df_unique_2 $movies_1 [is.na (df_unique_2 $movies)] < - 0
df_unique_2 $movies_1 [is.na (df_unique_2 $movies_1)] < - 1
df_unique_2 $tv_1 < - NA
df_unique_2 = df_unique_2 [, c(1:44, 90, 45:89)]
df_unique_2 $tv_1 [is.na (df_unique_2 $tv)] < - 0
df_unique_2 $tv_1 [is.na (df_unique_2 $tv_1)] < - 1
df_unique_2 $books_1 < - NA
df_unique_2 = df_unique_2 [, c(1:46, 91, 47:90)]
df_unique_2 $books_1 [is.na (df_unique_2 $books)] < - 0
df_unique_2 $books_1 [is.na (df_unique_2 $books_1)] < - 1
df_unique_2 $games_1 < - NA
df_unique_2 = df_unique_2 [, c(1:48, 92, 49:91)]
df_unique_2 $games_1 [is.na (df_unique_2 $games)] < - 0
df_unique_2 $games_1 [is.na (df_unique_2 $games_1)] < - 1
df_unique_2 $about_1 < - NA
df_unique_2 = df_unique_2 [, c(1:52, 93, 53:92)]
df_unique_2 $about_1 [is.na (df_unique_2 $about)] < - 0
df_unique_2 $about_1 [is.na (df_unique_2 $about_1)] < - 1
df_unique_2 $quotes_1 < - NA
df_unique_2 = df_unique_2 [, c(1:54, 94, 55:93)]
df_unique_2 $quotes_1 [is.na (df_unique_2 $quotes)] < - 0
df_unique_2 $quotes_1 [is.na (df_unique_2 $quotes_1)] < - 1
attach (df_unique_2)
df_unique_2 $pers_info < - (interests_1 + music_1 + activities_1 + movies_1 + tv_1 + books_1 + games_1 + about_1 + quotes_1)/9
detach (df_unique_2)
df_unique_2 = df_unique_2 [, c(1:49, 52:53, 56, 55, 95, 50:51, 54, 57:94)]
Далее создаем переменные mobile_phone_1, home_phone_1, twitter_1, skype_1, livejournal_1, которые принимают значение 1, если пользователь указал мобильный телефон, домашний телефон, аккаунт в Twitter, аккаунт в Skype или аккаунт в Live Journal, соответственно, и 0 в противном случае, а также переменную contacts, которая считает среднее значение по переменным mobile_phone_1, home_phone_1, twitter_1, skype_1, livejournal_1, facebook_1, instagram_1 и site_1, характеризуя степень заполнения информации о контактах:
df_unique_2 $mobile_phone_1 < - NA
df_unique_2 = df_unique_2 [, c(1:61, 96, 62:95)]
df_unique_2 $mobile_phone_1 [is.na (df_unique_2 $mobile_phone)] < - 0
df_unique_2 $mobile_phone_1 [is.na (df_unique_2 $mobile_phone_1)] < - 1
df_unique_2 $home_phone_1 < - NA
df_unique_2 = df_unique_2 [, c(1:63, 97, 64:96)]
df_unique_2 $home_phone_1 [is.na (df_unique_2 $home_phone)] < - 0
df_unique_2 $home_phone_1 [is.na (df_unique_2 $home_phone_1)] < - 1
df_unique_2 $twitter_1 < - NA
df_unique_2 = df_unique_2 [, c(1:65, 98, 66:97)]
df_unique_2 $twitter_1 [is.na (df_unique_2 $twitter)] < - 0
df_unique_2 $twitter_1 [is.na (df_unique_2 $twitter_1)] < - 1
...Подобные документы
Определение целевой аудитории. Рекламное сообщение и рекламные мероприятия. Основные факторы, влияющие на клиента. Анализ целевой аудитории на примере издания "Из рук в руки". Социально-демографические характеристики регулярной аудитории издания.
курсовая работа [792,2 K], добавлен 16.12.2012Трансформация традиционной модели коммуникации в виртуальной среде. Потребности потенциальных потребителей. Характеристики целевой аудитории, восприятие информации. Каким образом сайт поддерживает или ограничивает проявление реакции целевой аудитории.
контрольная работа [27,1 K], добавлен 23.05.2013Теоретические аспекты возможностей и способов использования социальных сетей для продвижения имиджа арт-компании. Методы взаимодействия коммерческого бренда с целевой аудиторией, возможности рекламного таргетирования в социальных сетях и блогосфере.
дипломная работа [3,5 M], добавлен 13.06.2015Типология интегрирования социальных элементов в разные виды коммуникации. Преимущества и недостатки интеграции коммерческой рекламы. Развитие бренда в условиях применения социальных качеств. Исследование рынка, ценовой политики, целевой аудитории.
контрольная работа [29,6 K], добавлен 27.12.2016Имиджевая реклама в системе средств коммуникации. Разработка сценария имиджевого рекламного ролика для канцелярской продукции с учетом особенностей торговой марки и ее целевой аудитории. Анализ целевой аудитории как основа разработки имиджевой рекламы.
курсовая работа [49,0 K], добавлен 07.06.2014Понятие целевой аудитории. Способы проведения исследования рекламной аудитории. Результаты исследований рекламной аудитории. Различия в методах и направлениях использования информации. Недостатки и преимущества каждого из методов сбора информации.
курсовая работа [232,5 K], добавлен 15.12.2008Идея уникального товара. Выбор товарной ниши и целевой аудитории. Основные конкуренты на рынке. Выбор имени бренда. Легенда о фараонах - ремесленниках красоты. Разработка анкеты для выявления ожиданий целевой аудитории. Логотип косметической компании.
презентация [3,3 M], добавлен 04.01.2013Теоретико-методологические ориентиры в изучении социальных сетей в информационном обществе. Концептуальные рамки понятия "информационного общества". Процесс институционализации социальных сетей. Маркетинговые модели монетизации социальных сетей.
дипломная работа [135,1 K], добавлен 30.09.2017Особенности интернет-продвижения Hand Made брендов в социальных сетях. Характеристика компании и ее целевая аудитория. Разработка программы продвижения, ее цели, задачи и инструменты. Методика вовлечения аудитории, проведение мастер-классов и конкурсов.
курсовая работа [936,7 K], добавлен 09.05.2014Основная цель Public relations - установление контакта с общественностью. Четыре важные особенности массовой аудитории. Осознание проблемы и ограничений, уровень включенности активной аудитории в проблемную ситуацию. Критерии типологизации общественности.
курсовая работа [53,5 K], добавлен 12.03.2011Маркетинговая сущность рекламы, ее значение, классификация и оценка состояния рынка. Принципиальные основы рекламной компании, формулировка ее цели и разработка бюджета. Особенности процесса выбора целевой аудитории и средств продвижения товара.
курсовая работа [57,4 K], добавлен 20.02.2012Охват аудитории как главное преимущество рекламы в кинотеатрах. Варианты рекламы в журналах. Особенности рекламы на телевидении. Финансовая экономичность для рекламодателей и охват стабильной целевой аудитории как основное преимущество рекламы на радио.
презентация [1,6 M], добавлен 01.01.2016Разработка и проведение маркетингового исследования целевой аудитории ночного клуба "R99". Определение отношения посетителей к клубу и проводимым в нем мероприятиям. Изучение эффективности различных рекламных методов и отношения посетителей к уровню цен.
отчет по практике [100,8 K], добавлен 28.11.2010Правила создания рекламы. Критерии, на которые необходимо обращать внимание при создании рекламы. Образы, привлекающие внимание целевой аудитории. Эффективная реклама для молодежи. Скрытое значение цветов в рекламе. Темы, интересующие потребителя.
курсовая работа [1,6 M], добавлен 02.12.2014Роль формирования маркетинговой деятельности на производственном предприятии. Изучение отдельных аспектов маркетинговой деятельности предприятия ЗАО "Очаково": анализ рынка пивоваренной продукции, конкурентоспособности фирмы, целевой аудитории компании.
курсовая работа [1,1 M], добавлен 30.11.2011Цели сегментации рынка. Разбиение рынка на секторы, принятие маркетинговых решений. Позиционирование товара. Сегментирование пива по географическим, психографическим, поведенческим, демографическим признакам. Портрет аудитории потребителей пива "Балтика".
контрольная работа [1,6 M], добавлен 28.09.2015Понятие и задачи маркетинга в социальных сетях как инновационная форма продвижения товаров и услуг. Анализ системы продвижения компании и разработка мероприятий по продвижению компании с помощью социальных сетей. Совершенствования системы продвижения.
курсовая работа [432,2 K], добавлен 24.09.2019Сущность рынка B2B и особенности применения маркетингового инструментария. Критерии сегментирования и сегменты рынка. Концепция уникального торгового предложения. Анализ целевой аудитории. Оценка программы коммуникаций. Разработка стратегии сообщения.
контрольная работа [124,7 K], добавлен 22.03.2015Анализ рыночной ситуации и деятельности фирмы, целевой аудитории товаров и услуг. Разработка рекламной стратегии и творческой идеи. Обоснование мотивов и стиля, разработка рекламного обращения. План рекламной кампании, разработка рекламных сценариев.
курсовая работа [29,2 K], добавлен 04.12.2009Характеристика ключевых тенденций развития электронной торговли в России. Технологии продвижения интернет-компании в социальных сетях. Анализ возможностей социальных сетей как рекламных площадок для осуществления рекламно-коммуникационного продвижения.
дипломная работа [2,3 M], добавлен 27.09.2017