Определение целевой аудитории компании ООО "Коти Бьюти"

Бизнес-направления деятельности ООО "Коти Бьюти". Выбор социальных сетей. Статистический анализ предприятия. Определение ядра целевой аудитории для брендов компании. Сравнение аналитических систем. Информационные средства для анализа социальных сетей.

Рубрика Маркетинг, реклама и торговля
Вид дипломная работа
Язык русский
Дата добавления 23.07.2016
Размер файла 923,2 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

IBM Watson Content Analytics преобразует необработанную и неструктурированную информацию, в ресурс, с которым можно работать без выстраивания сложных моделей, позволяет анализировать информацию в реальном времени. Для представления информации существуют специальные средства визуализации данных.

Алгоритм работы с текстовой информацией:

· Сквозной поиск по источникам;

· Выявление закономерностей на основании текстовых данных;

· Извлечение ключевых фактов из неструктурированных текстов.

Система выполняет полный цикл анализа текста: сбор данных, обработка текстовых данных на естественном языке и отображение выявленных аномалий, закономерностей, тенденций и т.д. Благодаря открытой архитектуре системы, результаты каждого из перечисленных шагов можно экспортировать в системы моделирования, визуализации и экспортирования. В системе есть возможность настройки специальные фильтров (фасеты, аналитические срезы) под каждую задачу. Применяя различные фильтры и комбинации фильтрации на большой массив данных, можно выявлять взаимосвязи и явления. С помощью IBM Watson Content Analytics есть возможность выполнять поисковые запросы, даже с учетом опечаток и различный вариантов написания. Распространены методы управления знаниями с помощью извлечения информации из массивов данных, после которого происходит автоматическое формирование базы знаний. Также возможен анализ логов, то есть просмотр посещений сайта пользователями. Есть возможность мониторинга социальных сетей, а именно определение мнения пользователей, определение состояния рынка, выявление негативных высказываний, отслеживание реакций клиентов и многое другое.

3.1.4 Сравнение аналитических систем

Для сравнения Brand Analytics и IBM Watson Content Analytics достаточно удостоверится, каждая ли система удовлетворяет списку требований выдвинутых для поиска информационной аналитической системы для определения целевой аудитории в социальных сетях. Удовлетворения требованию отмечено в таблице 4 как плюс, неудовлетворение отмечено как минус.

Таблица 4. Удовлетворение ИС предъявленным требованиям

Требование

Brand Analytist

IBM Watson Content Analytics

Присутствие всех выбранных обязательных критериев для определения целевой аудитории

+

+

Присутствие необязательных критериев для определения целевой аудиторий

--

+

Фильтрация по брендам

+

+

Дополнительная фильтрация по категориям

+

+

Обязательное присутствие выбранных социальных сетей для анализа

+

+

Визуализация получившихся результатов

+

+

Составление отчетов по получившимся результатам

+

+

Экспорт результатов из системы для дальнейшей обработки

+

+

Выявление аномалий и исключение их из выборки

--

+

Возможность внедрения по всем дивизионам ООО «Коти Бьюти» по миру, с привязкой к существующей ERP системе

--

+

Дешевизна

+

--

Из таблицы видно, что всем предъявленным требованиям удовлетворяет информационное средство IBM Watson Content Analytics, соответственно именно с помощью него будет проходить дальнейшее определение целевой аудитории пользователей с помощью социальных сетей.

3.2 IBM Watson Content Analytics

3.2.1 Описание информационной системы

Используя возможность извлечений данных из неструктурированных источников, компании могут получить новое понимание и виденье бизнеса. IBM Watson Content Analytics объединяет все данные из структурированных и неструктурированных источников и позволяет совершать поиск по всему массиву данных. Благодаря интерфейсу информационного средства конечный пользователь может легко найти и проанализировать нужные ему документы, связи, срезы и прочее.

IBM Watson Content Analytics позволяет выявлять факты на основе анализа контента. Анализ этих фактов позволяет принимать обоснованные решения, выявлять информацию о трендах, шаблонах и взаимосвязях, позволяющую проводить более качественный бизнес-анализ и улучшающую управление делопроизводством. В его функции также входит просмотр и импорт содержимого, осуществление синтаксического разбора и анализа содержимого и создание пригодного для поиска индекса. IBM Watson Content Analytics помогает анализировать текст во всех данных и делать эти данные доступными для анализа и выработки оптимальных решений. Платформа позволяет в интерактивном режиме исследовать данные из разных срезов (фасетов) и находить взаимосвязи между различными значениями в срезах и аномалии значений. Удобный интерфейс поиска обеспечивает быстрое получение нужных документов из ранжированного списка результатов путем выполнения запросов к индексу.

Система просматривает контент, после чего документы и записи передаются на аналитический конвейер IBM Watson Content Analytics. Все существующие в документах элементы преобразуются в текст, и над ними совершается ряд действий, помогающий обработать и проанализировать их. На каждом этапе анализа к содержимому элемента добавляются новые комментарии, и выполняется извлечение смысла из элемента.

В системе имеется мощный набор аннотаторов для извлечения смысла из содержимого и для добавления комментариев. Задачи, которые выполняют аннотаторы:

· Определяют язык элементов;

· Определяют кодировку символов в элементах;

· Определяют части речи слов элементов;

· Определяют группы слов, например смысловые пары (прилагательное-существительное);

· Извлекают из документов элементы с именами, например местонахождение, сотрудники, организации;

· Определяют пользовательские шаблоны на основе регулярных выражений;

· Находят релевантные термины в пользовательских словарях, например поиск названий брендов.

Кроме извлекаемых данных, с помощью аннотаторов, имеются еще метаданные или другие структурированные элементы, заранее связанные с содержимым, такие как даты, ключевые слова, атрибуты или элементы XML. Для каждого элемента содержимого извлекаемые элементы данных и существовавшие ранее элементы метаданных объединяются в один набор фасет.

Фасет - ограниченная совокупность однородных значений по некоторому классификационному признаку, то есть это та информация, которую добыли нам аннотаторы, т.е. привязки к различным объектам. Фасеты позволяют организовывать или классифицировать содержимое таким образом, чтобы пользователи могли углубляться в коллекции документов и перемещаться по ним различными путями, каждый из которых является отдельным представлением или проекцией содержимого.

Программа анализа данных позволяет изучать фасеты своего набора содержимого. С помощью данного инструмента в режиме реального времени можно применять фасеты для поиска нужной информации в документах и изучать результаты по каждому фасету в отдельности.

Пользовательский интерфейс программы анализа содержимого может показывать тенденции и аномалии набора содержимого в разных представлениях.

Многие из этих статистических методов строятся на том, как часто появляется значение того или иного фасета. Например, они могут показывать рост числа ссылок на отдельный продукт-конкурент в протоколах колл-центра за определенное время. Или позволяют при контроле или изучении заметить, что некие люди часто используют отдельное сокращение или слово. Такой первичный частотный анализ может быть полезен для быстрого определения горячих терминов или тем.

Программа анализа содержимого выполняет дальнейшую обработку, предоставляя пользователю частотные данные, которые представляют реальную ценность. В вышеприведенном примере аудита тот факт, что термин часто используется человеком, сам по себе не говорит о важности термина. Важнее знать, использует ли этот человек данный термин чаще других людей. При наличии корреляционных оценок, рассчитанных программой анализа содержимого, можно быстро выявить такие аномалии, даже если частота их невелика.

3.2.2 Компоненты системы

Компоненты системы IBM Watson Content Analytics собирают данные из ряда источников, выполняют синтаксический анализ текста, выявляют смысл полученной информации, создают индекс, к которому будут обращаться пользователи с запросами.

Собрание - это набор источников данных, в которых конечные пользователи могут выполнять аналитические исследования при помощи запросов. При создании собрания в первую очередь необходимо задать источники данных (среди которых необходимо совершать поиск). Следующий шаг, которые необходимо совершить - конфигурация опций для того чтобы запросы пользователей успешно выполнялись.

В системе можно создавать неограниченно количество собраний, каждое из которых может быть направленно на отдельные сегменты анализа. Например, одно собрание может анализировать русскоязычные источники (сайты), а второе - англоязычные. Такое разделение может понадобиться крупным международным корпорациям, для понимания специфики каждого их рынка.

При создании собрания необходимо задать его тип. Существует всего два типа собраний:

· Собрание поисковой системы предприятия. Данный тип собрания включает в себя поиск и получение данных, возможность настройки фасетов, сортировка документов по дате или по их релевантности.

· Собрание для анализа контента. Данный тип собрания включает в себя все опции предыдущего типа, но имеет более глубокую аналитику, поддерживается функция исследования контента. Также существует опция экспорта данных из системы для дальнейшего анализа.

3.2.2.1 Сбор данных

Сбор данных осуществляется с помощью компонента искателя. Данный компонент собирает документы из заданных источников либо по установленному расписанию, либо непрерывно. Чем чаще искатель обновляет базу документов, тем более актуальная информация будет у конечного пользователя для анализа. Документы можно не только искать по заданным источникам, но и импортировать свои данные в формате CSV (comma-separated value).

Искатели - компонент собрания сбора данных. Искатели собирают из заданных источников данных документы, для последующего выполнения анализа, индексации, поиска и исследования. Пока не будут заданы искатели данных, аналитическая система не начнет свою работу.

В одном собрании может быть несколько различных искателей. При этом каждый искатель используется для сбора данных из различного типа источников. Например, можно создать несколько источников, чтобы в одном собрании были документы из баз данных, файловых систем и почты. Или же можно создать несколько искателей одного и того же типа, но настроить расписание таким образом, чтобы самые главные источники обновлялись каждый час, а побочные раз в два дня.

Свойства искателя - набор правил, которые регулируют поведение каждого заданного искателя во время поиска новых документов и повторного просмотра выбранных документов. Главное свойство каждого искателя - это пространство искателя, где указываются конкретные места для поиска документов.

Все свойства можно корректировать в любой момент. Например, можно отредактировать расписания поиска, добавить или удалить источники данных.

3.2.2.2 Анализ данных

Анализ данных осуществляется с помощью аналитического конвейера, который сначала извлекает текс из документов, затем выполняет лингвистический анализ документа, выделяет значимые слова и словосочетания, извлекает объекты и осуществляет пользовательский анализ для всех документов. При таком анализе документов создаются специальные фасеты, при помощи которых исследование содержимого становится возможным.

Анализаторы данных, обработчики документов и аннотаторы анализируют документы, которые собрал искатель и подготавливает их для дальнейшего индексирования.

Задачи обработки документа:

· Определение кодировки всех найденных документов. Выполнение данной задачи необходимо, так как весь текст будет преобразован в Unicode, чтобы можно было начать выполнять лингвистический анализ.

· Определение языка каждого найденного документа.

· Извлечение текста из любого формата документа(XML, HTML, DOC, PDF и т.д.)

· Извлечение текста и добавление маркеров для того, чтобы облегчить процессы извлечения и исследования данных.

o Нормализация символов (например, перевод символов в верхний регистр);

o Анализ структуры слов, предложений абзацев и пробелов. Используя лингвистический анализ, происходит разбивка текста на отдельные слова и фразы, назначаются маркеры, позволяющие в дальнейшем просматривать отдельные слова и их синонимы.

· Применение правил, заданных пользователем. Например, создание собственных фасетов на этапе анализа текста, позволяет системе сразу индексировать весь массив данных, не только используя собственные инструменты анализа, но и включая пользовательскую потребность.

3.2.2.3 Индексация данных

Индексация данных осуществляется с помощью компонентов индекса. Данный компонент постоянно пополняет информацию о всех изменениях документа и вносит ее в индекс данного документа. Также, данные компоненты совершают глобальный анализ всех документов собрания, для обнаружения повторяющихся документов и для определения степени корреляции. В собрании анализа данных можно создать собственный индекс для фасетов.

По завершении синтаксического и лексического анализа документов, процессы индексации каждый раз добавляют в индексы информацию о измененных, новых и удаленных документах. Таким образом, конечный пользователь всегда имеет самую актуальную информацию.

Когда идет построение индекса, всегда выполняется глобальный анализ документов. Во время выполнения данного процесса применяются алгоритмы для анализа структуры ссылок документов, поиск и идентификация повторяющихся документов.

При создании собрания поисковой системы предприятия можно выбрать создание нескольких разделов индекса. Собрания анализа контента автоматически создаются, как многораздельные. Использование разделов помогает системе выполнять балансировку обработки миллионов документов, распределяя ее по нескольким разделам, так что в каждом разделе обрабатывается примерно равное число документов. Доступ к разделам происходит так же, как если бы все они были одним индексом.

При конфигурировании собрания есть возможность выбора опции для следующих операций процесса индексирования:

· разрешить пользователям использовать в запросах символы подстановки. Символ подстановки может быть неограниченным, а может быть разрешен только в последней позиции.

· сконфигурировать области действия. Область действия позволяет ограничить данные, которые пользователи могут просмотреть в собрании. Например, можно создать одну область действия, включив в нее все идентификаторы URI для документов из вашего технического отдела, а в другую область действия - URI документов из отдела кадров. Если ваша программа поддерживает области действия, пользователи смогут выполнять поиск документов и получать их только из этих поднаборов документов в собрании.

· задать опции для объединения в результатах поиска документов с одинаковым префиксом URI. Можно также задать имя группы, чтобы в результатах можно было объединять документы с разными префиксами URI.

· После построения индекса можно удалить URI, для которых пользователи не должны выполнять поиск или исследование.

3.2.2.4 Поиск и исследование содержимого

Поиск и исследование содержимого обеспечивает поиск конкретных документов, критериев, данных и изучение содержимого с целью обнаружения взаимосвязей.

Встроенные процессы поиска обрабатывают запросы пользователей, выполняют поиск по актуальному индексу и возвращают результаты.

Настраивая поиск для собрания, можно задать следующие параметры:

· Конфигурация кэша поиска для хранения запросов, которые выполняются чаще всего. Это поможет повысить производительность поиска и скорость получения документов.

· Связывание словарей с собраниями, например, на моменте поиска можно привязать словари синонимов, для того чтобы документы, содержащие синонимы терминов запроса, включаются в результаты.

· Конфигурация поддержки опережающего ввода. Когда пользователь будет вводить запрос в строку поиска, срезу будут видны предложения потенциально соответствующих слов и терминов данного запроса. Выбрав один из предложенных вариантов системы можно быстро запустить запрос.

3.2.3 Консоли системы

У информационного средства IBM Watson Content Analytics существует несколько консолей - отдельных окон для ввода данных. В данной работе мы остановимся только на тех, которые будут использоваться для ее выполнения:

· Административная консоль;

· Аналитическая программа исследования содержимого.

Административная консоль запускается в браузере, давая возможность пользователям администраторам обращаться к ней в любое время и из любого места.

Консоль администратора содержит мастера, помогающие выполнять некоторые основные задачи управления. Например, мастера искателя (отдельные для каждого из типов источников данных) помогают выбрать источники, которые вы хотите сделать доступными для поиска.

Для других задач администрирования инструментальные панели позволяют быстро найти и открыть конкретную часть системы, для которой требуется администрирование или мониторинг. Например:

· В представлении Собрания можно сконфигурировать опции просмотра искателем, синтаксического анализатора, индексации и поиска в содержимом, после чего следить за ходом выполнения каждого из этих процессов.

· В представлении Функции можно администрировать пакеты функций. Пакет функций содержит заранее заданные параметры конфигурации собрания, предназначенные, как правило, для определенной цели или отрасли.

· В представлении Система можно просмотреть топологию, добавить и удалить серверы и сконфигурировать общесистемные элементы управления, например, файлы журналов для сообщений системного уровня.

· В представлении Защита можно сконфигурировать опции управления, например, для ограничения доступа к прикладным программам, консоли администрирования и собраниям

Программа анализа содержимого позволяет исследовать контент, созданного собрания. Для исследования можно использовать только одно собрание. Программа содержит в себе различные методы анализа контента, которые доступны пользователям.

Данная программа предлагает несколько способов изучения, анализа и сравнения всей информации в собрании. Такая информация полезна для понимания данных предприятия. Например, на основе результатов анализа можно улучшить процесс принятия решений, обеспечить более эффективную и действенную поддержку клиентов, определять конкурентную прочность и недостатки или выявлять возможные проблемы, прежде чем они появятся. С помощью анализа контента можно выполнять поиск в ресурсах предприятия и составлять правильное представление, основываясь на результатах поиска.

Программа анализа содержимого поддерживает простой поиск по ключевым словам и сложный синтаксис запросов. По окончании поиска в собрании пользователь выбирает разные представления для дальнейшего анализа и просмотра зависимостей между результатами. Просматривая результаты поиска, можно многократно уточнять запрос, детализируя отдельные элементы, а также расширять или сужать набор документов, на которые необходимо обратить внимание.

Для облегчения анализа результатов лингвистической обработки и текстового анализа IBM Watson Content Analytics организует и классифицирует документами, имеющие подобные шаблоны или содержимое. Фасеты представляют различные аспекты или измерения документов в вашем собрании. Некоторые фасеты строятся как иерархические и содержат один или несколько уровней субфасетов. Например, у фасета завода-изготовителя автомобилей субфасеты будут представлять разные модели автомобилей, года выпуска и города- изготовители.

Каждый фасет связан с одним или несколькими значениями. Значения фасета - это обычно слова и словосочетания, извлеченные из вашего текстового содержимого. Значения фасета могут быть также получены из структурированных полей, таких как поля дат или числовые поля.

Фасеты обеспечивают механизм навигации и анализа вашего содержимого в программе анализа содержимого. В собрании для анализа контента фасеты нужно выбирать для поиска в содержимом. В режиме реального времени можно выполнять поиск по всем фасетам с целью изучения результатов анализа, взаимосвязей и изменения различных фасетов содержимого с течением времени.

3.2.4 Установка и настройка IBM Watson Content Analytics

Для начала необходимо выбрать предпочтительную конфигурацию системы. Всего их существует две:

· Установка на одном сервере - все функции будут выполняться одной машиной (искатель, анализ, индекс и поиск);

· Установка в распределенной среде - каждая функция выполняется на отдельном сервере.

Для данной работы подойдет конфигурация системы на одном сервере (рисунок 6), так как портфолио брендов не очень большое, а количество пользователей системы ограничено и не будет превышать 10 человек.

Рисунок 6. Схема установки системы на одном сервере.

В качестве операционной системы была выбрана Windows, так как по политике компании именно данная операционная система устанавливается на все устройства.

Необходимо убедится, что информационное средство IBM Watson Content Analytics будет установлено на главном сервере пользователем администратором. Пользователь, у которого отсутствуют права администратора, не может ни устанавливать информационную систему, ни использовать консоль администратора.

У пользователя администратора обязательно должны быть следующие права:

· Работа в режиме операционной системы;

· Закрепление страниц в памяти;

· Создание маркерного объекта;

· Замена маркера уровня процесса;

· Имитация клиента после аутентификации;

· Увеличение квот;

· Вход в качестве службы.

После проверки прав доступа, можно приступать к установке программы. При установке программы необходимо будет ввести следующие данные: полное имя хоста, имя и пароль администратора, тип сервера: все на одном сервере (рисунок 7). Нажимаем установить и процесс установки информационного средства начинается.

Рисунок 7. Опции установки IBM Watson Content Analytics

После установки серверу необходимо будет перезагрузиться. После перезагрузки необходимо будет зайти под пользователем администратором в учетную запись, и начнется автоматически открывается стартовое окно IBM Watson Content Analytics, которое называется «Первые шаги» (рисунок 8).

Рисунок 8. Стартовый экран «Первые шаги»

Первым шагом к началу работы с анализом данных является запуск сервера - первая строчка на рисунке 13. Как только начнется процесс запуске всех компонентов сервера, появится новое диалоговое окно, в котором будут отображаться действия, которые нужны для запуска сервера. Если последняя строчка в диалоговом окне следующая: «Все службы, требуемые для использования системы, запущены», то это значит, что установка прошла успешно и можно пользоваться средствами IBM Watson Content Analytics (рисунок 9).

Рисунок 9. Успешный запуск сервера

После успешного запуска сервера становятся доступными все опции на экране «Первые шаги»:

· Посмотреть документацию - откроется центр знаний IBM;

· Проверить установку - все ли элементы программы успешно установлены;

· Учебник по анализу контента - готовый пример по анализу контента, с уже созданным собранием, источниками данных и фасетами.

· Консоль администратора - конфигурация собраний.

· Программа поисковой системы предприятия.

· Аналитическая программа исследования содержимого.

3.2.5 Создание собрания

Первый шаг к анализу данных - это создание собрания. Для того чтобы создать собрание необходимо запустить «Консоль администратора» в меню «Первые шаги». Консоль администратора откроется в браузере и появится окно входа, в котором необходимо авторизоваться с помощью логина и пароля администратора (рисунок 10).

Рисунок 10. Вход в консоль администратора

Когда вход в консоль администратора совершен, перед пользователем появляется окно, как на рисунке 11.

Рисунок 11. Консоль администратора

Чтобы создать собрание, необходимо кликнуть на кнопку в левом верхнем углу «Создать собрание», после чего появится окно, изображенное на рисунке 12. В общих параметрах собрания необходимо обязательно задать имя собрания и тип собрания. В рамках данной работы собрание будет названо CotyBrands, тип собрания - собрание для анализа контента. После завершения установки параметров, необходимо кликнуть на кнопку «ОК» и собрание будет успешно создано.

Рисунок 12. Параметры собрания

По завершению установки параметров, необходимо кликнуть на кнопку «ОК», после чего собрание будет успешно создано и появится на панели главной страницы косили администратора (рисунок 13).

Рисунок 13. Созданные собрания

3.2.6 Настройка сбора данных

3.2.6.1 Создание искателя

Для поиска документов, на основе которых будет строиться анализ данных, необходимо задать источники данных. Для того чтобы задать конкретные ссылки, из которых необходимо выделить документы используется искатель.

Чтобы добавить новый искатель к собранию, необходимо кликнуть на знак плюс в верхнем правом углу искателя (рисунок 14).

Рисунок 14. Создание искателя

В следующем окне создания искателя необходимо задать тип искателя. В контексте данной работы необходимый тип искателя - веб (рисунок 15), так как необходимо использовать прямые ссылки на интересующие старицы в социальных сетях. После выбора типа, необходимо кликнуть на кнопку «Далее».

Рисунок 15. Выбор типа искателя

После того как откроется окно свойств веб-искателя, необходимо заполнить следующие обязательные поля: имя искателя, адрес электронной почты для комментариев по поводу искателя, пользовательский агент. Пример заполнения свойств одного из искателей для данной работы предоставлен на рисунке 16.

Рисунок 16. Свойства веб-искателя

Следующий шаг по созданию веб-искателя - это указание списка начальных URL адресов. На рисунке 17 показано, что в искатель «Facebook» был добавлен перечень веб-страниц социальной сети facebook. Полный перечень веб-страниц находится в приложении 1.

Рисунок 17. Пространство для веб-искателя

На следующем шаге необходимо задать правила для просмотра искателя доменов. Существуют 3 вида правил, используемых системой:

· forbid domain www.ibm.com (исключает весь домен);

· allow domain *.ibm.com (разрешает просмотр всех доменов, оканчивающихся на ibm.com);

· allow domain server*.ibm.com:443 (разрешает просмотр только для порта 443 в доменах IBM, начинающихся с "server").

По умолчанию задается правило разрешающее просмотр всего домена, заданного на предыдущем шаге и исключает, все остальные домены (рисунок 18). Для продолжения создания искателя, необходимо кликнуть «Далее».

Рисунок 18. Правила для просмотра доменов

На следующем шаге можно проверить способность искателя соединятся с адресами URL при помощи пользовательского агента, сконфигурированного для этого искателя. Кликнув на копку «Проверить» появится отчет как на рисунке 19 по каждому URL, заданному данному искателю. Убедившись, что напротив каждого типа проверки в поле решение стоит галочка, можно кликать на кнопку «Готово».

Рисунок 19. Отчет проверки URL

На главном окне собрания в разделе искатели появится новый источник - Facebook. Чтобы запустить поиск данных со страниц Facebook необходимо кликнуть на кнопку «Play» выделенную на рисунке 20.

Рисунок 20. Запуск поиска документов

Когда в анализе и индексе данных появится информация о количестве найденных документов, можно будет начинать анализ данных.

Рисунок 21. Количество найденных документов

3.2.6.2 Импорт документов

Для решения поставленной задачи была создана тестовая база, в которую были собраны отзывы или упоминания о продуктах в социальных сетях Вконтакте и Fecebook. База представляет из себя таблицу со следующей информацией:

· Profile - аккаунт человека, оставившего отзыв на продукт;

· FIO - фамилия и имя, заданные в социальных сетях.

· City - город, указанный в профиле пользователя.

· Sex - пол, указанный в профиле пользователя.

· Age - возраст, указанный в профиле пользователя.

· Review - текст отзыва, на основе которого будет строится анализ.

· Job - место работы, заданное в социальных сетях.

· Source - социальная сеть, из которой были взяты данные.

Всего в тестовой базе содержится 1 571 документ, что является достаточной выборкой для проведения анализа и определения целевой аудитории, нужных категорий продуктов.

При подготовке базы для загрузки в IBM Watson Content Analytics необходимо проделать следующие шаги:

1) Сформировать заполненную базу (как на рисунке 25);

2) Сохранить базу в формате CSV (разделители-запятые);

3) Название файла должно быть на латинице и без пробелов;

4) Желательно, чтобы весь путь к файлу был на латинице.

Далее в Консоли Администратора на странице собрания в блоке просмотр искателем и импорт необходимо кликнуть на знак плюса в подблоке Импорт, выделено на рисунке 22.

Рисунок 22. Импорт файлов

На следующем экране необходимо указать импортируемые файлы, в формате CSV. Так как файл находится на том же устройстве, что и информационное средство IBM Watson Content Analytics, то необходимо выбрать Локальный путь к файлу, кликнуть обзор и выбрать необходимый файл для загрузки.

Следующее окно служит для указания опций по чтению исходного файла. Можно изменит кодировку файла, задать разделители, задать какую-либо строку как заголовки. В блоке предварительного просмотра отображается, как будет выглядеть файл в системе с учетом примененных опций. С такими исходными данными будет очень сложно работать.

Для того, чтобы файл стал нужного вида для анализа, необходимо применить следующие опции:

· Кодовый набор символов: windows-1251;

· Разделитель: запятая и точка с запятой;

· Начальный номер строки: 1;

· Включить: читать начальную строку как заголовок, включающий поддержку отображения имен столбцов на поле индекса.

После применения вышеперечисленных опций, файл в системе, необходимо кликнуть Далее для перехода в следующее око настроек.

В окне Импортируемые столбцы необходимо выбрать те данные, по которым должен осуществляться поиск. Столбцы выбираются в колонке «Импорт». Свойства и опции, которые можно применить к выбранным столбцам:

· Столбец - Содержит внутреннее имя этого столбца, это значение нельзя изменить.

· Имя поля индекса - для создания нового имени индекса, необходимо выбрать «Новый» в списке имен, после чего станет доступным для ввода соседнее поле, где вводится новое поле индекса.

· Возвращаемый - при включении данной опции, пользователи смогут просматривать данные столбца в результатах поиска.

· Поиск на основе фасетов - при включении данной опции, выбранный столбец будет использоваться в качестве фасета.

· Свободный текстовый поиск - при включении данной опции пользователи смогут выполнять поиск при помощи свободных запросов. В отличие от поиска по явно заданным именам столбцов, свободный текстовый запрос позволяет выполнять поиск по всему доступному для поиска содержимому в соответствии с критерием поиска.

· Поиск по полю - при включении данной опции пользователи смогут выполнять поиск, задавая в запросе имя столбца. Запросы поиска для конкретного столбца дают более точные результаты, чем свободные текстовые запросы.

· Точное совпадение - при включении данной опции поиск будет рассматривать только указанные формы слов.

· С учетом регистра - при включении данной опции поиск будет регистрозависимым.

· С возможностью сортировки текста - при включении данной опции пользователи смогут делать сортировку по указанному столбцу.

· Пригодные для анализа - при включении данной опции будет разрешен анализ столбца с помощью аннотатора UIMA (архитектура управления неструктурированной информацией) и сохранение в индексе в форме аннотации. Аннотации служат для анализа содержимого и дают возможность пользователям исследовать отклонения, тенденции, частоты и взаимозависимости между документами с течением времени.

Для импорта тестовой базы были включены следующие опции для всех столбцов: имя поля индекса, возврашаемы, поиск на основе фасетов, свободный текстовый поиск, поиск по полю, с возможностью сортировки текста и пригодные для анализа. После выбора всех необходимых для решения задачи опции необходимо кликнуть готово и вернутся на главный экран собрания.

Спустя несколько минут будет видно, что необходимые документы импортированы, проиндексированы и отправлены на анализ.

3.2.7 Определение целевой аудитории

Для анализа данных необходимо запустить Аналитическую программу исследования содержимого из окна «Первые шаги».

Первым делом необходимо проверить, что запущено нужное собрание в правом верхнем углу. Затем, необходимо проверить, что все импортируемые документы отображаются в системе - это видно в строке поиска и в строчке «Результаты». Также, необходимо проверить, что фасеты из столбцов успешно созданы в системе. Загрузка тестовой базы и настройка системы прошла успешно, соответственно можно переходить к решению задачи.

Определение целевой аудитории будет проходить для следующих категорий товара:

· Lasting Finish lipstick

· Miracle Gel

· Get Ready!

· Pure Game

· Ice Dive

· 60 seconds nail polish

· Lasting Finish lipstick

· Wonderful mascara

· Hard As Nails Xtreme Wear

· Polish Remover

Критерии для определения целевой аудитории:

· Пол;

· Возраст;

· Местоположение;

· Уровень дохода.

Определение целевой аудитории для категории Rimmel Lasting Finish Lipstick

Для начала необходимо определить количество документов содержащих название данной помады. Для этого в строке поиска необходимо набрать название категории товара. Получилось 524 результата.

Определить целевую аудиторию товаров можно с помощью созданных ранее фасетов. Для этого необходимо перейти из окна документы в окно фасеты.

Определение пола

Для определения пола целевой аудитории, необходимо слева в списке выбрать фасет «пол».

IBM Watson Content Analytics моментально строит сводную таблицу по заданной в поисковой строке категории и выбранному срезу данных, и показывает частоту упоминаний по каждому срезу данных.

Получается, что категория товара Rimmel Lasting Finish упоминается у лиц женского пола 516 раз, а у лиц мужского пола всего 8 раз, следовательно, основные пользователи категории Lasting Finish - женщины.

Определение возраста.

Для определения возраста целевой аудитории, необходимо слева в списке выбрать фасет «возраст». Система строит сводную таблицу и, в результате, возраст целевой аудитории для помады, получается от 21 до 35 лет.

Определение местоположения.

Для определения местоположения целевой аудитории, необходимо слева в списке выбрать фасет «город». Система строит сводную таблицу и, в результате, основная часть пользователей проживает в крупных городах, таких как Москва, Новосибирск и Санкт-Петербург.

Определение уровня дохода.

Для определения уровня дохода целевой аудитории, необходимо слева в списке выбрать фасет «работа». Система строит сводную таблицу. Получается, что часто встречающаяся профессия пользователей губной помады Rimmel это аналитики, но стоит заметить, что только 10% пользователей указали свой род деятельности. Тем не менее, посмотрев на список профессий, можно сделать вывод, что уровень дохода у целевой аудитории помады - средний.

Целевая аудитория Rimmel Lasting Finish:

· Пол: женский;

· Возраст: 21-35 лет;

· Местоположение: Москва, Новосибирск, Санкт-Петербург;

· Уровень дохода: средний.

Определение целевой аудитории для категории Sally Hansen Hard as Nails

Количество документов, содержащих название категории: 109.

Определение пола.

Для определения пола целевой аудитории, необходимо слева в списке выбрать фасет «пол». Получается, что категория товара Hard as Nails упоминается только у лиц женского пола.

Определение возраста.

Для определения возраста целевой аудитории, необходимо слева в списке выбрать фасет «возраст». Система строит сводную таблицу и, в результате, возраст целевой аудитории для Hard as Nails, получается, от 21 до 24 и от 31 до 35 лет.

Определение местоположения.

Для определения местоположения целевой аудитории, необходимо слева в списке выбрать фасет «город». Система строит сводную таблицу и, в результате, основная часть пользователей проживает в крупных городах, таких как Москва, Новосибирск, Казань и Нижний Новгород.

Определение уровня дохода.

Для определения уровня дохода целевой аудитории, необходимо слева в списке выбрать фасет «работа». Система строит сводную таблицу. Получается, что часто встречающаяся профессия пользователей лаков Hard as Nails это аналитики, но стоит заметить, что только 22% пользователей указали свой род деятельности. Тем не менее, посмотрев на список профессий, можно сделать вывод, что уровень дохода у целевой аудитории помады - средний.

Целевая аудитория Sally Hansen Hard as Nails:

· Пол: женский;

· Возраст: 21-24 и 31-35;

· Местоположение: Москва, Новосибирск, Казань и Нижний Новгород;

· Уровень дохода: средний.

Таким образом, был проведен анализ целевой аудитории по всем выбранным категориям товаров. Сводные результаты в таблице 8.

Таблица 8. Целевая аудитория товаров компании ООО «Коти Бьюти»

Категория

Количество Документов

Пол

Возраст

Местоположение

Уровень Дохода

Lasting Finish lipstick

524

женский

21-35

Москва, Новосибирск, Санкт-Петербург

средний

Miracle Gel

26

женский

21-30

Новосибирск, Москва, Казань

высокий

Get Ready!

58

женский 65% мужской 25%

16-35

Москва, Новосибирск

высокий

Pure Game

328

женский

16-35

Москва, Санкт-Петербург

средний

Ice Dive

228

мужской

21-35

Новосибирск, Москва, Нижний Новгород

средний

60 seconds nail polish

26

женский

21-24

Новосибирск, Екатиренбург, Казань

низкий

Wonderful mascara

61

женский

21-35

Москва, Новосибирск, Нижний Новгород

высокий

Hard As Nails Xtreme Wear

109

женский

21-24 и 31-35

Москва, Новосибирск, Казань, Нижний Новгород

средний

Polish Remover

104

женский

16-35

Москва, Новосибирск

средний

Анализ, проведенный по девяти самым продаваемым категориям товаров компании ООО «Коти Бьюти», показал насколько разнородная целевая аудитория внутри брендов.

Если взять ядро целевой аудитории бренда Rimmel, то это женщины от 21 до 35 лет, проживающие в Москве и Санкт-Петербурге. Если посмотреть на проанализированные категории бренда Rimmel, то получается, что Lasting Finish lipstick и Wonderful mascara действительно интересует женщин от 21 до 35 лет, но расширится информация о местоположении целевой аудитории, так как добавятся Нижний Новгород и Новосибирск.

Касательно категории Rimmel 60 seconds nail polish - лаки низкой ценовой категории маленького объема, то возраст целевой аудитории данной категории будет от 21 до 24 лет, что явно уже, чем ядро Rimmel. Поэтому, если бы для рекламы данной категории было бы применено ядро, то она была бы в большей части направлена не на реальную целевую аудиторию данного продукта, а на людей, которым интересен бренд, но не интересна данная категория.

Тем не менее, в целом по категориям бренда Rimmel нет сильных отклонений от целевой аудитории, что позволяет считать правильной настройку и поиск системой.

Помимо этого, ядро целевой аудитории не включает в себя дополнительные параметры - место работы и уровень дохода, а с помощью информационной системы IBM Watson Content Analytics удалось определить и данный критерий целевой аудитории. Например, категория Sally Hansen Miracle Gel обширная по возрасту, но позволить себе купить данную категорию могут только потребители с высоким уровнем дохода, что явно сужает место проведения многих акций и рекламных компаний.

Выявленная целевая аудитория девяти выбранных категорий поможет маркетинговым командам брендов Adidas, Rimmel и Sally Hansen планировать различные акции, телевизионные компании, дни марок, наружную и печатную рекламу. С помощью такой маркетинговой деятельности лояльность бренда будет расти, а так как реклама будет направлена только на интересующихся товаром потребителей, то и прибыль компании будет расти.

Выводы к главе 3

Проведен анализ существующих аналитических информационных систем, которые подошли бы для выполнения поставленной задачи. На основе результатов проведенного анализа принято решение остановиться на информационной системе IBM Watson Content Analytics, так как данная система подходит под большинство требований компании.

Изучив особенности работы IBM Watson Content Analytics, была произведена установка и настройка системы для решения поставленной задачи.

Осуществлен импорт базы документов, содержащий отзывы пользователей социальных сетей, на основе которой будет строиться дальнейший анализ.

Созданы фасеты, с помощью которых становится возможным определение целевой аудитории в IBM Watson Content Analytics.

Результатом данной главы является выполнение поставленной цели, а именно определение целевых аудиторий для определенных товаров компании ООО «Коти Бьюти». Выявленные целевые аудитории сверены с ядром целевой аудитории бренда, отклонений от ядра не обнаружено.

Заключение

Целевая аудитория - совокупность потенциальных покупателей рекламируемой продукции. Если определить целевую аудиторию правильно, то можно существенно сократить расходы на рекламу, маркетинговую активность и продвижение бизнеса.

В ходе выполнения работы были детально изучены методы и средства для определения целевой аудитории в социальных сетях на примере основных брендов компании ООО «Коти Бьюти».

В данной работе выполнены следующие ключевые задачи:

· Произведено исследование деятельности компании;

· Выявлен список брендов и категорий, по которым важнее всего правильно определить целевую аудиторию в компании;

· Выбраны социальные сети, вес которых в определении целевой аудитории выше всего (Вконтакте, Facebook);

· Разработаны требования к информационной системе, с помощью которой эффективнее всего будет происходить определение целевой аудитории;

· Разработаны обязательные и желательные критерии для определения целевой аудитории в компании;

· Проведено сравнение информационных систем, соответствующих разработанным требованиям, проведено их сравнение по ряду технических и эксплуатационных показателей. По результатам сравнения выбрано инструментальное средство IBM Watson Content Analytics, котрое по совокупности показателей наилучшим образом подходит для решения поставленной задачи;

· Проанализированы критерии, с помощью которых возможно определение целевой аудитории;

· Определено ядро целевой аудитории для брендов компании;

· Установлено и настроено на решение задачи определения целевой аудитории по выбранным критериям инструментальное средство IBM Watson Content Analytics;

· Проанализировав отзывы из социальных сетей Вконтакте и Facebook, определены целевые аудитории для каждой выбранной категории продуктов.

Список литературы

1) Гольман И.А. Рекламная деятельность: Планирование. Технологии. Организация. - 2-е изд., перераб. и доп. - М., 2009.

2) Информационный центр IBM Content Analytics // Инструкции пользователя по системе IBM Content Analytics. 2016.

3) А.В. Шмид, Б.А. Позин, И.В. Галахов, М.А. Агейкин, Д.О. Александров, М.Р. Касимов, Н.И. Клемашев, Г.А. Ежов. Новые методы работы с большими данными: победные стратегии управления в бизнес-аналитике: Научно-практический сборник. ПАЛЬМИР, 2016. - 528 с.

Размещено на Allbest.ur

...

Подобные документы

  • Определение целевой аудитории. Рекламное сообщение и рекламные мероприятия. Основные факторы, влияющие на клиента. Анализ целевой аудитории на примере издания "Из рук в руки". Социально-демографические характеристики регулярной аудитории издания.

    курсовая работа [792,2 K], добавлен 16.12.2012

  • Теоретические аспекты возможностей и способов использования социальных сетей для продвижения имиджа арт-компании. Методы взаимодействия коммерческого бренда с целевой аудиторией, возможности рекламного таргетирования в социальных сетях и блогосфере.

    дипломная работа [3,5 M], добавлен 13.06.2015

  • Трансформация традиционной модели коммуникации в виртуальной среде. Потребности потенциальных потребителей. Характеристики целевой аудитории, восприятие информации. Каким образом сайт поддерживает или ограничивает проявление реакции целевой аудитории.

    контрольная работа [27,1 K], добавлен 23.05.2013

  • Идея уникального товара. Выбор товарной ниши и целевой аудитории. Основные конкуренты на рынке. Выбор имени бренда. Легенда о фараонах - ремесленниках красоты. Разработка анкеты для выявления ожиданий целевой аудитории. Логотип косметической компании.

    презентация [3,3 M], добавлен 04.01.2013

  • Организация маркетинговой деятельности на предприятии ООО "Коти". Анализ сбытовой деятельности фирмы. SWOT-анализ сильных и слабых сторон предприятия. Оценка процесса маркетингового планирования. Мероприятия по совершенствованию работы с потребителями.

    курсовая работа [271,8 K], добавлен 28.03.2012

  • Общая характеристика деятельности предприятия. Направления ассортимента продукции. Сравнительная характеристика продукции компании и ее конкурентов. Определение целевой аудитории. Определение целей и плана распространения рекламы, ее эффективность.

    курсовая работа [74,9 K], добавлен 13.12.2011

  • Имиджевая реклама в системе средств коммуникации. Разработка сценария имиджевого рекламного ролика для канцелярской продукции с учетом особенностей торговой марки и ее целевой аудитории. Анализ целевой аудитории как основа разработки имиджевой рекламы.

    курсовая работа [49,0 K], добавлен 07.06.2014

  • Характеристика коммерческой деятельности предприятия. Анализ целевой аудитории рынка систем безопасности. Выбор средств рекламы и критерии медиапланирования. Разработка рекламной кампании для предприятия ООО "Сквид", оценка ее экономической эффективности.

    курсовая работа [530,8 K], добавлен 11.05.2014

  • Роль формирования маркетинговой деятельности на производственном предприятии. Изучение отдельных аспектов маркетинговой деятельности предприятия ЗАО "Очаково": анализ рынка пивоваренной продукции, конкурентоспособности фирмы, целевой аудитории компании.

    курсовая работа [1,1 M], добавлен 30.11.2011

  • Алгоритм подготовки и проведения рекламной компании. Анализ коммерческой ситуации. Определение задач маркетинга и рекламы. Разработка концепции товара, определение целевой аудитории и выбор рекламной стратегии. Определение экономической эффективности.

    контрольная работа [30,9 K], добавлен 15.12.2011

  • Реклама как явление общественной жизни. Регулирование рекламной деятельности. Анализ деятельности компании "qWell.region". Анализ конкурентной среды. Анализ целевой аудитории и принципы выбора рекламных средств. Годовой график рекламы и ее эффективность.

    дипломная работа [657,8 K], добавлен 11.01.2012

  • Определение основных коммуникационных целей рекламирования. Характеристика целевой аудитории рекламного воздействия. Выявление и описание конкурентных преимуществ товара фирмы, определение его основополагающих черт имиджа и характерных особенностей.

    курсовая работа [1,7 M], добавлен 08.06.2013

  • Маркетинговая сущность рекламы, ее значение, классификация и оценка состояния рынка. Принципиальные основы рекламной компании, формулировка ее цели и разработка бюджета. Особенности процесса выбора целевой аудитории и средств продвижения товара.

    курсовая работа [57,4 K], добавлен 20.02.2012

  • Теоретико-методологические ориентиры в изучении социальных сетей в информационном обществе. Концептуальные рамки понятия "информационного общества". Процесс институционализации социальных сетей. Маркетинговые модели монетизации социальных сетей.

    дипломная работа [135,1 K], добавлен 30.09.2017

  • Основная цель Public relations - установление контакта с общественностью. Четыре важные особенности массовой аудитории. Осознание проблемы и ограничений, уровень включенности активной аудитории в проблемную ситуацию. Критерии типологизации общественности.

    курсовая работа [53,5 K], добавлен 12.03.2011

  • Понятие и задачи маркетинга в социальных сетях как инновационная форма продвижения товаров и услуг. Анализ системы продвижения компании и разработка мероприятий по продвижению компании с помощью социальных сетей. Совершенствования системы продвижения.

    курсовая работа [432,2 K], добавлен 24.09.2019

  • Разработка и проведение маркетингового исследования целевой аудитории ночного клуба "R99". Определение отношения посетителей к клубу и проводимым в нем мероприятиям. Изучение эффективности различных рекламных методов и отношения посетителей к уровню цен.

    отчет по практике [100,8 K], добавлен 28.11.2010

  • Краткая характеристика и организационная структура предприятия. Анализ организационно-управленческой деятельности РА "Pride". Определение целевой аудитории и сегментация рынка. Распределение рекламного бюджета и выбор средств распространения рекламы.

    отчет по практике [176,9 K], добавлен 14.11.2013

  • Типология интегрирования социальных элементов в разные виды коммуникации. Преимущества и недостатки интеграции коммерческой рекламы. Развитие бренда в условиях применения социальных качеств. Исследование рынка, ценовой политики, целевой аудитории.

    контрольная работа [29,6 K], добавлен 27.12.2016

  • Телевидение, как наиболее эффективный канал распространения рекламного сообщения. Исследование вербальных и невербальных средств воздействия на зрителя с помощью телевизионных рекламных роликов. Специфика целевой аудитории рекламы компании Bee Line.

    курсовая работа [40,1 K], добавлен 16.05.2012

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.