Оценка спроса на мобильные приложения

История, классификация и анализ рынка мобильных приложений. Методы экономической оценки спроса. Характеристика, особенности методов исследования рынка мобильных приложений и аналогичных рынков в научных статья зарубежных и отечественных публикаций.

Рубрика Маркетинг, реклама и торговля
Вид дипломная работа
Язык русский
Дата добавления 13.02.2016
Размер файла 2,6 M

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

8.394548

2.562162

1.226433

C

2566015.

3.806204

NA

В первую очередь, надо уточнить, что объясняющая переменная all5 отображает общее количество высших оценок (рейтинг), поставленных покупателями. В целях исследования были для стандарта выведены средний общий и текущий рейтинг, но поскольку выборка, участвующая в анализе, образована топом скачиваемых приложений, т.е. органично заметить, что у некоторых приложений средний рейтинг отличается на несколько сотых (общая величина в среднем превосходит 4,5), поэтому в регрессию она не включена. А переменная all5 показывает, как общее увеличение отличных отметок влияет на скачивания. Насчет одновременного влияния (возможно ли влияние самих загрузок на рейтинг) объяснение приведено в части 2 «Регрессия с инструментальными переменными».

Исходя из предварительного анализа, из большого количества различных категорий мобильных приложений для регрессии были созданы лишь 4 категории: Games (поскольку это более 50% выборки), Social Networking и Health&Fitness (было замечено сильное влияние на объем загрузок), а за эталон взяты все остальные категории под наименованием `Other'. Оказалось, что Social Networking и Health&Fitness имеют лишь по одному приложению в категории, WhatsApp Messenger и Smart Alarm Clock: sleep cycles and noise recording, соответственно.

· WhatsApp Messenger -- это межплатформенное приложение обмена сообщениями между мобильными устройствами, с помощью которого можно обмениваться сообщениями и при этом не платить за SMS. Приложение WhatsApp Messenger доступно для iPhone, BlackBerry, Android, Nokia S40, Nokia Symbian и Windows Phone, и все эти телефоны могут отправлять сообщения друг другу. Приложением используется тот же тарифный план для Интернета (3G или Wi-Fi), который вы используете для электронной почты и просмотра веб-страниц, и вам не нужно платить за обмен сообщениями и общение с друзьями. Помимо обмена сообщениями, пользователи приложения WhatsApp могут создавать группы и отправлять друг другу изображения, видеоклипы и звуковые мультимедийные сообщения.

· Smart Alarm Clock: sleep cycles and noise recording - «Умный будильник», который может как усыпить, так и разбудить, но не только он может записать ваш сон, воспроизвести и множество других функций, которых нет у стандартных устройств.

По количеству скачиваний данные приложения достаточно долго держатся на лидирующем уровне, поэтому эти коэффициенты дают значимую оценку. В результате получается, что по сравнению со всеми остальными категориями для приложений WhatsApp Messenger и Smart Alarm Clock: sleep cycles and noise recording увеличение в объеме скачиваний составляет 67 и 74 тыс. раз.

Но старые приложения никому не нужны, рынок быстро растущий, развивающийся и успех бизнеса озадачивает все время поддерживать новизну и обновление устаревшего, поэтому оценка коэффициента при переменной, выражающей время нахождения на рынке в днях отрицательный. А цена на приложения возможно не значима из-за внутренних особенностей рынка: общие устоявшиеся цены (несколько категорий), большинство успешных приложений находятся в самой низкой категории цены, а так же возможен порог выше которого люди не будут заинтересованы покупать приложение, тем более в какой-то доли приобретение каждого малоизвестного приложения - риск, поэтому потребитель будет уменьшать свои издержки.

Поскольку в базовой регрессии объясняющая переменная, характеризующая цены на мобильные приложения, оказалась незначимая, на основе линейной модели проверим значимость каждой категории цены в отдельности, а именно преобразуем ряд цен в фиктивные переменные и включим в регрессию.

Таблица 24 Базовая регрессия с включением каждой категории цены на мобильное приложение (Россия)

Dependent Variable: DOWNLOADS_THIS_MONTH

Method: Least Squares

Sample (adjusted): 1 106

Included observations: 99 after adjustments

White heteroskedasticity-consistent standard errors & covariance

Variable

Coefficient

Std. Error

t-Statistic

Prob.

ALL3

-4.663348

68.85517

-0.067727

0.9462

ALL5

2.776300

1.045457

2.655585

0.0096

APPS_PUBLISHED

-10.01094

17.32878

-0.577706

0.5651

CATEGORY3="Games"

-4349.503

2950.248

-1.474284

0.1445

CATEGORY3="Health and Fitness"

64642.06

4775.391

13.53650

0.0000

CATEGORY3="Social Networking"

48024.16

24221.30

1.982724

0.0510

HAD_FREE_PERIOD

-765.3887

2650.830

-0.288735

0.7736

IS_LOCAL

1982.631

4393.817

0.451232

0.6531

SIZE_MB

11.73597

6.043269

1.941990

0.0558

TIME_IN_MARKET

-11.50809

3.054002

-3.768200

0.0003

PRICE_NEW(1)

-1206.680

684.2144

-1.763600

0.0818

PRICE_NEW(2)

-855.4401

463.6735

-1.844919

0.0689

PRICE_NEW(3)

-224.9476

864.2998

-0.260266

0.7954

PRICE_NEW(4)

-1210.233

479.1961

-2.525549

0.0136

PRICE_NEW(5)

-936.7710

446.0089

-2.100341

0.0390

PRICE_NEW(6)

809.1809

686.7490

1.178277

0.2423

PAID_IN_APP

2308.106

2138.602

1.079259

0.2838

NUMBER_LANG

-4.097890

192.7811

-0.021257

0.9831

ALL4

17.16875

33.94820

0.505734

0.6145

ALL2

-19.55105

141.9644

-0.137718

0.8908

ALL1

-0.408005

33.86443

-0.012048

0.9904

C

22071.92

4901.336

4.503245

0.0000

R-squared

0.774182

Mean dependent var

21454.55

Adjusted R-squared

0.712595

S.D. dependent var

21073.70

S.E. of regression

11297.65

Akaike info criterion

21.69571

Sum squared resid

9.83E+09

Schwarz criterion

22.27240

Log likelihood

-1051.937

Hannan-Quinn criter.

21.92904

Снова для очищения регрессии от лишних переменных проведем F-тест на лишние переменные (probability F-статистики>0.05, следовательно, нулевая гипотеза не отклоняется - это статистически незначимые переменные, которые можно удалить из регрессии):

Таблица 25 F - тест на лишние переменные в линейной модели c ценой как категориальной переменной (Россия)

Redundant Variables: APPS_PUBLISHED NUMBER_LANG PAID_IN_APP

IS_LOCAL HAD_FREE_PERIOD

Value

df

Probability

F-statistic

0.268289

(5, 81)

0.9292

Likelihood ratio

1.626114

5

0.8981

Redundant Variables: PRICE_NEW(3) PRICE_NEW(4) PRICE_NEW(5)

PRICE_NEW(6)

Value

df

Probability

F-statistic

1.521987

(4, 86)

0.2029

Likelihood ratio

6.771281

4

0.1485

Получаем такую очищенную регрессию, где

Таблица 26Очищенная регрессия с категориальной ценой (Россия)

Dependent Variable: DOWNLOADS_THIS_MONTH

Method: Least Squares

Sample (adjusted): 1 110

Included observations: 103 after adjustments

White heteroskedasticity-consistent standard errors & covariance

Variable

Coefficient

Std. Error

t-Statistic

Prob.

ALL5

3.400473

0.547882

6.206578

0.0000

CATEGORY3="Games"

-6148.669

2311.314

-2.660248

0.0092

CATEGORY3="Health and Fitness"

64031.21

2199.837

29.10724

0.0000

CATEGORY3="Social Networking"

56419.16

8703.670

6.482226

0.0000

SIZE_MB

12.26519

5.361273

2.287738

0.0244

TIME_IN_MARKET

-12.14541

3.697275

-3.284963

0.0014

PRICE_NEW(1)

-1345.688

565.4826

-2.379716

0.0193

PRICE_NEW(2)

-886.3093

509.7727

-1.738636

0.0854

C

21304.90

3202.031

6.653557

0.0000

R-squared

0.734536

Mean dependent var

21010.68

Adjusted R-squared

0.711943

S.D. dependent var

20776.96

S.E. of regression

11151.18

Akaike info criterion

21.55980

Sum squared resid

1.17E+10

Schwarz criterion

21.79002

Log likelihood

-1101.330

Hannan-Quinn criter.

21.65305

F-statistic

32.51212

Durbin-Watson stat

1.857978

Prob(F-statistic)

0.000000

Из предыдущей модели видно, что первая и вторая категория цены значима и имеет отрицательный знак, данный факт показывает, что при сравнении с другими категориями, наличие этих категорий уменьшает количество загрузок на 1345 и 886 соответственно. При этом большинство приложений состоят именно в первой категории цены, что достаточно странно. Возможно, существует какая-то ошибка. Проверим на мультиколлинеарность модель. Мультиколлинеарности не обнаружено, все коэффициенты VIF<2.

Таблица 27 Variance Inflation Factors для модели с категориальной ценой (Россия)

Variance Inflation Factors

Sample: 1 112

Included observations: 103

Coefficient

Uncentered

Centered

Variable

Variance

VIF

VIF

ALL5

0.112319

1.952306

1.379172

CATEGORY3="Games"

6444078.

2.953887

1.319212

(CATEGORY3="Health and Fitness")

1.33E+08

1.066072

1.055722

(CATEGORY3="Social Networking")

1.65E+08

1.326529

1.313650

SIZE_MB

12.16745

1.542618

1.272910

TIME_IN_MARKET

14.73940

2.455353

1.190710

PRICE_NEW(1)

408106.5

2.523818

1.078200

PRICE_NEW(2)

405385.5

2.461350

1.052210

C

8294643.

6.870575

NA

Важно отметить, что проблемы гетероскедастичности сразу решались в моделях с использованием скорректированных стандартных ошибок. А так же исходя из распределения зависимой величины, была построена аналогичная лог-линейная модель для сравнения показателей. По описательным способностям она слабее. Но с математической точки зрения использование ее оценок является обоснованным. Поэтому все дальнейшие сравнения будут происходить именно с этой моделью.

Таблица 28 Лог-линейная модель

Dependent Variable: LOG(DOWNLOADS_THIS_MONTH)

Method: Least Squares

Sample: 1 112 IF ID<>"ru49" AND ID<>"ru55" AND ID<>"ru6" AND

ID<>"ru40"

Included observations: 101

White heteroskedasticity-consistent standard errors & covariance

Variable

Coefficient

Std. Error

t-Statistic

Prob.

ALL5

8.58E-05

1.64E-05

5.233942

0.0000

APPS_PUBLISHED

-0.000478

0.000485

-0.984582

0.3274

CATEGORY3="Games"

-0.057651

0.086928

-0.663197

0.5089

CATEGORY3="Health and Fitness"

1.933486

0.091797

21.06251

0.0000

CATEGORY3="Social Networking"

1.203614

0.297765

4.042156

0.0001

SIZE_MB

0.000289

0.000175

1.653017

0.1017

TIME_IN_MARKET

-0.000392

0.000128

-3.051742

0.0030

PRICE_IN_EUR

0.027314

0.035485

0.769730

0.4434

C

9.518194

0.094453

100.7713

0.0000

R-squared

0.509096

Mean dependent var

9.635890

Adjusted R-squared

0.466409

S.D. dependent var

0.533125

S.E. of regression

0.389434

Akaike info criterion

1.036640

Sum squared resid

13.95260

Schwarz criterion

1.269671

Log likelihood

-43.35033

Hannan-Quinn criter.

1.130978

F-statistic

11.92618

Durbin-Watson stat

1.885533

Prob(F-statistic)

0.000000

При этом, нулевая гипотеза о нормальности остатков не может быть принятой.

Рисунок 17 Остатки лог-линейной модели

В результате получается, что по сравнению со всеми остальными категориями для приложений WhatsApp Messenger и Smart Alarm Clock: sleep cycles and noise recording увеличение в объеме скачиваний составляет на 591,36% и 233,21%, соответственно. Так же как и в линейной модели, время нахождения на рынке отрицательно влияет на загрузки (с каждым днем относительная оценка загрузок будет падать на 0,04%. А цена на приложения возможно не значима из-за внутренних особенностей рынка: общие устоявшиеся цены (несколько категорий), большинство успешных приложений находятся в самой низкой категории цены, а так же возможен порог выше которого люди не будут заинтересованы покупать приложение, тем более в какой-то доли приобретение каждого малоизвестного приложения - риск, поэтому потребитель будет уменьшать свои издержки.

Регрессия с инструментальными переменными

Важной предпосылкой линейных регрессий является экзогенность заданных факторов, т.е. некоррелированность объясняющих переменных и случайной ошибки. Обратная ситуация может привести к смещенным и несостоятельным оценкам при применении стандартных методов оценивания (например, МНК). Одной из причин данной проблемы может являться проблема пропущенных существенных переменных (в нашем случае, пропущенной значимой объясняющей переменной может являться продвижение приложения через мобильный магазин (первые строчки для скачиваний и т.д.) или влияние рекламы в повседневной жизни).

Кроме того, следует отметить, что при имеющемся наборе данных можно предположить возможность одновременности, а точнее совместного влияния зависимой и независимых переменных друг от друга. Например, можно предположить, что рейтинг может влиять на количество скачиваний (если человек выбирает приложение по рейтингу, то рейтинг непосредственно влияет на желание скачать приложение), но и обратная связь может работать (если потребитель увидит популярность приложения, то и эта характеристика может послужить катализатором к последующей оценке). Так же цена может влиять на количество скачиваний (чем дешевле приложение, тем больше его покупают, например), но и обратная связь тоже возможна (чем больше масштаб продаж, тем ниже цена). Данную проблему в научном сообществе решают с помощью инструментальных переменных.

Инструментальные переменные - это переменные, которые коррелируют с «проблемными» регрессорами, но не коррелируют с ошибкой. В данном случае могут применяться два способа оценивания регрессионных параметров: двухшаговый метод наименьших квадратов(2ШМНК) и метод максимального правдоподобия с ограниченной информацией.

Как было замечено выше, одновременная связь может быть у рейтинга с загрузками. В исследовании имеются два вида рейтинга: общий и текущий. Но так как количество скачиваний приведено лишь за один месяц, то можно сказать, что общий рейтинг может влиять на объем загрузок, но вот этот объем не будет значимым фактором роста оценок в общем рейтинге, тем самым опровергается одновременная связь между этими переменными. А вот с текущим рейтингом вполне может сложиться обратная ситуация, поэтому в модели мы учтем только общий рейтинг. Это можно сделать в связи с тем, что общий рейтинг коррелирует с текущим, а значит мы можем оставить только один из них.

Другой такой объясняющей переменной является цена. Нужно подобрать такой инструмент, который коррелирует с ценой, но в тоже время не коррелирует с ошибкой (или с возможной пропущенной объясняющей переменной). Такими могут являться: количество приложений, выпущенных разработчиком (чем больше приложений, тем больше цена), размер приложения (рыночная цена косвенно учитывает себестоимость создания приложения, в результате, чем больше размер приложения, тем больше разработчики потратили времени и создали улучшенное по качеству приложение, т.е. размер коррелирует с ценой). Проверим эти предположения.

Из Таблица 29 Зависимость цены от размера и публикаций разработчика (Россия)видно, что взаимосвязь между размером приложения и ценой существует и она значима, но в тот же момент загрузки не влияют на размер приложения. А вот между количеством приложений, выпущенных разработчиком и ценой, линейная связь отсутствует. Поэтому размер приложения - скорее всего сильный инструмент, который можно использовать в модели.

Таблица 29 Зависимость цены от размера и публикаций разработчика (Россия)

Dependent Variable: PRICE_IN_EUR

Method: Least Squares

Sample: 1 112

Included observations: 112

Variable

Coefficient

Std. Error

t-Statistic

Prob.

SIZE_MB

0.002677

0.000409

6.550100

0.0000

APPS_PUBLISHED

-0.000597

0.001271

-0.469596

0.6396

C

1.276017

0.124262

10.26879

0.0000

R-squared

0.383626

Mean dependent var

1.674464

Adjusted R-squared

0.372316

S.D. dependent var

1.440705

S.E. of regression

1.141420

Akaike info criterion

3.128844

Sum squared resid

142.0095

Schwarz criterion

3.201661

Log likelihood

-172.2152

Hannan-Quinn criter.

3.158388

F-statistic

33.92032

Durbin-Watson stat

2.112308

Prob(F-statistic)

0.000000

Построим модель с полученным инструментом (Таблица 31 Проверка инструмента (Россия)).

Таблица 30 Модель с инструментом (size_mb) (Россия)

Снова проверим, не являются ли наши инструменты слабыми.

Таблица 31 Проверка инструмента (Россия)

Коэффициент детерминации является относительно высоким (описательная способность 44%), F статистики выше часто используемого порога в 10 единиц, поэтому инструмент сильный.

Сравним IV и OLS-оценки с помощью теста Хаусмана(Таблица 32 Тест Хаусмана (Россия)). Поскольку не отклоняется нулевая гипотеза, оценки коэффициентов в обеих регрессиях отличаются незначимо, значит, OLS дает состоятельные и эффективные оценки, а IV - только состоятельные. Можно предпочесть OLS модель.

Таблица 32 Тест Хаусмана (Россия)

Попробовав другие предположительные инструменты, тест Хаусмана показывал такие же результаты, поэтому приводить данные результаты в работе не будем.

Пуассоновская регрессия

Зависимая переменная Downloads_This_Month представляет число событий (скачиваний), поэтому обычно используют три способа работы с такими данными: пуассоновская регрессия, негативная биноминальная регрессия, zero-inflated regression model.

Downloads_This_Month - дискретная величина (количество скачиваний приложений за месяц), принадлежащая области натуральных чисел, другими словами, это только положительные оценки. В таком случае, априори, нормальное распределение не подходит, потому что оно подразумевает как отрицательные, так и положительные величины, распределенные вокруг математического ожидания равного нулю, для непрерывной переменной.

В то время как Пуассоновская регрессия - это лог-линейная функция, параметры которой найдены с помощью метода максимального правдоподобия (максимизирует функция правдоподобия эмпирического распределения пуасссоновскому распределению). Это показывает, что мы имеем лог-линейную функцию, у которой изменение на единицу объясняющей переменной приводит к изменению зависимой переменной нa (eв-1)*100%.

Таблица 33 Пуассоновская регрессия (Россия)

Все коэффициенты значимы, что достаточно странно, поэтому можно предположить, что в модели существует гетероскедастичность такой формы, которую не учитывает модель. Так же проверим на чрезмерную дисперсию, которая может менять модель к обобщенному виду - Negative Binomial Model.

Negative Binomial Model - модификация пуассоновской регрессии, которая учитывает чрезмерную дисперсию. В модели как показатель является alpha, которая показывает степень такой дисперсии. Если alpha=0, то модель сводится к простой пуассоновской регрессии.

Таблица 34 NB model

После очищения регрессии, получились такие результаты:

Таблица 35 NB regression (final)

По результатам модель дает похожие результаты с лог-линейной моделью, значимы соответствующие коэффициенты и знаки у оценок одинаковы. Поэтому для того, чтобы решить, какая модель лучше, сравним их информационные критерии.

Таблица 36 Информационные критерии для NB model

Поскольку информационные критерии у OLS модели ниже, то предпочтение стоит отдать именно ей.

Таблица 37 Информационные критерии для OLS

2.2.5 Рыночные атрибуты

В эконометрике в последнее время используют такую характеристику, как неявная цена атрибутов. Неявные цены на атрибуты (различные характеристики товара) определяются не от регрессии цен на вектор атрибутов, а от регрессии количества проданных величин (объема продаж) по цене и различным атрибутам. Основной задачей этого анализа является получение оценки, сколько потребитель готов заплатить за увеличение атрибута на 1 единицу при условии сохранения продаж прежними, другими словами, выявить скрытые цены атрибутов, которые отражают предельные нормы замещения потребителей между атрибутами.

Выводятся эти неявные цены на атрибуты с помощью теоремы о неявной функции.

Теорема о неявной функции

Пусть уравнение F(x; y) = 0 имеет решение (х0; у0), причем частные производные непрерывны в точке (х0; у0) и вторая из них (по переменной у) отлична от нуля в этой точке. Тогда в достаточно малой окрестности точки х0 существует одна и только одна непрерывная функция у(х), такая, что у(х0) = у0. При этом справедливо равенство:

причем эта производная непрерывна в указанной окрестности точки х0.

Рыночная ценность атрибутов

В нашем случае мы имеем такую гедоническую модель:

,

где Zi - набор различных характеристик, P - цены приложения.

где - рыночная ценность атрибутов.

Найдем рыночную стоимость атрибутов по сегменту российского рынка приложений. Поскольку в линейной и лог-линейной модели взаимосвязь между загрузками и ценой практически отсутствует и коэффициент оценки цены как объясняющей переменной не значим, рыночные атрибуты будем считать только по модели с инструментальными переменными.

Таблица 38 Рыночная ценность атрибутов

Объясняющие переменные

Коэффициенты IV

р

ALL5

3,80247

-0,00081

CATEGORY3="Games"

-6883,66500

1,46767

CATEGORY3="Health and Fitness"

70094,25000

-14,94487

CATEGORY3="Social Networking"

57555,80000

-12,27153

TIME_IN_MARKET

-14,72253

0,00314

PRICE_IN_EUR

4690,18800

Поскольку цена положительно влияет на загрузки, другими словами, чем выше цена, тем выше загрузки (что странно, особенно если учитывать, что большая часть выборки находится в нижнем уровне цены). Но с данной точки зрения, у нас меняются полностью ценности рыночных атрибутов в противоположную сторону, т.е. ценность отличных оценок в рейтинге падает, ценность крупнейших категорий тоже. Возможной причиной данной особенности рынка является наличие на рынке крайне популярных приложений, которые являются одними из самых дорогих приложений на рынке в данном сегменте. Поэтому зависимость загрузок и цены имеет восходящую траекторию, что мешает дальнейшим интерпретациям.

2.3 Регрессионный анализ для рынка Соединенных Штатов Америки

2.3.1 Описательные статистики

Теперь сделаем подобный анализ для сегмента рынка мобильных приложений относительно США. В данном случае, многие комментарии будем опускать, если он будет аналогичен предыдущему анализу для России.

В первую очередь приведем общую описательную таблицу всех переменных. Как видно из таблицы (Таблица 39 Описательные статистики переменных в сегменте американского рынка), общее количество наблюдений, в среднем, составляет 112 (за исключением, переменной featured, которая показывает рейтинг приложения в iTunes), поскольку не у всех приложений были заполнены рейтинги (у новых приложений отсутствует общий рейтинг, а у некоторых приложений, которые давно не выпускали обновления, соответственно, отсутствует рейтинг последней версии). Следует обратить внимание на зависимую переменную downloads_this_month, среднее которой составляет 123970,5 скачиваний, примерно около той же величины составляет дисперсия данной величины (117944,5), при этом минимальное количество загрузок составляет 45600, а максимальное 679500, следовательно, размах количества скачиваний приложений будет более 630 тысяч раз.

Таблица 39 Описательные статистики переменных в сегменте американского рынка

Аналогично, рассмотрим описательные статистики переменной Downloads_This_Month, которая отражает количество скачиваний приложений за последний месяц, она же будет являться зависимой переменной при анализе. График распределения переменной и график нормального распределения представлен ниже (Рисунок 18 Распределение переменной downloads_this_month (США)).

Рисунок 18 Распределение переменной downloads_this_month (США)

Как видно из графика распределение далеко от нормального, в доказательство приведем тест на нормальность распределения. Нулевая гипотеза гласит, что распределение нормально. Поскольку значимость (probability, далее prob)<0.05, то гипотеза о нормальности распределения загрузок отвергается. Следовательно, высока вероятность, что и остатки в регрессии не будут распределены нормально. Следует отметить, что распределение цены сильно несимметрично (асимметрия, отличаются от нуля, эксцесс - от трех, и медиана отлична от среднего). Подобный разброс количества скачиваний может быть связан с различными характеристиками приложений.

Таблица 40 Тест Франция на нормальность распределение величины (США)

Попробуем преобразовать переменную downloads_this_month в логарифм. Получим lndownloads. Распределение представлено ниже. Графически оно уже ближе к нормальному, чем первоначальное.

Рисунок 19 Распределение переменной lndownloads (США)

Снова отметим, что исходная величина не подразумевает наличие отрицательных значений и представляет собой целочисленные значения, поэтому логарифмирование не дает значимых результатов, поэтому исходя из графика распределения, можно предположить, что зависимая переменная может иметь пуассоновское распределение, однако к этому вопросу мы обратимся в параграфе Регрессионный анализ.

Как было уже отмечено на российском рынке: цены на рынке - сложившаяся категория, которая имеет несколько градаций.

Как видно из Таблица 41 Распределение категориальной переменной price_in_eur (США) около 60% - это минимальная цена, что говорит о том,что большинство приложений - средняя категория, в которой могут представлены как известные «бренды», как и малоизвестные платные приложения. Кроме того, по 19% и 12% от выборки занимают цены второй и третьей ступени (1,52 евро и 2,28 евро, соответственно).

Таблица 41 Распределение категориальной переменной price_in_eur (США)

Так же рассмотрим категориальные переменные. По категориям приложений () следует отметить преимущество игр (Category - Games) 75% выборки, следующая по количеству - Утилиты (около 4%), далее - Weather (4%) и остальные.

Таблица 42 Распределение категориальной переменной Category (США)

Оценивая совместимость устройств и приложений, универсальные приложения занимают весомую долю на рынке, как и на российском рынке, т.е. большинство приложений существует как на iPhone market, так же и на Android и других рынках мобильных приложений.

Таблица 43 Распределение категориальной переменной Compatibility (США)

Если говорить о других характеристиках, то ситуация похожая на российский рынок. Приложений, имеющих бесплатный период пользования всего 6 из 106 (около 6%), приложений, преимущественно распространяемых внутри страны всего 14/92=13%, а виды монетизации распределены поровну.

2.3.2 Корреляционный анализ

Для выявления взаимосвязей среди переменных часто используются два способа:

· парные корреляции;

· матрица диаграмм рассеяния.

Приведем коэффициенты корреляций основных объясняющих переменных с зависимой переменной (Таблица 44 Коэффициенты корреляции между загрузками и другими характеристиками (США)).

Таблица 44 Коэффициенты корреляции между загрузками и другими характеристиками (США)

Максимальный коэффициент корреляции наблюдается у переменной curr5, которая показывает количество текущих отличных оценок в рейтинге. Так же имеется несильная линейная связь между загрузками, размером, количеством языков в приложении и масштаб компании разработчика.

2.3.3 Проверка на выбросы

Для проверки данных на выбросы построим регрессию, которая будет включать большинство регрессоров (не берем curr рейтинг, поскольку он сильно коррелирует с общим рейтингом).

Вообще между категориями общего рейтинга тоже существует обоснованная сильная корреляция (поэтому можно предполагать, что в нашей модели будет мультиколлинеарность, но поскольку с экономической точки зрения нам важно оценить влияние рейтинга/оценок приложения, то пока эти переменные оставим совместно.

quietly reg lndownloads apps_published paid_in_app price_in_eur had_free_period is_local iphoneonly iphoneipodtouch iphoneitouch universal time_in_market all5 all4 all3 all2 all1 business education entertainment games healthandfitness music photoandvideo productivity socialnetworking utilities weather size_mb number

Проверим регрессию на выбросы. С помощью нескольких способов, которые можно реализовать в Stata. Поскольку мы так же имеем несовершенство информации, некоторые рейтинги пропущены, поэтому данные способы выявления выбросов отмечают именно эти наблюдения. Придется их удалить для дальнейшего полноценного анализа. Насчет выбросов, в дальнейшем исследовании на основе экспертного мнению будет выявлено, улучшаются ли модели с учетом этих выбросов или нет.

Таблица 45 Проверка на выбросы (США)

2.2.4 Регрессионный анализ сегмента американского рынка

Базовая линейная модель

Аналогично первому анализу, для рассмотрения основных возможных взаимосвязей построим первоначальную линейную модель со всеми объясняющими переменными.

Таблица 46 Базовая линейная модель (США)

Все объясняющие переменные не значимы в модели, кроме отличных оценок в текущем рейтинге. Возможно это ошибка спецификации, поэтому проверим лог-линейную модель.

Таблица 47 Лог-линейная модель (США)

Ситуация меняется незначительно.

Попробуем удалить некоторые незначимые переменные.

Таблица 48 Очищенная лог-линейная модель (США)

Таблица 49 Информационные критерии для лог-линейной модели (США)

При замене объясняющей переменной - цены на категориальные переменные ситуация не меняется.

На примере предыдущего анализа можно увидеть, что рынок приложений в Америке существенно отличается от рынка приложений в России. Среднестатистический американец, выходя на рынок мобильных приложений, готов потратить определенную сумму на покупку приложений. Таким образом, единственным важным критерием при выборе приложения для него остается только рекомендации/оценки других потребителей, а так популярность разработчика. Поэтому в модели для США значимыми оказываются лишь текущий рейтинг приложения (количество отличных оценок) и два вида категорий приложений и как долго приложение находится на рынке.

Следует отметить, что так же рынок мобильных приложений достаточно конкурентный, поэтому важным фактором при выборе приложения является пиар-кампания разработчика, что является существенной пропущенной переменной. Но данную переменную у нас нет возможности оценить, а использовать инструментальные переменные для решения данной проблемы мы не можем из-за отсутствия сильных инструментов.

Регрессия с инструментальными переменными

Проведем экспресс-анализ инструментальных переменных в случае сегмента рынка США. Предпосылки остаются теми же, что на российском рынке, а точнее, что цена может влиять на количество скачиваний (чем дешевле приложение, тем больше его покупают, например), но и обратная связь тоже возможна (чем больше масштаб продаж, тем ниже цена).

Построим модель с полученным инструментом (Таблица 31 Проверка инструмента (Россия)). рынок мобильный приложение

Таблица 50 Модель с инструментом (size_mb) (США)

Снова проверим, не являются ли наши инструменты слабыми.

Таблица 51 Проверка инструмента (США)

Коэффициент детерминации является относительно высоким (описательная способность 30%), F статистики выше часто используемого порога в 10 единиц, поэтому инструмент сильный.

Сравним IV и OLS-оценки с помощью теста Хаусмана (ссылка). Поскольку не отклоняется нулевая гипотеза, оценки коэффициентов в обеих регрессиях отличаются незначимо, значит, OLS дает состоятельные и эффективные оценки, а IV - только состоятельные. Можно предпочесть OLS модель.

Таблица 52 Тест Хаусмана (США)

Других сильных инструментов для данного случая не удалось найти.

Пуассоновская регрессия

Исходя из таких предположений, как на российском рынке, проверим метод пуассоновского распределения на наших данных.

Пуассоновская регрессия - это лог-линейная функция, параметры которой найдены с помощью метода максимального правдоподобия (максимизирует функция правдоподобия эмпирического распределения пуассоновскому распределению). Это показывает, что мы имеем лог-линейную функцию, у которой изменение на единицу объясняющей переменной приводит к изменению зависимой переменной нa (eв-1)*100%.

Таблица 53 Пуассоновская регрессия (США)

Так же как на российском рынке все коэффициенты значимы, что достаточно странно, поэтому проверим на чрезмерную дисперсию, построив Negative Binomial Model.

Negative Binomial Model - модификация пуассоновской регрессии, которая учитывает чрезмерную дисперсию. В модели как показатель является alpha, которая показывает степень такой дисперсии. Если alpha=0, то модель сводится к простой пуассоновской регрессии.

Таблица 54 NB model

По результатам модель дает похожие результаты с лог-линейной моделью, значимы соответствующие коэффициенты и знаки у оценок одинаковы. Поэтому для того, чтобы решить, какая модель лучше, сравним их информационные критерии.

Поскольку информационные критерии у OLS модели ниже, то предпочтение стоит отдать именно ей.

Таблица 55 Информационные критерии для OLS

ЗАКЛЮЧЕНИЕ

Мобильные приложения - быстро растущий сегмент глобального рынка мобильной связи. Различные факторы, которые способствовали этому росту, включают продвижения в сетевые технологии, понижение мобильной стоимости использования данных, растущее принятие умных телефонов во всем мире и непрерывное увеличение прикладного удобства и простоты использования. Поскольку потребители все чаще и чаще используют мобильные приложения, с практической точки интересно, какие факторы влияют на данный спрос.

Результатом данной исследовательской работы служит эконометрическое моделирование спроса на рынке мобильных приложений на примере сегментов американского и российского магазина - Apple App Store.

В первую очередь следует отметить, что рынок достаточно специфичен. В данной работе был использован рейтинг приложений на март 2013 года, который в дальнейшем использовался для моделирования. И распределение загрузок приложений в данном наборе данных оказалось далеко от нормального, поэтому в работе использовались еще и методы для характерных распределений.

В результате работы были выявлены интересные закономерности на рынках данных стран. На российском рынке важными характеристиками, влияющими на спрос является количество отличных оценок поставленных пользователями данного приложения, т.е. когда покупатель заходит в магазин и видит приложения со схожими характеристика велика вероятность, что он выберет именно приложение, у которого общий рейтинг отличных оценок выше. Другая особенность, что цена приложения не является значимой величиной, следовательно, на рынке имеется низкая эластичность загрузок по цене, что косвенно указывает на безразличие покупателя к цене, которую он заплатит за приложение. Так же цена на приложения возможно не значима из-за внутренних особенностей рынка: общие устоявшиеся цены (несколько категорий), большинство успешных приложений находятся в самой низкой категории цены, а так же возможен порог выше которого люди не будут заинтересованы покупать приложение, тем более в какой-то доли приобретение каждого малоизвестного приложения - риск, поэтому потребитель будет уменьшать свои издержки. Кроме того, в одном из методов, учитывающих несовершенство информации и рынка (метод инструментальных переменных) видно, что цена влияет положительно на загрузки, т.е. чем выше цена, тем больше количество скачиваний, в тот же момент, выборка состоит из 60% приложений, продающихся по нижней категории цены, что противоречит наблюдениям.

Поскольку рынок быстро растущий, развивающийся и успех бизнеса озадачивает все время поддерживать новизну и обновление устаревшего, поэтому оценка коэффициента при переменной, выражающей время нахождения на рынке в днях отрицательный.

На американском рынке немного другая ситуация, большинство факторов значимых на российском не являются таковыми на американском. Среднестатистический американец, выходя на рынок мобильных приложений, готов потратить определенную сумму на покупку приложений. Таким образом, единственным важным критерием при выборе приложения для него остается только рекомендации/оценки других потребителей, а так популярность разработчика. Поэтому в модели для США значимыми оказываются лишь текущий рейтинг приложения (количество отличных оценок) и два вида категорий приложений и как долго приложение находится на рынке.

Следует отметить, что так же рынок мобильных приложений достаточно конкурентный, поэтому важным фактором при выборе приложения является пиар-кампания разработчика, что является существенной пропущенной переменной. Но данную переменную у нас нет возможности оценить, а использовать инструментальные переменные для решения данной проблемы мы не можем из-за отсутствия сильных инструментов.

В результате данного анализа были выявлены взаимосвязи на данных двух рынках по которым можно судить о наличии различных предпочтений потребителей. Кроме того, выводы работы могут быть использованы в роли уточняющих факторов ведения бизнеса в данном сегменте цифрового рынка.

СПИСОК ЛИТЕРАТУРЫ

1. Akihiro Yamashita, Hidenori Kawamura, Hiroyuki Iizuka, and Azuma Ohuchi. Effect of the Number of Users and Bias of Users' Preference on Recommender Systems. H. Yin et al. (Eds.): IDEAL 2007, LNCS 4881, pp. 1112-1121, 2007.

2. Alto Palo. 11% quarterly growth in downloads for leading app stores - [сайт]. URL: http://www.canalys.com/newsroom/11-quarterly-growth-downloads-leading-app-stores - сайт посещён 03.04.2013.

3. Anindya Ghose, Panagiotis G. Ipeirotis Designing Novel Review Ranking Systems:Predicting Usefulness and Impact of Reviews. ICEC'07, August 19-22, 2007.

4. Anindya Ghose, Sang Pil Han. Estimating Demand for Mobile Applications. AppWeb 2012 Workshop, April 16, 2012, pp. 1-4.

5. Bhavik Pathak, Robert Garfinkel, Ram D. Gopal, Rajkumar Venkatesan, and Fang Y. Empirical Analysis of the Impact of Recommender Systems on Sales. Journal of Management Information Systems / Fall 2010, Vol. 27, No. 2, pp. 159-188.

6. Distimo. 2013. App distribution becomes a global game: The shift of power and impact for developers - [сайт]. URL: http://www.distimo.com/blog/2011_01_distimo-releases-fullyear-2010-report/ - сайт посещён 14.01.2013.

7. Feng Zhu, Xiaoquan (Michael) Zhang. Impact of Online Consumer Reviews on Sales: The Moderating Role of Product and Consumer Characteristics. April 21, 2009.

8. Gal Oestreicher-Singer, Arun Sundararajan. Recommendation networks and the long tail of electronic commerce. MIS Quarterly Vol. 36 No.1-Appendices/March 2012.

9. Guiran Chang, Chunguang Tan, Guanhua Li, and Chuan Zhu. Developing Mobile Applications on the Android Platform. X. Jiang, M.Y. Ma, and C.W. Chen (Eds.): WMMP 2008, LNCS 5960, pp. 264-286, 2010.

10. International Data Corporation (IDC). 2010. IDC forecasts worldwide mobile applications revenues to experience more than 60% compound annual growth through 2014 - [сайт]. URL: http://www.idc.com/about/viewpressrelease.jsp?containerId=prUS22617910&sectionId=null&elementId=null&pageType=SYNOPSIS - сайт посещён 14.02.2013.

11. Judith Chevalier, Austan Goolsbee. Measuring prices and price competition online: Amazon and Barnes and Noble. Yale ICF Working Paper No. 02-23, June 2002.

12. Judith Chevalier, Dina Mayzlin. The effect of word of mouth on sales: online book reviews. Journal of Marketing Research Vol. XLIII (August 2006), pp. 345-354.

13. Jun B. Kim, Paulo Albuquerque, Bart J. Bronnenberg. Online Demand Under Limited Consumer Search. Marketing Science,Vol. 29, No. 6, November-December 2010, pp. 1001-102

14. Linyuan Lu, Matus Medo et other. Recommender systems. Physics Reports 519 (2012) 1-49.

15. Nikos Manouselis & Constantina Costopoulou. Analysis and Classification of Multi-Criteria Recommender Systems. World Wide Web (2007) 10:415-441.

16. Octavian Carare. The Impact of Bestseller Rank on Demand: Evidence From a Software Market. International Economic Review, Forthcoming, September 1, 2010.

17. Octavian Carare. The Impact of Bestseller Rank on Demand: Evidence from the App Market. International Economic Review, Forthcoming, October 10, 2011.

18. Rajiv Garg, Rahul Telang. Inferring app demand from publicly available data. MIS Quarterly, Forthcoming, May 1, 2012, pp. 1-25.

19. Алтухов Алексей. Продажи мобильных аппаратов за год выросли всего на 0,7% - [сайт]. URL: http://www.oszone.net/20909/Android_share_in_smartphones_in_Q1_2013_is_74_4_ - сайт посещён 01.04.2013.

20. Воронина Юлия. Игра на миллиарды - [сайт]. URL: http://www.rg.ru/2013/03/19/prilizenia.html - сайт посещён 04.04.2013.

21. Статья «App Annie Index: отчет по рынку мобильных приложений, Q1 '13» - [сайт]. URL: http://habrahabr.ru/post/177277/ - сайт посещён 02.04.2013.

22. Статья «В первом квартале рынок мобильных приложений вырос на 11%» - [сайт]. URL: http://expert.ru/2013/04/15/ryinok-mobilnyih-prilozhenij/ - сайт посещён 06.04.2013

23. Статья «Разработка мобильных приложений: с чего начать» - [сайт]. URL: http://habrahabr.ru/company/mailru/blog/179113 - сайт посещён 05.04.2013.

Приложение 1. Распределение категориальной переменной Publisher (Разработчик) (Россия)

Приложение 2. Распределение категориальной переменной Publisher (США)

Приложение 3. Таблица коэффициентов корреляции (Россия)

Приложение 4. Таблица коэффициентов корреляции (США)

Размещено на Allbest.ru

...

Подобные документы

  • Классификация мобильных приложений. Способы монетизации мобильных приложений. Аналитика мобильных игр. Разработка маркетинговой стратегии для игрового продукта. Ценообразование и внутриигровые покупки, анализ целевого рынка и инструменты продвижения.

    дипломная работа [1,1 M], добавлен 04.09.2016

  • Исследование рынка мобильной и электронной коммерции. Методология сбора данных. Использование мобильных устройств, приложений и сервисов в интернет-торговле. Характеристика бизнес-моделей электронной коммерции, использующих мобильные приложения.

    дипломная работа [1001,9 K], добавлен 31.08.2016

  • Определение конкурентоспособности товара на примере рынка мобильных телефонов. Мобильные телефоны могут стать отличным каналом дистрибьюции, так же, как инструментом обратной связи и различных исследований. Анализ конъюнктуры рынка, его сегментации.

    реферат [64,8 K], добавлен 11.04.2008

  • Анализ рынка мобильных приложений. Распространение программных продуктов. Приложения для социальных сетей. Геоинформационная система WGS3-T. Потенциальные потребители системы в странах СНГ и регионах России. Локализация программ на рынке Евросоюза.

    отчет по практике [3,0 M], добавлен 05.11.2013

  • Анализ российского рынка мобильных телефонов, его основные представители и оценка конкуренции. Классификация и характеристика ассортимента данных продуктов. Комплекс торгового маркетинга и его инструменты. Оценка деятельности торгового предприятия.

    курсовая работа [1,5 M], добавлен 13.05.2014

  • Субъективные оценки свойств исследуемого продукта. Анализ отношения потребителей к разновидностям продукта, его конкурентоспособность и особенности позиционирования. Принципы сегментации рынка. Анализ динамики и прогнозирования спроса на смартфоны.

    контрольная работа [302,2 K], добавлен 17.11.2013

  • Сущность спроса как основной категории современного рынка, факторы формирования, классификация и разновидности, сбалансированность и удовлетворенность. Основные методы стимулирования спроса. Государственное регулирование рынка потребительских товаров.

    контрольная работа [28,6 K], добавлен 25.03.2010

  • Современное состояние сотовой связи в России. Характеристика основных видов мобильных телефонов, анализ динамики их продаж и описание наиболее популярных производителей. Состав и классификация йогуртов, исследование объемов их производства и потребления.

    курсовая работа [2,7 M], добавлен 28.05.2013

  • Анализ спроса и предложения на рынке мобильной связи, его конъюнктура. Перспективы и направления развития ассортимента мобильных телефонов. Маркетинговые исследования потребительских предпочтений на рынке сотовых телефонов в городе Новосибирске.

    курсовая работа [1,2 M], добавлен 16.10.2010

  • Анализ взаимосвязи потребительского спроса и дохода покупателей. Изучение рынка розничной торговли продуктов питания, парикмахерских услуг, рынка жилья, фармацевтических товаров, мебели, оргтехники. Рассмотрение состояния пищевой промышленности в городе.

    отчет по практике [47,5 K], добавлен 30.03.2011

  • Анализ альтернативных способов продвижения алкогольной продукции. Разработка проекта глобальной стратегии сокращения вредного употребления алкоголя. Использование для рекламы социальных сетей, промо-кодов страниц в интернете, мобильных приложений.

    реферат [39,0 K], добавлен 16.07.2016

  • Маркетинговое понимание товара. Методы, этапы и программа исследования товаров конкурентов. Организация маркетингового исследования сотовых телефонов, их конкурентоспособность как товара. Анализ рынка сотовой связи, его позиционирование и сегментирование.

    курсовая работа [78,2 K], добавлен 15.02.2009

  • Общая характеристика и разновидности рынков и их возможностей, инструменты маркетингового исследования. Изучение потребителей, конкурентов и завоевание преимуществ в конкурентной борьбе. Классификация и состояние спроса. Его измерение и прогнозирование.

    курсовая работа [134,0 K], добавлен 02.06.2013

  • Законы спроса и предложения. Характеристика российского рынка спорттоваров, особенности их ассортимента, задачи спортивного маркетинга. Роль рынка в экономике, сущность категорий спроса и предложения, пути повышение конкуренции среди участников рынка.

    курсовая работа [1,0 M], добавлен 10.04.2013

  • Изучение оценки текущей маркетинговой ситуации на предприятии. Характеристика оказываемых услуг, анализ рынка сбыта, потребителей, их сегментации. Замер спроса и оценка целевых рынков, особенности позиционирование услуги на рынке и прогноз объёма продаж.

    курсовая работа [220,0 K], добавлен 21.02.2010

  • Теоретический аспект темы исследования. Понятие и классификация рынков. Характеристики товарного рынка. Анализ деятельности на товарном рынке. Маркетинговые исследования. Анализ конъюнктуры рынка молочной продукции Хабаровского края.

    курсовая работа [58,8 K], добавлен 06.01.2004

  • Исследования потребительского и производственно-технического рынков: схема, назначение, цели. Организация маркетинговых исследований на примере компании "Корвет": классификация методов; виды информации и её сбор; оценка емкости рынка; анализ конкурентов.

    курсовая работа [115,0 K], добавлен 24.04.2011

  • Методы выбора зарубежных рынков сбыта и факторы спроса на кондитерскую продукцию. Характеристика и выбор зарубежных рынков сбыта для кондитерской продукции. Сравнительный анализ вариантов организации каналов закупки оборудования на зарубежном рынке.

    курсовая работа [1,8 M], добавлен 07.04.2014

  • Изучение сущности, значения и методов комплексного исследования товарного рынка. Анализ предложения мебельных изделий на рынке Республики Беларусь. Мебельное производство и перспективы его развития. Оценка покупательского спроса на мебельные изделия.

    курсовая работа [268,9 K], добавлен 04.12.2013

  • Факторы, влияющие на конкурентную среду, методы ее оценки. Характеристика производства на российском рынке мебели, динамика его роста. Модель покупательского поведения. Рекомендации операторам рынка мебели по увеличению спроса и продвижению продукции.

    курсовая работа [611,8 K], добавлен 17.12.2013

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.