Статистический анализ и моделирование развития киберспорта в современном мире
Изучение индустрии киберспорта в научной литературе. Статистические показатели и методы анализа развития электронного спорта. Построение регрессионной модели, определяющей вероятность победы той или иной команды в рамках профессиональной встречи.
Рубрика | Экономика и экономическая теория |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 14.12.2019 |
Размер файла | 2,2 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Так как ряд является тренд-стационарным в первую очередь необходимо проанализировать поведение тренда. В итоге в качестве тренда был выделен полином второй степени (рис. 2. П4.).
В первую очередь была построена AR(1) модель с включением полинома второй степени в качестве тренда (табл. 10).
Таблица 10. Идентификация AR(1) модели
AIC |
BIC |
HQ |
|||
-171,01 |
-159,04 |
-166,21 |
|||
Коэффициент |
Ст. ошибка |
z |
p-value |
||
const |
11,46 |
0,174 |
65,61 |
0,00*** |
|
phi_1 |
0,877 |
0,06 |
14,27 |
0,00*** |
|
sq_time |
-0,0003 |
0,00 |
-3,55 |
0,00*** |
|
time |
0,06 |
0,009 |
6,492 |
0,00*** |
|
*, **,*** - значимость на 10%, 5%, 1% соответственно |
Для того, чтобы определить качество модели, необходимо проанализировать остатки модели на нормальное распределение, автокорреляцию и гетероскедастичность ошибок.
На основе теста Люинга-Бокса можно утверждать, что на 5% уровне значимости в остатках модели присутствует автокорреляция (рис. 4. П4.), также на основе LM статистики наблюдается отсутствие гетероскедастичности остатков (рис. 5. П4.).
Далее было рассмотрено распределение остатков, представленное на рисунке. На основе теста Харке-Бера можно заключить, что остатки характеризуются нормальным распределением (рис. 3. П6.).
Из-за наличия в модели автокорреляции возникла необходимость для построения более качественной модели. В итоге была рассмотрена авторегрессионная модель с параметром 2, и выделением полиномиального тренда второго порядка. В полученной модели на основе теста Люинга-Бокса отсутсвует автокорреляция (рис. 6. П4.), а также, аналогично AR(1) модели, отсутствует гетероскедастичность ошибок (рис. 7. П4.). Далее было более подробно рассмотрено распределение остатков (рис. 4. П6.)
Стоит отметить, что в модели AR(2), остатки подвергнуты нормальному распределению. Сводная таблица двух рассматриваемых моделей представлена ниже (табл. 11).
Таблица 11. Сравнение моделей AR(1) и AR(2)
Модель |
Тест Харке-Бера (p-value) |
Тест Люинга-Бокса (p-value) |
ARCH тест (p-value) |
AIC |
BIC |
HQ |
|
AR(1) |
0,174 |
0,002 |
0,77 |
-171,02 |
-159,05 |
-166,21 |
|
AR(2) |
0,561 |
0,105 |
0,71 |
-173,19 |
-158,8 |
-167,42 |
Модели AR(1) и AR(2) характеризуются нормальным распределением остатков и отсутствием гетероскедастичности, но в AR(2) модели, в отличие от AR(1), отсутствует автокорреляция. На основе информационных критериев Акаике и Ханнана-Куина можно сделать вывод, что наилучшей моделью является AR(2). Именно поэтому дальнейший анализ проводиться с использованием оптимальной авторегрессионной модели с параметром 2. На основе оптимальной модели AR(2) был построен прогноз до конца 2019 года (рис. 22).
Рис. 22. Прогноз численности зрителей платформы Twitch.tv на конец 2019 года
На основе полученного прогноза можно сделать вывод, что количество зрителей, генерируемое стриминговой платформой Twitch.tv достигнет превышающего на начало 2019 года значения. Это означает, что динамика возрастания показателя сохраниться, но на основе графического представления стоит отметить, что темп роста аудитории снизиться.
Глава 3. Моделирование предсказания результатов профессиональных встреч в рамках дисциплины «League of Legends»
Во второй главе исследовательской работы был сделан вывод, что наиболее развитой в области киберспорта страной является Южная Корея, а наиболее развитая дисциплина - Dota 2. Игровая дисциплина Dota 2 - относится к жанру MOBA, который является самым популярным игровым жанром среди многопользовательских игр. Для дальнейшего анализа была предпринята попытка изучить дисциплину, наиболее востребованную в Южной Корее, а также, сочетающую в себе жанр MOBA игр, так как два этих фактора олицетворяют развитие индустрии электронного спорта. Такой дисциплиной оказалась востребованная во всем мире игра - «League of Legends». Для того, чтобы продолжить дальнейший анализ, необходимо ознакомиться с базовой концепцией игровой дисциплины.«League of Legends» - командная игра жанра MOBA, заключающаяся в противостоянии двух команд из пяти человек в режиме реального времени. Игроки разделяются на две противоборствующие стороны - синяя сторона (Blue side) и красная сторона (Red side). Игровая карта является симметричной и представлена на рисунке 23. Первоначально все игроки появляются на своей базе, имея в распоряжении первый уровень героя и 500 золотых. На базе каждой команды находиться крепость, и цель игры заключается в том, чтобы уничтожить вражескую крепость.
Каждый игрок выполняет определенную функцию в рамках одной игровой партии, в зависимости от того, на какой линии он находиться. В игре различают всего 3 линии: верхняя (toplane), средняя (middlelane) и нижняя (bottomlane). По каждой линии наступают неконтролируемые юниты - миньоны, за убийство которых игроки получают дополнительное золото, которое можно потрать на улучшение снаряжения, и опыт, который необходим для изучения новых способностей. То есть в целом опыт и золото являются одними из главных характеристик, определяющих силу команды.
Рис. 23. Игровое поле «League of Legends»
Также золото можно получить за уничтожение башен, каждая линия содержит по 3 башни, а также главная крепость охраняется еще двумя дополнительными башнями. Первоначально крепость является неуязвимой, и атаковать ее можно только после уничтожения вражеского ингибитора. Ингибиторы обозначены стрелочками со знаком “=” на рисунке 24.
Рис. 24. Расположение крепости и ингибиторов
Еще одним из источников добычи золота и опыта является убийство вражеских героев. После смерти герои не покидают игру, а появляются заново на своей базе спустя определенный промежуток времени. Игра носит в себе исключительно стратегический характер, заключающийся в своевременной защите и наступления вражеской крепости.
Игра начинается с поочередного выбора чемпиона, в зависимости от запланированной командной стратегии. На данный момент игра включает в себя 144 уникальных чемпиона, обладающих ноповторимыми умениями. Каждый персонаж реализует себя в разные временные промежутки игровой партии, некоторые персонажи сильны в ранней игре, некоторые в мид-гейме, а некоторые в позднем и затянутом сражении. В профессиональных турнирах для того, чтобы определить победителя обычно играется серия из трех матчей, то есть победителем становиться тот, кто одержал победу в двух картах.
Для предсказания результатов матчей по данной дисциплине была создана обучающая выборка из 10 тысяч наблюдений показателей игрока на основе рейтинговых матчей, то есть всего рассматривается 1000 игр. Обучающая выборка включает в себя 1000 наблюдений, в то время как тестовая выборка содержит в себе 33 наблюдения. Ниже представлена таблица внутриигровых показателей, использующихся для построения адекватной прогнозирующей модели. Стоит отметить, что построенная модель была построена по типу модели бинарного выбора, то есть в качестве зависимой переменной выступает переменная, содержащая в себе всего два значения 0 или 1.
Таблица 12
Показатели, используемые для построения предсказательной модели
Переменная |
Значение |
Описание |
Способ расчета |
|
win |
- |
Контрольная переменная, характеризующая победу или поражение команды синей стороны (Blue side) |
0 - поражение синей команды |
|
1 - победа синей команды |
||||
KDA |
Kills, Deaths, Assists ratio |
Для построения модели был рассчитан общекомандный показатель. Показатель показыает соотношения числа убийств + числа помощей при убийстве вражеских героев разделенное на число смертей. Очевидно, что чем больше показтель, тем эффективней команда в плане сражений с противоположной командой. |
||
TDTC |
Total damage to champions |
Среднее командное число урона, нанесенное вражеским героям |
||
TH |
Total heal |
Средний объем исцеленного урона |
||
TDR |
Total damage received |
Среднее число полученного от вражеских героев урона |
||
TGE |
Total gold earned |
Среднее число полученного золота |
||
TMK |
Total minions killed |
Среднее число убитых миньонов |
||
LVL |
Level |
Средний уровень персонажей |
||
TK |
Tower kills |
Число уничтоженных башен |
- |
|
BK |
Baron kills |
Число уничтоженных баронов |
- |
|
DK |
Dragon kills |
Число уничтоженных драконов |
- |
Для того, чтобы модель была адекватной, необходимо, чтобы она учитывала показатели одновременно двух противоборствующих сторон. Именно поэтому наблюдение рассматривается с точки зрения команды синей стороны. Все переменные рассматривались, как разность между показателями синей и красных сторон. Первоначально было построено 3 модели: пробит, логит и гомпит. Из всех моделей были удалены переменные TH, DK и BK, так как они во всех случаях оказались незначимыми. Для того, чтобы определить оптимальную модель, необходимо изучить качественные характеристики. Ниже представлена таблица для сравнения полученных моделей (табл. 12).
Таблица 12. Сравнение моделей бинарного выбора
Probit |
Logit |
Gompit |
||
LR-статистика |
1298,75* |
1298* |
1293,08* |
|
R^2 McFadden |
0,945 |
0,945 |
0,93 |
|
AIC |
89,06 |
89,83 |
96,74 |
|
BIC |
123,35 |
124,12 |
135,93 |
|
HQ |
102,1 |
102,87 |
112,93 |
|
* - значимость на 5% уровне значимости |
Из таблицы можно сделать вывод, что наилучшей моделью является Probit модель, так как она обладает наибольшим коэффициентом детерминации, а также наименьшими значениями информационных критериев. В итоге оптимальная модель представлена в таблице 13.
Таблица 13. Коэффициенты оптимальной пробит модели
Коэффициент |
Ст. ошибка |
z |
p-value |
||
KDA |
0,387 |
0,174 |
2,42 |
0,02** |
|
TDTC |
0,0001 |
0,00 |
1,66 |
0,097* |
|
TGE |
-0,0007 |
0,00 |
-2,5 |
0,012** |
|
TMK |
0,03 |
0,00 |
3,29 |
0,001*** |
|
LVL |
2,59 |
0,56 |
4,63 |
0,00*** |
|
TK |
0,794 |
0,129 |
6,11 |
0,00*** |
|
TDR |
0,0001 |
0,00 |
1,38 |
0,167 |
|
*, **,*** - значимость на 10%, 5%, 1% соответственно |
Большая часть коэффициентов является значимой на 5% уровне значимости. Также значимыми является большая часть маржинальных эффектов коэффициентов (рис. 4. П5.).
Стоит отметить, что самым влиятельным фактором, оказалась переменная LVL, то есть при увеличении разности в уровнях на 1, вероятность победы синей команды возрастает на 5,3%. Маржинальный эффект от показателя TGE является очень низким, так как маржинальные эффекты рассматривают изменение в 1 единицу, а за игровую партию примерная разница между данным показателем составляет примерно 4-6 тысяч золотых.
Для того, чтобы проверить адекватность модели, были использованы данные лиги LCK 2018 на стадии плей-офф в рамках весеннего и летнего сезонов. В плей-офф выходило 5 команд, набравших наибольшее количество очков в результате профессиональных встреч. То есть всего было протестировано 10 профессиональных встреч, каждая из которых включала в себя формат BO3 для первого раунда плей-офф, и BO5 для второго раунда, полуфинала и финала. Всего в тестовую выборку попал 31 матч. В результате модель полученная модель обладает высокой предсказательной способностью, так как ей удалось предсказать 29 из 31 результатов. Модель не способна предсказать 100% матчей, так как в ней не учитываются психологические факторы игроков, например, волнение. Ниже представлена таблица результатов прогнозирования модели.
Таблица 14. Результаты прогнозирования исходов профессиональных матчей в рамках LCK 2018
LCK 2018 Summer |
LCK 2018 Spring |
|||||
Round 1 |
GEN |
AF |
Round 1 |
SKT |
KSV |
|
AF |
GEN |
SKT |
KSV |
|||
Round 2 |
KZ |
AF |
KSV |
SKT |
||
KZ |
AF |
Round 2 |
SKT |
KT |
||
KZ |
AF |
SKT |
KT |
|||
KZ |
AF |
KT |
SKT |
|||
Round 3 |
AF |
GRF |
SKT |
KT |
||
GRF |
AF |
Round 3 |
AF |
KT |
||
AF |
GRF |
KT |
AF |
|||
AF |
GRF |
AF |
KT |
|||
AF |
GRF |
KT |
AF |
|||
Final |
KT |
GRF |
Final |
AF |
KZ |
|
GRF |
KT |
KZ |
AF |
|||
GRF |
KT |
AF |
KZ |
|||
GRF |
KT |
KZ |
AF |
|||
KT |
GRF |
Цветом выделены команды, которые одержат победу на основе построенной модели, зеленым цветом выделены совпадения модельных значений и истинных значений, а красным цветом выделены расхождения модельных значений и истинных значений.
Заключение
Явление киберспорта возникло неожиданно, но в текущий временной горизонт является одним из самых наиболее перспективных. На сегодняшний день индустрия электронного спорта достигла своего пика, именно поэтому с помощью эконометрического моделирование была изучена дальнейшая динамика развития индустрии на основе ключевых показателей. На основе модели ARIMA с параметрами (0, 1, 1) был построен прогноз по одному из важнейших показателей - объема призовых денежных средств. Прогноз включает в себя наблюдения за 2019 и 2020 год, значения которых продолжают возрастающую динамику переменной. Также дальнейшее развитие индустрии электронного спорта доказывает модель ARMA (0,1) для относительного показателя объема призовых средств на 1 профессионального игрок. Еще одним из наиболее значимых показателей является аудитория, которая является потребителем, данной отрасли. На основе числа зрителей стримингового сервиса «Twitch.tv» была построена оптимальная модель AR(2), которая в свою очередь спрогнозировала, что на конец 2019 года, значения объема аудитории превысит начало 2018 года, то есть в целом число зрителей возрастет.
В исследовательской работе было доказано, что темпы развития индустрия отличаются в различных странах. Во второй главе работы была построена модель взвешенного МНК, на основе которой было доказано, что самыми развитыми в области электронного спорта странами являются - Южная Корея и Китай, а самый быстроразвивающейся дисциплиной - Dota 2.
После выявления страны - наиболее успешной в области киберспорта, было принято решение, исследовать дисциплину, которая востребована в ней. Именно поэтому была более подробно рассмотрена кибеспортивная дисциплина - «League of Legends». С помощью моделей бинарного выбора, удалось построить модель, которая с высокой точностью предсказывает победителя профессиональной встречи.
В заключение стоит отметить, что на основе эконометрического моделирование было доказано, что индустрия продолжит свой рост, но темп роста снизиться по сравнению с колоссальным значением на протяжении 2014-2018 года.
Список литературы
1. Айвазян С.А. Прикладная статистика. Основы эконометрики. Том 2. -- М.: Юнити-Дана, 2001.
2. Магнус Я.Р., Катышев П.К., Пересецкий А.А. Эконометрика. Начальный курс. -- М.: Дело, 2007.
Приложение
Приложение 1
Модель ARIMA(0, 1, 1) для объема призовых денежных средств
Рис. 1. П1. ADF тест для первой разности объема призовых денежных средств
Рис. 2. П1. KPSS тест для объема призовых денежных средств
Рис. 3. П1. ARIMA(0, 1, 1) для объема призовых денежных средств
Рис. 4. П1. Тест Люинга-Бокса для остатков модели
Рис. 5. П1. Тест Харке-Бера на нормальность распределения остатков
Рис. 6. П1. Тест Эндрюса - Зигота на наличие структурного сдвига
Приложение 2
ARMA(0, 1) для объема денежных призовых средств при расчете на 1 киберспортсмена
Рис. 1. П2. ADF-тест
Рис. 2. П2. Идентификация модели
Рис. 3. П3. Тест Лююинга-Бокса
Приложение 3
Модели влияния дисциплин и стран на развитие электронного спорта
Рис. 1. П3. МНК модель влияния стран и дисциплин на объем призовых средств
Рис. 2. П3. Тест Бройша-Пагана
Рис. 3. П3. FGLS модель влияния стран и дисциплин
Рис. 4. П3. Тест Бройша-Пагана FGLS модели
Приложение 4
Моделирование численности «онлайн» аудитории
Рис. 1. П4. Результаты ADF теста
Рис. 2. П4. Распознавание полинома второй степени в качестве тренда
Рис. 3. П4. Идентификация AR(1) модели с включением полинома второй степени в качестве тренда
Рис. 4. П4. Тест Люинга-Бокса
Рис. 5. П4. ARCH тест на наличие гетероскедастичности
Рис. 6. П4. Тест Люинга-Бокса для AR(2)
Рис. 7. П4. ARCH тест на наличие гетероскедастичности в модели AR(2)
Приложение 5
Идентификация моделей бинарного выбора
Рис. 1. П5. Пробит модель
Рис. 2. П5. Логит модель
Рис. 3. П5. Гомпит модель
Приложение 6
Распределение остатков моделей
Рис. 1. П6. Распределение остатков модели ARMA(0, 1)
Рис. 2. П6. Распределение остатков FGLS модели
Рис. 3. П6. Распределение остатков AR(1) модели
Рис. 23. Распределение остатков модели AR(2)
Размещено на Allbest.ru
...Подобные документы
Показатели финансовых результатов. Анализ зависимости прибыли гостиничного комплекса от объема номерного фонда и его загрузки. Построение классической регрессионной модели, определение ее классности и точности. Анализ развития и прогнозирование прибыли.
курсовая работа [586,4 K], добавлен 03.06.2014Сущность и отличительные черты статистических методов анализа: статистическое наблюдение, группировка, анализа рядов динамики, индексный, выборочный. Порядок проведения анализа рядов динамики, анализа основной тенденции развития в рядах динамики.
курсовая работа [1,0 M], добавлен 09.03.2010Изучение современного состояния музыкальной индустрии. Методы повышения прибыли компаний в сфере музыкальной индустрии. Использование модели кластерного анализа с целью прогнозирования инвестиций. Тестирование модели на примере музыкальной индустрии.
дипломная работа [1013,3 K], добавлен 30.11.2016Статистический анализ динамики ВВП на душу населения в Северо-Западном федеральном округе РФ в период с 2005 по 2012 гг. Понятие о рядах динамики, правила их построения на примере анализируемого процесса. Основные показатели анализа ряда динамики.
контрольная работа [52,3 K], добавлен 16.10.2014Абсолютные и относительные статистические показатели, методы прогнозирования. Закон распределения вероятностей дискретной случайной величины. Оценки параметров генеральной совокупности. Статистическое исследование социально-экономического потенциала.
шпаргалка [1,8 M], добавлен 16.05.2012Статистические методы анализа динамики производства молока в Российской Федерации. Выравнивание ряда динамики по среднему абсолютному приросту и среднему коэффициенту роста. Выявление тенденции развития в рядах динамики с использованием ППП Excel.
курсовая работа [1,0 M], добавлен 18.11.2015Туризм как временные выезды людей в другую страну или местность, отличную от места постоянного жительства. Статистические показатели туризма в Республике Бурятия, индикаторы его развития, прогнозное значение к 2017 году. Проблемы в данной отрасли.
презентация [764,2 K], добавлен 27.10.2013Показатели среднего, виды средних величин и связи между ними. Пример статистического обследования из области экономики и его основные атрибуты. Построение однопараметрической модели регрессии, оценка ее адекватности. Изменение статистического признака.
контрольная работа [105,9 K], добавлен 25.02.2011Экономическая классификация стран, характеристика основных показателей экономического развития. Статистические методы анализа, описание дискриминантного, кластерного, факторного и графического анализа. Параметры исследование экономической безопасности.
дипломная работа [2,3 M], добавлен 14.10.2013Нахождение закона распределения переменной и построение гистограммы. Определение наиболее типичного значения переменной и средний разброс ее значений. Оценивание распределения переменной. Составление спецификации гиперболической регрессионной модели.
курсовая работа [620,9 K], добавлен 06.01.2016Экономическая сущность статистики, статистические методы анализа сельского населения. Динамика численности и структура сельского населения. Группировка городов и районов Амурской области по количеству сельских жителей. Величины и показатели вариации.
курсовая работа [461,5 K], добавлен 04.09.2013Оценка статистической значимости параметров регрессии. Построение экономического прогноза прибыли при прогнозном значении произведенной валовой продукции. Статистическая оценка параметров уравнения регрессии. Построение мультипликативной модели тренда.
контрольная работа [132,1 K], добавлен 10.03.2013Статистические методы исследования численности, состава и структуры населения Забайкальского края. Составление прогноза развития демографической ситуации в данном регионе на ближайший период времени. Проведение кореляционного и регрессионного анализа.
курсовая работа [276,3 K], добавлен 18.04.2014Изучение предмета и задач статистики рынка жилья. Причины роста цен на рынке жилья, обоснование необходимости развития рынка доступного жилья. Статистическая сводка и группировка. Построение и анализ ранжированного и интервального ряда. Индексный анализ.
курсовая работа [61,3 K], добавлен 19.10.2011Машинное обучение и статистические методы анализа данных. Оценка точности прогнозирования. Предварительная обработка данных. Методы классификации, регрессии и анализа временных рядов. Методы ближайших соседей, опорных векторов, спрямляющего пространства.
контрольная работа [833,1 K], добавлен 04.09.2016Статистические показатели занятости. Задачи корреляционно-регрессионного анализа. Характеристика Красноярского края. Наиболее актуальные проблемы рынка труда. Риски возможной модернизации экономики и социальной сферы. Цели развития человеческого капитала.
курсовая работа [515,2 K], добавлен 29.12.2014Анализ системы статистических показателей, характеризующих аналитические показатели рядов динамики. Статистические методы, применяемые при изучении рядов динамики. Исследование структуры совокупности. Определение ошибки выборки. Расчет объема оборота.
курсовая работа [569,2 K], добавлен 03.10.2010Формализованные методы финансового анализа. Традиционные и классические методы экономической статистики. Экономико–математические методы анализа. Математическо-статистические методы изучения связей. Финансовые вычисления и теория принятия решения.
курсовая работа [196,0 K], добавлен 05.05.2009Способы сбора и группировки статистических сведений, полученных в результате наблюдений или экспериментов. Методы анализа статистических данных в зависимости от целей исследования. Проверка статистических гипотез, оценка неизвестной вероятности события.
курсовая работа [172,8 K], добавлен 15.11.2009Построение баланса динамики численности населения. Статистические показатели рождаемости и смертности, абсолютные и относительные показатели воспроизводства трудовых ресурсов. Анализ численности персонала. Расчет валового национального дохода РФ.
контрольная работа [158,1 K], добавлен 23.06.2014