Моделирование факторов коммерческой успешности кинопроекта
Методология отбора и анализа факторов коммерческого успеха кинофильмов. Восстановление отсутствующих данных переменной бюджета с помощью метода MultipleImputation. Применение и анализ новой переменной репутационного индекса для актеров и режиссеров.
Рубрика | Экономико-математическое моделирование |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 28.08.2020 |
Размер файла | 7,4 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ
ВЫСШАЯ ШКОЛА ЭКОНОМИКИ
ФАКУЛЬТЕТ ЭКОНОМИЧЕСКИХ НАУК
ОБРАЗОВАТЕЛЬНАЯ ПРОГРАММА «ЭКОНОМИКА»
БАКАЛАВРСКАЯ ВЫПУСКНАЯ РАБОТА
Моделирование факторов коммерческой успешности кинопроекта
Оксана Омельченко, 165
Научный руководитель:
Татьяна Анатольевна Ратникова,
к.ф.-м.н., доцент департамента
прикладной экономики ФЭН
2020
Оглавление
Введение 3
Глава 1. Методология отбора и анализа факторов коммерческого успеха кинофильмов 9
1.1 Обзор литературы 9
1.2 Описание выборки 15
1.3 Предварительный анализ данных 21
Глава 2. Восстановление пропущенных наблюдений 25
2.1 Теоретическое описание метода MultipleImputation 25
2.2 Восстановление отсутствующих данных переменной бюджета с помощью метода MultipleImputation 27
Глава 3. Репутационный индекс 30
3.1 Прикладное значение репутационного индекса 30
3.2 Описание метода расчета репутационного индекса 32
3.3 Применение и анализ новой переменной репутационного индекса для актеров, режиссеров и кинокомпаний 33
Глава 4. Построение и анализ итоговой модели коммерческой успешности кинопроектов 39
4.1 Исследование переменной рейтинга фильма на наличие эндогенности39
4.3 Метод многоуровневой (иерархической) модели 43
4.4 Построение многоуровневой модели коммерческой успешности кинопроекта 45
4.4.1 Результаты исследования 47
Заключение 53
Список литературы 56
Приложение 59
Введение
С появлением кинематографа в конце XIX века, кино стало одним из главных видов культурного досуга для общества, вызывая глубокий интерес, обеспечивая яркие впечатления, иподнимая волну обсуждений проблем, затронутых в картинах. В то же время, киноиндустрияиграет важную роль не только в социальной сфере, но и экономической, являясь развитой отраслью с сильной конкуренцией, высокими темпами роста и миллиардами долларов прибыли с кинопроектов.По данным статистики мировой кассовый сбор и количество проданных билетовнепрерывно растут, иными словами, мировая тенденция спроса на продукцию киноиндустрии увеличивается. (График 1,2).
коммерческий успешность кинопроект
График 1. Динамика кассовый сборов (MPAA,2018)
График 2. Динамика количества проданных билетов (MPAA,2018)
Однако, частный спрос на продукты кинематографа является непредсказуемым, что выступает важной особенностью данной отрасли. Причина заключается в том, что фильм как продукт является опытным иуникальным благом, поэтому реакция зрителей абсолютно неопределенна до премьеры. Вследствие этого, киноиндустрия является не только растущей, но и крайне рисковой отраслью как для режиссеров, более заинтересованных в кино как в искусстве, так и продюсеров, для которых это прибыльный бизнес. Речь идет не только о главной функции фильма, такой как развлекательная или морально-этическая, где есть риск не достучаться до сердец зрителя. В контексте данной работы более значимым является коммерческий вопрос о факторах, повышающих доход от кинопродукта и снижающих издержки, то есть риски не окупаемости бюджета кинопроекта, который может быть весьма значительным.
В самом деле, кинематографический бизнес требует высоких первоначальных вложений (бюджета), и в связи с необходимостью привлечения больших средств на создание фильма появились разные способы финансирования кинопроизводства. В развитых странах возникли банки и частные фонды, специализирующиеся на инвестировании кинопроектов (Татарников, 2013).
Для потенциальных спонсоров предсказание прибыли до премьеры фильма представляется трудной, но крайне важной задачей, посколькуобъяснение и прогнозирование спроса на прокат позволяет снизить риски убытков от вложений в картину. Это мотивирует исследователей к систематическим попыткампредопределить будущее фильма математическим или эконометрическим путем. И, хотя каждый фильмявляется уникальным продуктом,есть ряд типичных показателей, которые поддаются систематическому наблюдению и измерению в каждом случае. Поэтому выявление и уточнение совокупности факторов, связанных с кинопроизводством и влияющих на успех картины, представляет большой интерес. Сконструированная методология измерения факторов успешности кинопроекта может быть применена в других сферах искусства, будь то музыка, театр илиорганизация художественных выставок.
Начиная с 1980-х годов, исследователи в сфере экономики культуры используют различные методы для выявления зависимости кассовых сборов от бюджета, жанра, наличия премий и даты выхода кинопроекта. Результаты исследований отличаются друг от друга в зависимости от набора характеристик фильма, учтенных авторами. В моделях часто отдельно анализируется рейтинг фильма, как одна из главных характеристик успеха кино. Дата выхода фильма, как правило, представлялась как сезон и не отображала состояние конкуренции рынка кинематографа в момент выхода. Существует важная проблема различных интерпретаций значимости актеров и режиссеров, и никак не учитывается репутация кинокомпаний.
В данной работе главным измерением коммерческого успеха кино будет служить кассовый сбор. Этот показатель заключает в себе отклик зрителей, формирующий спрос на рынке. Инвестиции в кино будут представлены в виде бюджета, который был вложен в создание проекта. Характеристикой восприятия фильма потребителями послужит рейтинг.
Одним из рычагов снижения коммерческого риска для компании является привлечение к проекту популярных актеров, режиссеров и меры (например, рекламные) повышения популярности самих кинокомпаний. Внимание зрителей к кинопроектучасто психологически бывает обусловлено узнаваемостью актера, исполняющего роль главного героя, больше, чем сюжетом и идеей фильма.
Важным фактором влияния на выручку может быть жанр и дата выхода фильма с точки зрения измерения интенсивности конкуренции на рынке в момент выхода. В зависимости от жанра и месяца выхода кино в данной работе рассчитан показатель конкуренции, который, предположительно, может влиять на кассовый сбор. К примеру, если в январе вышло 7 комедий, а в феврале всего одна, то вероятнее, что февральская комедия соберет большую выручку. Такой способ учета конкуренции не применялся в более ранних работах о прогнозировании выручки от кинопроката.
Стоит подчеркнуть, что жанр кинокартины для потребителей является буквально первым признаком, по которому принимается решение о просмотре кино (Desai, Basuroy, 2005). В неделю выходят порядка двух-трех фильмов, следовательно, конкуренция на рынке кинематографа крайне высока, и такая категория, как жанр, может стать ключевой для зрителя. Предположительно, все характеристики фильма могут по-разному оказывать влияние на кассовые сборы в зависимости от жанра.К примеру, дорогой актер в драме повысит выручку сильнее, чем в фильме ужасов. Учитывая это, производители могут снизить издержки на гонорар актера в жанре ужас и вложить деньги в спецэффекты.
Настоящая работа основана на статистических данных официального сайта IMDb, характеризующих американскую киноиндустрию с 1986 по 2016 год. Переменными модели являются параметры выручки кинопроекта, рейтинга, бюджета, репутации актеров, режиссеров и кинокомпаний, возрастной аудитории, популярности, интенсивности конкуренции, цены на билет, продолжительности картины. Выборка составляет 4278фильмов, в которыхнаблюдается выручка более одного миллиона долларов США. Кассовый сбор фильмов не является мировым, а учитывается только в стране производителя. Все денежные показали, включая выручку, бюджет и цену на билет переоценены с учетом индекса потребительских цен на 2020 год.
В работе делается предположение о том, что кассовый сбор и рейтинг формируются одновременно. Это связано с тем, что общественное мнение и оценка фильма мгновенно распространяются в сети и имеют прямое влияние на зрительский спрос в период проката фильма. Этот факт может породить проблему эндогенности.
Для оценки значимости влияния актеров, режиссеров и кинокомпаний (далее - производители) на кассовый сбор конструируются репутационные индексы. Данный подход позволяет присвоить численные значения категориальным факторам успешности каждого проекта на кинорынке. Чтобы оценить важность репутации для объяснения коммерческого успеха кинопроекта в зависимости от жанра в данной работе стоится иерархическая регрессионная модель, где зависимая переменная - кассовый сбор.
Специфическую проблему для количественного анализа создают наблюдения, в которыхпродюсеры скрывают истинное значение бюджета. В данной работе пробелы в данных устраняются с помощью метода MultipleImputation.
Основная цель работы: построение регрессионной модели выручки кинопроекта, позволяющей выявить статистически значимые факторы его коммерческого успеха.
Задачи:
№1 Устранить проблему пропуска переменных с помощью метода MultipleImputation
№2 Сконструировать репутационный индекс для актеров, режиссеров, сценаристов и кинокомпаний, отображающий их успешность
№3 Инструментировать экзогенными факторами эндогенную переменную рейтинга
№4 Построить иерархическую линейную модель зависимости выручки от независимых характеристик, в которой будет моделироваться влияние объясняющих факторов, обусловленное жанром картины.
Краткое содержание работы:
Глава 1 настоящей работы посвящена анализу факторов, влияющий на коммерческий успех фильма. В первой части Главы 1 представлен обзор используемой литературы, который включает описание значимых факторов кинопроектов, используемые методы проверки гипотез, а также полученные результаты работ исследователей экономики. В Главе 1.2,на основе предшествующих выводов и личных наблюдений, отобраны и эмпирически описаны факторы, которые являются характеристиками выручки в настоящей работе. Также представлены логические обоснования и доводы к включению определенных параметров в модель. Глава 1.3 посвящена эконометрическому анализу данных на предмет выявления системности, выбросов, зависимости и нормальности распределения. В Главе 2 описывается процесс восстановления пропущенных переменных с помощью метода MultipleImputation с теоретической и практической стороны. Глава 3 посвящена конструированию индекса репутации для производителей кино. В первой части главы обосновывается значимость данного показателя для данной индустрии. Вторая часть содержит теоретическое описание метода расчета репутационного индекса. В третьей части демонстрируется практическое применение метода и анализ новых параметров производителей. Заключительная Глава 5 посвящена построению итоговой иерархической модели для проверки основных гипотез работы.Данная глава включает предварительное тестирование эндогенности и мультиколлинеарности некоторых факторов с помощью Stata. В последней части главы представлено описание и применение метода многоуровневой модели в Stata.
Глава 1. Методология отбора и анализа факторов коммерческого успеха кинофильмов
1.1 Обзор литературы
Роль кинематографа является актуальной темой в экономике культуры, которой посвящено довольно много работ. Экономические и финансовые механизмы, приводящие в действие киноиндустрию, многогранны и не изучены до конца. Удивительным мир кино является не только для зрителей, но и бизнесменов, инвесторов и продюсеров, однако, по другим причинам.
Джон Седжвик исследует экономическую историю кинематографа, начиная с истоков его создания (Sedgwick, 2004). Автор сравнивает развитиеевропейского и американского кинематографа, приводя примеры историй успеха и провалов различных компаний, например,WarnerBros. Как и в любой сфере, у киноиндустрии также бывают трудные времена, особенно в периоды войн. Седжвик прослеживает зависимость экономического положения населения и кассовых сборов, утверждая, что люди ограничивают себя в услугах кинотеатра во времена кризисных ситуаций. Однако, в спокойное время, минимальная доходность от вложений в кино колеблется от 7 до 30%.
А.С. Татарников проводит межстрановой сравнительный анализ развитиякинорынков. Автор подтверждает, что при благоприятных экономических условиях кинематограф является значимым источником бюджета. Автор приводит пример российского рынка. Во времена СССР рентабельность кинематографа составляла 900%, и отрасль кино являлась важным источником пополнения бюджета. Затем, во времена распада Советского Союза киноиндустрия сильно пострадала. Однако начиная с 2000 года, когда начал прослеживаться рост ВВП и среднего дохода на душу населения, зрители вновь стали посещать кинотеатры, количество которых возросло благодаря строительству торгово-развлекательных центров. Темпы роста в 30% годовых стали привлекать все больше инвестиций спонсоров в производство. С тех пор, кино стало прибыльным вложением и высокодоходным местом размещения рекламы в России.
Прогноз и объяснение факторов выручки от кино является трудной, а поэтому весьма привлекательной задачей для ученых. Задаваясь данным вопросом, исследователи получали различные модели и противоречивые результаты. В первую очередь, ведутся споры о реализуемостизадач предсказания или объяснениякассовых сборов. Одни ученые считают, что в зависимости от располагаемой информации и степени обоснованностимодели, это сделать вполне реально, а другие отрицают это, утверждая, что зритель абсолютно не предсказуем.
А.Е. Татарников в работе «Измерения и прогнозы в киноиндустрии. Модели и эксперименты» (Татарников, 2016) разделяет модели на два типа - количественные и поведенческие. Первые включают в себя модели регрессионного и кластерного анализа, основанные на данных о жанре, бюджете и звездах. Второй вид заключается в моделировании потребительского решения, основанном на поведении человека.
Применяя поведенческую модель, авторвыделяет в качестве основного предиктора успеха кино рекламную кампанию, поэтому предлагает строить прогноз на основе зрительских эмоций (воодушевление, страх и т.д.), вызванных трейлером к фильму, данные о которых собирает путем анкетирования. Из количественных переменных в модели учитывается месяц выхода фильма и количество прокатных копий на первой неделе. Таким образом, Е.А. Татарников фиксирует основные эмоции, которые могут способствовать положительному решению зрителя посмотреть фильм после трейлера и привести к росту кассовых сборов.
Однако, для данной работы больший интерес представляет опыт оценивания количественных моделей и выбора факторов для объяснения кассовых сборов и спектр методов, которые применяют исследователи (линейные,логарифмические, иерархические регрессии или даже нейронные сети).
УченыеПраг и Касавант стали родоначальниками в исследовании факторов, объясняющих кассовый сбор фильма. По результатам анализа положительным эффектом на выручку обладают производственный бюджет, мнения критиков, присутствие звезд и премий кинофильму. Эта первая работа служит примером для многих последователей, однако, оставляет после себя множество вопросов. Важным упущением является то, что не учитывается репутация кинокомпании и режиссера, так как их авторитет может привлечь внимание зрителя даже в отсутствии знаменитого актера. Также в работе не учитывается жанровая неоднородность фильмов (Prag, Casavant, 1994).
Исследователи изуниверситета Баффаловыделяют сильное влияние жанра и звезд и включают в модель обзоры критиков перед всемирной премьерой. Однако, авторы утверждают, что только с учетом звездного влияния мнение критиков становится значимым и влияет положительно. В отличие от вышеописанной модели, жанры разделены на две категории «более популярный» и «менее популярный» для зрителей. Исследователи приходят к выводу, что наличие звезды и хороших отзывов критиков важны только для «менее популярных» жанров. (Desai, Basuroy, 2005).
Каким образом включать жанр в модель остается важным вопросом. В большинстве ранних работ исследователи анализировали жанр как отдельную переменную. Так, регрессионная модель Терри, объясняющая кассовый сбор, также включает переменные обзора критиков, как долю положительных отзывов, дату выхода с точки зрения количества выходных дней, возрастной рейтинг, жанр и является ли фильм сиквелом, то есть продолжением (Terry, 2005). По результатам исследования Терри, жанр приключение, возрастной рейтинг, бюджет и сиквел положительно влияют на выручку, а дата выхода (количество выходных в месяце) оказалась незначимой. Возможно, причиной этому послужило то, что модель проверялась на данных 2001-2003 гг. США, где в каждом месяце примерно одинаковое количество выходных.Предположительно, если проводить анализ на российских данных, этот показатель был бы важен, поскольку в стране существуют продолжительные новогодние и майские каникулы.
Стоит подчеркнуть, что Терри исследует фильмы всех жанров одновременно, не подразделяя на категории, что является серьезным недостатком данной работы. Позднее, исследователи из Санкт-Петербургского филиала Высшей школы экономики приходят к выводу, что оценивать характеристики, влияющие на выручку, необходимо отдельно для каждого жанра, поскольку они имеют разное влияние на коэффициенты (Антипов, Покрышевская, 2010).
Учитывая данный вывод, Е.А. Антипов в своей работе иначе построил регрессионную модель, включающую в себя бюджет, звездность актеров и режиссеров, жанр (Антипов, 2014). Автор строит иерархическую модель, где коэффициенты влияния актеров, режиссеров и бюджета зависят от дамми переменных жанра. Антипов Е.А. предполагает, что предельные эффекты данных переменных на кассовый сбор будут отличаться в зависимости от жанра. Впервые в данной работе, автор попытался решить проблему учета конкуренции фильмов в момент выхода в прокат с помощью подсчета совокупной силы авторского состава и бюджета фильмов конкурентов. То есть фильм, в котором актеры обладают наибольшей популярностью, имеют большие преимущества перед своими конкурентами. По результатам анализа, сила актеров важна для фильмов приключений, драм и триллеров, а отдача от бюджета больше у боевиков, фильмов ужасов и триллеров. Также автор утверждает, что чем выше суммарная сила конкурентов, тем ниже собственная сила рассматриваемого кино. Однако, данная модель не учитывает влияние рейтинга, охвата возрастной аудитории и популярность кинокомпании.
Существуют различные вариации оценивания влияния звездности актеров в фильме. Популярнымметодикой учета значимости актеров на выручку является подсчет наград, включая премию Оскар. Этот способ не представляет сложностей. Однако, некоторые авторысконструировали более специфичные методы.
Так, Е.А. Антипов, исследуя данные рынка США и Канады в период с 1943 по 2012 год, пытается решить проблему измерения силы актеров и режиссеров с помощью взвешенного дисконтирующего множителя по выведенной формуле:
где WCIAR - это взвешенные кумулятивные сборы, скорректированные на инфляцию; IAR - это кассовые сборы, скорректированные на инфляцию.
Затем автор проводит корреляционный анализ значимости актеров, режиссеров и кассовых сборов, и, таким образом, получает необходимые коэффициенты, где и . Данный метод остается не до конца ясным и не учитывает никаких характеристик актера, кроме как выручку фильма с его участием.
Иной метод определения вклада в результирующий показатель репутации производителей (художников) был предложен профессорами Крауссл и Эсландом при исследовании ценообразования на художественные полотна (Krдussl, Elsland, 2011).Авторы сконструировалидвухшаговую модель с гедонистической корректировкой качества полотна, которая применяется в данной работе.
На первом этапе авторы оценивают логарифм цены полотна от характеристик и сохраняют коэффициенты :
(1)
где - цена полотнаi художника y, - j-характеристика полотна, - дамми-переменная художника.
Корректировка качества представляет собой экспоненту в степени среднего изменения характеристик картин, проданных художниками, включающая коэффициенты из уравнения (1):
(2)
Затем авторы выбирают одного базового художника, и по выведенной формуле присваивают свой относительный коэффициент репутации другим художникам:
(3)
где,n - количество полотен художника у+t,m - количество полотен художника у, - коэффициент характеристики полотна.
Уравнение (3)показывает, что индекс равен отношению невзвешенных геометрических цен живописи художника yи y+t, деленному на гедоническую корректировку качества. Количество картин, проданных за один период, как правило, неравно, о чем свидетельствуют n и m. Для базового художника данный индекс равен единице. Иными словами, он сравнивается с другими художниками. При условии большей популярности и значимости для цены, показатель будет больше единицы, и наоборот.
Противоречивое мнение представляется в работе А.Б. Долгина, где рассматриваются данные по фильмам с 1985 по 1996 год в Северной Америке (Долгин,2006). Автор приходит к выводу, что существует лишь несколько актеров-исключений, когда их присутствие положительно сказывается на выручке, но в целом, звездность актеров не имеет большого значения.
ДиВейни и Уолш в своей работе отмечают, что актеры становятся успешными благодаря исключительно успеху самого фильма, а затем их участие в кино становится сигналом, что фильм достоин просмотра.Авторы имеют в виду, что игра определенных актеров не способствует увеличению рейтинга фильма, скорее наоборот, другие факторы кино повышают популярность актера, а затем актер избирательно участвует в кино, которое априори принесет ему успех. Поэтому важно принимать во внимание репутацию актеров, режиссеров и кинокомпании. (DeVany, Walls, 2004).
Некоторые исследователи предпринимали попытки объяснить или предсказать формирование не кассовых сборов, а рейтинга. В качестве объясняемых переменных были включены данные об актерах и режиссерах с сайта IMDb(Achal, Manas, 2011). Рейтинг является отображением реакции зрителей к фильму. Это крайне важная характеристика, поскольку формирование рейтинга преимущественно осуществляется пользователями в первые полгода от начала премьеры. Исследователи отмечают огромную роль общественного мнения в социальных сетях, которое распространяется с мгновенной скоростью. Ранее это называлось «сарафанным радио», однако сегодня существует огромное количество популярных интернет пространств, где люди делятся мнениями, советами и популяризируют кино в хорошем или плохом свете. Первые зрители могут предопределить судьбу фильма даже больше, чем маркетинговая кампания, за счет большей аудитории и уровня доверия.
1.2 Описаниевыборки
В данной работе рассмотрена выборка показателей для 4278 фильмов. Исследуемый временной период составляет 30 лет с 1986 до 2016 года. Все фильмы исключительно американского происхождения, поэтому выводы данной работы действительны преимущественно для американскогокинорынка. Однако не стоит исключать, что для схожих стран по развитию экономики и кинематографа результаты также будут верны.
Базой данных для анализа является портал IMDb (InternetMovieDatabase) - самая крупная открытая информационная система данных о кинематографе. Сайт охватывает параметры 5 миллионов фильмов и 8,5 миллионов актеров, режиссеров и сценаристов. С 1998 года данной базой владеет ДжеффБэзос , владелец компании Amazon. С 2018 года IMDb располагается на 54 месте по посещаемости в мире, в США - на 30 месте, что говорит о его высокой популярности и большом охвате зрителей всего мира.
Важной особенностью данного портала является возможность зрительского голосования. В настоящей работе реакция зрителей, отображающая успешность кинопроекта, представлена в виде рейтинга и популярности, то есть количества людей, которые приняли участие в голосовании по поводу фильма. Поскольку различное количество зрителей оценивают каждый фильм, то реальное значение рейтинга может быть искажено. В связи с этим, взвешенный рейтинг рассчитывается по выведенной формуле на основе подлинной байесовской оценки:
(4)
где v - количество голосов за фильм, m - минимальное количество голосов для включения в рейтинг, R - средний рейтинг фильма, С - средний рейтинг среди всех фильмов.
С помощью данного показателяформируются знаменитые списки «250 лучших фильмов» и «100 худших фильмов» всех времен.
По результатам наблюдения за формированием чистого рейтинга, можно утверждать, что период оценивания кинопроекта пользователями продолжается около шести месяцев после премьеры фильма. Со временем показатель рейтинга колеблется и изменяется незначительно. Следовательно, можно сделать два предположения. Во-первых,ожидания резких изменений рейтинга в противоположную сторону сводятся к нулю. Таким образом, использование данных первоначального рейтинга даже десятилетней давности будет актуально. Во-вторых, кассовый сбор фильма и рейтинг формируются одновременно. Из этого предположения вытекает две задачи: выяснить вид зависимости (отрицательная, положительная или ее отсутствие) между выручкой и рейтингом; выявить возможную проблему эндогенности, возникающую вследствие одновременности факторов.
В настоящей работе используется взвешенный рейтинг(rating)в целях устранения проблемы искаженной оценки фильмов. Данный фактор был рассчитан с использованием формулы (4). С эмпирической точки зрения он интересен как показатель реакции зрителей после просмотра фильма. Пусть кассовый сбор отображает реакцию до просмотра фильма, то есть ожидания людей, что кино заслуживает их потраченного времени и денег. Тогда возникает вопрос о сравнении двух реакций, о совпадении или разногласии их тенденций, а также влияющих на их формирование факторах.
Количество проголосовавших отображает популярность фильма(popularity). Повышенный интерес к фильму может привести к росту кассовых сборов. Поскольку отсутствует информация о количестве зрителей, в силу ее недоступности, данный фактор является еепрямым заменителем.
Выручка (revenue) кинофильма является объясняемой переменной, характеризующей коммерческий успех. Поскольку временной промежуток проката фильмов составляет 30 лет, сравнивать выручку фильма 1986 года и 2016 года представляется бессмысленным. Поэтому кассовые сборы прошли предварительную обработку с помощью Индекса потребительских цен США на 2020 год. Так, разница в ценах между 1986 и 2020 годом составляет 134%. Другие денежные показатели, такие как бюджет и цена на билет(priceticket), былискорректированы на ИПЦ.
В Таблице 1 приведены максимальные значения кассовых сборов трех фильмов с учетом ИПЦ и без корректировки ИПЦ, которые доказывают важность данного шага обработки, так как фильмы-лидеры изменили позиции и кассовые сбор.
Таблица 1. Рекордные фильмы по кассовым сборам с учетом и без учета ИПЦ
Название фильма |
Год |
Выручка (без ИПЦ) USD |
|
Звездные войны: Пробуждение Силы |
2015 |
936662225 |
|
Титаник |
1997 |
658672302 |
|
Мир Юрского периода |
2015 |
652270625 |
|
Название фильма |
Год |
Выручка (с ИПЦ) USD |
|
Титаник |
1997 |
1053875683 |
|
Звездные войны: Пробуждение Силы |
2015 |
1015341852 |
|
Звёздные войны. Эпизод I: Скрытая угроза |
1999 |
730798803 |
В настоящей работе бюджет фильма(budget) является производственным и маркетинговым в совокупности. Некоторые наблюдения отсутствуют, поскольку данной информации нет на сайте по неизвестной в точности причине. Предварительный анализ показывает, что преимущественно низкодоходные кинопроекты имеют пропуски в бюджете. Это может быть связано с тем, что директоры и продюсеры скрывают эту информацию, поскольку ее раскрытие не является обязательством.
Важное внимание в данной работе уделяется переменной жанра (genre). Жанр является первичным классификатором для зрителя, без которого ориентироваться в кино было бы затруднительно и неудобно. Поэтому жанр может послужить определяющим фактором при решении просмотра фильма. К примеру, каждая страна обладает определенным менталитетом и стилем жизни, что может отображаться на вкусах в кино. Исследования в этой отрасли могут помочь создателям и спонсорам киносократить издержки на спецэффекты, актеров или сценаристов, заведомо зная, какой жанр принесет им прибыль с большей вероятностью. В таком случае, жанр может служить рычагом для снижения риска потерь выручки, являясь классификатором для зрителей. Но производить исключительно фильмы популярных жанров представляется невозможным. В связи с этим, у ученых созревает вывод о том, что непопулярность жанра может быть компенсирована знаменитостью актера или режиссера, чтобы привлечь внимание зрителей. Однако, это будет дороже для продюсеров, так как гонорары хороших актеров растут с высокой скоростью (DeSilva, 1998).
Согласно одной из гипотез данной работы, жанр(genre) влияет на специфику создания кино и коэффициенты факторов, влияющих на выручку. Каждый фильм имеет несколько жанров, где один является превалирующим. В данной работе каждому фильму присвоен именно такой. Портал IMDbнасчитывает 15 основных жанров, однако, в данной работе схожие жанры были соединены для упрощения анализа. Таким образом, переменная жанрапредставлена в виде восьми фиктивных переменных: приключение, комедия, боевик, драма, детектив, ужас, мультфильм, биография(График 3).
График 3. Распределение числа фильмов по жанрам
Еще одной зависимой переменной является индекс интенсивности конкуренции(competition). В каждом месяце выпускается различное количество фильмов разных жанров. В данной работе делается предположение о том, что чем больше выпущено фильмов одного жанра в месяце, тем больше конкуренция и, как следствие, падает вероятность похода в кино на определенный фильм. Таким образом, для вычисленияиндекса, необходимо провести предварительную работу вExcel, чтобы рассчитать количество выпущенных фильмов каждого жанра в месяце. Затем посчитать долю фильмов одного жанра среди всех выпущенных фильмов в месяце. По результатам, в среднем, в месяце выходит около 12 фильмов. Преимущественно, фильмы выпускаются в апреле, августе и октябре.
Интерес представляет влияние на выручку продолжительностифильма(runtime).Данный показатель колеблется от 69 до 271 минуты. Предположительно, существует определенный «идеальный» промежуток, в котором достигается наибольшая выручка, затем реакция зрителей может идти на спад.
Всемирная организация MPAA обладает правом решать, какую возрастную категорию и при каких условиях можно допустить к просмотру фильма. Всего существует пять категорий(audience).G - генеральная аудитория, обозначающая отсутствие любых ограничений для детей; PG - разрешается смотреть всем, однако могут быть моменты фильмов, которые не понравятся родителям детей; PG-13 - родители должны быть осторожны при показе фильмов детям-тинейджерам; R -фильмы содержат материал для взрослых, но при предварительном просмотре и оценке родители могут показать детям; NC-17 - исключительно взрослая аудитория. Поскольку в выборке оказалось лишь 7 фильмов последней категории, они были добавлены в R. Данный фактор отображает охват потенциальной аудитории. Ее рост может привести к большей выручке.
Каждый фильм является производством кинокомпании, сценариста, режиссера и актера. Стоит отметить, что учитывается актер, исполняющийисключительно главную роль. Анализ уникальных производителей показывает, что наибольшее число производителей (2656) принадлежит категории сценаристов (График 4). Более детальный обзор данных говорит о том, что большая доля сценаристов являются и режиссерами, и не более десяти сценаристов являются популярными писателями. В связи с этим, данная категория не будет включена в модель.
В настоящей работе предполагается, что участие производителя в создании фильма является параметром, который учитывают зрители при принятии решения о просмотре кино. Следовательно, конструирование показателя значимости производителей на выручку является важной задачей. В связи с этим, в данной работе рассчитывается репутационный индекс (индекс ценности) для производителей методом Крауссл и Есланда, описанный ранее. Подробное применение и механизм расчета приведен в Главе 3.
График 4. Распределение производителей
1.3 Предварительный анализ данных
Данная глава посвящена предварительному анализу и обработке данных,чтобы подготовить их к эконометрическим тестам и проверке гипотез. Ниже представлено краткое описание переменных, используемых в модели (Таблица 2).
Таблица 2. Краткое описание переменных
revenue |
выручка (кассовый сбор в долларах США) |
|
budget |
бюджет |
|
genre |
жанр(категориальная переменная для 8 жанров) |
|
audience (aud1, aud2, aud3, aud4) |
охват аудитории (фиктивные переменные, где базовая переменная - aud4) |
|
popularity |
популярность (количество проголосовавших за фильм) |
|
competition |
интенсивность конкуренции (доля конкурентов одного жанра в одном месяце) |
|
rating |
рейтинг (взвешенный) |
|
price |
цена билета |
|
actor, director, writer, company |
репутационный индекс актеров, режиссеров, сценаристов, кинокомпаний |
|
winter, spring, summer, autumn |
сезон (фиктивные переменные, где базовая переменная -spring) |
Предварительно, каждая переменная была исследована на наличие выбросов с помощью диаграммы рассеяния и z-оценки. Последний метод позволяет проверить каждое наблюдение на предмет его отклонения от центра распределения. Z-оценка рассчитывается как:
где - значение переменной i-того наблюдения, - среднее значение переменной по всей совокупной выборки, - стандартное отклонение переменной повсей совокупной выборки.
Наблюдение считается выбросом, если его z-оценка больше трех, то есть отклоняется больше, чем на три. Такие выбросы могут помешать качественным результатам метода MultipleImputation, поэтому онидолжны быть удалены. В их числе оказались 95 фильмов с самой высокой кассой, поскольку их выручка с большим отрывом отличается от основной массы.
После вышеописанных преобразований, необходимо изучить дескриптивную статистику переменных(Таблица 3).Каждый показатель насчитывает 4183 наблюдений с выручкой более 1 млн долларов, кромебюджета (3357 наблюдений). Таким образом, выявляется проблема пропуска почти четверти наблюдений, которая будет решена в следующей главе.
Таблица 3. Дескриптивная статистика (Источник: собственные расчеты (Stata.14))
Variable |
Obs |
Mean |
Std. Dev. |
Min |
Max |
|
revenue |
4,183 |
5.67E+07 |
6.15E+07 |
1007246 |
3.20E+08 |
|
budget |
3,357 |
4.81E+07 |
4.73E+07 |
12810 |
3.06E+08 |
|
rating |
4,183 |
6.214631 |
0.9863323 |
1.5 |
9.3 |
|
popularity |
4,183 |
77853.13 |
126188.1 |
103 |
1900000 |
|
competition |
4,183 |
0.2692279 |
0.1440666 |
0.043478 |
0.75 |
|
priceticket |
4,183 |
8.536059 |
0.3708066 |
8 |
9.29837 |
|
runtime |
4,183 |
105.841 |
15.96585 |
69 |
202 |
Анализ дескриптивной статистики показывает, что среднее значение выручкизначительно превышает среднее значение бюджета. Наименьший бюджет фильма составляет 12 810 долларов, а наибольший 306 000 000 долларов, что говорит о большом разбросе значений. Наибольшее количество голосов за фильм от зрителей сайта составляет 1 861 666, в то время как самый непопулярный фильм набирает 103 голоса. Индекс интенсивности конкуренции, в среднем, составляет 0,27, то есть при выпущенных 10-12 фильмах в месяц разных жанров, около 3-4 фильмов имеют один жанр. Цена билета за тридцать лет колебалась от 8 до 9,29 долларов (с учетом ИПЦ). В среднем, люди оценивают фильмы в 6,21 баллов из 10, поскольку рейтинг варьируется от 1,5 до 9,3.
Более детальное описание кассовых сборов показывает, что 1% самых низкоприбыльных фильмов имеют выручку от 1 млн до 1,2 млн долларов. В то время как, 1% самых кассовых кино имеют больший разброс выручки - от 273 млн до 320 млн долларов США.Исходя из статистики, скошенность (Skewness) составляет 1.74, что не соответствует нормальному распределению, так как отклоняется от нуля. Это является доводом к использованию логарифма выручки в модели.(Приложение. Таблица 18) В свою очередь, переменная рейтинга более близка к нормальному распределению. Подтверждением этого служит графический анализ kdensityраспределения и детальная статистика, где островершинность (Kurtosis) и скошенность близки к нормальным значениям (Приложение. Таблица 19).
При анализе выручки в каждой возрастной категории, выяснилось, что среднее значение значительно меняется. 94 миллионадолларов - для самой обширной категории G; 73 миллиона - категория PG, когда есть смущающие родителей моменты; 66 миллионов - для PG-13, когда родители с осторожностью могут допускать подростков к просмотру; и, наконец, всего 42 миллиона - для R и NC-17 аудиторий, где есть взрослый материал, однако допустимый для подростковс разрешения родителей (Приложение. Таблица20).
Интересно, что в исследуемых границах значения выручки (более 1 млн долларов) среди всех жанров наибольшее среднее значение кассовых сборов имеют именно мультфильмы, оно достигает 120 миллионов. Данный факт является логичным следствием или причиной того, что наибольшее среднее значение выручки достигается у аудитории всех возрастов G. Вторым жанром по величине сборов является боевик. В то время как наименьшая касса обнаружена у драматических фильмов (Приложение. Таблица 22).
Стоит отметить, что по результатам статистики наибольшую выручкуполучают кинопроекты летом,в среднем,73 миллиона долларов. Такой результат завершает логическую цепочку, так как лидеры по выручке мультфильмы, производители выпускают премьеры именно в период отпусков и каникул своей целевой аудитории - детей. В свою очередь, зимой выручка составляет около 57 миллионов, весной - 51 миллион, и наименьшую выручку приносит осень - 46 миллионов.Такая ситуация может быть объяснима ритмом жизни, наличием праздников в жизни людей в данные периоды. (Приложение. Таблица21).
Для графической проверки нормальности распределениябыли построены гистограммы и графики «квантиль-квантиль» для каждой переменной (Приложение. Графики 7,8,9,10). При наблюдаемом отсутствииотклонений вдоль линии, распределение является нормальным у переменной рейтинга, логарифма выручки и логарифма популярности. Однако, более точные результаты покажут тесты. Спецификацию модели станет возможным определить после построения репутационного индекса и восстановления пропусковбюджета.
Глава 2. Восстановление пропущенных наблюдений
2.1 Теоретическое описание метода MultipleImputation
Как правило, для любого исследования предпочтительнее иметь большую выборку, чтобы результаты были корректнее и ближе к реальности. Но иногда исследователи сталкиваются с проблемой частично пропущенных данных, которые могут помешать представлению более полной картины изучаемого явления. Первой причиной такой ситуации может послужить нежелание компании раскрывать полностью свою информацию. Поскольку она может представлять компанию с невыгодной стороны либо являться секретной. Во-вторых, данные могут храниться на отдельных источниках. Множество компаний доверяют свои данные лишь официальным источникам или информационным агентствам, к которым не существует бесплатного и открытого доступа. Исследователю, с одной стороны, невыгодно терять наблюдения для анализа, но с другой, слишком долго и трудозатратноискать вручную пропущенные значения. Тогда, если для достижения цели работы необходимы все наблюдения, существует несколько способов решения проблемы пропущенных данных.
Первый способ - удаление конкретных наблюдений или целых переменных, содержащих пустые значения. Данный метод подходит в ситуации, когда таких пропусков не так много, и исключение наблюдений с пропусками неиспортит выборку кардинально. Если наблюдение было пропущено неслучайно, то его удаление может сделать оценки смещенными и неэффективными.
Второй способ - замена пропущенных наблюдений средним значением этой переменной. Это самый популярный и несложный метод, который не уменьшает количество наблюдений, а также не создает высоких рисков искажения результатов зависимости.
Третьим способом является метод SingleImputation, в котором первоначально оценивается регрессия переменной с пропущенными значениями по зависимой переменной, а затем строится итоговая модель, где оценка переменной с пропущенными значениями является независимой переменной. Таким образом восстанавливаются пропущенные значения. Но неопределенность оценок коэффициентов первоначальной регрессии ведет к неопределенности в итоговой модели, вследствие чего возникают проблемы неэффективности оценок. Это является недостатком данного метода, который учитывается в методе MultipleImputation.
Четвертый способ, метод MultipleImputation, является наиболее эффективным. Суть его заключается в предсказании значений пропущенных наблюдений на основе переменных, для которых все наблюдения присутствуют, с помощью регрессии. Отличительной чертой этого метода является то, что используется метод MarkovChainMonteCarlo (метод Монте-Карло с цепью Маркова), с помощью которого решаются проблемы отсутствующего набора данных. Процесс вменений пропущенных значений повторяется многократно и последовательно.
Данный метод состоит из нескольких глобальных шагов.
В первую очередь, необходимо оценить регрессию:
,
где зависимая переменная с пропущенными значениями, а- независимые характеристики без пропусков.
Далее на основе полученных оценок и ковариационной матрицы , формируются новые параметры и , которые имеют вид:
,
где случайная величина распределенная , - число наблюдений для переменной бюджета без учета пропусков.
,
где верхняя треугольная матрица в разложении Холецкого,
, Z - вектор k+1 независимых случайных нормальных величин.
Заключительный шаг заполнения пропусков попеременнойимеет вид:
,
где значения регрессоров и моделирует стандартное нормальное отклонение
Таким образом количество наблюдений восстанавливается.
2.2 Восстановление отсутствующих данных переменной бюджета с помощью метода MultipleImputation
В данной работе процесс восстановления данных осуществляется с помощью пакета Stata.14 благодаря специальному коду.
Первым шагом подготовки данных стало удаление выбросов, которые искажали общие тенденции (Глава 1).
Вторым шагом необходимо привести распределение непрерывных переменныхк виду максимально близкому к нормальному.
В данном случае, это можно сделать с помощью логарифмирования (Таблица 4).
Таблица 4. Дескриптивная статистика (Источник: собственные расчеты (Stata.14))
Variable |
Obs |
Mean |
Std. Dev. |
Min |
Max |
|
lnpopularity |
4,183 |
10.2779 |
1.5703 |
4.63473 |
14.437 |
|
lncompetit~n |
4,183 |
-1.476942 |
0.6084356 |
-3.13549 |
-0.287682 |
|
lnpricetic~t |
4,183 |
2.143367 |
0.043054 |
2.07944 |
2.22984 |
|
lnruntime |
4,183 |
4.651422 |
0.1427396 |
4.23411 |
5.30827 |
|
lnrevenue |
4,183 |
17.19214 |
1.306467 |
13.8227 |
19.5843 |
Для того, что программа начала процесс MI, необходимо задать специальный формат данным и выявить количество пропусков, чтобы убедиться в том, что переменная бюджета имеет пробелы. (Таблица 5).
Таблица 5. Определение переменных с пропусками (Stata.14)
Затем восстанавливаются значения с помощью повторяющейся операции вменений 20 раз(add (20)). Количество вменений может быть различным, в зависимости от количества наблюдений.(Таблица 6).
Таблица 6. Восстановление пропущенных наблюдений (Stata.14)
Так, 826 пропущенных переменных бюджета были восстановлены, однако необходимо убедиться в адекватности этих значений. С помощью экспоненты возможно провести потенцирование логарифмированных показателей и проверить соответствие дескриптивных статистик до и после процедуры заполнения пропусков(Таблица 7). Из таблицы видно, что наименьшее и наибольшее значение бюджета остались без изменения,среднее значение немного уменьшилось, и оно по-прежнему меньше среднего значения выручки.
Таблица 7. Дескриптивная статистика с восстановленными данными бюджета (Stata.14)
Variable |
Obs |
Mean |
Std. Dev. |
Min |
Max |
|
revenue |
4,183 |
5.67E+07 |
6.15E+07 |
1007246 |
3.20E+08 |
|
budget |
4.18E+03 |
4.81E+07 |
4.65E+07 |
1.28E+04 |
3.06E+08 |
|
rating |
4,183 |
6.214631 |
0.9863323 |
1.5 |
9.3 |
|
popularity |
4,183 |
77853.13 |
126188.1 |
103 |
1900000 |
|
competition |
4,183 |
0.2692279 |
0.1440666 |
0.043478 |
0.75 |
|
priceticket |
4,183 |
8.536059 |
0.3708066 |
8 |
9.29837 |
|
runtime |
4,183 |
105.841 |
15.96585 |
69 |
202 |
Зависимость выручки и бюджета, представленная на диаграмме рассеяния, является линейной и положительной, когда большему значению бюджета соответствует большее значение кассовых сборов. Однако, существует несколько фильмов, отклоняющихся от общей тенденции, с небольшим бюджетом при высокой выручке(Приложение. График11). Возможно, зрители решили пойти в кинотеатр из-за репутации кинокомпании, популярного любимого актера, или фильм был снят великим режиссером, что компенсирует малые затраты бюджета. Для того, чтобы выяснить это, необходимо сконструировать индекс репутации производителей.
Глава 3. Репутационный индекс
3.1 Прикладное значениерепутационного индекса
В условиях сильной конкуренции на рынке, каждому производителю любых товаров или услуг необходимо постояннопривлекать и заинтересовывать покупателя любыми способами. В зависимости от сферы и возможностей, компании разрабатывают программы лояльности, предоставляют скидки и купоны.Однако, один из самых действенных и эффективных способов привлечения и удержания клиента является заслуженное доверие к компании, к ее миссии и действиям, по-другому - репутация. Завоевав положительную репутацию, производители значительно снижают риски падения спроса на их товары, тем самым, закрепляют место лидера в конкурентной борьбе на рынке. Также частой практикой многих компаний является использование репутации знаменитых артистов или общественных деятелей, которым доверяют люди. Для потребителей это служит ярким сигналом, который привлекает внимание к товару или услуге.
На рынке кинематографа таким средством привлечения зрителей является популярность и узнаваемость режиссера, актера или кинокомпании. В данной отрасли доверие и любовь публики сказывается на производстве особо сильно. Карьера и история каждого производителя формирует в голове зрителя определенный образ и их репутацию.
Тогда, для зрителей причастность конкретного актера или режиссера к фильму определяет множество факторов, по которым человек может принять решение о просмотре кино. К примеру, многие зрители убеждены в блестящей режиссуре боевиков и триллеров Квентина Тарантино. Следовательно, репутация данного режиссера сформировала у зрителей определенные ассоциации и ожидания от его работ в этих конкретных жанрах. Безусловно, существуют универсальные актеры, режиссеры или компании, чье участие в фильме является для зрителей достаточным условием того, что кино успешно. Например, кинография Леонардо ДиКаприо, Бреда Питта и других актеров заслуживает полного доверия зрителей к фильмам с их участием.
Привлечение зрителей работает следующим образом. Популярные звезды обладают большим количеством поклонников, которые будут посещать кинотеатр исключительно ради любимого актера или режиссера. Более того, этот фактор является положительным сигналом для продюсеров и спонсоров.Потенциальные инвесторы принимают во внимание актерский состав, производство компании и режиссера, поскольку вероятность высокой выручки вырастает с участием прославленной знаменитости. Довольно часто продюсеры специально ставят на обложку фильма популярного исполнителя роли главного героя или делают отсылку к известному режиссеру. Поскольку за несколько минут трейлера затруднительно рассказать сценарий и главную мысль фильма, заинтересовав каждого зрителя.
Нужно сказать, что неоднократно актеры становились единственным способом спасения компаний от разорения и финансовых трудностей. В 30-ые годы знаменитая актриса Мэй Уэст спасла великую компанию ParamountPictures от краха. Финансовый успех компании Metro-Golden-Mayer обеспечили талантливые актеры Кларк Габл и Харрисон Форд еще в 1980-ых годах (Sedgwick, 2004). Данные факты доказывают необходимость учитывать создателей кино для анализа кассовых сборов, поскольку они могут являться основным предиктором успеха. Безусловно, утверждать, что это единственный и достаточный фактор не представляется возможным.
Таким образом, в индустрии кино имя актеров, режиссеров или компании может стать ключевым фактором для зрителей, а значит, имеет высокое влияние на выручку. В более ранних работах фактор влияния репутации создателей на выручку либо не учитывался, либо вычислялся с помощью подсчета личных наград и премий.В данном исследовании применяется метод на основе предыдущих данных о выручке и других характеристик каждого производителя, который не применялся ранее в сфере кино.
3.2 Описание метода расчета репутационного индекса
Для определениявлиянияпроизводителейна выручку, используется метод, предложенный Краусслом и Элсландом, который был упомянут ранеев Главе 1(Krдussl,Elsland, 2011).Данный метод обладает несколькими преимуществами. Во-первых, он позволяет учесть все факторы уже существующих фильмов при расчете репутации их создателей. Во-вторых, учитывается количество выпущенных фильмов каждого производителя. В-третьих, данный способ является менее субъективным и более репрезентативным, чем количество премий и наград. Причина в том, что именно количество зрителей, которых миллионы, формирует кассовый сбор, который является основным мерилом успеха компании, режиссера или актера. Именно признание потребителей способно сформировать репутацию и стать причиной последующих успехов в выручке актера или режиссера. В то время как, международное жюри, которых не больше пятидесяти, может определить фильм как лучший вне зависимости от его популярности и заинтересованности в нем зрителей или участия звезды.
Данный двухэтапный гедонистический подход работает следующим образом. Первымшагом является оценка уравнения (5) (см. ниже) на подвыборке производителей (актеров, режиссеров или компаний), чтобы получить коэффициенты регрессии, представляющие характерные цены. Регрессия проводится на случайной подвыборке, чтобы избежать мультиколлинеарности при последующих вычислениях. Фиктивные переменные создателей в регрессию не входят.
Регрессия имеет вид:
(5)
где - логарифм выручкиi-того фильма, - характеристики фильма, включающие бюджет, индекс конкуренции, цену на билет, популярность и продолжительность.
На втором шаге коэффициенты включаются в формулу (6).Числитель индекса представляет отношение геометрического среднего выручки от кино базового и другого производителя, при этом базовый определяется случайным образом. Знаменатель является гедонистической корректировкой качества, которая включает в себя характеристика фильма и коэффициенты из регрессии (4).
(6)
где , n - количество изделий y+t производителя,m - количество изделий производителя у (базовый), - коэффициенты характеристик фильма, - характеристики фильма, включающие бюджет, индекс конкуренции, цену на билет, популярность и продолжительность.
Индекс по формуле (6) вычисляется для каждой пары производителей, состоящей из базового и иного создателя. В результате получается показатель, который представляет собой среднюю цену фильма для одного актера, режиссера или компаниипо отношению к базовому, скорректированную на качественные факторы. Значения этого индекса могут служить косвенными показателями влиятельности производителей.
Таким образом, репутационный индекс представлен какотносительная стоимость фильма от создателя y, по сравнению со стоимостью фильма от создателя y+t, с учетом корректировки на гедонистические факторы.
...Подобные документы
- Нечеткая логика. Моделирование оценки показателей проекта, с использованием теории нечетких множеств
Описание лингвистической переменной. Моделирование оценки показателей проекта. Построение функции принадлежности термов, используемых для лингвистической оценки переменной "рост мужчины". Нечеткое моделирование конкурентоспособности кинотеатров.
контрольная работа [281,6 K], добавлен 09.07.2014 Построение модели для зависимой переменной, используя пошаговую множественную регрессию. Рассчет индекса корреляции, оценка качества полученного уравнения регрессии с помощью коэффициента детерминации. Оценка статистической значимости уравнения регрессии.
лабораторная работа [2,1 M], добавлен 25.05.2009Основные задачи оценки экономических явлений и процессов. Проведение детерминированного факторного анализа и приемы математического моделирования факторной системы. Суть метода последовательного элиминирования факторов. Оперативный контроль затрат.
шпаргалка [1,1 M], добавлен 08.12.2010Модель зависимости доходности индекса телекоммуникации от индекса рынка. Результаты регрессионного анализа. Уравнение регрессии зависимости доходности отраслевого индекса от индекса. Регрессионная статистика, дисперсный анализ. Минимальный риск портфеля.
лабораторная работа [1,7 M], добавлен 15.11.2010Множественная линейная регрессия: спецификация модели, оценка параметров. Отбор факторов на основе качественного теоретико-экономического анализа. Коэффициент регрессии при фиктивной переменной. Проблемы верификации модели. Коэффициент детерминации.
контрольная работа [88,0 K], добавлен 08.09.2014Понятие, задачи и основные цели регрессионного анализа. Прогнозирование, основанное на использовании моделей временных рядов. Определение степени детерминированности вариации критериальной переменной предикторами. Ошибки, возникающие при измерении данных.
контрольная работа [785,9 K], добавлен 13.11.2011Моделирование. Детерминизм. Задачи детерминированного факторного анализа. Способы измерения влияния факторов в детерминированном анализе. Расчёт детерминированных экономико-математических моделей и методов факторного анализа на примере РУП "ГЗЛиН".
курсовая работа [246,7 K], добавлен 12.05.2008История развития кинематографа в Голливуде. Фильмы и гонорары наиболее знаменитых американских актеров. Выявление факторов, влияющих на величину годового дохода актера. Проверка распределения на нормальность и корреляционно-регрессионный анализ выборки.
курсовая работа [164,3 K], добавлен 18.10.2013Оценка распределения переменной Х1. Моделирование взаимосвязи между переменными У и Х1 с помощью линейной функции и методом множественной линейной регрессии. Сравнение качества построенных моделей. Составление точечного прогноза по заданным значениям.
курсовая работа [418,3 K], добавлен 24.06.2015Составление схем моделирования методом последовательного (непосредственного) интегрирования, методом вспомогательной переменной и методом канонической формы. Модель в пространстве состояний в форме простых сомножителей. Моделирование нелинейных систем.
курсовая работа [1,1 M], добавлен 23.12.2013Факторы успеха кинокартин: результаты зарубежных исследований. Эконометрическая оценка детерминант успеха фильма. Регрессионный анализ. Тестирование качества параметров модели. Оценка предпочтений российского зрителя. Анализ дескриптивной статистики.
дипломная работа [2,8 M], добавлен 01.10.2016Общая характеристика математических методов анализа, их классификация и типы, условия и возможности использования. Экономико-математическое моделирование как способ изучения хозяйственной деятельности, их применение в решении аналитических задач.
контрольная работа [1,6 M], добавлен 26.05.2013Элементы математического анализа: производная, определенный интеграл и ряды. Арифметические операции и функции комплексной переменной. Основные понятия и определения теории вероятности, статистики и комбинаторики. Законы распределения вероятностей.
методичка [2,9 M], добавлен 05.07.2010Численные методы решения трансцедентных уравнений. Решение с помощью метода жордановых исключений системы линейных алгебраических уравнений. Симплексный метод решения задачи линейного программирования. Транспортная задача, применение метода потенциалов.
методичка [955,1 K], добавлен 19.06.2015Разработка и принятие правильного решения как задачи работы управленческого персонала организации. Деревья решений - один из методов автоматического анализа данных, преимущества их использования и область применения. Построение деревьев классификации.
контрольная работа [91,6 K], добавлен 08.09.2011Изучение показателей качества конструкционного газобетона как случайных величин. Проведение модульного эксперимента и дисперсионного анализа с целью определения достоверности влияния факторов на поведение выбранных показателей качества данной продукции.
курсовая работа [342,3 K], добавлен 08.05.2012Определение зависимой и независимой переменной. Построение корреляционного поля зависимости издержек производства от объема затраченных ресурсов и их цены. Произведение статистического анализа регрессионной модели. Нахождение коэффициента детерминации.
лабораторная работа [62,3 K], добавлен 26.12.2011Сущность и содержание метода моделирования, понятие модели. Применение математических методов для прогноза и анализа экономических явлений, создания теоретических моделей. Принципиальные черты, характерные для построения экономико-математической модели.
контрольная работа [141,5 K], добавлен 02.02.2013Расчет вероятности совмещения событий при броске монеты и игральной кости, при поражении цели стрелком согласно теории вероятности. Анализ заданной блок-схемы и определение значения переменной. Пример составления и использования электронных таблиц.
контрольная работа [565,1 K], добавлен 22.03.2013Расчет зависимости курса акций от эффективности рынка ценных бумаг. Построение графика экспериментальных данных и модельной прямой. Нахождение значения стандартных погрешностей для определения доверительных интервалов для значений зависимой переменной.
контрольная работа [441,9 K], добавлен 13.10.2014