Проверка гипотезы о независимости логарифмической доходности
Исследование особенностей индекса ММВБ10. Построение графиков цен для акций с максимальными скачками вверх и вниз. Проверка статистических гипотез. Характеристика критериев К. Пирсона. Изучение квантилей распределения статистики критерия Пирсона.
Рубрика | Экономико-математическое моделирование |
Вид | курсовая работа |
Язык | русский |
Дата добавления | 03.03.2015 |
Размер файла | 228,8 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru
Федеральное государственное образовательное бюджетное учреждение
высшего профессионального образования
«Финансовый университет при Правительстве Российской Федерации»
(Финансовый университет)
Факультет «Прикладная математика и информационные технологии»
Кафедра «Теория вероятностей и математическая статистика»
Курсовая работа
по дисциплине: «Теория вероятностей и математическая статистика-2»
на тему: «Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов»
вид исследуемых данных: акций компаний, входящие в индекс ММВБ 10
Выполнил: 15.05.2014
студент группы ПМ2-3 Юрочко С.Н.
Научный руководитель: профессор, к.ф.-м.н.
Браилов А.В.
Москва 2014
Введение
Подробное разъяснение темы
В данной работе осуществляется проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов. Актуальность данной темы не вызывает сомнения, поскольку рынок акций является очень перспективным для успешного долгосрочного и краткосрочного инвестирования, а проверка статистических гипотез и основанные на них статистические выводы являются мощным инструментом для анализа поведения рынка и помогают проследить его развитие и выявить существующие закономерности, что очень важно для участников рынка.
В качестве объекта исследования выступают акции компаний входящих в индекс ММВБ 10, в период с 1 января 2008 года по 31 декабря 2013 года. В данной работе применены некоторые методы математической статистики для проверки статистической гипотезы (в частности ч2 Пирсона.). Будет осуществляться проверка гипотез как на реальных, так и на модельных данных.
Все расчеты осуществляются в программной среде Матричный калькулятор MatCalc 2.9.1.6.
Описание выборок
Будут рассмотрены котировки акций компаний, входящих в индекс ММВБ 10. На момент написания работы (II квартал 2014 года) в состав индекса входят следующие компании: ГАЗПРОМ ао (GAZP), ГМКНорНик (GMKN), ЛУКОЙЛ (LKOH), Магнит ао (MGNT), Новатэк ао (NVTK), Роснефть (ROSN), Сбербанк (SBER), Сбербанк-п (SBERP), Сургнфгз-п (SNGSP), ВТБ ао (VTBR). Перед тем как работать с котировками данных компаний, будет произведен анализ, возможно, некоторые компании придется исключить.
1. Предварительный анализ данных
Индекс ММВБ10 (публикуется с 19 марта 2001 г., начальное значение индекса, рассчитанное на -- 18:00 по московскому времени 30 декабря 1997 года составляет 100 пунктов) представляет собой ценовой, невзвешенный индекс, рассчитываемый как среднее арифметическое изменения цен 10 наиболее ликвидных акций, допущенных к обращению на фондовой бирже ММВБ. ММВБ10 является российским аналогом американского индекса Dow Jones - самого известного и популярного индекса в мире. Индекс ММВБ10 отражает в режиме реального времени (с 10:30 до 19:00) прирост стоимости портфеля, состоящего из 10 акций, веса которых в составе портфеля в начальный момент времени одинаковы. Перечень 10 акций, по которым рассчитывается индекс, определяется один раз в квартал. На момент написания работы (второй квартал 2014 года) индекс ММВБ10 рассчитывался по акциям следующих эмитентов:
Тикер |
Наименование компании |
|
GAZP |
Газпром |
|
GMNK |
ГМКНорНик |
|
LKOH |
Лукойл |
|
MGNT |
Магнит |
|
NVTK |
Новатэк |
|
ROSN |
Роснефть |
|
SBER |
Сбербанк |
|
SBERP |
Сбербанк-п |
|
SNGSP |
Сургнфгз-п |
|
VTBR |
ВТБ |
Из приведенного перечня видно, что в индексе ММВБ10 значительна доля «голубых фишек».
ММВБ10 позволяет отслеживать малейшие колебания цен основных финансовых инструментов. Индекс ММВБ10 является первым биржевым индексом в России, методика которого не предусматривает временного усреднения цен, а пересчет значений индекса производится после каждой сделки, заключенной с любой из 10 выбранных акций в основном режиме торгов.
Чтобы проверить отсутствие грубых ошибок и различных сплитов в скачанных данных, проведена их проверка по нескольким параметрам: число торговых дней, максимальные дневные относительные скачки цен, графики цен. Использованы поля: Close - цены закрытия; единицы измерения - RUB (российский рубль).
Таблица 1 Число торговых дней
год/тикер |
2008 |
2009 |
2010 |
2011 |
2012 |
2013 |
|
GAZP |
246 |
249 |
248 |
248 |
255 |
250 |
|
GMKN |
246 |
249 |
248 |
248 |
255 |
250 |
|
LKOH |
246 |
249 |
248 |
248 |
255 |
250 |
|
MGNT |
246 |
249 |
248 |
248 |
255 |
250 |
|
NVTK |
246 |
249 |
248 |
248 |
255 |
250 |
|
ROSN |
246 |
249 |
248 |
248 |
255 |
250 |
|
SBER |
246 |
249 |
248 |
248 |
255 |
250 |
|
SBERP |
246 |
249 |
248 |
248 |
255 |
250 |
|
SNGSP |
246 |
249 |
248 |
248 |
255 |
250 |
|
VTBR |
246 |
249 |
248 |
248 |
255 |
250 |
Полученные результаты свидетельствуют о том, что все взятые акции пригодны для исследования, проводимого в данной курсовой работе.
Ниже приведены таблицы максимальных и минимальных дневных относительных скачков логарифмических доходностей по годам. Для наглядности, максимальные по модулю скачки выделены цветом.
Таблица 2 Максимальные скачки цен вверх
год/тикер |
2008 |
2009 |
2010 |
2011 |
2012 |
2013 |
|
GAZP |
0,200333 |
0,081378 |
0,053666 |
0,071694 |
0,053854 |
0,045451 |
|
GMKN |
0,301601 |
0,161132 |
0,075751 |
0,072754 |
0,045684 |
0,081395 |
|
LKOH |
0,197666 |
0,097928 |
0,051574 |
0,097692 |
0,039952 |
0,03583 |
|
MGNT |
0,209289 |
0,063959 |
0,062004 |
0,099372 |
0,056615 |
0,045835 |
|
NVTK |
0,157088 |
0,11685 |
0,065604 |
0,07564 |
0,099868 |
0,037855 |
|
ROSN |
0,240025 |
0,09392 |
0,062952 |
0,07617 |
0,036357 |
0,044226 |
|
SBER |
0,228055 |
0,140449 |
0,080475 |
0,096916 |
0,071338 |
0,046867 |
|
SBERP |
0,307294 |
0,148782 |
0,070018 |
0,095187 |
0,07795 |
0,05518 |
|
SNGSP |
0,257347 |
0,100409 |
0,070256 |
0,084103 |
0,121505 |
0,10317 |
|
VTBR |
0,292576 |
0,12406 |
0,070735 |
0,090802 |
0,059093 |
0,053839 |
Таблица 3 Максимальные скачки цен вниз
год/тикер |
2008 |
2009 |
2010 |
2011 |
2012 |
2013 |
|
GAZP |
0,287425 |
0,102928 |
0,107972 |
0,053922 |
0,040064 |
0,060526 |
|
GMKN |
0,24165 |
0,148782 |
0,058088 |
0,077844 |
0,063167 |
0,04675 |
|
LKOH |
0,270538 |
0,140089 |
0,041259 |
0,055334 |
0,053399 |
0,034772 |
|
MGNT |
0,146497 |
0,121212 |
0,125597 |
0,065279 |
0,08225 |
0,071429 |
|
NVTK |
0,34944 |
0,177645 |
0,070181 |
0,081461 |
0,066922 |
0,057234 |
|
ROSN |
0,463035 |
0,149923 |
0,105199 |
0,072295 |
0,059175 |
0,043089 |
|
SBER |
0,351459 |
0,175617 |
0,0924 |
0,076267 |
0,048088 |
0,047948 |
|
SBERP |
0,477347 |
0,233876 |
0,062269 |
0,070111 |
0,086647 |
0,046839 |
|
SNGSP |
0,424225 |
0,080199 |
0,071429 |
0,067937 |
0,061431 |
0,040513 |
|
VTBR |
0,593407 |
0,162896 |
0,083582 |
0,057957 |
0,062558 |
0,053788 |
Построим графики цен для акций с максимальными скачками вверх и вниз соответственно, то есть графики цен акций компаний Сбербанк и ВТБ. (см. рис.1 и рис.2).
Рисунок 1 График цены компании SBER
Рисунок 2 График цены компании VTBR
цена акция пирсон
2. Теоретическая справка по проверке гипотез
2.1 Проверка статистических гипотез
Статистической гипотезой называется любое предположение о виде или параметрах неизвестного закона распределения.
Статистические гипотезы делятся на гипотезы о параметрах распределения известного вида (это так называемые параметрические гипотезы) и гипотезы о виде неизвестного распределения (непараметрические гипотезы).
Одну гипотезу выдвигают в качестве основной (H0), а другую, которая является логическим отрицанием H0 (противоположной гипотезой) - в качестве альтернативной гипотезы и обозначают H1.
Гипотезу, однозначно фиксирующую распределение наблюдений, называют простой (в ней идет речь об одном значении параметра), в противном случае - сложной. Например, гипотеза «вероятность появления события в схеме Бернулли равна 1/2» является простой, а гипотеза «вероятность появления события в схеме Бернулли заключена между 0,3 и 0,6» - сложная.
Имея две гипотезы , надо на основе выборки Х1,…,Хn принять либо основную гипотезу H0, либо конкурирующую H1.
Правило, по которому принимается решение принять или отклонить гипотезу H0 (соответственно, отклонить или принять H1), называется статистическим критерием (или просто критерием) проверки основной гипотезы.
Проверку гипотезы осуществляют на основании результатов выборки Х1, Х2,…, Хn, из которых формируют функцию выборки Tn = T(Х1, Х2,…, Хn), называемой статистикой критерия.
Основной принцип проверки гипотез состоит в следующем. Множество возможных значений статистики критерия Tn разбивается на два непересекающихся подмножества: критическую область S, т.е. область отклонения нулевой гипотезы и область принятия этой гипотезы. Если фактически наблюдаемое значение статистики критерия (т.е. значение критерия, вычисленное по выборке: Тn = Т (х1,х2,…,хn)) попадает в критическую область S, то основанная гипотеза Н0 отклоняется и принимается альтернативная гипотеза Н1; если же Тn попадает в , то принимается Н0, а Н1 отклоняется.
2.2 Задача проверки гипотез
Полученные экспериментально оценки распределения дают возможность только строить различные гипотезы о распределении случайной величины, например гипотезу о том, что она распределена нормально. Поэтому возникает задача проверки гипотез. Эта задача состоит в том, чтобы определить, насколько хорошо согласуется та или иная гипотеза о распределении случайной величины с полученными экспериментальными данными. Ясно, что эта задача тесно связана с задачей определения доверительных областей для плотности или функции распределения. Однако она имеет и некоторые особенности. Дело в том, что по той же выборке, по которой проверяется гипотеза о распределении, обычно оцениваются и некоторые параметры этого распределения. Так, например, проверяя гипотезу о нормальном распределении, по той же выборке обычно оценивают математическое ожидание и ковариационную матрицу (дисперсию в случае одномерного распределения) случайной величины.
Вследствие этого гипотетическое распределение оказывается само случайным -- функцией случайных результатов опытов. Это и отличает задачу проверки гипотез о распределении от задачи определения доверительных областей для распределений. И только в отдельных частных случаях может возникнуть задача проверки гипотезы о том, что случайная величина подчинена вполне определенному закону распределения, не зависящему от неизвестных параметров. Для проверки гипотез о распределении применяются различные критерии согласия. Наиболее удобным и универсальным критерием согласия является критерий К. Пирсона. Он совершенно не зависит ни от распределения случайной величины, ни от ее размерности.
2.3 ч2-критерий Пирсона
Критерии, с помощью которых определяется удачно или неудачно подобран закон распределения, принято обозначать критериями согласия. Критерий ч2 К. Пирсона - наиболее часто употребляемый критерий для проверки простой гипотезы о законе распределения. Он основан на использовании в качестве меры отклонения экспериментальных данных от гипотетического распределения той же величины, которая служит для построения доверительной области для неизвестной плотности, с заменой неизвестных истинных значений вероятностей попадания в интервалы вероятностями, вычисленными по гипотетическому распределению. Предположим, что область возможных значений случайной величины разбита на r интервалов (многомерных, т.е. прямоугольников, в случае векторной величины). Пусть - случайные частоты попадания в эти интервалы, получаемые в результате n опытов, Р1,…,Рr - вероятности попадания в те же интервалы, вычисленные по гипотетическому распределению.
В общем случае эти вероятности являются функциями оценок неизвестных параметров, получаемых по тем же экспериментальным данным, и потому тоже являются случайными величинами. Предположим, что оценки неизвестных параметров гипотетического распределения вычисляются по той же группированной выборке, что и частоты . Тогда вероятности Р1,…,Рr будут некоторыми функциями частот , и для оценки отклонения экспериментальных данных от гипотетического распределения берут величину
, (1)
где Р1,…,Рr - определенные функции частот.
Нейман и Пирсон показали, что если для вычисления вероятностей Р1,…,Рr применяется асимптотически эффективная и асимптотически нормальная оценка неизвестного s-мерного параметра гипотетического распределения по группированной выборке, то величина Z, определяемая формулой (1), в пределе при n ->? имеет ч2 -распределение с r-s-1 степенями свободы.
Пользуясь этой теоремой, можно оценивать расхождение экспериментальных данных с гипотетическим распределением с помощью таблиц ч2-распределения. Выберем достаточно малую вероятность р, чтобы событие с такой вероятностью можно было считать практически невозможным, и определим из уравнения
Если реализация =2величины Z, полученная в результате опытов, пре-восходит или равна , =2 , то гипотетическое распределение считают не согласующимся с экспериментальными данными, так как при этом распределении практически невозможно получить при одной выборке =2 . Вероятность такого события при большом числе опытов n приближенно равна р, т.е. пренебрежимо мала. В этом случае говорят, что имеет место значимое отклонение экспериментальных данных от гипотетического распределения. Если же =2, то считают, что гипотетическое распределение не противоречит экспериментальным данным, согласуется с ними.
Величина называется 100р-процетпным уровнем значимости отклонения выборки от гипотетического распределения. Обычно пользуются 5-, 1- и 0,1-процентными уровнями значимости, в зависимости от характера задачи.
Для дополнительной проверки согласованности экспериментальных данных с гипотетическим распределением полезно вычислить вероятность того, что при данном гипотетическом распределении величина Z окажется больше полученной в результате опытов ее реализации =2, P(Z > 2).Чем больше эта вероятность, тем лучше согласуется выборка с гипотетическим распределением, тем меньше значимость полученного расхождения выборки с гипотетическим распределением. Действительно, если вероятность Р(Z > 2) велика, то при повторении данной серии опытов в случае справедливости выбранной гипотезы о распределении часто будут получаться значения величины Z еще большие, чем полученное в результате опытов значение =2.
Обратим внимание на то, что, получив =2 < и даже получив высокую вероятность P(Z > 2), мы не делаем определенного вывода, что выбранная гипотеза о распределении справедлива, а говорим лишь, что эта гипотеза не противоречит полученным результатам опытов, что она согласуется с ними, вследствие чего ее можно принять. Чтобы получить достаточно веское доказательство того, что случайная величина действительно подчинена гипотетическому закону распределения, необходимо повторить данную серию опытов достаточно большое число раз и убедиться в том, что полученное согласование гипотезы с результатами опытов устойчиво.
2.4 Критерий Колмогорова
Критерий Колмогорова - вспомогательный критерий
В качестве вспомогательного критерия по проверке равномерности распределения P-значения основного критерия в данной работе используем критерий Колмогорова.
Критерий Колмогорова рассматривает максимальное значение модуля разности между статистической функцией распределения F^* (x) и соответствующей теоретической функцией распределения F(x, т.е. D = max|F^* (x)-F(x)|.
Следующим шагом определяется величина л=D. По статистическим таблицам (в среде matcalc функцией pvKolm(u)) находится вероятность того, что за счет чисто случайных причин максимальное расхождение между F^* (x) и F(x) будет не меньше, чем фактически наблюденное. Если вероятность P(л) сравнительно велика, то гипотезу следует принять, если весьма мала, то отвергнуть как неправдоподобную.
3. Проверка гипотезы для модельных данных
Для проверки гипотезы о нормальности распределения по критерию Гири, используя метод Монте-Карло, создадим таблицу 999 квантилей распределения статистики Qq при верной нулевой гипотезе.
Таблица 4 Отдельные квантили распределения статистики критерия Пирсона
q |
|
q |
|
q |
|
|||
0.01 |
0,575 |
0.21 |
2,441 |
0.41 |
3,722 |
|||
0.02 |
0,767 |
0.22 |
2,501 |
0.42 |
3,782 |
|||
0.03 |
0,913 |
0.23 |
2,562 |
0.43 |
3,850 |
|||
0.04 |
1,028 |
0.24 |
2,628 |
0.44 |
3,926 |
|||
0.05 |
1,158 |
0.25 |
2,709 |
0.45 |
3,996 |
|||
0.06 |
1,249 |
0.26 |
2,783 |
0.46 |
4,057 |
|||
0.07 |
1,354 |
0.27 |
2,849 |
0.47 |
4,135 |
|||
0.08 |
1,443 |
0.28 |
2,907 |
0.48 |
4,195 |
|||
0.09 |
1,528 |
0.29 |
2,964 |
0.49 |
4,267 |
|||
0.10 |
1,630 |
0.30 |
3,024 |
0.50 |
4,349 |
|||
0.11 |
1,715 |
0.31 |
3,087 |
|||||
0.12 |
1,801 |
0.32 |
3,149 |
|||||
0.13 |
1,868 |
0.33 |
3,230 |
|||||
0.14 |
1,952 |
0.34 |
3,282 |
|||||
0.15 |
2,021 |
0.35 |
3,353 |
|||||
0.16 |
2,095 |
0.36 |
3,416 |
|||||
0.17 |
2,176 |
0.37 |
3,468 |
|||||
0.18 |
2,235 |
0.38 |
3,533 |
|||||
0.19 |
2,295 |
0.39 |
3,591 |
|||||
0.20 |
2,370 |
0.40 |
3,656 |
Рассчитываем P-значения критерия, где в качестве эмпирической функции распределения статистики мы используем таблицу квантилей распределения статистики основного критерия. Строим на основании этих данных гистограмму распределения P-значений для модельных данных.
Рисунок 3 Гистограмма P-значений для модельных данных
Производится проверка равномерности распределения P-значения на отрезке [0,1] по критерию Колмогорова. Получаем значение, равное 0,935. Так как значение достаточно велико, то согласно правилу, описанному в теоретической справке по критерию Колмогорова, гипотеза о нормальности распределения логарифмической доходности по исследуемому критерию Пирсона принимается.
4. Выбор альтернативных гипотез и оценка мощности критерия
Для проверки мощности критерия Пирсона в качестве первой альтернативной гипотезы будем использовать гипотезу об экспоненциальном распределении.
Случайная величина Х имеет экспоненциальное распределение с параметром, если её плотность имеет вид
Интегрируя плотность, получаем функцию экспоненциального распределения
Мы будем использовать экспоненциальное распределение, потому что, во-первых оно уже реализовано в программе MatCalc, а во-вторых, потому что экспоненциальное распределение внешне сильно похоже на распределение модуля нормальной величины.
Таблица 5 Мощность критерия, экспоненциальное распределение
n |
alpha |
0,25 |
0,5 |
0,75 |
1 |
1,25 |
1,5 |
1,75 |
2 |
|
125 |
0,05 |
1 |
1 |
0,972 |
0,615 |
0,464 |
0,74 |
0,963 |
1 |
|
250 |
0,05 |
1 |
1 |
0,999 |
0,902 |
0,781 |
0,981 |
1 |
1 |
|
500 |
0,05 |
1 |
1 |
1 |
0,997 |
0,984 |
1 |
1 |
1 |
В качестве второй альтернативной выберем гипотезу о том, что логарифмическая доходность распределена по закону Стьюдента, так как с возрастанием числа степеней свободы оно приближается к нормальному распределению. Из этого делаем вывод, что данная альтернативная гипотеза не сильно отличается от первоначальной.
Таблица 6 Таблица значений мощности критерия Пирсона
уровень значимости |
Pv=0.01 |
Pv=0.05 |
Pv=0.2 |
|
мощность критерия |
0.829 |
0.934 |
0.985 |
Итак, мы видим, что при различных уровнях значимости мощность критерия Пирсона велика. Это значит, что вероятность совершить ошибку второго рода, то есть принять неправильную гипотезу, мала. А значит, мы с уверенностью можем утверждать, что полученные результаты данной курсовой работы окажутся верным.
5. Проверка гипотезы на реальных данных
Гипотеза о независимости логарифмических доходностей за различные интервалы времени при большом, среднем и малом объеме торгов проверялась с помощью критерия Пирсона. Уровень значимости б=0,05.
Программа находит малый, средний и большой объемы торгов, строя эмпирическое распределение по объему (для каждого года и тикера отдельно) и беря соответственно выборку меньше квантиля уровня 1/3, больше квантиля уровня 1/3 и меньше 2/3, и больше 2/3 соответственно. Затем она проверяет независимость логарифмических доходностей двух рядов данных, первый ряд состоит из дней с определенными видами торга, а второй из дней следующих за ними.
Таблица 7 2008г.
Тикер |
LoVol |
MidVol |
HiVol |
|
GAZP |
0,57794 |
0,510377 |
0,425017 |
|
GMKN |
0,060614 |
0,110645 |
0,543271 |
|
LKOH |
0,676356 |
0,256273 |
0,868649 |
|
MGNT |
* |
0,940265 |
0,184429 |
|
NVTK |
0,993946 |
0,981548 |
0,266213 |
|
ROSN |
0,495098 |
0,315968 |
0,569832 |
|
SBER |
0,822822 |
0,307887 |
0,247856 |
|
SBERP |
0,601157 |
0,057269 |
* |
|
SNGSP |
0,340238 |
0,045592 |
0,011545 |
|
VTBR |
* |
0,093638 |
0,018632 |
Таблица 8 2009г.
Тикер |
LoVol |
MidVol |
HiVol |
|
GAZP |
0,448633 |
0,391969 |
0,052693 |
|
GMKN |
0,416666 |
0,431346 |
0,045655 |
|
LKOH |
0,947709 |
0,913661 |
0,449975 |
|
MGNT |
0,530968 |
0,86333 |
0,000239 |
|
NVTK |
0,932783 |
0,130506 |
0,106215 |
|
ROSN |
0,112538 |
0,871744 |
0,73996 |
|
SBER |
0,689755 |
0,096976 |
0,431214 |
|
SBERP |
0,668142 |
0,130808 |
0,1577 |
|
SNGSP |
0,175122 |
0,121687 |
0,019537 |
|
VTBR |
0,547083 |
0,11827 |
0,760712 |
Таблица 9 2010г.
Тикер |
LoVol |
MidVol |
HiVol |
|
GAZP |
0,78308 |
0,23495 |
0,135792 |
|
GMKN |
0,189897 |
0,128368 |
0,015867 |
|
LKOH |
0,644705 |
0,991006 |
0,227855 |
|
MGNT |
0,940572 |
0,824121 |
0,191202 |
|
NVTK |
0,877268 |
0,067973 |
0,119513 |
|
ROSN |
0,287452 |
0,486118 |
0,672927 |
|
SBER |
0,274481 |
0,015734 |
0,310976 |
|
SBERP |
0,266642 |
0,196643 |
0,169032 |
|
SNGSP |
0,717195 |
0,009487 |
0,028626 |
|
VTBR |
0,669869 |
0,021851 |
0,198768 |
Таблица 10 2011г.
Тикер |
LoVol |
MidVol |
HiVol |
|
GAZP |
0,343598 |
0,344632 |
0,028165 |
|
GMKN |
0,008505 |
0,055311 |
0,035698 |
|
LKOH |
0,414403 |
0,918321 |
0,579339 |
|
MGNT |
0,264015 |
0,160213 |
0,100216 |
|
NVTK |
0,795331 |
0,006179 |
0,590717 |
|
ROSN |
0,119666 |
0,861197 |
0,40782 |
|
SBER |
0,401953 |
0,018158 |
0,20163 |
|
SBERP |
0,007426 |
0,467585 |
0,631747 |
|
SNGSP |
0,806209 |
0,735903 |
0,397873 |
|
VTBR |
0,563692 |
0,395625 |
0,39994 |
Таблица 11 2012г.
Тикер |
LoVol |
MidVol |
HiVol |
|
GAZP |
0,742108 |
0,070636 |
0,713633 |
|
GMKN |
0,136639 |
0,823088 |
0,076007 |
|
LKOH |
0,704354 |
0,872467 |
0,291506 |
|
MGNT |
0,66032 |
0,214359 |
0,832269 |
|
NVTK |
0,699701 |
7,10E-05 |
0,02897 |
|
ROSN |
0,285574 |
0,796311 |
0,406639 |
|
SBER |
0,153147 |
0,035023 |
0,052461 |
|
SBERP |
0,024837 |
0,647216 |
0,003684 |
|
SNGSP |
0,376958 |
0,865004 |
0,141448 |
|
VTBR |
0,810749 |
0,163574 |
0,093217 |
Таблица 12 2013г.
Тикер |
LoVol |
MidVol |
HiVol |
|
GAZP |
0,118672 |
0,4557 |
0,934985 |
|
GMKN |
0,895637 |
0,472455 |
0,226902 |
|
LKOH |
0,056203 |
0,910611 |
0,212161 |
|
MGNT |
0,38558 |
0,015969 |
0,003859 |
|
NVTK |
0,342346 |
0,001954 |
0,019551 |
|
ROSN |
0,379428 |
0,380545 |
0,213746 |
|
SBER |
0,01497 |
0,276569 |
0,523578 |
|
SBERP |
0,098914 |
0,175182 |
0,014293 |
|
SNGSP |
0,426355 |
0,189162 |
0,213311 |
|
VTBR |
0,531757 |
0,20771 |
0,000419 |
Проведено 180 проверок гипотезы, из результатов таблиц видно , что гипотеза подтверждается в 85 % всех проверок (т.е 152 случаях). Любопытна динамика по годам: для 2008 и 2009 года гипотеза отвергается по 3 раза (10%), для 2010 года 5 раз (16,6%), для 2011 года 6 раз (20%), для 2012 года 4 раза (13,3%),для 2013 года 7 раз(23,3%), т.е количество отвергаемых случаев растет (исключение составил 2012 год). При рассмотрении отдельно для различных объемов торгов получим: для малого объема торга гипотеза отвергается в 4 случаях из 60(т.е в 6,6%), для среднего объема торга в 9 случаях(15%), для большого объема торга в 15 случаях(25%)
Заключение
В своей работе я проверил гипотезу о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов.
Исходя из полученных данных, можно сделать вывод, что логарифмическая доходность в целом не зависит, ни от объёмов торгов ( хотя при большом объеме торгов гипотеза отвергается чаще, но эта разница не существенна), ни от времени ( хотя можно предположить, что гипотеза отвергается чаще с течением времени для наших данных). Следовательно, фактически нельзя предсказать доходность акции следующего дня в зависимости от доходности сегодняшнего дня, даже исходя из объема торга. Никаких закономерностей между тикерами акций не обнаружено, значит действительно нельзя предсказать доходность следующего дня.
Литература
1. Браилов А.В. Лекции по математической статистике - М.: Финакадемия, 2007.
2. Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. -- 2-е изд., перераб. и доп.-- М.: ЮНИТИ-ДАНА, 2004.
3. Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. пособие для вузов/В.Е. Гмурман. -- 9-е изд., стер. -- М.: Высш. шк., 2003.
4. Королюк В.С. Справочник по теории вероятностей и математической статисти-ке- М: Наука, 1985.
5. Письменный Д.Т. Конспект лекций по теории вероятностей и математической статистике. - М.: Айрис-пресс, 2004.
6. Пугачев B.C. Теория вероятностей и математическая статистика: Учеб. посо-бие.-- 2-е изд., исправл. и дополи.-- М.: ФИЗМАТ ЛИТ, 2002.
7. www.finam.ru
Приложение 1
Характеристики компьютера
- Тип процессора: Intel Core 2 Quad Q9300
- Частота процессора: 2500 МГц на ядро (x4);
- Частота системной шины: 1333 МГц
- Объем кэша второго уровня: 2х3072 Кб (такой большой объем обусловлен отсутствием кэша третьего уровня)
Программа <<Реальные данные.mtc>> выполняется 30 с.
Программа <<Мощность.mtc>> выполняется 27с.
Приложение 2
Коды программ
<<Число торговых дней.mtc>>
// Фошин Д. В. 2009г.
// Редакция Юрочко С. . 2014
// время выполнения 5,2 секунд
Y=[2008:2013];
ny=#Y;
T=["GAZP","GMKN", "LKOH", "MGNT","NVTK", "ROSN", "SBER", "SBERP","SNGSP","VTBR"];
NT=0(#T,#Y);
for (y in Y)
{
d1=date(y,1,1);
d2=date(y,12,31);
for (t in T)
{
X=loaddaily(d1,d2,t+".csv","<CLOSE>");
NT(t.num,y.num)=sum(X>0);
}
}
F=["год/тикер","2008","2009","2010","2011","2012","2013"];
tiker=[F;'T,NT];
savetable(tiker,"Число торговых дней.csv");
<<Максимальные и минимальные скачки цен.mtc>>
// Сытник Е.А 2012г.
// Редакция Юрочко С. . 2014
// время выполнения 3,0 секунд
T=["GAZP","GMKN", "LKOH", "MGNT","NVTK", "ROSN", "SBER", "SBERP","SNGSP","VTBR"];
Y = [2008:2013];
S1 = 0(#T,#Y);
S2 = 0(#T,#Y);
for (j in 1:#T)
{
for (i in 1:#Y)
{
I=loaddaily(date(Y(i),01,01), date(Y(i),12,31), T(j)+".csv", "<CLOSE>");
I=select(I,I>0);
S1(j,i)= max((1-exp(dif(ln(I)))));
S2(j,i)=-min((1-exp(dif(ln(I)))));
}
}
T1 = [" ",'Y;'T,S1];
T2 = [" ",'Y;'T,S2];
savetable(T1,"Скачки_вверх.csv");
savetable(T2,"Скачки_вниз.csv");
J=max(S1);
K=max(S2);
<<графики цены компаний SBER и VTBR.mtc>>
// Сафейкин Р.А. 2012г.
// Редакция Юрочко С. . 2014
// время выполнения 3,1 секунд
Tikkery=["SBERP";"VTBR"];
d1 = date(2008,1,1);
d2 = date(2013,12,31);
for (i in 1:2)
{
I0=loaddaily(d1,d2,Tikkery(i)+".csv","<CLOSE>");
I=select(I0,I0>0);
wintitle(Tikkery(i));
axes();
line(1:#I,I,red);
show();
erase();
}
<< Отдельные квантили распределения статистики критерия Пирсона.mtc>>
// время выполнения 2 секунды
nl=nlaw(0,1);
n=249;//размер выборки
N=10000;// кол-во испытаний
setmaxdim(2*N);
B=0(N);
dx = 0.05;
Zcr = 0(N);
qs = 0.001 : 0.999 : 0.001;
for (i in 1:N)
{
x = nl(n);
x = abs(x);
h = 0:3:0.5;
M = x.intfr(h);
EF = nl.intefr(h,n).c(3);
EF(1) = EF(1)-n/2;
B(i)=sum((M.c(3) - 2*EF)^2/(2*EF));
}
m=1000;
EL=elaw(B);
Q=EL.invpl(1/m:(m-1)/m:1/m);
savetable(Q, "Квантили Пирсона.csv");
<< Гистограмма P-значений для модельных данных.mtc>>
// время выполнения 9 секунд
//Редакция Юрочко С.
nl=nlaw(0,1);
N=1000;
n=249;
PV=0(N);
Q=loadvector("Квантили Пирсона.csv ");
for (i in 1:N)
{
x = nl(n);
x = abs(x);
h = 0:3:0.5;
M = x.intfr(h);
EF = nl.intefr(h,n).c(3);
EF(1) = EF(1)-n/2;
B=sum((M.c(3) - 2*EF)^2/(2*EF));
PV(i)=elaw(Q).pg(B);
}
hist(PV.intfr(0:1:0.1),green);//гистограмма Р-значений
axes();
//проверка равномерности Колмогорова
Pt=0:1:0.001;
d=maxabs(elaw(PV).pl(Pt)-ulaw(0,1).pl(Pt));
XX = pvKolm(d*(#PV)^0.5); // р-значение по критерию Колмогорова
if (XX>0.05) xx ="Принимается"; else xx = "Отвергается";
wintitle(xx + ", р-значение = " +round(XX,3));
savetable(round(PV,3),"P-значения для модельных данных.csv")
<<Таблица 7-12 Реальные данные.mtc>>
// Пивоварова К.М. 2008г.
//Редакция Юрочко С. 2014г.
// время выполнения 30 секунд
Tickers = '["GAZP","GMKN", "LKOH", "MGNT","NVTK", "ROSN", "SBER", "SBERP","SNGSP","VTBR"];
Vars = ["LoVol","MidVol","HiVol"];
TabPV = super(#Tickers,#Vars);
Y=[0:6];
for (y in Y){
d1 = date(2007,1,1);
d2 = date(2007+y,12,31);
for(ticker in Tickers) {
V = select(loaddaily(d1,d2,ticker + ".csv","<VOL>"),loaddaily(d1,d2,ticker + ".csv","<VOL>")>0);
LV = elaw(V);
v1 = LV.invpl(1/3);
v2 = LV.invpl(2/3);
P = select(loaddaily(d1,d2,ticker + ".csv","<Close>"),loaddaily(d1,d2,ticker + ".csv","<VOL>")>0);
assert(min(P)>0);
for(nv in 1:#Vars){
TabPV(ticker.num,nv) = "*";
if(nv==1) C = (V<=v1)(1:#V-1);
if(nv==2) C = (V>v1 & V<v2)(1:#V-1);
if(nv==3) C = (V>=v2)(1:#V-1);
lnR = select(dif(ln(P)), C);
m = #lnR;
if(m<100) continue;
minR = min(lnR)-1;
maxR = max(lnR)+1;
r = elaw(lnR).invpg(1/3);
// Другие варианты :
// r = 0.01;
//. r = 0.02;
Q = [-r;r];
D1 = [minR; Q; maxR];
D2 = [minR; Q; maxR];
r1 = #D1-1;
r2 = #D2-1;
lnR1 = lnR(1:m-1);
lnR2 = lnR(2:m);
n = #lnR1;
p = 0(r1,r2);
for (i in 1:r1){
for(j in 1:r2){
p(i,j) = sum(lnR1>=D1(i)&lnR1<D1(i+1) & lnR2>=D2(j)&lnR2<D2(j+1))/n;}} // p - матрица вероятностей попадания доходностей в получившиеся интервалы
assert(abs(sum(p)-1) < 0.000001);
k = (r1-1)*(r2-1);// степень свободы критерия
p2 = sum(cols(p));// сумма столбцов матрицы p
p1 = sum(rows(p));// сумма строк матрицы р
t = 0(r1,r2);
for (i in 1:r1){
for(j in 1:r2)
t(i,j) = p1(i)*p2(j);}
if(min(t*n) > 5){
Z = 0(r1,r2);
for(i in 1:r1){
for(j in 1:r2)
Z(i,j) = (p(i,j)-t(i,j))^2 / t(i,j);}
z = sum(Z)*n;
pv = x2law(k).pg(z); // P-значение
TabPV(ticker.num,nv) = pv;}}}
H = ["Тикер",Vars];
Out = [H; [Tickers,TabPV]];
savetable(Out,"tab20"+(7+y)+".csv");}
<< Мощность критерия, экспоненциальное распределение.mtc>>
//Болдарев Х. 2013г.
//Редакция Юрочко С. 2014г.
//Время выполнения 27с
N = 1000;//Кол-во испытаний
ns = [125,250,500];//размеры выборок
alpha = [0.05];//уровни принятия гипотезы
Lteor = nlaw(0,1);//С помощью него мы построим модуль норм. распределения
Lx2 = x2law(5);
lamb = [0.25,0.5,0.75,1,1.25,1.5,1.75,2];//Лямбды для показат. распр.
Result = 0(#ns*#alpha,#lamb);
for(l in lamb){
L = explaw(l);
for(n in ns){
Z = 0(N);
for(i in 1:N){
x = L(n);
h = 0:3:0.5;
M = x.intfr(h);
//равномерно распределяем по всей прямой значения
rasp = (M(6,3) - sum(x > 2.5 & x < 3))/5;
M(6,3) = sum(x > 2.5 & x < 3);
for(j in 1:5) M(j,3) = M(j,3) + rasp;
EF = Lteor.intefr(h,n).c(3);
EF(1) = EF(1)-n/2;
Z(i) = sum((M.c(3) - 2*EF)^2/(2*EF));//Строим статистику
}
PV=0(N);
PV = Lx2.pg(Z);//P - значения
for(a in alpha){
Result(n.num,l.num) = sum(PV >= a)/N;}//Записываем мощности
}
}
Result = 1 - Result;
A =0(3,2);
for(j in 0:2){
for(i in 1:1){ A(j+1,1) = ns(j+1); A(j+1,2) = alpha(i);}}
Return = ["n","alpha",lamb;A,Result];
savetable(Return,"Powers.csv");
<< Таблица значений мощности критерия Пирсона.mtc>>
//Аюпов Д. 2012г
//Время выполнения 8с.
timer(0);
N = 1000;
pow1 = 0; pow5 = 0; pow20 = 0;
for(n in 1:N)
{
Ob = tlaw(3)(250);// вместо данных загружаю закон стьюдента и проверяю на нормальность
M = mean(Ob);
S = stdev(Ob); //критерий
L = nlaw(M, S);
h = S; Pt = (M-3*S):(M+3*S):h;
TOF = Ob.intfr(Pt); // таблица наблюдаемых частот
TEF = L.intefr(Pt, #Ob);// таблица ожидаемых частот
EF = TEF.c(3); OF = TOF.c(3);
assert(min(EF)>5);
X2 = (EF-OF)^2 / EF; x2 = sum(X2);
L2 = x2law(#X2-3);
PV = L2.pg(x2); // Критерий закончился
if(PV < 0.01) pow1 = pow1 + 1; //Подсчет количества раз, когда гипотеза о нормальности отвергнута
if(PV < 0.05) pow5 = pow5 + 1;
if(PV < 0.2) pow20 = pow20 + 1;
}
Power = ["PV=0.01", "PV=0.05", "PV=0.2"; pow1/N, pow5/N, pow20/N];
Размещено на Allbest.ru
...Подобные документы
Проверка гипотезы о нормальности распределения дневных логарифмических доходностей, рассчитанных по котировкам акций. Принятие в расчет достаточного объема выборок данных. Расчет характеристик временных рядов. Оценка статистического критерия Фроцини.
курсовая работа [307,0 K], добавлен 29.08.2015Общие понятия статистической проверки гипотез. Проверка гипотез на основе выборочной информации, понятие нулевая и альтернативная гипотезы. Формулировка общего алгоритма проверки. Проведение проверки статистической гипотезы в системе "Minitab" и MS Excel.
методичка [741,9 K], добавлен 28.12.2008Определение среднего значения показателя надежности сельскохозяйственной техники и ее элементов. Нахождение коэффициента вариации. Построение графиков дифференциальных и интегральных функций закона распределения Вейбулла. Расчет критерия согласия Пирсона.
курсовая работа [843,0 K], добавлен 07.08.2013Особенности метода проверки гипотезы о законе распределения по критерию согласия хи-квадрат Пирсона. Свойства базовой псевдослучайной последовательности. Методы оценки закона распределения и вероятностных характеристик случайной последовательности.
лабораторная работа [234,7 K], добавлен 28.02.2010Формулы вычисления критерия Пирсона, среднего квадратического отклонения и значений функций Лапласа. Определение свойств распределения хи-квадрата. Критерий согласия Колмогорова-Смирнова. Построение графика распределения частот в заданном массиве.
контрольная работа [172,2 K], добавлен 27.02.2011Понятие доверительного интервала и доверительной вероятности. Доверительный интервал для математического ожидания (пример задачи). Распределение Стьюдента. Принятие решения о параметрах генеральной совокупности, проверка статистической гипотезы.
реферат [64,9 K], добавлен 15.02.2011Понятие нулевой и альтернативной гипотез. Обычная процедура принятия решений. Область принятия гипотезы. Гипотетическое распределение, область принятия и распределения в действительности. Области и вероятность совершения ошибки при принятии решения.
презентация [61,3 K], добавлен 20.01.2015Основные характеристики распределения экономических величин. Сущность, особенности и метод вычисления коэффициента корреляции Пирсона. Расчет статистических характеристик величин с помощью MINITAB. Расчет основных статистических показателей в пакете.
методичка [411,0 K], добавлен 15.12.2008Построение рядов распределения с произвольными интервалами и с помощью формулы Стерджесса. Построение статистических графиков. Расчет и построение структурных характеристик вариационного ряда. Общая характеристика исследуемых статистических совокупностей.
курсовая работа [654,9 K], добавлен 12.04.2009Построение гистограммы и эмпирической функции распределения. Нахождение доверительного интервала для оценки математического распределения. Проверка статистической гипотезы о равенстве средних значений, дисперсий, их величине, о виде закона распределения.
курсовая работа [1,7 M], добавлен 29.11.2014Освоение методики организации и проведения выборочного наблюдения; статистических методов и методов компьютерной обработки информации; методов оценки параметров генеральной совокупности на основе выборочных данных. Проверка статистических гипотез.
лабораторная работа [258,1 K], добавлен 13.05.2010Статистический анализ курса Центрального банка валютной пары евро/рубль, построение соответствующих гистограмм. Выполнение описательной статистики выборочных данных, проверка гипотезы о нормальном распределении, равенстве средних и равенстве дисперсий.
курсовая работа [2,5 M], добавлен 08.07.2015Построение процедуры для проверки индивидуальных гипотез о равенстве вероятностей совпадения и несовпадения знаков случайных величин. Проверка адекватности условия оптимальности процедуры идентификации графа фондового рынка экспериментальным данным.
дипломная работа [823,9 K], добавлен 28.12.2015Дедуктивные выводы и правдоподобные рассуждения. Правила логического вывода. Методы поиска закономерностей на примерах. Примеры индукции в рассуждениях. Условное экзистенциальное суждение. Проверка насыщенности простой системы методом перебора.
контрольная работа [260,8 K], добавлен 20.02.2011Статистическая адекватность и проверка модели линейной регрессии на мультиколлинеарность. Исследование автокорреляции с помощью критерия Дарбина-Уотсона, тестов Сведа-Эйзенхарта и Бреуша-Годфри. Анализ гетероскедастичности и корректировка модели.
курсовая работа [1,5 M], добавлен 29.03.2015Модель зависимости доходности индекса телекоммуникации от индекса рынка. Результаты регрессионного анализа. Уравнение регрессии зависимости доходности отраслевого индекса от индекса. Регрессионная статистика, дисперсный анализ. Минимальный риск портфеля.
лабораторная работа [1,7 M], добавлен 15.11.2010Анализ структуры взаимосвязей признаков по данным трехмерной таблицы сопряженности с помощью логлинейных моделей. Непараметрические методы проверки гипотез об однородности распределения двух совокупностей. Модели двухфакторного дисперсионного анализа.
отчет по практике [388,6 K], добавлен 01.10.2013Ковариационная матрица оценок коэффициентов регрессии. Оценка дисперсии ошибок. Сущность теоремы Гаусса-Маркова. Проверка статистических гипотез, доверительные интервалы. Расчет коэффициента детерминации, скорректированного коэффициента детерминации.
контрольная работа [1,4 M], добавлен 28.07.2013Проверка нулевой и альтернативной гипотез с целью выполнения статистической проверки. Особенности использования тестовой статистики для проверки ряда на наличие тренда. Преимущества применения метода повторной выборки при проверке гидрологических данных.
презентация [47,5 K], добавлен 16.10.2014Базовые принципы и приемы, используемые при имитационном моделировании доходности финансового актива. Построение модели, способной прогнозировать доходность акции компании "РосНефть" через индекс MICEX и нефть марки Brent. Проверка модели на адекватность.
контрольная работа [415,5 K], добавлен 11.12.2014