Главная Коллекция "Revolution" Экономико-математическое моделирование Проверка гипотезы о независимости логарифмической доходности

Проверка гипотезы о независимости логарифмической доходности

Исследование особенностей индекса ММВБ10. Построение графиков цен для акций с максимальными скачками вверх и вниз. Проверка статистических гипотез. Характеристика критериев К. Пирсона. Изучение квантилей распределения статистики критерия Пирсона.

Рубрика	Экономико-математическое моделирование
Вид	курсовая работа
Язык	русский
Дата добавления	03.03.2015
Размер файла	228,8 K

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru

Федеральное государственное образовательное бюджетное учреждение

высшего профессионального образования

«Финансовый университет при Правительстве Российской Федерации»

(Финансовый университет)

Факультет «Прикладная математика и информационные технологии»

Кафедра «Теория вероятностей и математическая статистика»

Курсовая работа

по дисциплине: «Теория вероятностей и математическая статистика-2»

на тему: «Проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов»

вид исследуемых данных: акций компаний, входящие в индекс ММВБ 10

Выполнил: 15.05.2014

студент группы ПМ2-3 Юрочко С.Н.

Научный руководитель: профессор, к.ф.-м.н.

Браилов А.В.

Москва 2014

Введение

Подробное разъяснение темы

В данной работе осуществляется проверка гипотезы о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов. Актуальность данной темы не вызывает сомнения, поскольку рынок акций является очень перспективным для успешного долгосрочного и краткосрочного инвестирования, а проверка статистических гипотез и основанные на них статистические выводы являются мощным инструментом для анализа поведения рынка и помогают проследить его развитие и выявить существующие закономерности, что очень важно для участников рынка.

В качестве объекта исследования выступают акции компаний входящих в индекс ММВБ 10, в период с 1 января 2008 года по 31 декабря 2013 года. В данной работе применены некоторые методы математической статистики для проверки статистической гипотезы (в частности ч2 Пирсона.). Будет осуществляться проверка гипотез как на реальных, так и на модельных данных.

Все расчеты осуществляются в программной среде Матричный калькулятор MatCalc 2.9.1.6.

Описание выборок

Будут рассмотрены котировки акций компаний, входящих в индекс ММВБ 10. На момент написания работы (II квартал 2014 года) в состав индекса входят следующие компании: ГАЗПРОМ ао (GAZP), ГМКНорНик (GMKN), ЛУКОЙЛ (LKOH), Магнит ао (MGNT), Новатэк ао (NVTK), Роснефть (ROSN), Сбербанк (SBER), Сбербанк-п (SBERP), Сургнфгз-п (SNGSP), ВТБ ао (VTBR). Перед тем как работать с котировками данных компаний, будет произведен анализ, возможно, некоторые компании придется исключить.

1. Предварительный анализ данных

Индекс ММВБ10 (публикуется с 19 марта 2001 г., начальное значение индекса, рассчитанное на -- 18:00 по московскому времени 30 декабря 1997 года составляет 100 пунктов) представляет собой ценовой, невзвешенный индекс, рассчитываемый как среднее арифметическое изменения цен 10 наиболее ликвидных акций, допущенных к обращению на фондовой бирже ММВБ. ММВБ10 является российским аналогом американского индекса Dow Jones - самого известного и популярного индекса в мире. Индекс ММВБ10 отражает в режиме реального времени (с 10:30 до 19:00) прирост стоимости портфеля, состоящего из 10 акций, веса которых в составе портфеля в начальный момент времени одинаковы. Перечень 10 акций, по которым рассчитывается индекс, определяется один раз в квартал. На момент написания работы (второй квартал 2014 года) индекс ММВБ10 рассчитывался по акциям следующих эмитентов:

Тикер	Наименование компании
GAZP	Газпром
GMNK	ГМКНорНик
LKOH	Лукойл
MGNT	Магнит
NVTK	Новатэк
ROSN	Роснефть
SBER	Сбербанк
SBERP	Сбербанк-п
SNGSP	Сургнфгз-п
VTBR	ВТБ

Из приведенного перечня видно, что в индексе ММВБ10 значительна доля «голубых фишек».

ММВБ10 позволяет отслеживать малейшие колебания цен основных финансовых инструментов. Индекс ММВБ10 является первым биржевым индексом в России, методика которого не предусматривает временного усреднения цен, а пересчет значений индекса производится после каждой сделки, заключенной с любой из 10 выбранных акций в основном режиме торгов.

Чтобы проверить отсутствие грубых ошибок и различных сплитов в скачанных данных, проведена их проверка по нескольким параметрам: число торговых дней, максимальные дневные относительные скачки цен, графики цен. Использованы поля: Close - цены закрытия; единицы измерения - RUB (российский рубль).

Таблица 1 Число торговых дней

год/тикер	2008	2009	2010	2011	2012	2013
GAZP	246	249	248	248	255	250
GMKN	246	249	248	248	255	250
LKOH	246	249	248	248	255	250
MGNT	246	249	248	248	255	250
NVTK	246	249	248	248	255	250
ROSN	246	249	248	248	255	250
SBER	246	249	248	248	255	250
SBERP	246	249	248	248	255	250
SNGSP	246	249	248	248	255	250
VTBR	246	249	248	248	255	250

Полученные результаты свидетельствуют о том, что все взятые акции пригодны для исследования, проводимого в данной курсовой работе.

Ниже приведены таблицы максимальных и минимальных дневных относительных скачков логарифмических доходностей по годам. Для наглядности, максимальные по модулю скачки выделены цветом.

Таблица 2 Максимальные скачки цен вверх

год/тикер	2008	2009	2010	2011	2012	2013
GAZP	0,200333	0,081378	0,053666	0,071694	0,053854	0,045451
GMKN	0,301601	0,161132	0,075751	0,072754	0,045684	0,081395
LKOH	0,197666	0,097928	0,051574	0,097692	0,039952	0,03583
MGNT	0,209289	0,063959	0,062004	0,099372	0,056615	0,045835
NVTK	0,157088	0,11685	0,065604	0,07564	0,099868	0,037855
ROSN	0,240025	0,09392	0,062952	0,07617	0,036357	0,044226
SBER	0,228055	0,140449	0,080475	0,096916	0,071338	0,046867
SBERP	0,307294	0,148782	0,070018	0,095187	0,07795	0,05518
SNGSP	0,257347	0,100409	0,070256	0,084103	0,121505	0,10317
VTBR	0,292576	0,12406	0,070735	0,090802	0,059093	0,053839

Таблица 3 Максимальные скачки цен вниз

год/тикер	2008	2009	2010	2011	2012	2013
GAZP	0,287425	0,102928	0,107972	0,053922	0,040064	0,060526
GMKN	0,24165	0,148782	0,058088	0,077844	0,063167	0,04675
LKOH	0,270538	0,140089	0,041259	0,055334	0,053399	0,034772
MGNT	0,146497	0,121212	0,125597	0,065279	0,08225	0,071429
NVTK	0,34944	0,177645	0,070181	0,081461	0,066922	0,057234
ROSN	0,463035	0,149923	0,105199	0,072295	0,059175	0,043089
SBER	0,351459	0,175617	0,0924	0,076267	0,048088	0,047948
SBERP	0,477347	0,233876	0,062269	0,070111	0,086647	0,046839
SNGSP	0,424225	0,080199	0,071429	0,067937	0,061431	0,040513
VTBR	0,593407	0,162896	0,083582	0,057957	0,062558	0,053788

Построим графики цен для акций с максимальными скачками вверх и вниз соответственно, то есть графики цен акций компаний Сбербанк и ВТБ. (см. рис.1 и рис.2).

Рисунок 1 График цены компании SBER

Рисунок 2 График цены компании VTBR

цена акция пирсон

2. Теоретическая справка по проверке гипотез

2.1 Проверка статистических гипотез

Статистической гипотезой называется любое предположение о виде или параметрах неизвестного закона распределения.

Статистические гипотезы делятся на гипотезы о параметрах распределения известного вида (это так называемые параметрические гипотезы) и гипотезы о виде неизвестного распределения (непараметрические гипотезы).

Одну гипотезу выдвигают в качестве основной (H0), а другую, которая является логическим отрицанием H0 (противоположной гипотезой) - в качестве альтернативной гипотезы и обозначают H1.

Гипотезу, однозначно фиксирующую распределение наблюдений, называют простой (в ней идет речь об одном значении параметра), в противном случае - сложной. Например, гипотеза «вероятность появления события в схеме Бернулли равна 1/2» является простой, а гипотеза «вероятность появления события в схеме Бернулли заключена между 0,3 и 0,6» - сложная.

Имея две гипотезы , надо на основе выборки Х1,…,Хn принять либо основную гипотезу H0, либо конкурирующую H1.

Правило, по которому принимается решение принять или отклонить гипотезу H0 (соответственно, отклонить или принять H1), называется статистическим критерием (или просто критерием) проверки основной гипотезы.

Проверку гипотезы осуществляют на основании результатов выборки Х1, Х2,…, Хn, из которых формируют функцию выборки Tn = T(Х1, Х2,…, Хn), называемой статистикой критерия.

Основной принцип проверки гипотез состоит в следующем. Множество возможных значений статистики критерия Tn разбивается на два непересекающихся подмножества: критическую область S, т.е. область отклонения нулевой гипотезы и область принятия этой гипотезы. Если фактически наблюдаемое значение статистики критерия (т.е. значение критерия, вычисленное по выборке: Тn = Т (х1,х2,…,хn)) попадает в критическую область S, то основанная гипотеза Н0 отклоняется и принимается альтернативная гипотеза Н1; если же Тn попадает в , то принимается Н0, а Н1 отклоняется.

2.2 Задача проверки гипотез

Полученные экспериментально оценки распределения дают возможность только строить различные гипотезы о распределении случайной величины, например гипотезу о том, что она распределена нормально. Поэтому возникает задача проверки гипотез. Эта задача состоит в том, чтобы определить, насколько хорошо согласуется та или иная гипотеза о распределении случайной величины с полученными экспериментальными данными. Ясно, что эта задача тесно связана с задачей определения доверительных областей для плотности или функции распределения. Однако она имеет и некоторые особенности. Дело в том, что по той же выборке, по которой проверяется гипотеза о распределении, обычно оцениваются и некоторые параметры этого распределения. Так, например, проверяя гипотезу о нормальном распределении, по той же выборке обычно оценивают математическое ожидание и ковариационную матрицу (дисперсию в случае одномерного распределения) случайной величины.

Вследствие этого гипотетическое распределение оказывается само случайным -- функцией случайных результатов опытов. Это и отличает задачу проверки гипотез о распределении от задачи определения доверительных областей для распределений. И только в отдельных частных случаях может возникнуть задача проверки гипотезы о том, что случайная величина подчинена вполне определенному закону распределения, не зависящему от неизвестных параметров. Для проверки гипотез о распределении применяются различные критерии согласия. Наиболее удобным и универсальным критерием согласия является критерий К. Пирсона. Он совершенно не зависит ни от распределения случайной величины, ни от ее размерности.

2.3 ч2-критерий Пирсона

Критерии, с помощью которых определяется удачно или неудачно подобран закон распределения, принято обозначать критериями согласия. Критерий ч2 К. Пирсона - наиболее часто употребляемый критерий для проверки простой гипотезы о законе распределения. Он основан на использовании в качестве меры отклонения экспериментальных данных от гипотетического распределения той же величины, которая служит для построения доверительной области для неизвестной плотности, с заменой неизвестных истинных значений вероятностей попадания в интервалы вероятностями, вычисленными по гипотетическому распределению. Предположим, что область возможных значений случайной величины разбита на r интервалов (многомерных, т.е. прямоугольников, в случае векторной величины). Пусть - случайные частоты попадания в эти интервалы, получаемые в результате n опытов, Р1,…,Рr - вероятности попадания в те же интервалы, вычисленные по гипотетическому распределению.

В общем случае эти вероятности являются функциями оценок неизвестных параметров, получаемых по тем же экспериментальным данным, и потому тоже являются случайными величинами. Предположим, что оценки неизвестных параметров гипотетического распределения вычисляются по той же группированной выборке, что и частоты . Тогда вероятности Р1,…,Рr будут некоторыми функциями частот , и для оценки отклонения экспериментальных данных от гипотетического распределения берут величину

, (1)

где Р1,…,Рr - определенные функции частот.

Нейман и Пирсон показали, что если для вычисления вероятностей Р1,…,Рr применяется асимптотически эффективная и асимптотически нормальная оценка неизвестного s-мерного параметра гипотетического распределения по группированной выборке, то величина Z, определяемая формулой (1), в пределе при n ->? имеет ч2 -распределение с r-s-1 степенями свободы.

Пользуясь этой теоремой, можно оценивать расхождение экспериментальных данных с гипотетическим распределением с помощью таблиц ч2-распределения. Выберем достаточно малую вероятность р, чтобы событие с такой вероятностью можно было считать практически невозможным, и определим из уравнения

Если реализация =2величины Z, полученная в результате опытов, пре-восходит или равна , =2 , то гипотетическое распределение считают не согласующимся с экспериментальными данными, так как при этом распределении практически невозможно получить при одной выборке =2 . Вероятность такого события при большом числе опытов n приближенно равна р, т.е. пренебрежимо мала. В этом случае говорят, что имеет место значимое отклонение экспериментальных данных от гипотетического распределения. Если же =2, то считают, что гипотетическое распределение не противоречит экспериментальным данным, согласуется с ними.

Величина называется 100р-процетпным уровнем значимости отклонения выборки от гипотетического распределения. Обычно пользуются 5-, 1- и 0,1-процентными уровнями значимости, в зависимости от характера задачи.

Для дополнительной проверки согласованности экспериментальных данных с гипотетическим распределением полезно вычислить вероятность того, что при данном гипотетическом распределении величина Z окажется больше полученной в результате опытов ее реализации =2, P(Z > 2).Чем больше эта вероятность, тем лучше согласуется выборка с гипотетическим распределением, тем меньше значимость полученного расхождения выборки с гипотетическим распределением. Действительно, если вероятность Р(Z > 2) велика, то при повторении данной серии опытов в случае справедливости выбранной гипотезы о распределении часто будут получаться значения величины Z еще большие, чем полученное в результате опытов значение =2.

Обратим внимание на то, что, получив =2 < и даже получив высокую вероятность P(Z > 2), мы не делаем определенного вывода, что выбранная гипотеза о распределении справедлива, а говорим лишь, что эта гипотеза не противоречит полученным результатам опытов, что она согласуется с ними, вследствие чего ее можно принять. Чтобы получить достаточно веское доказательство того, что случайная величина действительно подчинена гипотетическому закону распределения, необходимо повторить данную серию опытов достаточно большое число раз и убедиться в том, что полученное согласование гипотезы с результатами опытов устойчиво.

2.4 Критерий Колмогорова

Критерий Колмогорова - вспомогательный критерий

В качестве вспомогательного критерия по проверке равномерности распределения P-значения основного критерия в данной работе используем критерий Колмогорова.

Критерий Колмогорова рассматривает максимальное значение модуля разности между статистической функцией распределения F^* (x) и соответствующей теоретической функцией распределения F(x, т.е. D = max|F^* (x)-F(x)|.

Следующим шагом определяется величина л=D. По статистическим таблицам (в среде matcalc функцией pvKolm(u)) находится вероятность того, что за счет чисто случайных причин максимальное расхождение между F^* (x) и F(x) будет не меньше, чем фактически наблюденное. Если вероятность P(л) сравнительно велика, то гипотезу следует принять, если весьма мала, то отвергнуть как неправдоподобную.

3. Проверка гипотезы для модельных данных

Для проверки гипотезы о нормальности распределения по критерию Гири, используя метод Монте-Карло, создадим таблицу 999 квантилей распределения статистики Qq при верной нулевой гипотезе.

Таблица 4 Отдельные квантили распределения статистики критерия Пирсона

q	Qq	q	Qq	q	Qq
0.01	0,575	0.21	2,441	0.41	3,722
0.02	0,767	0.22	2,501	0.42	3,782
0.03	0,913	0.23	2,562	0.43	3,850
0.04	1,028	0.24	2,628	0.44	3,926
0.05	1,158	0.25	2,709	0.45	3,996
0.06	1,249	0.26	2,783	0.46	4,057
0.07	1,354	0.27	2,849	0.47	4,135
0.08	1,443	0.28	2,907	0.48	4,195
0.09	1,528	0.29	2,964	0.49	4,267
0.10	1,630	0.30	3,024	0.50	4,349
0.11	1,715	0.31	3,087
0.12	1,801	0.32	3,149
0.13	1,868	0.33	3,230
0.14	1,952	0.34	3,282
0.15	2,021	0.35	3,353
0.16	2,095	0.36	3,416
0.17	2,176	0.37	3,468
0.18	2,235	0.38	3,533
0.19	2,295	0.39	3,591
0.20	2,370	0.40	3,656

Рассчитываем P-значения критерия, где в качестве эмпирической функции распределения статистики мы используем таблицу квантилей распределения статистики основного критерия. Строим на основании этих данных гистограмму распределения P-значений для модельных данных.

Рисунок 3 Гистограмма P-значений для модельных данных

Производится проверка равномерности распределения P-значения на отрезке [0,1] по критерию Колмогорова. Получаем значение, равное 0,935. Так как значение достаточно велико, то согласно правилу, описанному в теоретической справке по критерию Колмогорова, гипотеза о нормальности распределения логарифмической доходности по исследуемому критерию Пирсона принимается.

4. Выбор альтернативных гипотез и оценка мощности критерия

Для проверки мощности критерия Пирсона в качестве первой альтернативной гипотезы будем использовать гипотезу об экспоненциальном распределении.

Случайная величина Х имеет экспоненциальное распределение с параметром, если её плотность имеет вид

Интегрируя плотность, получаем функцию экспоненциального распределения

Мы будем использовать экспоненциальное распределение, потому что, во-первых оно уже реализовано в программе MatCalc, а во-вторых, потому что экспоненциальное распределение внешне сильно похоже на распределение модуля нормальной величины.

Таблица 5 Мощность критерия, экспоненциальное распределение

n	alpha	0,25	0,5	0,75	1	1,25	1,5	1,75	2
125	0,05	1	1	0,972	0,615	0,464	0,74	0,963	1
250	0,05	1	1	0,999	0,902	0,781	0,981	1	1
500	0,05	1	1	1	0,997	0,984	1	1	1

В качестве второй альтернативной выберем гипотезу о том, что логарифмическая доходность распределена по закону Стьюдента, так как с возрастанием числа степеней свободы оно приближается к нормальному распределению. Из этого делаем вывод, что данная альтернативная гипотеза не сильно отличается от первоначальной.

Таблица 6 Таблица значений мощности критерия Пирсона

уровень значимости	Pv=0.01	Pv=0.05	Pv=0.2
мощность критерия	0.829	0.934	0.985

Итак, мы видим, что при различных уровнях значимости мощность критерия Пирсона велика. Это значит, что вероятность совершить ошибку второго рода, то есть принять неправильную гипотезу, мала. А значит, мы с уверенностью можем утверждать, что полученные результаты данной курсовой работы окажутся верным.

5. Проверка гипотезы на реальных данных

Гипотеза о независимости логарифмических доходностей за различные интервалы времени при большом, среднем и малом объеме торгов проверялась с помощью критерия Пирсона. Уровень значимости б=0,05.

Программа находит малый, средний и большой объемы торгов, строя эмпирическое распределение по объему (для каждого года и тикера отдельно) и беря соответственно выборку меньше квантиля уровня 1/3, больше квантиля уровня 1/3 и меньше 2/3, и больше 2/3 соответственно. Затем она проверяет независимость логарифмических доходностей двух рядов данных, первый ряд состоит из дней с определенными видами торга, а второй из дней следующих за ними.

Таблица 7 2008г.

Тикер	LoVol	MidVol	HiVol
GAZP	0,57794	0,510377	0,425017
GMKN	0,060614	0,110645	0,543271
LKOH	0,676356	0,256273	0,868649
MGNT	*	0,940265	0,184429
NVTK	0,993946	0,981548	0,266213
ROSN	0,495098	0,315968	0,569832
SBER	0,822822	0,307887	0,247856
SBERP	0,601157	0,057269	*
SNGSP	0,340238	0,045592	0,011545
VTBR	*	0,093638	0,018632

Таблица 8 2009г.

Тикер	LoVol	MidVol	HiVol
GAZP	0,448633	0,391969	0,052693
GMKN	0,416666	0,431346	0,045655
LKOH	0,947709	0,913661	0,449975
MGNT	0,530968	0,86333	0,000239
NVTK	0,932783	0,130506	0,106215
ROSN	0,112538	0,871744	0,73996
SBER	0,689755	0,096976	0,431214
SBERP	0,668142	0,130808	0,1577
SNGSP	0,175122	0,121687	0,019537
VTBR	0,547083	0,11827	0,760712

Таблица 9 2010г.

Тикер	LoVol	MidVol	HiVol
GAZP	0,78308	0,23495	0,135792
GMKN	0,189897	0,128368	0,015867
LKOH	0,644705	0,991006	0,227855
MGNT	0,940572	0,824121	0,191202
NVTK	0,877268	0,067973	0,119513
ROSN	0,287452	0,486118	0,672927
SBER	0,274481	0,015734	0,310976
SBERP	0,266642	0,196643	0,169032
SNGSP	0,717195	0,009487	0,028626
VTBR	0,669869	0,021851	0,198768

Таблица 10 2011г.

Тикер	LoVol	MidVol	HiVol
GAZP	0,343598	0,344632	0,028165
GMKN	0,008505	0,055311	0,035698
LKOH	0,414403	0,918321	0,579339
MGNT	0,264015	0,160213	0,100216
NVTK	0,795331	0,006179	0,590717
ROSN	0,119666	0,861197	0,40782
SBER	0,401953	0,018158	0,20163
SBERP	0,007426	0,467585	0,631747
SNGSP	0,806209	0,735903	0,397873
VTBR	0,563692	0,395625	0,39994

Таблица 11 2012г.

Тикер	LoVol	MidVol	HiVol
GAZP	0,742108	0,070636	0,713633
GMKN	0,136639	0,823088	0,076007
LKOH	0,704354	0,872467	0,291506
MGNT	0,66032	0,214359	0,832269
NVTK	0,699701	7,10E-05	0,02897
ROSN	0,285574	0,796311	0,406639
SBER	0,153147	0,035023	0,052461
SBERP	0,024837	0,647216	0,003684
SNGSP	0,376958	0,865004	0,141448
VTBR	0,810749	0,163574	0,093217

Таблица 12 2013г.

Тикер	LoVol	MidVol	HiVol
GAZP	0,118672	0,4557	0,934985
GMKN	0,895637	0,472455	0,226902
LKOH	0,056203	0,910611	0,212161
MGNT	0,38558	0,015969	0,003859
NVTK	0,342346	0,001954	0,019551
ROSN	0,379428	0,380545	0,213746
SBER	0,01497	0,276569	0,523578
SBERP	0,098914	0,175182	0,014293
SNGSP	0,426355	0,189162	0,213311
VTBR	0,531757	0,20771	0,000419

Проведено 180 проверок гипотезы, из результатов таблиц видно , что гипотеза подтверждается в 85 % всех проверок (т.е 152 случаях). Любопытна динамика по годам: для 2008 и 2009 года гипотеза отвергается по 3 раза (10%), для 2010 года 5 раз (16,6%), для 2011 года 6 раз (20%), для 2012 года 4 раза (13,3%),для 2013 года 7 раз(23,3%), т.е количество отвергаемых случаев растет (исключение составил 2012 год). При рассмотрении отдельно для различных объемов торгов получим: для малого объема торга гипотеза отвергается в 4 случаях из 60(т.е в 6,6%), для среднего объема торга в 9 случаях(15%), для большого объема торга в 15 случаях(25%)

Заключение

В своей работе я проверил гипотезу о независимости логарифмической доходности за различные интервалы времени при большом, среднем и малом объеме торгов.

Исходя из полученных данных, можно сделать вывод, что логарифмическая доходность в целом не зависит, ни от объёмов торгов ( хотя при большом объеме торгов гипотеза отвергается чаще, но эта разница не существенна), ни от времени ( хотя можно предположить, что гипотеза отвергается чаще с течением времени для наших данных). Следовательно, фактически нельзя предсказать доходность акции следующего дня в зависимости от доходности сегодняшнего дня, даже исходя из объема торга. Никаких закономерностей между тикерами акций не обнаружено, значит действительно нельзя предсказать доходность следующего дня.

Литература

1. Браилов А.В. Лекции по математической статистике - М.: Финакадемия, 2007.

2. Кремер Н.Ш. Теория вероятностей и математическая статистика: Учебник для вузов. -- 2-е изд., перераб. и доп.-- М.: ЮНИТИ-ДАНА, 2004.

3. Гмурман В.Е. Теория вероятностей и математическая статистика: Учеб. пособие для вузов/В.Е. Гмурман. -- 9-е изд., стер. -- М.: Высш. шк., 2003.

4. Королюк В.С. Справочник по теории вероятностей и математической статисти-ке- М: Наука, 1985.

5. Письменный Д.Т. Конспект лекций по теории вероятностей и математической статистике. - М.: Айрис-пресс, 2004.

6. Пугачев B.C. Теория вероятностей и математическая статистика: Учеб. посо-бие.-- 2-е изд., исправл. и дополи.-- М.: ФИЗМАТ ЛИТ, 2002.

7. www.finam.ru

Приложение 1

Характеристики компьютера

- Тип процессора: Intel Core 2 Quad Q9300

- Частота процессора: 2500 МГц на ядро (x4);

- Частота системной шины: 1333 МГц

- Объем кэша второго уровня: 2х3072 Кб (такой большой объем обусловлен отсутствием кэша третьего уровня)

Программа <<Реальные данные.mtc>> выполняется 30 с.

Программа <<Мощность.mtc>> выполняется 27с.

Приложение 2

Коды программ

<<Число торговых дней.mtc>>

// Фошин Д. В. 2009г.

// Редакция Юрочко С. . 2014

// время выполнения 5,2 секунд

Y=[2008:2013];

ny=#Y;

T=["GAZP","GMKN", "LKOH", "MGNT","NVTK", "ROSN", "SBER", "SBERP","SNGSP","VTBR"];

NT=0(#T,#Y);

for (y in Y)

{

d1=date(y,1,1);

d2=date(y,12,31);

for (t in T)

{

X=loaddaily(d1,d2,t+".csv","<CLOSE>");

NT(t.num,y.num)=sum(X>0);

}

F=["год/тикер","2008","2009","2010","2011","2012","2013"];

tiker=[F;'T,NT];

savetable(tiker,"Число торговых дней.csv");

<<Максимальные и минимальные скачки цен.mtc>>

// Сытник Е.А 2012г.

// Редакция Юрочко С. . 2014

// время выполнения 3,0 секунд

T=["GAZP","GMKN", "LKOH", "MGNT","NVTK", "ROSN", "SBER", "SBERP","SNGSP","VTBR"];

Y = [2008:2013];

S1 = 0(#T,#Y);

S2 = 0(#T,#Y);

for (j in 1:#T)

{

for (i in 1:#Y)

{

I=loaddaily(date(Y(i),01,01), date(Y(i),12,31), T(j)+".csv", "<CLOSE>");

I=select(I,I>0);

S1(j,i)= max((1-exp(dif(ln(I)))));

S2(j,i)=-min((1-exp(dif(ln(I)))));

}

T1 = [" ",'Y;'T,S1];

T2 = [" ",'Y;'T,S2];

savetable(T1,"Скачки_вверх.csv");

savetable(T2,"Скачки_вниз.csv");

J=max(S1);

K=max(S2);

<<графики цены компаний SBER и VTBR.mtc>>

// Сафейкин Р.А. 2012г.

// Редакция Юрочко С. . 2014

// время выполнения 3,1 секунд

Tikkery=["SBERP";"VTBR"];

d1 = date(2008,1,1);

d2 = date(2013,12,31);

for (i in 1:2)

{

I0=loaddaily(d1,d2,Tikkery(i)+".csv","<CLOSE>");

I=select(I0,I0>0);

wintitle(Tikkery(i));

axes();

line(1:#I,I,red);

show();

erase();

}

<< Отдельные квантили распределения статистики критерия Пирсона.mtc>>

// время выполнения 2 секунды

nl=nlaw(0,1);

n=249;//размер выборки

N=10000;// кол-во испытаний

setmaxdim(2*N);

B=0(N);

dx = 0.05;

Zcr = 0(N);

qs = 0.001 : 0.999 : 0.001;

for (i in 1:N)

{

x = nl(n);

x = abs(x);

h = 0:3:0.5;

M = x.intfr(h);

EF = nl.intefr(h,n).c(3);

EF(1) = EF(1)-n/2;

B(i)=sum((M.c(3) - 2*EF)^2/(2*EF));

}

m=1000;

EL=elaw(B);

Q=EL.invpl(1/m:(m-1)/m:1/m);

savetable(Q, "Квантили Пирсона.csv");

<< Гистограмма P-значений для модельных данных.mtc>>

// время выполнения 9 секунд

//Редакция Юрочко С.

nl=nlaw(0,1);

N=1000;

n=249;

PV=0(N);

Q=loadvector("Квантили Пирсона.csv ");

for (i in 1:N)

{

x = nl(n);

x = abs(x);

h = 0:3:0.5;

M = x.intfr(h);

EF = nl.intefr(h,n).c(3);

EF(1) = EF(1)-n/2;

B=sum((M.c(3) - 2*EF)^2/(2*EF));

PV(i)=elaw(Q).pg(B);

}

hist(PV.intfr(0:1:0.1),green);//гистограмма Р-значений

axes();

//проверка равномерности Колмогорова

Pt=0:1:0.001;

d=maxabs(elaw(PV).pl(Pt)-ulaw(0,1).pl(Pt));

XX = pvKolm(d*(#PV)^0.5); // р-значение по критерию Колмогорова

if (XX>0.05) xx ="Принимается"; else xx = "Отвергается";

wintitle(xx + ", р-значение = " +round(XX,3));

savetable(round(PV,3),"P-значения для модельных данных.csv")

<<Таблица 7-12 Реальные данные.mtc>>

// Пивоварова К.М. 2008г.

//Редакция Юрочко С. 2014г.

// время выполнения 30 секунд

Tickers = '["GAZP","GMKN", "LKOH", "MGNT","NVTK", "ROSN", "SBER", "SBERP","SNGSP","VTBR"];

Vars = ["LoVol","MidVol","HiVol"];

TabPV = super(#Tickers,#Vars);

Y=[0:6];

for (y in Y){

d1 = date(2007,1,1);

d2 = date(2007+y,12,31);

for(ticker in Tickers) {

V = select(loaddaily(d1,d2,ticker + ".csv","<VOL>"),loaddaily(d1,d2,ticker + ".csv","<VOL>")>0);

LV = elaw(V);

v1 = LV.invpl(1/3);

v2 = LV.invpl(2/3);

P = select(loaddaily(d1,d2,ticker + ".csv","<Close>"),loaddaily(d1,d2,ticker + ".csv","<VOL>")>0);

assert(min(P)>0);

for(nv in 1:#Vars){

TabPV(ticker.num,nv) = "*";

if(nv==1) C = (V<=v1)(1:#V-1);

if(nv==2) C = (V>v1 & V<v2)(1:#V-1);

if(nv==3) C = (V>=v2)(1:#V-1);

lnR = select(dif(ln(P)), C);

m = #lnR;

if(m<100) continue;

minR = min(lnR)-1;

maxR = max(lnR)+1;

r = elaw(lnR).invpg(1/3);

// Другие варианты :

// r = 0.01;

//. r = 0.02;

Q = [-r;r];

D1 = [minR; Q; maxR];

D2 = [minR; Q; maxR];

r1 = #D1-1;

r2 = #D2-1;

lnR1 = lnR(1:m-1);

lnR2 = lnR(2:m);

n = #lnR1;

p = 0(r1,r2);

for (i in 1:r1){

for(j in 1:r2){

p(i,j) = sum(lnR1>=D1(i)&lnR1<D1(i+1) & lnR2>=D2(j)&lnR2<D2(j+1))/n;}} // p - матрица вероятностей попадания доходностей в получившиеся интервалы

assert(abs(sum(p)-1) < 0.000001);

k = (r1-1)*(r2-1);// степень свободы критерия

p2 = sum(cols(p));// сумма столбцов матрицы p

p1 = sum(rows(p));// сумма строк матрицы р

t = 0(r1,r2);

for (i in 1:r1){

for(j in 1:r2)

t(i,j) = p1(i)*p2(j);}

if(min(t*n) > 5){

Z = 0(r1,r2);

for(i in 1:r1){

for(j in 1:r2)

Z(i,j) = (p(i,j)-t(i,j))^2 / t(i,j);}

z = sum(Z)*n;

pv = x2law(k).pg(z); // P-значение

TabPV(ticker.num,nv) = pv;}}}

H = ["Тикер",Vars];

Out = [H; [Tickers,TabPV]];

savetable(Out,"tab20"+(7+y)+".csv");}

<< Мощность критерия, экспоненциальное распределение.mtc>>

//Болдарев Х. 2013г.

//Редакция Юрочко С. 2014г.

//Время выполнения 27с

N = 1000;//Кол-во испытаний

ns = [125,250,500];//размеры выборок

alpha = [0.05];//уровни принятия гипотезы

Lteor = nlaw(0,1);//С помощью него мы построим модуль норм. распределения

Lx2 = x2law(5);

lamb = [0.25,0.5,0.75,1,1.25,1.5,1.75,2];//Лямбды для показат. распр.

Result = 0(#ns*#alpha,#lamb);

for(l in lamb){

L = explaw(l);

for(n in ns){

Z = 0(N);

for(i in 1:N){

x = L(n);

h = 0:3:0.5;

M = x.intfr(h);

//равномерно распределяем по всей прямой значения

rasp = (M(6,3) - sum(x > 2.5 & x < 3))/5;

M(6,3) = sum(x > 2.5 & x < 3);

for(j in 1:5) M(j,3) = M(j,3) + rasp;

EF = Lteor.intefr(h,n).c(3);

EF(1) = EF(1)-n/2;

Z(i) = sum((M.c(3) - 2*EF)^2/(2*EF));//Строим статистику

}

PV=0(N);

PV = Lx2.pg(Z);//P - значения

for(a in alpha){

Result(n.num,l.num) = sum(PV >= a)/N;}//Записываем мощности

}

Result = 1 - Result;

A =0(3,2);

for(j in 0:2){

for(i in 1:1){ A(j+1,1) = ns(j+1); A(j+1,2) = alpha(i);}}

Return = ["n","alpha",lamb;A,Result];

savetable(Return,"Powers.csv");

<< Таблица значений мощности критерия Пирсона.mtc>>

//Аюпов Д. 2012г

//Время выполнения 8с.

timer(0);

N = 1000;

pow1 = 0; pow5 = 0; pow20 = 0;

for(n in 1:N)

{

Ob = tlaw(3)(250);// вместо данных загружаю закон стьюдента и проверяю на нормальность

M = mean(Ob);

S = stdev(Ob); //критерий

L = nlaw(M, S);

h = S; Pt = (M-3*S):(M+3*S):h;

TOF = Ob.intfr(Pt); // таблица наблюдаемых частот

TEF = L.intefr(Pt, #Ob);// таблица ожидаемых частот

EF = TEF.c(3); OF = TOF.c(3);

assert(min(EF)>5);

X2 = (EF-OF)^2 / EF; x2 = sum(X2);

L2 = x2law(#X2-3);

PV = L2.pg(x2); // Критерий закончился

if(PV < 0.01) pow1 = pow1 + 1; //Подсчет количества раз, когда гипотеза о нормальности отвергнута

if(PV < 0.05) pow5 = pow5 + 1;

if(PV < 0.2) pow20 = pow20 + 1;

}

Power = ["PV=0.01", "PV=0.05", "PV=0.2"; pow1/N, pow5/N, pow20/N];

Размещено на Allbest.ru

...

курсовая работа "Проверка гипотезы о независимости логарифмической доходности" скачать

Подобные документы

Проверка гипотезы о нормальном распределении логарифмической доходности по критерию Фроцини
Проверка гипотезы о нормальности распределения дневных логарифмических доходностей, рассчитанных по котировкам акций. Принятие в расчет достаточного объема выборок данных. Расчет характеристик временных рядов. Оценка статистического критерия Фроцини.

курсовая работа [307,0 K], добавлен 29.08.2015
Проверка статистических гипотез при помощи системы "Minitab" для Windows
Общие понятия статистической проверки гипотез. Проверка гипотез на основе выборочной информации, понятие нулевая и альтернативная гипотезы. Формулировка общего алгоритма проверки. Проведение проверки статистической гипотезы в системе "Minitab" и MS Excel.

методичка [741,9 K], добавлен 28.12.2008
Методика обработки отказов автотракторных двигателей
Определение среднего значения показателя надежности сельскохозяйственной техники и ее элементов. Нахождение коэффициента вариации. Построение графиков дифференциальных и интегральных функций закона распределения Вейбулла. Расчет критерия согласия Пирсона.

курсовая работа [843,0 K], добавлен 07.08.2013
Исследование статистических характеристик случайной последовательности
Особенности метода проверки гипотезы о законе распределения по критерию согласия хи-квадрат Пирсона. Свойства базовой псевдослучайной последовательности. Методы оценки закона распределения и вероятностных характеристик случайной последовательности.

лабораторная работа [234,7 K], добавлен 28.02.2010
Методы оценки параметров распределения
Формулы вычисления критерия Пирсона, среднего квадратического отклонения и значений функций Лапласа. Определение свойств распределения хи-квадрата. Критерий согласия Колмогорова-Смирнова. Построение графика распределения частот в заданном массиве.

контрольная работа [172,2 K], добавлен 27.02.2011
Доверительный интервал. Проверка статистических гипотез
Понятие доверительного интервала и доверительной вероятности. Доверительный интервал для математического ожидания (пример задачи). Распределение Стьюдента. Принятие решения о параметрах генеральной совокупности, проверка статистической гипотезы.

реферат [64,9 K], добавлен 15.02.2011
Проверка гипотез, связанных с коэффициентами регрессии
Понятие нулевой и альтернативной гипотез. Обычная процедура принятия решений. Область принятия гипотезы. Гипотетическое распределение, область принятия и распределения в действительности. Области и вероятность совершения ошибки при принятии решения.

презентация [61,3 K], добавлен 20.01.2015
Выполнение статистических расчетов с помощью ЭВМ в системе MINITAB и Exсel
Основные характеристики распределения экономических величин. Сущность, особенности и метод вычисления коэффициента корреляции Пирсона. Расчет статистических характеристик величин с помощью MINITAB. Расчет основных статистических показателей в пакете.

методичка [411,0 K], добавлен 15.12.2008
Проведение исследовательской работы со статистическими данными
Построение рядов распределения с произвольными интервалами и с помощью формулы Стерджесса. Построение статистических графиков. Расчет и построение структурных характеристик вариационного ряда. Общая характеристика исследуемых статистических совокупностей.

курсовая работа [654,9 K], добавлен 12.04.2009
Статистический анализ данных
Построение гистограммы и эмпирической функции распределения. Нахождение доверительного интервала для оценки математического распределения. Проверка статистической гипотезы о равенстве средних значений, дисперсий, их величине, о виде закона распределения.

курсовая работа [1,7 M], добавлен 29.11.2014
Проведение выборочного наблюдения
Освоение методики организации и проведения выборочного наблюдения; статистических методов и методов компьютерной обработки информации; методов оценки параметров генеральной совокупности на основе выборочных данных. Проверка статистических гипотез.

лабораторная работа [258,1 K], добавлен 13.05.2010
Анализ поведения финансовых индексов с помощью методов математической статистики на примере курса Центрального банка валютной пары евро/рубль
Статистический анализ курса Центрального банка валютной пары евро/рубль, построение соответствующих гистограмм. Выполнение описательной статистики выборочных данных, проверка гипотезы о нормальном распределении, равенстве средних и равенстве дисперсий.

курсовая работа [2,5 M], добавлен 08.07.2015
Процедуры для проверки многих гипотез о симметрии знаков доходностей на рынке
Построение процедуры для проверки индивидуальных гипотез о равенстве вероятностей совпадения и несовпадения знаков случайных величин. Проверка адекватности условия оптимальности процедуры идентификации графа фондового рынка экспериментальным данным.

дипломная работа [823,9 K], добавлен 28.12.2015
Формирование и проверка гипотез
Дедуктивные выводы и правдоподобные рассуждения. Правила логического вывода. Методы поиска закономерностей на примерах. Примеры индукции в рассуждениях. Условное экзистенциальное суждение. Проверка насыщенности простой системы методом перебора.

контрольная работа [260,8 K], добавлен 20.02.2011
Исследование проблемы автокорреляции (первого порядка) случайных отклонений с помощью теста Сведа-Эйзенхарта и статистики Дарбина-Уотсона, а также графических методов
Статистическая адекватность и проверка модели линейной регрессии на мультиколлинеарность. Исследование автокорреляции с помощью критерия Дарбина-Уотсона, тестов Сведа-Эйзенхарта и Бреуша-Годфри. Анализ гетероскедастичности и корректировка модели.

курсовая работа [1,5 M], добавлен 29.03.2015
Применение регрессионного анализа при оценке рисков
Модель зависимости доходности индекса телекоммуникации от индекса рынка. Результаты регрессионного анализа. Уравнение регрессии зависимости доходности отраслевого индекса от индекса. Регрессионная статистика, дисперсный анализ. Минимальный риск портфеля.

лабораторная работа [1,7 M], добавлен 15.11.2010
Непараметрические методы проверки статистических гипотез
Анализ структуры взаимосвязей признаков по данным трехмерной таблицы сопряженности с помощью логлинейных моделей. Непараметрические методы проверки гипотез об однородности распределения двух совокупностей. Модели двухфакторного дисперсионного анализа.

отчет по практике [388,6 K], добавлен 01.10.2013
Линейная модель множественной регрессии
Ковариационная матрица оценок коэффициентов регрессии. Оценка дисперсии ошибок. Сущность теоремы Гаусса-Маркова. Проверка статистических гипотез, доверительные интервалы. Расчет коэффициента детерминации, скорректированного коэффициента детерминации.

контрольная работа [1,4 M], добавлен 28.07.2013
Определение изменений в рядах гидрологических наблюдений
Проверка нулевой и альтернативной гипотез с целью выполнения статистической проверки. Особенности использования тестовой статистики для проверки ряда на наличие тренда. Преимущества применения метода повторной выборки при проверке гидрологических данных.

презентация [47,5 K], добавлен 16.10.2014
Имитационное моделирование доходности финансового актива
Базовые принципы и приемы, используемые при имитационном моделировании доходности финансового актива. Построение модели, способной прогнозировать доходность акции компании "РосНефть" через индекс MICEX и нефть марки Brent. Проверка модели на адекватность.

контрольная работа [415,5 K], добавлен 11.12.2014

Другие документы, подобные "Проверка гипотезы о независимости логарифмической доходности"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.