Множественная проверка гипотез о средней доходности
Методы теории множественных решений, оптимальный тест без учета априорной информации. Эксперименты гипотез, использование процедур Бонферрони и Холма. Анализ российского и американского рынков. Сравнение тестов без учета и с учетом априорной информации.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 17.07.2020 |
Размер файла | 4,9 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ АВТОНОМНОЕ
ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ
ВЫСШЕГО ОБРАЗОВАНИЯ
«НАЦИОНАЛЬНЫЙ ИССЛЕДОВАТЕЛЬСКИЙ УНИВЕРСИТЕТ
«ВЫСШАЯ ШКОЛА ЭКОНОМИКИ»
Факультет информатики, математики и компьютерных наук
Программа подготовки бакалавров по направлению
ВЫПУСКНАЯ КВАЛИФИЦИРОВАННАЯ РАБОТА
Множественная проверка гипотез о средней доходности
Елькина Варвара
Нижний Новгород, 2020
Оглавление
- Введение
- Глава I. Теоретические основы
- 1.1 Постановка задачи
- 1.2 Методы теории множественных решений
- 1.3 Оптимальный несмещенный тест без учета априорной информации
- 1.4 Вывод статистики оптимального несмещенного теста с учетом априорной информации
- 1.5 Методы множественной проверки гипотез
- Глава II. Проведение экспериментов и анализ характеристик тестов
- 2.1 Эксперименты сравнения тестов без учета и с учетом априорной информации
- 2.2 Эксперименты множественной проверки гипотез. Использование процедур Бонферрони и Холма
- 2.3 Анализ Российского и Американского рынков
- Заключение
- Список литературы
- Приложение А
- Приложение Б
- Приложение В
Введение
Актуальность темы дипломной работыС появлением фондового рынка, актуальными стали вопросы его изучения и прогнозирования. В настоящее время уже существует множество различных работ, как наших, так и зарубежных авторов, посвященных изучению проблем фондового рынка. Но, проанализировав их, можно сделать вывод о том, что практически все они носят общеэкономический характер, заключая в себе трактовку методов технического и фундаментального анализа, применяемых на Западе. В то же время, возможность применения современных статистических методов исследования для оценки состояния и прогнозирования фондового рынка открывает новые возможности. Именно важность применения на практике методов математической статистики и обусловило выбор темы данной дипломной работы: «Множественная проверка гипотез о средней доходности». априорная информация учет бонферрони
Цели и задачи дипломной работы. Целью дипломной работы является построение статистических процедур множественной проверки гипотез о равенстве нулю средней доходности.
Для реализации поставленных целей были определены следующие задачи:
· Изучение способов построения статистических тестов проверки гипотез о равенстве нулю для средних доходностей акций.
· Вывод оптимальной статистической процедуры с учетом зависимости акций.
· Изучение процедур и методов множественной проверки гипотез.
· Исследование характеристик статистических тестов на искусственно сгенерированных данных, подбор параметров и значений.
· Анализ влияния информации о зависимости акций.
· Построение процедур множественной проверки гипотез и проверка работы этих процедур на реальных данных.
Объект исследования.Объектом исследования являются логарифмические доходности акций.
Проверяемое предположение. Возможно ли считать, что реальные данные не противоречат гипотезе о том, что средняядоходность акций фондовых рынков различных стран равна нулю.
Источники исследования.Информационной базой дипломной работы послужили данные о ценах акций Московскойбиржи и американского внебиржевого рынка NASDAQза периоды с 2018 по 2019 и с 2008 по 2018, которые были получены с сайтаYahooFinance.
Обработка информации, моделирование и вычисления реализованы с использованием компьютерной программы JupyterNotebook, язык программирования - Python.
Глава I. Теоретические основы
1.1 Постановка задачи
Пусть наблюдается изменение котировок акций за определенный промежуток времени. Количество рассматриваемых акций на данном фондовом рынке будем обозначать через N, а число дней, за которое осуществлялось наблюдение, - через n.
Как было сказано ранее, основой данной работы является информация о доходностях акции за определенный промежуток времени, которая находится по формуле:
где - цена акции iза день t (i = 1,…,N; t = 1,…,n)
Также в работе делаем следующие предположения:
· является наблюдением случайной величины
· Случайные величины при t=1,…,nи фиксированном iнезависимы и имеют одинаковое распределение.
· Случайный вектор ()имеет многомерное нормальное распределение с вектором средних значений , где , и ковариационной матрицей , где .
Основной теоретический вопрос: возможно ли считать, что реальные данные не противоречат гипотезе о том, что средняядоходность акций фондовых рынков различных стран равна нулю.
Для проверки этого вопроса, необходимо узнать для каких акций, при каком объеме данных и для каких фондовых рынков гипотеза о значении средней доходности равной 0 будет отвергаться. А значит задача сводится к задаче множественной проверки гипотез и выбору одной гипотезы из набора следующих гипотез:
где - суммарное число гипотез.
1.2 Методы теории множественных решений
Набор гипотез описанный выше можно записать через следующие порождающие гипотезы
(2)
Таким образом, можно записать
(3)
Стоит отметить, что в данном случае все пресечения параметрических областей для соответствующих гипотез не пустые.
Для проверки порождающих или индивидуальных гипотез используется следующий тест:
(4)
Где - решение о принятии гипотезы ; - решение об отвержении гипотезы (принятии альтернативной гипотезы ); - статистика теста.
Нетрудно видеть, что все пересечения областей принятия и отвержения гипотез не пустые, т.е.
Тогда между разбиением (1) пространства и разбиением (2) параметрического пространства существует взаимнооднозначное соответствие. Таким образом, множество тестов (4) совестимо с задачей (1), статистическую процедуру которой можно записать в следующем виде:
(5)
Пусть будет обозначать потери в случае отвержения гипотезы , когда гипотеза истинная, т.е. потери от ошибки первого рода, и пусть будет обозначать потери в случае принятия гипотезы , когда она ложная, т.е. потери от ошибки второго рода(i = 1,2,…,N).
Обозначим через потери в случае принятии решения при верной гипотезе , где j,k=1,2,…,L. Связь потерь , и является ключевой во множественной проверке гипотез и называется аддитивной функцией потерь. В работе предполагается, что условие аддитивности выполняется. Это означает, что потери от неправильной классификации акций равны сумме потерь от неправильной классификации отдельных акций.
Рассмотрим пару примеров, чтобы разобраться. При таком условии имеем , потому что и отличались одной компонентой, и гипотеза должна быть верной, хотя было принято решение. По такому же принципу получаем , , , . Таким образом, можем записать в общем виде
(6)
Где
Качество любой статистической процедуры измеряется функцией риска [4]. В данном случае функция риска определяется следующим образом.
Тогда
С учетом аддитивности функции потерь функция риска принимает вид:
(7)
Основной результат теории Лемана гласит: если статистические процедуры все не смещены, то процедура множественного решения тоже не смещена, а также если все оптимальны в классе несмещенных статистических процедур, то процедура принятия решения также оптимальна.[2]
Обозначим через функцию потерь
(8)
Функция принятия решения называется W-несмещенной если для всех м и м'
(9)
Риск для теста (4) порождающих гипотез для и функция потерь ()
(10)
Риск для теста (4) порождающих гипотез для и функция потерь ()
(11)
Тогда можно записать
Таким образом (4) будет W-несмещенным если
(12)
Преобразуем неравенства с учетом
Получим
(13)
Таким образом, можно видеть, что условие W-несмещенности для данной функции потерь эквивалентно
Согласно (7) условие W-несмещенности для аддитивной функции потерь для статистической процедуры множественного решения (5) имеет вид:
(14)
1.3 Оптимальный несмещенный тест без учета априорной информации
В статье [1] рассматривается задача проверки гипотез против альтернатив для многомерного нормального распределения, где , и доходности всех акций неизвестны. Для этой задачи выводится несмещенный статистическийтест, который выглядит следующим образом:
(15)
Стоит отметить, что данный статистический тест зависит только от элементов диагонали ковариационной матрицы.
Таким образом, несмещенный статистический тест для гипотез против альтернативы , где i=1,…,N, можно записать в следующем виде:
(16)
где - решение об не отвержении гипотезы, -решение об отвержении гипотезы, -квантиль нормального распределения для заданного уровня значимости .
1.4 Вывод статистики оптимального несмещенного теста с учетом априорной информации
Рассмотрим случай, когда на рынке всего N акций, средняя доходность неизвестна, а средние доходности известны. Необходимо относительно построить несмещенный тест гипотезы против альтернативы с учетом априорной информации.
Запишем функцию плотности
Для того, чтобы говорить, что существует равномерно наиболее мощный несмещенный критерий, необходимо показать, что тест имеет Неймановскую структуру [7]. Другими словами, что функция плотности удовлетворяет экспоненциальному семейству распределений и может быть записана в виде:
(17)
Распишем выражениепод экспонентой
Таким образом, функцию плотности можно записать следующим образом
Выведем статистику, выделив информацию о под экспонентой
Итоговую плотность можно записать в следующем виде
Эта плотность удовлетворяет (17). Таким образом статистика имеет вид:
Далее, нормируем статистику, чтобы она удовлетворяла стандартному нормальному распределению
Таким образом, итоговый тест для проверки гипотезы против альтернативы с учетом априорной информации имеет следующий вид
(18)
Где - решение об не отвержении гипотезы, -решение об отвержении гипотезы, -квантиль нормального распределения для заданного уровня значимости
1.5 Методы множественной проверки гипотез.
Задача (1) представляет собой задачу множественной проверки гипотез - класс задач прикладной статистики, который возникает в случае одновременного построения статистических выводов. Как правило, при проверке каждой статистической гипотезы предполагается возможность ошибки первого рода (т.е. отклонение верной нулевой гипотезы).
Однако, при решении такого вида задач возникает проблема: чем больше проверяется гипотез с использованием одних и тех же данных, тем больше будет вероятность допустить хотя бы одну ошибку первого рода, это означает, что практически наверняка будет сделана хотя бы одна ошибка о неверном отвержении гипотезы. Такое явление принято называть эффектом множественного сравнения (англ. multiplecomparisons или multipletesting). Рассмотрим более подробно эту проблему.
Найдем вероятность совершить хотя бы одну ошибку первого рода в ?? независимых тестах:
??(совершить хотя бы одну1 ошибку) = ??,
?? (не совершить 1 ошибку) = 1 ? ??,
?? (не совершить ни одной1 ошибку в ?? независимых тестах) = ,
??(совершить хотя бы одну ошибку в ?? независимых тестах) = .
Как показано выше, совместное построение ?? независимых заключений становится причиной того, что вероятность совершить хотя бы одну ошибку первого рода получается ограничена сверху величиной вида , которая уже при малых m становится недопустимо большой.
Число m независимых тестов |
Вероятность совершить хотя бы одну ошибку первого рода б = 0.05 |
|
5 |
0,226219 |
|
10 |
0,401263 |
|
15 |
0,536709 |
|
20 |
0,641514 |
|
25 |
0,72261 |
Большая вероятность совершения хотя бы одной ошибки первого рода означает, что практически наверняка будет совершена хотя бы одна ошибка о неверном отвержении гипотезы. Для устранения эффекта множественных сравнений существует большой арсенал методов, которые будут рассмотрены далее.
Групповая вероятность ошибки первого рода
Прежде чем приступить к рассмотрению процедур множественной проверки статистических гипотез, необходимо выяснить, для чего именно эти процедуры служат с математической точки зрения.
Допустим, что мы проверяем истинность m нулевых гипотез, которые в дальнейшем будем обозначать через ,,… . В отношении каждой из этих гипотез мы применяем определенный статистический критерий и делаем заключение о том, отвергаем ли мы гипотезу или нет. Результаты такого анализа можно отобразить в следующей таблице:
Таблица 2. Ошибки первого и второго рода при множественной проверке гипотез.
Представленную выше таблицу необходимо понимать следующим образом:
· В первой строчке мы видим, что всего число верных нулевых гипотез равняется , из которых часть U гипотез в результате анализа определяется правильно, а соответственно остальная V часть ошибочно отвергается.
· Аналогичная ситуация происходит и во второй строчке, существует число неверных (альтернативных) гипотез, которые в свою очередь содержат число S безошибочно отвергнутых гипотез и соответственно число T ошибочно принятых.
· Стоит заметить, что количество отвергнутых R и количество принятых W гипотез известно, в то время как и нам неизвестны.
Получается, необходимо минимизировать количество ложно отвергнутых гипотез (ошибка первого рода), а так же количество ложно принятых гипотез. Если число ложно отвергнутых гипотез не меньше одного (V?1), то в таком случае совершается как минимум одна ошибка первого рода, а вероятность такой ошибки в случае множественной проверки гипотез принято называть «групповой вероятностью ошибки» или FWER (англ. «familywiseerrorrate»).
(19)
Пытаясь контролировать групповую вероятность ошибки на определенном, заданном уровне значимости б, необходимо, чтобы выполнялось неравенство.
Процедура Бонферрони
Метод Бонферрони (названный в честь предложившего его итальянского математика Карло Эмилио Бонферрони; CarloEmilioBoferroni) является одним из наиболее простых и известных методов контроля групповой вероятности ошибки.
Основная идея метода заключается в том, что для контроля ??WER на уровне ?? достаточно, чтобы отвергались только те гипотезы , для которых выполняется условие: ,
где ? p-value, полученное при проверке соответствующей гипотезы , а ??? количество проверяемых гипотез. Деление исходного уровня значимости ?? на ??-- это и есть поправка Бонферрони.
Теорема (Процедура Бонферрони):
Пусть даны следующие гипотезы ,,…. Тогда если текущая гипотеза отвергается при , то выполняется неравенство (групповая вероятность совершить хотя бы одну ошибку не превышает заданный уровень значимости при одновременной проверке гипотез ,,…).
Доказательство:
Обозначим I, как неизвестное подмножество истинных нулевых гипотез, тогда | I | - мощность этого множества.Допустим, что гипотезы верны при , все остальные ложные. Тогда из неравенства Бонферрони следует:
¦
Хотя метод Бонферрони и прост в реализации, а так же позволяет ограничить вероятность ошибки первого рода, он обладает одним существенным недостатком: при возрастании числа проверяемых гипотез мощность этого метода резко снижается, поскольку каждую гипотезу проверяют на уровне значимости . Однако, существуют другие методы, результаты которых превосходят по мощности процедуру, основанную на поправке Бонферрони.
Процедура Холма
Метод Холма - метод, обеспечивающий безусловный контроль над FWER на уровне б.
Зададим уровень значимости б. Далее, упорядочим гипотезы ,,… по неубыванию соответствующих им p-value: .
Шаг 1. Если , то следует принять все нулевые гипотезы ,,… и остановиться. Иначе, необходимо отвергнуть гипотезу и продолжить проверку оставшихся гипотез на уровне значимости.
Шаг 2. Если , то следует принять все нулевые гипотезы ,… и остановиться. Иначе, необходимо отвергнуть гипотезу и продолжить проверку оставшихся гипотез на уровне значимости.
Шаг K. Если , то принять все нулевые гипотезы … и остановиться. Иначе, необходимо отвергнуть гипотезу и продолжить проверку оставшихся гипотез на уровне значимости.
Шаг M. Если , то принимаем гипотезу и процедура останавливается.
Этот метод гарантирует, что ,
Доказательство
Холм контролирует FWER следующим образом.
Пусть ,,… - семейство гипотез, а отсортированные p-значения. Пусть будет набором индексов, соответствующих (неизвестным) истинным нулевым гипотезам, имеющим членов.
Допустим, мы ошибочно отвергаем истинную гипотезу. Мы должны доказать, что вероятность этого события не превышает б. Пусть h будет первой отвергнутой истинной гипотезой (первой в порядке, заданном тестом Холма). Тогда , … , все отвергнутые ложные гипотезы и . Оттуда мы получаем
(20)
Поскольку h отклоняется, у нас есть по определению теста. Используя (20), получается что правая часть не более . Таким образом, если мы ошибочно отвергаем истинную гипотезу, должна быть истинная гипотеза с p-value не более .
Итак, определяем случайную переменную . Каким бы ни был (неизвестный) набор истинных гипотез , у нас есть , исходя из Неравенства Бонферрони. Следовательно, вероятность отклонить истинную гипотезу не превышает б.¦
Глава II. Проведение экспериментов и анализ характеристик тестов
Перед непосредственным применением тестов для проверки гипотезы на реальных данных, необходимо изучить основные характеристики, проанализировать поведение теста без учета априорной информации и теста с учетом априорной информации и выбрать из этого анализа лучший.
Для тестирования статистических процедур применялся метод Монте-Карло. Дляэтогоспомощьюфункцииnumpy.random.multivariate_normal(mean, cov, size), гдеmean-вектор математического ожидания, cov-ковариационная матрица, size-размер выборки, генерировались повторные наблюдения, имеющие псевдослучайное многомерное нормальное распределение.
2.1 Эксперименты сравнения тестов без учета и с учетом априорной информации
Сравнение процедур без учета и с учетом априорной информации, осуществлялось по средствам сравнения ошибок первого рода и мощности обеих процедур.
Для того, чтобы показать различия процедур, брались 3 вида ковариационных матриц: ковариационная матрицаакций индекса NASDAQ100; ковариационная матрица, элементы которой превышают заданный порог; единичная матрица.Уровень значимости брался равным б=0,05. Количество повторных генераций = 1000.
Ошибка первого рода
Для оценки ошибки первого рода при генерации наблюдений многомерного нормального распределения брался нулевой вектор, в качестве ковариационной матрицы брались 3 различные ковариационные матрицы, описанные выше.
Далее, для полученных наблюдений проводим проверку гипотез теста с учетом априорной информации и без ее учета. Для каждых тестов подсчитывалась доля отклонения верной гипотезы - количество отверженных гипотез деленное на количество всех проверяемы гипотез.Ниже представлены результаты для различных ковариационных матриц.
Ковариационная матрица акций индекса NASDAQ100 |
|||||||||||
б |
N |
10 |
25 |
50 |
75 |
100 |
250 |
500 |
750 |
1000 |
|
0.05 |
Без учета а.и. |
0.105 |
0.073 |
0.05 |
0.05 |
0.049 |
0.046 |
0.053 |
0.054 |
0.055 |
|
С учетом а.и. |
0.061 |
0.043 |
0.048 |
0.046 |
0.048 |
0.037 |
0.045 |
0.05 |
0.056 |
||
0.01 |
Без учета а.и. |
0.033 |
0.018 |
0.016 |
0.007 |
0.02 |
0.007 |
0.014 |
0.01 |
0.009 |
|
С учетом а.и. |
0.007 |
0.01 |
0.009 |
0.01 |
0.008 |
0.008 |
0.008 |
0.01 |
0.01 |
||
Пороговая ковариационная матрица |
|||||||||||
б |
N |
10 |
25 |
50 |
75 |
100 |
250 |
500 |
750 |
1000 |
|
0.05 |
Без учета а.и. |
0.089 |
0.08 |
0.058 |
0.062 |
0.055 |
0.051 |
0.045 |
0.04 |
0.054 |
|
С учетом а.и. |
0.049 |
0.056 |
0.05 |
0.054 |
0.05 |
0.058 |
0.045 |
0.041 |
0.053 |
||
0.01 |
Без учета а.и. |
0.041 |
0.013 |
0.011 |
0.017 |
0.01 |
0.007 |
0.006 |
0.005 |
0.011 |
|
С учетом а.и. |
0.008 |
0.008 |
0.015 |
0.009 |
0.015 |
0.009 |
0.006 |
0.009 |
0.004 |
||
Единичная матрица |
|||||||||||
б |
N (б=0.05) |
10 |
25 |
50 |
75 |
100 |
250 |
500 |
750 |
1000 |
|
0.05 |
Без учета а.и. |
0.103 |
0.054 |
0.058 |
0.04 |
0.057 |
0.043 |
0.046 |
0.049 |
0.048 |
|
С учетом а.и. |
0.055 |
0.042 |
0.048 |
0.042 |
0.062 |
0.038 |
0.045 |
0.048 |
0.047 |
||
0.01 |
Без учета а.и. |
0.045 |
0.018 |
0.013 |
0.013 |
0.014 |
0.008 |
0.011 |
0.01 |
0.007 |
|
С учетом а.и. |
0.011 |
0.006 |
0.009 |
0.013 |
0.008 |
0.009 |
0.009 |
0.011 |
0.006 |
Вывод: из приведенных выше таблиц и графиков видно, что тестам проверки гипотезы о равенстве нулю, как с учетом априорной информации, так и без учета, удается контролировать заданный уровень значимости(0.05 и 0.01) на выборках, размерностью больше 100. Однако, на выборках меньшего размера тесту без учета априорной информации контролировать уровень значимости не удается, что нельзя сказать о другом тесте. Таким образом, можно сказать, что тест с учетом априорной информации менее чувствителен к размеру выборки.
Мощность
Для оценки мощности, которая рассчитывалась как доля верно отвергнутых гипотез, при генерации наблюдений многомерного нормального распределения брались различные значения вектора математических ожиданий. Эксперименты по прежнему проводились для 3 различных матриц. Ниже представлены результаты тестирования мощности.
Из графиков видно, что для ковариационной матрицы NASDAQ100 и пороговой ковариационной матрицы мощности обоих тестов при различных значениях м, где это значение не равно 0, на промежутке от -1 до 1 максимальны, т.е. равны 1. В случае единичной матрицы значения мощностей обоих тестов примерно одинаковы и равны единице для м, значения которых по модулю больше и равны 0.5. Посмотрим как ведут себя мощности тестов при меньших значениях м.
Из рисунков 10 и 11 можно увидеть что для ковариационной матрицы NASDAQ100 мощность теста с учетом априорной информации имеет большую мощность в отличие от теста без учета априорной информации. Однако, для пороговой ковариационной и единичной матриц тест с учетом априорной информации имеет некоторое отставание в мощности(Рис.13-15).
2.2 Эксперименты множественной проверки гипотез. Использование процедур Бонферрони и Холма
На данном этапе проводились эксперименты в предположении, что среди N акций есть K известных и U неизвестных акций (N=K+U). В этом случае задача становится задачей множественной проверки гипотез и в этом случае, как обсуждалось в главе Х, имеется групповая вероятность ошибки первого рода. Поэтому, помимо использования тестов с учетом априорной информации и без в экспериментах будут рассмотрены использование этих тестов вместе с процедурами Бонферрони и Холма.
Эксперименты проверки ошибок первого рода и мощности осуществлялись по тому же принципу - метод Монте-Карло. Уровень значимости брался равный 0.05, количество повторений - 1000, в качестве ковариационной матрицы бралась ковариационная матрица для первых 30 акций индекса NASDAQ100.
Ошибка первого рода
Для проверки ошибки первого рода проводилось несколько экспериментов: подсчет доли отвергнутых гипотез при изменении размера выборки n, при изменении количества неизвестных акций(U) и при изменении количества известных акций(K).
Из графиков видно, что наименьшее количество ошибочно отвергнутых гипотез было у процедур Бонферрони и Холма с учетом априорной информации, это значение было очень близко к нулю даже при маленьких размерах выборки. Стоит также отметить, что приразмере выборки меньшего 100 обычному тесту без учета априорной информации не удается контролировать уровень значимости (Рисунок 16), в то время как обычный тест с учетом информации имел близкую к нулю долю ошибок первого рода.
Мощность
Для проверки мощности брался вектор математического ожидания, состоящий из K нулей для известных акций и U не нулевых значений для неизвестных акций. На данном этапе проводились следующие эксперименты: подсчет (количество верно отвергнутых акций) мощности при изменении значения математического ожидания неизвестных акций на диапазоне [-1,1]; подсчет мощности при малых значениях математического ожидания [0.001,0.01]; подсчет мощности при изменении количества неизвестных акций; подсчет мощности при изменении количества известных акций; подсчет мощности при изменении размера выборки.
Таким образом, можно сделать следующие выводы:
· наибольшую мощность имеет тест без учета априорной информации;
· все тесты на интервале от 0.1 до 1 имеют максимальную мощность;
· тесты никак не реагируют на увеличение количества известных акций;
· на увеличение количества неизвестных акций реагируют тесты с использованием процедур Бонферрони и Холма, их мощность с увеличением числа акций уменьшается;
· уже при размере выборки n = 250 и более мощность всех тестов близка к максимальному значению - 1 даже при низких значениях альтернативы - 0.005.
Вывод по всем экспериментам на сгенерированных данных: Для проверки гипотезы о том, что все акции на рынке равны 0, в том случае, когда нет никакой информации о доходностях акций, целесообразней использовать тест без учета априорной информации с использованием процедуры Холма, так как доля ошибок первого рода с его использованием близка к нулю, а мощность несильно уступает обычному тесту без учета априорной информации и при размере выборки больше 250 имеют одинаковую высокую мощность (Рисунок 23).В том случае, когда на рынке имеется информация о доходностях некоторых акций, целесообразней всего использовать тест с учетом априорной информации без каких-либо дополнительных процедур, так как доля ошибок первого рода уже при малых размерах выборки близка к нулю, что совпадает с результатами процедур Бонферрони и Холма, а мощности с их использованием сильно уступают другим тестам.
2.3 Анализ Российского и Американского рынков
В этой главе приведены результаты анализа двух рынков - Российского (Московская Биржа [8]) и Американского (NASDAQ [9]) за период 01.01.2019-31.12.2019-всего 251 торговых дней. Данные о ценах акций были получены с сайта YahooFinance. Анализ производился по акциям основных индексов -RTSIndex,NASDAQ-100 - а также осуществлялся отраслевой анализ. Заданный уровень значимости б = 0.05.
Основные индексы стран
В этом анализе было рассмотрено 2 случая: осуществление проверки гипотез, в предположении о том, что акции между собой независимы; осуществление проверки гипотезы, в предположении, что акции на рынке зависимы и имеется априорная информация о некоторых акциях. В первом случае использовался тест без учета априорной информации совместно с процедурой Холма. Результаты для индексов обоих рынков приведены в Приложении А. Во втором случае использовался тест с учетом априорной информации, а также осуществлялся предварительный анализ поведения акций за 10 лет. За каждый год осуществлялась проверка гипотезы о равенстве нулю, в том случае, когда для анализируемой акции гипотеза не отвергалась за все 10 лет, предполагалось, что ее математическое ожидание действительно равно 0 и она добавлялась в список «известных» акций. Таким образом, для RSTIndexбыло выбрано 26 известных акций из 41 акции и для NASDAQ100 - 40 из 89. Для оставшихся «неизвестных» акций осуществлялась проверка гипотез за период 01.01.2019 - 31.12.2019. Результаты представлены в Приложении Б.
Вывод: Из таблиц (ПриложенияА, Б) видно, что гипотеза о математическом ожидании не отвергается для всех акций как при проверке с априорной информацией, так и без, что подтверждает основное предположение - реальные данные не противоречат гипотезе о том, что средняядоходность акций фондовых рынков различных стран равна нулю.
Отрасли стран
В данном анализе рассматривались сектор энергетических и минеральных ресурсов, транспортный сектор, финансовый сектор Российского рынка и сектор информационных технологий, сектор энергетических и минеральных ресурсов, сектор здравоохранения Американского рынка. Для проверки гипотез использовался тест без учета априорной информации с использованием процедуры Холма. Результаты анализа представлены в таблицах Приложения В.
Вывод: При анализе всех перечисленных секторов для Российского и Американского рынков за период 01.01.2019 - 31.12.2019 при заданном уровне значимости б = 0.05 гипотеза о математическом ожидании равном 0 не отвергается ни для одной акции. Таким образом, можно сделать вывод, что результаты секторного анализа не имеют достаточных оснований отвергнутьосновное предположение о нулевом значении средней доходности акций.
Заключение
Научное исследование, описанное в данной выпускной квалифицированной работе, является статистическим исследованием в области фондовых рынков. Целью данной дипломной работы являетсяпостроение статистических процедур множественной проверки гипотез о равенстве нулю средней доходности.Основной гипотезойявлялось предположение, что средняя доходность акций различных стран равна нулю.
Для проверки этой гипотезы было сделано следующее:
1. Формулировка основного предположения в терминах математической статистики многомерного нормального распределения.
2. Построение оптимальных одношаговых статистических процедур без учета и с учетом априорной информации, одношаговой статистической процедуры Бонферрони и многошаговой статистической процедуры Холма множественной проверки гипотез.
3. Проведение первичных экспериментов на искусственно сгенерированных данных для оценки ошибок первого рода и мощности, для различных ковариационных матриц, разного размера выборки и разного количества акций.
4. Проведение сравнительного анализа результатов тестирования всех тестов и выявление основных характеристик тестов.
5. Проведение экспериментов на реальных данных двух фондовых рынков, при анализе которых были применены изученные, в процессе работы, методы статистического исследования.
Основные результаты исследования:В ходе индексного и отраслевого анализов двух фондовых рынков - Российского и Американского - за период 01.01.2019 - 31.12.2019 основное предположение о равенстве нулю средней доходности всех акций при заданном уровне значимости б = 0.05 не имеет достаточных оснований быть отвергнутой.
Список литературы
1. Koldanov P., Bautin G. A., Multiple decision problem for stock selection in market network, Learning and Intelligent Optimization (Pardalos P.M., Resende M., Vogiatzis C., Walteros J. Editors), Lecture Notes in Computer Science, Springer, vol. 8426 (2014), P. 98-110.
2. Lehmann E.L.: A theory of some multiple decision procedures 1. Annals of Mathematical Statistics, vol. 28(1957), P. 1-25.
3. Lehmann E.L., Romano J.P.: Testing statistical hypotheses. Springer, New York, (2005).
4. Wald A.: Statistical Decision Function. John Wiley and Sons, New York (1950).
5. Андерсон Т., Введение в многомерный статистический анализ, (1963).
6. Ивченко Г.И., Медведев Ю.И. Введение в математическую статистику, (2009).
7. Леман Э., Проверка статистических гипотез, (1979).
8. Сайт московской фондовой биржи [Электронный ресурс]. - Режим доступа : https://www.moex.com/, свободный.
9. Сайт внебиржевого фондового рынка NASDAQ [Электронный ресурс]. - Режим доступа : http://www.nasdaq.com, свободный.
Приложение А
Таблица 1. RTCIndex
Holm |
Number |
||
0 |
не отвергается |
AFKS.ME |
|
1 |
не отвергается |
SNGS.ME |
|
2 |
не отвергается |
SBERP.ME |
|
3 |
не отвергается |
GMKN.ME |
|
4 |
не отвергается |
GAZP.ME |
|
5 |
не отвергается |
MTSS.ME |
|
6 |
не отвергается |
TATNP.ME |
|
7 |
не отвергается |
SBER.ME |
|
8 |
не отвергается |
MOEX.ME |
|
9 |
не отвергается |
LSRG.ME |
|
10 |
не отвергается |
FEES.ME |
|
11 |
не отвергается |
VTBR.ME |
|
12 |
не отвергается |
PLZL.ME |
|
13 |
не отвергается |
POLY.ME |
|
14 |
не отвергается |
YNDX.ME |
|
15 |
не отвергается |
LKOH.ME |
|
16 |
не отвергается |
CBOM.ME |
|
17 |
не отвергается |
MVID.ME |
|
18 |
не отвергается |
IRAO.ME |
|
19 |
не отвергается |
ALRS.ME |
|
20 |
не отвергается |
DSKY.ME |
|
21 |
не отвергается |
HYDR.ME |
|
22 |
не отвергается |
LNTA.ME |
|
23 |
не отвергается |
NVTK.ME |
|
24 |
не отвергается |
FIVE.ME |
|
25 |
не отвергается |
SFIN.ME |
|
26 |
не отвергается |
RTKM.ME |
|
27 |
не отвергается |
UPRO.ME |
|
28 |
не отвергается |
NLMK.ME |
|
29 |
не отвергается |
PHOR.ME |
|
30 |
не отвергается |
PIKK.ME |
|
31 |
не отвергается |
ROSN.ME |
|
32 |
не отвергается |
MGNT.ME |
|
33 |
не отвергается |
TRNFP.ME |
|
34 |
не отвергается |
TATN.ME |
|
35 |
не отвергается |
SNGSP.ME |
|
36 |
не отвергается |
MAGN.ME |
|
37 |
не отвергается |
AFLT.ME |
|
38 |
не отвергается |
RNFT.ME |
|
39 |
не отвергается |
RUAL.ME |
|
40 |
не отвергается |
CHMF.ME |
Таблица 2. NASDAQ100
Holm |
Number |
||
0 |
не отвергается |
CHTR |
|
1 |
не отвергается |
AAPL |
|
2 |
не отвергается |
COST |
|
3 |
не отвергается |
MSFT |
|
4 |
не отвергается |
LRCX |
|
5 |
не отвергается |
MDLZ |
|
6 |
не отвергается |
FISV |
|
7 |
не отвергается |
VRSK |
|
8 |
не отвергается |
SBAC |
|
9 |
не отвергается |
SRCL |
|
10 |
не отвергается |
AMAT |
|
11 |
не отвергается |
SWKS |
|
12 |
не отвергается |
CERN |
|
13 |
не отвергается |
ROST |
|
14 |
не отвергается |
PAYX |
|
15 |
не отвергается |
NXPI |
|
16 |
не отвергается |
FB |
|
17 |
не отвергается |
SBUX |
|
18 |
не отвергается |
ADBE |
|
19 |
не отвергается |
AKAM |
|
20 |
не отвергается |
CMCSA |
|
21 |
не отвергается |
MAR |
|
22 |
не отвергается |
PCAR |
|
23 |
не отвергается |
ADP |
|
24 |
не отвергается |
STX |
|
25 |
не отвергается |
NVDA |
|
26 |
не отвергается |
JD |
|
27 |
не отвергается |
TRIP |
|
28 |
не отвергается |
NCLH |
|
29 |
не отвергается |
ADSK |
|
30 |
не отвергается |
INTU |
|
31 |
не отвергается |
FAST |
|
32 |
не отвергается |
MU |
|
33 |
не отвергается |
QCOM |
|
34 |
не отвергается |
ORLY |
|
35 |
не отвергается |
ADI |
|
36 |
не отвергается |
TXN |
|
37 |
не отвергается |
WDC |
|
38 |
не отвергается |
GOOG |
|
39 |
не отвергается |
EBAY |
|
40 |
не отвергается |
GOOGL |
|
41 |
не отвергается |
DISH |
|
42 |
не отвергается |
INCY |
|
43 |
не отвергается |
SIRI |
|
44 |
не отвергается |
AMGN |
|
45 |
не отвергается |
TMUS |
|
46 |
не отвергается |
DISCK |
|
47 |
не отвергается |
PYPL |
|
48 |
не отвергается |
MNST |
|
49 |
не отвергается |
DISCA |
|
50 |
не отвергается |
AMZN |
|
51 |
не отвергается |
INTC |
|
52 |
не отвергается |
EA |
|
53 |
не отвергается |
ISRG |
|
54 |
не отвергается |
BBBY |
|
55 |
не отвергается |
KHC |
|
56 |
не отвергается |
MXIM |
|
57 |
не отвергается |
AVGO |
|
58 |
не отвергается |
MYL |
|
59 |
не отвергается |
CSX |
|
60 |
не отвергается |
ATVI |
|
61 |
не отвергается |
BIDU |
|
62 |
не отвергается |
TCOM |
|
63 |
не отвергается |
MAT |
|
64 |
не отвергается |
ENDP |
|
65 |
не отвергается |
NFLX |
|
66 |
не отвергается |
WBA |
|
67 |
не отвергается |
CTXS |
|
68 |
не отвергается |
TSCO |
|
69 |
не отвергается |
TSLA |
|
70 |
не отвергается |
CHKP |
|
71 |
не отвергается |
CSCO |
|
72 |
не отвергается |
AAL |
|
73 |
не отвергается |
XLNX |
|
74 |
не отвергается |
HSIC |
|
75 |
не отвергается |
ILMN |
|
76 |
не отвергается |
ALXN |
|
77 |
не отвергается |
LBTYA |
|
78 |
не отвергается |
GILD |
|
79 |
не отвергается |
LBTYK |
|
80 |
не отвергается |
CTSH |
|
81 |
не отвергается |
DLTR |
|
82 |
не отвергается |
EXPE |
|
83 |
не отвергается |
NTAP |
|
84 |
не отвергается |
ULTA |
|
85 |
не отвергается |
BIIB |
|
86 |
не отвергается |
BMRN |
|
87 |
не отвергается |
VOD |
|
88 |
не отвергается |
REGN |
Приложение Б
Таблица 1.RTC Index
Test |
Ticker |
||
0 |
Не отвергается |
SBER.ME |
|
1 |
Не отвергается |
SBERP.ME |
|
2 |
Не отвергается |
MGNT.ME |
|
3 |
Не отвергается |
ALRS.ME |
|
4 |
Не отвергается |
PLZL.ME |
|
5 |
Не отвергается |
IRAO.ME |
|
6 |
Не отвергается |
VTBR.ME |
|
7 |
Не отвергается |
MAGN.ME |
|
8 |
Не отвергается |
AFLT.ME |
|
9 |
Не отвергается |
PIKK.ME |
|
10 |
Не отвергается |
FEES.ME |
|
11 |
Не отвергается |
AFKS.ME |
|
12 |
Не отвергается |
LSRG.ME |
|
13 |
Не отвергается |
SFIN.ME |
|
14 |
Не отвергается |
MVID.ME |
Таблица 2. NASDAQ100
Test |
Ticker |
||
0 |
Не отвергается |
ATVI |
|
1 |
Не отвергается |
ADBE |
|
2 |
Не отвергается |
ALXN |
|
3 |
Не отвергается |
GOOGL |
|
4 |
Не отвергается |
GOOG |
|
5 |
Не отвергается |
AMZN |
|
6 |
Не отвергается |
AAL |
|
7 |
Не отвергается |
AAPL |
|
8 |
Не отвергается |
ADP |
|
9 |
Не отвергается |
BIIB |
|
10 |
Не отвергается |
AVGO |
|
11 |
Не отвергается |
CHTR |
|
12 |
Не отвергается |
CMCSA |
|
13 |
Не отвергается |
COST |
|
14 |
Не отвергается |
DLTR |
|
15 |
Не отвергается |
EA |
|
16 |
Не отвергается |
ENDP |
|
17 |
Не отвергается |
FB |
|
18 |
Не отвергается |
FISV |
|
19 |
Не отвергается <... |
Подобные документы
Математические модели характеристик компьютеров возможных нарушителей и угроз безопасности информации в условиях априорной неопределённости. Методика построения комплексной системы защиты информационной сети военного ВУЗа от несанкционированного доступа.
контрольная работа [401,8 K], добавлен 03.12.2012Автоматизированная обработка экономической информации. Методы и средства технологического контроля обработки экономической информации. АИС в области бухгалтерского учета с использованием 1: С Бухгалтерия. Программное обеспечение бухгалтерского учета.
контрольная работа [39,4 K], добавлен 07.12.2010Принципы реализации программы проверки статистических гипотез с использованием t-критерия Стьюдента, ее общий алгоритм. Особенности применения двухвыборочного критерия для независимых выборок. Функциональные модели решения задачи для различных функций.
курсовая работа [644,2 K], добавлен 25.01.2010Система автоматизации бухгалтерского учета. Состав и характеристика нормативно-справочной информации. Этапы и средства бухучета в 1С. Виды Классификаторов информации. Перечень основных справочников, используемых в автоматизированной системе учета.
контрольная работа [26,4 K], добавлен 27.07.2009Проблемы защиты информации человеком и обществом. Использование информации. Организация информации. Угроза информации. Вирусы, характеристика и классификация. Проблемы защиты информации в Интернете. Анализ и характеристики способов защиты информации.
реферат [36,5 K], добавлен 17.06.2008Понятие и методы поиска информации, способы ее хранения и особенности процесса передачи от источника к получателю. Предназначение канала связи и кодирующего устройства. Правила обработки информации, ее использование при принятии решений и меры по защите.
презентация [59,8 K], добавлен 14.10.2013Основные положения теории защиты информации. Сущность основных методов и средств защиты информации в сетях. Общая характеристика деятельности и корпоративной сети предприятия "Вестел", анализ его методик защиты информации в телекоммуникационных сетях.
дипломная работа [1,1 M], добавлен 30.08.2010Обоснование проектных решений по программному обеспечению. Теория складского учёта. Характеристика входной информации. Основные показатели эффективности программных продуктов. Реализация базы данных. Защита информации в автоматизированной системе.
дипломная работа [4,6 M], добавлен 19.09.2014Современные физические и законодательные методы защиты информации. Внедрение системы безопасности. Управление доступом. Основные направления использования криптографических методов. Использование шифрования, кодирования и иного преобразования информации.
реферат [17,4 K], добавлен 16.05.2015Программная реализация средства "Автоматизация учета транспортных средств ГАИ" для упрощения работы инспектора ГАИ: отслеживания информации об автомобилях, регистрации, информации о марке, технических характеристиках, владельцах и страховках автомобилей.
курсовая работа [1,3 M], добавлен 12.02.2016Формы как носители информации. Реляционные базы данных. Разработка автоматизированной системы по ведению учета операций на предприятии ТОО "Фирма Радар". Задачи, выполняемые приложением. Цели, задачи, функции внутрифирменной системы обработки информации.
дипломная работа [1,7 M], добавлен 03.07.2015Теория информации как наука, предмет и методы ее изучения, применение в компьютерной технике. Системы передачи информации, разновидности сообщений и их источники. Разновидности помехи и способы их устранения. Аппаратура, используемая при передаче данных.
реферат [23,7 K], добавлен 14.07.2009Организационно-административное обеспечение информационной безопасности. Процедура санкционирования в отношении средств информации. Классификация ресурсов и контроль за ними. Неформальные методы поиска оптимальных решений. Управление защитой информации.
учебное пособие [969,6 K], добавлен 18.01.2011Основы теории передачи информации. Экспериментальное изучение количественных аспектов информации. Количество информации по Хартли и К. Шеннону. Частотные характеристики текстовых сообщений. Количество информации как мера снятой неопределенности.
лабораторная работа [42,3 K], добавлен 15.02.2011Автоматизация учета закупки и реализации продукции. Сущность задач учета операций товародвижения. Характеристика входной, постоянной, промежуточной и результатной информации. Структура программных средств. Руководство программиста и пользователя.
курсовая работа [2,4 M], добавлен 23.12.2013Понятие и сущность стеганографии, использование свойств формата файла-контейнера. Классификация методов стеганографии. Компьютерные вирусы и стеганография, гарантированное уничтожение информации. Методы воздействия на средства защиты информации.
контрольная работа [80,2 K], добавлен 02.01.2018Роль моделирования общественно-исторических процессов. Распределенный банк данных системы сбора информации. Концептуальная схема модели системы. Критерии оценки эффективности процесса функционирования СМО. Выдвижение гипотез и принятие предположений.
дипломная работа [140,1 K], добавлен 30.07.2009Примеры построения тестов и технологии исследования алгоритмов на их основе. Построение тестов на основе метода покрытия решений и проведение исследования соответствующего исходного алгоритма и алгоритма с ошибками в операторах проверки условий.
контрольная работа [224,8 K], добавлен 24.05.2016Функции, место и виды контроля в обучении. Тест как инструмент измерения качества знаний, формы тестов. Балльно-рейтинговая система оценивания студентов. Разработка компьютерных тестов по математике на базе Конструктора Distance Learning Studio.
дипломная работа [2,2 M], добавлен 05.09.2011Актуальность (своевременность) информации. Информационные ресурсы и информационные технологии. Подходы к определению количества информации. Свойства информации, ее качественные признаки. Роль информатики в развитии общества. Бит в теории информации.
презентация [200,9 K], добавлен 06.11.2011