Моделювання динаміки фондових індексів
Вивчення закономірностей динаміки світових фондових індексів та побудова адекватної авторегресійної математичної моделі для даних індексів. Оцінка параметрів та тестування помилок моделі AR(1) для DAX та розподіл частот помилок регресії для DAX.
Рубрика | Экономико-математическое моделирование |
Вид | дипломная работа |
Язык | украинский |
Дата добавления | 18.01.2020 |
Размер файла | 7,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Змішана модель авторегресії, ковзного середнього, АRMA(р, q). Модель у загальному випадку має вигляд (фор. 2.24):
, (2.24)
де - вагові коефіцієнти, що представляють компоненти процесів авторегресійного AR(p) і ковзного середнього MA(q) відповідно. Її можна представити також у вигляді (фор. 2.25):
, (2.25)
де , - оператор зрушення назад ,, , .
Стаціонарність процесу визначається його AR-частиною, тобто умови стаціонарності такі ж, як у процесу AR. За таким же принципом діють умови оберненості, тобто можливість виразити через , повністю визначаються умовою оберненості MA-частини. Якщо MA-частина обернена, то і весь процес обернений. Коефіцієнти моделі знаходять з рівнянь (фор. 2.26):
, (2.26)
де ,
Якщо процес відноситься до типу АRMA (р,q), то починаючи з деякого номера, і автокореляційна і частинна автокореляційна функції, у випадку стаціонарності ряду, поводяться як сума затухаючих компонент.
Для перевірки адекватності моделі АRMA статистика Дарбіна-Уотсона теоретично не застосовна. В даний час найбільш поширеними критеріями якості моделі є критерій ( Akaike information criterion), запропонований Акіке [68] в 1974 році, і критерій (Bayesian information criterion), запропонований Шварцем [90] у 1978 році. Інформаційний критерій для моделі АRMA обчислюється за формулою 2.27:
, (2.27)
де - число спостережень, - залишкова сума квадратів , - початковий часовий ряд, - ряд, отриманий з використанням моделі АRMA.
Критерій Шварца має дещо інший вигляд (фор. 2.28):
(2.28)
Параметри моделі потрібно підібрати так, щоб значення кожного з критеріїв були мінімальні, тобто близькими до нуля. Критерій Шварца заснований на байесівському підході і має фундаментальніше теоретичне обґрунтування. Доведено, що оцінка порядку моделі, яка отримана за цим критерієм, є спроможною. Проте, на практиці частіше використовують інформаційний критерій .
Для перевірки наявності авторегресії в моделях АRMA краще всього скористатися універсальним способом - методом множників Лагранжа - LM (Lagrange multiplier) [21]. Нехай розглядається модель множинної регресії (фор. 2.29):
, (2.29)
де - різні регресори, зокрема, в тому числі, і лагові значення як незалежних, так і залежних змінних. Перевіримо гіпотезу про те, що підкоряється авторегресійній схемі порядку , тобто задається рівнянням (фор. 2.30):
, (2.30)
де - білий шум.
Перевіряється гіпотеза при альтернативі .
Метод множників Лагранжа полягає в наступному:
Методом найменших квадратів (МНК) будується регресія або з'ясовної змінної або залишків на старті регресори і залишки з лагом включно, тобто як додаткові пояснюючі змінні використовуємо .
Перевіряється гіпотеза про те, що група додаткових змінних є зайвою. Якщо як пояснюючі змінні використовують залишки, то статистика , де - число спостережень, а - коефіцієнт множинної детермінації регресії, має асимптотичний ( при збільшенні числа спостережень ) розподіл з ступенями свободи. Якщо значення статистики , де - квантиль розподілу з ступенями свободи рівна , то приймається гіпотеза , тобто не підкоряється авторегресійній схемі порядку .
Використання ARMA-моделі часто дозволяє простіше представити часові залежності в умовному математичному сподіванні в порівнянні з AR-моделлю. Проте, велика невідповідність експериментальним даним та достатньо трудомісткий процес підбору параметрів, звертають увагу дослідників до інших моделей.
Слід зазначити, що кожна з наведених моделей і відповідні їм методи мають як переваги, так і недоліки. Наприклад, використання моделей експоненціального згладжування обумовлене їх простотою і прозорістю, в той же час накладені на кожну з моделей вимоги обмежують їх широке застосування. Регресійні моделі теж характеризуються простотою і гнучкістю [25], проте і нелінійна, і лінійна регресійні моделі мають свої недоліки. Лінійна регресійна модель не використовується для моделювання нелінійних процесів, а як відомо більшість часових рядів, для яких виникає задача прогнозування і аналізу, характеризуються нелінійністю і нестійкістю відносно середнього рівня. У той же час, складність ідентифікації функціональних залежностей та розрахунку параметрів нелінійних регресійних моделей в багатьох випадках обмежує їх застосування [85].
Залежно від задачі прогнозування, точність моделі може мати кілька аспектів, зокрема похибка прогнозування безпосередньо значень часових рядів на визначений горизонт, похибка прогнозування знаків приростів. Крім того, у випадку прогнозування фінансових показників, точність може розглядатися і через призму подальшого прийняття рішень. В цьому випадку модель або метод, що їй відповідає, буде характеризуватися з точки зору досягнутої економічної ефективності. Саме тому, ефективні моделі або методи прогнозування повинні володіти здатністю ідентифікувати ключові характеристики часових рядів і використовувати їх для досягнення поставлених цілей. Вказані класичні моделі цієї здатності не мають.
2.3 Моделювання нестаціонарними процесами
Посилення ролі ризику вимагало розвитку нових економетричних методів для часових рядів, які враховували б при моделюванні зміну дисперсій і коваріацій в часі. Цьому розвитку допоміг клас моделей з умовною авторегресійною гетероскедастичністю (Auto regressiv Conditional Heteroskedasticity), скорочено ARCH, введений Ф.Енглом (F.Engle (1982)) [16]. Ключовий момент, запропонований моделями типу ARCH, полягає у відмінності умовних і безумовних моментів другого порядку. Тоді як безумовна матриця коваріацій для тих змінних, що представляють інтерес, може бути незмінною в часі, умовні дисперсії і коваріації часто залежать нетривіальним чином від станів об'єкту, що вивчається, в минулому. Процес типу ARCH p-го порядку описується авторегресійною моделлю, в якій умовна дисперсія помилки залежить від квадрата помилки попередніх спостережень. Процес типу GARCH(p,q) є альтернативною модифікацією моделі ARCH, в якій умовна дисперсія помилки залежить як від квадратів помилок попередніх спостережень, так і від дисперсій цих помилок.
Перші емпіричні застосування моделей класу ARCH відносилися до моделювання інфляційної невизначеності, але надалі широке використання ця методологія набула у виявленні часових залежностей в прибутковостях активів. ARCH є сімейством нелінійних стохастичних процесів, в протилежність лінійно-залежним процесам AR і МА. Частотний розподіл має високий пік і товсті хвости. Емпіричні дослідження показали, що фінансові часові ряди проявляють статистично суттєву ARCH. В літературі запропонована безліч різних параметричних специфікацій для умовної дисперсії, що змінюється в часі [75, 92, 95]. Розглянемо дві основні моделі [17]: ARCH(p) і GARCH(p, q). Припустимо, що існує часовий ряд, у якого видалені трендова і сезонна компоненти. Позначимо через процес, який складається із залишків регресії або процесу авторегресії. Такий ряд можна представити у вигляді: , де- послідовність незалежних, нормально розподілених випадкових величин з нульовим середнім і одиничною дисперсією. Параметр можна розглядати як локальне умовне стандартне відхилення процесу. Нехай, , де і вибрані таким чином, що для всіх . Така модель отримала назву ARCH(1) - процес. Очевидно, що модель може бути записана як деякий AR(1) - процес. Введемо змінну, , тоді, . Автокореляційна функція має вигляд . Слід зазначити, що, це характерно для всіх ARCH моделей. Коефіцієнти знаходять методом максимальної правдоподібності. Прогнози за моделлю ARCH(1) розраховуються за формулою 2.31:
(2.31)
У загальному вигляді, ARCH(p) - процес залежить від p квадратів минулих лагових змінних (фор. 2.32)
. (2.32)
Щоб ця модель була коректно визначеною і умовна дисперсія була додатною, параметри повинні задовольняти співвідношення (фор. 2.33):
(2.33)
з імовірністю, близькою до одиниці.
Якщо ввести позначення , то модель ARCH(p) можна переписати у вигляді (фор. 2.34):
(2.34)
Перевірка відсутності умовної гетероскедастичності в залишках моделі або для початкового процесу зводиться до перевірки гіпотези про рівність нулю коефіцієнтів моделі за -критерієм. Якщо відхиляється, то встановлюється присутність умовної гетероскедастичності і значення параметра q, що входить в рівняння (2.23).
В емпіричних застосуваннях ARCH(q) - моделей часто виникають труднощі через довгі лаги і велике число параметрів. Щоб обійти цю проблему, Боллерслев (Bollerslev (1986)) [95, 96] запропонував узагальнення ARCH - моделі. Він запропонував додати в рівняння для дисперсії залежність від попередніх значень дисперсії. Ця модель отримала назву Generalisized Auto regressiv Conditional Heteroskedasticity, скорочено GARCH(p, q). Головне рівняння моделі (фор. 2.35):
, (2.35)
де - константа.
GARCH також створює частотний розподіл з високим піком і товстими хвостами. Для того, щоб умовна дисперсія в моделі GARCH(p, q) була визначена, всі коефіцієнти у відповідній лінійній ARCH-моделі нескінченного порядку повинні бути додатними. Це обмеження на додатність виконується тоді і тільки тоді, коли поліноми, які входять в модель, не мають однакових коренів, і корені рівняння лежать за межами одиничного круга, а всі коефіцієнти в представленні нескінченним степеневим рядом невід'ємні. Для збереження стаціонарності повинні виконуватись такі обмеження: . В простій GARCH(1,1)-моделі для додатності потрібно, щоб майже напевно виконувалися нерівності і . Модель GARCH(p, q), яка представлена рівнянням (фор. 2.35), є гнучкішою з погляду параметризації умовної дисперсії в порівнянні з ARCH(q)-моделлю.
Перетворивши GARCH(p, q)-модель, представлену в формулі 2.35, отримаємо (фор. 2.36):
(2.36)
Рівняння (фор. 2.36) задає ARMA[max(p, q), p] - модель для . Ця модель стаціонарна в широкому сенсі, тоді і тільки тоді, коли всі корені рівняння лежать за межами одиничного круга. У багатьох застосуваннях з «високочастотними» фінансовими даними виявляється, що оцінка величини дуже близька до одиниці.
Більшість стаціонарних часових рядів, що зустрічаються на практиці, можна з достатнім ступенем точності апроксимувати однією з чотирьох основних моделей (табл. 2.1), які можна ідентифікувати за видом автокореляційної функції (АКФ) і частинної автокореляційній функції (ЧАКФ). Список моделей, заснований на теорії, викладений в [13].
Таблиця 2.1 Основні автокореляційні моделі
№ |
Характеристика АКФ |
Характеристика ЧАКФ |
Значення |
Значення |
|
1 |
2 |
3 |
4 |
5 |
|
1 |
АКФ має форму синусоїди або експоненційно спадає |
ЧАКФ має значення,що різко виділяються на лагах 1, 2,немає кореляцій на інших лагах. |
2 |
- |
|
2 |
АКФ має значення, що різко виділяється, на лагу 1, немає кореляцій на інших лагах |
ЧАКФ експоненційно спадає |
- |
1 |
|
3 |
АКФ має значення, що різко виділяються, на лагах 1, 2, немає кореляцій на інших лагах |
ЧАКФ має форму синусоїди або експоненційно спадає |
- |
2 |
|
4 |
АКАКФ експоненційно з спадає з лага 1 |
ЧАКФ - експоненційно спадає з лага 1 |
1 |
1 |
Розглянемо ряд виду . Детермінована частина цього ряду, тобто тренд, є параболічною функцією часу. Очевидно, що цей ряд нестаціонарний. Математичне сподівання цього процесу залежить від часу.
Візьмемо першу різницю:
Степінь полінома, що описує тренд, знизилася на одиницю. Якщо обчислити другу різницю , то отримаємо стаціонарний процес. Правда, рівняння тепер містить ковзне середнє. Таким чином, отриманий двократним взяттям різниць стаціонарний процес є з процесом МА(2) Бокс і Дженкінс запропонували виділити клас нестаціонарних рядів, які обчисленням послідовних різниць можна звести до стаціонарного вигляду, а саме ARMA [21].
Якщо ряд після обчислення послідовних різниць зводиться до стаціонарного, то такий ряд називають ARIMA(p,d,q) (авторегресійні проінтегровані ковзні середні - Autoregressive Integrated Moving Average) порядку (p,d,q), які моделюють різні ситуації, що зустрічаються при аналізі стаціонарних і нестаціонарних рядів. Скорочення I ( від англійського - Integrated) означає інтегрований. При цьому p параметр AR - частини, d - степінь інтеграції, q - параметр MA-частини.
Залежно від аналізованого ряду модель ARIMA (p,d,q) може трансформуватися до авторегресійної моделі AR(p), моделі ковзного середнього MA(q) або змішаної моделі ARMA(p,q). При переході від нестаціонарного ряду до стаціонарного ряду виникає параметр d, який визначає порядок різниці. Цей параметр має тільки цілочисельні значення. Зазвичай обмежуються вибором між d = 0 і d = 1.
Підхід Бокса-Дженкінса до аналізу тимчасових рядів є вельми могутнім інструментом для побудови точних прогнозів з малою дальністю прогнозування. Моделі ARIMA достатньо гнучкі і можуть описувати широкий спектр характеристик часових рядів, які зустрічаються на практиці. Але ARIMA має і декілька недоліків:
необхідна відносно велика кількість початкових даних;
не існує простого способу коректування параметрів моделей ARIMA. Коли притягуються нові дані, модель доводиться майже повністю перебудовувати, а іноді потрібен вибір абсолютно нової моделі;
для оцінок використовується та або інша модель, а це означає наявність модельного ризику в розрахунках. Тому необхідна періодична перевірка адекватності вживаної моделі;
при різкій зміні умов на ринку прогнози будуть некоректні.
Вищеназвані чинники призводять до того, що дані моделі добре працюють у разі стабільного стану ринків і перестають адекватно відображати поведінку цін, коли на ринках відбуваються істотні зміни. Загальний недолік прогнозування за допомогою авторегресійних моделей полягає в тому, що всі вони незалежно від вживаних методів обчислення використовують історичні дані. І якщо умови на ринку різко міняються, то ці зміни будуть враховані тільки через певний проміжок часу. А до цього моменту прогнози будуть некоректні.
Проте з поля зору дослідників випадала ситуація, коли параметр d може набувати дробові значення. Для вирішення цієї проблеми в роботах зарубіжних учених був запропонований новий клас моделей ARFIMA(p,d,q) (F: fractional-дробовий), що допускає можливість нецілого параметра d і що отримав назву авторегресійний дробово-інтегрований процес ковзного середнього. Такі ряди володіють своєю специфікою: самоподібністю, дробовою розмірністю, поволі спадаючою кореляцією. Прогнозування часових рядів за допомогою моделі ARFIMA(p, d, q) відкриває ширші перспективи для підвищення точності прогнозу. Останнім часом значний інтерес виявився до часових рядів, які можна охарактеризувати терміном «часові ряди з довготривалою кореляційною залежністю (time series with long memory)» або з «довготривалої пам'яттю». Існує декілька можливих означень таких рядів, але в основному вони повинні володіти поволі спадаючою автокореляційною функцією і мати необмежену спектральну щільність на низьких частотах. Для опису рядів з довготривалою кореляційною залежністю можна скористатися останньою моделлю, але на відміну від моделі ARIMA тут показник d приймає дробові значення. Розгляд значень d з інтервалу d привів до дробової авторегресійної моделі ковзного середнього порядків p, d, q, абревіатура якої визначається як ARFIMA(p, d, q). При цьому можна зобразити у вигляді (фор. 2.37):
(2.37)
де - поліноми моделі (фор. 2.28), де припускається, що всі корені рівнянь за модулем більші одиниці (фор. 2.38 - 2.39):
, (2.38)
(2.39)
- гаусовий білий шум ,
- гамма-функція, яка визначається формулою 2.40
(2.40)
Автокореляційні коефіцієнти процесу мають той же знак, що і . Повільний спад автокореляцій пояснюється тим, що при додатному сума останніх збігається до нескінченності, а при від'ємному - до нуля. В роботі [23] показано, що для процес є стаціонарним і оберненим, а автокореляції спадають з гіперболічною швидкістю.
В окремому випадку, при p,q = 0, , процес має вигляд (фор. 2.41):
=, (2.41)
де .
Формула 2.41 є зображенням Вольда для , при цьому автокореляційна функція і спектральна щільність дорівнюють відповідно (фор. 2.42):
, (2.42)
Природно, встає проблема виявлення «довгої пам'яті», тобто перевірки статистичної гіпотези про довгострокову (long-range) залежність. Для виявлення long-range залежності Б. Мандельброт запропонував використовувати R/S статистику (rescaled range), розроблену Х. Херстом (1951).
Переваги і недоліки моделей, що були розглянуті стосуються лише процесу побудови моделі. Цікаво порівняння точності прогнозів моделей ARIMA з іншими моделями, яке було здійснено в ряді випробувань, що проводяться Міжнародним інститутом прогнозистів (International Institute of Forecasters).
До 1982 р. серед прогнозистів існувала думка, що моделі ARIMA дають найточніші прогнози, оскільки є більш загальними для класу інших моделей. Проте після проведення перших випробувань точності прогнозування різних моделей в рамках "М - Competition", проведеного Міжнародним інститутом прогнозистів, в ході якого моделі ARIMA показали себе не краще моделей експоненціального згладжування, ця думка змінилася на цілком логічне уявлення про те, що в кожному конкретному випадку потрібно використовувати свою модель [24].
Більше того, подальші дослідження показали, що використання моделей AR(1), AR(2) і ARMA(1,1) в обхід методології Бокса-Дженкінса (тобто без дослідження коррелограмм та оцінки залишків) в ряді випадків дає не менш точні прогнози, ніж за моделями ARIMA, побудованим на основі методології Бокса-Дженкінса [25]. Даний висновок вказує на те, що для отримання точних прогнозів за допомогою моделей ARIMA домагатися некорельованих нормально розподілених залишків не має сенсу: одне просто не залежить від іншого [25].
Дослідження в рамках наступних випробувань, опублікованих у статтях 1998-х, 2000-х і 2005-х рр. [26], показали, що статистично обґрунтовані моделі (в першу чергу малася на увазі саме ARIMA) не перевищують інші моделі по точності прогнозів.
Все це викликає питання про те, чому ж методи, що мають таке гарне наукове обґрунтування з точки зору математичної статистики, не перевищують "дикі" методи, у яких повноцінне статистичне обґрунтування з'явилося в кращому випадку на початку XXI ст.
Відповідь на це питання полягає в самому підході, лежачому в основі цих методів: вся побудова моделей ARIMA ґрунтується на припущенні про те, що часовий ряд генерується нескінченно відповідно до якоїсь функції, параметри якої нам потрібно ідентифікувати і оцінити, тобто в основі підходу ARIMA лежить припущення при застиглому характері протікають, еволюційність як така в моделі не враховується. Викликано це не в останню чергу тим, що моделі спочатку розроблялися для моделювання фізичних і технічних процесів (наприклад, один з основоположників моделей авторегресії, Дж. Юл, у своїх роботах спирався на моделювання числа плям на сонці [27]), в яких практично всі види процесів описуються або як стаціонарні, або як стаціонарні в різницях. Проблема ж застосування цих методів по економічним рядам полягає в тому, що економічні процеси, як ми вже знаємо, по суті своїй незворотні, а значить, і таке "технічне" ставлення до них не дозволяє врахувати їх особливості і, як результат, не дозволяє давати точні прогнози.
У економетрики вважається, що для отримання адекватних прогнозів потрібно домогтися різними способами незміщених, ефективних і заможних оцінок коефіцієнтів моделі, позбутися гетероскедастичності і автокореляції, отримати нормально розподілені залишки і т.д. І звичайно при прогнозуванні тенденцій у тимчасових рядах економетрика всього цього домагається за допомогою моделі ARIMA (і різних її модифікацій для окремих випадків автокореляції залишків і гетероскедастичності). Проте всі ці характеристики мають сенс тільки у випадку з технічними процесами або при роботі з просторовими даними - там, де немає еволюції. У еволюційних процесах відбуваються постійні зміни всіх характеристик розподілу, у зв'язку з чим "гонка" за кращими оцінками швидше нагадує пошуки єдинорога: ми шукаємо те, що не існує, там, де його в принципі немає.
Більше того, залежність поточного значення від попереднього в багатьох рядах має скоріше віртуальний, ніж реальний характер: дійсно, якщо в понеділок продаж взуття був на одному рівні, то і у вівторок вони будуть близькі до нього. Однак це жодною мірою не говорить про те, що кількість проданого взуття в понеділок дійсно впливає на те, скільки буде продано взуття у вівторок. По суті своїй це незалежні один від одного події, на які впливають якісь зовнішні чинники. Але формально при побудові коррелограм ми побачимо, що між цими подіями є якась кореляція. Очевидно, що вона носить помилковий характер, а значить, і моделі, що ґрунтуються на ній, будуть носити помилковий характер.
Моделі експоненціального згладжування, не маючи настільки хорошого статистичного обґрунтування, як моделі ARIMA, одночасно з цим не вводять якихось припущень про те, як процес генерується і які в ньому є залежності. Вони націлені в першу чергу не на "розтин залежностей", а на "зовнішнє" опис динаміки. Саме тому, наприклад, в М3-Competition найточніші прогнози у багатьох випадках дав один з найменш статистично обґрунтованих на той момент методів - метод Theta [28], який є окремим випадком моделі простого експоненціального згладжування з дрейфом.
Звичайно, у моделей ARIMA є свої недоліки, що лежать в самій їх основі. Однак це жодною мірою не говорить про те, що від цих моделей треба відмовитися і при прогнозуванні використовувати тільки моделі експоненціального згладжування! Для кожного конкретного випадку варто звертатися до своєї прогнозної моделі: будь то найпростіші моделі, моделі трендів, сезонної декомпозиції, моделі експоненціального згладжування або моделі авторегресії зі ковзної середньої. Просто варто мати на увазі як позитивні, так і негативні сторони використовуваних моделей і спиратися на ті прогнози, щодо яких (на основі експертної думки і фундаментального аналізу галузі) можна сказати, що вони краще опишуть реальну ситуацію в майбутньому.
Висновки до розділу 2
У другому розділі наведено аналітичний огляд найбільш значущих методів і моделей динаміки фондових індексів. Аналіз часових рядів крім визначення природи ряду передбачає прогнозування майбутніх значень по теперішнім та майбутнім значенням, що реалізується на математичних моделях. З огляду на те, що для фінансових часових рядів характерна наявність волатильності, особлива увага надана моделям умовної гетероскедастичності.
Розглянуто такі стаціонарні моделі: модель ковзного середнього (MA(q)), авторегресійна модель(AR(p)) та змішана модель авторегресії і ковзного середнього (ARMA(p, q)).
Перевагою даних моделей є простота їх опису. Однак, велика невідповідність експериментальним даним і досить трудомісткий процес підбору параметрів звертають увагу дослідників до нелінійних моделей, які враховують при моделюванні зміну дисперсії і ковариацій в часі. Такими являються розглянуті нестаціонарні моделі: ARCH(p), GARCH(p, q), ARIMA(p, d, q), ARFIMA(p, d, q).
Проблеми створення систем прогнозування в першу чергу стосуються побудови такого комплексу моделей, який би характеризувався необхідною точністю, простотою, гнучкістю в застосуванні і прозорістю в оцінці параметрів.
Застосування більшості класичних статистичних методів і моделей пов'язане з виконанням ряду жорстких вимог: стаціонарності, нормальності та незалежності залишків часових рядів.
Вказані моделі та методи за умови ефективного управління процесом прогнозування, зокрема поєднання в комплексах статистичних моделей та інтелектуальних методів, можуть бути успішно застосовані та адаптовані до цілей прогнозних інформаційних систем.
Перспекспективним напрямом в розробці інформаційних систем прогнозування на сьогодні є побудова комбінованих адаптивних моделей, які можуть включати адаптивні поліноміальні моделі різних порядків, моделі авторегресії тощо, переваги яких видобуваються з результатів кластеризації часового ряду.
Слід зазначити, що останніми роками з'являється розуміння того, що для багатьох задач інтелектуального аналізу даних необхідно застосовувати не швидкий та наближений, а повільний, але точний і ґрунтовний пошук [29], пропонується використовувати методи, які можуть бути максимально легко практично застосовані.
РОЗДІЛ 3.ЕКСПЕРИМЕНТАЛЬНЕ МОДЕЛЮВАННЯ ФОНДОВИХ ІНДЕКСІВ
3.1 Інструменти практичної реалізації моделювання динаміки фондових індексів
Будь-яке економетричне дослідження неможливо провести без використання обчислювальної (комп'ютерної) техніки. Причина цього полягає в складності економетричних розрахунків та реалізації їх алгоритмів. Множину програм статистичної обробки поділяють на професійні, спеціалізовані і популярні (напівпрофесійні).
Професійні економетричні програмні засоби мають велику кількість методів аналізу, а у популярних пакетів кількість функцій обмежена. Спеціалізовані програмні комплекси спрямовані на будь-яку вузьку область аналізу даних.
Для освоєння декількох економетричних програм необхідно чимало часу, тому вибір програмного продукту є дуже важливим завданням. Проте, майже всі такі програмні продукти схожі по інтерфейсу і набору базових функцій.
Економетричні програмні продукти - це наукомістке програмне забезпечення, тому найчастіше їх вартість недоступна індивідуальному користувачеві.
Аналіз економетричних програм показав, що в даний час найбільш часто використовуються наступні зарубіжні програмні продукти [1]:
програми, які орієнтовані на програмування (R проект і інші);
статистичні програми загального призначення, які містять широкий набір статистичних функцій і процедур (Statistica, SPSS);
програми, орієнтовані на вирішення широкого кола економетричних задач (EViews, Stata, Gretl);
електронні таблиці (Excel).
При відсутності спеціалізованих програм всі розрахунки можна проводити в MS Excel, але для цього потрібно добре знати алгоритми обчислення статистичних величин.
Позитивні риси MS Excel: широке поширення, тісна інтеграція з PowerPoint і MS Word, наявність українськомовної версії і сервісного обслуговування, велика кількість документації, має зручний інтерфейс для роботи з вибірками. MS Excel має добре відомий всім інтерфейс, являє можливості з побудови класичних лінійних регресійних моделей. Крім того, варто відзначити, що даний програмний засіб постійно оновлюється. Так, остання версія (11231.20130) була випущена 13 січня 2016 року зі оновленням пакета прикладних програм Microsoft Office 365. Однак за допомогою даного програмного засобу неможливо вирішити складні економетричні завдання.
Побудова моделей, які описують більш складну залежність результуючого показника від набору пояснюючих факторів, в MS Excel не передбачено. Реалізація складних економетричних процедур зажадає від користувача бездоганного знання всіх обчислювальних алгоритмів.
Для більш ефективної роботи в сфері економетричних досліджень можна використовувати програмні продукти: STATISTICA або SPSS.
Програмні засоби SPSS [1] і STATISTICA [2] є електронними таблицями з системою меню, які орієнтовані на роботу з часовими рядами і просторовими даними. В SPSS та STATISTICA є функція автоматичного формування звіту з результатами моделювання. На сьогоднішній день останніми версіями систем є русифікована STATISTICA 13, IBM SPSS Statistics 22.0.
SPSS та STATISTICA - це системи, які включають базовий і додаткові модулі, кожен з яких надає різний набір аналітичних статистичних або економетричних методів.
Програмний засіб SPSS призначений для проведення прикладних досліджень в соціальних науках, і, як наслідок, його відрізняє відсутність сучасних моделей і методів просунутої економетрики.
Gretl [3] - це пакет прикладних програм для економетричного моделювання, який розроблений у 2000 році спільнотою з 15 економетристів. Відмінною рисою Gretl є те, що ця програма є відкритою, вільною і безкоштовною зі стандартною громадської ліцензією GNU, при цьому за якість і точність функціонування програми відповідає користувач.
Крім англійської, gretl підтримує французьку, італійську, іспанську, німецьку, баскську, португальську, польську, турецьку, чеську, албанську, російську та традиційну китайську мови. Зазвичай не потрібно робити що-небудь особливе для того, щоб gretl з'являвся на місцевій мові: програма поставляється з повним набором перекладів, і їх слід використовувати автоматично, на основі налаштувань мови вашого комп'ютера.
На сьогоднішній день остання версія Gretl 1.6.5 була випущена 24 січня 2019 року. До переваг Gretl можна віднести наявність прикладів побудови моделей, які представлені в популярних підручниках, а також, деяких спеціалізованих періодичних виданнях і комплексів інструкцій, які полегшують оцінювання та вивчення економетричних моделей. Для просунутих користувачів є можливість роботи в режимі консолі, при цьому результати з'являються тільки в одному вікні.
Stata [4] і Eviews [5] це комерційні програмні продукти, розроблені для економістів в 1985 р і 1994 року відповідно.
Управління в даних програмах більшою мірою здійснюється за допомогою введення команд в командний рядок з клавіатури, що істотно полегшує відтворюваність моделей. Крім того, Stata і Eviews працюють у віконному або графічному оточенні. Stata і Eviews містять готові набори даних для демонстрації та вивчення їх можливостей.
На сайтах розробників представлено кілька видів ліцензій програмного забезпечення (студентська, професійна та ін.). Крім того, на сайтах кожен користувач може ознайомитися з покроковими інструкціями і відео по роботі з продуктами на англійській мові.
В даний момент останніми версіями систем є Eviews 10 і Stata 15. Обидва пакети представляють широкі можливості при аналізі часових рядів і панельних даних, що дозволяє використовувати їх в економетричних дослідженнях.
Інтерфейс програми Eviews, як правило, легко освоюється. Труднощі з вивченням командного синтаксису виникають вкрай рідко. Командний синтаксис програми Stata трохи складніше, але підпорядковується одним шаблоном.
Prognoz Platform [6] представляє собою комерційну інтегровану платформу російської компанії, яка спеціалізується на програмному забезпеченні для бізнес-аналітики. Prognoz Platform випускається з 1992 року.
Відповідно до керівництва по повному переліку методів, програма включає модулі «Моделювання та прогнозування» і «Аналіз часових рядів», на базі яких можлива побудова моделей часових рядів.
До недоліків даного програмного засобу можна віднести відсутність детального опису та якісного огляду в довідковій документації реалізованих методів і моделей економетрики, а також додаткової навчальної літератури по роботі в Prognoz Platform. Ознайомитися з можливостями даного програмного продукту можна, скориставшись безкоштовним web-доступом до ресурсу на місяць. До переваг Prognoz Platform відноситься наявність статистичної бази російських даних. Однак зміна розміру вибірки в програмі не передбачено, тому доводиться проводити аналіз усієї тенденції часового ряду, в тому числі і тієї, яка вже втратила силу. На практиці виявилося, що не всі заявлені в програмі економетричні процедури і тести реалізовані в онлайн-версії. Зокрема, двокрокова процедура Енгла-Гренджер тестування на коінтеграції недоступна в програмі. Крім того, в програмі Prognoz Platform висновок результатів деяких тестів передбачає відображення тільки розрахункових і критичних значень без результатів регресії.
Порівняємо можливості програмних продуктів STATISTICA, SPSS, EViews, Stata, Gretl, Prognoz Platform (табл. 3.1).
Порівняємо функціональні характеристики програмних продуктів (табл. 3.2) на наявність методів і моделей базового і просунутого рівнів економетрики, а також методів багатовимірного статистичного аналізу, «відлучення» яких призводить до збіднення математичного апарату економетрики і обмеження можливостей прикладних економетричних досліджень [1].
Таблиця 3.1 - Порівняльний аналіз можливостей прикладних економетричних програм
Програма |
Переваги |
Недоліки |
|
1 |
2 |
3 |
|
STATISTICA (StatSoft Inc.) |
Містить набір методів для базової економетрики; наявність русифікованої версії і докладної русифікованої довідкової системи; випущено досить літератури по роботі з програмою; зрозумілий інтерфейс; швидкодія; можливість паралельної роботи в різних модулях; легкий імпорт / експорт даних в електронні і текстові процесори; можливість створення власних макросів. |
Велика кількість кнопок і вкладок в діалогових вікнах ускладнює відтворюваність моделей; можливість паралельної обробки декількох підгруп даних тільки в останніх версіях; висока ціна. |
|
SPSS (IBM) |
Містить набір методів для базової економетрики; наявність русифікованої версії і докладної русифікованої довідкової системи; випущено досить літератури по роботі з програмою; зрозумілий інтерфейс; швидкодія; можливість одночасної роботи з декількома наборами даних; можливість паралельної роботи в різних модулях; імпорт / експорт даних в електронні і текстові процесори. |
Націленість на маркетингові та соціологічні дослідження; велика кількість кнопок і вкладок в діалогових вікнах ускладнює відтворюваність моделей; високі вимоги до характеристик комп'ютера і операційної системи; висока ціна. |
|
Eviews (Quantitative Micro Software HIS Global Inc.) |
Містить величезний набір сучасних методів для просунутої економетрики; докладна (але не русифікована) довідкова система; легкий в освоєнні командний синтаксис і інтерфейс; швидкодія; легка відтворюваність моделей і отримання графіків; можливість створення власних макросів; можливість одночасної роботи з декількома файлами; доступна ціна студентської версії. |
Відсутність русифікованої версії і русифікованої довідкової системи; мало російськомовної літератури по роботі в пакеті. |
|
Stata (StataCorp LP) |
Містить величезний набір сучасних методів для просунутої економетрики; докладна (але не русифікована) довідкова система; швидкодія; доступна ціна; наявність навчальних уроків для користувачів. |
Відсутність русифікованої версії і русифікованої довідкової системи; мало російськомовної літератури по роботі в пакеті; складний командний синтаксис; ускладненість повноцінного імпорту / експорту даних в електронні процесори. |
|
Prognoz Platform (Прогноз) |
Містить набір методів для базової економетрики і деякі методи просунутої економетрики; русифікована програма; наявність статистичної бази соціально-економічних рядів Російської Федерації. |
Повнота і якість довідкової системи залишають бажати кращого; відсутність додаткової літератури по роботі в пакеті; складний в освоєнні інтерфейс; низька швидкість роботи і довге завантаження онлайн-сервісу; ускладненість імпорту / експорту даних і результатів аналізу. |
|
Gretl (спільнота економетристів) |
Містить величезний набір сучасних методів для просунутої економетрики; наявність русифікованої версії; докладна (але не русифікована) довідкова система; легкий в освоєнні інтерфейс; швидкодія; наявність в програмі навчальних уроків для користувачів, прикладів даних; можливість паралельної роботи в різних модулях; можливість створення власних макросів; безкоштовна ліцензія. |
Відсутність русифікованої довідкової системи; мало російськомовної літератури по роботі в пакеті; ускладненість імпорту / експорту даних в електронні і текстові процесори; нагромадження і хаотичність розташування вікон з результатами; можливість одночасної роботи з одним файлом. |
Таблиця 3.2 - Підтримка економетричних методів та моделей в пакетах програм
Економетричні методи та моделі |
Statistica |
SPSS |
Eviews |
Stata |
Prognoz Platform |
Gretl |
|
1 |
2 |
3 |
4 |
5 |
6 |
7 |
|
Методи багатомірного статистичного аналізу |
+ |
+ |
- |
+ |
- |
+ |
|
Множинна регресія |
+ |
+ |
+ |
+ |
+ |
+ |
|
Моделі з граничними залежними змінними |
+ |
+ |
+ |
+ |
+ |
+ |
|
Моделі декомпозиції одномірних часових рядів |
+ |
+ |
+ |
+ |
+ |
+ |
|
Моделі Бокса-Дженкінса (ARMA, ARIMA) |
+ |
+ |
+ |
+ |
+ |
+ |
|
Динамічні моделі з розподіленим лагом |
+ |
+ |
+ |
+ |
+ |
+ |
|
Одиничні корні та аналіз часових рядів |
- |
- |
+ |
+ |
+ |
+ |
|
Моделі багатомірних часових рядів |
- |
- |
+ |
+ |
+ |
+ |
|
Моделі умовної гетероскедаcтичності (ARCH, GARCH) |
- |
- |
+ |
+ |
+ |
+ |
|
Лінійні моделі панельних даних |
- |
- |
+ |
+ |
- |
+ |
|
Динамічні моделі панельних даних |
- |
- |
+ |
+ |
- |
+ |
|
Моделі панельних даних з граничними залежними змінними |
- |
- |
+ |
+ |
- |
+ |
Як видно з таблиці, найбільш повний перелік методів економетрики для аналізу часових рядів, просторових і панельних даних, а також методів багатовимірного статистичного аналізу містять програми Gretl і Stata. Пакет Eviews поступається їм лише через невключення методів багатовимірного аналізу. Якщо врахувати комбінацію критеріїв «можливості + ціна», то безумовним лідером залишається програма Gretl. Тому саме за допомогою цього програмного продукту буде проводитися моделювання динаміки фондових індексів.
3.1 Аналіз емпіричних даних та вибір типу моделі
Для виконання аналізу використовуємо комп'ютерний пакет, а саме економетричний програмний продукт Gretl (в пункті 3.1 представлена детальна інформація по даному продукту) і пакет «Анализ данных» Microsoft Excel.
Коли при аналізі економічних даних виникає необхідність оцінити динаміку зміни деякого показника і при цьому досліджуваний показник залежить тільки від часу, то використовують моделі часових рядів, але при цьому важливою складовою дослідження є аналіз цих рядів. Аналіз являє собою сукупність математичних і статистичних методів дослідження інформації з метою визначення структури часового ряду. Визначення структури часового ряду необхідно для правильної ідентифікації математичної моделі, а також для оцінки ризику [7]. В рамках даної роботи розглянуті часові ряди щоденних значень фондових індексів за 2017 рік на момент закриття торгів: DAX (Німеччина), DOW JONES (США), CAC (Франція) і РР (Розвиваючий ринок). У всіх часових рядах попередньо виключена постійна складова шляхом центрування рядів. У таблиці 3.3 представлена описова статистика вихідних даних:
Таблиця 3.3 - Описова статистика вихідних даних
DAX |
DJ |
CAC |
РР |
||
Середнє значення |
-8,06 |
7,61 |
1,83 |
7,4 |
|
Медіана |
1,24 |
1,56 |
4,39 |
-39,49 |
|
Мінімум |
-26,73 |
-21,61 |
-32,36 |
-519,82 |
|
Максимум |
31,92 |
15,04 |
24,52 |
590,84 |
|
Стандартне відхилення |
14,84 |
7,38 |
15,32 |
276,42 |
|
Асиметрія |
0,14 |
-0,79 |
-0,52 |
0,22 |
|
Ексцес |
-0,92 |
1,00 |
-0,94 |
-1,04 |
З таблиці випливає, що ексцес у всіх індексах приблизно дорівнює по модулю одиниці. Це свідчить про те, що розподіли рядів трохи відрізняються від нормального, вони мають більш або менш високу вершину, ніж нормальний закон. Спостерігається помірний розкид даних (волатильність) на розвинених ринках, а на ринку, що розвивається (РР), розкид набагато більше.
На графіках, що зображені на рисунках 3.1 - 3.3 представлені центровані дані і тренд індексів DAX (260 значень), DJ (295 значень), CAC (261 значення).
Рисунок 3.1 - Центрований ряд і тренд індексу DAX
Для подальшого дослідження тренд потрібно виключити з ряду. Для цього необхідно задати його математичну модель. В даному випадку модель для DAX має вигляд (фор. 3.1):
, (3.1)
Коефіцієнт детермінації рівний 0,6671, що свідчить про наявність лінійного взаємозв'язку між досліджуваними даними.
Рисунок 3.2 - Центрований ряд і тренд індексу DJ
Рівняння тренда для DJ наступне (фор.3.2):
, (3.2)
Коефіцієнт детермінації рівний 0,6697, що також свідчить про наявність лінійного взаємозв'язку між досліджуваними даними.
Рисунок 3.3 - Центрований ряд і тренд індекса CAC
Математчна модель тренда для CAC має вигляд (фор. 3.3):
, (3.3)
Коефіцієнт детермінації рівний 0,6944, що свідчить про наявність лінійного взаємозв'язку між досліджуваними даними.
Перевірка гіпотез про значущість моделей і значущість параметрів для індексів DAX, CAC та DJ дозволяє зробити висновок, що самі моделі та параметри статистично значимі.
За графіками 3.1 - 3.3 видно, що рівні ряду групуються біля різних середніх значень і дисперсія ряду залежить від часу (розкид істотно змінюється). Крім того, має місце лінійний зростаючий тренд. Виходячи з цього, можна припустити, що ряди є нестаціонарними.
На розвиваючому ринку спостерігається інша ситуація. На графіку, що зображен на рисунку 3.4 представлені центровані дані індекса PP (252 значень). і поліноміальний тренд, який змінює свою тенденцію на розглянутому інтервалі часу.
Рисунок 3.4 - Центрований ряд і тренд індекса РР
Рівняння тренду має вигляд (фор. 3.4):
, (3.4)
де - параметри регресії;
- помилка спостережень.
Розрахуємо коефіцієнти та статистику регресії для даних РР за допомогою надстройки «Excel» «AtteStat» (рис. 3.5).
Рисунок 3.5 - Обчислення регресійних коефіцієнтів та статистики для даних РР
З рисунка 3.5 видно, що коефіцієнт детермінації рівний 0,7652. Це свідчить про високу ступінь взаємозв'язку між досліджуваними змінними.
F-статистика більше ніж р-значення тому модель є статистично значуща.
Розрахункове значення t-статистики по модулю більше р-значення для всіх коефіцієнтів тому за критерієм Стьюдента всі коефіцієнти статистично значимі.
Таким чином рівняння тренду наступне (фор. 3.5):
(3.5)
На рисунку 3.6 показано графіки поліноміальної аппроксимації і довірчі інтервали для РР.
Рисунок 3.6 - Графік поліноміальної аппроксимації і довірчі інтервали для РР
Згідно методики аналіза часових рядів [7] потрібно тренд виключити з часового ряду На рисунках 3.7 - 3.10 наведено графіки індексів DAX, DJ, CAC, РР після виключення тренду.
Рисунок 3.7 - Детрендований ряд індекса DAX
Рисунок 3.8 - Детрендований ряд індекса DJ
Рисунок 3.9 - Детрендований ряд індекса CAC
Рисунок 3.10 - Детрендований ряд РР
На основі візуального аналізу графіків неможливо зробити висновок про стаціонарність отриманого ряду. Скористаємося розширеним тестом Дікі-Фуллера [7]. Відповідно до тесту перевіряється гіпотеза - ряд нестаціонарний при альтернативній - ряд стаціонарний (тут і далі рівень значущості прийнятий рівним ). На рисунках 3.11 - 3.14 містяться результати розрахунків по тесту.
Рисунок 3.11 - Результати тесту Дікі?Фуллера для DAX
В даному випадку p-значення для DAX дорівнює 0,0139, що менше рівня значущості, тому гіпотеза відхиляється. P-значення (p-рівень значущості, p-критерій) - ймовірність отримати для даної ймовірнісної моделі розподілу значень випадкової величини таке ж або більш екстремальне значення статистики (середнього арифметичного, медіани і ін.), В порівнянні з раніше спостережуваними значеннями, за умови, що нульова гіпотеза вірна.
Рисунок 3.12 - Результати тесту Дікі?Фуллера для DJ
Для індексу DJ p-значення дорівнює 0,0035, тобто менше рівня значущості, також гіпотеза відхиляється.
Рисунок 3.13 - Результати тесту Дікі?Фулера для CAC
Для CAC p-значення рівне 0,0407, що також менше рівня значущості, тобто гіпотеза відхиляється.
Рисунок 3.14 - Результати тесту Дікі?Фуллера для РР
Для РР p-значення дорівнює 0,0002, що менше рівня значущості.
Отже, нульова гіпотеза про нестаціонарність відхиляється для всіх індексів, тобто немає підстав вважати ряди нестаціонарними.
Для ідентифікації моделі розглянемо оцінки корелограми автокореляційної (ACF) і частинної автокореляційної (PACF) функцій для детрендованих рядів (рис. 3.15 - 3.18).
Рисунок 3.15 - Корелограми ACF і PACF для DAX
Рисунок 3.16 - Корелограми ACF і PACF для DJ
Рисунок 3.17 - Корелограми ACF і PACF для CAC
Рисунок 3.18 - Корелограми ACF і PACF для РР
Для всіх індексів корелограма для ACF експоненціально спадає на лагах 1-30, а корелограма для PACF різко спадає з першого лагу тому перетворені індекси є авторегресійними процесами першого порядку AR(1) [6].
3.2 Моделювання фондових індексів
Побудуємо модель процесу AR(1). Математична модель має вигляд (фор. 3.6):
, (3.6)
де - значення ряду в поточний момент часу;
- значення ряду в попередній момент часу;
і - коефіцієнти моделі;
- випадкове обурення, має нормальний розподіл N(0, ).
Для тестування помилок на присутність ефекту гетероскедатичності викорисовується критерій Уайта. Гетероскедастичність моделі викликана залежністю (можливо досить складною) дисперсій помилок від ознак. У тесті перевіряється нульова гіпотеза про відсутність гетероскедастичності (тобто помилки моделі передбачаються гомоскедастичність - з постійною дисперсією). В такому випадку допоміжна регресія повинна бути незначною. Для перевірки цієї гіпотези використовується LM-статистика LM = nR2, де R2 - коефіцієнт детермінації допоміжної регресії, n - кількість спостережень. При відсутності гетероскедастичності дана статистика має асимптотичний розподіл Х2(N-1), де N - кількість параметрів допоміжної регресії. Отже, якщо значення статистики більше критичного значення цього розподілу для заданого рівня значущості, то нульова гіпотеза відкидається, тобто є гетероскедастичність. В іншому випадку гетероскедастичність визнається незначною (випадкові помилки швидше за все гомоскедастичні).
На рисунках 3.19 - 3.22 приведені розрахунки процесу AR(1) та результат тестування на гетероскедастичність.
Рисунок 3.19 - Оцінка параметрів та тестування помилок моделі AR(1) для DAX
Авторегресійна модель для DAX має наступний вигляд (фор. 3.7):
, (3.7)
З рисунку видно, що спостерігається висока кореляція , F-критерій більше р-значення, отже модель є статистично значуща. За розрахунками h-статистика Дарбіна-Уотсона рівна -0,002, що менше чим 1,5. З цього слідує, що модель не адекватна та потребує тестування на наявність ефекту гетероскедастичності [7].
Рисунок 3.20 - Оцінка параметрів та тестування помилок моделі AR(1) для DJ
Модель для DJ має наступний вигляд (фор. 3.8):
, (3.8)
З рисунку 3.20 видно, що спостерігається висока кореляція , F-критерій більше р-значення, отже модель є статистично значуща. За розрахунками h-статистика Дарбіна-Уотсона рівна -0,0785, що менше чим 1,5. З цього слідує, що модель не адекватна та потребує тестування на наявність ефекту гетероскедастичності.
Рисунок 3.21 - Оцінка параметрів та тестування помилок моделі AR(1) для CAC
Модель для CAC має наступний вигляд (фор. 3.9):
, (3.9)
З рисунку 3.21 видно, що спостерігається висока кореляція , F-критерій більше р-значення, отже модель є статистично значуща. За розрахунками h-статистика Дарбіна-Уотсона рівна 0,0099, що менше чим 1,5. З цього слідує, що модель не адекватна та потребує тестування на наявність ефекту гетероскедастичності.
Рисунок 3.22 - Оцінка параметрів та тестування помилок моделі AR(1) для PP
Модель для РР має наступний вигляд (фор. 3.10):
, (3.10)
З рисунку 3.22 видно, що спостерігається висока кореляція , F-критерій більше р-значення, отже модель є статистично значуща. За розрахунками h-статистика Дарбіна-Уотсона рівна -0,3001, що менше чим 1,5. З цього слідує, що модель не адекватна та потребує тестування на наявність ефекту гетероскедастичності.
Для всіх індексів перевіряється гіпотеза про відсутність ARCH процесів. В даному випадку Хи-квадрат більше чим р-значення тому гіпотеза про відсутність ARCH процесів відклоняється, тобто має місце гетероскедастичність тому розглядається процес ARCH(1).
Крім того тестування помилок свідчить про відсутність нормального розподілу для . Тест на нормальність розподілу помилок по всім індексам (рис. 3.19 - 3.22) відхиляє гіпотезу про нормальний розподіл (p-значення < 0,05). Ці висновки наочно ілюструють графіки на рис.3.23 - 3.30.
Розподіл частот помилок регресії є більш гостроверхим, ніж нормальне (рис. 3.23 - 3.26).
Рисунок 3.23 - Розподіл частот помилок регресії для DAX
фондовий індекс авторегресійний
Рисунок 3.24 - Розподіл частот помилок регресії для DJ
Рисунок 3.25 - Розподіл частот помилок регресії для CAC
Рисунок 3.26 - Розподіл частот помилок регресії для PP
На рисунках 3.27 - 3.30 представлені графіки помилок моделі. Помилки коливаються навколо нульового значення протягом усього досліджуваного періоду. Однак дисперсія помилок кластерізована, тобто періоди високої дисперсії чергуються з більш спокійними періодами, коли дисперсія відносно мала. Таке поєднання зазначених властивостей є характерною особливістю фінансових часових рядів і також свідчить про наявність гетероскедастичності.
Рисунок 3.27 - Графік помилок регресії для DAX
Рисунок 3.28 - Графік помилок регресії для DJ
Рисунок 3.29 - Графік помилок регресії для САС
Рисунок 3.30 - Графік помилок регресії для РР
Нижче, на рисунках 3.31 - 3.34 наведено моделі з поправкою на гетероскедастичність.
Рисунок 3.31 - Коригування параметрів моделі з урахуванням гетероскедастичності для DAX
Рівняння для DAX приймає вигляд (фор. 3.11):
, (3.11)
Рисунок 3.32 - Коригування параметрів моделі з урахуванням гетероскедастичності для DJ
Рівняння для DJ приймає вигляд (фор. 3.12):
, (3.12)
Рисунок 3.33 - Коригування параметрів моделі з урахуванням гетероскедастичності для CAC
Рівняння для CAC приймає вигляд (фор. 3.13):
, (3.13)
Рисунок 3.34 - Коригування параметрів моделі з урахуванням гетероскедастичності для PP
Рівняння для РР приймає вигляд (фор. 3.14):
, (3.14)
Остаточно, закон динаміки для індексів набирає вигляду:
, (3.15)
, (3.16)
, (3.17)
, (3.18)
де , , , ? значення індексу в момент часу t, ? помилка моделі.
На наступних діаграмах представлено відповідність розрахункових і реальних значень (рис. 3.35 - 3.38). Можна сказати, що моделі досить точно описують вихідний ряд, фактичні і розрахункові значення практично збігаються, стандартне відхилення DAX становить , DJ: , CAC: , PP: . Отже, отримані моделі можуть бути використані для побудови короткострокових прогнозів. Прогноз на 1 день є безумовним, і він виявиться найбільш точним, оскільки залежить тільки від уже відомих даних.
Рисунок 3.35 -- Графіки прогнозних і фактичних зосереджених значень DAX
Рисунок 3.36 -- Графіки прогнозних і фактичних зосереджених значень DJ
Рисунок 3.37 -- Графіки прогнозних і фактичних зосереджених значень CAC
Рисунок 3.38 -- Графіки прогнозних і фактичних зосереджених значень PP
В таблиці 3.4 наведені результати моделювання всіх досліджувальних індексов.
Таблиця 3.4 - Результати моделювання
Середнє |
Рівняння тренду |
Рівняння AR(1) |
Модель |
||
DAX |
413,19 |
||||
DJ |
267,11 |
||||
CAC |
369,87 |
||||
РР |
6587,08 |
Моделі для розглянутих індексів схожі, вони мають три складові: постійну, тренд і авторегресійний процес з ефектом гетероскедастичності, окрім, моделі для РР тренд якої виявився поліноміальним трендом чутливим до точності обчислень. Так грубе округлення коефіцієнтів рівняння тренду призводить до невірних розрахунків, особливо для малих коефіцієнтів, тобто близьких до нуля.
Висновки до розділу 3
У третьому розділі побудовано моделі фондових індексів різних країн та на їх основі проведено оцінювання якості моделей по статистичним критеріям.
Побудова моделей здійснювалася за допомогою програмного продукту Gretl, так як проведений аналіз різних програмних продуктів показав, що безумовним лідером в комбінації «можливості + ціна» виявилася саме ця економетрична програма.
Динаміка ринків розвинених країн спрямована за лінійним трендом ринку, ринку, що розвивається - за поліномом третього порядку. Лінійні тренди мають невеликий нахил, таким чином, шанси на продовження тренда вище, ніж на його корекцію. Ринок, що розвивається частіше змінює свій напрямок, тобто менш стійкий.
Для всіх розглянутих часових рядів фондових індексів має місце гостровершинність щільності ймовірностей і кластеризація дисперсії помилок. Це, в свою чергу, говорить про високу ймовірність появи екстремальних значень.
ВИСНОВКИ
В умовах глобалізації великий вплив здійснюють світові індекси один на одного. Якщо падають показники індексу DJ, то це відображається на показниках індексів інших країн. Тому відслідковувати динаміку світових індексів являється актуальною та важливою задачою.
...Подобные документы
Теоретичні основи методів аналізу фінансових даних. Формалізований опис емпіричних закономірностей фінансових часових рядів. Розробка алгоритмів оцінювання параметрів волатильності і комплексу стохастичних моделей прогнозування фінансових індексів.
курсовая работа [1,4 M], добавлен 05.05.2015Оцінка якості моделі лінійної регресії. Використання методу найменших квадратів при розрахунках параметрів. Згладжування рядів динаміки за методом простої середньої і експоненціального згладжування. Перевірка адекватності моделі за критерієм Фішера.
контрольная работа [272,3 K], добавлен 10.05.2015Виробнича функція Кобба-Дугласа. Розрахунок методом математичної екстраполяції прогнозного значення обсягу виробництва при заданих значеннях витрат праці та виробничого капіталу. Оцінка адекватності моделі за критерієм Фішера. Оцінки параметрів регресії.
контрольная работа [39,9 K], добавлен 13.03.2015Специфікація економетричної моделі парної регресії. Побудова лінійної, степеневої та показникової економетричної моделі, поняття коефіцієнта регресії та детермінації. Графічне зображення моделювання лінійного зв’язку, застосування F–критерію Фішера.
контрольная работа [5,1 M], добавлен 17.03.2010- Конкурентоспроможність національної економіки і валютний курс: оцінка впливу, прогнозування динаміки
Створення економіко-математичної моделі на основі рівняння множинної регресії та прогнозування конкурентоспроможності національної економіки за допомогою системи показників її розвитку. Оцінка впливу валютного курсу, практика його державного регулювання.
автореферат [50,3 K], добавлен 06.07.2009 Моделювання як наука. Типові математичні схеми моделювання систем. Статистичне моделювання систем на ЕОМ. Технології та мови моделювання. Методи імітаційного моделювання із застосуванням пакета GPSS World. Ідентифікація параметрів математичної моделі.
курс лекций [1,4 M], добавлен 01.12.2011Побудова економетричної моделі парної регресії. На основі даних про витрати обігу (залежна змінна) і вантажообігу (незалежна змінна) побудувати економетричну модель. Рівняння регресії. Коефіцієнт парної детермінації та кореляції. Перевірка надійності.
задача [563,6 K], добавлен 28.12.2008Види і функції фондової біржі. Основні етапи та принципи створення математичних моделей. Найвідоміші індекси світового фондового ринку. Розрахунок індексів українських акцій. Розробка програмної моделі діяльності фондової біржі на базі Ruby та JavaScript.
курсовая работа [965,9 K], добавлен 25.11.2015Зміст методики перевірки статистичної вибірки на розподіл за нормальним законом. Формування рандомізованого плану проведення спостережень за обсягами перевезень, поняття регресійної моделі та коефіцієнтів детермінації і кореляції, виявлення помилок.
контрольная работа [77,8 K], добавлен 18.05.2011Складання математичної моделі задачі забезпечення приросту капіталу. Її рішення за допомогою електронних таблиць Microsoft Excel. Облік максимальної величини сподіваної норми прибутку. Оцінка структури оптимального портфеля. Аналіз отриманого розв’язку.
контрольная работа [390,5 K], добавлен 24.09.2014Параметри проведення економетричного аналізу. Метод найменших квадратів. Оцінка параметрів лінійної регресії за методом найменших квадратів. Властивості простої лінійної регресії. Коефіцієнти кореляції і детермінації. Ступені вільності, аналіз дисперсій.
контрольная работа [994,5 K], добавлен 29.03.2009Статистичний і економічний зміст коефіцієнтів кореляції і детермінації. Економічне тлумачення довірчих інтервалів коефіцієнтів моделі, точкового значення прогнозу. Форма відображення статистичних даних моделі. Параметри стандартного відхилення асиметрії.
контрольная работа [20,1 K], добавлен 03.08.2010Побудова загальної лінійної регресії та аналіз її основних характеристик. Перевірка гіпотези про лінійну залежність між змінними. Визначення статистичної властивості окремих оцінок і моделі в цілому. Альтернативні способи оцінки параметрів регресії.
лабораторная работа [77,0 K], добавлен 22.07.2010Типи економетричних моделей. Етапи економетричного аналізу економічних процесів та явищ. Моделі часових рядів та регресійні моделі з одним рівнянням. Системи одночасних рівнянь. Дослідження моделі парної лінійної регресії. Однофакторні виробничі регресії.
задача [152,8 K], добавлен 19.03.2009Особливі точки системи, що описана моделлю динаміки ринкового середовища. Дослідження моделі динаміки ринкового середовища за допомогою біфуркаційної діаграми та за допомогою коренів характеристичного рівняння. Умови стійкості та точки біфуркації.
курсовая работа [1,7 M], добавлен 22.04.2014Поняття реклами, ефективності рекламної діяльності та проблеми її моделювання. Види емпіричних моделей для оцінки рекламного бюджету. Ідеї для побудови економіко-математичної моделі організації рекламної діяльності. Застосування диференціальних рівнянь.
дипломная работа [793,8 K], добавлен 24.09.2016Статистичні методи аналізу та обробки спостережень. Характерні ознаки типової і спеціалізованої звітності підприємств. Оцінка параметрів простої лінійної моделі методом найменших квадратів. Аналіз показників багатофакторної лінійної і нелінійної регресії.
контрольная работа [327,1 K], добавлен 23.02.2014Вихідні поняття прогнозування, його сутність, принципи, предмет і об'єкт. Суть адаптивних методів. Прогнозування економічної динаміки на основі трендових моделей. Побудова адаптивної моделі прогнозування прибутку на прикладі стоматологічної поліклініки.
дипломная работа [1,2 M], добавлен 18.06.2015Теоретичні аспекти математичного моделювання динамічних систем: поняття і принципи, прийняття управлінських рішень з урахуванням фактору часу. Вирішення задач динамічного програмування: побудова і розрахунок моделі; оптимальний розподіл інвестицій.
курсовая работа [1,1 M], добавлен 16.02.2011Поняття системи одночасних рівнянь. Структурна форма економетричної моделі. Побудова лінійної багатофакторної економіко-математичної моделі залежності фактору Y від факторів Xi. Аналіз на наявність мультиколінеарності згідно алгоритму Фаррара-Глобера.
курсовая работа [342,6 K], добавлен 18.07.2011