Статистический анализ инвестиционной привлекательности регионов России
Анализ инвестиционной привлекательности регионов РФ в динамике. Факторы, оказывающие влияние на эту сферу. Показатели, описывающие влияние на приток инвестиций в регион. Взаимосвязь между экономической эффективностью региона и притоком инвестиций.
Рубрика | Экономика и экономическая теория |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 07.12.2019 |
Размер файла | 1,3 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
;
(t):(2,655) (2,791) (4,278) (4,453) (2,551) (1,701) (-2,853)
Как видно из уравнения регрессии, если исключить из анализа валовый региональный продукт, то поведение зависимой переменной будет описано большим числом факторов. Так, самое большое влияние оказывает переменная х1 -удельный вес численности населения в трудоспособном возрасте в общей численности населения. Чем больше людей в трудоспособном возрасте в регионе, тем выше объем инвестиций в основной капитал. Такая тенденция объясняется тем, что новые предприятия строятся в тех регионах, где есть рабочая сила. Однако, наблюдается и обратная взаимосвязь - в места, с высоким количеством рабочих мест (территории с развитым промышленным, финансовым сектором) приезжает много людей в трудоспособном возрасте.
Объем отгруженных товаров собственного производства, выполненных работ и услуг собственными силами сырьевого сектора (х5) также влияет на приток инвестиций в основной капитал. Так как рассматривались объем отгруженных товаров сырьевого сектора, обрабатывающего сектора и электроэнергетического сектора, то можно сделать вывод, что инвесторы предпочитают вкладывать сектор в предприятия по добыче полезных ископаемые, то есть в регионах, где есть природные ресурсы, инвестиции в основной капитал выше.
Полученная регрессионная модель показала, что среднедушевые денежные доходы населения (х9) и грузооборот автомобильного транспорта организаций всех видов деятельности (х11) влияют на приток инвестиций в основной капитал в регионе, то есть потребительский потенциал (возможность у населения приобретать производимые в регионы товары и услуги) и инфраструктурный потенциал (доступность транспортной сети и связи) важны для инвестора при выборе объекта инвестирования.
Помимо этого, в модели значимым является фактор научно-технического потенциала региона, а именно затраты на технологические инновации в процентах от общего объема отгруженных товаров, выполненных работ, услуг (х13). Следовательно, на решение инвестора относительно того, инвестировать ли денежные средства в основной капитал, влияет наличие высокотехнологичного производства в регионе, то есть чем больше инноваций в регионе, тем охотнее инвесторы вкладываются в развитие предприятий.
Отрицательное значение коэффициента в модели только перед логарифмом вклада населения на депозит, что совпадает с выводом предыдущей модели (с включением ВРП).
Все коэффициенты модели являются значимыми так как . Также, можно сказать, что полученная модель является значимой, так как p-value для F статистики меньше 0,05
Таблица 19Дисперсионный анализ линеаризованной нелинейной модели без включения ВРП, построенной методом пошагового исключения переменных
Модель |
Сумма квадратов |
ст.св. |
Средний квадрат |
F |
Знч. |
|
Регрессия Остаток Всего |
21,881 |
6 |
3,647 |
23,142 |
0,000 |
|
11,976 |
76 |
0,158 |
||||
33,857 |
82 |
Источник: Расчеты автора
Полученное значение говорит о том, что включенные в модель значимые факторы объясняют 64,6% вариации зависимой переменной - поведения показателя инвестиций в основной капитал на душу населения (таблица 20).
Таблица 20Характеристики точности линеаризованной нелинейной модели без включения ВРП, построенной методом пошагового исключения переменных
R |
R-квадрат |
Скорректированный R-квадрат |
Стд. ошибка оценки |
|
0,804 |
0,646 |
0,618 |
0,39697 |
Источник: Расчеты автора
Также были рассчитаны информационные критерии для сравнения полученной модели без включения ВРП с другими рассматриваемыми в работе моделями(табл.21).
Таблица 21Информационные критерии линеаризованной нелинейной модели без включения ВРП, построенной методом пошагового исключения переменных
Критерий Акаике |
1,071 |
|
Критерий Шварца |
1,275 |
|
Критерий Хеннана - Куинна |
1,153 |
Источник: Расчеты автора
Остатки полученной модели были проверены на принадлежность к нормальному закону распределения (таблица 22). Нулевая гипотеза проведенных тестов: распределение исследуемых данных является нормальным.
Таблица 22Тесты для проверки принадлежности остатков линеаризованной нелинейной модели без включения ВРП, построенной методом пошагового исключения переменных, к нормальному закону распределения
Тест |
Наблюдаемое значение |
p-value |
|
Lilliefors(D) |
0,088 |
>0,1 |
|
Cramer-von Mises (W2) |
0,123 |
0,0542 |
|
Watson (U2) |
0,103 |
0,0785 |
|
Anderson-Darling (A2) |
0,777 |
0,0418 |
Источник: Расчеты автора
Четыре проведенные теста (Lilliefors(D), Cramer-von Mises (W2), Watson (U2), Anderson-Darling (A2)) показывают, что остатки модели принадлежат нормальному закону распределения на уровне значимости 0,05, так как p-value> 0,05.
LM тест показал, что автокорреляция остатков отсутствует (таблица прил.2), так как значение p-value больше, чем 0,05, следовательно, нулевая гипотеза об отсутствии автокорреляции остатков модели на втором лаге не отвергается.
Тест Харви (таблица прил.2) показал, что гетероскедастичность остатков отсутствует, так как p-value больше, чем 0,05, следовательно, нулевая гипотеза об отсутствии гетероскедастичности остатков модели не отвергается.
Также, в таблице в приложении 2 представлена проверка на мультиколлинеарность для построенного уравнения регрессии. Значения фактора инфляции вариации (centered VIF) для каждой переменной меньше 4, следовательно, мультиколлинеарность в модели отсутствует.
Метод пошагового включения переменных для модели без учета ВРП показал, что на инвестиции в основной капитал на душу населения влияют такие переменные, как среднедушевые денежные доходы населения и объем отгруженных товаров собственного производства, выполненных работ и услуг собственными силами сырьевого сектора. На третьем шаге в модель включается незначимая переменная - размер вклада (депозита) физических лиц в кредитных организациях Российской Федерации на душу населения. =0,56, значит включенными в модель регрессорами объясняется только 56% вариации зависимой переменной. Стандартная ошибка и критерии качества модели, построенной методом пошагового включения переменных ниже, чем в модели, построенной методом исключения переменных, поэтому в дальнейшем исследовании будет использоваться модель, построенная методом пошагового исключения переменных.
Таким образом, нелинейная степенная модель регрессии, построенная методом пошагового исключения переменных, имеет следующий вид:
Параметры модели в нелинейном уравнении регрессии являются коэффициентами частной эластичности, поэтому их можно интерпретировать следующим образом:
=4,446, следовательно, при увеличении удельного веса численности населения в трудоспособном возрасте в общей численности населения на 1%, объем инвестиций в основной капитал в среднем увеличится на 4,446%.
=0,092, следовательно, при увеличении объема отгруженных товаров собственного производства, выполненных работ и услуг собственными силами (добычи полезных ископаемых) на 1%, объем инвестиций в основной капитал в среднем увеличится на 0,092%.
=0,809, следовательно, при увеличении среднедушевых денежных доходов на 1%, объем инвестиций в основной капитал в среднем увеличится на 0,809%.
=0,131, следовательно, при увеличении грузооборота автомобильного транспорта организаций всех видов деятельности в регионе на 1 %, объем инвестиций в основной капитал в среднем увеличится на 0,131%.
=0,065, следовательно, при увеличении затрат на технологические инновации на 1 %, объем инвестиций в основной капитал в среднем увеличится на 0,065%.
=-0,175, следовательно, при увеличении числа финансовых и страховых предприятий и организаций на 1 %, объем инвестиций в основной капитал в среднем сократится на 0,175%.
Таким образом, обе модели (с включением ВРП и без) имеют высокую объясняющую способность и низкое значение стандартной ошибки. Однако, в модели с включением ВРП более высокие значения и и меньшие значения информационных критериев Шварца и Акаике, а также меньшая стандартную ошибка, поэтому можно считать ее наилучшей.
Использование метода главных компонент для исследования притока инвестиций в основной капитал
Снижение признакового пространства проводится в работе с целью объединить большое число переменных в компоненты и построить модель, в которой исследуется влияние каждой компоненты на зависимую переменную - объем инвестиций в основной капитал на душу населения по регионам России.
Для того, чтобы сделать вывод о числе главных компонент используются критерий Кайзера и критерий каменистой осыпи.
Согласно критерию Кайзера, для дальнейшего анализа необходимо отобрать только те факторы, собственные значения которых больше или равны 1. Это означает, что если фактор не выделяет дисперсию, эквивалентную дисперсии хотя бы одной переменной, то он опускается. В таблице 23 представлена объясненные совокупные дисперсии главных компонент. Собственные значения только у компонент 1, 2, 3 и 4 больше 1, поэтому для последующего анализа отбираются только 4 компоненты.
Таблица 23Объясненная совокупная дисперсия главных компонент
Компонента Начальные собственные значения Суммы квадратов нагрузок извлечения Итого % Дисперсии Кумулятивный % Итого % Дисперсии Кумулятивный % 1 7,127 39,592 39,592 7,127 39,592 39,592 2 3,354 18,634 58,227 3,354 18,634 58,227 3 1,490 8,276 66,502 1,490 8,276 66,502 4 1,196 6,644 73,146 1,196 6,644 73,146 5 0,983 5,462 78,608 6 0,876 4,865 83,473 7 0,674 3,746 87,219 8 0,463 2,574 89,794 9 0,433 2,406 92,200 10 0,369 2,048 94,247 11 0,265 1,471 95,718 12 0,217 1,206 96,925 13 0,137 0,760 97,685 14 0,119 0,663 98,347 15 0,108 0,598 98,945 16 0,082 0,456 99,401 17 0,067 0,374 99,775 18 0,041 0,225 100,000 |
Источник: Расчеты автора
Первая главная компонента объясняет 39,59% дисперсии исходных переменных. Меньше всего (6,64%) дисперсии исходных переменных объясняет четвертая главная компонента.
Отобранные для анализа по критерию Кайзера и критерию каменистой осыпи четыре главные компоненты объясняют 73,15% дисперсии исходных переменных, следовательно, вклад главных компонент в дисперсию высоких переменных высокий. Согласно критерию каменистой осыпи, собственные значения главных компонент изображаются на графике, и та точка на графике, где убывание собственных значений слева направо максимально замедляется, является последней главной компонентой, которую необходимо включить в дальнейший анализ. Как видно из графика собственных значений (рис.11), убывание собственных значений замедляется на участке кривой, где номер компоненты равен 4, следовательно, согласно критерию каменистой осыпи, необходимо оставить четыре главные компоненты (первую, вторую, третью и четвертую).
Рисунок 11 График собственных значений
Источник: Расчеты автора
Можно сделать вывод о том, что для последующего анализа необходимо оставить первые четыре главные компоненты, так как данный результат показали оба критерия (критерий Кайзера и критерий каменистой осыпи).
С целью интерпретации главных компонент была построена матрица компонент (таблица. 24). Сильной считается корреляция с коэффициентом Пирсона R ? 0,5, следовательно, интерпретация главных компонент проводится исходя из тех факторов, связь главных компонент с которыми больше 0,5.
Таблица 24Матрица компонент
Компонента |
|||||
1 |
2 |
3 |
4 |
||
x1 |
0,065 |
0,676 |
0,481 |
0,195 |
|
x2 |
0,148 |
0,282 |
0,496 |
0,377 |
|
x3 |
0,487 |
0,699 |
-0,034 |
-0,185 |
|
x4 |
-0,145 |
-0,154 |
-0,073 |
0,427 |
|
x5 |
0,428 |
0,508 |
0,192 |
-0,341 |
|
x6 |
0,898 |
-0,284 |
-0,107 |
0,022 |
|
x7 |
0,923 |
-0,046 |
0,044 |
-0,057 |
|
x8 |
0,254 |
-0,665 |
0,184 |
-0,318 |
|
x9 |
0,448 |
0,754 |
-0,025 |
-0,049 |
|
x10 |
0,41 |
-0,262 |
-0,177 |
0,562 |
|
x11 |
0,52 |
-0,352 |
0,021 |
-0,138 |
|
x12 |
0,891 |
-0,091 |
0,147 |
0,19 |
|
x13 |
0,627 |
-0,169 |
0,1 |
-0,122 |
|
x14 |
0,886 |
-0,235 |
0,162 |
0,12 |
|
x15 |
0,73 |
0,178 |
-0,444 |
0,112 |
|
x16 |
0,707 |
0,491 |
-0,356 |
0,044 |
|
x17 |
0,187 |
-0,371 |
0,632 |
-0,269 |
|
x18 |
0,566 |
-0,115 |
0,003 |
0,018 |
Источник: Расчеты автора
Коэффициент корреляции> 0,5 наблюдается у первой главной компоненты с х6, х7, х11, х12, x13, х14, х15, x16, х18 (х6 - объем отгруженных товаров собственного производства, выполненных работ и услуг собственными силами(обрабатывающие производства) млн. руб., х7 - объем отгруженных товаров собственного производства, выполненных работ и услуг собственными силами (обеспечение электрической энергией, газом и паром; кондиционирование воздуха) млн. руб., х11 - грузооборот автомобильного транспорта организаций всех видов деятельности, млн. т-км, х12 -внутренние затраты на научные исследования и разработки, млн. руб., х13 - затраты на технологические инновации в процентах от общего объема отгруженных товаров, выполненных работ и услуг, х14 - число страховых и финансовых предприятий и организаций, ед., х15 - число малых предприятий на 10 000 человек населения, ед., х16 - размер вклада (депозита) физических лиц в кредитных организациях Российской Федерации на душу населения на рублевых счетах, руб., х18 - объем туристских услуг, оказанных населению, млн. руб. ). Таким образом, для того, чтобы дать название первой главной компоненте, необходимо объединить все показатели. Первая компонента включает в себя большое число показателей, характеризующих регион с различных сторон (развитость инфраструктуры в регионе, объемы производства, финансовый потенциал и наличие вложений денежных средств в инновации и технологические разработки). Все эти показатели привлекательность региона для инвесторов. Следовательно, название первой главной компоненты Z1 -инвестиционная региона.
Коэффициент корреляции > 0,5 наблюдается у второй главной компоненты с х1, х3, х5, х8, х9 (х1 - Удельный вес численности населения в трудоспособном возрасте в общей численности населения(на конец года), %, х3 - валовый региональный продукт на душу населения, руб., х5 - объем отгруженных товаров собственного производства, выполненных работ и услуг собственными силами (добыча полезных ископаемых) млн. руб., х8 - продукция сельского хозяйства всего, млн. руб., х9 - среднедушевые денежные доходы (в месяц) руб.). Переменные х3, х5, х8 связаны с производственной сферой региона, а х3 и х9 с человеческим потенциалом, высокий уровень которого способствует экономическому росту территории. Поэтому название второй главной компоненты Z2 можно определить как производственный потенциал и перспективы экономического развития в регионе.
Коэффициент корреляции> 0,5 наблюдается у третьей главной компоненты с х17 (удельный вес прибыльных организаций в общем числе организаций, %), поэтому то название третьей главной компоненты Z3 -число прибыльных организаций в регионе.
Коэффициент корреляции> 0,5 наблюдается у четвертой главной компоненты с х10 (плотность железнодорожных путей на конец года, км путей на 10000 км2 территории). Следовательно, название четвертой главной компоненты Z4 -плотность железнодорожных путей в регионе.
В таблице 25 представлены рассчитанные коэффициенты интерпретации для четырех отобранных для анализа главных компонент.
Таблица 25Коэффициенты интерпретации для отобранных для анализа главных компонент
Коэф. интр. 1 |
0,848812 |
|
Коэф. интр. 2 |
0,712331 |
|
Коэф. интр. 3 |
0,289119 |
|
Коэф. интр. 4 |
0,285139 |
Источник: Расчеты автора
Коэффициент интерпретации показывает, процент дисперсии главной компоненты, объясненный включением в нее выбранных в ходе анализа матрицы компонент факторов.
Значения коэффициента интерпретации для первой и второй главных компонент высокие, а для второй и третьей компонент наблюдаются низкие значения коэффициентов интерпретации. То есть выбранные для первых двух компонент начальные признаки хорошо объясняют дисперсии главных компонент. Для третьей и четвертой компонент необходимо выбрать дополнительные признаки.
В третью главную компоненту можно также включить такой фактор, как удельный вес лиц с высшим образованием в численности занятых, % (х2), так как коэффициент корреляции у этого показателя с третьей главной компонентой равен 0,496. В таком случае значение коэффициента интерпретации третьей главной компоненты станет равно 0,578, это означает, что выбранные показатели (удельный вес лиц с высшим образованием в численности занятых, % и удельный вес прибыльных организаций в общем числе организаций, %) объясняют 57,8% дисперсии третьей главной компоненты. Можно дать новое название третьей главной компоненте Z3 - финансовая устойчивость региона.
Для того, чтобы повысить значение коэффициента интерпретации, в четвертую главную компоненту можно включить такой показатель, как индекс промышленного производства в процентах к предыдущему году (х4), корреляция с которым у четвертой компоненты равна 0,427. После включения нового фактора коэффициент интерпретации равен 0,45, следовательно, выбранные показатели (плотность железнодорожных путей на конец года, км путей на 10000 км2 территории и индекс промышленного производства в процентах к предыдущему году) объясняют 45,0% дисперсии четвертой главной компоненты. Можно дать новое название четвертой главной компоненте Z4 - эффективность промышленного сектора.
Для того, чтобы выявить, какие из полученных главных компонент оказывают влияние на зависимую переменную (приток инвестиций в основной капитал) было построено уравнение регрессии методом пошагового исключения переменных. В таблице 26 представлена конечная нелинейная линеаризованная модель, в которой все регрессоры являются значимыми.
Таблица 26Конечный этап метода пошагового исключения переменных для нелинейной линеаризованной модели с включением 4 главных компонент
Модель |
Нестандартизованные коэффициенты |
t |
Знч. |
|||
B |
Стд. Ошибка |
|||||
(Константа) |
11,282 |
0,045 |
249,132 |
0,000 |
||
Z1 |
0,271 |
0,046 |
5,950 |
0,000 |
||
Z2 |
0,405 |
0,046 |
8,895 |
0,000 |
||
Z4 |
-0,106 |
0,046 |
-2,323 |
0,023 |
Источник: Расчеты автора
Полученное уравнение регрессии имеет следующий вид:
(t): (249,132) (5,95) (8,895) (-2,323)
Э1=0,271, следовательно, при увеличении инвестиционной привлекательности региона на 1 %., логарифм инвестиций в основной капитал на душу населения увеличится на 0,271 %.
Э2=0,405, следовательно, при увеличении производственного потенциала и перспектив экономического развития в регионе на 1 %., логарифм инвестиций в основной капитал на душу населения увеличится на 0,405 %.
Э4= - 0,106, следовательно, при увеличении эффективность промышленного сектора на 1 %., логарифм инвестиций в основной капитал на душу населения снижается на 0,106 %. Это связано с тем, что в России инвестиции идут в топливно-сырьевой сектор, в то время как основные фонды предприятий истощены. Поэтому если в регионе развит промышленный сектор, но нет ресурсов, то приток инвестиций в таком регионе будет не очень высоким.
В таблице 27 представлены показатели качества модели, построенной на главных компонентах.
Таблица 27Характеристики точности модели с включением 4 главных компонент
R |
R-квадрат |
Скорректированный R-квадрат |
Стд. ошибка оценки |
|
0,776 |
0,603 |
0,588 |
0,41256 |
Источник: Расчеты автора
Полученное значение говорит о том, что 60,3% вариации Y можно объяснить включением в модель таких регрессоров, как инвестиционная привлекательность региона, производственный потенциал и перспективы экономического роста, эффективность промышленного сектора.
Все коэффициенты модели являются значимыми так как . Также, можно сказать, что полученная модель является значимой, так как p-value для F статистики меньше 0,05.
Таблица 28Дисперсионный анализ нелинейной линеаризованной модели с включением 4 главных компонент
Модель |
Сумма квадратов |
ст.св. |
Средний квадрат |
F |
Знч. |
|
Регрессия Остаток Всего |
20,411 |
3 |
6,804 |
39,973 |
0,000 |
|
13,446 |
79 |
,170 |
||||
33,857 |
82 |
Источник: Расчеты автора
Также были рассчитаны информационные критерии, позволяющие сравнить полученную модель с другими (таблица 29).
Таблица 29Критерии качества модели с использованием метода главных компонент (в модель включены 4 главные компоненты)
Критерий Акаике |
1,114 |
|
Критерий Шварца |
1,231 |
|
Критерий Хеннана - Куинна |
1,195 |
Источник: расчеты автора
Остатки полученной модели были проверены на принадлежность к нормальному закону распределения (таблица 30). Нулевая гипотеза проведенных тестов: распределение исследуемых данных является нормальным.
Таблица 30Тесты для проверки принадлежности остатков линеаризованной нелинейной модели с включением 4 компонент, построенной методом пошагового исключения переменных, к нормальному закону распределения
Тест |
Наблюдаемое значение |
p-value |
|
Lilliefors(D) |
0,081 |
>0,1 |
|
Cramer-von Mises (W2) |
0,119 |
0,0605 |
|
Watson (U2) |
0,097 |
0,0971 |
|
Anderson-Darling (A2) |
0,822 |
0,0524 |
Источник: Расчеты автора
Четыре проведенные теста (Lilliefors(D), Cramer-von Mises (W2), Watson (U2), Anderson-Darling (A2)) показывают, что остатки модели принадлежат нормальному закону распределения на уровне значимости 0,05, так как p-value> 0,05.
LM тест показал, что автокорреляция остатков отсутствует (таблица прил.3), так как значение p-value больше, чем 0,05, следовательно, нулевая гипотеза об отсутствии автокорреляции остатков модели на втором лаге не отвергается.
Тест Бройша-Пагана (таблица прил.3) показал, что гетероскедастичность остатков отсутствует, так как p-value больше, чем 0,05, следовательно, нулевая гипотеза об отсутствии гетероскедастичности остатков модели не отвергается.
Также, в таблице в приложении 3 представлена проверка на мультиколлинеарность для построенного уравнения регрессии. Значения фактора инфляции вариации (centered VIF) для каждой переменной меньше 4, следовательно, мультиколлинеарность в модели отсутствует.
Построение рейтинга регионов на основе показателя инвестиционной привлекательности
Так как первая главная компонента (инвестиционная привлекательность региона) включает в себя большинство социально-экономических показателей (у нее высокий коэффициент корреляции с большинством показателей, отобранных для анализа (см. таблицу 24)), то ее можно использовать в качестве интегрального показателя инвестиционной привлекательности региона. Проранжировав субъекты РФ по первой главной компоненте (инвестиционная привлекательность) (см. прил. 5), можно сделать вывод, что лидирующими регионами по данному показателю являются города федерального значения (города Москва и Санкт-Петербург), на первом месте рейтинга находится город Москва. Также, высокие позиции занимает республика Татарстан и Московская область. У всех регионов, занимающих лидирующие места рейтинга, высокие показатели социально-экономического, развития. Высокий трудовой и инфраструктурный потенциал. Они являются центрами притяжения трудоспособного населения страны, а также в этих регионах развита финансовая сфера. Однако, высокий объем инвестиций в основной капитал наблюдается только в городе Москва. Отстающую позицию по показателю инвестиционной привлекательности (последние места в рейтинге) занимают южные регионы (республика Калмыкия, республика Ингушетия,) а также республика Тыва. В этих регионах очень низкие показатели инфраструктуры региона и нет налаженного производства. Инвестиции в основной капитал у этих регионов также находятся на низком уровне. Однако, регионы с самым высоким объемом инвестиций в основной капитал (Магаданская область, Якутия, Сахалинская область) находятся в середине рейтинга по инвестиционной привлекательности, большинство из этих регионах расположены ближе к концу рейтинга. Следовательно, можно сделать вывод о том, что инвестиционная привлекательность мало связана с притоком инвестиций в основной капитал и только в регионах, где наблюдается высокая концентрация природных ресурсов, высокий приток инвестиций. В целом, коэффициент корреляции между двумя показателями (инвестиционной привлекательностью и притоком инвестиций) равен 0,25, что говорит о слабой положительной взаимосвязи.
Глава 3. Анализ факторов, влияющих на приток инвестиций в основной капитал, в кластерах и временной анализ инвестиционной привлекательности регионов России
Разделение регионов на кластеры на основе их социально-экономических показателей
Необходимость кластерного анализа обусловлена тем, что регионы России отличаются по ряду признаков: по степени социально-экономического развития, по наличию или отсутствию природных ресурсов, а также по эффективности производственного сектора. Поэтому для того, чтобы определить факторы, влияющие на приток инвестиций в регион, следует разделить регионы на однородные группы и таким образом нивелировать тот факт, что у каждого региона был свой путь развития.
Для кластерного анализа были отобраны данные по 82 субъектам РФ за 2017 г. Из анализа на предварительном этапе исследования были исключены Ненецкий и Ямало-Ненецкий автономные округа, так как данные по этим субъектам являются выбросами. В качестве зависимой переменной у - рассматривается показатель логарифма инвестиций в основной капитал на душу населения, руб.
Для того, чтобы сделать вывод о наиболее предпочтительном числе кластеров, необходимо рассмотреть различные варианты разбиения объектов на кластеры и, исходя из наиболее часто встречающегося количества кластеров, сделать соответствующие выводы. В данном исследовании были рассмотрены 5 методов: метод ближнего соседа, метод дальнего соседа, метод центра тяжести, метод средней связи, метод Варда. Методы ближнего соседа (рис.1 прил.5), центра тяжести (рис.3 прил.5), средней связи (рис.4 прил.5) не дали наглядно интерпретируемого отображение кластеров (результаты объединялись и присоединялись очень близко). Наиболее точные разбиения объектов на кластеры показывают метод дальнего соседа и метод Варда. На рисунках 2 и 5 в приложении 5 представлены дендрограммы для этих двух методов. Данные дендрограммы показывают, что объекты разделены на 2 кластера. Можно также сказать, что один кластер по величине больше другого (в первом кластере сосредоточено больше переменных). Таким образом, для дальнейшего анализа будет отобрано 2 кластера.
Из графика средних значений(рис 12), который показывает среднее значение переменной для всех кластеров, видно, что все средние значения для каждой переменной, в большей или меньшей степени, различаются по всем параметрам, отсутствуют объединенные в одну точку средние значения, следовательно, объекты двух кластеров различаются по каждому признаку и нет необходимости проверять гипотезу о равенстве средних для какой-либо переменной так как отсутствуют точки, в которых средние значения расположены близко друг к другу и линии не соединяются воедино.
Рисунок 12 График средних значений в кластерах
Источник: расчеты автора
Можно также отметить, что наибольшая разница в средних у переменной х6, x7 и х12, а меньше всех - у х1и х2. Следовательно, такие признаки как х6(объем отгруженных товаров собственного производства, выполненных работ и услуг собственными силами(обрабатывающие производства)), х7(объем отгруженных товаров собственного производства, выполненных работ и услуг собственными силами (обеспечение электрической энергией, газом и паром; кондиционирование воздуха)) и х12(внутренние затраты на научные исследования и разработки) имеют важное значение при делении объектов на кластеры по сравнению с остальными переменными.
В таблице в приложении 6 представлено распределение субъектов РФ на 2 кластера (согласно методу к-средних). Можно заметить, что в первый кластер вошли регионы, в которых показатели инфраструктуры региона, человеческого потенциала и финансовой системы находятся на высоком уровне. Во второй кластер вошли регионы, богатые природными ресурсами. Таким образом, первый кластер можно назвать «Регионы с высоким уровнем социально-экономического развития», а второй кластер «Регионы с высоким природно-ресурсным потенциалом». В первый кластер вошел 51 регион, во второй 32 региона.
Построение регрессионных моделей, описывающих инвестиционную привлекательность регионов, в кластерах
Для того, чтобы выявить факторы, влияющие на приток инвестиций в основной капитал в первом кластере, построена линеаризованная нелинейная модель методом пошагового исключения переменных. После реализации процедуры исключения переменных было оставлено 3 переменные, являющиеся статистически значимыми (на что указывает уровень значимости, не превышающий 0,05 (p-value <0,05)). В таблице 31 представлен конечный этап метода пошагового исключения переменных для линеаризованной нелинейной модели в первом кластере.
Таблица 31Этапы метода пошагового исключения переменных для линеаризованной нелинейной модели в первом кластере
Модель |
Нестандартизованные коэффициенты |
t |
Знч. |
||
B |
Стд. Ошибка |
||||
(Константа) x3 x16 |
1,174 |
1,318 |
0,890 |
0, 037 |
|
1,477 |
0,114 |
12,974 |
0,000 |
||
-0,553 |
0,150 |
-3,680 |
0,001 |
Источник: расчеты автора
Полученное уравнение регрессии имеет следующий вид:
(t): (1,318) (0,114) (0,150)
Полученное уравнение регрессии говорит о том, что в первом кластере на приток инвестиций в основной капитал влияет величина валового регионального продукта. Данный результат не отличается от выводов, полученных при построении уравнения регрессии без деления на кластеры.
В таблице 32 представлены характеристики точности уравнения регрессии для первого кластера - регионы с высоким уровнем социально-экономического развития.
Таблица 32Характеристики точности линеаризованной нелинейной модели для первого кластера
R |
R-квадрат |
Скорректированный R-квадрат |
Стд. ошибка оценки |
|
0,905 |
0,819 |
0,811 |
0,26355129 |
Источник: расчеты автора
Значение говорит о том, что 81,9% вариации зависимой переменной объясняется включением в модель таких переменных, как валовый региональный продукт на душу населения и размер вклада (депозита) физических лиц в кредитных организациях Российской Федерации на душу населения на рублевых счетах).
Все коэффициенты модели являются значимыми так как . Также, можно сказать, что полученная модель является значимой, так как p-value для F статистики меньше 0,05.
Таблица 33Дисперсионный анализ линеаризованной нелинейной модели для первого кластера
Модель |
Сумма квадратов |
ст.св. |
Средний квадрат |
F |
Знч. |
|
Регрессия Остаток Всего |
168,454 |
3 |
56,151 |
42,692 |
0,000 |
|
47,350 |
36 |
1,315 |
||||
215,803 |
39 |
Источник: расчеты автора
Также были рассчитаны информационные критерии, позволяющие сравнить полученную модель с другими (таблица 34).
Таблица 34Критерии качества модели для первого кластера
Критерий Акаике |
0,227 |
|
Критерий Шварца |
0,342 |
|
Критерий Хеннана - Куинна |
0,271 |
Источник: расчеты автора
Остатки полученной модели были проверены на принадлежность к нормальному закону распределения (таблица 35). Нулевая гипотеза проведенных тестов: распределение исследуемых данных является нормальным.
Таблица 35Тесты для проверки принадлежности остатков нелинейной линеаризованной модели для первого кластера к нормальному закону распределения
Тест |
Наблюдаемое значение |
p-value |
|
Lilliefors(D) |
0,087 |
>0,1 |
|
Cramer-von Mises (W2) |
0,073 |
0,253 |
|
Watson (U2) |
0,066 |
0,276 |
|
Anderson-Darling (A2) |
0,533 |
0,1646 |
Источник: расчеты автора
Четыре проведенные теста (Lilliefors(D), Cramer-von Mises (W2), Watson (U2), Anderson-Darling (A2)) показывают, что остатки модели принадлежат нормальному закону распределения на уровне значимости 0,05, так как p-value> 0,05.
LM тест показал, что автокорреляция остатков отсутствует (таблица прил.7), так как значение p-value больше, чем 0, 05, следовательно, нулевая гипотеза об отсутствии автокорреляции остатков модели на втором лаге не отвергается.
Тест Бройша-Пагана (таблица прил.7) показал, что гетероскедастичность остатков отсутствует, так как p-value больше, чем 0,05, следовательно, нулевая гипотеза об отсутствии гетероскедастичности остатков модели не отвергается.
Также, в таблице в приложении 7 представлена проверка на мультиколлинеарность для построенного уравнения регрессии. Значения фактора инфляции вариации (centered VIF) для каждой переменной меньше 4, следовательно, мультиколлинеарность в модели отсутствует.
Для второго кластера - регионов с высоким природно-ресурсным потенциалом была также построена линеаризованная нелинейная модель методом пошагового исключения переменных. После реализации процедуры исключения переменных было оставлено 8 переменных, являющиеся статистически значимыми (на что указывает уровень значимости, не превышающий 0,05 (p-value <0,05)). В таблице 36 представлен конечный этап метода пошагового исключения переменных для линеаризованной нелинейной модели во втором кластере.
Таблица 36Конечный этап метода пошагового исключения переменных для линеаризованной нелинейной модели во втором кластере
Модель |
Нестандартизованные коэффициенты |
t |
Знч. |
|||
B |
Стд. Ошибка |
|||||
(Константа) |
7,663 |
4,572 |
1,676 |
0,017 |
||
x2 |
0,685 |
0,332 |
2,067 |
0,050 |
||
x3 |
0,888 |
0,204 |
4,346 |
0,000 |
||
x4 |
1,410 |
0,645 |
2,186 |
0,039 |
||
x9 |
0,733 |
0,234 |
3,127 |
0,005 |
||
x12 |
0,119 |
0,052 |
2,299 |
0,031 |
||
x13 |
0,198 |
0,084 |
2,358 |
0,027 |
||
x16 |
-0,437 |
0,132 |
-3,314 |
0,003 |
||
x17 |
-1,141 |
0,452 |
-2,522 |
0,019 |
Источник: расчеты автора
Полученное уравнение регрессии имеет следующий вид:
(t): (4,572) (0,332) (0,204) (0,645) (0,234) (0,052) (0,084) (0.132) (0,452)
Полученное уравнение регрессии говорит о том, что во втором кластере на приток инвестиций в основной капитал влияет ряд показателей, характеризующих регион с различных сторон. Помимо ВРП на душу населения(х3), сильное положительное влияние оказывают такие факторы, как удельный вес лиц с высшим образованием в численности занятых(х2), индекс промышленного производства(х4) и среднедушевые денежные доходы населения (х9). Помимо этого, в уравнении регрессии для второго кластера стали значимы такие переменный, как внутренние затраты на научные исследования и разработки (х12) и Затраты на технологические инновации в процентах от общего объема отгруженных товаров, выполненных работ, услуг(х13). Следовательно, для регионов, входящих во второй кластер, на инвестиционное решение влияет инновационный потенциал региона. Данный результат сильно отличается от выводов, полученных при построении уравнения регрессии без деления на кластеры.
В таблице 37 представлены характеристики точности уравнения регрессии для второго кластера - регионов с высоким природно-ресурсным потенциалом.
Таблица 37Характеристики точности линеаризованной нелинейной модели для второго кластера
R |
R-квадрат |
Скорректированный R-квадрат |
Стд. ошибка оценки |
|
0,917 |
0,840 |
0,785 |
0,28239 |
Источник: расчеты автора
Полученное значение свидетельствует о том, что 84% вариации зависимой переменной объясняется включением в модель восьми значимых регрессоров.
Все коэффициенты модели являются значимыми так как . Также, можно сказать, что полученная модель является значимой, так как p-value для F статистики меньше 0,05
Таблица 38Дисперсионный анализ линеаризованной нелинейной модели для второго кластера
Модель |
Сумма квадратов |
ст.св. |
Средний квадрат |
F |
Знч. |
|
Регрессия Остаток Всего |
9,664 |
8 |
1,208 |
15,148 |
0,000 |
|
1,834 |
23 |
0,080 |
||||
11,498 |
31 |
Источник: расчеты автора
Информационные критерии, позволяющие сравнить полученную модель с другими моделями, построенными в работе ранее, представлены в таблице 39.
Таблица 39Критерии качества модели для второго кластера
Критерий Акаике |
0,541 |
|
Критерий Шварца |
0,953 |
|
Критерий Хеннана - Куинна |
0,678 |
Источник: расчеты автора
Остатки полученной модели были проверены на принадлежность к нормальному закону распределения (таблица 40). Нулевая гипотеза проведенных тестов: распределение исследуемых данных является нормальным.
Таблица 40Тесты для проверки принадлежности остатков нелинейной линеаризованной модели для второго кластера к нормальному закону распределения
Тест |
Наблюдаемое значение |
p-value |
|
Lilliefors(D) |
0,11 |
> 0,1 |
|
Cramer-von Mises (W2) |
0,071 |
0,265 |
|
Watson (U2) |
0,064 |
0,289 |
|
Anderson-Darling (A2) |
0,453 |
0,255 |
Источник: расчеты автора
Четыре проведенные теста (Lilliefors(D), Cramer-von Mises (W2), Watson (U2), Anderson-Darling (A2)) показывают, что остатки модели принадлежат нормальному закону распределения на уровне значимости 0,05, так как p-value> 0,05.
LM тест показал, что автокорреляция остатков отсутствует (таблица прил.8), так как значение p-value больше, чем 0, 05, следовательно, нулевая гипотеза об отсутствии автокорреляции остатков модели на втором лаге не отвергается.
Тест Бройша-Пагана (таблица прил.8) показал, что гетероскедастичность остатков отсутствует, так как p-value больше, чем 0,05, следовательно, нулевая гипотеза об отсутствии гетероскедастичности остатков модели не отвергается.
Также, в таблице в приложении 8 представлена проверка на мультиколлинеарность для построенного уравнения регрессии. Значения фактора инфляции вариации (centered VIF) для каждой переменной меньше 4, следовательно, мультиколлинеарность в модели отсутствует.
Таким образом, уравнения регрессии, построенные для каждого кластера имеют высокую объясняющую способность и низкие значения информационных критериев и стандартной ошибки, поэтому для исследования притока инвестиций в основной капитал целесообразно разделить регионы России на кластеры и рассматривать инвестиционный климат в каждом кластере по-отдельности.
Выбор наилучшей модели, описывающей приток инвестиций в основной капитал
В результате проведения регрессионных анализов были выбраны наилучшие модели, описывающие поведение зависимой переменной - притока инвестиций в основной капитал на душу населения. Рассматривалось пять различных моделей: нелинейное уравнение регрессии для всей совокупности объектов с включением валового регионального продукта и без включения данного фактора, нелинейное уравнения регрессии с включением 4 главных компонент, а также нелинейные уравнения регрессии для каждого из двух кластеров - регионов с высоким уровнем социально-экономического развития и регионов с высоким природно-ресурсным потенциалом. В таблице 8 представлены основные характеристики качества построенных моделей. Уравнения регрессии, построенные с использованием всех факторов (не объединяя их в главные компоненты) имеют более высокую объясняющую способность и невысокие значения информационных критериев модели (критерий Шварца и критерий Акаике). Следовательно, нет необходимости объединять выбранные независимые переменные в главные компоненты. Самыми качественными являются нелинейные модели для двух кластеров, у данных моделей самая высокая объясняющая способность и низкие значения информационных критериев. следовательно, гипотеза о том, что существуют различия в факторах, влияющих на приток инвестиций в основной капитал, между классами регионов, подтвердилась.
Таблица 41Основные показатели качества построенных уравнений регрессии
Модель |
R^2 |
R^2adJ |
S |
Критерий Шварца |
Критерий Акаике |
Критерий Хеннана - Куинна |
|
Нелинейная модель с включением ВРП |
0,783 |
0,771 |
0,30725 |
0,536 |
0,682 |
0,595 |
|
Нелинейная модель без включения ВРП |
0,646 |
0,618 |
0,39697 |
1,071 |
1,275 |
1,153 |
|
Модель МГК (с включением 4 компонент) |
0,603 |
0,588 |
0,41256 |
1,114 |
1,231 |
1,195 |
|
Нелинейная модель для 1-го кластера |
0,819 |
0,811 |
0,2636 |
0,227 |
0,342 |
0,271 |
|
Нелинейная модель для 2-го кластера |
0,840 |
0,785 |
0,28239 |
0,541 |
0,953 |
0,678 |
Источник: расчеты автора
Временной анализ инвестиционной привлекательности регионов России
Для того, чтобы выявить факторы, влияющие на приток инвестиций в основной капитал в динамике, необходимо построить регрессионную модель с использованием панельных данных. В качестве зависимой переменной Y используется показатель инвестиций в основной капитал на душу населения по регионам России. Рассматриваемый временной промежуток - 4 года (с 2014 по 2017 гг.). Выбор короткого временного интервала объясняется тем, что в 2014 году была присоединена республика Крым и количество регионов увеличилось. Поэтому стоял выбор: удалить присоединенные регионы или использовать более короткий временной интервал. Было приято решение оставить все регионы и выявить факторы, влияющие на приток инвестиций в основной капитал после кризиса 2014 года.
В качестве независимых переменных отобраны 8 показателей, характеризующие социально-экономическую сферу регионов и предположительно влияющие на приток инвестиций в регион:
Х1 - Удельный вес численности населения в трудоспособном возрасте в общей численности населения (на конец года), %
Х2 - ВРП на душу населения в текущих основных ценах, руб.
Х3 - Индекс промышленного производства (в процентах к предыдущему году)
Х4 - Объем отгруженных товаров собственного производства, выполненных работ и услуг собственными силами (добыча полезных ископаемых) млн. руб.
Х5 - Среднедушевые денежные доходы (в месяц) руб.
Х6 - Плотность железнодорожных путей на конец года, км путей на 10000 км2 территории
Х7 - Внутренние затраты на научные исследования и разработки (млн. руб.)
Х8 - Удельный вес прибыльных организаций в общем числе организаций, %
Денежные показатели были переведены в базовые цены 2014 года, с учетом уровня инфляции в России за каждый из рассматриваемых временных промежутков.
На предварительном этапе анализа из исследования были исключены такие регионы, как Ненецкий автономный округ и Ямало-Ненецкий автономный округ, так как данные по инвестициям в основной капитал на душу населения для этих регионов являются выбросами для каждого исследуемого года.
Таким образом, было построено нелинейное линеаризованное уравнение регрессии методом пошагового исключения переменных. Незначимыми оказались такие факторы, как индекс промышленного производства, среднедушевые денежные доходы, инфраструктура региона (плотность железнодорожных путей) и удельный вес прибыльных организаций. Конечная модель представлена в таблице 42.
Таблица 42Конечный этап метода пошагового исключения переменных для линеаризованной нелинейной модели на панельных данных
Модель |
B |
Стд. Ошибка |
t |
Знчимость |
|
(Константа) |
9,236 |
1,910 |
4,836 |
0,0004 |
|
х1 |
1,863 |
0,521 |
3,579 |
0,0000 |
|
х2 |
1,048 |
0,031 |
34,246 |
0,0001 |
|
х7 |
0,037 |
0,009 |
4,045 |
0,0000 |
Источник: расчеты автора
Полученное уравнение регрессии имеет следующий вид:
(t): (4,836) (3,579) (34,246) (4,045)
Полученное уравнение регрессии говорит о том, что на приток инвестиций в основной капитал в динамике влияет ряд показателей, характеризующих регион с различных сторон. Помимо ВРП на душу населения(х3), сильное положительное влияние оказывает такой фактор, как удельный вес численности населения в трудоспособном возрасте (х1). Следовательно, на решение инвестора влияет наличие трудового потенциала в регионе. Результат, полученный при анализе притока инвестиций в динамике отличается от предыдущих результатов (для уравнений регрессии, построенных по данным 2017 года). Помимо ВРП, значимым фактором стал человеческий потенциал, поэтому можно сделать вывод, что гипотеза о том, что на инвестиционную привлекательность региона в динамике оказывают влияние другие факторы, незначимые для моделей для данных 2017 года, подтвердилась.
В таблице 43 представлены характеристики точности и информационные критерии уравнения регрессии на панельных данных.
Таблица 43Характеристики точности линеаризованной нелинейной модели для панельных данных