Анализ торговых потоков на рынке сельского хозяйства
История сетевого анализа. Анализ многоуровневой сети для мировых торговых потоков сельскохозяйственной продукции. Построение регрессионной модели для интенсивности и объема торговых потоков. Сравнение слоев с использованием специальных параметров.
Рубрика | Экономика и экономическая теория |
Вид | дипломная работа |
Язык | русский |
Дата добавления | 14.07.2020 |
Размер файла | 4,1 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.Allbest.Ru/
Размещено на http://www.Allbest.Ru/
Размещено на http://www.Allbest.Ru/
Федеральное государственное автономное образовательное учреждение высшего образования
Национальный исследовательский университет
«Высшая школа экономики»
Факультет экономики
Направление подготовки 38.03.01 «Экономика»
Основная профессиональная образовательная программа высшего образования - программа бакалавриата «Экономика»
Выпускная квалификационная работа - бакалаврская работа
Тема:
Анализ торговых потоков на рынке сельского хозяйства
Выполнила Горнова А.М.
Руководитель к.ф.-м.н.,
Доцент С.А. Лапинова
Нижний Новгород, 2020
Содержание
- Введение
- Глава 1. Теоретические аспекты исследования торговых потоков на рынке сельского хозяйства
- 1.1 История развития сетевого анализа
- 1.2 Обзор работ, посвященных исследованию торговых сетей
- 1.3 Основные понятия и метрики сетевого анализа
- 1.4 Методики проведения анализа многоуровневых сетей
- Глава 2. Анализ торговых потоков на мировом рынке сельского хозяйства
- 2.1 Построение и анализ многоуровневой сети для мировых торговых потоков сельскохозяйственной продукции
- 2.2 Сравнение слоев с использованием специальных параметров для анализа центральности вершин
- 2.3 Построение регрессионной модели для интенсивности торговых потоков
- 2.4 Построение регрессионной модели для объема торговых потоков41
- Заключение
- Список литературы
- Приложения
Введение
Аграрный сектор в России обладает высоким потенциалом. Наша страна имеет огромную территорию, которая вполне пригодна для сельскохозяйственных нужд. Дополнительным фактором, оказывающим положительное влияние, являются благоприятные климатические условия в южных регионах. Если мы приобретём лучшее понимание того, как складываются торговые отношения между странами на глобальном рынке сельскохозяйственной продукции, то сможем более эффективно и выгодно продавать там отечественные товары.
Понимая структуру торговых потоков на мировом сельскохозяйственном рынке, мы можем разработать оптимальные торговые стратегии, которые обеспечат хорошее функционирование национальной экономики и значительно снизят риски. Кроме того, важно определить, какие факторы оказывают наибольшее влияние на формирование стабильных торговых отношений. Исходя из всех вышеперечисленных фактов, необходимо рассмотреть глобальную сельскохозяйственную торговую сеть, так как эта тема достаточно актуальна для российской экономики.
В данной работе объектом исследования выступают анализ структур торговых потоков. Предметом является исследование внешней торговли продукцией сельского хозяйства.
Основной целью данного исследования является анализ торговых потоков на мировом сельскохозяйственном рынке.
Для достижения этой цели: необходимо решить ряд задач, а именно:
1. Проанализировать научную литературу, посвященную методам анализа мировой торговой сети;
2. Изучить предыдущие достижения исследователей в области анализа торговых сетей;
3. Построить и проанализировать многоуровневую мировую сеть торговли сельскохозяйственной продукцией;
4. Построить линейную регрессию для определения факторов, влияющих на интенсивность и объем торговых потоков сельскохозяйственной продукции.
Данное исследование ориентировано на изучение торговых потоков только на мировом сельскохозяйственном рынке, другие секторы торговли не рассматриваются. Период нашего анализа также был ограничен 11 годами: с 2007 по 2017 год.
В качестве программного обеспечения была использована программная среда R и пакеты igraph, dplyr, readxl, multynet, car, lmtest.
Теоретическая база курсовой работы представлена исследованиями зарубежных авторов, связанных с внешней торговлей сельскохозяйственной продукцией, сетевым анализом и его историей. В качестве информационной основы работы была использована база данных Food and Agricultural organization of United Nations, а также другие ресурсы сети Интернет.
Глава 1. Теоретические аспекты исследования торговых потоков на рынке сельского хозяйства
1.1 История развития сетевого анализа
Сетевой анализ впервые появился как подход в антропологии, социальной психологии и социологии. Он оказал влияние на теоретические и методологические разработки во многих других областях общественных наук. Первоначально исследователи применяли математические модели из теории графов для изучения структур социальных отношений. Вскоре они стали включать в свои исследования более широкий набор инструментов анализа: методы масштабирования, алгебраическую теорию множеств, а также стохастические и статистические методы. Таким образом, многие ученые внесли свой вклад в развитие сетевого анализа, что позволило ему стать широко используемым методом во всех областях научных исследований. Сетевой анализ широко используется в социологии, в том числе политической, экономической, изучении семьи и родства, исследованиях мировых систем, сообщества и многих других областях [1].
Сетевой анализ имеет относительно долгую историю, хотя он и не был известен под этим именем в течение очень долгого времени [31]. В первый раз слово «сеть» использовалось в социологическом контексте в работе антрополога Альфреда Рэдклиффа-Брауна [29], который использовал его, чтобы более формально сосредоточиться на структурном анализе. В то же время ряд психологов, работающих в области образования детей, начали создавать схемы социальных отношений, которые они постепенно формализовали как «социограммы». Их использовали, чтобы показать цепочки позитивных и негативных связей, которые они обнаружили среди детей в своих экспериментальных исследованиях.
Важнейшая социально-психологическая работа внесшая большой вклад в развитие сетевого метода принадлежит психотерапевту Якобу Морену [24]. В своем исследовании он рассматривал влияние отбора друзей школьниками на развитие их личностей. Его основным нововведением было использование социограмм для иллюстрации определенных закономерностей, которые он мог найти в небольших группах, таких как школьные классы. Он также дружил с психологом Куртом Левиным, с которым они обменивались идеями. Впоследствии их взгляды кардинально разошлись.
И Морено, и Левин использовали схематическое представление социальных отношений, но именно Морено разработал социограммы. Она состоит из вершин, представляющих индивидов, и линий между ними, обозначающих социальные отношения. Морено считал, что эти шаблоны точек и линий, которые впоследствии получили формальные названия «вершины» и «ребра», могут быть описаны как «социальные конфигурации», в которых можно указать такие вещи, как направление дружеских связей и их интенсивность.
Эта работа получила название «социометрия», после чего в 1937 году был основан журнал с таким же названием. Благодаря работам, опубликованным в этом журнале, идеи Левина и Морено об организации социальных отношений в малых группах постепенно привели к появлению более математически ориентированного подхода под названием «групповая динамика». При таком подходе начали использоваться идеи теории графов, впервые сформулированные в работах Рене Кенига [21].
С конца 40-х годов они стали базой для более формального изучения характеристик социальных сетей, созданных для небольших групп. Представление социограммы в виде графика позволило идентифицировать бинарные, триадные и более сложные структуры, а также проанализировать состояние «дисбаланса» и «равновесия» в сети.
В 30-40-е годы антропологические и социологические исследования начали развиваться в этом направлении. Так называемые «исследования Хоторна», авторами которых были Ллойд Уорнер и Элтон Мейо стали важным этапом развития социальных исследований - не в последнюю очередь из-за их важности в усовершенствовании идеи социальных сетей.
«Исследования Хоторна» [30] начались с изучения взаимосвязи физических условий труда и качества работы сотрудников. В первоначальных экспериментах рассматривались такие вещи, как влияние изменений уровня обогрева и освещения в комнате, а также обеспечение перерывов во время работы. Исследование перешло от физических к социальным факторам, и Мейо, заметил, что решающим фактором повышения эффективности труда оказалось участие работников в самом эксперименте. Ученые отметили постепенное построение форм социальной солидарности между участниками экспериментальной группы и неформальных рабочих групповых отношений. Эти неформальные отношения шли рука об руку с формальными отношениями, и исследователи использовали социограммы для того, чтобы отразить возникновение неформальных социальных сетей среди работников. Социограммы, составленные учеными Хоторна, позволили им идентифицировать большие группы, которые получили названия «клик», «толпа» и «круг».
В конце 1940-х и начале 1950-х годов началось создание единой системы анализа социальных сетей, которая была окончательно создана десятилетиями позже. Коллега Уорнера и Мейо из Гарварда - Джордж Хоманс - пытался объединить социологические и антропологические идеи. Он использовал методы перестановки элементарных матриц, целью которых было более точно определить структуру «клики». Инновационным шагом к более формальным методам блочного моделирования, разработанным в 1970-х годах [19], стал метод ручного «смешивания» нулей и единиц в матрице для извлечения блоков высокой и низкой плотности, который разработал Хоманс.
В первой половине 1950-х годов в Великобритании проводились более систематические исследования социальных сетей. Антропологом Максом Глюкманом был основан Институт Родс-Ливингстон в Замбии для изучения структуры социальных сетей в городах и деревнях Африки. Первым сотрудником института был Джон Барнс. Он защищал изучение целых сообществ, как сеть, представляющую собой точки, соединенные линиями [2]. Элизабет Ботт использовала его находки в своих собственных исследованиях сети родства между лондонскими семьями. На основе ее трудов Надель [25] пытался создать математическую базу для изучения социальных сетей, но окончанию его трудов помешала его ранняя смерть. Однако Митчелл [23] продолжил и развил его работу. Ему удалось ввести несколько концептуальных нововведений - достижимость, мультиплексирование, плотность, направление, долговечность и т. д.
В 1969 году был создан четкий набор идей сетевого анализа, основанных на теории графов. Но нужно сказать, что в Соединенных Штатах Америки в тот же временной период начал развиваться альтернативный подход. Франсуа Лоррен , Харрисон Уайт и Джон Бойд начали анализировать структуры родства, прибегая к алгебраической теории множеств, в то время как Джоэль Левин и Эдвард Лауманн начали использовать многомерное масштабирование для изучения социальной структуры.
Возможность применения таких передовых математических методов в сетевом анализе стала возможной исключительно благодаря развитию компьютерных технологий. Появление компьютеров и первого языка программирования - Фортран - позволило использовать более сложные математические теории и анализировать огромные наборы данных. Вскоре была создана Международная сеть анализа социальных сетей, которая послужила базой для создания журнала Social Networks. Стэнли Вассерман разработал один из лучших учебников по методам сетевого анализа [34]. В 1990-х годах сетевой анализ приобрел статус одного из наиболее популярных исследовательских направлений в области социологии, располагающих передовыми методами и сильной интеллектуальной базой.
1.2 Обзор работ, посвященных исследованию торговых сетей
Использование теории сложных сетей стало обычным явлением в последних научных работах в различных областях науки. Основная причина их популярности заключается в том, что данный подход обеспечивает наиболее точное определение структурных связей в реальных сетях [11]. Этот метод использовался различными исследователями для выявления ключевых структурных характеристик социальных сетей, финансовых сетей, энергетических и экологических сетей, сети выбросов углерода и др.
Последние работы по анализу торговых сетей можно разделить на две большие группы. Первая содержит статьи, посвященные так называемой Международной торговой сети (ITN) или Всемирной торговой сети (WTW), где узлами являются страны, а границы между двумя странами представлены взаимными торговыми потоками.
Одно из направлений, рассматриваемых в традиционных эмпирических исследованиях по международной торговле, использует сетевые метрики для изучения характеристик мировой торговли. Фаджиоло [14], Бхатачария [5] и другие показывают, что WTW, рассматриваемая как взвешенная сеть, отображает статистические характеристики, которые очень отличаются от тех, которые получены с использованием традиционного бинарно-сетевого подхода. Это более подробно раскрыто в статье Де Бенедиктиса и Тайоли [8], которая изучает эволюцию бинарного WTW с течением времени. Они обнаруживают рост торговой интеграции на мировом уровне, но с высоким уровнем неоднородности между странами, и значительную роль торговой политики в формировании сети. К аналогичным результатам пришли и Де Бенедиктис и др. [7]. Они описали топологию WTW в ее бинарной и взвешенной версиях, рассчитав и проанализировав несколько сетевых статистических метрик.
Подводя итог, можно сказать, что в существующих работах были описаны некоторые общие черты торговой системы: централизация и неоднородное распределение связей, которые приводят к образованию иерархических структур, где большинство стран с высокой центральностью часто являются развитыми экономиками или быстро развивающимися экономиками, такими как Китай. Другие недавние материалы подчеркивают сильный профиль торговых отношений "ядро/периферия" [9].
Кроме того, существует еще одна область исследований, где основной темой являются структуры сообществ, образованных в рамках Международной торговой сети. Тзекина и др. [33] в своей работе определили структуру и поведение сети через пороговые значения и во времени. В частности, они сосредоточили свое внимание на эволюции торговых "островов" в мировой торговой сети, в которой страны связаны направленными ребрами, взвешенными по доле общего объема долларов, пересылаемых из одной страны в другую. Авторы нашли противоречивые свидетельства в пользу глобализации.
В отличие от предыдущего исследования, Пикарди и Тайоли [28] в своей работе поддерживают точку зрения о существенном воздействии глобализации на торговую систему. Как показывают исследования, нет никаких свидетельств значительных разделов в WTW. В результате анализа выявляется несколько слабых сообществ, но они не представляют изолированные группы стран, поскольку межобщинные связи также сильны. Хе и Дим [18] в своем исследовании приводят дополнительные доказательства этого вывода и обнаруживают, что глобализация оказывает негативное воздействие на торговую сеть: она восстанавливается после рецессионных потрясений медленнее, чем 40 лет назад.
Другие эмпирические исследования в области международной торговли сосредоточены главным образом на объяснении структуры торговли между группами стран различными факторами, такими как уровень технологического развития, ВВП, участие в преференциальных торговых соглашениях или географическое положение и т.д. Итон и Кортум [12] в своей статье используют модель торговли Рикардо для изучения различных вопросов, таких как выгоды от торговли, роль торговли в распространении преимуществ новой технологии и последствия снижения тарифов. Эвенетт и Келлер [13] в своей работе исследуют, могут ли две важные теории торговли ?теория Хекшера?Оллина и теория возрастающей доходности - объяснить эмпирический успех так называемого уравнения гравитации. Вообще говоря, в обоих исследованиях выбор параметров обусловлен ожиданием того, что членство в каком-либо профсоюзе или географическая близость могли бы создать стимул для расширения торговли.
Отраслевые торговые сети являются основным объектом интереса второй группы исследований. Все методы и подходы, используемые для изучения всемирной торговой сети, также применимы для изучения отраслевой торговли. Существуют исследования, посвященные разным секторам, к примеру, торговли сырой нефтью [10], марганецем [32], минеральными ресурсами [35] и др. Как можно заметить, большинство статей посвящены рассмотрению торговли полезными ископаемыми. Литература, касающаяся сельскохозяйственной торговой сети, до сих пор была весьма скудной. В некоторых статьях изучаются торговые сети некоторых специфических продуктов агропромышленного комплекса, но в данной работе будет проведен анализ мировой сельскохозяйственной торговой сети.
1.3 Основные понятия и метрики сетевого анализа
Располагая знанием о структуре сети, можно рассчитать множество полезных показателей, отражающих ее свойства и облегчающих анализ ее характеристик.
Концепция центральности была предметом многих исследований в области сетей. Данный показатель характеризует влияние и важность определенного узла в сети. Существует довольно большое количество способов вычисления и определений центральности сетей.
Наиболее простой мерой центральности в сети является просто степень вершины, то есть количество ребер, которые входят или выходят из нее. В научной литературе ее иногда называют степенью центральности сети, чтобы подчеркнуть ее использование в качестве меры центральности. В ориентированных сетях вершины помимо обычной степени вычисляют также «outdegree» - количество ребер, выходящих из вершины, и «indegree» - число входных ребер.
Центральность собственного вектора является ожидаемым продолжением идеи простой степени центральности. Центральность степени можно рассматривать как назначение одного «балла централизации» за каждого соседа по сети, с которым связана вершина. Но все дело в том, что соседи не равнозначны. Определённо, соседи имеющую более высокую степень центральности, будут ценнее, чем те, у кого она ниже, поэтому необходимо это учитывать. Понятие центральности собственного вектора таково, что вместо того, чтобы назначать только одну точку вершине для каждого соседа, каждой вершине присваивается балл, пропорциональный сумме баллов вершин, соединенных с ней. На теоретическом уровне данный расклад может быть использован для направленных сетей, но существует проблема с точками, которые имеют исключительно выходные потоки. В таком случае центральность собственного вектора будет равняться нулю.
В случае, если сеть направленная, более уместно использовать алгоритм, разработанный Кляйнбергом называющийся HITS [20]. Неправильно предоставлять высокий показатель централиьности, только если соседи с высокой степенью центральности указывают на вершину. Более справедливо также учитывать высокую центральность вершины, которая указывает на соседей с высокой степенью центральности. Подводя итог, можно сказать, что в направленных сетях есть два типа важных узлов: авторитеты - это вершины, содержащие полезную информацию по интересующей нас теме; хаб - это вершины, через которые можно установить связь с лучшими авторитетами. Конечно, хабы и авторитеты существуют только в направленных сетях, потому что в неориентированном случае нет разницы между направлениями связей между вершинами. Таким образом в направленных сетях вершина представляется в двух ролях: хаба и авторитета. В каждой роли она имеет свой уровень центральности.
Характерной особенностью узла с высоким уровнем центральности авторитета является то, что на него ссылаются многие хабы, то есть многие другие узлы с высокой центральностью хаба. И характерной особенностью узла с высокой центральностью хаба является то, что он указывает на многие узлы с высоким уровнем центральности авторитета.
Центральность по посредничеству выступает совершенно другим концептуальным подходом к измерению центральности узла в сети [17].
Допустим, у нас есть сеть, в которой что-нибудь перебегает от узла к узлу по краям. К примеру, в социальной сети в этой роли могут выступать информация, анонсы, сообщения, или же слухи, передаваемые от 1-го человека другому. В интернете у нас есть пакеты данных, передвигающиеся кругом. Давайте в начале создадим необходимую предпосылку, что каждая пара узлов, соединенная ребром, в сети обменивается сообщением с равной вероятностью в единицу времени, и собственно, что сообщения всякий раз избирают геодезическую или же самую краткую дорогу, подобранную случайным образом, в случае если их более одного в сети. Вслед за этим давайте зададим насущный вопрос: в случае если мы станем дожидаться довольно длительное время, пока же меж всякой парой вершин не протечет большое количество информации, насколько большое количество извещений, в среднем, протекут сквозь любой узел на пути к точке назначения? Ответ на данный вопрос заключается в том, что, так как сообщения протекают по любому геодезическому пути с равной скоростью, среднее количество, проходящее сквозь любой узел, элементарно пропорционально численности геодезических путей, на коих лежит данный узел. Данное число и является тем, что принято называть центральностью по посредничеству.
Узлы, обладающие высокой центральностью этого типа, могут оказывать значительное влияние на сеть из-за их контроля над передачей информации. Этими вершинами в нашем сценарии обмена сообщениями являются те, сквозь которые проходят наибольшее количество информации. Если предположить, что эти узлы обладают правом читать передаваемые сообщения и получают плату за передачу посланий, они могут значительно выиграть от своего выгодного положения в сети. Узлы с самым высоким значением центральности по посредничеству будут теми, чье удаление из сети принесет наиболее ощутимый вред структуре связей в графе, так как они лежат на самом большом числе путей, через которые проходят сообщения. Несомненно, в реальной жизни не все акторы обмениваются сообщениями с одинаковой периодичностью, и в большинстве случаев сообщение не идет геодезическим путем. Несмотря на это, центральность по посредничеству все еще может служить ориентиром для определения влияния той или иной вершины на обмен информацией между участниками в графе.
Почти все сети возможно поделить на подгруппы. Таким образом, исследователи выделяют некоторое количество несложных определений подгрупп в сети. Одним из их считается клика. Клика - это максимальное подмножество вершин в неориентированном графе, такое что каждый член группы соединен ребром с любым другим. «Максимальное» в данном случае значит, что в сети нет иного узла, который возможно было бы прибавить в подгруппу, не нарушив условие о том, что любой узел в группе связан с любым другим. Таким образом, комплект из 4 вершин в сети определяется как клика, в случае, когда (и только тогда) любая из 4х точек объединена ребрами с остальными 3-мя напрямую, и в случае если в сети нет иного узла, который возможно было бы присоединить для образования группы из 5 вершин, где все объединены ребрами друг с другом. Также стоит учитывать, что клики могут пересекаться между собой. То есть, они могут иметь несколько одинаковых вершин.
Можно заметить, что условие о том, чтобы каждое возможное ребро присутствовало в клике, является довольно строгим, поэтому можно его немного ослабить. Понятие k-plex как раз подразумевает под собой те самые ослабленные условия клики. Если говорить об этом подробнее, то k-plex размера n - это максимальное подмножество n вершин в сети, так что каждая вершина соединена по крайней мере с n - k другими. При условии, что k = 1, мы получаем традиционное определение клики. Если k = 2, то каждый узел в подгруппе должен быть соединен со всеми другими или же со всеми кроме одного.
Также существует иное понятие связанное с идеей k-plex - это k-core. K- core - это максимальное подмножество вершин, такое, что каждая из них связана по крайней мере с k другими в подмножестве. Совершенно понятно, что (n - k) - plex также является k- core из n вершин. Однако набор всех k- core для данного значения k не совпадает с набором всех k- plex для любого значения k. Это происходит из-за того, что размер группы n может варьироваться от одного k- core к другому. Помимо этого, в отличие от клик и k- plex, k- core не могут пересекаться между собой. Данное утвержление можно объяснить, тем что в случае если два k- core совместно используют одну или несколько вершин, то они просто будут образовывать одно большее k- core по их определению.
Еще одним видом подгрупп в сети является компонент. В ненаправленной сети под ней понимают максимальное подмножество вершин, такое, что каждая из них достижима по некоторому пути от каждой из других. Полезным обобщением этой концепции является k-компонент. K-компонент - это максимальное подмножество вершин, такое, что каждая из них достижима из каждой из других по крайней мере k независимыми путями. В частных случаях при k = 2 компонента носит название бикомпоненты, а при k = 3 трикомпоненты.
1-компонент по этому определению является просто обычным компонентом - между каждой парой вершин имеется по крайней мере один путь, а k-компоненты для k ? 2 вложены друг в друга. К примеру, 2-компонентный или двухкомпонентный обязательно является подмножеством 1-компонентного, поскольку любая пара вершин, которые связаны по меньшей мере двумя путями, также связана по меньшей мере одним путем. Точно так же трикомпонент обязательно является подмножеством бикомпонента и так далее.
Свойство, очень важное в сетях - это транзитивность. В математике, если a = b и b = c, то из этого следует, что a = c, поэтому «=» является транзитивным отношением. В сети существуют различные отношения между парами вершин, самая простая из которых «соединена ребром». Если бы отношение «соединено ребром» было транзитивным, это означало бы, что если вершина u соединена с вершиной v, а v подключен к c, то и также подключен к c. Проще говоря, «друг моего друга - это тоже мой друг». Это определение транзитивности сети может применяться как к направленным, так и к ненаправленным сетям.
Мы можем количественно определить уровень транзитивности в сети следующим образом. Если u знает v, а v знает w, то у нас есть путь uvw из двух ребер в сети. Если вы также знаете w, мы говорим, что путь замкнут - он образует петлю длины три или треугольник в сети. В социальной сети жаргон, u, v и w называется uvw, образуя замкнутую триаду. Мы определяем коэффициент кластеризации как долю закрытых треугольников (триад, где наблюдаются все три связи) по отношению к общему количеству открытых и закрытых треугольников (триад, где наблюдаются либо две, либо все три связи).
Среди всех основных характеристик сети плотность является одной из наиболее важных и при этом одной из самых простых показателей с точки зрения интерпретации. Плотность - доля имеющихся связей по отношению к максимально возможному количеству связей. Таким образом, плотность является отношением, которое может колебаться от 0 до 1. Чем ближе плотность к 1, тем выше взаимосвязанность сети.
1.4 Методики проведения анализа многоуровневых сетей
Многоуровневая сеть - это сеть, в которой множество элементарных единиц связано внутрислойными и межслойными связями (“ребрами”) [27]. Эта структура является обобщением однослойных сетей, где существуют только внутрислойные связи. Эти слои представляют собой неоднородность в структуре или маркировке данных; уровень в сети может соответствовать типу соединения или дискретному шагу времени. Межуровневая структура представляет собой связи между узлами в различных слоях; эта структура может наблюдаться, предполагаться или оцениваться в зависимости от типа используемых данных. Межслойная структура в социальной сети часто согласовывается с метками каждого узла, так что каждый узел в одном слое соединяется со своими аналогами в других слоях. Если слои представляют временные интервалы, то каждая сущность может быть связана со своим двойником в слоях до и после текущего слоя, который представляет локализацию характеристик этого слоя во времени.
Поскольку многоуровневая сетевая структура является более сложной, чем ее однослойный аналог, методы анализа одноуровневой сети были модифицированы. Более того также были разработаны новые методы специально для многоуровневого случая. В данной главе будет представлено их подробное описание.
Для анализа многоуровневой сети чаще всего используют различные методики для сравнения слоев. Обозначим матрицу свойств за P, где каждая строка представляет слой, мы можем сравнить два слоя тремя основными способами. Первый - суммировать каждую строку с помощью функции агрегирования f и сравнить f() с f(). Возможные агрегатные функции представлены в таблице 1. Например, если матрица свойств содержит степень узлов, мы можем сравнить среднее значение степени узлов по слоям: mean () и mean ().
Таблица 1
Список часто применяемых агрегатных функций для матриц свойств
Название |
Обозначение |
|
Среднее арифметическое |
mean() |
|
Стандартное отклонение |
sd() |
|
Коэффициент асимметрии |
skew() |
|
Коэффициент эксцесса |
kurt() |
|
Коэффициент энтропии |
entropy() |
|
Коэффициент вариации |
CV() |
|
Харке - Бера |
Jaque-Bera() |
Источник: [6]
Сравнение распределения значений в и является вторым способом сравнения слоев. Возможные методы сравнения представлены в таблице 2, где -относительная частота k-го значения вектора свойств в общем слое l. В качестве примера мы можем сравнить распределения степеней вершин на разных слоях и выяснить, что оба хорошо соответствуют степенному распределению с одним и тем же показателем.
Таблица 2
Основные методы сравнения распределения свойств сети по уровням
Название |
Формула |
|
Индекс расхождения |
||
Расстояние Кульбака - Лейблера |
||
Расхождение Дженсена - Шеннона |
||
Коэффициент Джеффри |
Источник: [6]
Основная особенность многоуровневых сетей состоит в том, что на каждом слое может присутствовать или отсутствовать одна и та же структура, имеющая различные характеристики. Например, узел может присутствовать на одном слое, но не в другом, или одна и та же вершина может иметь разные степени в зависимости от уровня, на котором она расположена. Таким образом, существует особенный набор измерений для сравнения слоев, опирающийся на сравнение интересующих структур, одной за другой. То есть третий способ заключается в сравнении с для всех s, где s - это номер вершины.
Возможны два основных случая. В матрицах свойств, указывающих на существование различных структур на разных слоях, мы имеем только два значения: 0 и 1. Будучи представленными в виде чисел, они являются всего лишь номинальными значениями, указывающими на то, что структура присутствует на слое. Для этих бинарных матриц можно использовать специальные методы, представленные в таблице 3, проверяющие степень перекрытия или, говоря другими словами, общее существование (или отсутствие) структур на разных слоях.
В таблице в написании формул использованы следующие обозначения:
· a - число элементов присутствующих на обоих слоях,
· b - число элементов, которые присутствуют на первом слое и отсутствуют на втором,
· c - число элементов, которые отсутствуют на первом слое и присутствуют на втором,
· d - число элементов отсутствующих на обоих слоях,
· m=a+b+c+d - длина строки матрицы свойств.
Таблица 3
Основные функции схожести для бинарных матриц свойств
Название |
Формула |
|
Рассел-Рао |
||
Жакард |
||
Кулчински |
||
Простой коэффициент соответствия |
||
Хамман |
Источник: [6]
Для числовых матриц, содержащих результаты вычисления тех или иных параметров, например, степеней узлов, более приемлемы другие методы: коэффициенты корреляции Пирсона и Спирмана, а также коэффициент Отиаи (косинусный коэффициент) [6]. В данном случае, вычисление корреляций - один из самых популярных способов [4]. Интересно отметить, что в литературе корреляции между слоями почти всегда вычислялись по степеням узлов, а также по коэффициентам кластеризации [3]. Однако корреляции фактически могут быть вычислены на любой матрице свойств.
Кроме того, корреляция Пирсона используется как мера соответствия числовых векторов, и в данном случае она может быть использована, когда обычные статистические допущения не полностью выполнены. Однако в случае сильно искаженных распределений или в случае многочисленных выбросов ранговая корреляция Спирмана является хорошим решением.
Исследование центральности, то есть оценка степени важности узлов для структуры сети, часто используется для выявления и ранжирования важных узлов в сложных сетях. Обычно используется ряд показателей центральности, таких как степень вершины, центральность собственного вектора, коэффициент кластеризации, близость, центральность по посредничеству, центральность хаба и авторитета, различающиеся тем, какой тип влияния следует подчеркнуть [26]. Например, степень вершины показывает общее число связей узла, в то время как центральность собственного вектора измеряет важность узла по важности его соседей. Большинство методов централизации непосредственно применимы только к однослойным сетям. Здесь мы обобщаем некоторые важные однослойные методы централизации на многослойные сети.
Степень вершины - это самый простой вид центральности, используемый при диагностике сети. Существует несколько способов определения данного показателя в многоуровневой сети. Простейший способ - использовать сетевую агрегацию, где два узла считаются смежными тогда и только тогда, когда число ребер, соединяющих их в многослойной сети, больше порогового значения [27]. Однако этот способ не хорош тем, что не в полной мере учитывает межслойный эффект.
В многослойной сети важно изучить как степень вершин распределена по различным слоям. Для этих целей рассчитывают показатель степени перекрытия, который может использоваться для идентификации хабов, узлов с высокой степенью в сети. Однако узел, являющийся хабом в одном слое, может иметь только несколько соединений на другом уровне сети.
В данном случае, более подходящим способом определить хабы в многослойной сети является вычисление мультиплексный коэффициент участия. Он может принимать значения от 0 до 1 и показывает насколько равномерно распределена степень вершины по слоям сети. Чем ближе он к единице, тем более равномерно распределена центральность.
Центральность собственного вектора описывает влияние узла на глобальную структуру сети и определяется доминирующим собственным вектором матрицы смежности графа. Центральность собственных векторов широко используется во многих исследованиях. Например, он тесно связан с концентрацией хаба и авторитетности, используемыми в алгоритме поиска по гиперссылкам (HITS) [20]. Поскольку вычисление собственного вектора может быть вычислено в распределенном окружении, центральность собственного вектора часто предпочтительнее, чем другие типы, такие как центральность по посредничеству. Наиболее простым способом обобщения понятия центральности собственного вектора для многослойных сетей является использование агрегации сетей и применение однослойных методов.
Обнаружение сообществ в сложных сетях, является широкой областью исследований [16]. Эти сообщества обычно описываются как подмножество узлов в графе, которые связаны более плотно, чем другие узлы в сети. В социологии это иногда называют гомофилией [22]. Обнаружение этих сообществ в однослойной сети было и продолжает оставаться активной областью исследований. Кроме того, в последнее десятилетие все большее распространение получили исследования по выявлению сообществ для более общего многослойного случая. Обнаружение сообществ в социальных сетях облегчает интерпретацию общей структуры сети. Как правило, мы ожидаем увидеть сообщества в социальных сетях, которые сильно связывают различных агентов друг с другом, например, общие действия, интересы или членство в организациях.
Понятие сообществ становится более сложным, когда вводится несколько слоев; сообщества, которые развиваются на одном уровне сети, могут отсутствовать в другом или могут быть объединены более крупным, более распространенным суперобществом. Также возможно, что структура сообщества в каждом слое проявляет различные гомофильные кластеры, которые не коррелируют между слоями. В некоторых случаях основной целью анализа может быть использование нескольких слоев для поиска сообществ, которые могут быть неочевидны в однослойном срезе сети. В других случаях нас могут заинтересовать сходства и различия в структуре сообщества для каждого слоя, что требует различных подходов. Обнаружение сообществ в временных сетях заслуживает своего особого рассмотрения.
Существуют три основных метода обнаружения многослойных сообществ: метод, основанный на баллах; метод, основанный на моделях; метод агрегирования. Основная цель методов агрегирования - найти общую структуру сообщества путем объединения каждого среза многослойного графа в однослойную сеть. Методы, основанные на оценивании, построены на максимизации функции приспособляемости на основе соответствующей нулевой модели для обнаружения сообществ. Наконец, методы, основанные на моделях, опираются на статистические модели и формальные выводы для обнаружения скрытой структуры. Эти три типа методов не обязательно отделены друг от друга; например, многие в сообществе статистики изучают модели, которые очень похожи на нулевые модели, используемые в оценочных методах.
Глава 2. Анализ торговых потоков на мировом рынке сельского хозяйства
2.1 Построение и анализ многоуровневой сети для мировых торговых потоков сельскохозяйственной продукции
Для построения многоуровневого графа были взяты данные с сайта Food and Agriculture Organization of the United Nations [15]. Данная организация собирает, обрабатывает и распространяет данные о сельскохозяйственной продукции и продовольствии в соответствии со стандартами методологии статистики международной торговли товарами.
Источниками информации в основном служат СОООН, Евростат и другие национальные органы, если существует необходимость. Исходные данные проходят проверку на наличие выбросов. Также стоит отметить, что для стран, не предоставляющих отчетность используются данные полученные от торгового партнера, а информация о продовольственной помощи добавляются для учета общих трансграничных торговых потоков.
Торговая база данных включает количественные и денежные показатели экспорта и импорта, а также все продовольственные и сельскохозяйственные товары, импортируемые / экспортируемые ежегодно всеми странами мира. Со списком стран и перечнем включенных товаров с кодами гармонической системы можно ознакомиться в приложениях 1 и 2 соответственно.
Для целей данного исследования были взяты данные об экспортных потоках в 1000$ по всем странам и товарным категориям за 11 лет: с 2007 по 2017 года. Чтобы получить общий торговый поток по сельскому хозяйству были просуммированы торговые потоки по всем категориям товаров.
В полученной многоуровневой сети построены 11 слоев, каждый из которых представляет из себя определенный год. Для первичного анализа необходимо ознакомиться с базовой статистикой для каждого слоя и в целом по сети, представленной в таблице 4, где N - количество вершин, M - количество ребер, NC - число компонент связности, DENS - плотность, CC- коэффициент кластеризации, APL- средняя длина пути, DIA - диаметр сети.
Таблица 4
Основные статистические показатели сети
layer |
n |
m |
nc |
dens |
cc |
apl |
dia |
|
2007 |
213 |
13 495 |
1 |
0,30 |
0,64 |
1,54 |
3 |
|
2008 |
214 |
13 245 |
1 |
0,29 |
0,64 |
1,53 |
3 |
|
2009 |
215 |
13 629 |
1 |
0,30 |
0,65 |
1,52 |
3 |
|
2010 |
213 |
13 689 |
1 |
0,30 |
0,66 |
1,51 |
3 |
|
2011 |
213 |
13 545 |
1 |
0,30 |
0,65 |
1,49 |
3 |
|
2012 |
214 |
13 981 |
1 |
0,31 |
0,66 |
1,51 |
4 |
|
2013 |
214 |
14 430 |
1 |
0,32 |
0,66 |
1,50 |
3 |
|
2014 |
228 |
16 794 |
1 |
0,32 |
0,68 |
1,58 |
3 |
|
2015 |
228 |
16 998 |
1 |
0,33 |
0,68 |
1,57 |
3 |
|
2016 |
228 |
17 077 |
1 |
0,33 |
0,68 |
1,57 |
3 |
|
2017 |
228 |
17 213 |
1 |
0,33 |
0,69 |
1,57 |
4 |
|
flat |
231 |
164 096 |
1 |
3,09 |
0,77 |
1,42 |
3 |
Источник: составлено автором на основе данных FAOSTAT
Как можно заметить на рисунке 1 за весь исследуемый период выросло число участников. Так, в среднем за 11 лет оно увеличилось на 7%, с 213 до 228. После значительного скачка в 2014 году, количество стран, участвующих в торговле сельскохозяйственной продукцией стабилизировалось на уровне 228. При этом число уникальных стран в общей сети составило 231, значит некоторые из стран со временем выбыли из торговли сельскохозяйственной продукцией. Аналогичный тренд наблюдается и у числа связей между ними. В 2014 году произошел сильный рост числа торговых потоков с 14 до 16 тысяч связей, то есть их количество возросло на 16% за один год. При этом оно продолжило свой рост и достигло 17,2 тысяч связей в 2017 году.
Рисунок 1. Динамика количества стран, участвующих в торговле сельскохозяйственной продукцией, и связей между ними
Источник: составлено автором на основе данных FAOSTAT
Теперь обратим внимание на коэффициент кластеризации и среднюю длину пути, представленные на рисунке 2. Как можно заметить, до 2010 года оба показателя изменялись с одинаковым средним темпом прироста, однако если коэффициент кластеризации рос, а средняя длина пути падала. Затем в 2011 оба показателя резко упали. Возможно это связано с экономическим кризисом в Европе. После произошел перелом и начался стремительный рост обоих метрик, который продлился до 2014, когда коэффициент кластеризации продолжил расти, а средняя длина пути начала спадать. Эти тенденции свидетельствуют о том, что глобальная сеть торговли сельскохозяйственной продукцией с 2014 года приобретает черты «маленького мира», что повышает эффективность потоков аграрных товаров в мировой сети и подтверждает идею о глобализации торговли.
Данные выводы также подтверждает минимальное числа компонент в сети и низкое значение ее диаметра, равные 1 и 3 соответственно. То есть присутствует всего одна компонента, представляющая собой всю сеть целиком. Это означает, что каждая из вершин в графе достижима по некоторому пути до каждой из других. В то же время маленький диаметр сети, говорит о более быстром сообщении в ней.
Рисунок 2. Динамика коэффициента кластеризации и средней длины пути
Источник: составлено автором на основе данных FAOSTAT
Так можно отметить, что пусть коэффициент плотности и невелик, но наблюдается устойчивый рост. За 11 лет он вырос с 0,3 до 0,33, что говорит о постепенном повышении взаимосвязанности стран в торговой сети.
2.2 Сравнение слоев с использованием специальных параметров для анализа центральности вершин
Теперь перейдем к анализу схожести уровней мировой сельскохозяйственной торговой сети. Для этого используем способы, описанные в части 1.4 данной работы.
Для начала проанализируем изменения в центральности вершин. Для этого используем такие показатели как: средние значения, коэффициент энтропии, коэффициент вариации и статистика Харке-Бера, представленные в таблице 5. Рассчитаем каждый из них как для общей степени вершины, так и только для входящих и исходящих потоков.
Таблица 5
Динамика значений показателей, характеризующих степени вершин
Год |
Средняя степень вершины |
Энтропия |
Коэффициент вариации |
Статистика Харке-Бера |
||||||||
all |
in/out |
all |
in |
out |
all |
in |
out |
all |
in |
out |
||
2007 |
88,78 |
63,36 |
4,74 |
4,40 |
3,61 |
60% |
47% |
103% |
14,34 |
3,98 |
22,17 |
|
2008 |
87,96 |
61,89 |
4,77 |
4,40 |
3,48 |
61% |
46% |
108% |
15,22 |
3,69 |
24,10 |
|
2009 |
89,79 |
63,39 |
4,73 |
4,43 |
3,48 |
60% |
47% |
106% |
13,54 |
3,58 |
22,71 |
|
2010 |
91,35 |
64,27 |
4,70 |
4,39 |
3,46 |
59% |
46% |
105% |
12,84 |
3,88 |
22,27 |
|
2011 |
91,26 |
63,59 |
4,68 |
4,39 |
3,34 |
60% |
44% |
108% |
14,83 |
3,69 |
23,81 |
|
2012 |
93,00 |
65,33 |
4,80 |
4,42 |
3,46 |
59% |
45% |
105% |
13,68 |
4,56 |
22,63 |
|
2013 |
94,98 |
67,43 |
4,78 |
4,39 |
3,49 |
58% |
44% |
103% |
13,75 |
4,64 |
21,88 |
|
2014 |
97,31 |
73,66 |
4,80 |
4,67 |
4,08 |
59% |
54% |
90% |
9,49 |
4,88 |
18,67 |
|
2015 |
97,99 |
74,55 |
4,75 |
4,62 |
4,12 |
59% |
54% |
89% |
9,57 |
4,77 |
18,64 |
|
2016 |
97,67 |
74,90 |
4,83 |
4,61 |
4,09 |
60% |
55% |
89% |
9,99 |
5,84 |
18,39 |
|
2017 |
98,19 |
75,50 |
4,81 |
4,57 |
4,13 |
59% |
54% |
88% |
9,77 |
5,30 |
18,43 |
Источник: составлено автором на основе данных из FAOSTAT
Для начала проанализируем изменения в средних значениях центральности, представленных на рисунке 3. Можно сказать, что наблюдается устойчивый восходящий тренд. Это свидетельствует о том, что власть в сети со временем концентрируется в руках нескольких стран.
Рисунок 3. Динамика средних значений общей и in/out центральности вершин
Источник: составлено автором на основе данных FAOSTAT
Далее необходимо проанализировать изменения в показателе энтропии, представленные на рисунке 4. В целом, можно отметить, что для всех типов потоков энтропия степени вершин растет, что говорит о повышении неупорядоченности.
Рисунок 4. Динамика энтропии центральности вершин
Источник: составлено автором на основе данных FAOSTAT
Также необходимо рассмотреть коэффициент вариации, который показывает относительный разброс значений центральности. Он представлен на рисунке 5. Как можно заметить, у значение данного показателя для out-degree было больше 100% до 2014 года, когда оно упало до примерно 90%, что свидетельствует о возможном наличии скошенности и сильной асимметрии в ее распределении. Также высоки значения и у двух других видов центральности, что говорит о относительно большом разбросе исс...
Подобные документы
Теоретические аспекты формирования и использования денежных потоков, их сущность, управление, планирование. Факторный анализ коэффициента рентабельности, состава и структуры, сбалансированности, интенсивности и эффективности денежных потоков предприятия.
курсовая работа [356,2 K], добавлен 07.01.2012Организационно-методические аспекты учета и анализа. Анализ денежных потоков предприятия. Учет и анализ денежных потоков ОАО "Фриз". Оценка и разработка направлений по совершенствованию деятельности ОАО "Фриз". Анализ рентабельности.
дипломная работа [123,0 K], добавлен 28.07.2003Сущность, типы и классификация торговых посредников, их основные функции и разновидности, отличительные особенности и признаки. Факторы выбора торговых посредников в ООО "Кангор". Разработка мероприятий по совершенствованию работы торговых посредников.
курсовая работа [57,0 K], добавлен 02.12.2010Нормативные документы, регулирующие ценообразование и деятельность торговых объектов общественного питания. Модели и методы формирования продажной цены, особенности применения торговых надбавок. Калькулирование цен на продукцию собственного производства.
презентация [2,2 M], добавлен 04.10.2013Понятие денежных потоков, их виды и значение в обеспечении кругооборота капитала предприятия. Сущность организации денежных потоков и её основные этапы. Основные задачи организации и управления денежными потоками. Цели организации денежных потоков.
реферат [257,3 K], добавлен 14.01.2016Особенности учета экспортных операций в торговых организациях, специфика бухгалтерского учета. Синтетический учет расчетов с иностранными и российскими поставщиками, оформление первичных документов. Экономический анализ ВЭД в разработке бизнес-плана.
контрольная работа [21,8 K], добавлен 15.02.2010Теоретические основы проведения анализа ликвидности и платежеспособности предприятия. Рассмотрение метода денежных потоков для определения платежеспособности предприятия. Оценка платежеспособности предприятия на основе изучения потоков денежных средств.
реферат [28,1 K], добавлен 12.10.2011Группировка торговых точек по объему ежедневного дохода. Построение гистограммы, полигона, кумуляты. Дисперсия, среднее квадратическое отклонение, нижний и верхний квартили, коэффициент вариации. Динамика, точечный и интервальный прогноз доходов фирмы.
контрольная работа [596,2 K], добавлен 12.02.2011Основные направления деятельности продакшн-студии видеопроизводства "Vi-art": создание рекламных, презентационных, учебных и других видеоматериалов. Организационная структура компании. Управление производством и анализ движения финансовых потоков.
отчет по практике [258,5 K], добавлен 04.11.2015История создания международных правил толкования Инкотермс, назначение и причины принятия их новой редакции. Практические аспекты применения торговых терминов Инкотермс, их существенные в редакции 2000 и 2010. Проблемы применения и перспективы развития.
курсовая работа [41,9 K], добавлен 24.05.2015Экономические и финансовые основы деятельности торговых организаций. Виды правовых форм организаций. Определение хозяйственных товариществ и обществ. Анализ преимуществ и недостатков торговых организаций в форме хозяйственных товариществ и обществ.
курсовая работа [72,5 K], добавлен 29.10.2013Анализ состояния производственно-технической базы РУП "Агрокомбината "Ждановичи". Оптимизация материальных и финансовых потоков в организациях агросервиса, минимизация их издержек и повышение эффективности производства в макрологистической системе.
дипломная работа [592,4 K], добавлен 12.11.2010Кругооборот хозяйственных средств; сущность и виды денежных потоков предприятия, основы управления, методика их оценки и оптимизации. Анализ движения, этапы обращения и прогнозирование денежных средств; эффективность предпринимательской деятельности.
курсовая работа [47,9 K], добавлен 27.09.2011Планирование, состав и структура затрат торговых организаций. Влияние затрат на финансовый результат деятельности предприятия. Особенности принятия управленческих решений в управлении издержками организаций. Методы калькулирования и учета расходов.
контрольная работа [32,7 K], добавлен 02.03.2014Общая характеристика деятельности ОсОО "Нур Телеком", анализ его рентабельности (по основной отчетности), финансовой устойчивости и деловой активности. Методика прогнозирования и оценки рисков денежных потоков инвестиционного проекта ОсОО "Нур Телеком".
курсовая работа [33,0 K], добавлен 11.11.2010Экономическое содержание, классификация и значение рыночной цены. Формулы определения оптовой и розничной торговых надбавок. Описание составных элементов торговых наценок. Практический расчет свободной отпускной цены предприятия методом прямого счета.
контрольная работа [28,2 K], добавлен 27.11.2010Понятие, виды, источники доходов торговых предприятий. Организационно-экономическая характеристика предприятия ООО "Камелия". Расчет и планирование доходов предприятий торговли на предстоящий период. Пути увеличения доходов торговых предприятий.
курсовая работа [49,6 K], добавлен 29.06.2010Экономическая характеристика и анализ механизма организации денежных потоков СХОАО "Белореченское", рекомендации по их совершенствованию. Характеристика, принципы управления и методика планирования денежных потоков. Сущность финансового цикла предприятия.
курсовая работа [242,6 K], добавлен 10.03.2010Метод дисконтирования денежных потоков. Сущность, основные принципы, лежащие в основе метода. Основные этапы оценки предприятия методом ДДП. Ретроспективный анализ и расчет величины денежного потока. Определение ставки дисконта.
дипломная работа [63,9 K], добавлен 18.05.2007Обоснование экономической эффективности строительства торговых площадей и создания продовольственной торговой сети "Ромашка". Создание схемы финансирования и плана маркетинга предприятия. Изучение конкуренции на рынке сбыта и рисков в деятельности фирмы.
бизнес-план [96,7 K], добавлен 23.12.2011