Разработка алгоритма прогнозирования развития научных направлений

Разработке алгоритма, позволяющего однозначно оценить развитие научного направления на основании построения прогнозных значений. Экспертная оценка вклада научного коллектива в развитие направления. Математическая модель алгоритма прогнозирования.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 20.08.2018
Размер файла 449,0 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

УДК 519.81

разработка алгоритма прогнозирования развития научных направлений

Крюкова А.В., Бочкарёв П.В.

Национальный исследовательский ядерный университет «МИФИ» E-mail: kryukova.alina.vl@gmail.com, PVBochkarev@mephi.ru

Настоящая статья посвящена разработке алгоритма, позволяющего однозначно оценить развитие научного направления на основании построения прогнозных значений. Предложенный подход дает возможность членам попечительского совета и экспертам Фондов научных исследований и научных организаций однозначно оценить, стоит ли развивать выбранное научное направление. А это значит, что информационные системы, в которых будет использоваться данный алгоритм, позволят выявлять перспективных молодых ученых, тем самым увеличивая их число, а также позволят снизить количество ошибок при выборе перспективного направления. Работа поддержана грантом РФФИ № 15-07-08742.

Ключевые слова: научные направления, управление наукой, методы прогнозирования.

DEVELOPMENT OF FORECASTING ALGORITHM PROGRESS OF SCIENTIFIC DIRECTIONS

Kryukova A.V., Bochkaryov P.V.

This article is devoted to the development of the algorithm allow uniquely evaluating the development of scientific directions to use of the predicted values. The proposed approach enables to the Board of Trustees and members of the expert of scientific research and scientific organizations uniquely assess necessity of development the selected scientific direction. This means that information systems, which will be use the algorithm, could identify the promising young researchers, thus increasing their number, and decrease the number of errors in the selection of prospective directions. This work was supported by RFFI grant № 15-07-08742.

Keywords: scientific directions, management of science, methods forecasting.

Введение

Выбор эффективного решения в научной, конструкторской, управленческой, предпринимательской деятельности является актуальной задачей сегодня, которая требует тщательного анализа и оценки всех альтернативных вариантов. В задачах, когда приходится выбирать компромиссные решения, например, между ценой и качеством, ожидаемыми доходами и возможным риском, применяются многокритериальные методы.

Актуальность алгоритма заключается в том, что он позволит обрабатывать большой объем информации, используя различные критерии поиска. Один из вариантов использования алгоритма - это создание информационной системы, которая позволит оценивать динамику развития того или иного научного направления за последние 20-30 лет. Также формировать рекомендации относительно развития научных направлений в виде краткосрочного прогноза на ближайшие 2-3 года, используя критерии поиска.

Состояние проблемы

Для экспертной оценки вклада научного коллектива в развитие того или иного научного направления важным является разработка критериев оценки и сравнения между собой различных научных направлений. Под научным направлением будем понимать совокупность научных работ, объединенных общностью объекта и методов исследования, общностью тем и их взаимосвязанностью [1].

Научное направление проходит несколько этапов своего развития. В работах Г.А. Несветайлова предложена модель жизненного цикла, состоящая из следующих этапов: зарождение, рост, зрелость и насыщение с последующим распадом [3].

На этапе зарождения фиксируется небольшое количество научных публикаций в виде статей, препринтов или тезисов докладов.

На этапе роста количество публикаций резко растет, это, как правило, тезисы докладов, статьи, незначительное количество препринтов и патентов, начинают появляться авторефераты диссертаций.

Этап насыщения характеризуется уменьшением количества научных статей и авторефератов диссертаций, увеличением монографий и учебников. Именно на этом этапе происходит рождение нового научного направления.

Этапы зрелости и насыщения составляют экстенсивную фазу развития. Исследования во время этой фазы носят прикладной характер, в связи с чем резко возрастает число патентов.

В качестве примера развития научного направления рассмотрим представленные на рис. 2 количественные объемы публикаций (в тысячах единиц) по отраслям науки: ядерная физика (рис. 1а), география (рис. 1б).

а) ядерная физика

Размещено на http://www.allbest.ru/

б) география

Размещено на http://www.allbest.ru/

Рисунок 1. Объемы публикаций, индексированных в Web of Science с 1980 по 2015 гг.

Для отрасли науки ядерная физика мы наблюдаем фазу зрелости, переходящую в насыщение, отрасль география пережила насыщение и зарождение в своем составе нового, менее крупного научного направления, связанного с появлением геоинформационных систем.

В современной литературе, посвященной многокритериальным задачам, рассматривается большое число разнообразных методов ранжирования принятия решений для слабоструктурированных проблем: PROMETHEE, ELECTRE, QUALIFLEX, REGIME, ORESTE, ARGUS, EVAMIX, TACTIC и др. [4,5,6].

Рассмотрим подробнее метод PROMETHEE

Отличительной особенностью метода является установление отношений предпочтения между вариантами (предпочтения и безразличия) относительного веса каждого критерия [2].

Преимущества метода PROMETHEE: метод позволяет найти единственное решение, а также составить иерархический список альтернатив, имеет четкую и прозрачную методику отбора. Есть возможность оценки не только отдельных, но также и наборов альтернатив.

Недостатки метода PROMETHEE: наличие несравнимых альтернатив заставляет глубже изучить природу проблемы и возможно скорректировать входные данные, что в итоге может привести к выбору иного, возможно, ошибочного решения. Исходя из этого, для прогнозирования развития научного направления следует использовать иной подход.

Принимаемый подход

научный прогнозирование алгоритм оценка

Для решения проблемы был разработан алгоритм, основанный на анализе временного ряда.

В разработанном алгоритме используется регрессия, тренд, выделение нескольких периодов (циклов), так как временной ряд охватывает очень большой промежуток времени (более 30 лет), и динамичное время развития может длиться несколько лет, в то время как существование самого направления намного больше. Поэтому имеет место выделение нескольких циклов, длительность которых длится разное время, но последствия часто бывают схожими, что говорит о том, что достоверность построенного прогноза для такого временного ряда будет очень высока.

Перед составлением алгоритма был проведён опрос среди экспертов с целью выяснения того, в какой фазе будут находиться направления на основе визуального анализа. Далее был построен алгоритм, с помощью которого получены прогнозные значения.

Алгоритм представлен на рисунке 2.

Рисунок 2. Алгоритм вычисления прогнозных значений

Ниже рассмотрим математическую модель алгоритма прогнозирования

1. Определение количества лет, для которых надо построить прогноз

Первый год для прогноза связан с обновлением базы данных, содержащей в себе всю информацию о публикациях за прошедший год. Обычно базы данных научных систем актуализируются к осени. Поэтому, если текущий месяц - сентябрь или любой последующий месяц, то первым годом, для которого строится прогноз, принимается следующий год. Если более ранний месяц, то вычисляется сначала прогнозное значение для текущего года.

Затем выбирается научное направление, для которого необходимо сделать прогноз, например, по коду и классификатору. Обязательным условием является наличие данных о развитии данного направления в прошлом, т.к. на основании этих данных будет строиться прогноз.

2. Вычисление циклов

Вначале определяется объем выборки V. Далее выделяются циклы. В каждом цикл сохраняются значения, сгруппированные по определенным признакам, например, последовательно увеличивающиеся значения элементов или последовательно уменьшающиеся и т.д.

3. Вычисление индекса цикличности и среднего значения каждого цикла

Определяется количество получившихся циклов z. В каждом цикле определяется количество элементов. Затем вычисляется среднее значение элементов в цикле (1):

,

где m - номер цикла, v - объем выборки, l - количество элементов в выборке.

Определение индекса цикличности внутри цикла (2):

,

где j - год (с известным значением), A[j] - значение в выборке в выбранном году, SRI[m] - среднее значение элементов в выбранном цикле.

4. Вычисление тренда

Определение коэффициента тренда. Для линейного тренда коэффициенты тренда определяются по формулам (3) и (4):

??? = ?????[????] ? ??? ? ?? ? (3),

где ?????[????] - среднее значение элементов выборки, ?? ?- среднее количество лет

,

где x - координата года, y - координата значения в выбранном году.

Для каждого года вычисляется значение тренда (5):

Y_hot[j]=j*???+??? (5)

Вычисляется отклонение Q[t] фактических значений от значений тренда (6):

Вычисляется значение тренда для прогнозируемого года (7):

Y_hot[j]=T[i]*x+b (7),

где T[i] - прогнозируемый год.

Определяется цикл, равный или ближайший к циклу, в котором находится текущий год. Для этого внутри каждого цикла вычисляются коэффициенты наклона между значениями по координатам (8)

Затем сравнивается коэффициенты наклона текущего цикла с предыдущими коэффициентами наклона в циклах (9):

После этого выбирается цикл, в котором по результатам сравнений у последовательно идущих друг за другом коэффициентов наклона отклонения ????[????] были либо равны текущим, либо близкими.

5. Вычисление прогнозного значения

Значение тренда прогнозируемого года Y_hot[j] умножается на индекс цикличности схожего цикла развития IC[m,v].

Если есть еще один год, для которого надо вычислить прогноз, тогда берется выборка, в конец выборки ставится вычисленное прогнозное значение и повторяется все сначала.

Обсуждение полученного результата

В таблице 1 приведен пример расчета прогнозного значения на первый год. Для сравнения полученного значения с реальным, расчет сделан для года, значение тренда для которого известно.

Таблица 1. Расчет прогнозного значения на 2011 год

Х

У

Значение тренда

Откл.фак

т. зн.от реал.

Среднее по циклам

Индекс циклич ности

Коэф-ты наклона

Откл. 1

Год для

прогно за

Зн.тренда на

прогноз. год

Прогноз 2011

1980

1712

1670.19

1.025

1823.82

0.94

2011

12197.73

11574

1981

1935

1993.65

0.971

1.06

0.019

-0.462

1982

1340

2337.20

0.573

2921.84

0.46

-0.050

1.231

1983

3201

2677.63

1.195

1.10

0.155

-3.846

1984

3499

3039.09

1.151

1.20

0.025

-0.615

1985

3648

3343.60

1.091

1.25

0.012

-0.308

1986

3424

3648.59

0.939

4218.36

0.81

-0.019

0.462

1987

4541

4028.06

1.127

1.08

0.093

-2.308

1988

4690

4370.66

1.073

1.11

0.012

-0.308

1989

3871

4695.45

0.824

5025

0.77

-0.068

1.692

1990

5211

5036.54

1.035

1.04

0.112

-2.769

1991

5993

5397.38

1.110

1.19

0.065

-1.615

1992

5658

5721.56

0.989

5583.13

1.01

-0.028

0.692

1993

5546

6083.54

0.912

0.99

-0.009

0.231

1994

5546

6388.24

0.868

0.99

0.000

0.000

1995

6514

6729.80

0.968

7165.01

0.91

0.081

-2.000

1996

7816

7109.03

1.099

1.09

0.109

-2.692

1997

7258

7414.45

0.979

8002.48

0.91

-0.047

1.154

1998

7593

7756.81

0.979

0.95

0.028

-0.692

1999

9156

8097.62

1.131

1.14

0.130

-3.231

2000

8151

8422.65

0.968

8802.73

0.93

-0.084

2.077

2001

9454

8782.83

1.076

1.07

0.109

-2.692

2002

8114

9108.28

0.891

9205.96

0.88

-0.112

2.769

2003

9603

9449.18

1.016

1.04

0.124

-3.077

2004

9901

9791.60

1.011

1.08

0.025

-0.615

2005

9715

10134.62

0.959

10734.49

0.90

-0.016

0.385

2006

10236

10457.71

0.979

0.95

0.043

-1.077

2007

10459

10800.22

0.968

0.97

0.019

-0.462

2008

10868

11161.54

0.974

1.01

0.034

-0.846

2009

12395

11483.35

1.079

1.15

0.127

-3.154

2010

11911

11826.76

1.007

11910.67

1.00

-0.040

334

-670593

Коэф.тренда

Результаты: реальное значение - 12246, полученное прогнозное значение - 11574. Таким образом, точность полученного значения составляет 94,5 %.

В таблице 2 приведен пример расчета прогнозного значения на второй год. Для сравнения полученного значения с реальным, расчет сделан для года, значение тренда для которого известно. Таблица 2. Расчет прогнозного значения на 2012год

Х

У

Знтренда

Отклонение фактич от реал значений

Среднее по периодам

Индекс цикличности по периодам

Коэффициенты наклона

Год для прогноза

Значение тренда на след год

Прогноз 2012

1980

1712

1705.80

1.004

1823.82

0.94

2012 12458.58

14254.94

1981

1936

2025.87

0.955

1.06

0.019

1982

1340

2365.80

0.566

2921.84

0.46

-0.05

1983

3201

2702.65

1.184

1.1

0.155

1984

3499

3060.31

1.143

1.2

0.025

1985

3648

3361.62

1.085

1.25

0.012

1986

3424

3663.40

0.935

4218.36

0.81

-0.019

1987

4541

4038.88

1.124

1.08

0.093

1988

4690

4377.88

1.071

1.11

0.012

1989

3871

4699.25

0.824

5025

0.77

-0.068

1990

5211

5036.75

1.035

1.04

0.112

1991

5993

5393.80

1.111

1.19

0.065

1992

5658

5714.57

0.99

5583.13

1.01

-0.028

1993

5546

6072.74

0.913

0.99

-0.009

1994

5546

6374.24

0.87

0.99

0

1995

6514

6712.21

0.97

7165.01 0.91

0.081

1996

7816

7087.45

1.103

1.09

0.109

1997

7258

7389.65

0.982

8002.48

0.91

-0.047

1998

7593

7728.42

0.982

0.95

0.028

1999

9156

8065.64

1.135

1.14

0.130

2000

8151

8387.25

0.972

8802.73

0.93

-0.084

2001

9454

8743.64

1.08

1.07

0.109

2002

8114

9065.67

0.895

9205.96

0.88

-0.112

2003

9603

9402.98

1.021

1.04

0.124

2004

9901

9741.80

1.016

1.08

0.025

2005

9715

10081.22

0.964

10734.49

0.9

-0.016

2006

10236

10400.91

0.984

0.95

0.043

2007

10459

10739.82

0.974

0.97

0.0189

2008

10868

11097.33

0.979

1.01

0.034

2009

12395

11415.76

1.086

1.15

0.127

2010

11911

11755.55

1.013

11742.16

1

-0.04

2011

11574

12122.63

0.955

0.97

-0.028

Коэф.тренда 336 -663487

Результаты: реальное значение - 12655, полученное прогнозное значение - 14255. Таким образом, точность полученного значения составляет 87,3 %.

На рисунке 3 представлены график развития направления, данные которого представлены в таблице 1, с 1980 года до 2014, и график прогнозных значений для данного временного ряда с 2011 до 2017 года.

Рисунок 3. График развития направления

Здесь, синим сплошным цветом, выделены реальные значения временного ряда, оранжевым

- прогнозируемые значения, синим пунктиром - линейный тренд. Точность значений - не менее 85,6 %.

Заключение

Для реализации поставленной задачи был разработан алгоритм, основанный на анализе временного ряда. Также представлена его математическая модель. Для сравнения полученного значения с реальным сделан расчет для временных периодов, значение тренда для которых известно. Точность полученных значений составила не менее 85,6 %. Проведённое сравнение полученного результата с результатами опроса экспертов показало совпадение в 85 % случаев.

Таким образом, разработанный алгоритм позволит выявить перспективных молодых ученых, что будет способствовать развитию отечественной науки.

Список литературы

1. Бочкарёв П.В., Гусева А.И., Киреев В.С., Кузнецов И.А., Филиппов С.А. Модель научного направления на основе интеграции объектно-ориентированного, наукометрического и экспертного подходов// Фундаментальные исследования. ¬ - 2015. № 12, часть 6. - с. 1095-1102.

2. Кравченко Т. К., Авдеев Ю. В. Аналитическое обоснование инвестиционной привлекательности банков - М.: Аудит и финансовый анализ. 2012. № 3. - 140-144 с.

3. Несветайлов Г. А. Научные кадры: возраст и творчество // Социологические исследования. -- 1998. - № 9. -- С.115-119.

4. Резниченко В.А., Проскудина Г.Ю., Овдий О.М. Концептуальная модель научной публикации // Труды 14-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (RCDL-2012). URL: http://rcdl.ru/doc/2012/paper5.pdf (дата обращения: 23.11.2015).

5. Тенденции развития научных школ в современной России / Дежина И.Г., Киселева В.В. - М.: ИЭПП, 2009. - 164 с.: ил. - (Научные труды / Ин-т экономики переходного периода; № 124P)

6. Kahnemann D. Choice, values, and frames / D. Kahnemann, A. Tversky. - Cambridge: Cambridge University Press, 2000.

Размещено на Allbest.ru

...

Подобные документы

  • Создание программного обеспечения для реализации алгоритма, позволяющего находить кратчайшее расстояние от одной из вершин графа до всех остальных, при условии, что ребра графа не имеют отрицательного веса. Примеры выполнения алгоритма Дейкстра.

    курсовая работа [1,1 M], добавлен 11.01.2015

  • Формирование и зарождение научного понятия алгоритма и его трансформация в современное понимание интуитивного алгоритма: изложение традиционных теорий и их дальнейшее уточнение. Исследование логических теорий алгоритмов с философской точки зрения.

    книга [315,7 K], добавлен 10.12.2009

  • Основные свойства алгоритма. Формальный и неформальный исполнитель алгоритма, система его команд. Способы записи алгоритма. Словесное описание, построчная запись, опорный конспект. Характеристики алгоритмического языка. Выполнение алгоритма компьютером.

    презентация [2,0 M], добавлен 04.04.2014

  • Описание формальной модели алгоритма на основе рекурсивных функций. Разработка аналитической и программной модели алгоритма для распознающей машины Тьюринга. Разработка аналитической модели алгоритма с использованием нормальных алгоритмов Маркова.

    курсовая работа [1,5 M], добавлен 07.07.2013

  • Разработка модели лифта, алгоритма и программы на языке JavaScript. Возможность использования модели при проектировании промышленных лифтов и отладки управляющих программ. Основные принципы построения модели лифта, выполнение вычислительного эксперимента.

    курсовая работа [495,8 K], добавлен 09.06.2013

  • Описание принципа работы генетического алгоритма, проверка его работы на функции согласно варианту на основе готовой программы. Основные параметры генетического алгоритма, его структура и содержание. Способы реализации алгоритма и его компонентов.

    лабораторная работа [20,2 K], добавлен 03.12.2014

  • Разработка алгоритма и реализация интеллектуальной информационной системы, позволяющей оценить время в неделю, необходимое для осуществления функций технической поддержки администратора с необходимым уровнем надежности работы локальной сети.

    курсовая работа [37,4 K], добавлен 01.12.2009

  • Состав и принцип работы аппаратуры. Выбор параметров корреляционного анализа и Фурье-анализа. Разработка и применение алгоритма корреляционного анализа. Реализация алгоритма Фурье-анализа на языке С++ и алгоритма корреляционного анализа на языке С#.

    дипломная работа [4,6 M], добавлен 30.11.2016

  • История возникновения алгоритма симметричного шифрования, условия и особенности его применения на современном этапе. Принципы и функции исследуемой технологии. Анализ главных преимуществ и недостатков использования алгоритма, оценка его уязвимости.

    курсовая работа [301,9 K], добавлен 29.10.2017

  • Изучение понятия и свойств алгоритма. Определение сущности технологии Robson. Исполнитель, а также блок-схема алгоритма или его графическое представление, в котором он изображается в виде последовательности связанных между собой функциональных блоков.

    реферат [155,9 K], добавлен 19.10.2013

  • Программные продукты для решения задачи построения оптимального маршрута. Выбор аппаратных и программных средств для построения маршрута обхода пациентов. Математическая модель муравьиного алгоритма: состав, структура, тестирование, отладка, реализация.

    дипломная работа [1,9 M], добавлен 03.12.2017

  • Этапы процедуры принятия решений. Разработка математического алгоритма. Блок-схема алгоритма работы программы. Разработка программы на языке программирования С++ в среде разработки MFC. Текст программы определения технического состояния станка с ЧПУ.

    курсовая работа [823,0 K], добавлен 18.12.2011

  • Исследование системы распределения ключей на основе линейных преобразований. Описание компонентов сети конфиденциальной связи. Характеристика отечественного алгоритма шифрования данных. Обзор результатов расчетов криптостойкости алгоритма шифрования.

    контрольная работа [56,5 K], добавлен 26.09.2012

  • Исследование симметричных алгоритмов блочного шифрования. Минусы и плюсы алгоритма IDEA. Разработка программы аутентификации пользователя и сообщений на основе алгоритма IDEA. Выбор языка программирования. Тестирование и реализация программного средства.

    курсовая работа [314,2 K], добавлен 27.01.2015

  • Понятие алгоритма, его свойства. Дискретность, определенность, результативность, формальность как свойства алгоритма. Программа как описание структуры алгоритма на языке алгоритмического программирования. Основные структурные алгоритмические конструкции.

    реферат [1,3 M], добавлен 18.11.2010

  • Математическая модель алгоритма с модификацией муравьиной колонии. Выбор аппаратных и программных средств для разработки программы. Особенность построения оптимального маршрута обхода пациентов. Характеристика тестирования и отладки данного проекта.

    дипломная работа [1,9 M], добавлен 17.11.2017

  • Разработка программы шифрования данных с использованием алгоритма DES. Структура алгоритма, режимы его работы. Электронный шифровальный блокнот. Цепочка цифровых блокнотов. Цифровая и внешняя обратная связь. Структура окна: функции основных кнопок.

    лабораторная работа [830,3 K], добавлен 28.04.2014

  • Постановка задачи и ее математическая модель. Блок-схема алгоритма обработки массивов координат точек. Тестирование алгоритма сортировки. Используемые глобальные и локальные переменные. Листинг программы на языке Си. Анализ результатов. Пример работы.

    курсовая работа [1,8 M], добавлен 08.11.2012

  • Анализ алгоритмов, оценка параметров алгоритма (эффективности, сложности, правильности). Комплексный анализ эффективности алгоритма на основе комплексной оценки ресурсов формальной системы. Верификация при коллективной разработке программных систем.

    презентация [234,9 K], добавлен 22.10.2013

  • Понятие алгоритма. Цикл программы. Структурная схема алгоритма. Элементы языка Тurbo Рascal. Алфавит. Идентификаторы. Комментарии. Лексика языка С++. ESC-последовательности. Операции. Ключевые слова. Комментарии.

    контрольная работа [43,0 K], добавлен 24.04.2006

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.