Методика автоматизированного формирования сведений о научных публикациях университета для отчета в системе управления НИР Минобрнауки России
Разработка методики, предполагающей использование исключительно инструментария стандартных офисных приложений для автоматизированного формирования сведений о научных публикациях университета. Автоматизированное формирование сведений о публикациях.
Рубрика | Педагогика |
Вид | статья |
Язык | русский |
Дата добавления | 13.12.2021 |
Размер файла | 2,9 M |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Белгородский государственный национальный исследовательский университет
Методика автоматизированного формирования сведений о научных публикациях университета для отчета в системе управления НИР Минобрнауки России
О.С. Резниченко, С.И. Сиваков, Т.А. Резниченко
Аннотация
Ручная подготовка и размещение сведений о публикациях университета в Системе управления НИР занимают значительное время, зачастую несовместимое с установленными сроками, что поставило перед авторами исследования задачу автоматизации указанных процессов. Разработанная методика предполагает использование исключительно инструментария стандартных офисных приложений (Microsoft Word и Excel) и может быть освоена сотрудниками со средним уровнем владения персональным компьютером, не имеющими специализированных знаний в сфере информационных технологий. Результаты исследования продемонстрировали сокращение временных затрат в 3,5 раза при автоматизированном формировании сведений о публикациях по сравнению с ручным вводом данных в профильную информационную систему.
Ключевые слова: Scopus, Web of Science, eLIBRARY.RU, научные публикации, Система управления НИР, Microsoft Excel, Microsoft Word, макросы, транслитерация.
METHOD OF AUTOMATED GENERATION OF INFORMATION ABOUT UNIVERSITY'S SCIENTIFIC PUBLICATIONS FOR REPORTING IN THE RESEARCH MANAGEMENT SYSTEM OF THE RUSSIAN MINISTRY OF SCIENCE AND HIGHER EDUCATION
O.S. Reznichenko, S.I. Sivakov, T.A. Reznichenko
Belgorod State University Belgorod, Russia;
Abstract
Manual preparation and uploading information on university's scientific publications to the Research Management System takes considerable time, and often it is not able to meet the deadlines. This challenge posed the task of automating these processes to the authors of the study. The method involves the use of standard office tools (Microsoft Word and Excel), so that employees who do not have specialized information technology knowledge and have an average level of computer skills could use it. The study demonstrated a 3.5-fold time costs reduction when generating information about university's scientific publications automatically as compared to manual data entry in the Research Management System. Keywords: Scopus, Web of Science, eLIBRARY.RU, scientific publications, Research Management System, Microsoft Excel, Microsoft Word, macros, transliteration.
Введение
Предоставление различного рода отчетности давно является неотъемлемым компонентом деятельности образовательных учреждений. Применительно к государственным высшим учебным заведениям одной из платформ для отчетности выступает Единый портал информационного взаимодействия с учреждениями, подведомственными Минобрнауки России (www.sbias.ru). С 2019 года в рамках исполнения поручений Президента РФ № Пр-2558 от 29 декабря 2018 года государственным высшим учебным заведениям необходимо представлять отчеты о публикационной активности за прошедший календарный год. От содержания и качества этих отчетов зависят будущие объемы госфинансирования вузов, а также возможность их участия в конкурсах на предоставление грантов. Формирование отчетов осуществляется в информационной системе управления НИР, функционирующей на базе штатной подсистемы «Нормирование НИР для государственного задания» (модуль ScientificRationing) программного продукта «ПАРУС-Бюджет 8», разработанного при помощи модуля «Конструктор отраслевых расширений» (КОР).
В данном исследовании рассматриваются вопросы подготовки данных для их импорта в раздел «Сведения о публикационной активности» (далее - информационная система, ИС) подсистемы «Нормирование НИР для государственного задания». Руководство пользователя ИС с описанием вариантов добавления сводных данных, списком исходных информационных баз данных для формирования сводных данных, а также с описанием свойств полей данных и рекомендаций по заполнению каждого поля представлены в Технологической инструкция по внесению данных в раздел «Сведения о публикациях» информационной системы Минобрнауки России по взаимодействию с подведомственными учреждениями (далее - Технологическая инструкция) [1]. Инструкция размещена на информационном портале «Система управления НИР», а также рассылается сотрудниками Минобрнауки подотчетным научным организациям.
В 2018 году Белгородский государственный национальный исследовательский университет (НИУ «БелГУ») подготовил более пяти тысяч научных публикаций, поэтому ручной ввод данных об этих публикациях занял бы значительное время, несопоставимое с требованиями министерства к срокам размещения информации в ИС. Соответственно применение представленной в статье методики нецелесообразно, если требуется внести сведения о не более чем полутора сотнях публикаций. Необходимо также отметить, что в настоящее время на рынке программного обеспечения существуют решения для управления научными исследованиями, включающие в том числе и возможности агрегирования информации из наукометрических баз, а также формирования и экспорта отчетов в различных разрезах. В качестве примера успешного применения подобной системы можно привести комплексную систему учета и управления научной информацией Elsevier Pure [2, 3]. Эта система кроме агрегации данных из реферативных баз порталов Scopus и Web of Science Core Collection может экспортировать ранее выгруженные данные из базы eLIBRARY.RU, а также систему управления научно-исследовательской деятельностью VP GROUP Academic Line [4], позволяющую накапливать сведения о публикациях, выпускаемых организацией, в рамках встроенной или внешней электронной библиотеки. Условия Национальной подписки НИУ «БелГУ» не позволяют безвозмездно использовать возможности коммерческих решений от Elsevier и VP GROUP, а также интерфейс прикладного программирования (API) реферативной базы eLIBRARY.RU, что приводит к необходимости искать альтернативные способы подготовки и предоставления отчета о публикационной активности. Проблемой исследования является тот факт, что информацию для итогового файла импорта необходимо собирать из разнородных источников, тогда как средств обработки, форматирования, предобразования этой информации к пригодному для импорта виду имеется ограниченное количество. Кроме того, многие исполнители работ зачастую являются обычными пользователями, не владеющими навыками программирования.
Цель данного исследования состояла в сокращении временных затрат на предоставление сведений о публикациях научной организации в информационную систему управления НИР за прошедший календарный год посредством разработки алгоритмов формирования готового для загрузки в ИС файла, содержащего все необходимые записи.
Описание методов и средств реализации цели исследования
Подробное описание свойств файла для импорта и рекомендаций по заполнению сведений о научных публикациях сотрудников университета приведены в Технологической инструкции [1]. В качестве источников информации о публикациях можно выделить следующие:
1) данные, получаемые сотрудниками профильных административных подразделений от научных и научно-образовательных подразделений университета в течение отчетного года или по его окончании [при этом следует предварительно сформировать пустую электронную форму (например, в виде документа Microsoft Excel) с полями, описанными в Технологической инструкции, разработать упрощенные рекомендации к заполнению этой электронной формы или предусмотреть возможность использования при заполнении формы полей с предопределенными списками];
2) данные, представленные в реферативных базах порталов Scopus, eLIBRARY.RU и Web of Science Core Collection (далее - WoS) [5-7], а также данные, представленные кадровыми службами и сотрудниками подразделений, курирующих грантовую активность научной организации.
Очевидными недостатками первого варианта являются вероятная неполнота предоставляемых сведений, ошибки, неточности в заполнении и подлоги со стороны недобросовестных сотрудников. Больший интерес представляют методика автоматизированного извлечения и обработки информации из реферативных баз данных, а также правила сборки итогового файла для импорта в ИС. Общая схема, описывающая последовательность формирования итогового файла, представлена на рис. 1.
Способы извлечения данных из реферативных баз таковы:
1) последовательное открытие веб-страницы каждой публикации и ручной перенос требуемых сведений в файл для импорта в ИС (или непосредственно в веб-форму ИС);
2) автоматизированный экспорт требуемых сведений при помощи встроенного инструментария веб-порталов соответствующих реферативных баз.
В проведенном нами исследовании применялись методы системного анализа, методы анализа данных и библиографический анализ. В качестве инструментов исследования использовались приложения Word и Excel из состава пакета Microsoft Office, интернет-браузер с поддержкой возможности сохранения веб-страниц, макросы Microsoft Office Excel.
Рис. 1. Общая схема процесса получения итогового файла для импорта в ИС Fig. 1. General scheme of the process of obtaining the final import file
Описание структур данных о публикациях, извлекаемых из различных источников
Итоговые сводные данные о публикациях организаций должны представлять собой текстовый файл (с расширением *.txt) в кодировке ANSI, поля в котором разделяются символом «;», а перечисления значений внутри полей - символом «,». Пример содержимого такого файла приведен в табл. 1.
Scopus [5] - это библиографическая и реферативная база данных и инструмент для отслеживания цитируемости статей, опубликованных в научных изданиях. Доступна эта база данных через веб-интерфейс на условиях Национальной подписки и только с определенных подпиской IP- адресов. Поисковый аппарат интегрирован с поисковой системой Scirus для поиска веб-страниц и позволяет экспортировать до 20 000 записей, в том числе в формате «Простой текст ASCII в HTML» (рис. 2). Структура записей, экспортируемых из базы данных Scopus, представлена в табл. 2.
Web of Science Core Collection (далее - WoS) [6] - поисковая интернет-платформа, объединяющая реферативные базы данных публикаций в научных журналах и патентов, в том числе базы, учитывающие взаимное цитирование публикаций. В этой платформе предусмотрены возможности поиска и анализа библиографической информации и управления ею, а также возможность экспортирования до 5 000 записей в текстовом формате с разделителями табуляцией (рис. 3).
База данных Web of Science Core Collection также доступна через веб-интерфейс на условиях Национальной подписки. Структура записей, экспортируемых из базы данных WoS, представлена в табл. 3.
Весь комплекс выходных данных статьи в этом варианте экспорта удобнее объединить в одну запись, так как для основного контента конечного импортного файла это неважно, а важно только в процессе обработки данных экспорта этого типа.
eLIBRARY.ru [7] - это российская научная электронная библиотека, интегрированная с Российским индексом научного цитирования (RSCI). Национальная подписка для университета позволяет пользоваться встроенными поисковыми возможностями и выводить для просмотра в виде веб-страниц списки научных публикаций университета с применением различных фильтров. Невозможность задействовать в рамках подписки данного типа встроенный API причина того, что извлечь сведения о публикациях удается только одним способом: в виде постраничного сохранения содержимого веб-страниц в формате html средствами браузера по 100 записей (табл. 4)
Таблица 1 Структура записи в сводном файле для импорта в ИС
Table 1 Structure of one entry in the summary import for Research Management System
Название поля |
Пример записи |
|
DOI |
10.1002/a.012678 |
|
ISBN |
987-3-11-141411-0 |
|
Номер темы |
FSAD-2019-001 |
|
Квартиль |
Q1 |
|
Количество авторов |
12 |
|
Автор |
Ivanov I. I. |
|
ФИО автора на русском языке полностью |
Иванов Иван Иванович |
|
Должность автора в организации |
ВНС |
|
Ученая степень |
ДОКТ (доктор наук) |
|
Тип трудовых отношений |
О |
|
Год рождения автора |
1976 |
|
Идентификатор |
3100 |
|
Количество аффилиаций автора |
1 |
|
Перечень тем автора |
AAAA-A11-112233355555-1 |
|
Примечания |
Адсорбенты из отходов сахарного тростника, их применение для извлечения фенола и 2,4-дихлорфенола из водной среды |
Таблица 2 Состав полей для экспорта из библиографической и реферативной базы данных Scopus с примерами записей
Table 2 Contents of the fi elds of the export fi le from the Scopus database with data sample
Кадровая служба организации в нашем случае предоставляет информацию в виде экспортного файла из информационной системы управления кадрами в формате Microsoft Office Excel (Excel) (*.xlsx) и содержит следующие поля данных: полное имя, должность, ученая степень, дата рождения, СНИЛС, вид занятости.
Внутренняя служба, курирующая грантовую активность научной организации, предоставляет информацию о перечне показателей, которые характеризуют выполнение работ и достигнутые результаты по каждому научному проекту, имеющему номер ЕГИСУ НИОКР, в том числе списки значимых публикаций в международных базах цитирования. Сведения о научных проектах предоставляются в нашем случае в табличном виде в pdf-файлах. Номер темы, соответствующий каждому из проектов, выбирается, соответственно, согласно реестру тем из ИС.
Рис. 2. Последовательность, приводящая к генерации файла-экспорта из библиографической и реферативной базы данных Scopus
Fig. 2. Screenshots describing the process of generating an export file from the Scopus database
Таблица 3 Состав полей для экспорта из поисковой интернет-платформы
Table 3 Contents of the fields of the export file from the Web of Science database with data sample
Название поля |
Пример записи |
|
Автор(ы) |
Ivanov, Oleg; Danshina, Elena |
|
Название документа |
Peculiarities of the dielectric properties of ternary 0.5(Y0.1Zr0.9O2)-0.5(0.6SrTiO(3)-0.4BiScO(3)) ceramic system |
|
Название источника |
CERAMICS INTERNATIONAL |
|
Том |
44 |
|
Выпуск |
18 |
|
Начальная страница |
22856 |
|
Конечная страница |
22864 |
|
Номер статьи |
||
DOI |
10.1016/j.ceramint.2018.09.078 |
|
Индекс документа |
WOS:000452345500104 |
Рис. 3. Последовательность, приводящая к генерации файла-экспорта из базы поисковой интернет-платформы Web of Science Core Collection
Fig. 3. Screenshots describing the process of generating an export file from the Web of Science database
автоматизированный научная публикация университет
Таблица 4
Состав полей для экспорта из базы российской научной электронной библиотеки eLIBRARY.RU с примерами записей
Table 4 Contents of the fi elds of the export fi les from eLIBRARY.RU with data sample
Рис. 4. Последовательность, приводящая к генерации серии экспортных файлов из российской научной электронной библиотеки eLIBRARY.ru
Fig. 4. Screenshots describing the process of generating an export file from eLIBRARY.ru
Создание алгоритмов обработки данных при формировании файла импорта
Ниже описывается процесс обработки сведений о публикациях, полученных из соответствующих реферативных баз, а также процесс добавления недостающих сведений (см. шаг 1 на рис. 1).
На рис. 5 приведен алгоритм обработки данных файла экспорта при извлечении сведений о научных публикациях из библиографической и реферативной базы данных Scopus.
Описание алгоритма обработки файла экспорта при извлечении сведений о научных публикациях из базы данных Scopus
Шаг 1: процесс экспорта файла с данными из Scopus (отображен на рис. 2).
Шаг 2: процесс преобразования экспортного файла в формат Excel с полями, соответствующими полям в табл. 2 (отображен на рис. 6).
Шаги 3-5: согласно требованиям Технологической инструкции при отсутствии в статье DOI соответствующее поле необходимо заполнять значениями идентификатора библиографической и реферативной базы данных Scopus (EID). EID содержится в структуре URL-адреса и может быть извлечен в отдельное поле функцией Excel MID (ПСТР (например, вида =ПСТР(12;46;18).
Шаг 6: согласно требованиям Технологической инструкции для всех статей базы данных Scopus в поле «Квартиль» должно проставляться значение «S».
Шаг 7: для подсчета количества авторов публикации последовательно выполняются указанные ниже действия:
Рис. 5. Алгоритм обработки файла экспорта при извлечении сведений о публикациях из библиографической и реферативной базы данных Scopus
Fig. 5. Scopus publications data export processing algorithm
Рис. 6. Преобразование экспортного файла export.txt в файл, пригодный для обработки в Excel
Fig. 6. Converting the export file «export.txt» to usable in Excel
1) поле Authors копируется на отдельный лист;
2) в значениях поля Authors последовательность символов «.,» заменяется на символ «.;»;
3) применяется функция «Текст по столбцам» во вкладке «Данные» ленты с разделителями «;» [8];
4) с использованием функции COUNTA (СЧЁТЗ) в отдельном столбце вычисляется количество заполненных в строке ячеек (рис. 7).
На рис. 8 приведен алгоритм обработки данных файла экспорта при извлечении сведений о научных публикациях из базы поисковой интернет-платформы WoS.
Описание алгоритма обработки файла экспорта при извлечении сведений о научных публикациях из базы данных WoS
Шаги 1-3: в экспортном файле выходные данные каждой статьи распределены по нескольким столбцам, поэтому для того чтобы сформировать в отдельном столбце единую строку с выходными данными, необходимо осуществить сцепление значений нескольких столбцов, используя операцию Excel «&» (рис. 9) [9].
Шаги 4 и 5: согласно требованиям Технологической инструкции при отсутствии DOI соответствующее поле необходимо заполнять значениями индекса документа (WoS ID, см. табл. 3).
Шаг 6: для формирования из значений поля UT файла savedrecs.txt строки с поисковым запросом для расширенного поиска статьи необходимо использовать формулу Excel вида =»UT=»&I2, где ссылка на ячейку I2 содержит значение поля UT.
Шаг 7: для подсчета количества авторов применяется алгоритм, использующийся для обработки файла экспорта из базы Scopus (пункт 2 исключается).
Шаг 8: в файле экспорта не содержится данных о квартиле журнала, поэтому квартиль необходимо искать на портале WoS [6] с применением средств расширенного поиска посредством поискового запроса, полученного на шаге 6.
Рис. 7. Пример вычисления количества авторов публикации с использованием функции COUNTA (СЧЁТЗ)
Fig. 7. Example of calculating the number of publication authors using the Excel COUNTA function
Рис. 8. Алгоритм обработки данных файла экспорта при извлечении сведений о публикациях из базы поисковой интернет-платформы WoS
Fig. 8. Web of Science publications data export processing algorithm
Рис. 9. Пример сцепления значений столбцов из экспортного файла WoS для получения строки с выходными данными публикации
Fig. 9. Example of concatenating column values from a Web of Science export file to produce a single row with publication imprint
При выгрузке данных о публикациях из портала eLIBRARY.RU в соответствии с рекомендациями Технологической инструкции на странице списка публикаций университета необходимо последовательно воспользоваться указанными ниже фильтрами:
I. статьи в журналах, включенных в перечень ВАК;
II. статьи в журналах, входящих в RSCI;
III. публикации, имеющие ISBN;
IV. публикации, имеющие DOI.
Алгоритм обработки файла экспорта при извлечении сведений о научных публикациях из библиографической и реферативной базы данных eLIBRARY.RU приведен на рис. 10.
Описание алгоритма обработки файла экспорта при извлечении сведений о научных публикациях из базы данных eLIBRARY.RU
Шаги 1-3: экспортированные веб-страницы со списком публикаций (см. рис. 4) сцепляются друг с другом в один файл и обрабатываются средствами Excel.
Шаг 4: при обработке экспортного файла базы данных eLIBRARY.RU для извлечения из названия статьи URL-адреса можно воспользоваться приведенным ниже адаптированным макросом Excel [10].
Sub GetURL()
With ActiveSheet For I = 1 To.Hyperlinks.Count Hyperlinks(I).Range.Offset (0, 3). Value =.Hyperlinks(I).Address Next I End With End Sub
При выполнении макроса URL-адрес на соответствующей статьи пропишется в третьем столбце, следующим за столбцом с ее заголовком.
Шаги 5-14: предназначены для выполнения требований Технологической инструкции в контексте заполнения DOI и квартиля журнала публикации для списков публикаций, полученных при использовании различных фильтров.
Шаг 15: для подсчета количества авторов применяется алгоритм, использующийся для обработки файла экспорта из базы данных Scopus (пункт 2 исключается).
Наиболее трудозатратным и тяжело поддающимся автоматизации является процесс добавления в итоговый файл импорта информации о суммарном количестве аффилиаций авторов, которые публикуются от университета. Чтобы получить эти сведения, необходимо иметь прямые ссылки на страницы публикаций в соответствующих реферативных базах. В базах Scopus и eLIBRARY.RU такие ссылки можно получить непосредственно при экспорте данных или после соответствующей их обработки, а в базе WoS - только осуществив расширенный поиск по WOS ID статьи, используя поисковый запрос, полученный на шаге 6 (см. рис. 8). При отсутствии возможности организовать парсинг веб-страниц информацию о количестве аффилиаций авторов, а в случае с WoS - еще и данных о квартиле журнала (по умолчанию посредством автозаполнения проставляется квартиль Q4) можно получить только ручным переносом значения квартиля со страницы статьи.
Рис. 10. Алгоритм обработки данных файла экспорта при извлечении сведений о научных публикациях из базы eLIBRARY.RU
Fig. 10. eLIBRARY.RU publications data export processing algorithm
В результате обработки данных из трех источников (см. шаг 2 на рис. 1) получается электронная таблица, содержащая поля, представленные в табл. 5.
Необходимость экспорта из трех реферативных баз приведет в том числе к появлению одинаковых записей. Подобные дубликаты можно удалить, используя функцию Excel IF (ЕСЛИ). Применяя формулу =IF(LEFT(A2;35)=LEFT (A3;35);1;0), можно сформировать новый служебный столбец, по значениям которого будут отфильтровываться дубликаты. В вопросе о том, какую именно запись необходимо оставить, приоритет отдается публикациям WoS [1].
На следующем этапе добавляется информация о грантовых тематиках и номере грантовой темы непосредственно для каждой публикации (см. шаг 3 на рис. 1), которая осуществлялась в рамках соответствующего грантового исследования.
При обработке файла экспорта, предоставленного кадровой службой, необходимо придерживаться следующего алгоритма:
1) замена значений в столбцах, содержащих информацию о должности, ученой степени, виду занятости, на соответствующие сокращения согласно требованиям Технологической инструкции [1];
2) извлечение года рождения автора публикации и последних 4 цифр СНИЛС;
3) разбиение полного имени сотрудника по столбцам «Фамилия», «Имя», «Отчество»;
4) транслитерация записей в столбцах «Полное имя», «Фамилия», «Имя», «Отчество» согласно алгоритму [11] в отдельные дополнительные столбцы;
5) формирование двух столбцов со значениями вида «Фамилия И. О.» и их транслитерированными вариантами.
Следующий этап состоит в распределении информации о статье по всем авторам этой статьи (см. шаг 4 на рис. 1), то есть таким образом, чтобы количество записей, соответствующих одной статье, было равно числу соавторов в ней. Подобное распределение можно осуществить посредством такого алгоритма:
1) копирование содержимого электронной таблицы в документ Microsoft Office Word (Word);
2) замена символов разделителей авторов в поле «Авторы» на символ абзаца;
3) копирование содержимого документа на новый лист документа Excel;
4) автозаполнение пустых значений полей DOI, ISBN, «Квартиль», «Количество авторов», «Примечание» с использованием формулы =IF(A2="";B1;A2.
Следующий этап заключается в добавлении в результирующий файл импорта недостающих полей из адаптированного файла (см. шаг 5 на рис. 1), содержащего сведения о работниках. Для этого будет использоваться функция VLOOKUP (ВПР) [12], в зависимости от языка
Таблица 5 Состав полей итогового файла импорта, содержащего сведения о научных публикациях, с примерами записей
Table 5 Contents of the fields of the final import file with information about scientific publications with sample data
Название поля |
Пример записи |
|
DOI |
10.1088/1748-0221/13/02./C 02048 |
|
ISBN |
- |
|
Квартиль |
Q3 |
|
Количество авторов |
5 |
|
Авторы |
Vokhmyanina K. A.; Sotnikova V. S.; Kaplii A. A.; Sotnikov A. V.; Kubankin A. S. |
|
Название статьи |
About a contactless transmission of 10 keV electrons through tapering microchannels |
|
Выходные данные статьи |
JOURNAL OF INSTRUMENTATION, Vol. 13, art.# C02048 |
Состав полей итогового файла импорта, содержащего сведения о научных публикациях, с примерами записей публикации добавляющая из таблицы с кадровой информацией поля «Полное имя», «Должность», «Ученая степень», «Год рождения», «СНИЛС», ориентируясь на равенство значений поля формата «Фамилия И. О.» (или его транслитерированного варианта) и значений поля «Авторы» итогового файла. В нашем случае используется Excel- функция вида =ВПР(А2; Employees!$J:$W; i;0), где i - номер столбца из диапазона J:W, содержащий недостающее для итогового файла поле электронной таблицы с информацией о кадрах. В результате использования функции ВПР произойдет автоматическое заполнение персональной информации об авторе, если она имеется в таблице с информацией о кадрах. Нужно проанализировать, для каждой ли статьи нашлись соответствующие персональные данные. Наиболее вероятной причиной отсутствия в записи кадровой информации является различие между написанием фамилии автора в файлах экспорта из реферативных баз и транслитерированной записью в таблице с информацией о кадрах. Найденные несоответствия исправляются вручную. Записи, оставшиеся после проведенного анализа пустыми, отфильтровываются и из итоговой таблицы удаляются. На этом этапе формирование файла импорта завершено.
Заключение
Итогом данного прикладного исследования является разработка методики, позволяющей сформировать готовый файл электронной таблицы Excel, содержащий несколько типов записей о научных публикациях. Данный файл сохраняется в текстовом формате с требуемыми Технологической инструкцией разделителями.
В табл. 6 представлены временные затраты на внесение в ИС 2473 записей вручную и посредством формирования файла импорта. Временные затраты на перенос сведений о научных проектах организации в файл для импорта составили 87 минут. Замеры времени для переноса этих же сведений вручную непосредственно в ИС не производились, но можно с уверенностью утверждать, что этот процесс занял бы значительно больше времени, так как данные, относящиеся к одному научному проекту, пришлось бы вносить в записи по каждому из соавторов одной публикации. Эксперимент по ручному и автоматизированному заполнению системы совершал один и тот же сотрудник центра развития публикационной активности НИУ «БелГУ».
Приведенные в табл. 6 данные свидетельствуют, что увеличение количества сотрудников, осуществляющих подготовку и ручной перенос в ИС сведений о публикациях, кадровых данных и сведений о научных проектах, приведет к уменьшению суммарных временных затрат на выполнение работы. В свою очередь, увеличение количества публикаций, количества научных проектов организации, а также доли авторства в публикациях за отчетный период будет способствовать значительному увеличению разницы между временньї- ми затратами при ручном вводе сведений и при их автоматизированной обработке.
Рекомендации по использованию предлагаемой методики:
1) в связи с особенностями работы ИС управления НИР содержимое файла импорта необходимо разбить на несколько отдельных файлов объемом не более чем по 100 записей в каждом, а затем уже импортировать итоговые текстовые файлы в кодировке ASCII встроенными средствами импорта;
Таблица 6
Временные затраты на добавление сведений о публикациях в ИС вручную и посредством формирования файла импорта
Table 6 Time spent on adding information about publications to the Research Management System
База данных |
Среднее время, затраченное на добавление одной записи, мин |
Количество обработанных записей, ед. |
||
При ручном переносе данных |
При автоматизации формирования и обработки данных |
|||
Scopus |
1,30 |
0,50 |
928 |
|
WoS |
1,57 |
0,17 |
687 |
|
eLIBRARY.RU |
1,52 |
0,48 |
858 |
|
Экспортный файл кадровой службы |
32 |
32 |
- |
Примечание. При ручном переносе данных в ИС затраченное время составило 3621 мин, при автоматизированном - 1025 мин.
2) в качестве поля с примечанием можно вставить данные о названиях или выходных данных научной публикации или сцепку «название статьи»&»выходные данные», чтобы облегчить в будущем навигацию по загруженным записям, а также быстро исправлять ошибки, возникшие при формирования итогового файла импорта;
3) информацию о публикациях в рамках грантов (проектов) следует получать в более формализованном табличном виде, а не в виде паспорта проекта.
«Узкими местами» предложенного метода являются неверное сопоставление авторов, имеющих одинаковые фамилии и инициалы, а также вариативность транслитерации фамилий авторов. В нашем случае корректировка результатов транслитерации фамилий производилась непосредственно перед формированием итогового файла путем поиска и исправления записей, для которых функция ВПР не добавила сведений из таблицы с данными о кадрах. Указанные проблемы могут быть решены путем ввода в анкеты сотрудников информационной системы управления кадрами организации дополнительных полей, содержащих их уникальные идентификаторы в крупных наукометрических базах (Scopus ID, Research ID, ORCID и другие).
В перспективе при разработке программных средств автоматизации формирования файла импорта для хранения экспортной информации можно использовать базу данных, структура которой представлена на рис. 11.
В рамках дополнительного модуля программных средств автоматизации с целью повышения качества программного обеспечения можно разработать и реализовать функционал онлайнового или офлайного парсинга веб-страниц публикаций для автоматизации извлечения информации о количестве аффилиаций авторов применительно ко всем исходным реферативным базам; для автоматизации извлечения информации о квартиле журналов в базе WoS; а также для извлечения значений DOI и ISBN на страницах публикаций в базе eLIBRARY.RU, что приведет к значительному сокращению временных затрат на выполнение автоматизированного формирования итогового файла для импорта.
Рис. 11. Структура базы данных для хранения экспортной информации из различных реферативных баз Fig. 11. Data structure for storing exported information from Scopus, Web of Science, eLIBRARY.RU
Список литературы
1. Инструкция по действиям в разделе «Сведения о публикациях» (обновленная) // Министерство науки и высшего образования Российской Федерации: официальный сайт. URL: http://wnir.minobmauki.gov.ru/index. php?newsid=67 (дата обращения: 04.04.2020).
2. Pure // Elsevierscience. URL: http://elsevierscience.ru/ products/pure/ (дата обращения: 15.05.2020).
3. ИлюхинД Продвигаем ученых в мировом пространстве // Уральский Федеральный: [периодическое издание Уральского федерального университета им. Б. Н. Ельцина]. 2020. № 7. С. 2. URL: https://urfu.ru/fileadmin/user_upload/ common_files/news/2020/02/20200210_gazeta_UF_7.pdf (дата обращения: 15.05.2020).
4. Система управления научно-исследовательской деятельностью вуза // VP Group: [сайт]. URL: http://vpgroup. ru/Default.aspx?tabid=436 (дата обращения: 15.05.2020).
5. Elsevier Scopus // Scopus: библиографическая и реферативная база данных. URL: https://www.scopus.com/ search/form.uri?display=basic= (дата обращения: 04.04.2020).
6. Clarivate Analytics Web of Science Core Collection // Web of Science: поисковая интернет-платформа. URL: https://apps.webofknowledge.com/WOS_GeneralSearch_ input.do?product=WOS&search_mode=GeneralSearch&SI D=C3Qtws6Zp9bRCWtj7S7&preferencesSaved= (дата обращения: 04.04.2020).
7. eLIBRARY.RU: Российская научная электронная библиотека. URL: https://elibrary.ru/defaultx.asp (дата обращения: 04.04.2020).
8. Text to Columns // Excel Easy - #1 Excel tutorial on the net. URL: https://www.excel-easy.com/examples/text-to- columns.html (дата обращения: 15.05.2020).
9. Текстовые функции (справка) // Поддержка Office. URL: https://support.office.com/ru-ru/article/ Текстовые-функции-справка-cccd86ad-547d-4ea9-a065- 7bb697c2a56e (дата обращения: 15.05.2020).
10. How to extract a URL from a hyperlink on Excel // How to Use Excel. Tips on how to use Microsoft Excel. URL: https://howtouseexcel.net/how-to-extract-a-url-from-a- hyperlink-on-excel (дата обращения: 04.04.2020).
11. Транслитерация текста в Excel // Tutorexcel.ru. Excel простыми словами. URL: https://tutorexcel.ru/makrosy-vba/ transliteraciya-teksta-v-excel/ (дата обращения: 04.04.2020).
12. Функция ВПР в программе Microsoft Excel // Lumpics.ru.: [сайт]. URL: https://lumpics.ru/examples-the- vlookup-function-in-excel/ (дата обращения: 04.04.2020).
References
1. Instruktsiya po deistviyam v razdele «Svedeniya o publikatsiyakh» (obnovlennaya)» [Manual for Using Section «Information on Publications» (Updated)], available at: http:// wnir. minobrnauki. gov. ru/index.php? newsid=67 (accessed 04.04.2020). (In Russ.).
2. Pure. The World's Leading Research Information Management System, available at: https://www.elsevier.com/ solutions/pure (accessed 15.05.2020). (In Eng.).
3. Ilyukhin D. Prodvigaem uchenykh v mirovom pros- transtve [Promoting Our Scientists in World Science]. Uralskii Federalnii, 2020, no. 7, p. 2, available at: https://urfu.ru/fil- eadmin/user_upload/common_files/news/2020/02/20200210_ gazeta_UF_7.pdf (accessed 15.05.2020). (In Russ.).
4. Sistema upravleniya nauchno-issledovatelskoi deyatel'nosti vuza [University Research Management System], available at: http://vpgroup.ru/Default.aspx?tabid=436 (accessed 15.05.2020). (In Russ.).
5. Elsevier Scopus, available at: https://www.sco- pus.com/search/form.uri?display=basic= (accessed 04.04.2020). (In Eng.).
6. Clarivate Analytics Web of Science Core Collection (2020), available at: https://apps.webofknowledge. com/WOS_GeneralSearch_input.do?product=WOS&search_ mode=GeneralSearch&SID=C3Qtws6Zp9bRCWtj7S7&prefe rencesSaved= (accessed 04.04.2020). (In Eng.).
7. eLIBRARY.RU: Nauchnaya electronnaya bib- lioteka [Scientific Electronic Library eLIBRARY.RU], available at: https://elibrary.ru/defaultx.asp (accessed 04.04.2020). (In Russ.).
8. Text to Columns - Easy Excel Tutorial, available at: https://www.excel-easy.com/examples/text-to-columns.ht- ml (accessed 15.05.2020). (In Eng.).
9. Tekstovye funktsii (spravka) [Text functions (reference)], available at: https://support.office.com/ru-ru/article/ Текстовые-функции-справка-cccd86ad-547d-4ea9-a065- 7bb697c2a56e (accessed 15.05.2020). (In Russ.).
10. How to use Microsoft Excel. How to extract a URL from a hyperlink on Excel, available at: https://howtouseex- cel.net/how-to-extract-a-url-from-a-hyperlink-on-excel (accessed 04.04.2020). (In Eng.).
11. Transliteratsiya teksta v Excel [Transliteration of text in Excel], available at: https://tutorexcel.ru/makrosy-vba/trans- literaciya-teksta-v-excel/ (accessed 04.04.2020). (In Russ.).
12. Funktsiya VPR v programme Microsoft Excel [VLOOKUP function in Microsoft Excel], available at: https://lumpics.ru/examples-the-vlookup-function-in-ex- cel/ (accessed 04.04.2020). (In Russ.).
Размещено на Allbest.ru
...Подобные документы
Знакомство с историческими этапами становления Казанского университета. Рассмотрение основных задач Казанского федерального университета: подготовка специалистов в области территориального развития и планирования, проведение научных исследований.
дипломная работа [1,5 M], добавлен 05.11.2014Психолого-педагогические основы формирования научных понятий. Сущность и источники витагенного обучения. Методы и приемы выявления и актуализации витагенного опыта учащихся. Формирование научных понятий как педагогическая проблема. Виды научных понятий.
дипломная работа [478,7 K], добавлен 13.12.2009Роль Ломоносова в создании Московского университета. Его становление в XIX – в начале XX веков. Краткая история уставов 1863, 1884 годов. Революционный перелом университета. Великая Отечественная война 1941-1945 годов как испытание в жизни университета.
контрольная работа [25,5 K], добавлен 01.05.2009Модели университета, сформированные в индустриальном обществе. Болонский процесс и проблемы высшей школы. Рейтинги как инструмент определения миссии университета. Текущие проблемы системы высшего образования. Модели университета постиндустриального типа.
дипломная работа [196,0 K], добавлен 11.12.2017Определение понятия "интернет-ресурсы". Роль экологических сведений в процессе формирования экологической культуры ребенка. Диагностика и анализ формирования экологической культуры родителей. Динамика формирования экологической культуры родителей.
курсовая работа [597,6 K], добавлен 20.03.2014Определение понятия и содержания страноведения. Исследование и характеристика его значения в процессе обучения иностранному языку. Ознакомление с критериями отбора сведений страноведческого характера с целью формирования речевых навыков и умений.
дипломная работа [69,2 K], добавлен 28.08.2017Подготовка специалистов в системе высшего образования. Педагогическая проблематика метода преподавания социогуманитарных дисциплин. Возможности изучения философской науки в условиях университета. Статус философии в системе образования университета.
контрольная работа [24,1 K], добавлен 03.08.2013Оценка параметров, оценивающих влияние вузов на социально-экономическое положение регионов. Анализ характеристик региональной системы высшего образования. Формирование показателей результативности университета как центра создания пространства инноваций.
дипломная работа [692,5 K], добавлен 31.03.2018Свойства социального института вуза: генератор социальных норм поведения, форма организации совместной деятельности людей. Характеристика Уральского Федерального университета, структура его управлення. Анализ основных задач Координационного совета.
реферат [53,8 K], добавлен 17.04.2012Основные этапы становления и развития Красноярского Государственного Медицинского Университета, выдающиеся ученые, преподававшие и обучаемые в стенах данного образовательного учреждения. Современное состояние и оценка перспектив данного университета.
презентация [495,1 K], добавлен 10.04.2013Предпосылки возникновения научных школ на Ставрополье. Исследования по спектроскопии сложных органических молекул. Развитие научной школы "Физика магнитных жидкостей" с 1954 г. по 1990 г. Организация учебной и воспитательной работы в ВУЗах Ставрополья.
дипломная работа [88,1 K], добавлен 23.03.2012Объединение профессорско-преподавательского состава и научных работников. Основные учебно-научные структурные подразделения университета. Подготовка и выпуск специалистов по направлению "Кораблестроение и океанотехника". Состав и структура кафедры.
реферат [28,8 K], добавлен 18.06.2013Изучение современных научных подходов к проблеме формирования дивергентного мышления. Осуществление диагностики уровня его развитости у учащихся и определение динамики формирования дивергентности. Анализ принципов снижения творческо-подавляющего эффекта.
курсовая работа [64,9 K], добавлен 29.01.2012Изучение истории основания и основных этапов развития Санкт-Петербургского государственного политехнического университета. Базовые институты: инженерно-строительный, энергетики и транспортных, информационных технологий и управления. Научная деятельность.
отчет по практике [168,6 K], добавлен 11.06.2014Сущность и генезис понятия классический университет. Интеграция учебного процесса и фундаментальных научных исследований. Пути развития классического университета Украины за годы независимости. Рейтинг ВУЗов от Министерства образования и науки Украины.
реферат [12,8 K], добавлен 04.05.2009Возникновение первых высших учебных заведений в Российской империи. Основание Академического университета при Академии наук во второй четверти XVIII века. Создание первого классического университета в Москве. Государственные высшие учебные заведения.
курсовая работа [122,9 K], добавлен 16.05.2017История образования, структура и факультеты Северо-Кавказского федерального университета. Организационные основы деятельности филиала, трудоустройство выпускников факультетов. Задачи основных факультетов университета как структурных подразделений филиала.
отчет по практике [39,0 K], добавлен 08.06.2017Экологическое воспитание как актуальное направление дошкольной педагогики. Формирование естественно-научных представлений у детей дошкольного возраста средствами графического моделирования. Констатирующий, формирующий и контрольный эксперименты.
аттестационная работа [41,6 K], добавлен 08.05.2010Региональный импакт, слияния и управление изменениями в вузах: ключевые аспекты проблематизации. Целевая модель, миссия и задачи развития опорного университета. Развитие кадрового потенциала. Развитие местных сообществ, городской и региональной среды.
дипломная работа [1,9 M], добавлен 31.03.2018Требования к освоению навыка алгоритмического стиля мышления. Изучение сведений о психолого-возрастном аспекте формирования познания у детей. Развитие алгоритмической культуры учеников младшей школы. Анализ уровня математической культуры учащихся.
курсовая работа [54,7 K], добавлен 14.04.2019