ETL процесс на базе платформы 1С Предприятие

Анализ методов загрузки информации из хранилища источников в информационную систему приемника данных. Выбор инструмента извлечения данных и их преобразования перед загрузкой в место назначения. Реализация ETL-процесса на базе платформы 1С:Предприятие.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 18.01.2021
Размер файла 748,1 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.Allbest.Ru/

Размещено на http://www.Allbest.Ru/

Размещено на http://www.Allbest.Ru/

ФГБОУ ВО «РЭУ им. Г.В. Плеханова»

ETL процесс на базе платформы 1С Предприятие

Воробьев Н.В., студент магистратуры

Павлова Е.В., специалист

Россия, г. Москва

Аннотация

В данной статье описан подход к реализации ETL процесса на базе платформы 1С: Предприятие. Дана характеристика необходимой технологической основы, а также проанализированы основные методы реализации загрузки информации из информационной системы источника в информационную систему приемника данных.

Ключевые слова: ETL, 1С Предприятие, SQL, WEB API, Хранилища данных, Интеграция.

Annotation

This article describes an approach to the implementation of the ETL process based on the 1C: Enterprise platform. The characteristic of the necessary technological basis is given, and the main methods for implementing the loading of information from the information system of the source into the information system of the data receiver are analyzed.

Keywords: ETL, 1C Enterprise, SQL, WEB API, Data warehouses, Integration.

В течение многих лет ключом к успеху любого бизнес-решения были данные. Выбор правильного инструмента для извлечения данных из разрозненных источников и их преобразования перед загрузкой в целевое место назначения имел решающее значение. Многие организации боролись с этим процессом, добавляя новые инструменты, поскольку ограничения в выбранных инструментах становились очевидными. При выборе инструментов департаменты часто работали в изолированном пространстве, что в сочетании со слияниями и поглощениями привело к тому, что инструменты ETL не были интегрированы. В дополнение к увеличению затрат на обслуживание и обучение, использование различных инструментов может привести к фрагментации метаданных, что превращает соответствие в огромную рутинную работу. Решения, реализованные на платформе 1С:Предприятие развивались вместе с развитием бизнеса в России, поэтому они содержат в себе российские практики управления бизнесом, что является одной из главных причин использовать данные продукты как основу для реализации ETL процесса. В этой статье содержится обзор необходимых возможностей интеграции данных и объясняется, почему они важны.

Первым этапом реализации ETL процесса является разработка процесса извлечения данных [1]. В общем случае на предприятии заказчика можно выявить следующие способы извлечения данных:

• Извлечение данных из заполненного вручную шаблона;

• Интеграция с СУБД;

• Извлечение данных из csv данных, полученных по FTP соединению;

• Извлечение данных из файла, полученного по почте;

• Интеграция с Excel файлом расположенном в файловой системе;

• Интеграция с API поставщика данных;

Для информационного обеспечения ETL процесса разрабатывается концепция создания и тестирования среды проекта.

Среда разработки представляет из себя два сегмента:

• Интранет (LAN 1)

• Сеть между серверами (БАМ 2) системного архитектора, системных и сетевых администраторов

На серверах сегмента не установлены антивирусные мониторы, подсеть изолирована брандмауэром от сервера терминалов.

Рисунок 1. Среда разработки ЕТБ процесса Сеть между серверами не предполагает доступа конечных пользователей

Конечными пользователями являются все пользователи за исключением.

Интрасеть защищена корпоративным брандмауэром, рассчитана на пользователей всех уровней. Терминальный сервер-подключен к интрасети одним интерфейсом, другим - к межсерверной сети через брандмауэр.

Данный сервер предназначен:

• для работы конечных пользователей через толстые и тонкие клиенты 1С;

• для публикации внешних сервисов;

• для подключения внешних пользователей по веб-ссылке (тонкие и веб-клиенты).

Последовательность развертывания среды представляет из себя следующие этапы:

• Предоставляются серверы с установленной ОС;

• Серверы подключены к сети в соответствии со схемой;

• В операционной системе Windows есть доступ через RDP;

• Cервер с ОС Linux доступен по протоколу SSH из сети LAN 2.

Следующим этапом разработки ETL процесса является определение порядка загрузки данных [2]. Общим подходом является запуск регламентного задания раз в сутки в согласованное время, которое последовательно обрабатывает все интеграции по загрузке транзакционных данных за один день.

Для работы с динамически изменяемыми данными создается механизм анализа изменений в случае повторной загрузки данных за один и тот же период. В этом случае в движениях по регистрам будут отражаться только изменения.

Для загрузки мастер-данных используется следующий подход:

Поиск ссылочных типов осуществляется по ключевому полю. При этом, если элемент справочных данных не найден, он будет создаваться с минимальным набором данных, который включает в себя значение ключевого поля и специальный признак, означающий, что элемент является черновиком.

Во время загрузки транзакционных данных инициализируется событие по созданию черновых элементов НСИ, этот процесс сопровождается записью в очередь на обработку по заполнению данными каждого элемента данными систем источников (их может быть несколько). Очередь на обработку по заполнению данными справочников обрабатывается отдельным регламентным заданием, которое запускает необходимые интеграции.

Для обновления изменившихся элементов реализуется регламентное задание. Для реализации извлечения данных с использованием прямого подключения к СУБД можно использовать два способа:

1. Подключение с использованием ODBC;

2. Реализовать особый объект конфигурации, который называется внешним источником данных.

В данной статье описан второй способ, т.к. он является более гибким, прозрачным и управляемым. Внешние источники данных - это прикладные объекты конфигурации. Они позволяют работать с внешними базами данных, не основанными на 1С:Предприятии [3]. Благодаря этим объектам конфигурации информацию из внешних баз можно использовать внутри прикладного решения так же, как будто бы она хранится в самой информационной базе. хранилище данный информационный приемник

Внешний источник может получать данные из ODBC-источников в операционных системах Windows и Linux, причем при работе с СУБД Microsoft SQL Server, IBM DB2, PostgreSQL и Oracle Database обеспечиваются полные возможности языка запросов. Кроме этого внешние источники данных позволяют подключить к прикладному решению многомерные источники данных, такие как:

Microsoft Analysis Services;

Oracle Essbase;

IBM InfoSphere Warehouse.

При работе с другими СУБД некоторые конструкции языка запросов могут не работать, т.к. они ограничены возможностями того ODBC-драйвера, который используется.

Таблицы внешнего источника данных можно описать вручную, или с помощью конструктора [4]. Конструктор, используя строку соединения, может подключится к внешней базе данных и предоставить список таблиц, доступных для добавления во внешний источник.

Таблицы внешних источников используются в конфигурации точно так же, как и таблицы любых других объектов конфигурации.

Для извлечения данных с помощью WEB API используется механизм Web - сервисов. Данная технология является одним из механизмов платформы, используемых для интеграции с другими информационными системами. Он является средством поддержки SOA (Service-Oriented Architecture) - сервис-ориентированной архитектуры, которая является современным стандартом интеграции приложений и информационных систем.

Прикладное решение 1С:Предприятия 8 может являться как поставщиком веб-сервисов, так и потребителем веб-сервисов, опубликованных другими поставщиками [5].

После настройки Web сервиса появляется возможность использовать его как обычный объект конфигурации.

Главным преимуществом такого подхода при интеграции является простота его реализации, к недостаткам можно отнести низкую степень управляемости такого процесса, т.к. приемник данных не имеет прямого доступа к данным.

Для большинства языков программирования подход к загрузке из CSV файлов является одинаковым. Это связано с тем, что CSV файл является обычным текстом, в котором строки разделены символами переноса строки, а значения - запятыми.

Таким образом, чтение CSV файла сводится к механизму разбиения строк и значений по разделителям.

Для платформы 1С:Предприятия наиболее общим подходом является использование функции СтрРазделить и дальнейшая обработка в цикле [6].

Для загрузки из Excel файлов существует несколько подходов, наиболее общим из которых является использование Excel драйвера. Данный способ имеет множество преимуществ, основным из которых является высокая производительность, однако, чаще всего, установка Excel на сервере предприятия оказывается экономически нецелесообразной. В связи с этим выбирается другой способ загрузки Excel файла - NativeXLSX.

Данный способ позволяет организовать импорт из файла типа XLSX в таблицу значений. При этом учитывается, что XLSX-файл - это некий контейнер, который можно распаковать средствами 1С в набор XML-файлов.

Путем чтения этих XML-файлов представляется возможность обрабатывать следующие типы данных: строковые значения; индексы строковых значений, числовые значения, формулы; информация об изображениях; стили форматирования.

В данном случае объект типа Документ DOM образуется как результат чтения nocmpoume MeMDOM объекта 4menueXML - источника данных XML.

В дальнейшем осуществляется обход дочерних узлов Документа DOM, чтение их значений и различных атрибутов.

Механизмы обмена данными позволяют создавать территориально распределенные информационные системы обменивающиеся данным в офлайн режиме, без постоянного соединения. С помощью этих механизмов можно осуществлять интеграцию не только между различными информационными базами 1С:Предприятия, но и строить сложные гетерогенные информационные системы, включающие, наряду с решениями на платформе 1С:Предприятие, еще и внешние приложения.

Платформа обеспечивает работу двух механизмов обмена данными: Механизм распределенных информационных баз Универсальный механизм обмена данными

Оба эти механизма используют ряд средств технологической платформы, которые разработчик может применять как по отдельности, так и в различных комбинациях, в зависимости от конкретной решаемой задачи. Такой подход позволяет обеспечить гибкость механизмов обмена и их настраиваемость на решение как можно большего круга задач [7].

Основная настройка обмена данными происходит в интерфейсе программы предприятия. К преимуществам данного подхода можно отнести относительную простоту реализации, т.к. разработка планов обмена является задачей разработчиков приложения источника, однако данный способ требует значительных трудозатрат в случае необходимости внесения изменений. Элементы справочников, для которых выполнены все необходимые интеграции на этапе загрузки данных, попадают в интерфейс согласования ответственным за НСИ.

Работа ответственного производится в специально разработанном интерфейсе, в котором возможно выполнить следующие действия:

Дозаполнить и скорректировать информацию элементов справочников; Подобрать значения из классификаторов;

Согласовать элемент справочной информации, после чего он становится корректным элементом, т.е. снимается метка «Черновой элемент»

Некоторые информационные системы являются источниками избыточного количества мастер-данных, которые могли возникнуть вследствие особенностей или ограничений системы [8]. Важной особенностью, которую необходимо учитывать при разработке ETL процесса является возможность реализовать загрузку данных в подсистемы ручного учета для помощи первоначального заполнения и возможно последующего использования.

В данной статье был описан подход и особенности реализации ETL процесса на базе платформы 1С: Предприятие. В первой части работы дана характеристика необходимой технологической основы, выявлены особенности сетевой характеристики и сформированы рекомендации по оснащению сетевым оборудованием. Следующие тезисы описывают способы реализации выгрузки данных, а именно с помощью:

Прямого доступа к СУБД;

Использования WEB-API;

Из файлов форматов Excel и CSV;

А также с использованием стандартного форма XML в рамках работы процесса обмена данными.

Для реализации возможности трансформации данных была описания концепция инструмента подтверждения и нормализации данных, использование которого замыкает реализацию процесса извлечения, трансформирования и загрузки данных.

Примечание: Исследование выполнено по гранту Президента РФ по государственной поддержке ведущих научных школ №НШ-5449.2018.6 «Исследование цифровой трансформации экономики».

The research was supported by grant of President of Russian Federation according to state support of leading scientific schools (grant №NSh-5449.2018.6).

Список использованной литературы

1. Радченко, М. 1С:Предприятие 8.3. Практическое пособие разработчика / Радченко М.Г., Хрусталева Е.Ю.- Москва: 1С, 2015

2. Абрашина, Е. Использование механизма расширенной аналитики в "1С:Управление производственным предприятием" / Абрашина Е.В., Емельянов И.М.- Москва: 1С, 2016

3. Печерских В. Внедрение ERP-решений на платформе 1С:Предприятие 8 / Печерских В., Бельцев Г.- Москва: BHV, 2015

4. Коньков М.Н. Гусев А.С. Некоторые вопросы планирования для обеспечения безопасности бизнеса в условиях цифровой экономики. - Интеллектуальные системы в информационном противоборстве. Сборник научных трудов Российской научной конференции. 15-17 декабря 2017 г. / под науч. ред. Н.И. Баяндина: в двух томах. - М.: ФГБОУ ВО РЭУ им. Г.В. Плеханова, 2018 - С. 241-244

5. Мамиконов А.Г. Управление и информация; Наука - М., 2013. - 184 с.

6. Dneprovskaya, N., Urintsov, A., Komleva, N. and Staroverova, O. Evaluation Indicators of Knowledge Management in the State Service. In E. Bolisani, E. Di Maria and E. Scarso (Eds.), Proceedings of the 19th European Conference on Knowledge Management - ECKM 2018 Vol.1 (pp.182-189). Padova, Italy: Academic Conferences and Publishing International Limited.

7. Pavlekovskaya, I., Urintsov, A., Staroverova, O. and Nefedov, Y. (2018) The Impact of Digital Transformation of the Russian Economy on Knowledge Management Processes In E. Bolisani, E. Di Maria and E. Scarso (Eds.), Proceedings of the 19th European Conference on Knowledge Management - ECKM 2018 Vol.2 (pp.677684). Padova, Italy: Academic Conferences and Publishing International Limited.

8. Mamedova N.A., A.I. Urintsov, Design of an automated information system for the management of municipal programs, References: 5th International Multidisciplinary Scientific Conference on Social Sciences and Arts SGEM 2018, www.sgemsocial.org, SGEM2018 Conference Proceedings, ISBN 978-619-740860-7 / ISSN 2367-5659, 26 August - 01 September, 2018, Volume 5, Issue 5.2, 371376 pp.

Размещено на allbest.ru

...

Подобные документы

  • Обзор технологической платформы для разработки клиентского веб-интерфейса. Выбор платформы базы данных, языка разработки, фреймворка на стороне сервера и клиента. Создание схемы данных MySQL. Работа пользователя и оператора с программным продуктом.

    курсовая работа [4,1 M], добавлен 17.07.2012

  • Разработка инфологической и даталогической модели, обобщенного алгоритма и средств защиты программы по автоматизации начисления заработной платы на основе платформы 1С:Предприятие 7.7, входные и выходные параметры, программный код проведения документа.

    курсовая работа [2,0 M], добавлен 23.06.2011

  • Информация как объект хранения, преобразования и передачи. Объединение источников и получателей информации в информационную систему. Синтаксический, семантический и прагматический аспекты информации. Степень структуризации информационных данных.

    презентация [36,5 K], добавлен 14.10.2013

  • Характеристика предприятия, оценка его конкурентоспособности. Экономическая безопасность предприятия. Сущность и задачи розничной торговли. Виды переоценки. Адаптация платформы 1С:Предприятие. Структура конфигурации. Режим проведения торговых операций.

    дипломная работа [1,2 M], добавлен 14.01.2012

  • Архитектура и технология функционирования системы. Извлечение, преобразование и загрузка данных. Oracle Database для реализации хранилища данных. Создание структуры хранилища. Механизм работы системы с точки зрения пользователя и с точки зрения платформы.

    курсовая работа [2,2 M], добавлен 22.02.2013

  • Состав и структура автоматизированной информационной системы. Применение технических средств для получения информации. Преобразования экономической информации, создание форм и последовательность их выполнения. Требования к базе данных и их реализация.

    контрольная работа [45,7 K], добавлен 30.12.2009

  • Разработка программы для автоматизации складского учета. Описание предметной области и технологии функционирования информационной системы. Физическое проектирование базы данных. Создание экранных форм ввода-вывода, отчетов, модулей для прикладных решений.

    курсовая работа [3,6 M], добавлен 08.12.2013

  • Методы построения хранилища данных на основе информационной системы реального коммерческого предприятия. Основные аналитические задачи, для решения которых планируется внедрение хранилищ данных. Загрузка процессоров на серверах. Схемы хранения данных.

    контрольная работа [401,0 K], добавлен 31.05.2013

  • Организация корпоративного файлового сервера, выполняющего функции прокси-сервера на базе ОС Linux. Процесс его реализации. Выбор оптимальной аппаратно-программной платформы. Расчёт сметы затрат на выполнение объёма работ по созданию FTP-сервера.

    дипломная работа [2,0 M], добавлен 06.07.2012

  • Обзор существующих технологий разработки программного обеспечения. Описание платформы NET Framework. Принцип работы платформы: компиляция исходного кода; процесс загрузки и исполнения кода; IL-код и верификация. Новые возможности платформы NET Framework.

    реферат [30,7 K], добавлен 01.03.2011

  • Сведения о платформе Microsoft.NET Framework, способы и методы доступа к базам данных и системам управления базами данных, особенности проектирования и программирования баз данных средствами выше упомянутой платформы. Спроектировано приложение "Articles".

    курсовая работа [5,9 M], добавлен 20.03.2011

  • Проектирование модуля на базе 1С Предприятие для предприятия, занимающегося сборкой и ремонтом компьютеров. Разработка конфигурации информационной системы. Описание 1C Предприятие. Проектирование конфигурации. Создание справочников, документов и отчетов.

    курсовая работа [1,7 M], добавлен 28.07.2015

  • Разработка программы, создающей и управляющей базой данных, ее реализация на языке Turbo Pascal. Организация алгоритма программы. Вывод информации и возможность добавления информации в базу данных. Поиск информации в базе данных по заданному значению.

    курсовая работа [26,7 K], добавлен 19.06.2010

  • Анализ предметной области и разработка проекта информационной системы по поддержке пользователей на базе 1С: Предприятие. Проведение формализации логических моделей информационных процессов и процедур в проектной системе. Реализация функций системы 1С.

    дипломная работа [1,9 M], добавлен 27.01.2013

  • Автоматизация процессов, связанных с обучением студента в колледже: учет абитуриентов и зачисление в колледж, перемещение студентов с курса на курс, из группы в группу, выпуск и отчисление. Концепция "1С: Предприятия". Выбор языка программирования.

    дипломная работа [305,8 K], добавлен 12.07.2012

  • Учет оказываемых услуг в стоматологической клинике. Автоматизация бизнес-процессов. Технологическая платформа "1С: Предприятие". Описание конфигурации, объектов метаданных. Отображение процесса ввода данных и формирования документов. Регистры бухгалтерии.

    дипломная работа [1,9 M], добавлен 17.11.2015

  • Изучение существующих методов и программного обеспечения для извлечения числовых данных из графической информации. Программное обеспечение "graphtrace", его структура и методы обработки данных. Использование этой системы для данных различного типа.

    дипломная работа [3,9 M], добавлен 06.03.2013

  • Разработка конфигурации, реализующей учет товаров на складе хозяйственных товаров. Составляющие конфигурации, хранение в константах одного значения в базе данных. Разработка управляемого приложения, анализ данных. Реализация бизнес-процессов и задач.

    курсовая работа [2,9 M], добавлен 01.04.2013

  • Основные виды баз данных. Система управления базами данных. Анализ деятельности и информации, обрабатываемой в поликлинике. Состав таблиц в базе данных и их взаимосвязи. Методика наполнения базы данных информацией. Алгоритм создания базы данных.

    курсовая работа [3,1 M], добавлен 17.12.2014

  • Публикации на Интернет-сервере запросов к базе данных. Реализация интерфейсной части информационной подсистемы, экранных форм и SQL запросов. Обоснование требований к серверу и рабочей станции пользователя. Расчёт себестоимости подсистемы "Запросы в ЖКХ".

    дипломная работа [6,7 M], добавлен 29.06.2011

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.