Разработка модели предиктивной аналитики работоспособности компрессорного оборудования, основанной на анализе диагностических данных
Рассмотрение возможности использования известных методов машинного обучения для анализа отказов нефтегазового оборудования. Сущность модели предиктивной аналитики работоспособности компрессорного оборудования, основанной на анализе диагностических данных.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 01.08.2022 |
Размер файла | 159,6 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Размещено на http://www.allbest.ru/
Институт нефтегазового инжиниринга и цифровых технологий
Уфимский государственный нефтяной технический университет
Разработка модели предиктивной аналитики работоспособности компрессорного оборудования, основанной на анализе диагностических данных
Садыков Ильгам Радикович, студент (магистрант)
Научный руководитель: Кулаков Пётр Алексеевич
Аннотация
В статье рассматриваются возможность использования известных методов машинного обучения для анализа отказов нефтегазового оборудования. В качестве исходных данных взят набор реальных данных с одного из нефтеперерабатывающих заводов г. Уфа. Для обработки и интерпретации результатов применен программный комплекс «Python».
Ключевые слова: нефтегазовое оборудование, анализ отказов оборудования, анализ данных, машинное обучение, «деревья принятия решений».
Annotation
The article discusses the possibility of using well-known machine learning methods for oil and gas equipment failure analysis. A set of real data from one of the oil refineries in Ufa was taken as the initial data. The Python software package was used to process and interpret the results.
Key words: oil and gas equipment, equipment failure analysis, data analysis, machine learning, «decision trees».
Одним из главных экономических расходов любого нефтегазового предприятия, является ремонт и обслуживание оборудования, поскольку они часто выходят из строя и на их ремонт, зачастую, привлекаются большое количество рабочих и в ходе ремонта объект простаивает без работы. В связи с этим возникает следующая задача: научиться прогнозировать отказы оборудования для своевременной ревизии всех узлов и деталей, четкого планирования ремонтных работ (совмещая их с плановыми остановами оборудования), а также выявления скрытых закономерностей отказов.
Поскольку большинство современных предприятий оснащены высокоточными датчиками, тщательный анализ записанных значений может показать пути прогнозирования отказов.
В работе рассмотрены возможности использования методов машинного обучения для анализа реальных данных по вибрации ключевых узлов центробежного компрессора. Так как машинное обучение - это класс методов автоматического создания прогнозных моделей на основе большого массива данных этот инструмент лучше всего подходит для обработки вышеупомянутых параметров.
Одним из надежных методов машинного обучения является метод «деревьев решений», который представляет собой древовидную структуру, похожую на блок-схему, где внутренний узел представляет функцию, ветвь представляет правило решения, а каждый конечный узел представляет результат. Он учится разделять на основе значения атрибута, которое называется пороговым значением[1].
На рисунке 1 представлено дерево решения для массива данных, в котором «node №0» корневой узел с которого начинается расщепление значений. «Xn» означает параметр, по которому происходит расщепление. Например: Xi - возраст, Х2 - зарплата, Х3 - пол и т.д. «Samples» - количество либо доля значений, входящих в массив данных; «value» - количество либо доля значений, отнесенных в каждый класс (0 или 1). Цвета обозначают принадлежность узла (по большинству значений) к классам объектов. Чем темнее цвет, тем большая доля значений принадлежат к конкретному классу. Светлые цвета обозначают равенство, представленных в узле классов.
Рисунок 1. Дерево принятия решений
предиктивный работоспособность компрессорный
Описанный выше алгоритм в данном случае, обучаясь на тренировочных данных, выявил те диапазоны значений параметров, в которых ранее происходили остановы либо отказы оборудования. Опираясь на эти данные, дерево построило модель для вновь поступивших значений[2].
Предметом изучения данной исследовательской работы является массив реальных данных полученных в одном из нефтеперерабатывающих заводов г. Уфа. Данные представляют собой значения параметров вибрации (виброперемещения в мкм) центробежного компрессорного агрегата, которые были записаны в течение двух лет через каждые 12 часов, что составляет 1464 строк в программе «excel». Также известны даты, в которых произошли остановы оборудования.
Для исследования набора данных дни, в которых происходили остановы оборудования, промаркированы цифрой «1» безотказные дни цифрой «0». Для достоверного анализа массива данных было предположено, что дефект зарождался задолго до дня остановки. Поэтому цифрой «1» были пронумерованы предыдущие 15 значений до отказа. Данный прием позволил исключить влияние «выбросов» на конечный результат.
По причине отсутствия большого количества данных тестовый набор был спроектирован самостоятельно в отдельном файле «test», из имеющегося массива обучающей выборки «train», путем отбора 3-го и 10-го (из 15) строк остановов. По правилам машинного обучения тестовая выборка должна составлять 20% от обучающей выборки (в данном случае должно быть 293 строки). Поэтому, оставшиеся строки заполняем строками, метки которых равны нулю.
В начале исследований «дерево решений» показывает 45% точности прогнозов, что не является приемлемым результатом для прогнозирования отказов.
Для увеличения показателей точности вручную были подобраны значения внутренних параметров дерева, куда относится: глубина дерева и количество элементов в узле разбиения. Они составили 9 и 2 соответственно. После корректировки внутренних параметров «дерева решений» точность повысилась до 89%, что вполне приемлемый результат для условий ограниченных данных.
В общем виде схема проведения исследований выглядит, как показано на рисунке 2.
Рисунок 2. Блок-схема исследовательской работы
Анализ результатов исследования показал, что остановы случались в те моменты, когда показания значений вибраций находились за пределами определенных значений. Так, параметр который зашифрован как «Х9» должен работать в диапазоне от 22,1 до 42,6 мкм; «Xg» - до 0,07 мкм; «Хо» - до 2,1 мкм; Х11 - от 50,4 до 60,5 мкм. Отклонения значений за пределы указанных могут привезти к отказам оборудования.
Модель рекомендуется применять в дальнейших анализах отказов оборудования как дополнительный критерий оценки отказа, так как на данном этапе недостаточная база данных работы динамического оборудования не позволяют провести гиперплоскость между данными безотказного режима работы и отказами оборудования. Для дальнейшего исследования требуется генерация новых признаков, из существующих наборов данных, и большее количество измерений.
Использованные источники
1. Хенрик Бринк, Машинное обучение/ Хенрик Бринк. - Санкт Петербург: Изд-во ООО «Питер Пресс», 2017. - С. 15-55.
2. Лекция 10. Деревья классификации и регрессии [Электронный ресурс]. URL:https://www.youtube.com/watch?v=hqnsTBKJ5Lg&list=PLlb7e2G7aSpRb9 5_Wi7lZ-zA6fOjV3_l7&index=10 (дата обращения: 16.02.2022).
Размещено на Allbest.ru
...Подобные документы
Сбор ключевой статистики по интерфейсам, проведение аналитики и выдвижение гипотез по улучшению продукта. Рассмотрение методов анализа данных на базе конкретного проекта. Расположение инструментов на экране и порядок взаимодействия с ними у пользователя.
курсовая работа [664,7 K], добавлен 01.01.2018Обзор архитектуры СУБД SQL Server. Описание и анализ областей применения средств бизнес-аналитики, таких как многомерный анализ данных и интеллектуальный анализ данных. Обзор языковых средств, методов и экспериментальное применение полученных сведений.
дипломная работа [2,2 M], добавлен 09.07.2014Анализ современных информационно-поисковых систем автоматизации производства. Основные виды, требования и параметры технологического оборудования для сборочно-монтажных работ. Разработка физической модели базы данных технологического оборудования.
дипломная работа [1,5 M], добавлен 02.09.2014Проектирование базы данных, содержащей информацию, которая всесторонне характеризует российский рынок медицинского оборудования. Описание атрибутов сущностей и связей, отраженных в разработанной ER-модели. Разработка отчетов, форм, запросов в базе данных.
курсовая работа [3,2 M], добавлен 19.06.2015Разработка приложения, позволяющего вести полноценный учет оборудования, использующегося на предприятии: отслеживать движение оборудования по отелам предприятия, просматривать перечень оборудования и его цену, добавлять, удалять, редактировать записи.
курсовая работа [4,4 M], добавлен 01.07.2011Метод извлечения информации о личностных характеристиках пользователя с помощью технологии распознавания лица. Разработка алгоритма работы рекомендательной системы, основанной на психологическом портрете пользователя, хранилища баз данных и интерфейса.
курсовая работа [815,2 K], добавлен 21.09.2016Определение, свойства базы данных. Рассмотрение применения баз данных в малом и среднем бизнесе. Описание приложения для отслеживания заказов клиентов магазина лабораторного оборудования, наличия товаров, менеджеров, которые продали оборудование клиенту.
контрольная работа [970,1 K], добавлен 25.06.2015Автоматизация работы отдела информационных технологий ООО "Бентек Дриллинг энд Ойлфилд Системс". Создание информационной системы для учета и анализа оборудования. Создание базы данных сотрудников, номенклатуры IT оборудования и программного обеспечения.
дипломная работа [4,6 M], добавлен 21.06.2011Определенная логическая структура данных, которые хранятся в базе данных. Основные модели данных. Элементы реляционной модели данных. Пример использования внешних ключей. Основные требования, предъявляемые к отношениям реляционной модели данных.
презентация [11,7 K], добавлен 14.10.2013Анализ криптографических методов шифрования данных. Разработка криптосистемы, основанной на схеме Эль-Гамаля. Определение функциональных и нефункциональных требований. Выбор языка программирования и среды разработки. Тестирование программного продукта.
дипломная работа [1,6 M], добавлен 17.07.2016Разработка топологии информационной сети. Разбиение сети на подсети. Разработка схемы расположения сетевого оборудования. Калькулирование спецификации сетевого оборудования и ПО. Расчет работоспособности информационной сети. Классификация видов угроз.
курсовая работа [2,6 M], добавлен 10.01.2016Порядок сообщения об авариях, расследования аварий и отказов в работе электроустановок. Разработка автоматизированной системы учета отказов и основных дефектов электроэнергетического оборудования. Инструментарий реализации программного комплекса.
дипломная работа [4,0 M], добавлен 26.06.2013Проектирование и разработка базы данных, основанной на инфологической модели по семантическому описанию. Информационно-логическая модель. Проверка таблиц на соответствие нормальным формам. Запросы на создание таблиц и установлению связей между ними.
курсовая работа [476,7 K], добавлен 19.11.2022Проектирование базы данных, в которой хранится информация об оборудовании, количестве его отказов, персонале, должностях, бригадах, графике работы сотрудников. Схема и описание логической и физической модели. Построение запросов на языке SQL к БД.
курсовая работа [53,4 K], добавлен 14.03.2015Анализ информационно-поисковых систем автоматизации производства. Построение инфологической и логической модели базы данных технологического оборудования для сборочно-монтажных работ. Выбор языка программирования приложения БД. Алгоритм работы программы.
дипломная работа [2,5 M], добавлен 18.12.2013Разработка информационно-аналитической системы агентства недвижимости. Обоснование выбора архитектуры базы данных и СУБД. Моделирование потоков данных (DFD диаграмм). Проектирование инфологической модели данных с использованием модели "сущность-связь".
дипломная работа [5,4 M], добавлен 06.06.2013Особенности создания учетных записей на файловом сервере. Разработка функциональной модели базы данных. Отчет по дугам модели. Сущность, атрибуты и связи информационной модели. Разработка базы данных в системе управления базами данных MS Access.
контрольная работа [2,3 M], добавлен 23.01.2014Сущность и характеристика типов моделей данных: иерархическая, сетевая и реляционная. Базовые понятия реляционной модели данных. Атрибуты, схема отношения базы данных. Условия целостности данных. Связи между таблицами. Общие представления о модели данных.
курсовая работа [36,1 K], добавлен 29.01.2011Анализ руководящих документов по антитеррору и проведению специальных операций. Анализ современных методов 3D-моделирования, его функциональные возможности и методы повышения оптимизации. Разработка имитационной 3D-модели, и базы данных филиала.
дипломная работа [5,0 M], добавлен 03.06.2013Модели данных как формальный аппарат для описания информационных потребностей пользователей. Структура информационной базы. Типы взаимосвязей. Разработка логической структуры базы для хранения данных о пяти поставщиках. Детализация реляционной модели.
презентация [28,9 K], добавлен 07.12.2013