Подходы к интеграции методов машинного обучения и технологии блокчейн

Возможности применения технологии блокчейн для повышения эффективности работы методов машинного обучения. Тенденции практического применения нейронных сетей и технологии блокчейн. Формирование обучающих выборок, сбор данных распределенными системами.

Рубрика Программирование, компьютеры и кибернетика
Вид статья
Язык русский
Дата добавления 10.05.2022
Размер файла 145,8 K

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.allbest.ru/

Подходы к интеграции методов машинного обучения и технологии блокчейн

Частикова Вера Аркадьевна

Малыхина Мария Петровна

Зотина Юлия Салеховна

Аннотация

Рассмотрены возможности применения технологии блокчейн для повышения эффективности работы методов машинного обучения. Также проведен анализ тенденций практического применения нейронных сетей и технологии блокчейн. Одной из основных проблем разработки нейронных сетей является формирование обучающих выборок. Особенности обработки данных платформами блокчейн предоставляют возможность решить эту проблему. Практической базой для построения обучающих выборок нейронных сетей может стать информация, используемая в цепочках блокчейн. Специфика сбора данных распределенными системами позволяет избежать ряда типовых трудностей, встречающихся при создании обучающих выборок. Особенности объединяемых технологий накладывают некоторые ограничения на возможные методы интеграции. Тем не менее расхождения между архитектурами цепочек блокчейн и нейронных сетей можно решить путем разбиения итогового решения на отдельные смысловые части.

Ключевые слова: нейронные сети, технология блокчейн, обучающие выборки, распределенные системы, экспертные системы, умные контракты.

Abstract

Chastikova Vera Arkadyevna

Associate Professor, Candidate of Technical Sciences, Associate Professor of the Department of Computer Technologies and Information Security, Institute of Computer Systems and Information Security, Kuban State University of Technology

Malykhina Mariya Petrovna

Professor, Candidate of Technical Sciences, Professor of the Department of Computer Technologies and Information Security, Institute of Computer Systems and Information Security, Kuban State University of Technology

Zotina Yuliya Salekhovna

Student, Institute of Computer Systems and Information Security, Kuban State University of Technology

Approaches to integrating machine learning methods and blockchain technology

This article discusses the possibilities of using blockchain technology to increase the efficiency of machine learning methods. An analysis of trends in the practical application of neural networks and blockchain technology was also carried out.

One of the main problems in the development of neural networks is the formation of training samples.

Features of data processing by blockchain platforms provide an opportunity to solve this problem.

A practical basis for constructing training samples of neural networks can be information used in blockchain chains. The specificity of data collection by distributed systems avoids a number of typical difficulties encountered in the creation of training samples. Features of the combined technologies impose some restrictions on possible integration methods. Nevertheless, the discrepancies between the architectures of blockchain series and neural networks can be resolved by dividing the final solution into separate semantic parts.

Keywords: neural networks, blockchain technology, training samples, distributed systems, expert systems, smart contracts.

Введение

В настоящее время нейросетевые технологии применяются в обычной жизни практически повсеместно. Без использования нейронных сетей не обходится ни одно взаимодействие с большими данными. Одной из основных задач данной технологии является распознавание различных объектов и явлений [1, 2]:

- уличные камеры видеонаблюдения вычисляют в толпе скрывающихся от закона преступников;

- автоматические обработчики деловых звонков записывают результаты переговоров;

- смартфоны распознают своих владельцев по их фото и отпечаткам пальцев.

Распознанные явления зачастую приходится сразу же сортировать, выделяя уже не отдельные сущности, а целые классы объектов [3]:

- умную оценку стоимости квартиры производят на основе состояния самого помещения вместе с рынком недвижимости;

- обработчики кредитных историй позволяют сразу выявить неблагонадежных плательщиков;

- специальные сервисы сортировки электронной почты отделяют спам от полезных писем;

- средства обнаружения вторжений выявляют сетевые атаки [4].

На основе подобных закономерностей нейронные сети могут строить точные предсказания дальнейшего поведения выделенных объектов [5]:

- беспилотные автомобили учитывают ситуации на дороге и характеристики самой машины для безопасной езды;

- сетевые магазины создают рекламные рекомендации на основе предыдущих запросов пользователей;

- биржевые инструменты прогнозируют поведение курсов валют и драгоценных металлов.

С подобными задачами ранее хорошо справлялся человек, однако такая работа всегда считалась рутинной и выматывающей. Через какое-то время человек обязательно устает и начинает допускать ошибки. Правильно настроенный алгоритм не знает ни усталости, ни невнимательности, а ошибиться не может в принципе. Для корректной работы нейронной сети также требуется большая обучающая выборка, идентичная человеческому опыту. Однако на данный момент такие выборки еще не перекрывают всю способность человека адаптироваться к нестандартным ситуациям. Поэтому многие нейросетевые сервисы нуждаются в надзоре оператора:

- средства выявления онкологических заболеваний по гистологическим срезам лишь помогают врачам давать заключения;

- беспилотные автомобили на всех доступных уровнях автоматизации до сих пор требуют присутствия водителя;

- решения алгоритма удаления из социальных сетей запрещенных изображений корректируются модераторами.

Материалы и методы исследования

Для создания обучающих выборок отлично подходит технология блокчейн. Эта технология соединяет информацию в последовательные блоки, надежно связанные между собой криптографией. Объемы данных, обрабатываемых в подобных цепочках, поистине огромны. Технология блокчейн также укрепляет свои позиции и в повседневной жизни, хоть и используется несколько реже. Использование смарт-контрактов, электронных договоров, которые невозможно обойти, обмануть или подделать, позволило встроить цепочки блокчейн в следующие сферы жизни:

- средства электронного голосования;

- проведение неподкупных выборов;

- покупка и продажа недвижимости;

- операции с товарами и сырьем;

- область управления данными;

- подтверждение прав доступа;

- улучшение Интернета вещей;

- оборот электронной валюты;

- авторство и право владения.

В децентрализованных системах накапливаются самые актуальные сведения об изучаемых сущностях. Информация, которую собирают подобные сервисы, уже частично приведена к виду, удобному для создания обучающих выборок. Кроме того, определенные данные цепочек блокчейн уже используются нейронными сетями при решении описанных выше задач [6]:

- удаленный доступ к государственным услугам осуществляется только через подтвержденные цифровые профили;

- некоторые электронные платежи производятся с использованием технологии распознавания лиц;

- существуют интеллектуальные системы выявления мошеннических транзакций.

Такая особенность реализации цепочек блокчейн, как обработка большого объема информации, может сыграть важную роль при решении задачи создания обучающих выборок. Это позволяет считать совмещение технологии блокчейн с нейросетевыми технологиями реальным и перспективным направлением компьютерных наук. Подобный подход решает сразу несколько типичных проблем составления обучающих выборок для нейронных сетей [7]:

- случайное игнорирование некоторых классов объектов - если распределенная система имеет достаточно большую распространенность, то в нее рано или поздно попадут все возможные наборы наблюдаемых параметров;

- отсутствие изменений некоторых переменных - поскольку данные записываются самыми разными пользователи и конечными устройствами, то меняться будут все отслеживаемые параметры;

- недостаточный размер объектов в выборке - масштабы распределенных систем отметают этот вопрос еще на подходе.

Иными словами, размеры распределенных систем решают все вопросы масштабности и разнообразия обучающих выборок. Однако те условия формирования цепочек блокчейн, которые дадут описанные преимущества, также наложат на результирующие выборки немаловажное ограничение. Оно появляется из-за закономерной разбалансировки получающихся множеств. Так как определенные типы сущностей появляются в реальной жизни чаще других, то и в достаточно большой распределенной сети они будут всплывать в соответствии со своими вероятностными законами. Следовательно, использовать данные распределенных сетей без дополнительной обработки нельзя.

Вопрос о целесообразности такой фильтрации остается открытым. С одной стороны, подобную обработку можно произвести сразу несколькими типовыми методами нормализации. Однако объемы данных, хранящихся в распределенных системах, сильно ограничат скорость и эффективность любой фильтрации. Но именно эти объемы являются основным аргументом в пользу возможной интеграции нейросетевых технологий с цепочками блокчейн.

Данные подтягиваются в такие цепочки с помощью независимых оракулов. Это специальные программные посредники, которые передают смарт-контрактам необходимую информацию о некоторых событиях реального мира. Оракул должен быть абсолютно доверенным, поскольку к нему будут обращаться все участники распределенной системы [8]. Место оракула в цепочке блокчейн распределенной базы данных показано на рисунке 1.

В частности, эта схема отражает процедуру реагирования на инциденты с использованием умного контракта. Данные о событиях безопасности собираются оракулами из различных точек системы. Затем в теле смарт-контракта происходит сравнение собранных параметров с нормативными. На основе результатов этой проверки принимается решение о защитном реагировании. Для сбора обучающей выборки системы защиты информации все этапы реагирования записываются в распределенную базу данных. Неизменяемость журнала транзакций обеспечивается цепочкой блокчейн.

Рис. 1. Место оракула в цепочке блокчейн

Возникает гипотеза о том, что для обработки нейронными сетями больше подойдет информация, непосредственно передаваемая оракулами. В данном случае не нужно будет заниматься извлечением данных из цепочек блокчейн. Достаточно встроить в тело умного контракта метод, сразу передающий сведения оракула в некую общую базу данных. Эти же сведения могут обрабатываться нейронными сетями и в режиме реального времени.

Решения, использующие похожие подходы, обычно направлены на защиту информации. Например, различные системы поведенческого анализа не дают проводить транзакции профилям с подозрительной активностью, основываясь на предыдущих записях. Однако такие продукты строятся по типу экспертных систем, кардинальным образом отличающихся от нейронных сетей. И технология блокчейн по своей архитектуре гораздо ближе именно к экспертным системам.

Умные контракты, на которых держится любая платформа блокчейн, представляют собой набор различных инструкций, связанных условными операторами. В теле смарт-контракта попросту нет места для такой небезопасной операции, как передача данных во внешнюю среду. Языки программирования, использующиеся для написания умных контрактов, должны обеспечивать максимальную прозрачность чтения и соблюдение условий транзакций [9]:

- Kadenamint;

- Chaincode;

- Liquidity;

- Logikon;

- Solidity;

- Bamboo;

- Vyper;

- Flint;

- Ivy.

При желании смарт-контракты можно писать и на универсальных языках. Однако такой подход не дает гарантии завершения программы, что может привести к самым непредсказуемым последствиям. Языки, разработанные специально для написания умных контрактов, исключают эту уязвимость. Нейронные сети же чаще всего строятся именно на универсальных языках программирования и не имеют общего с экспертными системами в плане внутренней архитектуры. Следовательно, сами архитектуры объединяемых технологий показывают, что сочетать нейронные сети и цепочки блокчейн таким способом по меньшей мере нецелесообразно.

Основные задачи экспертных систем и нейронных сетей почти полностью совпадают. Однако механизмы работы этих архитектур очень сильно различаются. Например, логика любой экспертной системы полностью прозрачна для человеческого понимания, а все возможные результаты ее работы открыто показываются в теле программы [10, 11]. Нейронные сети работают на очень низком уровне абстракций и не могут гарантировать полную точность своих решений. Именно поэтому их методы нельзя встраивать непосредственно в платформы блокчейн. Гораздо удобнее реализовать методы машинного обучения в виде отдельного модуля платформы блокчейн. Модель создания такой системы показана на рисунке 2.

Данная модель показывает этапы создания комплекса процедур защиты информации. Прототип комплекса собирает базу инцидентов безопасности, на основе которой разработчики создают модуль реагирования, использующий методы машинного обучения. Следует помнить о том, что технология блокчейн не подразумевает хранение обработанной информации. Цепочки блокчейн работают только с криптографическими выжимками данных, поскольку иные подходы неизбежно приводят к проблеме разбухания платформы. Однако сам факт прохождения данных через смарт-контракты делает вполне возможным сохранение этой информации на тех же узлах, которые участвуют в подтверждении операций. Схема информационных потоков такой системы показана на рисунке 3.

В частности, эта схема иллюстрирует работу системы защиты информации, построенной на смарт-контрактах:

- С - следящий модуль, состоящий из оракулов, отслеживает различные параметры рабочей станции;

- Т - транзакционный модуль, состоящий из смарт-контрактов, получает данные от оракулов и сопоставляет их с принятыми решениями безопасности;

- Ш - шифрующий модуль, состоящий из разнообразных криптографических методов, принимает обращения как от платформы блокчейн, так и от самих умных контрактов;

- О - объединяющий модуль, состоящий из классических инструментов технологии блокчейн, отвечает за слаженную работу всей системы;

- Н - накапливающий модуль, состоящий из распределенных узлов, хранит децентрализованную базу данных инцидентов.

Рис. 2. Машинное обучение на платформе блокчейн

Рис. 3. Схема накопления данных цепочки блокчейн

Заключение

Таким образом, платформы блокчейн действительно могут предоставить разработчикам нейронных сетей широкие возможности для создания обучающих выборок. Можно поручить нейросетевым решениям контроль над транзакциями блокчейн. Однако при прямой интеграции методы нейронных сетей несовместимы с архитектурой распределенных вычислений. Поэтому использование описанных систем возможно только при их реализации в виде раздельных программных продуктов.

Примечания

блокчейн машинное обучение нейронная сеть

1. Хайкин С. Нейронные сети. Полный курс: пер. с англ. 2-е изд. Москва: Вильямс, 2006. 1104 с.

2. Частиков А.П., Малыхина М.П., Урвачев П.М. Анализ распознавания паттернов нейросетевыми

3. Haykin S. Neural networks. Full course: transl. from English. 2nd ed. Moscow: Williams, 2006. 1104 p.

4. Chastikov A.P., Malykhina M.P., Urvachev P.M. Analysis of pattern recognition by neural network методами // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2014. № 98. С. 457-467.

5. Барский А.Б. Логические нейронные сети. Москва: Интернет-университет информационных технологий: Бином. Лаборатория знаний, 2007. 384 с.

6. Сравнительный анализ некоторых алгоритмов роевого интеллекта при обнаружении сетевых атак нейросетевыми методами / В. А. Частикова, М.П. Малыхина, С.А. Жерлицын, Я.И. Воля // По- литематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2017. № 129. С. 106-115.

7. Круглов В.В. Искусственные нейронные сети. Теория и практика: монография. 2-е изд., стер. Москва: Горячая линия - Телеком, 2002. 382 с.

8. О внесении изменений в отдельные законодательные акты Российской Федерации в части противодействия хищению денежных средств: Федеральный закон от 27.06.2018 № 167-ФЗ // СПС Консуль- тантПлюс. Москва, 2020.

9. Кафтанников И.Л., Парасич А.В. Проблемы формирования обучающей выборки в задачах машинного обучения // Вестник ЮУрГУ. Сер.: Компьютерные технологии, управление, радиоэлектроника. 2016. Т. 16, № 3. С. 15-24.

10. Кардонов А.В. Сферы применения смарт- контрактов и риски при работе с ними // Бизнес- образование в экономике знаний. 2018. № 1. С. 44-47.

11. Обзор языков для безопасного программирования смарт-контрактов / А.В. Тюрин, И.В. Тюляндин, В. Мальцев, Я.А. Кириленко, Д.А. Березун // Труды Института системного программирования РАН. 2019. № 31 (3). С. 157-176.

12. Частиков А.П., Алешин А.В., Частикова В.А. Принципы создания регенеративных экспертных систем // Информационные технологии в моделировании и управлении: материалы II Междунар. науч.-практ. конф. 2000. С. 329-331.

13. Частиков А.П., Белов Д.Л., Частикова В. А. Регенеративные экспертные системы: монография. Краснодар, 2014. 128 с. methods // Polythematic Network Electronic Scientific Journal of the Kuban State Agrarian University. 2014. No. 98. P. 457-467.

14. Barsky A.B. Logical neural networks. Moscow: Internet University of Information Technologies: Bi- nom. Laboratoriya Znaniy, 2007. 384 p.

15. Comparative analysis of some algorithms of swarm intelligence when detecting network attacks by neural network methods / V.A. Chastikova, M.P. Malykhina,

16. S.A. Zherlitsyn, Ya.I. Volya // Polythematic Network Electronic Scientific Journal of the Kuban State Agrarian University. 2017. No. 129. P. 106-115.

17. Kruglov V.V. Artificial neural networks. Theory and practice: a monograph. 2nd ed., stereotype. Moscow: Hot Line - Telecom, 2002. 382 p.

18. On amendments to certain legislative acts of the Russian Federation in terms of countering the theft of funds: Federal Law No. 167-FZ dated June 27, 2018 // SPS ConsultantPlus. Moscow, 2020.

19. Kaftannikov I.L., Parasich A.V. Problems of training set's formation in machine learning tasks // YuUrGU Bulletin. Ser.: Computer Technologies, Management, Radioelectronics. 2016. Vol. 16, No. 3. P. 15-24.

20. Kardonov A.V. Scopes of application of smart contracts and risks at work with them // Business Education in the Knowledge Economy. 2018. No. 1. P. 44-47.

21. Review of languages for secure programming of smart contracts / A.V. Tyurin, I.V. Tyulyandin, V. Maltsev, Ya.A. Kirilenko, D.A. Berezun // Proceedings of the RAS Institute for System Programming. 2019. No. 31 (3). S. 157-176.

22. Chastikov A.P., Aleshin A.V., Chastikova V.A. Principles of creating regenerative expert systems // Information technologies in modeling and management: proceedings of the 2nd Intern. scient. and pract. conf. 2000. P. 329-331.

23. Chastikov A.P., Belov D.L., Chastikova V.A. Regenerative expert systems: a monograph. Krasnodar, 2014. 128 p.

Размещено на Allbest.ru

...

Подобные документы

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.