Optical Character Recognition (OCR) решения и их использование в СЭД
Анализ модулей оптического распознавания символов как инструмента оптимизации работы с потоком документов в системах электронного документооборота. Технология автоматизации процессов принятия управленческих и организационных решений в организациях.
Рубрика | Программирование, компьютеры и кибернетика |
Вид | статья |
Язык | русский |
Дата добавления | 06.12.2024 |
Размер файла | 71,5 K |
Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже
Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.
Размещено на http://www.allbest.ru/
Optical Character Recognition (OCR) решения и их использование в СЭД
Перова Марина Викторовна, Заведующая кафедры информационных технологий; Жуковский Сергей Романович, Студент, Южно-Российский институт, управления - филиал Российской академии народного хозяйства и государственной службы при Президенте РФ
Аннотация
В данной статье анализируется технология (модуль) OCR (ОРС) как инструмент оптимизации работы с большим потоком документов и технологии автоматизации управленческих и организационных процессов государственного сектора и бизнес-структур. Технология оптического распознавания символов имеет определенные этапы считывания текстовой информации и технологии, которые оптимизируют данные этапы, минимизируя риск ошибок распознавания информации и, как следствие, оцифровки документов. Использование модуля ОРС совместно с технологиями машинного обучения, нейросетями, модулем ИИ для СЭД и других новшеств современного ИТ-рынка позволяет реализовать масштабирование и интеграцию ОРС в различных сценариях использования, а также увеличить количество сценариев использования модуля, тем самым позволив органам власти и бизнесу высвободить значительное количество временных, финансовых и кадровых ресурсов.
Ключевые слова: OCR, нейросети, машинное обучение, система электронного документооборота, распознавание информации, API.
Annotation
Optical Character Recognition (OCR) solutions and their use in EDMS
This article analyzes the technology (module) OCR (OCR) as a tool for optimizing work with a large flow of documents and technology for automating managerial and organizational processes in the public sector and business structures. Optical character recognition technology has certain stages of reading text information and technologies that optimize these stages, minimizing the risk of information recognition errors and, as a result, digitization of documents. The use of the LFS module in conjunction with machine learning technologies, neural networks, the AI module for EDMS and other innovations of the modern IT market allows for scaling and integration of the LFS in various use scenarios, as well as increasing the number of scenarios for using the module, thereby allowing authorities and businesses to free up a significant amount of time, financial and human resources.
Keywords: OCR, neural networks, machine learning, electronic document management system, information recognition, API.
В современном мире использование систем электронного документооборота (СЭД), а также различных технологий обработки электронной информации становится все более распространено за счет политики импортозамещения на рынке ИТ-решений в РФ, а также желанием государственного сектора и бизнеса оптимизировать управленческие и организационные процессы, тем самым высвободив значительное количество кадровых, временных и финансовых ресурсов.
При этом вопросы, связанные с документационным обеспечением органов власти и бизнеса, касающиеся оцифровки текстовых файлов, поступающей документации, автономного распознавания текста и перевода его в удобный для пользователя цифровой формат имеют огромное значение в рамках процесса обработки документации. Современное ИТ -решение optical character recognition - OCR (Оптическое распознавание символов - ОРС) - выступая модулем СЭД или микросервисной технологией значительно упрощает входящую обработку документации и последующую работу с ней. Технология заключается в интеллектуальном распознавании не оцифрованного документа посредством предоставления API для точной идентификации символов с изображений и отсканированных документов на различных языках и форматах [1, с. 6]. Проще говоря интеллектуальная система при распознавании текста в документах сканирует текстовый слой посимвольно и вытаскивает его из документа для дальнейшего редактирования. В случае с изображениями (сканами документов), интеллектуальная система разбивает его на блоки с помощью алгоритма топологического структурного анализа бинарных изображений [2, с. 46]. Далее на каждом блоке выделенного изображения происходит распознавание текстовых символов с помощью системной библиотеки.
В соответствии с Указом Президента от 10.10.2019 года «О развитии искусственного интеллекта в Российской Федерации», а также Национальным проектом «Цифровая экономика» развитие цифровых технологий и искусственного интеллекта становятся приоритетными направлениями развития экономики и государственного управления. Это касается прежде всего нейросетевого взаимодействия, технологий искусственного интеллекта, машинного обучения, цифровых инфраструктурных решений для бизнеса и государства и многого другого. Использование новых цифровых технологий в российском государственном секторе и экономических отношениях выходят на передовые позиции государственной политики, как средства технологического совершенствования [7].
Российский рынок OCR-решений не стал исключением и был вовлечен в развитии ИТ-рынка РФ в целом и отдельных компаний после ухода из РФ крупномасштабного разработчика серии продуктов FineReader - компании ABBYY. На 2022 год выручка разработчиков OCR-продуктов упала на 24% по сравнению с 2021 годом, так как компания ABBYY занимала более 2/3 всего рынка соответствующих технологий [6]. Однако, активная политика импортозамещения и стремление компаний к независимости от зарубежных продуктов привели в 2023 году к взлету рынка финтех-разработчиков и вендоров на 43% по сравнению с 2022 годом (рис. 1).
Рис. 1. Динамика совокупной выручки ИТ-рынка в РФ [8].
Современные OCR-решения продукты используются повсеместно и в государственном секторе, экономике, бизнесе. Один из флагманских продуктов Content AI -- ContentCapture, универсальная платформа для интеллектуальной обработки информации. Решение, призванное заменить продукт ABBYY FlexiCapture, включено в дорожную карту развития и поддержки нового общесистемного программного обеспечения (НОПО).Продукт Content AI отнесен к разряду общесистемного ПО, поскольку он комплексно решает целый ряд задач, связанных с обработкой бухгалтерских, финансовых, юридических документов как для крупного, так и для среднего бизнеса.ContentCapture обрабатывает в едином потоке бумажные и электронные документы любых типов: отсканированные бумаги, фотографии, тексты, PDF-файлы, полученные из разных источников -- электронных писем, FTP, «горячих папок», мобильных устройств, МФУ, сетевых сканеров. Причем разные форматы документов можно обрабатывать одновременно [9].
В 2023 году команда СЭД Тезис активно вела разработки в области искусственного интеллекта и его использования в СЭД и цифровой экономике. Встроенные модули ИИ, одним из которых является использование OCR совместно с ИТ-инфраструктурой компании или органа власти, позволяют оптимизировать значительную часть процессов по управлению и хранению данными, потоками документов, а также решение текущих процессов на основе обучения систем искусственного интеллекта в конкретной системе. Не исключением становится OCR-модуль, который основан на технологиях искусственного интеллекта и являющийся одним из передовых направлений разработки программного обеспечения и его комплектующих для бизнеса и государственного управления. На 2024 год модули ИИ внесены в Роспатент и используются в рамках государственных программ по цифровизации государственного и муниципального управления, в цифровой экономике, в бизнес-процессах, а также во взаимодействии общества и государства. Как раз таки развитие технологий искусственного интеллекта в РФ усилило необходимость и желание российских компаний привлечь дополнительные инструменты для оптимизации процессов, в том числе оцифровке бумажной документации [10].
ОРС-решение в качестве модуля СЭД имеет собственный алгоритм оптимизации и может быть связан с машинным обучением, искусственным интеллектом (ИИ) и интегрированными системами электронного документооборота (ЭДО) для автоматизации не только распознавания выходных документов, но и работы с архивной документацией, обращениями и внутриведомственной текущей документацией.
ОРС модуль имеет 3 стадии обработки изображения или документа:
1. Обработка изображений. В основном при обработке изображений используются 2 технологии: функциональное выравнивание Гаусса и бинаризация входящего изображения. Первая технология позволяет избавиться от неровного расположения текстовых полей отсканированного документа и минимизировать «шум» для более четкой оцифровки. Вторая же направлена на считывание символов текста и перевод их из цветного формата в черно-белый для упрощения последующей работы с текстом.
2. Сегментация. На втором этапе изображение проходит компьютерноматематическую обработку на основании проверки корректности текста и его основных параметров. То есть изображение делится на бинарные топологические единицы и с помощью модуля ИИ и математических вычислений данных изображения производится обработка корректности текстовых строк и параметров документа.
3. Распознавание символов. В основном распознавание символов основаны на методе интеллектуального извлечения, где каждый символ считывается и извлекается на основе определенных систематических правил семантики и графической структуры изображения - пиксельной схемы сканированного документа [3, с. 90].
Сама технология ОРС имеет несколько сценариев использования, популярными из которых являются: оцифровка архивов, классификация и маршрутизация текущих документов, полнотекстовая сверка и сверка с шаблоном, обработка первичной документации, обработка кадровых документов, выверка данных и модификация документов. Данные сценарии представлены командной SOICA компании SL Soft [4]. По их мнению, использование ОРС решений в данных направлениях позволяет автоматизировать государственные и бизнес управленческие процессы, а также интегрировать новую среду ИИ в СЭД. Сама же технология ОРС на базе каст- программного обеспечения отечественных разработчиков способна к развертыванию и масштабированию за счет крупной контейнеризации и, в случае необходимости, технология может быть перемещена на новые мощности для увеличения пропускной способности или же при создании нового контейнера модуля ОРС.
Примером масштабирования технологии является интеграция решения российского вендора Content AI совместно с крупнейшим в РФ поставщиком ИТ - решений ЭОС. Компания ЭОС официально перешла на использование в своих решениях российского продукта ContentReader Engine -- многофункционального OCR SDK для встраивания в приложения функций интеллектуального распознавания информации. Технологии ContentReader Engine применяются в модуле потокового ввода данных в СЭД «ДЕЛО». С их помощью пользователи СЭД могут быстро и точно распознавать информацию в разных типах документов, изображений, фотографий, скриншотов, мониторов и дисплеев с сохранением в форматах Word, Excel, PDF и других. Это позволяет в дальнейшем осуществлять полнотекстовый поиск по документам [5].
Таким образом, использование ОСЯ модуля является важным компонентом систем электронного документооборота (СЭД), так как позволяет автоматически распознавать текст из отсканированных документов. Это упрощает процесс работы с большим объемом документов, так как устраняется необходимость вручную перепечатывать информацию. Однако, при выборе OCR решения для СЭД следует учитывать несколько важных факторов. Важно, чтобы система обладала высокой точностью распознавания текста, а также поддерживала различные языки и форматы документов. Также стоит обратить внимание на скорость работы и интеграционные возможности с другими компонентами СЭД, что позволит внедрять и масштабировать данную технологию в различные сценарии использования.
оптическое распознавание электронный документооборот
Список используемой литературы
1. Аверьянова А.Н., Атанов В.В., Кеся М.С., Можнов Е.С. Использование интеллектуальных микросервисов в современных системах электронного документооборота // Форум молодых ученых. 2023. №5.
2. Бикметова М.Р., Азбуханов А.Ф. Использование машинного обучения для автоматизации электронного документооборота на предприятии // Информационные технологии: проблемы и решения. Уфа. 2021. №3. С. 76
3. Хоменко Т.В., Иргалиев А.А., Тараканов В.Д. Моделирование процесса распознавания символов в нормативных документах организации // Вестник АГТУ. Серия: Управление, вычислительная техника и информатика. 2023. №2.
4. SOICA: как OCR помогает автоматизировать документооборот. Tadviser. Официальный сайт
5. Российский вендор Content AI будет внедрять свои технологии в СЭД/ECM-решения разработчика систем управления документооборотом ЭОС. ЭОС. Официальный сайт.
6. Россия без FineReader: рынок OCR за год упал на четверть. Cnews. Официальный сайт.
7. Указ Президента РФ от 10.10.2019. «О развитии искусственного интеллекта (совместно с Национальной стратегией развития искусственного интеллекта на период до 2030 года)». // Информационно-правовой портал Гарант
8. Выручка ИТ-компаний в России выросла на 43%. Минцифры. Официальный портал.
9. ContentCapture -- универсальный инструмент для интеллектуальной обработки документов. Tadviser. Официальный сайт
10. СЭД ТЕЗИС: Возможности модуля искусственного интеллекта. Tadviser. Официальный сайт
Размещено на Allbest.ru
...Подобные документы
Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.
презентация [469,2 K], добавлен 15.03.2015Как работает система оптического распознавания. Деление текста на символы. Образ страницы и распознавание по шаблонам, особенности коррекции ошибок. Увеличение скорости бесклавиатурного ввода документов в технологиях электронного документооборота.
контрольная работа [15,6 K], добавлен 29.04.2011Оптическое распознавание символов как механический или электронный перевод изображений рукописного, машинописного или печатного текста в последовательность кодов. Компьютерные программы для оптического распознавания символов и их характеристика.
презентация [855,2 K], добавлен 20.12.2011Методы предобработки изображений текстовых символов. Статистические распределения точек. Интегральные преобразования и структурный анализ. Реализация алгоритма распознавания букв. Анализ алгоритмов оптического распознавания символов. Сравнение с эталоном.
курсовая работа [2,1 M], добавлен 20.09.2014Принципы автоматизации и типы архитектур систем учета электронного документооборота. Бизнес-процессы в среде "1С: Предприятие 8". Структура информационной базы электронного документооборота деканата. Объекты и методы механизма бизнес-процессов.
дипломная работа [773,9 K], добавлен 27.06.2013Классификация и сравнение программных продуктов в области электронного управления документацией. Информационное исследование и анализ процессов, подлежащих автоматизации на предприятии. Внедрение системы корпоративного электронного документооборота.
дипломная работа [5,4 M], добавлен 29.06.2012Комплекс, предназначенный для обработки документов и автоматизации работы пользователей в системах управления. Состав и основные компоненты электронного офиса. Информационные технологии виртуальных офисов. Использование интерактивной машинной графики.
лекция [28,1 K], добавлен 25.06.2013Понятие бизнес-процесса. Формы автоматизации регистрации документов. Функции систем электронного управления делопроизводства и документооборота, обоснование их выбора и практическое применение. Структура рынка программных продуктов в области ЭУД.
курсовая работа [232,8 K], добавлен 17.07.2013Делопроизводство бумажных и электронных документов. Современные системы электронного документооборота и системы автоматизации классического делопроизводства. Создание безбумажного делопроизводства в загруженных участках управленческой деятельности.
курсовая работа [501,8 K], добавлен 08.12.2010Понятие электронного документа, отличие от иных видов документов. Юридическая сила и правовой режим электронного документа и документооборота. Процедуры разрешения конфликтов. Основные типы текстовых электронных документов и выбор средств их оформления.
реферат [24,5 K], добавлен 22.08.2010Использование информационных технологий в здравоохранении. Автоматизация электронного документооборота. Обзор рынка медицинских услуг. Здравоохранение в США. Программная реализация автоматизации электронного документооборота медицинских учреждений.
отчет по практике [201,0 K], добавлен 27.04.2016Системы и задачи их анализа. Методы системного анализа: аналитические; математические. Сущность автоматизации управления в сложных системах. Структура системы с управлением, пути совершенствования. Цель автоматизации управления. Этапы приятия решений.
реферат [324,3 K], добавлен 25.07.2010Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.
дипломная работа [887,3 K], добавлен 26.11.2013Анализ структуры и методологии CASE-средств. Методологии проектирования, используемые в CASE-средствах. Основные понятия о системах электронного документооборота, их создание с помощью CASE-средств. Объектно-ориентированное и структурное проектирование.
курсовая работа [67,9 K], добавлен 18.07.2014Общая характеристика основных подходов к автоматизации документооборота и процессов управления в бизнес-процессе организации. Описание, функции и назначение системы электронного документооборота (СЭД), а также анализ проблем ее комплексной реализации.
реферат [23,3 K], добавлен 12.10.2010Методы решения проблем, возникающих на стадиях и этапах процесса принятия решений, их реализация в информационных системах поддержки принятия решений (СППР). Назначение СППР, история их эволюции и характеристика. Основные типы СППР, области их применения.
реферат [389,3 K], добавлен 22.11.2016Процессы распознавания символов. Шаблонные и структурные алгоритмы распознавания. Процесс обработки поступающего документа. Обзор существующих приложений по оптическому распознаванию символов. Определение фиксированного шага и сегментация слов.
дипломная работа [3,3 M], добавлен 11.02.2017Разработка проекта автоматизации документооборота при помощи механизма бизнес-процессов и с использованием современных программных наработок в 1С:Предпирятие. Создание информационной базы "Деканат" для обработки данных процесса обучения студентов.
дипломная работа [954,8 K], добавлен 26.07.2013Краткие сведения о системах принятия решения в режиме показа формул и в режиме пользователя. Принципы решения задач оптимизации. Построение математической модели. Диаграмма "Оптимизация плана перевозок". Создание таблицы БД в Access: база данных, запросы.
курсовая работа [482,3 K], добавлен 12.08.2012Анализ бизнес-процессов, информационных потоков и уровня автоматизации деятельности риэлтерского агентства. Разработка модуля поддержки взаимоотношений с клиентом и электронного документооборота. Логическая схема проектируемой информационной системы.
дипломная работа [2,7 M], добавлен 10.02.2012