Главная Коллекция "Revolution" Программирование, компьютеры и кибернетика Системы автоматизации ввода и обработки информации

Системы автоматизации ввода и обработки информации

Технические средства обработки информации. Системы и устройства автоматизации ввода данных, проектирования, изображений. Программное обеспечение распознавания документов, речи; работа с PDF. Архитектура систем управления процессами распознавания ABBYY.

Рубрика	Программирование, компьютеры и кибернетика
Вид	курсовая работа
Язык	русский
Дата добавления	02.02.2017
Размер файла	777,2 K

посмотреть текст работы

скачать работу можно здесь

полная информация о работе

весь список подобных работ

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Студенты, аспиранты, молодые ученые, использующие базу знаний в своей учебе и работе, будут вам очень благодарны.

Размещено на http://www.Allbest.ru/

Оглавление

Введение

Глава 1. Автоматизация ввода информации

1.1 Устройства ввода информации

1.2 Системы автоматизации ввода данных

1.3 Распознавание речи

Глава 2. Программное обеспечение

2.1 Распознавание документов и работа с PDF

2.2 Программы для распознавания речи

Заключение

Список использованных источников и литературы

Введение

Для современной цивилизации характерна небывалая скорость развития науки, техники и новых технологий. Так, от изобретения книгопечатания (середина XV века) до изобретения радиоприемника (1895 год) прошло около 440 лет, а между изобретением радио и телевидения - около 30 лет. Разрыв во времени между изобретением транзистора и интегральной схемы составил всего 5 лет. В области накопления научной информации ее объем начиная с XVII века удваивался примерно каждые 10-15 лет. Поэтому одной из важнейших проблем человечества является лавинообразный поток информации в любой отрасли его жизнедеятельности. Подсчитано, например, что в настоящее время специалист должен тратить около 80% своего рабочего времени, чтобы уследить за всеми новыми печатными работами в его области деятельности. Увеличение информации и растущий спрос на нее обусловили появление отрасли, связанной с автоматизацией обработки информации. Этим обуславливается актуальность данной темы.

Глава 1. Автоматизация ввода информации

1.1 Устройства ввода информации

Устройства ввода информации -- приборы для занесения (ввода) данных в компьютер во время его работы. Устройствами ввода являются те устройства, посредством которых можно ввести информацию в компьютер. Главное их предназначение - реализовывать воздействие на машину. Разнообразие выпускаемых устройств ввода породили целые технологии от осязаемых до голосовых. Хотя они работают по различным принципам, но предназначаются для реализации одной задачи - позволить человеку связаться с компьютером. Устройства ввода графической информации находят широкое распространение благодаря компактности и наглядности способа представления информации для человека.

По степени автоматизации поиска и выделения элементов изображения устройства ввода графической информации делятся на два больших класса: автоматические и полуавтоматические.

В полуавтоматических устройствах ввода графической информации функции поиска и выделения элементов изображения возлагаются на человека, а преобразование координат считываемых точек выполняется автоматически. В полуавтоматических устройствах процесс поиска и выделения элементов изображения осуществляется без участия человека. Эти устройства строятся либо по принципу сканирования всего изображения с последующей его обработкой и переводом из растровой формы представления в векторную, либо по принципу слежения за линией, обеспечивающей считывание графической информации, представленной в виде графиков, диаграмм, контурных изображений. Основными областями применения устройств ввода графической информации являются системы автоматизированного проектирования, обработки изображений, обучения, управление процессами, мультипликации и многие другие. К этим устройствам относятся сканеры, кодирующие планшеты (дигитайзеры), световое перо, сенсорные экраны, цифровые фотокамеры, видеокамеры, клавиатура компьютера, манипулятор "мышь" и другие.

Рассмотрим некоторые устройства ввода информации.

1. Клавиатура

Сейчас основным широко распространенным устройством ввода информации в компьютер является клавиатура (клавишное устройство). Она реализует диалоговое общение пользователя с ПК:

- ввод команд пользователя, обеспечивающий доступ к ресурсам ПК;

- запись, корректировку и отладку программ;

- ввод данных и команд в процесс решения задачи.

В настоящее время принят стандарт клавиатуры MFII. Условно в ней можно выделить пять групп клавиш, несущих свою функциональную отгрузку. Из других видов клавиатур можно упомянуть специальные клавиши для слепых с осязаемыми точками на клавишах; клавиатуры для магазинов и складов, снабженные устройствами для считывания штрихового кода или для считывания магнитных карт; промышленные клавиатуры- сенсорные, имеющие в качестве защиты от вредных воздействий (стружек, пепла и т.д.) дополнительное покрытие клавиш специальной сенсорной фольгой; клавиатура для медицинских учреждений с устройствами для считывания информации со страховых карт. В настоящее время появились клавиатуры с дополнительными клавишами для удобства работы с той или иной операционной системой (ОС), например, клавиатура для Windows 95. Таким образом, выбор клавиатуры зависит от ОС, с которой предполагается работать.

2. Мышь

Она служит для ввода данных или одиночных команд, выбираемых из меню или текстограмм графических оболочек, выведенных на экран монитора.

Мышь представляет собой небольшую коробочку с двумя или тремя клавишами и утопленным, свободно вращающимся в любом направлении шариком на нижней поверхности. Она подключается к компьютеру при помощи специального шнура и требует специальной программной поддержки. Для работы с мышью необходима плоская поверхность, с этой целью используют резиновые коврики. Так как с помощью мыши нельзя вводить в компьютер серии команд, поэтому мышь и клавиатура - не взаимозаменяемые устройства. Назначение графических оболочек - в обеспечении инициализации множества команд без длительного набора их с клавиатуры. Это снижает вероятность опечаток и экономит время. На объекте в виде текстограммы выбирается пункт меню или символ и щелчком кнопки мыши инициализируется. Конечно, при наборе или осуществлении некоторых функций применение мыши может быть нерациональным, если, например, эти функции выполняются нажатием функциональных клавиш.

В настоящее время также существует оптическая мышь, где сигнал передается с помощью луча мыши на специальный коврик и анализируется электроникой. В настоящее время широкое распространение получает бесхвостая (бескабельная) инфракрасная мышь (принцип ее действия похож на действие пультов дистанционного управления) и радиомышь.

3. Сканеры

Для непосредственного считывания графической информации с бумажного или иного носителя в ПК применяется оптические сканеры. Сканируемое изображение считывается и преобразуется в цифровую форму элементами специального устройства: CCD - чипами.

Существует множество видов и моделей сканеров. Какой из них выбрать, зависит от задач, для которых сканер предназначается.

Самые простые сканеры распознают только два цвета: черный и белый. Такие сканеры используют для чтения штрихового кода.

Ручные сканеры - самые простые и дешевые. Основной недостаток в том, что человек сам перемещает сканер по объекту, и качество полученного изображения зависит от умения и твердости руки. Другой важный недостаток - небольшая ширина полоса сканирования, что затрудняет чтение широких оригиналов.

Барабанные сканеры применяются в профессиональной типографической деятельности. Принцип заключается в том, что оригинал на барабане освещается источником света, а фотосенсоры переводят отраженное лучение в цифровое значение.

Листовые сканеры. Их основное отличие от двух предыдущих в том, что при сканировании неподвижно закреплена линейка с CCD - элементами, а лист со сканируемым изображением движется относительно нее с помощью специальных валиков.

Планшетные сканеры. Это самый распространенный сейчас вид для профессиональных работ. Сканируемый объект помещается на стеклянный лист, изображение построчно с равномерной скоростью считывается головкой чтения с CCD - сенсорами, расположенной снизу. Планшетный сканер может быть оборудован специальным устройством слайд-приставкой для сканирования диапозитивов и негативов.

Слайд-сканеры используются для сканирования микроизображений.

Проекционные сканеры. Относительно новое направление. Цветной проекционный сканер является мощным многофункциональным средством для ввода в компьютер любых цветных изображений, включая трехмерные. Он вполне может заменить фотоаппарат.

В наше время у сканеров появилось еще одно применение - считывание рукописных текстов, которые затем специальными программами распознавания символов преобразуются в коды ASC II и в дальнейшем могут обрабатываться текстовыми редакторами.

1.2 Системы автоматизации ввода данных

Ввод и обработка информации - это непрерывный процесс, неотъемлемый элемент существования любой организации. Работа с большим объемом данных в бумажном варианте, однозначно усложняет процесс работы и увеличивает время её выполнения. При помощи программ предназначенных для автоматизации ввода и обработки информации, любая организация сможет значительно увеличить эффективность своей работы.

В настоящее время самой популярной компанией разработчиком программ в области автоматизации ввода и обработки информации является компания ABBYY. Компания ABBYY основана в 1989 году. ABBYY сегодня - мировой разработчик решений в области интеллектуальной обработки информации и лингвистики. 16 международных офисов группы ABBYY открыты в 13 странах мира. Программными продуктами ABBYY пользуются более 40 миллионов пользователей свыше чем в 200 странах мира. Технологии ABBYY лицензируют крупнейшие в мире производители оборудования и мобильных устройств, разработчики программного обеспечения, а также ведущие российские разработчики систем электронного документооборота: Brother, Canon, Diotek, Epson, Fujitsu, Hewlett-Packard, Intuit, Laserfiche, Microtek, Mustek, Panasonic, Plustek, Ricoh, Samsung Electronics, Sharp, Sony, Xerox и многие другие компании.

Смело можно утверждать, что системы автоматизации ввода данных необходимы не только для работы различных организаций, но и активно используются среди простых пользователей в личных целях. Одним из самых популярных направлений развития автоматизации ввода и обработки информации является голосовой ввод (распознавание речи).

1.3 Распознавание речи

Распознавание речи -- процесс преобразования речевого сигнала в цифровую информацию (например, текстовые данные). Обратной задачей является синтез речи. Первое устройство для распознавания речи появилось в 1952 году, оно могло распознавать произнесённые человеком цифры. В 1962 году на ярмарке компьютерных технологий в Нью-Йорке было представлено устройство IBM Shoebox. Все большую популярность применение распознавания речи находит в различных сферах бизнеса, например, врач в поликлинике может проговаривать диагнозы, которые тут же будут внесены в электронную карточку. Или другой пример. Наверняка каждый хоть раз в жизни мечтал с помощью голоса выключить свет или открыть окно. В последнее время в телефонных интерактивных приложениях все чаще стали использоваться системы автоматического распознавания и синтеза речи. В этом случае общение с голосовым порталом становится более естественным, так как выбор в нём может быть осуществлен не только с помощью тонового набора, но и с помощью голосовых команд. При этом системы распознавания являются независимыми от дикторов, то есть распознают голос любого человека.

Классификация систем распознавания речи.

Системы распознавания речи классифицируются:

· по размеру словаря (ограниченный набор слов, словарь большого размера);

· по зависимости от диктора (дикторозависимые и дикторонезависимые системы);

· по типу речи (слитная или раздельная речь);

· по назначению (системы диктовки, командные системы);

· по используемому алгоритму (нейронные сети, скрытые Марковские модели, динамическое программирование);

· по типу структурной единицы (фразы, слова, фонемы, дифоны, аллофоны);

· по принципу выделения структурных единиц (распознавание по шаблону, выделение лексических элементов).

Для систем автоматического распознавания речи, помехозащищённость обеспечивается, прежде всего, использованием двух механизмов:^[3]

· Использование нескольких, параллельно работающих, способов выделения одних и тех же элементов речевого сигнала на базе анализа акустического сигнала;

· Параллельное независимое использование сегментного (фонемного) и целостного восприятия слов в потоке речи.

Архитектура систем распознавания

Типичнаяархитектура статистических систем автоматической обработки речи.

· Модуль шумоочистки и отделение полезного сигнала.

· Акустическая модель -- позволяет оценить распознавание речевого сегмента с точки зрения схожести на звуковом уровне. Для каждого звука изначально строится сложная статистическая модель, которая описывает произнесение этого звука в речи.

· Языковая модель -- позволяют определить наиболее вероятные словесные последовательности. Сложность построения языковой модели во многом зависит от конкретного языка. Так, для английского языка, достаточно использовать статистические модели (так называемые N-граммы). Для высокофлективных языков (языков, в которых существует много форм одного и того же слова), к которым относится и русский, языковые модели, построенные только с использованием статистики, уже не дают такого эффекта -- слишком много нужно данных, чтобы достоверно оценить статистические связи между словами. Поэтому применяют гибридные языковые модели, использующие правила русского языка, информацию о части речи и форме слова и классическую статистическую модель.

· Декодер -- программный компонент системы распознавания, который совмещает данные, получаемые в ходе распознавания от акустических и языковых моделей, и на основании их объединения, определяет наиболее вероятную последовательность слов, которая и является конечным результатом распознавания слитной речи.

Этапы распознавания:

1. Обработка речи начинается с оценки качества речевого сигнала. На этом этапе определяется уровень помех и искажений.

2. Результат оценки поступает в модуль акустической адаптации, который управляет модулем расчета параметров речи, необходимых для распознавания.

3. В сигнале выделяются участки, содержащие речь, и происходит оценка параметров речи. Происходит выделение фонетических и просодических вероятностных характеристик для синтаксического, семантического и прагматического анализа. (Оценка информации о части речи, форме слова и статистические связи между словами.)

4. Далее параметры речи поступают в основной блок системы распознавания -- декодер. Это компонент, который сопоставляет входной речевой поток с информацией, хранящейся в акустических и языковых моделях, и определяет наиболее вероятную последовательность слов, которая и является конечным результатом распознавания.

Основным преимуществом голосовых систем объявлялась дружественность к пользователю. Речевые команды должны были избавить конечного пользователя от необходимости использования сенсорных и иных методов ввода данных и команд.

· Голосовое управление

· Голосовые команды

· Голосовой ввод текста

· Голосовой поиск

Успешными примерами использования технологии распознавания речи в мобильных приложениях являются: ввод адреса голосом в Яндекс Навигаторе, голосовой поиск Google Now.

Помимо мобильных устройств, технология распознавания речи находит широкое распространение в различных сферах бизнеса:

· Телефония: автоматизация обработки входящих и исходящих звонков путём создания голосовых систем самообслуживание в частности для: получения справочной информации и консультирования, заказа услуг/товаров, изменения параметров действующих услуг, проведения опросов, анкетирования, сбора информации, информирования и любые другие сценарии;

· Решения "Умный дом": голосовой интерфейс управления системами «Умный дом»;

· Бытовая техника и роботы: голосовой интерфейс электронных роботов; голосовое управление бытовой техникой и т.д.;

· Десктопы и ноутбуки: голосовой ввод в компьютерных играх и приложениях;

· Автомобили: голосовое управление в салоне автомобиля -- например, навигационной системой;

· Социальные сервисы для людей с ограниченными возможностями.

программный автоматизация ввод распознавание

Глава 2. Программное обеспечение

В первой главе, говорилось о том, что компания ABBYY является ведущим разработчиком программ для автоматизации ввода и обработки информации.

Рассмотрим некоторые программные продукты данной компании.

2.1 Распознавание документов и работа с PDF

В данной категории можно выделить 4 программных продукта: «ABBYY FineReader 12 Professional», «ABBYY FineReader Pro для Mac», «ABBYY FineReader 12 Corporate» и «ABBYY PDF Transformer+».

Все эти продукты предназначены для распознавания текста, программа, которая переводит изображения документов и любые типы PDF-файлов в электронные редактируемые форматы, определяет и точно восстанавливает логическую структуру документа в его электронной копии, позволяя забыть о перепечатывании текстов. Более подробно рассмотреть каждый из продуктов и сравнить их между собой мы можем в таблице 1.

Как мы видим из таблицы 1, все эти программные продукты обладают похожими возможностями и имеют сходные системные требования. В зависимости от того, какие особенности имеет система, варьируется и ее цена. К примеру, отличительной особенностью «ABBYY PDF Transformer+» и « ABBYY FineReader 12 Corporate» является то, что в отличие от других 2х систем, они имеют лицензирование.

Для использования в организациях предусмотрены следующие типы лицензий:

Лицензия «Per Seat» (общая для этих 2х программ) позволяет использовать одну копию программы на одном конкретном компьютере.

Таблица 1

Сравнительная характеристика продуктов в категории распознавание документов и работа с PDF

Программа	Возможности	Системные требования	Цена
ABBYY FineReader 12 Professional	Обновление бумажных документов и PDF-файлов. Извлечение информации из документов. Создание электронных копий документов для хранения. Распознавание изображений, полученных с камеры мобильного устройства. Создание копий документов, имеющихся в единственном экземпляре Создание личных электронных книг	Компьютер с тактовой частотой процессора 1ГГц или выше. ОС: Microsoft® Windows® 10, 8, 7, Vista, XP, Server® 2012, Server® 2012 R2, Server® 2008, Server® 2008 R2, Server 2003. ОП не менее 1024 МБ, доп. для каждого ядра процессора -- 512 МБ. Свободное место на диске: 850 МБ для обычной установки и 850 МБ для работы программы. TWAIN- или WIA-совместимый сканер, цифровой фотоаппарат/фотокамера мобильного устройства или факс-модем. Клавиатура, мышь или другое указательное устройство. Интернет-соединение для активации серийного номера.	От 2890 руб.
ABBYY FineReader Pro для Mac	Обновление бумажных документов и PDF-файлов Извлечение информации из документов Создание электронных копий документов для хранения Создание копий документов, имеющихся в единственном экземпляре Создание личных электронных книг	Компьютер Mac с процессором Intel ОС: Mac OS X 10.7 Lion1, Mac OS X 10.8 Mountain Lion, Mac OS X 10.9 Mavericks, Mac OS 10.10 Yosemite, Mac OS 10.11 El Capitan, macOS 10.12 Sierra Свободное место на диске: 1,5 ГБ для обычной установки программы и 1 ГБ оперативной памяти для работы программы Клавиатура, мышь или другое указательное устройство	От 4290 руб.
ABBYY FineReader 12 Corporate	Обновление бумажных документов и PDF-файлов. Извлечение информации из документов. Создание электронных копий документов для хранения. Распознавание изображений, полученных с камеры мобильного устройства. Создание копий документов, имеющихся в единственном экземпляре. Создание личных электронных книг	Компьютер с тактовой частотой процессора 1ГГц или выше. ОС: Microsoft® Windows® 10, 8, 7, Vista, XP, Server® 2012, Server® 2012 R2, Server® 2008, Server® 2008 R2, Server 2003. Объем ОП: не менее 1024 МБ, доп. для каждого ядра процессора -- 512 МБ. Свободное место на диске: 850 МБ для обычной установки и 850 МБ для работы программы. TWAIN- или WIA-совместимый сканер, цифровой фотоаппарат/фотокамера мобильного устройства или факс-модем. Клавиатура, мышь или другое указательное устройство. Интернет-соединение для активации серийного номера.	от 5568 руб.
ABBYY PDF Transformer+	Открытие и просмотр PDF-документов. Рецензирование и согласование документов. Исправление опечаток и внесение изменений. Создание и объединение PDF-документов. Конвертирование PDF-документов. Защита PDF-документов.	Компьютер с тактовой частотой процессора 1 ГГЦ и выше Intel® Core™2 / Pentium® / Celeron® / Xeon™, AMD K6/Turion™/Athlon™/Duron™/Sempron™/ или совместимым с ними процессором ОС: Microsoft® Windows® 10, 8, 7, Vista, XP, Server® 2012, 2003, 2008, 2008 R2. Объем ОП не менее 1024 МБ. Свободное место на диске: 800 МБ для обычной установки и 800 МБ для работы программы.	От 2690 руб.

Например, компания приобретает программу с лицензией Per Seat на 11 рабочих станций. В этом случае программа может быть установлена только на 11-ти компьютерах. Данный вид лицензий предусматривает 2 типа установки:

Сетевая установка: заданное количество лицензий поставляется в едином серийном номере, который позволяет автоматически активировать все оплаченные лицензии на компьютерах (нет необходимости вводить серийный номер локально на каждом компьютере).

Локальная установка: программа устанавливается и активируется вручную на каждом компьютере. Количество поставляемых серийных номеров соответствует количеству купленных лицензий.

Так же системы имеют и индивидуальные лицензии.

Лицензия «Concurrent» (для « ABBYY FineReader 12 Corporate» ) позволяет использовать программу на любом количестве компьютеров внутри одной локальной сети. При этом общее количество пользователей, одновременно работающих с программой, не может превышать количество приобретенных лицензий. Использование лицензий такого типа выгодно в случае, когда необходимость работать с программой есть у многих пользователей, но она возникает периодически. Данный вид лицензий предполагает обязательную активацию в сетевом Менеджере лицензий ABBYY FineReader, использование таких лицензий для компьютеров вне локальной сети не имеет смысла.

Лицензия «Terminal» (для «ABBYY PDF Transformer+»)позволяет получать доступ к программе через терминальные службы.

Лицензию данного типа можно установить и использовать только на терминальном сервере, при этом количество одновременно использующих программу рабочих станций не может превышать числа имеющихся лицензий.

Например, организация закупила программное обеспечение с лицензией Terminal на 11 рабочих станций. Любые сотрудники, имеющие доступ к терминальному серверу, могут загружать программу и работать с ней тогда, когда потребуется. При этом общее количество одновременно загруженных копий программы в любой момент времени будет не больше 11. Попытка загрузить 12-ую копию приведёт к выдаче сообщения, что в данный момент работа с программой в полнофункциональном режиме недоступна, поскольку лимит одновременно работающих копий исчерпан. Для 12-ого и всех последующих пользователей программа будет доступна в ограниченном режиме в качестве приложения для просмотра PDF.

Более наглядно схему лицензирования для «ABBYY PDF Transformer+» и «ABBYY FineReader 12 Corporate» мы можем увидеть на рисунках 1 и 2 соответственно.

Рисунок 1 - Схема лицензирования ABBY PDF Transformer+

Рисунок 2 - схема лицензирования ABBYY FineReader 12 Corporate

На основе проведенного анализа этих программ можно сделать вывод, что все эти программы имеют довольно широкий функционал. Пользователь может подобрать для себя более удобную версию, подходящую его требованиям и определенной ценовой категории.

Еще одним уникальным решением по автоматизации процесса ввода в информационные системы важной для бизнеса информации является: ABBYY FlexiCapture. Это решение для потокового ввода данных и документов. Продукт автоматизирует извлечение информации из бумажных документов и сохраняет данные в информационной системе предприятия. ABBYY FlexiCapture позволяет различным организациям, в том числе крупным корпорациям, правительственным структурам и образовательным учреждениям, автоматизировать процесс ввода данных в информационные системы, снизить затраты и повысить качество обслуживания клиентов.

Функциональность

ABBYY FlexiCapture имеет два типа установки, которые дают возможность работать с системой как на одном рабочем месте, так и масштабировать решение в рамках корпоративной сети.

1. Локальная установка

Локальная установка подходит для малых проектов с объемом обработки до нескольких тысяч документов ежедневно. Все операции от сканирования документов до сохранения данных выполняются на одной рабочей станции. На рисунке 3 наглядно представлена локальная установка.

Рисунок 3 - Локальная установка

2. Cетевая установка

Сетевая установка предназначена для крупных проектов, где требуется обрабатывать от нескольких тысяч до миллионов документов ежедневно, а в процесс обработки вовлечено несколько операторов - в корпоративной сети или через интернет. Наглядная иллюстрация сетевой установки представлена на рисунке 4.

Рисунок 4 - Сетевая установка

Таким образом, ABBYY FlexiCapture представляет собой единый центр потокового ввода данных и позволяет обрабатывать любые типы документов вне зависимости от структуры:

· Документы с жесткой структурой или структурированные документы: анкеты, экзаменационные тесты, бланки, страховые формы, запросы на выплату медицинской страховки, налоговые декларации и т.п.

· Слабоструктурированные документы: счета, заказы на покупку, транспортные накладные и т.п.

· Неструктурированные документы: письма, контракты, статьи т.п.

Существует еще одно решение для автоматизированной обработки
первичной бухгалтерской документации в крупных торговых сетях - «CORRECT. Автоматизация ввода и обработки документов», разработанное на базе ABBYY FlexiCapture с использованием аутсорсинга.

Процессы, которые были автоматизированы данной программой:

· Решение CORRECT позволяет автоматизировать бухгалтерский учет. Процесс обработки документов реализуется на базе аутсорсинга и выглядит так:

· Бухгалтерские документы загружаются в сканер, где создаются их электронные образы.

· Образы документов отправляются на сервер распознавания, где происходит автоматическое распознавание содержимого каждого документа (буквально: картинка преобразуется в текст).

· Оператор аутсорсингового центра обработки данных CORRECT проводит верификацию, устраняя неточности распознавания, которые могут появиться из-за неудовлетворительного качества сканирования или плохой читаемости символов.

· Документ возвращается в компанию, загружается в учетную систему, после чего он готов для проведения финансовых операций в бухгалтерии.

· Автоматизированный ввод данных может быть реализован для различных финансовых документов, таких как счет-фактура, товарная накладная, акт выполненных работ, акты КС-2, КС-3 и др., в зависимости от требований заказчика.

В этом процессе большая часть действий по обработке документов производится на базе аутсорсинга. В компании заказчика проводится: комплектация пакета документов и сканирование, прием обработанных данных в учетной системе. В компании CORRECT осуществляется: распознавание данных, верификация, сверка данных со справочниками, отправка данных компании-заказчику. Весь процесс, начиная со сканирования и заканчивая занесением данных в учетную систему, занимает в среднем четверть часа. При этом пакеты документов обрабатываются параллельно и сотрудники компании-заказчика задействованы минимально. Трудовые ресурсы заказчика могут быть направлены на решение более актуальных и важных задач, чем ввод данных с клавиатуры в учетную систему.

Для того, чтобы убедиться, что системы фактически идентичны, достаточно обратиться к таблице 2.

Проанализировав таблицу 2, можно увидеть схожесть программ, что однозначно подтверждает происхождение программы «CORRECT. Автоматизация ввода и обработки документов» от «ABBYY FlexiCapture». Существенная разница заключается лишь в том, что «ABBYY FlexiCapture» позволяет заказать демо-версию, что является существенным плюсом для потенциального покупателя системы.

2.2 Программы для распознавания речи

Как мы уже выяснили в первой главе, программы для распознавания речи в наше время очень актуальны и широко используются в повседневной жизни. Две главные задачи машинного распознавания речи -- достижение гарантированной точности при ограниченном наборе команд хотя бы для одного фиксированного голоса и независящее от дикции распознавание произвольной слитной речи с приемлемым качеством -- не решены до сих пор, несмотря на длительную историю их разработки. Более того, существуют сомнения в принципиальной возможности решения обеих задач, поскольку даже человек не всегда может стопроцентно распознать речь собеседника. Рассмотрим некоторые продукты данной области в таблице 3.

Таблица 2

Сравнительная характеристика продуктов «ABBYY FlexiCapture» и «CORRECT. Автоматизация ввода и обработки документов»

Программа	Возможности	Системные требования	Цена
ABBYY FlexiCapture	Автоматизирует извлечение информации из бумажных документов и сохраняет данные в информационной системе предприятия	ОС: Windows XP SP2, Vista SP2, 7, Server 2003 SP2, Server 2008 SP2 или R2 + Desktop Expirience. Требования к компьютеру: ПК с процессором семейств Intel Core2/2 Quad/Pentium/Celeron/Xeon/Core i5/Core i7, AMD K6/Turion/Athlon/Duron/Sempron, тактовая частота 2 ГГц или выше; ОП:512 Мб на каждое ядро процессора, но не менее 1 Гб; место на диске: 1 Гб, из них 700 Мб для установки; сканер с поддержкой TWAIN, WIA или ISIS; интернет-соединение для активации серийного номера, USB-порт для аппаратного ключа защиты; видеоплата и монитор с разрешением не менее 1024Ч768; клавиатура, мышь или другое указательное устройство. Требования к установленному программному обеспечению: Net Framework 2.0 или выше, если используются скрипты .Net. Дополнительные требования: интернет-соединение для активации серийного номера, USB-порт для аппаратного ключа защиты.	Информация о цене доступна при заказе. Возможен заказ пробной версии.
CORRECT. Автоматизация ввода и обработки документов	Решение для автоматизированной обработки первичной бухгалтерской документации на базе ABBYY FlexiCapture с использованием аутсорсинга.	ОС: Windows XP SP2, Vista SP2, 7, Server 2003 SP2, Server 2008 SP2 или R2 + Desktop Expirience. Требования к компьютеру: ПК с процессором семейств Intel Core2/2 Quad/Pentium/Celeron/Xeon/Core i5/Core i7, AMD K6/Turion/Athlon/Duron/Sempron, тактовая частота 2 ГГц или выше; ОП:512 Мб на каждое ядро процессора, но не менее 1 Гб; место на диске: 1 Гб, из них 700 Мб для установки; сканер с поддержкой TWAIN, WIA или ISIS; интернет-соединение для активации серийного номера, USB-порт для аппаратного ключа защиты; видеоплата и монитор с разрешением не менее 1024Ч768; клавиатура, мышь или другое указательное устройство.	Информация о цене доступна при заказе.

Таблица 3

Сравнительная характеристика программ для голосового ввода

Продукт

Доступно на:

Особенности программы

Яндекс. Диктовка

iPhone и iPad и для Android

- Голосовая активация. Чтобы начать запись, достаточно произнести «Яндекс, записывай».

- Распознавание речи. Вы говорите, а приложение превращает вашу речь в текст.

- Голосовое управление. Отредактировать текст можно с помощью команд -- например, «Удали последнее слово», «Начни с новой строки», «Добавь весёлый смайлик». Яндекс. Диктовка не только распознаёт слова, но и понимает их смысл, поэтому список команд не ограничен.

- Расстановка знаков пунктуации. Приложение ориентируется на паузы в речи и само расставляет знаки препинания.

- Синтез речи

RealSpeaker

Windows 7 и 8.Началась разработка Android-приложения

«Скачай бесплатно RealSpeaker, и ты сможешь вводить текст любой длины с помощью голоса в любой текстовый редактор (блокнот, MS Word, Skype, VKontakte, Facebook и т.д.) на любом из одиннадцати языков», -- указано на сайте проекта. При этом системные требования RealSpeaker заявлены вполне демократичные: компьютер с фронтальной камерой и микрофоном, наличие доступа в интернет, ОС Windows 7 или 8.

Горыныч 5.0 Dict Light

Совместимость с операционными системами Microsoft Windows Me/2000/XP.

Очень простой и удобный интерфейс.

Быстрая и легкая настройка микрофона.

Возможность добавлять в словарь собственные слова.

Тренировка слов непосредственно в процессе диктовки.

VoiceType

Интегрируется во множество различных приложений, в первую очередь - в Microsoft Word

Встроенный активный словарь. При выборе и назначении команд следует помнить, что у VOICETYPE существует режим, при котором программа автоматически набирает текстом все то, что не хранится в качестве голосового аналога системной команды. Поэтому если вы использовали созвучные выражения, то скорее всего VOICETYPE начнет спотыкаться, чем испортит все дело. Второй достаточно серьезной проблемой VOICETYPE является встроенный модуль самообучения. Если программа решит, что правильно распознала слово или выражение, в смысле текстового эквивалента, но не уловила до конца вашей индивидуальной тонкости произношения, то она может "попросить" пользователя повторить слово пару раз и перезапишет совершенно исправный фрагмент. При плохом произношении можно вообще все испортить, так как VOICETYPE DICTATION в состоянии все перепутать.

Из данных таблицы 3 следует, что программы голосового ввода распространены не только на компьютеры, но и на смартфоны. Все указанные программы в данной таблице легкодоступны и понятны в использовании. Все данные продукты можно приобрести бесплатно.

Несмотря на все достижения последних лет, средства для распознавания слитной речи все еще допускают большое количество ошибок, нуждаются в длительной настройке, требовательны к аппаратной части и к квалификации пользователя и отказываются работать в зашумленных помещениях, хотя последнее важно как для шумных офисов, так и для мобильных систем и эксплуатации в условиях телефонной связи.

Однако распознавание речи, как и машинный перевод с одного языка на другой, относится к так называемым культовым компьютерным технологиям, к которым проявляется особое внимание. Интерес к данным технологиям постоянно подогревается бесчисленными произведениями писателей-фантастов, поэтому неизбежны постоянные попытки создать такой продукт, который должен соответствовать нашим представлениям о технологиях завтрашнего дня. И даже те проекты, которые по своей сути ничего собой не представляют, часто бывают коммерчески вполне успешны, так как потребителя живо интересует сама возможность подобных реализаций, даже независимо от того, сможет ли он применить ее на практике.

Заключение

На самом деле, устройства системы автоматизации ввода и обработки информации не ограничиваются вышеперечисленными элементами, а их многообразие в информационном мире не перестает удивлять. В настоящий момент разнообразие таких систем просто поражает своими масштабами и к тому же, не перестает расти. Однозначно можно сделать вывод о том, что и крупным компаниям и простому пользователю смартфона или компьютера обязательно удастся найти именно ту систему, которую он захочет выбрать даже по самым строгим критериям.

Список использованных источников и литературы:

1. Артемьев В. Методы и средства автоматизации учрежденческой деятельности // Материалы пленарного доклада на конференции «Офисные информационные системы».

2. Тихонова Светлана Николаевна. Информационные системы в управлении предприятием: Автореферат, доцент кандидат экономических наук. - Москва, 2012 г.

3. Автоматизация деятельности организации» В.П. Нестеров, И.Б. Нестеров, 2012 г.

4. Учебное пособие по специальности 2202 дисциплина “Технические средства обработки информации” Автоматизированные системы обработки информации и управления. Разработал: Шишанов Ю.А. г. Новгород 2012 г.

Размещено на Allbest.ru

...

курсовая работа "Системы автоматизации ввода и обработки информации" скачать

Подобные документы

Задачи автоматизации, хранения и обработки информации на предприятии
Системы управления базами данных и их использование для решения задач автоматизации предприятия. Разработка информационного и программного обеспечения для автоматизации хранения и обработки информации при организации работы агропромышленного предприятия.

курсовая работа [607,1 K], добавлен 07.05.2011
Системы распознания текста и ввода данных
Представление о системе оптического распознавания ABBYY FineReader и настройках BIOS. Виды систем управления вводом информации. Современные и перспективные носители энергии, особенности биоэнергетики. Преимущества и недостатки Li-Ion-аккумуляторов.

контрольная работа [274,1 K], добавлен 10.06.2010
Системы и устройства распознавания текста. Технология обработки текстовой информации
Необходимость в системах распознавания символов. Виды сканеров и их характеристики. Оптимальное разрешение при сканировании. Программы распознавания текста. Получение электронного документа. FineReader - система оптического распознавания текстов.

презентация [469,2 K], добавлен 15.03.2015
Проектирование АРМ налогового инспектора отдела ввода и обработки информации
Основные возможности программных комплексов "АРМ-Клиент", "Астрал-Отчет". Технология обработки информации в системе электронной обработки данных. Разработка рабочего места налогового инспектора, предназначенного для автоматизации заполнения деклараций.

дипломная работа [285,3 K], добавлен 12.04.2013
Знакомство с компьютером
Структурная схема компьютера. Основные характеристики процессора - устройства, предназначенного для обработки информации и управления процессом обработки. Способы хранения информации. Описание, назначение и принципы работы устройств ввода и вывода данных.

презентация [862,1 K], добавлен 20.07.2011
Ввод стандартных форм и форматированных документов
Понятие, классификации и типы стандартных форм. Этапы ввода и обработки форматированных документов. Требования к системам массового ввода стандартных форм. Подходы к реализации систем обработки форм. Система ABBYY Fine Reader Form и Cognitive Forms.

курсовая работа [42,4 K], добавлен 20.10.2010
Технология обработки изображений и распознавания образов
Оптико-электронная система идентификации объектов подвижного состава железнодорожного транспорта. Автоматический комплекс распознавания автомобильных номеров. Принципы и этапы работы систем оптического распознавания. Особенности реализации алгоритмов.

дипломная работа [887,3 K], добавлен 26.11.2013
Автоматизированные системы обработки информации и управления на предприятии
Анализ структуры и управления предприятием. Функции, виды деятельности, организационная и информационная модели предприятия, оценка уровня автоматизации. Перспективы развития автоматизированных систем обработки информации и управления на предприятии.

отчет по практике [243,3 K], добавлен 10.09.2012
Устройства ввода и вывода. Их назначение, виды и основные характеристики
Классификация периферийных устройств ввода и вывода данных для обмена информацией между компьютером и внешним миром. Системы распознавания магнитных знаков, символов. Принцип работы мониторов и принтеров. Вид манипуляторов для управления курсором.

реферат [272,7 K], добавлен 01.04.2014
Автоматизация системы обработки экономической информации в малом торговом предприятии "Манго" (оптовая торговля)
Требования и структура систем обработки экономической информации. Технология обработки информации и обслуживание системы, защита информации. Процесс создания запросов, форм, отчетов, макросов и модулей. Средства организации баз данных и работы с ними.

курсовая работа [2,7 M], добавлен 25.04.2012
Исследование характеристик системы распознавания формы микрообъектов
Понятие системы распознавания образов. Классификация систем распознавания. Разработка системы распознавания формы микрообъектов. Алгоритм для создания системы распознавания микрообъектов на кристаллограмме, особенности его реализации в программной среде.

курсовая работа [16,2 M], добавлен 21.06.2014
Прикладное программное обеспечение
Прикладное программное обеспечение, его использование при проведении сложных математических вычислений. Менеджер загрузок. Офисные средства обработки информации. Система автоматизации проектных работ. Основы использования функций Excel, их аргументы.

контрольная работа [227,6 K], добавлен 01.03.2009
Устройства ввода информации в персональный компьютер
Характеристика разновидностей устройств ввода информации: клавиатуры, сканера, графического планшета, средств речевого ввода, мыши, джойстика, светового пера. Исследование принципов ввода информации с бумажных носителей, разрешающей способности матрицы.

курсовая работа [78,7 K], добавлен 07.11.2011
Автоматизация процесса оцифровки, обработки графической информации и цифровых данных
Изучение существующих методов и программного обеспечения для извлечения числовых данных из графической информации. Программное обеспечение "graphtrace", его структура и методы обработки данных. Использование этой системы для данных различного типа.

дипломная работа [3,9 M], добавлен 06.03.2013
Информатика. Устройства ввода и вывода. Периферийные устройства
Обработка информации компьютерами. Средства преобразования информации в цифровую форму и обратно. Основные устройства компьютера: системный блок, жесткий диск, материнская плата. Устройства ввода и вывода информации: клавиатура и манипулятор мышь.

курсовая работа [18,4 K], добавлен 25.11.2010
Программы ввода текстовой и графической информации
Назначение, классификация и экономическая целесообразность использования устройств ввода текстовой и графической информации. Обзор и сравнительный анализ программ распознавания образов Acrobat Reader и ASDee. Охрана труда при работе на компьютере.

дипломная работа [4,3 M], добавлен 23.07.2010
Процесс автоматизации бухгалтерского учета
Автоматизированная обработка экономической информации. Методы и средства технологического контроля обработки экономической информации. АИС в области бухгалтерского учета с использованием 1: С Бухгалтерия. Программное обеспечение бухгалтерского учета.

контрольная работа [39,4 K], добавлен 07.12.2010
Проблемное и системное программное обеспечение
Программное обеспечение как совокупность программ системы обработки информации и программных документов, необходимых для эксплуатации этих программ. Системное ПО (программы общего пользования), прикладное и инструментальное (системы программирования).

реферат [73,1 K], добавлен 04.06.2010
Устройства ввода графической информации
Устройства ввода графической информации. Настольные барабанные сканеры. Планшетные сканеры. Технологии планшетного сканирования. Сканеры для обработки пленок и диапозитивов. Листовые и многоцелевые сканеры. Ручные сканеры. Беспленочные камеры.

реферат [26,9 K], добавлен 02.10.2008
Системы распределенной обработки информации
Требования, предъявляемые к свойствам систем распределенной обработки информации. Логические слои прикладного программного обеспечения вычислительных систем. Механизмы реализации распределенной обработки информации. Технологии обмена сообщениями.

курсовая работа [506,8 K], добавлен 03.03.2011

Другие документы, подобные "Системы автоматизации ввода и обработки информации"

весь список подобных работ

скачать работу можно здесь

Работы в архивах красиво оформлены согласно требованиям ВУЗов и содержат рисунки, диаграммы, формулы и т.д.
PPT, PPTX и PDF-файлы представлены только в архивах.
Рекомендуем скачать работу.

Продукт	Доступно на:	Особенности программы
Яндекс. Диктовка	iPhone и iPad и для Android	- Голосовая активация. Чтобы начать запись, достаточно произнести «Яндекс, записывай». - Распознавание речи. Вы говорите, а приложение превращает вашу речь в текст. - Голосовое управление. Отредактировать текст можно с помощью команд -- например, «Удали последнее слово», «Начни с новой строки», «Добавь весёлый смайлик». Яндекс. Диктовка не только распознаёт слова, но и понимает их смысл, поэтому список команд не ограничен. - Расстановка знаков пунктуации. Приложение ориентируется на паузы в речи и само расставляет знаки препинания. - Синтез речи
RealSpeaker	Windows 7 и 8.Началась разработка Android-приложения	«Скачай бесплатно RealSpeaker, и ты сможешь вводить текст любой длины с помощью голоса в любой текстовый редактор (блокнот, MS Word, Skype, VKontakte, Facebook и т.д.) на любом из одиннадцати языков», -- указано на сайте проекта. При этом системные требования RealSpeaker заявлены вполне демократичные: компьютер с фронтальной камерой и микрофоном, наличие доступа в интернет, ОС Windows 7 или 8.
Горыныч 5.0 Dict Light	Совместимость с операционными системами Microsoft Windows Me/2000/XP.	Очень простой и удобный интерфейс. Быстрая и легкая настройка микрофона. Возможность добавлять в словарь собственные слова. Тренировка слов непосредственно в процессе диктовки.
VoiceType	Интегрируется во множество различных приложений, в первую очередь - в Microsoft Word	Встроенный активный словарь. При выборе и назначении команд следует помнить, что у VOICETYPE существует режим, при котором программа автоматически набирает текстом все то, что не хранится в качестве голосового аналога системной команды. Поэтому если вы использовали созвучные выражения, то скорее всего VOICETYPE начнет спотыкаться, чем испортит все дело. Второй достаточно серьезной проблемой VOICETYPE является встроенный модуль самообучения. Если программа решит, что правильно распознала слово или выражение, в смысле текстового эквивалента, но не уловила до конца вашей индивидуальной тонкости произношения, то она может "попросить" пользователя повторить слово пару раз и перезапишет совершенно исправный фрагмент. При плохом произношении можно вообще все испортить, так как VOICETYPE DICTATION в состоянии все перепутать.

Системы автоматизации ввода и обработки информации

Отправить свою хорошую работу в базу знаний просто. Используйте форму, расположенную ниже

Архитектура систем распознавания

Обновление бумажных документов и PDF-файлов.

Извлечение информации из документов.

Создание электронных копий документов для хранения.

Распознавание изображений, полученных с камеры мобильного устройства.

Создание копий документов, имеющихся в единственном экземпляре

Компьютер с тактовой частотой процессора 1ГГц или выше.

ОС: Microsoft® Windows® 10, 8, 7, Vista, XP, Server® 2012, Server® 2012 R2, Server® 2008, Server® 2008 R2, Server 2003.

ОП не менее 1024 МБ, доп. для каждого ядра процессора -- 512 МБ.

Свободное место на диске: 850 МБ для обычной установки и 850 МБ для работы программы.

TWAIN- или WIA-совместимый сканер, цифровой фотоаппарат/фотокамера мобильного устройства или факс-модем.

Клавиатура, мышь или другое указательное устройство.

Обновление бумажных документов и PDF-файлов

Извлечение информации из документов

Создание электронных копий документов для хранения

Создание копий документов, имеющихся в единственном экземпляре

Компьютер Mac с процессором Intel

ОС: Mac OS X 10.7 Lion1, Mac OS X 10.8 Mountain Lion, Mac OS X 10.9 Mavericks, Mac OS 10.10 Yosemite, Mac OS 10.11 El Capitan, macOS 10.12 Sierra

Свободное место на диске: 1,5 ГБ для обычной установки программы и 1 ГБ оперативной памяти для работы программы

Обновление бумажных документов и PDF-файлов.

Извлечение информации из документов.

Создание электронных копий документов для хранения.

Распознавание изображений, полученных с камеры мобильного устройства.

Создание копий документов, имеющихся в единственном экземпляре.

Компьютер с тактовой частотой процессора 1ГГц или выше.

ОС: Microsoft® Windows® 10, 8, 7, Vista, XP, Server® 2012, Server® 2012 R2, Server® 2008, Server® 2008 R2, Server 2003.

Объем ОП: не менее 1024 МБ, доп. для каждого ядра процессора -- 512 МБ.

Свободное место на диске: 850 МБ для обычной установки и 850 МБ для работы программы.

TWAIN- или WIA-совместимый сканер, цифровой фотоаппарат/фотокамера мобильного устройства или факс-модем.

Клавиатура, мышь или другое указательное устройство.

Открытие и просмотр PDF-документов.

Рецензирование и согласование документов.

Исправление опечаток и внесение изменений.

Создание и объединение PDF-документов.

Конвертирование PDF-документов.

Так же системы имеют и индивидуальные лицензии.

Лицензия «Terminal» (для «ABBYY PDF Transformer+»)позволяет получать доступ к программе через терминальные службы.

Более наглядно схему лицензирования для «ABBYY PDF Transformer+» и «ABBYY FineReader 12 Corporate» мы можем увидеть на рисунках 1 и 2 соответственно.

Требования к установленному программному обеспечению:

Net Framework 2.0 или выше, если используются скрипты .Net.

ОС: Windows XP SP2, Vista SP2, 7, Server 2003 SP2, Server 2008 SP2 или R2 + Desktop Expirience. Требования к компьютеру:

ПК с процессором семейств Intel Core2/2 Quad/Pentium/Celeron/Xeon/Core i5/Core i7, AMD K6/Turion/Athlon/Duron/Sempron, тактовая частота 2 ГГц или выше;

Подобные документы