RECOGNITION

Автоматическая индексация при помощи технологии распознавания текста и штриховых кодов

Модуль RECOGNITION предоставляет вам возможность формировать файлы в системе DocuWare еще быстрее благодаря извлечению критериев индекса из содержания документов. RECOGNITION считывает тексты при помощи технологии оптического распознавания текста (OCR) или из предопределённых зон через штриховые коды. Широкий спектр возможностей конфигурации превращает модуль RECOGNITION в многогранный инструмент.

Область применения

Для сохранения входящих счетов-фактур, сначала наклейте метки штрих-кода на пакет счетов-фактур и выполните сканирование этих документов в DocuWare. Далее данные документы помещаются в корзину DocuWare, где посредством модуля RECOGNITION автоматически считываются числа штрих-кода. Этот модуль извлекает штриховые коды в качестве слов-модификаторов на протяжении всего процесса сохранения. Теперь вы можете записывать или регистрировать счета-фактуры в вашей бухгалтерской программе путем ввода наименования компании, номера счета-фактуры, суммы и т.п. Данная информация также может добавляться к номеру счета-фактуры в автоматическом режиме для оптимизации процесса индексирования счетов-фактур в DocuWare. Благодаря добавочному модулю DocuWare AUTOINDEX все эти процессы выполняются в автоматическом режиме.
Если вам нужно обработать большое количество документов, которые находятся в бумажном виде и оформлены по единому образцу, например, формы, вы можете использовать технологию оптического распознавания текста (OCR) для прочтения элементов текста, расположенных в одном и том же месте, и затем объединить полученную информацию для автоматического индексирования в DocuWare.
Если вам необходимо сохранять рабочие заказы и отчеты, сформированные технической службой, модуль RECOGNITION сделает этот процесс удобным. Создается форма, например, в программе обработки заказов вашего отдела обслуживания клиентов. После поступления запроса, форма частично заполняется информацией об имени клиента, дате заказа и т.п. Номер заказа добавляется либо как штрих-код, либо в стандартном формате. Область служебного отчета остается незаполненной. Форма служебного отчета автоматически запоминается в ходе печати средством TIFFMAKER, который использует имя клиента, дату заказа и номер заказа в качестве ключевых слов.
При помощи DocuWare для сотрудников вашего отдела обслуживания клиентов все заказы могут быть сохранены в один файл-кабинет. Кроме того, программа может поддерживать обзор статуса всех заказов.
Если специалист технической службы выезжает к клиенту, он берет с собой распечатанный вариант частично заполненной формы, заполняет пустые поля и подписывает у клиента. По окончании встречи, в офисе документ подлежит сканированию, и штрих-код считывается посредством модуля RECOGNITION. Документ индексирован и надежно сохранен при помощи критериев индекса официально записанной частично заполненной версии данной формы.

Функциональные возможности

Сбор входящих бумажных документов, таких как счета-фактуры, подтверждения доставки или бланки транспортных документов осуществляется посредством сканера. Затем данные передаются в DocuWare. Сначала они помещаются в корзину DocuWare, далее выполняется процесс считывания одним из указанных ниже способов:

• Из основного окна DocuWare запускается модуль RECOGNITION, который затем считывает маркированные документы из корзины.
• Запускается сам модуль RECOGNITION. Процесс считывания может осуществляться из множества корзин.
• Совместно с ACTIVE IMPORT, модуль RECOGNITION извлекает из импортируемых файлов слова-модификаторы.

С помощью технологии распознавания текста или штрихового кода, такая информация как номер штрих-кода, отправитель или дата, автоматически извлекается из содержания документа и затем применяется в качестве слов-модификаторов для сохранения документа в DocuWare. Они записываются в заголовок файла документа. Таким образом, документ предварительно индексирован. Теперь он готов для перемещения из корзины в соответствующий файл-кабинет. Одновременно, ключевые слова из заголовка автоматически копируются в соответствующие поля базы данных файл-кабинета.
Совместно с ACTIVE IMPORT вы можете использовать модуль RECOGNITION для подготовки документов к импортированию. В зависимости от результатов считывания, документы могут быть размещены в различных корзинах или файл-кабинетах. Таким образом, выполняется классификация документов (предварительная сортировка) в автоматическом режиме.
Модуль DocuWare RECOGNITION состоит из программы RECOGNITION, которая отвечает за считывание/извлечение информации, и RECOGNITION Редактора. Прежде чем впервые приступить к работе с RECOGNITION, необходимо установить конфигурацию приложения Редактор.

Установка конфигурации модуля RECOGNITION

Работая с новой конфигурацией RECOGNITION, в первую очередь необходимо выбрать файл-кабинет, где будут храниться документы после извлечения слов-модификаторов. Кроме того, на ваше усмотрение задается наименование конфигурации и выбирается образец документа. Это будет отображаться в основном окне RECOGNITION  Редактора.
Что касается конфигурации, вы определяете условия и способ сортировки документов, что имеет большое значение во время сканирования больших объемов документов. Вы также можете принимать решение о том, нужно ли считывать текст документа полностью для полнотекстового индексирования. Если сканированные документы не очень хорошего качества, существует несколько опций для улучшения качества изображения.
Например, если необходимо устранить серые участки или искажения/штрихи. Возможно сохранение усовершенствованного документа с заменой оригинала. Для полнотекстового индексирования устанавливается настройка технологии оптического распознавания текста (OCR). Чтобы гарантировать достижение самого точного считывания, настройка выполняется с учетом соответствующих вашим документам  требований. Кроме того, предоставляется опция формирования журнала регистрации для того, чтобы заносить в каталог процесс считывания. Выбор фиксированных индексных полей предусмотрен для максимум пяти полей базы данных. Также можно задавать условие их наличия/отсутствия в представленном образце документа.
 
Определение участков для считывания

Вы устанавливаете область для последующего считывания путем растягивания прямоугольника на участках образца документа. Для каждого из таких участков вы определяете, что подлежит считыванию: текст (включая числа) или штриховой код. Кроме того, вы отбираете поля базы данных, куда текстовая строка, считанная из документа, будет помещена в ходе сохранения.
С целью оптимизации процесса считывания, каждый участок может быть усовершенствован посредством применения технологии повышения качества изображения. Специальные настройки оптического распознавания текста (OCR) или штрихового кода также могут быть отрегулированы для каждой области. При помощи всех данных возможностей, вы можете в полной мере адаптировать работу модуля RECOGNITION к вашим потребностями. Теперь выполненная конфигурация RECOGNITION доступна для всех пользователей DocuWare в вашей сети.

Функциональные возможности

Общие функции
• Автоматическое распознавание текста и штрих-кода для извлечения ключевых слов
• Считывание индексной информации из предопределенных участков изображения и перемещение в заданные поля базы данных


RECOGNITION Редактор
• Определение до 24 значений штрих-кода и/или текстовых полей для каждого файл-кабинета
• Ввод в поле комментария до 64 кб
• Альтернативные позиции, определяемые для каждого поля (заменяет треугольники)
• До 5 фиксированных или постоянных значений поля
• Разбиение по группам сканированных в массе документов либо с автоматическим распознаванием первой или последней страницы документа, либо при помощи разделителя страниц
• 100% распознавание штрих-кода с достаточным качеством

Типы штрих-кодов
• Ширина самой узкой линии должна быть минимум 0,25 мм
• Код 39: алфавитный, относительно широкий, регулируемая длина
• CODABAR: числовой, функции распознавания ошибок, регулируемая длина
• UPC/EAN: применяется в международном масштабе для товаров, числовой, фиксированная длина, распознавание ошибок и проверка сумм, относительно узкий
• UPC 6: применяется в США, 6 символов в длину
• UPC 12: применяется в США, 12 символов в длину
• EAN 8: применяется в международном масштабе, 8 символов в длину
• EAN 13: применяется в международном масштабе, 13 символов в длину
• 2 из 5: регулируемая числовая длина, в целом, компактный, легко распознаваемый: информационно-логический, перемежающийся, 5 штрихов и матрица

Настройки технологии оптического распознавания текста
Общие:
• Примените стандартные настройки технологии оптического распознавания текста, которые, как правило, дают хорошие результаты считывания
• Задайте частные установочные параметры технологии оптического распознавания текста
• Различные настройки технологии оптического распознавания текста могут быть установлены для применения в рамках всей конфигурации или индивидуально для каждого поля
• Настройки технологии оптического распознавания текста могут быть сохранены в различных конфигурациях
 
Языки:
• Оптическое распознавание текста специальных международных символов (наборы символов западной и восточной Европы, балтийский, кириллица, турецкий, греческий и мальтийский)
• Выбор языка (языков) для применения в документах с целью ограничения набора символов (доступны 34 языка)
• Выбор степени точности распознавания влияет на скорость процесса считывания

Символьные фильтры:
• Сокращение количества символов ускоряет процесс распознавания

Повышение качества изображения:
• Автоматическое повышение качества изображения: документы плохого качества могут быть изменены для улучшения результатов считывания
• В случае повышения качества изображения всего документа, новый документ может быть сохранен вместо оригинала
• Выпрямление или вращение изображения


Для получения более подробной информации, пожалуйста, посетите наш сайт www.docuware.com

footerLayout