Перейти к содержанию

Потоковый ввод документов

Модуль потокового ввода документов предназначен для обработки результата потокового сканирования (или любого другого источника электронных документов).

Important

Модуль входит в корпоративную лицензию (от 200 подключений) или приобретается отдельно.

Посмотреть информацию о модулях, включённых в лицензию, можно в разделе “Информация” Tessa Admin.

Функции модуля потокового ввода документов:

  • Выделение карточке уникального штрих-кода и его печать.
  • Распознавание отсканированного штрих-кода и прикрепление скана документа к карточке.
  • Распознавание данных отсканированного входящего документа с использованием ИИ инструмента incoming_create_card для создания входящих документов с последующим прикреплением скана документа к созданной карточке.
  • Распознавание отсканированного штрих-кода с последующим распознаванием данных отсканированного входящего документа с использованием ИИ инструмента incoming_create_card и обновление данных соответствующего штрих-коду документа, в т.ч. прикрепление скана документа к обновляемой карточке.

Note

В проекте могут быть реализованы любые инструменты по классификации документов и распознаванию данных с помощью ИИ и соответствующие им обработчики для потокового ввода.

Для работы модуля необходимо:

Система оперирует обработчиками потокового ввода. По умолчанию доступны следующие обработчики:

  • Потоковый ввод по ШК. Распознавание отсканированного штрих-кода и прикрепление скана документа к карточке.
    Поддерживаемые форматы документов: png, jpg, jpeg, pdf, tif, tiff.
  • Потоковый ввод входящих писем с использованием ИИ. Распознавание данных отсканированного входящего документа с использованием ИИ. С последующим созданием/обновлением входящих документов.
    Поддерживаемые форматы документов: png, jpg, jpeg, pdf, tif, tiff, doc, docx, xls, xlsx.

Important

Потоковое сканирование может получать от сканера файлы в формате pdf. Однако их использование для серверов на ОС Windows поддерживается, начиная с Windows Server 2016 или Windows 10. Для сервера на ОС Linux ограничений нет.

Important

Можно разрабатывать и регистрировать собственные обработчики потокового ввода см. Собственные обработчики потокового ввода

В конфигурационном файле Chronos\app-plugins.json можно указать формат названия подпапок для обработанных документов. По умолчанию указан формат:

"DocLoad.OutputFolderFormat": "yyyy-MM-dd_HH-mm-ss"

Это означает, что при каждом запуске плагина будет создаваться новая подпапка, содержащая в названии дату и время с секундами, куда будут перемещены все обработанные за текущую итерацию плагина документы. Если, например, указать формат "yyyy-MM-dd", то все обработанные за текущий день документы при каждом запуске плагина будут перемещаться в одну и ту же папку.

Система ищет настроенные в таблице Настройки обработчиков для подпапок папки внутри папки, указанной в настройке Путь к папке для обработки документов и обрабатывает документы найденные в указанных подпапках.

Также можно разрешить обработку файлов из подпапок относительно подпапки с указанным обработчиком. По умолчанию данное поведение отключено, и поиск файлов выполняется только в папке верхнего уровня:

"DocLoad.IncludeSubFolders": false

Карточка “Потоковый ввод документов”

Открыть карточку можно из меню системы -> Настройки -> Потоковый ввод документов.

Карточка содержит следующие настройки:

Параметр
Описание
Потоковый ввод документов включен Отвечает за включение/отключение модуля. Если этот флаг снят, то перестает отображаться кнопка печати штрих-кода в меню системы в карточке документа, не работают выделение штрих-кода документу и плагин распознавания документов
Путь к папке для обработки документов Путь к папке, в которой предполагается размещение подпапок, настраиваемых в таблице Настройки обработчиков для подпапок, в которых хранятся документы для распознавания. Поддерживаются сетевые папки. Плагин получает для обработки только документы, расположенные в настроенных подпапках для указанной папки, без учета вложенных подпапок. Обработку документов из вложенных подпапок можно включить (настройка DocLoad.IncludeSubFolders описана выше)
Путь к папке для успешно обработанных документов Путь к папке, в которой хранятся успешно обработанные документы. В данной папке создается подпапка в соответствии с обрабатываемой подпапкой, указанной в таблице Настройки обработчиков для подпапок, в которой в свою очередь создаётся подпапка определенного формата (настройка DocLoad.OutputFolderFormat описана выше). Не является обязательным к заполнению. Если не заполнен, то документ удаляется, вместо переноса в папку назначения. Поддерживаются сетевые папки
Путь к папке для обработанных документов с ошибками Путь к папке, в котором хранятся документы, обработанные с ошибками. В данном каталоге создается подпапка в соответствии с обрабатываемой подпапкой, указанной в таблице Настройки обработчиков для подпапок, в которой в свою очередь создаётся подпапка определенного формата (настройка DocLoad.OutputFolderFormat описана выше). Не является обязательным к заполнению. Если не заполнен, то документ удаляется, вместо переноса в папку назначения. Поддерживаются сетевые папки
Настройки обработчиков для подпапок В данной таблице указываются обрабатываемые подпаки и выбираются обработчики потокового ввода для них. Так же могут быть указаны дополнительные настройки обработчика потокового ввода, если таковые имеются.
Название документа Название документа, который прикрепляется к карточке. Поддерживаются плейсхолдеры и константы локализации
Сотрудник с настройками локализации и форматирования Сотрудник, от имени которого в карточки будут добавляться файлы и чьи настройки локализации и форматирования будут использованы при их именовании. По умолчанию это сотрудник System
Искать по всей странице (длительный поиск, выше точность) Работает только для документов формата pdf. Использует алгоритм, принудительно генерирующий pdf формата А4, что увеличивает нагрузку на сервер. Рекомендуется использовать, если содержимое страниц не соответствует формату А4
Начальный множитель Первый множитель масштаба, с которого начинается изменение масштаба картинки страницы
Конечный множитель Последний множитель масштаба, которым заканчивается изменение масштаба картинки страницы
Шаг множителя Шаг множителя масштаба, с которым происходит переход от начального множителя масштаба к конечному
Исключить страницу со штрих-кодом Исключает страницу со штрих-кодом из итогового документа
Выделять из последовательности Последовательность, из которой выделяется номер для штрих-кода
Формат полного номера Формат штрих-кода, выделяемого системой
Секция Секция карточки, в которой хранится штрих-код
Поле Поле карточки, в которой хранится штрих-код
Тип штрих-кода для печати Тип штрих-кода, используемый для печати штрих-кода
Типы штрих-кодов для распознавания Список типов штрих-кодов, используемых для распознавания в плагине системы
Ширина штрих-кода Ширина штрих-кода при печати (указывается в пикселях)
Высота штрих-кода Высота штрих-кода при печати (указывается в пикселях)
Отображать штрих-код внизу страницы с зашифрованными данными Добавляет текстовое представление штрих-кода внизу изображения
Печатать заголовок с дополнительной информацией Добавляет дайджест карточки в печатаемый документ. Изменяет поведение параметров, указанных ниже: если флаг стоит, то отсчёт смещения производится от центра, иначе - от левого верхнего угла
Смещение штрих-кода по ширине Добавляет смещение штрих-коду по ширине (указывается в пикселях)
Смещение штрих-кода по высоте Добавляет смещение штрих-коду по высоте (указывается в пикселях)

Tip

Для отображения кнопки печати штрих-кода в меню системы открытой карточки необходимо, чтобы указанные в настройках секция и поле существовали в данной карточке. Поля и секции для карточки добавляются в Tessa Admin.

Tip

Настройки множителя масштаба прямо влияют на скорость обработки документа. На каждой странице выполняется поиск штрих-кода с использованием множителей масштаба: к начальному множителю происходит прибавка шага, пока не будет достигнут конечный множитель. Например: начальный множитель - 0.5 (50%), конечный - 1.5 (150%), шаг множителя 0.5. Поиск штрих-кода будет произведен с множителями: 0.5 (50%), 1.0 (100%) и 1.5 (150%). Чем больше множителей для поиска, тем медленнее обработка страницы.

Back to top