IPA-Server

  1. Home
  2. Dokumente
  3. IPA-Server
  4. 4.0 Admin Benutzeroberfläche Prozess
  5. 4.3 OCR

4.3 OCR

Generelle Einstellung OCR
Hier aktivieren sie die OCR und stellen OCR Sprache für den Prozess ein.

Leerzeichen Schwellenwert:
Hier können Sie den Wert für die Erkennung von Leerzeichen definieren.

Charakter-Whitelist (Von der OCR zu erkennende Zeichen):
Hier können Sie eine Zeichen-Whitelist für den OCR-Prozess für diesen Ordner erstellen. Achtung, wenn Sie dies verwenden, werden nur diese Zeichen vom OCR-Prozess erkannt.

Multithreading-Modus:
Mit dieser Option kann der IPA-Server für diesen Ordner im Multithreading-Modus eingestellt werden. Diese Option ist nur in der Enterprise-Version verfügbar.
Das Dokument wird in einzelne Dokumente aufgeteilt, die dann gleichzeitig verarbeitet werden. Sie können hier definieren wie viele parallele Threads (möglich von 1 bis 64) verwendet werden sollen und ab wie vielen Seiten der Modus verwendet wird.

Regular Expression RegEx

Mit Hilfe von RegEx (Regulären Ausdrücke) können Sie Text aus der gescannten Datei auslesen und als Variablen verwenden. Sie müssen die Variable aktivieren und den regulären Ausdruck dafür dort einfügen.

Detaillierte Information finden sie unter: 8.3 RegEx Informationen

Oben befinden sich noch zwei Links:

  1. Zu einer der RegEx Webseite, dort können sie ihren RegEx Ausdrück testen. https://regex101.com/
  2. Unter dem zweiten Link finden sie ein PDF Dokument mit der Übersicht der RegEx Ausdrücke,  : Regex-Quick-Reference.pdf

Falls sie dazu noch Fragen haben schreiben sie uns eine Mail an: support@it-scom.com.

Zonale OCR

Auf dieser Registerkarte können sie bis zu 7 OCR-Zonen definieren.
Aktivieren Sie zuerst die Zone mit dem Kontrollkästchen.
Dann klicken sie auf den Knopf […] Es erscheint dann ein neues Fenster in dem sie die Zone einstellen können.

Mit der […] Taste Zone testen und definieren
Mit dieser Schaltfläche öffnen Sie ein separates Fenster, um die OCR-Zone zu definieren.

Sprache:
In dem Auswahlfeld können Sie die OCR-Sprache für diese Zone bearbeiten.

RegEx-Filter:
Hier können Sie den RegEx (regulärer Ausdruck) Filter und die RegEx Gruppe bearbeiten.

Zonen OCR Auswahl Fenster

  1. Klicken sie auf den Knopf ‚Dokument laden‘ und wählen dann ihre Vorlage aus.
  2. Markieren sie eine Zone auf der geladenen Vorlage.
  3. Drücken sie den Knopf ‚Ergebnis testen‘.
  4. Sie kriegen dann in einem Fenster den OCR Inhalt dieser Zone angezeigt.

Regulären Ausdruck:
Hier definieren Sie Ihren Text- oder RegEx-Filter (regulärer Ausdruck).
Zeichen-Whitelist
Sie können eine Zeichen-Whitelist nur für diese Zone definieren, darunter befinden sich Schaltflächen für vordefinierte Zeichen (Großbuchstaben, Kleinbuchstaben, Zahlen und Umlaute).
Leerzeichen löschen
Die Leerzeichen werden im Ergebnis gelöscht
Ersetzen Sie das Zeichen im Ergebnis
Hier können Sie festlegen, wann Sie einige Zeichen ersetzen möchten, z. B.: (/ zu _)
Ergebnis testen
Wenn Sie darauf klicken, wird das Ergebnis Fenster nach Abschluss der OCR angezeigt.
Zone speichern
Die Schaltfläche speichert Werte in den Einstellungen des Ordners.
Im Allgemeinen können Sie die OCR-Zone in einem mehrseitigen Dokument auf Seite 2, 3 usw. definieren. Diese wird im Profil auch gespeichert.

Vorlagenverwaltung mit RegEx Ausdrücken

Mit dieser Option arbeitet der IPA-Server für diesen Ordner mit der Vorlagenverwaltung. Diese Option ist nur in der Enterprise-Version verfügbar. Sie müssen 2 einmalige Anker pro Vorlage festlegen wie z.B.:

  • In jeder Rechnung von der Firma Combera haben Sie in dem OCR-Text Combera und deren Umsatzsteuer-Identifikationsnummer DE777234.

Wenn die Anker in einem Dokument vorhanden sind, lesen wir dann in dem OCR-Text bis zu 7 Variablen (TMVAR1-7) aus.
Diese Variable können Sie später z.B. für die Ausgabeoption verwenden.
Diese leistungsstarke Option optimiert ihre automatisierten Prozesse.

Vorlagenverwaltung mit Template Manager GUI  des ProcessClient*

Hier stellen sie ein das der IPA-Server die Vorlagenverwaltung des IPA-Clients nutzt. Dafür müssen sie Angeben wo die Datenbanken (TemplateDB, DoctypeDB und ImageDB) des IPA-Clients liegen. Desweiteren definieren sie noch den Ordner für nicht erkannte Vorlagen und bei Bedarf die Benachrichtigung per Mail dafür.

Der Workflow aus dem ProcessClient muss dann im IPA-Server identisch konfiguriert werden (Eingabe, Prozess und Ausgabe). Die Variablen können stehen dann unter :

TMName: [(,)|TMName]
TMAnker1: [(,)|TMAnker1]
TMAnker2: [(,)|TMAnker2]
TMVar1: [(,)|TMVar1]
TMVar2: [(,)|TMVar2]
TMVar3: [(,)|TMVar3]
TMVar4: [(,)|TMVar4]
TMVar5: [(,)|TMVar5]
TMVar6: [(,)|TMVar6]
TMVar7: [(,)|TMVar7]

*Nur freigeben für den TemplateManager des DigitalProcessClient Version 2.6.2.1

Fandest du diesen Artikel hilfreich? Ja Nein