Handbuch IPA-Server

  1. Home
  2. Dokumente
  3. Handbuch IPA-Server
  4. 4.0 Admin Benutzeroberfläche Prozess
  5. 4.3.1 Optical Mark Recognition (OMR)

4.3.1 Optical Mark Recognition (OMR)

Optical Mark Recognition (OMR)

Optical Mark Recognition (OMR) ist eine Technik zur computergestützten Erkennung von Markierungen auf Papier, ähnlich der Texterkennung (Optical Character Recognition oder OCR).

OMR wird häufig zur automatischen Auswertung von händisch – etwa durch Ankreuzen von vorgedruckten Felden – ausgefüllten Formularen wie zum Beispiel Multiple-Choice-Tests oder Wahlzetteln verwendet.

Der IPA-Server, Bestandteil der IPA-Suite, unterstützt nun die Optical Mark Recognition.

Einfache Erstellung von OMR-Templates

Die Erstellung eines OMR-Template, also einer Vorlage zur maschinellen Erkennung der Ankreuzfelder, ist mit dem IPA-Server besonders einfach:

  1. Scannen Sie eine Mustervorlage ein und laden Sie das Vorlage-Dokument im IPA-Server OMR-Designer
  2. Erstellen Sie einen Anker (siehe unten So wählen Sie den richtigen Anker)
  3. Ziehen Sie mit der Maus ein Feld über das Ankreuzfeld
  4. Geben Sie dem Feld einen Namen
  5. Setzen Sie den Wert für angekreuzt und nicht angekreuzt
  6. Wiederholen Sie die Schritte 3-5 für beliebig viele Ankreuzfelder
  7. Schließen Sie mit dem Button „OK, schließen“ den OMR-Designer und speichern Sie die Prozess-Konfiguration
Optical Mark Recognition Template-Designer
Optical Mark Recognition process
Optical Mark Recognition process

So wählen Sie den richtigen Anker

Bewährt haben sich für die Anker z.B. schwarze Rechtecke, die sich oben am Dokumentenrand befinden. Diese sollten etwa 1 x 1 cm groß sein. Wählen Sie als Farbe schwarz. Bei der Markierung des Ankers achten Sie darauf, dass Sie nach Möglichkeit nur die schwarze Box (ohne weißen Rahmen) markieren.

Im IPA-Server Admin können Sie nach der Definition der OMR-Zonen (vergessen Sie nicht das Speichern Ihres Prozesses!!!) weitere gescannte Dokumente zum Test der Zonendefinition laden. Die definierten Zonen werden sodann mit den korrigierten Verschiebungen gelb markiert.

Direkter Export in eine Excel-Datei

Scannen Sie nun Ihre händisch ausgefüllten Formulare ein. Der IPA-Server wertet die Ankreuzfelder aus und exportiert die Ergebnisse aller Formulare in eine Excel-Datei. Der Prozess passiert vollautomatisch.

Zusätzliche können Sie, z.B. durch Barcodes auf den Dokumenten, beliebige Zusatzinformationen mitgeben. So könnten Sie zum Beispiel die Umfragedaten in verschiedene Excel-Dateien exportieren, ohne vorher die Papierstapel zu sortieren.

Wichtiges Hintergrundwissen: Was ist OMR

Optical Mark Recognition (auch optisches Markierungslesen oder OMR genannt) ist der Prozess, bei dem wir Hardware, Software oder beides verwenden, um das von Menschen markierte Ausfüllen von Multiple-Choice-Fragen, Fragebögen mit richtigen oder falschen Feldern und allen Arten von Dokumentformularen zu erfassen.

Diese Arten von „Felder“, die wir OMR-Zonen nennen, kommen in fast jedem Formular vor, sei es bei einer Umfrage, bei der Sie z.B. Ihr Geschlecht angeben müssen und ob Sie berufstätig sind oder nicht, oder bei Multiple-Choice-Prüfungen, bei denen die OMR-Zonen die dominierende und wichtigste Art von Daten auf dem Formular sind.

Mit dem IPA-Server können Sie diese Dokumente scannen und ein System einrichten, das Ihnen schnell und genau mitteilt, ob jede OMR-Zone ausgefüllt ist oder nicht.

Komponenten eines OME-Systems

Jedes OMR-System besteht unabhängig von der Art des zu verarbeitenden Dokuments aus zwei Hauptkomponenten:

  • Vorlage:
    Dies ist normalerweise ein nicht ausgefülltes Dokument, in dem Sie den Speicherort der Daten angeben, die Sie extrahieren möchten. Diese „Daten“ sind in zwei Teile aufgeteilt:
    • Anker: Ein Logo, ein schwarzes Rechteck oder ein festes Objekt am Rand des Dokuments, von dem wir wissen, dass es in jedem ausgefüllten Formular vorkommt. Dies wird verwendet, um die Verschiebung gescannter ausgefüllter Formulare zu messen, aber dazu später mehr.
    • OMR-Zonen: Das sind die Orte der Zonen, die von Menschen ausgefüllt werden müssen.
      IPA-Server verwendet Rechtecke, die diese Felder umgeben, um ihre Position für den Erkennungsalgorithmus anzugeben.
  • Gescannte Formulare:
    Dies sind die gleichen Formulare wie die Vorlage, jedoch mit den von Menschen markierten Daten darauf.
    Im Grunde genommen handelt es sich dabei um die Dokumente, aus denen wir die Informationen extrahieren möchten.

Mögliche Fehlerquellen

Bevor wir zu unserem Systemdesign übergehen, müssen wir das System selbst verstehen, um Bereiche zu erkennen, die die Qualität unserer Ergebnisse beeinträchtigen könnten.

In OMR-Systemen gibt es drei häufig zu sehende Fehlerquellen, die in der Produktion zu Problemen führen können:

  • Niedrige Auflösung der Bilder:
    Niedrig aufgelöste Bilder, mit 150 dpi und weniger. Sie wirken sich auf die Bildqualität und damit auf die Qualität der OMR-Zonen und der darin enthaltenen Inhalte aus.
  • Kleine Felder:
    Wenn die OMR-Zonen zu klein sind, hängt der Entscheidungsprozess in vielen Fällen von nur wenigen Pixeln ab, wodurch die Daten, die dem Erkennungsalgorithmus zur Verfügung stehen, zu klein werden, um eine genaue Entscheidung zu treffen, und die Fehlergrenzen größer werden.
  • Verschiebungen durch Scannen:
    Das wichtigste Problem. Die Positionen der OMR-Zonen im gescannten ausgefüllten Dokument sind niemals die gleichen wie die im Vorlagendokument angegebenen Positionen. Wieso ist das so?
    Es gibt zwei Hauptgründe für dieses Phänomen:
    • Die Position des Dokuments im Scanner ist nie genau die gleiche wie die Position des Vorlagendokuments im Scanner. Dies ist einfach nur eine Tatsache des menschlichen Lebens, wo es schwierig ist, die Ausrichtung zu 100% korrekt zu halten.
    • Dehnung entlang beider Achsen aufgrund des Einzugsmechanismus im automatischen Dokumenteneinzug des Scanners, falls dieser verwendet wird.

Der IPA-Server hat eine spezielle Technologie mit dem Namen „Anchoring Engine“, die Ihnen hilft, diese Verschiebungen zu analysieren und die OMR-Zonen automatisch zu ändern.

Die ersten beiden Probleme können jedoch während des Formularentwurfs leicht behoben werden, indem mit 200-300 DPI gescannt und die OMR-Felder groß genug gemacht werden, um mehr als ein paar Pixel darin zu enthalten.

Anker-Zone definieren und Verschiebung automatisch korrigieren

Im Absatz Komponenten eines OME-Systems wurde ein Anker wie folgt definiert: Ein Logo, ein schwarzes Rechteck oder ein festes Objekt am Rand des Dokuments, von dem wir wissen, dass es in jedem vorkommt ausgefülltes Formular.

Im Abschnitt Mögliche Fehlerquellen haben wir erwähnt, dass diese Anker verwendet werden, um die Verschiebung zwischen dem Vorlagendokument und den gescannten ausgefüllten Formularen zu messen und zu analysieren. Wie wird das gemacht?

Die Idee hinter der Wahl eines Logos oder eines soliden Rechtecks ​​oder Objekts ist, dass es unabhängig davon, welche Kopie/Scan verwendet wird, in jedem Dokument mit genügend Daten (schwarzen Pixeln) vorkommen muss, um es wieder zu erkennen.

Wenn wir im ausgefüllten Dokument nach diesem „Anker“ suchen, ihn finden und seinen Standort analysieren, können wir seinen neuen Standort mit seinem Standort im Vorlagendokument vergleichen.

Der Unterschied zwischen den beiden Positionen in der X- und Y-Achse ist die Verschiebung. Wenn wir nun diese Verschiebung auf die im Vorlagendokument angegebenen OMR-Zonen anwenden, befinden sie sich an ihrer richtigen Position.