CANDIS > Blog > OCR-Software - Funktion, Nutzen, Technologie

OCR-Software - Funktion, Nutzen, Technologie

OCR-Software - Funktion, Nutzen, Technologie

Inhaltsverzeichnis

  1. here comes table of content generated from the blog body H2 tags


Schonmal den Begriff OCR gehört? Dann wird es höchste Zeit. Vor allem im Dokumentenmanagement wird die Nutzung der OCR-Technologie immer beliebter, denn mit ihrer Hilfe spart man Zeit und Geld. Die Rede ist von Texterkennung, und lästiges Abtippen von Informationen ist damit endlich Geschichte. Doch wie funktioniert die OCR-Technologe überhaupt - und in welchen Bereichen wird sie eingesetzt? Wir haben einen Überblick zusammengestellt - über alles, was man zur OCR-Technologie wissen muss.

Definition OCR 

Die Abkürzung OCR steht für Optical Character Recognition und bedeutet im Wesentlichen “Texterkennung”, bzw. optische Zeichenerkennung. Eine OCR-Software kann digital vorliegende Dokumente auslesen und in Textzeichen umwandeln. 

Die mithilfe der OCR-Technologie entstandene Datei kann digital weiter bearbeitet werden und ersetzt so die manuelle Erfassung von Daten. Das spart also nicht nur mühselige Arbeit, sondern auch viel Platz in Form von Aktenschränken und Ordnern. 

Um ein Dokument digital nutzbar zu machen, muss es zunächst eingescannt werden. Die Fotodatei wird dann von der OCR-Technologie ausgelesen und in eine Datei umgewandelt, in der man z.B. Stichwörter suchen und die man bearbeiten kann. Die meisten Scanner oder vergleichbaren Geräte werden übrigens direkt mit einer Software geliefert, in der die OCR-Technologie verankert ist.

Wie funktioniert eine OCR-Software? 

Einen einfachen Scan oder eine Kopie kennt ja jede:r. Das zu scannende Dokument auflegen, den Scanner anwerfen und schon erstellt der PC eine sogenannte Rastergrafik, eine Bildkopie. Mit der kann man aber nicht viel anfangen, außer sie erneut abzuspeichern, in einer Cloud abzulegen oder nochmal auszudrucken. Um eine Datei zu bekommen, die man digital bearbeiten und durchsuchen kann, braucht es aber mehr. Der mehrstufige Erkennungsprozess einer OCR-Software macht es möglich. 

Wenn es um die Texterkennung geht, gibt es verschiedene Technologien, aus denen man auswählen kann. 

Mustererkennung in OCR-Softwares 

OCR-Programme, die mit Mustererkennung arbeiten, können Buchstaben in häufig verwendeten Schriftarten erkennen. Verdana, Arial, Times New Roman und Co. sind für eine solche OCR-Software kein Problem. Das Programm vergleicht die Darstellung mit unzähligen in der Datenbank der Software abgelegten Fonts und erstellt auf Basis derer ein neues Dokument. Handschriftliche Aufzeichnungen oder nicht gespeicherte Schriftarten werden bei der Mustererkennung jedoch häufig nicht erkannt.

Merkmalserkennung in OCR-Softwares 

Bei der Merkmalserkennung - auch intelligente Zeichenerkennung (ICR) genannt -  wird das Originaldokument in kleinste Teile zerlegt. Buchstaben werden beispielsweise in Linien, Ausrichtung der Linien, Bögen und Schnittstellen geteilt. Dadurch wird die Darstellung für die Software weniger komplex und die Rechenleistung zur Erkennung wird effektiv genutzt. Die Merkmale werden mit anderen Zeichen abgeglichen, Hilfsmittel wie der sogenannte k-nearest-neighbor-Algorithmus grenzen die Optionen ein und wählen schließlich die wahrscheinlichste aus. Auch handschriftliche Notizen können mithilfe der Merkmalserkennung digitalisiert werden. 

Zonale OCR in OCR-Softwares 

Nicht immer muss das gesamte Dokument erfasst und verarbeitet werden. Die zonale ist eine spezifische Art der OCR, die nur Teile bzw. Textdatenfelder des Dokumentes übernimmt. Bei Rechnungen oder Lieferscheinen zählt vor allem die Rechnungs- bzw. Liefernummer, weniger aber die formellen Anschreiben. Die gewünschten Textparts können in einer Software mit zonaler OCR vorab ausgewählt werden. Dadurch verkürzt sich der gesamte Vorgang und die Daten können noch schneller erfasst werden. 

ICR - Intelligent Character Recognition 

ICR - das I steht für intelligent. Die intelligente Texterkennung ist komplexer als die konventionelle OCR. Sie erkennt neben Wörtern und Zahlen auch Sonderzeichen. Die intelligente Texterkennung korrigiert sogar Schreib- oder Tippfehler, orientiert sich an der Rechtschreibung und erkennt - je nach Software - sogar Fremdsprachen. Handschriftliche Notizen, Briefe oder Dokumente können ebenfalls ausgelesen werden. Das ist vor allem für historische Dokumente hilfreich, deren Inhalt so konserviert werden kann. Für diese Leistung verwenden ICR-Softwares linguistische und statistische Mittel und Erkenntnisse. 

OMR - Optical Marc Recognition 

Bei OMR geht es um die Erkennung von Markierungen auf Papier. Angekreuzte Multiple-Choice-Fragebögen oder Wahlzettel können mithilfe dieser Technologie schneller ausgewertet werden.

Die Vorteile der OCR-Technologie

OCR-Softwares finden an vielen Stellen Anwendung. Ob in Universitäten, Unternehmen oder Anwaltskanzleien - überall erleichtert die OCR-Technologie bürokratische Vorgänge. Nach der Texterkennung kann das Dokument nach bestimmten Begriffen durchsucht, bearbeitet oder in ein anderes Format umgewandelt werden. 

Auch Merkmale wie Vertrags- oder Rechnungsnummer können per OCR-Software direkt festgestellt und das Dokument so automatisch an die entsprechende Zuständigkeit weitergeleitet werden. Das spart Zeit - und natürlich Geld. 

Auch, wenn ein Originaldokument mit großer Sorgfalt erstellt wurde - Fehler sind menschlich. Die Auslesungsrate von OCR-Softwares hingegen ist sehr zuverlässig und kann sogar grobe Tippfehler, optische Unschärfen oder Schriftarten korrigieren. Das Ergebnis noch einmal gegenzulesen, ist dennoch ratsam. Insbesondere bei hohen Rechnungsbeträgen oder rechtlich wichtigen Dokumenten gibt die Kombination aus hochwertiger OCR-Technologie und fachlicher Kompetenz der Mitarbeiter:innen das beste Ergebnis.

Tipp: Gute OCR-Softwares sind ihr Geld wert. Wer erstmal testen möchte, ob sich die Nutzung einer OCR-Software geschmeidig in den eigenen Arbeitsablauf integrieren lässt, kann auch zuerst eine Freeware ausprobieren.

Wo werden OCR-Softwares eingesetzt? 

OCR-Technologie findet in vielen Bereichen Anwendung. Vor allem Workflows lassen sich mit einer OCR-Software deutlich vereinfachen. Ein paar Beispiele: 

  • Anwalts- und Steuerberaterkanzleien setzen OCR-Technologie ein, um Ausdrucke von Gerichtsurteilen und Protokollen digital lesbar zu machen. 
  • Die Post verwendet OCR-Softwares unter anderem zum Auslesen der Postleitzahlen. Dadurch vereinfacht sich die Sortierung nach Zielregion. 
  • Archive und Universitätsbibliotheken verwenden OCR-Softwares und können so ihre digitale Datenbank erweitern. User:innen finden so in der Volltextsuche schnell und effizient, was sie benötigen. 
  • Für blinde Menschen bieten OCR-Softwares eine besonders wertvolle Hilfe. Die eingescannten und erkannten Dokumente können nun per Sprachausgabe vorgelesen werden. 
  • Verkehrssünder:innen unterwegs? Mithilfe der OCR-Technologie kann die Polizei Autokennzeichen in Windeseile auslesen und über die Auswertung von Radarbildern ausfindig machen. 
  • Und wieder ist die Steuererklärung fällig. Mit einer OCR-Software wird sie aber direkt einfacher, weil sich Quittungen, Rechnungen und Kontoauszüge einfach auf digitalem Weg auslesen und archivieren lassen. Damit erhalten Steuerzahler:innen direkt einen besseren Überblick über die Finanzen des letzten Jahres.
  • Banken und Finanzdienstleister setzen OCR-Technologie ein, um riesige Datenmengen korrekt zu erfassen. Die Technologie dient als grundlegender Schritt in Richtung Automatisierung.

OCR-Technologie bei CANDIS 

Auch CANDIS setzt OCR-Technologie ein, um z. B. Rechnungsdaten wie Belegdatum und -nummer, IBAN oder Kostenstelle zu erfassen. Doppelerfassungen werden so vermieden und manuelles Abtippen der Buchungsdaten gehört der Vergangenheit an. Auf der Basis der ausgelesenen Rechnungsdaten wird anschließend die zur Freigabe zuständige Person ermittelt und die Rechnung an sie weitergeleitet. 


Hannah Bachmann
Hannah Bachmann

Content Writer

Hannah schreibt seit vielen Jahren Artikel und hat sich auf alle Themen rund um Rechnungsmanagement und vorbereitende Buchhaltung spezialisiert.

FAQ

Was versteht man unter OCR?
Wie funktioniert OCR-Technologie?
Wie wird OCR-Technologie bei CANDIS eingesetzt?

Verwandte Artikel

Du willst immer auf dem Laufenden bleiben? Dann abonniere unseren Newsletter.

Danke! Ihre E-Mail-Adresse wurde in den Newsletter-Verteiler aufgenommen.
Etwas ist schief gelaufen. Bitte versuchen Sie es erneut.