Candis logo
Candis logo

OCR-Technologie: Definition, Nutzen und Software

Hannah Bachmann

Hannah Bachmann

-

June 1, 2022

-

(Reading time: 5min)

A woman is using the OCR-technology on her phone and is holding a paper while setting at a wooden table.

Key Takeaways

  • OCR steht für Optical Character Recognition und bedeutet optische Zeichenerkennung

  • Sie ist ein integrierter Bestandteil vieler automatisierter Prozesse in Unternehmen oder staatlichen Institutionen

  • Da die OCR-Technologie Daten sauberer und zuverlässiger ausliest als das menschliche Auge, werden so bei Datenübertragungen häufig Fehler vermieden sowie Zeit und Geld gespart

  • Vor allem in der Buchhaltung ist die OCR-Technologie Gold wert: Rechnungen ganz einfach auszulesen und zu übertragen, vereinfacht den Rechnungs-Workflow.

OCR-Technologie – was ist das?

Die Abkürzung OCR steht für Optical Character Recognition und bedeutet im Wesentlichen „Texterkennung“ bzw. optische Zeichenerkennung. Die OCR-Technologie kann digital vorliegende Dokumente auslesen und in Textzeichen umwandeln. Vor allem im Dokumentenmanagement wird sie immer beliebter, denn mit ihrer Hilfe spart man Zeit und Geld.

Die entstandene Datei kann digital weiter bearbeitet werden und ersetzt so die manuelle Erfassung von Daten. Das spart also nicht nur mühselige Arbeit, sondern auch viel Platz in Form von Aktenschränken und Ordnern.

Um ein analoges Dokument digital nutzbar zu machen, muss es zunächst eingescannt werden. Die Fotodatei wird dann von der OCR-Technologie ausgelesen und in eine Datei umgewandelt, in der man z. B. Stichwörter suchen und die man bearbeiten kann. Die meisten Scanner oder vergleichbaren Geräte werden übrigens direkt mit einer Software geliefert, in der die OCR-Technologie verankert ist.

Wie funktioniert die OCR-Technologie?

Wenn es um die Texterkennung geht, gibt es verschiedene Technologien, aus denen man auswählen kann:

Mustererkennung

OCR-Softwares, die mit Mustererkennung arbeiten, können Buchstaben in häufig verwendeten Schriftarten erkennen. Verdana, Arial, Times New Roman und Co. sind für eine solche OCR-Software kein Problem.

Die OCR-Software vergleicht die Darstellung mit unzähligen in der Datenbank der Software abgelegten Fonts und erstellt auf Basis derer ein neues Dokument. Handschriftliche Aufzeichnungen oder nicht gespeicherte Schriftarten werden bei der Mustererkennung jedoch häufig nicht erkannt.

Zonale OCR

Nicht immer muss das gesamte Dokument erfasst und verarbeitet werden. Die zonale OCR-Technologie ist eine spezifische Art der OCR, die nur Teile bzw. Textdatenfelder des Dokumentes übernimmt.

Die gewünschten Textparts können in einer Software mit zonaler OCR vorab ausgewählt werden. Dadurch verkürzt sich der gesamte Vorgang und die Daten können noch schneller erfasst werden.

Merkmalserkennung

Bei der Merkmalserkennung wird das Originaldokument in kleinste Teile zerlegt. Buchstaben werden beispielsweise in Linien, Ausrichtung der Linien, Bögen und Schnittstellen geteilt.

Die Merkmale werden mit anderen Zeichen abgeglichen und Hilfsmittel wie der sogenannte „k-nearest-neighbor-Algorithmus“ grenzen die Optionen ein. Auch handschriftliche Notizen können mithilfe der Merkmalserkennung digitalisiert werden.

ICR – „Intelligent Character Recognition"

Die intelligente Texterkennung ist komplexer als die konventionelle OCR-Technologie. Sie erkennt neben Wörtern und Zahlen auch Sonderzeichen, korrigiert Schreib- oder Tippfehler und erkennt, je nach Software, sogar Fremdsprachen.

Handschriftliche Notizen, Briefe oder Dokumente können ebenfalls ausgelesen werden. Das ist vor allem für historische Dokumente hilfreich, deren Inhalt so konserviert werden kann. Für diese Leistung verwenden ICR-Softwares linguistische und statistische Mittel.

OMR – „Optical Marc Recognition"

Bei OMR geht es um die Erkennung von Markierungen auf Papier. Angekreuzte Multiple-Choice-Fragebögen oder Wahlzettel können mithilfe dieser Technologie schneller ausgewertet werden.

Die Vorteile der OCR-Technologie

OCR-Softwares finden an vielen Stellen Anwendung. Ob in Universitäten, Unternehmen oder Anwaltskanzleien – überall erleichtert die OCR-Technologie bürokratische Vorgänge. Nicht umsonst ist sie so populär, denn sie beinhaltet viele Vorteile:

Flexibilität: Nach der Texterkennung kann das Dokument nach bestimmten Begriffen durchsucht, bearbeitet oder in ein anderes Format umgewandelt werden.

Zeit- und Geldeinsparung: Auch Merkmale wie Vertrags- oder Rechnungsnummer können per OCR-Technologie direkt festgestellt und das Dokument so automatisch an die entsprechende Zuständigkeit weitergeleitet werden. Das spart Zeit und natürlich Geld.

Fehlerminimierung: Auch, wenn ein Originaldokument mit großer Sorgfalt erstellt wurde: Fehler sind menschlich. Die Auslesungsrate von OCR-Softwares hingegen ist sehr zuverlässig und kann sogar grobe Tippfehler, optische Unschärfen oder Schriftarten korrigieren. Das Ergebnis noch einmal gegenzulesen, ist dennoch ratsam. Insbesondere bei hohen Rechnungsbeträgen oder rechtlich wichtigen Dokumenten gibt die Kombination aus hochwertiger OCR-Technologie und fachlicher Kompetenz der Mitarbeiter:innen das beste Ergebnis.

Tipp: Gute OCR-Softwares sind ihr Geld wert. Wer erstmal testen möchte, ob sich die Nutzung einer OCR-Software geschmeidig in den eigenen Arbeitsablauf integrieren lässt, kann auch zuerst eine Freeware ausprobieren.

Beispiele für die Anwendung der OCR-Technologie

Die OCR-Technologie ist schon viel weiter verbreitet, als man glauben mag. Vor allem in staatlichen Institutionen sind viele Prozesse dank OCR-Technologie bereits deutlich vereinfacht worden. Hier gibt es ein paar Beispiele:

  • Anwalts- und Steuerberaterkanzleien verwenden die OCR-Technologie, um Ausdrucke von Gerichtsurteilen und Protokollen digital lesbar zu machen.

  • Die Post verwendet die OCR-Technologie unter anderem zum Auslesen der Postleitzahlen. Dadurch vereinfacht sich die Sortierung nach Zielregion.

  • Archive und Universitätsbibliotheken verwenden OCR-Softwares und können so ihre digitale Datenbank erweitern. User:innen finden so in der Volltextsuche schnell und effizient, was sie benötigen.

  • Für blinde Menschen bieten OCR-Softwares eine besonders wertvolle Hilfe. Die eingescannten und erkannten Dokumente können nun per Sprachausgabe vorgelesen werden.

  • Verkehrssünder:innen unterwegs? Mithilfe der OCR-Technologie kann die Polizei Autokennzeichen in Windeseile auslesen und über die Auswertung von Radarbildern ausfindig machen.

  • Und wieder ist die Steuererklärung fällig. Mit einer OCR-Software wird sie aber direkt einfacher, weil sich Quittungen, Rechnungen und Kontoauszüge einfach auf digitalem Weg auslesen und archivieren lassen. Damit erhalten Steuerzahler:innen direkt einen besseren Überblick über die Finanzen des letzten Jahres.

  • Banken und Finanzdienstleister setzen die OCR-Technologie ein, um riesige Datenmengen korrekt zu erfassen. Die Technologie dient als grundlegender Schritt in Richtung Automatisierung.

Die OCR-Technologie bei Candis

Auch Candis setzt die OCR-Technologie ein, um z. B. Rechnungsdaten wie Belegdatum und -nummer, IBAN oder Kostenstelle zu erfassen.

Doppelerfassungen werden so vermieden und manuelles Abtippen der Buchungsdaten gehört der Vergangenheit an. Auf der Basis von ausgelesenen Rechnungsdaten wird anschließend die zur Freigabe zuständige Person ermittelt und die Rechnung an sie weitergeleitet.

OCR-Technologie: Definition, Nutzen und Software

Hannah Bachmann

Hannah Bachmann

-

June 1, 2022

-

(Reading time: 5min)

A woman is using the OCR-technology on her phone and is holding a paper while setting at a wooden table.

Key Takeaways

  • OCR steht für Optical Character Recognition und bedeutet optische Zeichenerkennung

  • Sie ist ein integrierter Bestandteil vieler automatisierter Prozesse in Unternehmen oder staatlichen Institutionen

  • Da die OCR-Technologie Daten sauberer und zuverlässiger ausliest als das menschliche Auge, werden so bei Datenübertragungen häufig Fehler vermieden sowie Zeit und Geld gespart

  • Vor allem in der Buchhaltung ist die OCR-Technologie Gold wert: Rechnungen ganz einfach auszulesen und zu übertragen, vereinfacht den Rechnungs-Workflow.

OCR-Technologie – was ist das?

Die Abkürzung OCR steht für Optical Character Recognition und bedeutet im Wesentlichen „Texterkennung“ bzw. optische Zeichenerkennung. Die OCR-Technologie kann digital vorliegende Dokumente auslesen und in Textzeichen umwandeln. Vor allem im Dokumentenmanagement wird sie immer beliebter, denn mit ihrer Hilfe spart man Zeit und Geld.

Die entstandene Datei kann digital weiter bearbeitet werden und ersetzt so die manuelle Erfassung von Daten. Das spart also nicht nur mühselige Arbeit, sondern auch viel Platz in Form von Aktenschränken und Ordnern.

Um ein analoges Dokument digital nutzbar zu machen, muss es zunächst eingescannt werden. Die Fotodatei wird dann von der OCR-Technologie ausgelesen und in eine Datei umgewandelt, in der man z. B. Stichwörter suchen und die man bearbeiten kann. Die meisten Scanner oder vergleichbaren Geräte werden übrigens direkt mit einer Software geliefert, in der die OCR-Technologie verankert ist.

Wie funktioniert die OCR-Technologie?

Wenn es um die Texterkennung geht, gibt es verschiedene Technologien, aus denen man auswählen kann:

Mustererkennung

OCR-Softwares, die mit Mustererkennung arbeiten, können Buchstaben in häufig verwendeten Schriftarten erkennen. Verdana, Arial, Times New Roman und Co. sind für eine solche OCR-Software kein Problem.

Die OCR-Software vergleicht die Darstellung mit unzähligen in der Datenbank der Software abgelegten Fonts und erstellt auf Basis derer ein neues Dokument. Handschriftliche Aufzeichnungen oder nicht gespeicherte Schriftarten werden bei der Mustererkennung jedoch häufig nicht erkannt.

Zonale OCR

Nicht immer muss das gesamte Dokument erfasst und verarbeitet werden. Die zonale OCR-Technologie ist eine spezifische Art der OCR, die nur Teile bzw. Textdatenfelder des Dokumentes übernimmt.

Die gewünschten Textparts können in einer Software mit zonaler OCR vorab ausgewählt werden. Dadurch verkürzt sich der gesamte Vorgang und die Daten können noch schneller erfasst werden.

Merkmalserkennung

Bei der Merkmalserkennung wird das Originaldokument in kleinste Teile zerlegt. Buchstaben werden beispielsweise in Linien, Ausrichtung der Linien, Bögen und Schnittstellen geteilt.

Die Merkmale werden mit anderen Zeichen abgeglichen und Hilfsmittel wie der sogenannte „k-nearest-neighbor-Algorithmus“ grenzen die Optionen ein. Auch handschriftliche Notizen können mithilfe der Merkmalserkennung digitalisiert werden.

ICR – „Intelligent Character Recognition"

Die intelligente Texterkennung ist komplexer als die konventionelle OCR-Technologie. Sie erkennt neben Wörtern und Zahlen auch Sonderzeichen, korrigiert Schreib- oder Tippfehler und erkennt, je nach Software, sogar Fremdsprachen.

Handschriftliche Notizen, Briefe oder Dokumente können ebenfalls ausgelesen werden. Das ist vor allem für historische Dokumente hilfreich, deren Inhalt so konserviert werden kann. Für diese Leistung verwenden ICR-Softwares linguistische und statistische Mittel.

OMR – „Optical Marc Recognition"

Bei OMR geht es um die Erkennung von Markierungen auf Papier. Angekreuzte Multiple-Choice-Fragebögen oder Wahlzettel können mithilfe dieser Technologie schneller ausgewertet werden.

Die Vorteile der OCR-Technologie

OCR-Softwares finden an vielen Stellen Anwendung. Ob in Universitäten, Unternehmen oder Anwaltskanzleien – überall erleichtert die OCR-Technologie bürokratische Vorgänge. Nicht umsonst ist sie so populär, denn sie beinhaltet viele Vorteile:

Flexibilität: Nach der Texterkennung kann das Dokument nach bestimmten Begriffen durchsucht, bearbeitet oder in ein anderes Format umgewandelt werden.

Zeit- und Geldeinsparung: Auch Merkmale wie Vertrags- oder Rechnungsnummer können per OCR-Technologie direkt festgestellt und das Dokument so automatisch an die entsprechende Zuständigkeit weitergeleitet werden. Das spart Zeit und natürlich Geld.

Fehlerminimierung: Auch, wenn ein Originaldokument mit großer Sorgfalt erstellt wurde: Fehler sind menschlich. Die Auslesungsrate von OCR-Softwares hingegen ist sehr zuverlässig und kann sogar grobe Tippfehler, optische Unschärfen oder Schriftarten korrigieren. Das Ergebnis noch einmal gegenzulesen, ist dennoch ratsam. Insbesondere bei hohen Rechnungsbeträgen oder rechtlich wichtigen Dokumenten gibt die Kombination aus hochwertiger OCR-Technologie und fachlicher Kompetenz der Mitarbeiter:innen das beste Ergebnis.

Tipp: Gute OCR-Softwares sind ihr Geld wert. Wer erstmal testen möchte, ob sich die Nutzung einer OCR-Software geschmeidig in den eigenen Arbeitsablauf integrieren lässt, kann auch zuerst eine Freeware ausprobieren.

Beispiele für die Anwendung der OCR-Technologie

Die OCR-Technologie ist schon viel weiter verbreitet, als man glauben mag. Vor allem in staatlichen Institutionen sind viele Prozesse dank OCR-Technologie bereits deutlich vereinfacht worden. Hier gibt es ein paar Beispiele:

  • Anwalts- und Steuerberaterkanzleien verwenden die OCR-Technologie, um Ausdrucke von Gerichtsurteilen und Protokollen digital lesbar zu machen.

  • Die Post verwendet die OCR-Technologie unter anderem zum Auslesen der Postleitzahlen. Dadurch vereinfacht sich die Sortierung nach Zielregion.

  • Archive und Universitätsbibliotheken verwenden OCR-Softwares und können so ihre digitale Datenbank erweitern. User:innen finden so in der Volltextsuche schnell und effizient, was sie benötigen.

  • Für blinde Menschen bieten OCR-Softwares eine besonders wertvolle Hilfe. Die eingescannten und erkannten Dokumente können nun per Sprachausgabe vorgelesen werden.

  • Verkehrssünder:innen unterwegs? Mithilfe der OCR-Technologie kann die Polizei Autokennzeichen in Windeseile auslesen und über die Auswertung von Radarbildern ausfindig machen.

  • Und wieder ist die Steuererklärung fällig. Mit einer OCR-Software wird sie aber direkt einfacher, weil sich Quittungen, Rechnungen und Kontoauszüge einfach auf digitalem Weg auslesen und archivieren lassen. Damit erhalten Steuerzahler:innen direkt einen besseren Überblick über die Finanzen des letzten Jahres.

  • Banken und Finanzdienstleister setzen die OCR-Technologie ein, um riesige Datenmengen korrekt zu erfassen. Die Technologie dient als grundlegender Schritt in Richtung Automatisierung.

Die OCR-Technologie bei Candis

Auch Candis setzt die OCR-Technologie ein, um z. B. Rechnungsdaten wie Belegdatum und -nummer, IBAN oder Kostenstelle zu erfassen.

Doppelerfassungen werden so vermieden und manuelles Abtippen der Buchungsdaten gehört der Vergangenheit an. Auf der Basis von ausgelesenen Rechnungsdaten wird anschließend die zur Freigabe zuständige Person ermittelt und die Rechnung an sie weitergeleitet.

FAQ

Lern uns kennen! Kostenfrei.

Durch Absenden des Formulars bestätige ich, dass ich die Datenschutzerklärung zur Kenntnis genommen habe und mit der Verarbeitung meiner personenbezogenen Daten durch Candis zu den genannten Zwecken einverstanden bin. Ich kann meine Zustimmung hierzu jederzeit widerrufen.

Manage your invoices on the go with new Candis mobile app.

Candis mobile app on Google PlayGet it on gPlay

Cards are issued by Transact Payments Malta Limited pursuant to licence by VISA Europe Limited. Transact Payments Malta Limited is duly authorised and regulated by the Malta Financial Services Authority as a Financial Institution under the Financial Institution Act 1994. Registration number C91879.