Mobile-Menu

Optische Zeichenerkennung Was ist Optical Character Recognition (OCR)?

Von Dipl.-Ing. (FH) Stefan Luber 2 min Lesedauer

Anbieter zum Thema

Unter Optical Character Recognition versteht man die automatische Erkennung von geschriebenem oder gedrucktem Text in gescannten Dokumenten oder in Bildern. Mithilfe von OCR-Software wird bildlich dargestellter Text in eine von Textprogrammen und anderer Software interpretierbare Textcodierung überführt.

Die wichtigsten IT-Fachbegriffe verständlich erklärt.(Bild:  © aga7ta - Fotolia)
Die wichtigsten IT-Fachbegriffe verständlich erklärt.
(Bild: © aga7ta - Fotolia)

OCR ist das Akronym für Optical Character Recognition. Die deutsche Übersetzung lautet „optische Zeichenerkennung“.

Bei OCR handelt es sich um Verfahren, mit denen sich in Bildern oder in gescannten oder abfotografierten Texten dargestellter, handgeschriebener oder gedruckter Text automatisiert in ein maschineninterpretierbares, digitales Textformat überführen lässt. Mithilfe von OCR extrahierter und in ein digitales Textformat konvertierter Text lässt sich anschließend mit Software wie Textverarbeitungsprogrammen weiterverarbeiten. Optical Character Recognition macht manuelles Abschreiben oder Eingeben bildlich dargestellter Texte überflüssig.

Prinzipielle Funktionsweise der optischen Zeichenerkennung

Für Optical Character Recognition kommt häufig eine Kombination aus Soft- und Hardware zum Einsatz. Mithilfe von Hardware lassen sich physische Dokumente oder Bilder mit Textinhalten einscannen oder abfotografieren und in ein Bildformat umwandeln. Diese Fotografien oder Scans werden anschließend der OCR-Software in Form von Dateien zur Verfügung gestellt.

Die OCR-Software analysiert die Scans oder Fotografien und führt eine Vorverarbeitung durch. Die Bilder oder Scans werden meist in Schwarzweißformate verwandelt. Zudem werden störende Elemente wie Flecken entfernt, Ausrichtungen oder Verzerrungen korrigiert, Kanten der Text-Images geglättet und Kontraste erhöht. Anschließend identifiziert die Software grob die Bildbereiche mit den zu erkennenden Textinhalten.

Sind die Vorbereitungen abgeschlossen, findet die eigentliche Zeichenerkennung statt. Es können hierfür verschiedene Verfahren, beispielsweise merkmals- oder musterbasierte Verfahren, zum Einsatz kommen.

Mit der Erkennung der Zeichen ist im eigentlichen Sinn des Begriffs Optical Character Recognition der OCR-Vorgang abgeschlossen. OCR-Software geht aber meist über die reine Zeichenerkennung hinaus. Die Software erkennt beispielsweise die vorliegende Sprache und fügt die identifizierten Zeichen zu Wörtern und ganzen Sätzen zusammen. Anschließend ist eine automatisierte Grammatik- und Rechtschreibprüfung möglich. Als letzter Schritt folgt die Formatierung, Bereitstellung und Speicherung des erkannten Textes in einem maschineninterpretierbaren, digitalen Textformat.

Weiterentwicklung von OCR

Wie im vorigen Abschnitt angedeutet, geht Optical Character Recognition mittlerweile über die reine Zeichenerkennung weit hinaus. Moderne OCR-Software verfügt über sogenannte ICR- und IWR-Funktionen. ICR und IWR stehen für „Intelligent Character Recognition“ und „Intelligent Word Recognition“. Die Grenzen zwischen OCR, ICR und IWR sind fließend. Häufig stehen Marketinggründe hinter der Verwendung der Begriffe.

Mit ICR und IWR kommen für die optische Texterkennung Verfahren der Künstlichen Intelligenz und des Maschinellen Lernens ins Spiel. ICR und IWR können als eine Art Weiterentwicklung von OCR verstanden werden. Mit ihnen werden die Kontextanalyse von Texten und die automatische Korrektur reiner Zeichenerkennungsergebnisse möglich. Die Endergebnisse der Zeichen- und Texterkennung werden durch die selbstlernenden Systeme kontinuierlich verbessert.

Einsatzbereiche von Optical Character Recognition

Typische Einsatzbereiche von OCR sind:

  • elektronisches Erfassen, Verarbeiten und Durchsuchen der Textinformationen von in Bild- oder Papierform vorliegenden Dokumenten (zum Beispiel Konvertierung in durchsuchbare PDFs),
  • automatische Klassifizierung von Dokumenten und Volltextsuche,
  • Archivierung von Buchbeständen,
  • Erkennen von Adressen auf Briefen,
  • Erkennung von Fahrzeugkennzeichen,
  • Einlesen von Ausweisdaten,
  • Unterstützung von Menschen mit Seheinschränkungen (zum Beispiel das Vorlesen oder Übersetzen gedruckter Texte),
  • Steuerung von Computern über handgeschriebenen Text,
  • automatische Verarbeitung von Belegen.

(ID:50196949)

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu Data-Storage und -Management

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung