OCR und KI: Intelligente Dokumentenverarbeitung

15.12.2022

“Klassische” Optical Character Recognition (OCR) wird bereits seit vielen Jahren eingesetzt – KI-basierte Verfahren zur Dokumentenverarbeitung schaffen komplett neue Perspektiven: weit höhere Erkennungsraten, Automatisierung von komplexen Prozessen und deutlich mehr Effizienz.

OCR Texterkennung und künstliche Intelligenz

Extraktion von Informationen – selbst aus langen, komplexen Dokumenten

Die Digitalisierung zahlreicher Geschäftsprozesse ist ohne strukturierte Auswertung von Informationen aus Dokumenten nicht möglich. Wo die Systeme bislang an Ihre Grenzen gestoßen sind, macht OCR mit KI-Technologie es möglich, selbst lange und komplexe Dokumente strukturiert auszuwerten. Informationen können so nicht nur aus standardisierten Dokumenten, wie Rechnungen, ausgelesen werden – selbst Vertragsinformationen oder wissenschaftliche Publikationen lassen sich analysieren und die Informationen extrahieren.

Individuell und strategisch sinnvoll in die Prozesslandschaft integriert ermöglicht der Einsatz von OCR mit KI-Technologie es Unternehmen Prozesse zu automatisieren, die Effizienz zu steigern, die Fehlerquote zu reduzieren und eine wertvolle Datenbasis für strategische Entscheidungen zu schaffen.

OCR mit KI in der Praxis

Prozesse beim Einsatz von OCR mit KI-Technologie

Neueste OCR KI-Technologie extrahiert Informationen zuverlässig

Perfekt in die bestehende IT-Umgebung integriert und abgestimmt auf Folgeprozesse sorgt OCR mit KI-Technologie für die initiale Klassifikation der eingehenden Dokumente – oder auch für die Basisanalyse großer Mengen an Bestandsdokumenten. Im Anschluss extrahiert die Software die benötigten Informationen anhand der “Contextual AI”.

Dabei erkennt die KI Informationen im Kontext – unabhängig vom Aufbau der Dokumente oder konkreten Formulierungen. Die Informationen können dann mit bestehenden Daten (z.B. im ERP oder CRM-System) abgeglichen und bei Bedarf natürlich auch überprüft und ggf. korrigiert werden. Im Anschluss initiiert die Software für OCR mit KI individuell auf den Prozess abgestimmte Workflows und übergibt die Daten.

Nachfolgend der Basis-Prozess beim Einsatz der KI-Software kinisto von tetrel:

Vorteile von OCR Texterkennung mit KI

Massiv beschleunigtes Eingangsmanagement

Automatisierung bislang manueller Tätigkeiten

Automatisierung von komplexen Prozessen

Effizientere Prozesse

Schnellere Bearbeitung

Höhere Genauigkeit

Compliant

Schnell einsatzbereit

Automatisierung von Workflows

Einsatzgebiete von OCR und KI-basierter Dokumentenverarbeitung

OCR kommt bereits seit längerer Zeit in Unternehmen zum Einsatz – vor allem zum Auslesen von Daten aus Rechnungen. Hier sind die Systeme z.T. bereits recht ausgereift, da insbesondere Rechnungen die am weitesten standardisierten Dokumente in Unternehmen sind. Durch den Einsatz von KI-Technologie lassen sich die Erkennungsraten noch einmal massiv steigern, da Informationen unabhängig vom Layout erkannt werden. Es kann ein Automatisierungsgrad bis zur kompletten Dunkelverarbeitung erreicht werden.

Lösungen zur intelligenten Dokumentenverarbeitung lohnen sich insbesondere da, wo das Lesen von Text manuellen Aufwand verursacht. Die KI-Technologie ermöglicht das Auffinden von Informationen in langen, komplexen Dokumenten. Das bedeutet in der Praxis vor allem Zeitersparnis, aber auch mehr Transparenz, geringere Fehlerquote und bessere Skalierbarkeit. Im Gegensatz zur OCR kann eine KI-Software zur Erledigung von Teil-Arbeitsschritten in komplexe Prozesse am Dokument eingebunden werden. So beispielsweise bei der Prüfung von Verträgen auf bestimmte Risikoklauseln oder auch beim Abgleich von Bewerbungsunterlagen mit dem geforderten Skillset.

Intelligent Document Processing (IDP)-Lösungen ermöglichen darüber hinaus das schnelle Auslesen von Informationen aus großen Mengen an Dokumenten. So kann beispielsweise der gesamte Vertragsbestand von Versicherungen schnell auf bestimmte Inhalte geprüft werden. KI macht also bereits vorhandene, jedoch bislang “versteckte” Informationen verwertbar.

OCR mit KI vs OCR ohne KI

Klassisches OCR Processing und OCR mit neuester KI-Technologie

Optical Character Recognition ist nicht gleich Intelligent Character Recognition

Dass das klassische OCR-Verfahren weder die Genauigkeit noch die Skalierbarkeit einer KI-basierten Dokumentenverarbeitung erreichen kann, wird schnell offensichtlich. Layouts verändern sich über die Zeit, es kommen neue Dokumente mit bisher unbekanntem Aufbau hinzu. Schlagwortbasierte Text-Regeln sind zudem selten eindeutig. KI-basierte Verfahren erkennen diese Fälle durch “echtes” Sprachverständnis dagegen unabhängig von der genauen Formulierung im Text.

OCR- und KI-Dokumentenverarbeitung im Vergleich:

MöglichkeitOCRKI
Schlagwortsuche
Positionsbasierte Erkennung
Verarbeitung ohne Positionstemplates
Verarbeitung ohne manuelle Regeln
Erkennung von Informationen im sprachlichen Kontext
Verarbeitung bisher unbekannter Formulierungen ohne Anpassung
Verarbeitung bisher unbekannter Layouts ohne Anpassung

Eine KI-basierte Dokumentenverarbeitung kann grundsätzlich Aufgaben erledigen, die sonst auch ein:e Werkstudent:in durchführen würde – also eine Klassifizierung oder Extraktion von Informationen nach klaren Vorgaben durchführen.

Hintergrundwissen - OCR Texterkennung und Künstliche Intelligenz

Vom Template zum Lesen auf menschlichem Niveau

OCR mit KI ermöglicht die Verarbeitung komplexer und langer Dokumente

Dokumentenverarbeitung mittels reiner OCR

Optical Character Recognition (OCR) hat mit KI zunächst nichts zu tun. Das klassische Verfahren zur automatisierten Dokumentenverarbeitung existieren bereits seit den 1970er-Jahren1. Es basiert auf der Erkennung von Informationen, die standardmäßig an einer bestimmten Position im Dokument stehen. Regelbasiert wird dabei auf Basis des Seitenlayouts oder einzelner Schlagwörter versucht, die korrekten Informationen zu erkennen. So kann zum Beispiel eine fünfstellige Zahl als Postleitzahl erkannt werden und das Wort danach als zugehöriger Ort.

Das bedeutet in der Umsetzung: Für jedes Layout und jede mögliche Formulierung müssen spezifische Regeln (sog. Templates) erstellt werden. Ohne das für den Dokumententyp passende Layout ist keine Erkennung von Informationen möglich. Die Grenzen der OCR sind somit, im Gegensatz zur KI-basierten Lösung, schnell erreicht. Denn eine fünfstellige Zahl kann eben nicht nur eine Postleitzahl sein, sondern auch ein Geldbetrag.


  1. https://en.wikipedia.org/wiki/Timeline_of_optical_character_recognition ↩︎

KI-basierte Dokumentenverarbeitung

Im Unterschied zur OCR: KI-basierte Lösungen zur intelligenten Dokumentenverarbeitung ermöglichen das Auslesen von Informationen auf menschlichem Niveau – nur schneller und präziser.

Eine OCR kommt hierbei lediglich zwecks Pre-Processing zum Einsatz. Also zum initialen Erkennen von Text in gescannten Dokumenten. Die KI-basierte Software erkennt dann jedoch auch die Bedeutung der Textbausteine und stellt deren Beziehung zueinander her – sowohl sprachlich als auch bezogen auf die Position im Dokument. Das ermöglicht die Erfassung von komplexen inhaltlichen Zusammenhängen, unabhängig von Formulierung, Aufbau, Layout und Format.

Die Rolle von OCR und KI bei der digitalen Transformation

Wir stehen am Anfang. Noch lange sind die Möglichkeiten, die intelligente Lösungen zur Dokumentenverarbeitung für Unternehmen bieten, nicht ausgeschöpft. Der Einsatz von KI-Technologie lohnt sich nicht nur für Konzerne, auch kleinere und mittelständische Unternehmen können nachhaltig Prozesse effizienter gestalten, Mitarbeiter entlasten, Fehlerquoten reduzieren und dank der neuen Technologie wirtschaftlicher arbeiten. Intelligent Document Processing wird die Art, wie wir unsere täglichen Aufgaben im Zusammenhang mit Dokumenten und Text erledigen, nachhaltig verändern.

Software für OCR Texterkennung mit KI

Das System für Dokumentenanalyse

Individuelle, intelligente OCR mit KI

tetrel bietet mit kinisto ein individuell konfigurierbares KI-System zur intelligenten Dokumentenverarbeitung an – basierend auf Natural Language Processing (NLP) mit Deep Learning-Verfahren. kinisto kann komplexe, individuell definierte Informationen aus Dokumenten jeglicher Art auslesen.

Da wo Business und Technologie ineinander greifen, setzt tetrel künstliche Intelligenz ein, um Arbeitsalltag und Hintergrundprozesse zu optimieren und zu beschleunigen. Als Spezialist für KI-Technologie im praktischen Einsatz beraten wir Sie gern zum Thema und zu Ihrem speziellen Fall!

Mit einem Experten sprechen
Kontakt