Digitalisierung mit OCR-Technologie

Digitalisierung mit OCR-Technologie

Wer Zeit und damit Geld sparen will, der setzt heute auf digitalisierte und automatisierte Arbeitsprozesse. Besonders hilfreich dabei ist die sogenannte OCR-Technologie. 

OCR steht für Optical Character Recognition, also eine optische Zeichenerkennung beziehungsweise Texterkennung. OCR hilft in der Buchhaltung dabei, das zeitaufwendige und sehr fehleranfällige Abtippen von Belegen zu umgehen. Mit Hilfe von OCR, werden auch bei Run my Accounts gescannte Papierdokumente und PDF-Dateien in bearbeitbare und durchsuchbare Dateien umgewandelt.

Wie funktioniert die OCR-Technologie?

Der Dokumentenscan ist eine Bildkopie eines Dokuments und wird auch Rastergrafik genannt. Er  ist im Grunde eine Ansammlung schwarzer, weißer oder farbiger Bildpunkte. OCR beginnt mit einer mehrschrittigen Analyse des eingescannten Dokuments. Hierbei wird das Dokument zunächst in seine Einzelteile wie Absätze, Tabellen und Bilder zerlegt. Danach werden Zeilen, Wörter und dann die kleinsten Einheiten, also einzelne Buchstaben und Zahlen, erkannt. Diese kleinsten Einheiten werden von der OCR-Technologie mit Mustern verglichen und es werden verschiedenen Hypothesen vom Programm dazu aufgestellt. Hierbei kommen zwei Erkennungsarten zum Einsatz.

1. Merkmalserkennung

Von den circa zehn bisher entwickelten Methoden, sind die Raster-, Merkmals- und Strukturklassifizierung die bedeutendsten. Die verwendete OCR-Technologie kennt bestimmte Merkmale eines jeden Zeichens (Buchstaben, Zahlen). Die Merkmale eines Zeichens bleiben auch bei Veränderungen bestehen. Ändert sich beispielsweise die Schriftgröße, so ändern sich die Merkmale des Zeichen nicht. Obligatorisch werden immer mehrere Erkennungsverfahren nacheinander in der die Merkmalserkennung genutzt. Die so gewonnen Ergebnisse werden dann verglichen und gewichtet. Die Zeichen mit der höchsten Wahrscheinlichkeit auf Richtigkeit werden schließlich zu einem Text zusammengefasst.

2. Mustererkennung

Diese Methode vergleicht jedes Zeichen des Dokuments einzeln. Wie bei der Merkmalserkennung, wird dabei auf ein bereits vorhandenes Kontingent an Zeichenmuster zurückgegriffen. Dabei werden riesige Datenbanken mit verschiedenen Schriftarten verwendet. Sobald ein zuerkennendes Zeichen mit einem Zeichen aus dieser Datenbank übereinstimmt, gilt es als identifiziert. Diese Methode ist enorm zeitintensiv und nicht besonders präzise. Die Ursache dafür ist, dass ein Zeichen zu 100 Prozent mit den gespeicherten Zeichenvorlagen übereinstimmen muss. Besonders schwierig ist dabei der Fakt, dass auch die Schriftart, inklusive aller möglichen Formatierungen, vom zu identifizierenden Dokument und der Datenbank identisch sein muss.

OCR bei Run my Accounts

Kunden von Run my Accounts übersenden entweder direkt die gescannten Belege zur Weiterverarbeitung, oder leiten ihre Post zu Run my Accounts um. Die umgeleitete Post wird dann von uns zur Bearbeitung eingescannt. Um letztendlich von digitalisierten und automatisierten Prozessen profitieren zu können, reicht ein Scanner allein nicht aus. Es müssen die relevanten Informationen aus den Belegen herausgezogen werden. Ein Scanner erstellt lediglich ein Bild eines Dokuments und die OCR-Technologie stellt die erforderlichen Informationen der Belege bereit.

Die Buchhaltungssoftware von Run my Accounts nutzt die OCR-Technologie und ist somit in der Lage eingescannte Belege zu lesen und automatisiert zu verbuchen. Zusätzlich ist die Software intelligent: Sie lernt ständig dazu und optimiert sich quasi selbst. Bei Run my Accounts halten wir uns nicht mit dem lästigen Abtippen von Belegen auf, sondern gehen gleich zur Buchhaltung über, denn wir lieben und leben Buchhaltung.


Digitalisierung mit OCR-Technologie

0 Kommentare

Hinterlasse einen Kommentar

An der Diskussion beteiligen?
Hinterlasse uns deinen Kommentar!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert