Gescannten Beleg in Excel umwandeln – vollständige OCR-Anleitung
Wer regelmäßig Rechnungen, Kassenbelege oder andere tabellarische Dokumente manuell in Excel eingibt, weiß wie zeitaufwändig das ist. Die gute Nachricht: Mit OCR-Technologie (Optical Character Recognition) können gescannte Belege und PDF-Dokumente automatisch in bearbeitbare Excel-Tabellen umgewandelt werden. Die Qualität der automatischen Erkennung hängt stark von der Scan-Qualität und dem Dokumenttyp ab. Dieser Leitfaden erklärt den kompletten Prozess – von der optimalen Scan-Einstellung über die OCR-Konvertierung bis hin zur GoBD-konformen Nachbearbeitung für die Buchführung.
Scan-Qualität für optimale OCR-Ergebnisse
Die Qualität der automatischen Texterkennung steht und fällt mit der Qualität des Ausgangsscans. Schlechte Scans führen zu Erkennungsfehlern, die manuelle Korrekturen erfordern. Optimale Scanner-Einstellungen für Belege: Auflösung: 200-300 DPI für normale Textdokumente, 300 DPI für kleine Schriften (Kassenbon-Format), 400 DPI für handgeschriebene Elemente Farbmodus: Graustufen oder Schwarz-Weiß für Textdokumente reicht aus und erzeugt kleinere Dateien. Farbe nur wenn farbige Markierungen wichtig sind. Kontrast: Möglichst hoher Kontrast. Schwach bedruckte Thermopapier-Bons (verblasst) sind schwierig zu erkennen – hier hilft manchmal eine höhere DPI. Ausrichtung: Dokument gerade einlegen. Schief gescannte Dokumente verringern die OCR-Genauigkeit erheblich. Besondere Herausforderungen bei Belegen: Thermopapier (Kassenzettel): Thermobons verblassen mit der Zeit und können nach Jahren kaum noch gelesen werden. Scannen Sie schnell und bei guter Qualität. Handschrift: OCR-Erkennung von Handschrift ist deutlich fehleranfälliger als gedruckter Text. Erwarten Sie mehr manuelle Korrekturen. Mehrsprachige Belege: Wenn der Beleg Zahlen in verschiedenen Formaten enthält (z.B. englisches Dezimalpunkt-Format), konfigurieren Sie das OCR-Tool auf die richtige Sprache.
- 1Dokument gerade auf dem Scanner ausrichten.
- 2Scanner auf 300 DPI und Graustufen konfigurieren.
- 3Kontrast leicht erhöhen für blasse Drucke.
- 4Als PDF oder TIFF scannen (nicht als JPEG, da zu viel Qualitätsverlust).
- 5Scan auf Lesbarkeit prüfen, bevor OCR gestartet wird.
OCR-Konvertierung: Schritt für Schritt
Nach dem Scan wird das Dokument mit OCR-Software in bearbeitbaren Text umgewandelt. Mit LazyPDF OCR: 1. Öffnen Sie LazyPDF OCR im Browser 2. Laden Sie das gescannte PDF hoch 3. Wählen Sie die Sprache (Deutsch für deutsche Belege) 4. Starten Sie die OCR-Verarbeitung 5. Laden Sie das durchsuchbare PDF herunter 6. Öffnen Sie dann LazyPDF PDF-zu-Excel für die Tabellenextraktion Mit Adobe Acrobat Pro (lokal): 1. Öffnen Sie das gescannte PDF in Acrobat 2. Werkzeuge → PDF verbessern → Text in gescanntem Dokument erkennen 3. Sprache und Auflösung einstellen 4. OCR durchführen 5. Datei → In anderes Format exportieren → Excel-Arbeitsmappe Mit ABBYY FineReader (beste Qualität, kostenpflichtig): 1. Dokument öffnen 2. OCR-Sprachpaket auf Deutsch setzen 3. Erkennungsgenauigkeit wählen (hoch für wichtige Belege) 4. Als Excel exportieren Mit Google Drive (kostenlos, cloud-basiert): 1. Laden Sie das Bild/PDF-Scan in Google Drive hoch 2. Rechtsklick → 'Öffnen mit' → Google Docs 3. Google Docs führt automatisch OCR durch 4. Der erkannte Text erscheint im Dokument 5. Kopieren Sie die Tabellenwerte und fügen Sie sie in Google Sheets / Excel ein Hinweis: Google Drive OCR für Tabellen ist weniger präzise als spezialisierte OCR-Tools.
Excel-Ergebnisse prüfen und korrigieren
Nach der OCR-Konvertierung muss das Excel-Ergebnis immer geprüft und korrigiert werden. Typische OCR-Fehler bei Belegen: Verwechslung von Zahlen: '0' und 'O', '1' und 'l', '8' und 'B'. Besonders kritisch bei Beträgen! Dezimaltrennzeichen: OCR erkennt manchmal Komma als Punkt und umgekehrt. 1.234,56 könnte als 1234.56 erscheinen. Tausendertrennzeichen: Werden manchmal als Dezimalzeichen falsch interpretiert. Einheiten: EUR, USD, %, MwSt könnten fehlen oder falsch platziert sein. Spaltenverschiebung: Bei Tabellen kann es passieren, dass Werte in der falschen Spalte erscheinen. Kritische Prüfung für Buchführungszwecke: Vergleichen Sie jede Zahl im Excel-Ergebnis mit dem Original-Scan Addieren Sie Spalten und prüfen Sie Gesamtbeträge Prüfen Sie Steuersätze und MwSt-Beträge besonders sorgfältig Kontrollieren Sie Datum und Rechnungsnummer GoBD-Anforderung: Wenn Sie OCR-erfasste Belege für die Buchführung verwenden, müssen Sie sicherstellen, dass die Originalbelege (Papier oder Scan) aufbewahrt werden. Das Excel-Ergebnis ist eine Arbeitshilfe, ersetzt aber nicht den GoBD-konformen Originalbeleg.
GoBD-Compliance beim Scannen und OCR-Verarbeiten
Die GoBD stellt spezifische Anforderungen an das Scannen und digitale Verarbeiten von Belegen. Grundsatz der Unveränderlichkeit: Gescannte Belege müssen unveränderlich archiviert werden. Das bedeutet: Der Scan (PDF/TIFF) muss im Archivsystem gespeichert werden, bevor mit OCR oder anderer Verarbeitung begonnen wird. Die OCR-Bearbeitung erzeugt eine neue, bearbeitbare Version – das Archiv-Original bleibt unberührt. Verfahrensdokumentation: Unternehmen, die Belege scannen und digital verarbeiten, müssen dies in der Verfahrensdokumentation beschreiben. Dazu gehören: verwendete Scanner-Einstellungen, eingesetzte OCR-Software, Qualitätssicherungsmaßnahmen und Aufbewahrungsfristen. Nachvollziehbarkeit der Buchungen: GoBD-konforme Buchführung erfordert, dass jede Buchung auf einen Originalbeleg zurückführbar ist. Wenn ein OCR-erfasster Wert in Excel falsch ist, muss das Original-Scan des Belegs zur Überprüfung verfügbar sein. Empfehlung für kleine Unternehmen und Freelancer: Nutzen Sie eine einfache Archivierungsstruktur: Pro Jahr ein Ordner, darin pro Monat ein Unterordner. Scans werden als PDF mit Datum und Rechnungsnummer benannt (z.B. 2026-03-15_Lieferant-XY_RE-2026-0042.pdf). Die OCR-Ergebnisse in Excel werden separat als Eingabehilfe genutzt, nicht als Archiv. Spezielle Software für GoBD-Compliance: Buchführungssoftware wie DATEV, Lexware oder Fastbill integriert Scan und OCR in einen GoBD-konformen Workflow. Für professionelle Nutzung empfehlen wir diese dedizierten Lösungen gegenüber manuellen OCR-Prozessen.
Häufig gestellte Fragen
Wie genau ist die automatische OCR-Erkennung bei Belegen?
Bei guten Scans (300 DPI, guter Kontrast, gedruckter Text) erreichen professionelle OCR-Tools 95-99% Genauigkeit. Bei schlechten Scans, Handschrift oder verblassten Thermobons kann die Genauigkeit auf 70-85% sinken. Prüfen Sie immer alle Zahlen, besonders Beträge, manuell gegen das Original.
Kann ich Kassenzettel (Thermobon) automatisch erfassen?
Ja, aber mit Einschränkungen. Frische Thermobons mit gutem Kontrast werden bei 300 DPI gut erkannt. Ältere, verblasste Bons sind problematisch. Scannen Sie Thermobons immer zeitnah nach Erhalt, da das Thermopapier schnell verblasst. Prüfen Sie das OCR-Ergebnis sorgfältig.
Ersetzt das OCR-Ergebnis in Excel den Originalbeleg für die GoBD?
Nein. Das Excel-Ergebnis ist eine Arbeitshilfe für die Buchführung. Der GoBD-Originalbeleg ist der gescannte PDF/TIFF des Dokuments, der unveränderlich im Archivsystem gespeichert sein muss. Beide Dokumente müssen aufbewahrt werden.
Welches OCR-Tool empfehlen Sie für deutsche Rechnungen?
Für gelegentliche Nutzung: LazyPDF OCR (kostenlos, Browser). Für regelmäßige professionelle Nutzung: ABBYY FineReader (beste Qualität) oder Adobe Acrobat Pro. Für eine vollständige Buchhaltungslösung: DATEV Unternehmen online oder Fastbill mit integrierten Scan- und OCR-Funktionen.
Wie kann ich die OCR-Genauigkeit verbessern?
Verbessern Sie die Scan-Qualität: 300 DPI, guter Kontrast, gerade Ausrichtung. Wählen Sie im OCR-Tool die korrekte Sprache (Deutsch). Nutzen Sie für schwierige Dokumente Adobe Acrobat Pro oder ABBYY FineReader statt einfacherer Tools. Bei verblassten Bons: Kontrast vor der OCR per Bildbearbeitungsprogramm erhöhen.