Convertir un reçu scanné en tableau Excel avec l'OCR
La gestion des notes de frais est une corvée bien connue des salariés et des travailleurs indépendants français. Compiler des dizaines de reçus papier, les scanner, puis ressaisir manuellement chaque montant dans un tableur représente des heures de travail gaspillées chaque mois. Grâce à la reconnaissance optique de caractères (OCR) combinée à la conversion PDF vers Excel, il est désormais possible d'automatiser une grande partie de ce processus. Ce guide vous explique comment transformer rapidement vos reçus scannés en données structurées et exploitables dans Microsoft Excel ou LibreOffice Calc.
Pourquoi utiliser l'OCR pour traiter les reçus professionnels ?
En France, les salariés doivent souvent soumettre leurs notes de frais dans des délais précis — généralement avant la fin du mois pour un remboursement sur la paie suivante. Les services comptables et les contrôleurs de gestion ont besoin de données structurées (date, montant HT, TVA, fournisseur, nature de la dépense) pour valider et imputer correctement les dépenses. Saisir manuellement ces informations depuis des reçus papier ou des images scannées est non seulement fastidieux, mais source d'erreurs. L'OCR (Optical Character Recognition) permet de transformer automatiquement le texte d'une image ou d'un PDF scanné en données numériques éditables. Associée à la conversion PDF vers Excel, cette technologie permet de récupérer directement les données dans un tableur structuré. Pour les auto-entrepreneurs et les freelances français soumis aux obligations déclaratives de l'URSSAF et de l'administration fiscale, disposer de données structurées facilite aussi la préparation des déclarations de revenus et la vérification des déductions de charges professionnelles.
Comment convertir un reçu scanné en Excel avec LazyPDF
Le processus se déroule en deux étapes principales : d'abord l'OCR pour rendre le texte extractible, puis la conversion vers Excel. Voici la méthode pas à pas.
- 1Scannez votre reçu ou votre facture à une résolution d'au moins 300 DPI pour garantir une bonne lisibilité par l'OCR.
- 2Si vous avez plusieurs reçus, rassemblez-les dans un seul fichier PDF (utilisez l'outil Fusionner de LazyPDF si nécessaire).
- 3Accédez à l'outil OCR de LazyPDF et importez votre PDF scanné.
- 4Sélectionnez la langue du document (français ou autre) pour améliorer la précision de la reconnaissance.
- 5Lancez l'OCR et téléchargez le PDF résultant avec le texte reconnu.
- 6Utilisez ensuite l'outil PDF vers Excel de LazyPDF pour extraire les données dans un tableau structuré.
- 7Ouvrez le fichier Excel généré et vérifiez que les montants, dates et libellés sont correctement reconnus.
- 8Ajustez manuellement les éventuelles erreurs de reconnaissance avant d'utiliser les données pour votre comptabilité.
Optimiser la qualité de numérisation pour l'OCR
La qualité du résultat OCR dépend directement de la qualité de la numérisation. Un reçu froissé, mal éclairé ou de faible résolution donnera des résultats médiocres. Voici les bonnes pratiques à respecter pour obtenir des données exploitables. Privilégiez une résolution de numérisation de 300 DPI minimum, idéalement 400 DPI pour les petits reçus avec des polices de petite taille. Assurez-vous que le document est bien à plat et correctement cadré dans le scanner. Évitez les photos prises avec un smartphone dans de mauvaises conditions d'éclairage : les ombres et les reflets dégradent significativement la reconnaissance. Pour les reçus thermiques (tickets de caisse), qui sont souvent de petite taille et imprimés en gris très clair, augmentez le contraste lors de la numérisation. Si vous numérisez régulièrement des reçus, envisagez d'utiliser un scanner à défilement (comme le Fujitsu ScanSnap ou le Brother ADS) qui numérise automatiquement et en batch, à la bonne résolution. Côté logiciel, les applications mobiles comme Adobe Scan, Microsoft Lens ou CamScanner permettent de photographier des reçus avec votre smartphone et d'en améliorer automatiquement la qualité (correction de la perspective, amélioration du contraste) avant de les exporter en PDF.
Gérer les données Excel pour les notes de frais françaises
Une fois vos reçus convertis en données Excel, vous pouvez structurer votre tableau selon les exigences de votre employeur ou de l'administration fiscale française. Un tableau de notes de frais type comprend généralement les colonnes suivantes : date, nature de la dépense, fournisseur/bénéficiaire, montant HT, taux de TVA, montant TVA, montant TTC, justificatif joint (oui/non). Pour les auto-entrepreneurs et les sociétés soumises à la TVA, la distinction entre montants HT et TTC est essentielle pour la déclaration de TVA (CA3 ou CA12). Les dépenses mixtes (professionnelles et personnelles) doivent être ventilées selon le pourcentage d'utilisation professionnelle. De nombreuses entreprises françaises utilisent des logiciels de gestion des notes de frais comme Expensify, Jenji ou N2F, qui peuvent importer des données Excel. En structurant correctement votre tableau depuis le départ, vous facilitez l'import dans ces outils et accélérez le processus de validation et de remboursement.
Questions fréquentes
L'OCR fonctionne-t-il avec des reçus en français et des caractères accentués ?
Oui, les outils OCR modernes supportent parfaitement le français avec tous ses accents et caractères spéciaux (é, è, ê, à, ù, ç, etc.). L'important est de bien sélectionner 'français' comme langue de reconnaissance pour optimiser la précision, surtout pour les textes manuscrits ou les polices peu courantes.
Peut-on traiter plusieurs reçus en même temps ?
Oui, vous pouvez fusionner plusieurs reçus scannés en un seul PDF avant de lancer l'OCR et la conversion Excel. Cela génère un tableau Excel avec toutes les données sur plusieurs lignes. Vous pouvez ensuite trier et organiser ces données selon vos besoins comptables.
Les données extraites sont-elles suffisamment précises pour la comptabilité ?
Pour des reçus bien numérisés, la précision de l'OCR atteint généralement 95 à 99%. Cependant, une vérification manuelle reste recommandée, notamment pour les montants et les dates. La précision peut être moindre pour les tickets de caisse thermiques très pâles ou les documents manuscrits.
Comment conserver les reçus originaux tout en ayant les données Excel ?
La bonne pratique est de conserver les fichiers PDF scannés comme pièces justificatives numériques, organisés par date ou par fournisseur, et d'utiliser le tableau Excel uniquement pour les données comptables. En France, un reçu numérisé a valeur probatoire s'il respecte les exigences du décret n°2016-1673 sur la dématérialisation des justificatifs de dépenses professionnelles.