Ayant fait récemment l’acquisition d’une imprimante tout-en-un, disposant d’un scanner à chargement automatique de documents, je me suis décidé à arrêter d’archiver les courriers et factures que je reçois encore par la poste 🙁 dans des classeurs.
Au lieu d’utiliser un système de GED complet et fastidieux à mettre en place pour une utilisation personnelle, je me suis dit que je pourrai simplement utiliser mon client mail pour classer et rechercher ces documents (un autre avantage est que je peux ainsi fusionner les factures que je reçois par e-mail avec les factures papier).
Je me suis donc concocté un petit script qui permet de scanner un document d’une ou plusieurs pages, recto ou recto-verso, d’en faire un fichier PDF qui sera attaché à un e-mail et, finalement, de mettre dans le corps du message, le texte reconnu par un logiciel de reconnaissance optique de caractères (OCR) ; ceci afin de faciliter la recherche et l’indexation.
Vous le trouverez ci-dessous dans sa première version ; n’hésitez pas à m’envoyer vos commentaires et améliorations.
Mise à jour 12 septembre 2009 : Une nouvelle version vient d’être publiée, rendez-vous sur cet article pour la liste des modifications.