It is a long established fact that a reader will be distracted by the readable content of a page when looking at its layout.
La transformation digitale des entreprises passe naturellement par la dématérialisation des documents papiers via une solution de gestion documentaire. La numérisation est le moyen inévitable pour transformer un document papier en document électronique. Au-delà de disposer du document en format numérique, il est intéressant d’assurer sa lecture par l’ordinateur. Il s’agit donc de convertir ces papiers en document texte lisible. Il s’agit du traitement documentaire. Notre logiciel de gestion électronique documentaire, Zensolutions, est capable de reconnaître le texte contenu à l’intérieur des documents scannés.
Ces traitements techniques sont appliqués sur les documents en fonction de leur nature documentaire et des processus métier.
La reconnaissance optique des caractères ou Optical Character Recognition (OCR en anglais) est une conversion d’images en un fichier de format texte. Elle est la technique la plus répandue pour le traitement documentaires.
Avec l’OCR, vos documents papier peuvent être numérisés et disponibles en texte lisible numériquement. Cette technique de traitement documentaire permet de rendre accessibles les données de ces documents.
La difficulté de l’OCR repose sur la capacité à reconnaître les différentes polices de caractères et éventuellement les caractères manuscrits qui multiplient les façons d’écrire chaque symbole. L’océrisation se déroule en quelques étapes :
Le prétraitement va permettre de normaliser le document en y effectuant quelques traitements automatisés listés ci-dessous :
L’outil procède alors à la reconnaissance de caractère du fichier normalisé et va effectuer la conversation en matrice binaire.
A cette étape, un algorithme statistique va permettre de mapper les caractères de manière électronique.
En fonction du contexte et de l’objectif de l’opération d’OCR, les résultats peuvent être optimisés en réduisant le champ lexical autorisé, aussi appelé contexte.
Vous pourrez désormais effectuer des recherches dans votre base documentaire, non seulement sur les libellés des documents (comme nous en avons l’habitude), et également dans le contenu même des documents. C’est la recherche plein texte!
Une fois le traitement documentaire effectué, vous pourrez donc modifier les documents numérisés avec de simples outils de traitement de texte.
De nos jours, les outils OCR permettent de traiter tout type de documents et ce peu importe la langue. Cela inclut les caractères non-latins tels que le chinois ou l’arabe par exemple.
Notre logiciel de gestion documentaire, Zensolutions, utilise ces principes pour créer des automatismes et notamment en matière de processus métier. Selon le type de document et les informations qu’il contient, son routage, les éventuels circuits d’approbation et les traitements spécifiques peuvent être automatisés.
L’OCR est capable d’analyser et traiter des documents numérisés et/ou manuscrits. Cette technologie est donc particulièrement utile dans le but de traiter différentes factures et d’analyser les données inscrites. Vous allez pouvoir automatiser de très nombreux processus liés à la facturation et à la comptabilité.
Quelles informations sont pertinentes dans le cadre des factures dématérialisées ?
Parmi toutes les données présentes dans une facture, nous noterons les plus importantes. Zensolutions va rechercher dans l’outil les balises suivantes pour les convertir en données exploitables :
Peu importe la construction de votre facture et la localisation des champs, notre outil d’extraction saura repérer ces données.
Ces données extraites permettront de déterminer le fournisseur à l’origine de cette facture.
Afin de respecter les normes documentaires en vigueur, les documents stockés dans votre base Zensolutions peuvent se voir affectés un certificat de type RGS. Il s’agit de garantir l’intégrité et la conformité de votre document et de révéler toute tentative de modification.
Le RGS est le Référentiel Général de Sécurité. Son objectif est de « faciliter les échanges électroniques sécurisés entre les usagers et les autorités administratives. Il sert également entre autorités administratives par la mise à disposition d’un catalogue de solutions de sécurité référencées interopérables. » Ce référencement obtenu auprès de l’ANSSI propose différents niveaux de sécurité qui dépendent de :
Il existe 3 types de référentiel RGS :
Donc un RGS 1 étoile est amplement suffisant dans la plupart des cas lors de la mise en place d’une GED.
Pour conclure, un certificat permet de :
Sources:
https://www.ssi.gouv.fr/entreprise/reglementation/confiance-numerique/le-reglement-eidas/
Chaque scénario d’entreprise est unique et il se peut que la problématique qui vous a conduite à nous aujourd’hui ne soit pas détaillée. Pas de panique!
Nous proposons également une approche plus personnalisée et spécifique. Dans ce cas de figure, nos experts seront à même de vous accompagner tant sur le plan organisationnel que technique pour vous apporter la solution adéquate.
Nos équipes se tiennent à votre disposition pour vous apporter les solutions adéquates