Optimisez votre architecture de capture

Traitement intelligent des documents (IDP) en Suisse pour l'onboarding des clients, la reconnaissance des factures ou la vérification de l'âge


Dernière mise à jour: 15 février 2025


Matières


Automatisation avec l'IA

Analyse commerciale (BA)

Apprentissage automatique (ML)

Business Intelligence (BI)

Capture de données et indexation

Découverte de données sombres

Gestion des processus métiers (BPM)

Saisie de données et indexation machine

Noircissement automatique des documents

Reconnaissance optique de caractères (ROC)

Vérification automatique de l'âge

Vision par ordinateur

"Le traitement intelligent des documents transforme les données d'image en données de texte et ces dernières en renseignements stratégiques pour l'entreprise"

Définition du traitement intelligent des documents (IDP)


Le traitement intelligent des documents (IDP) consiste essentiellement à utiliser des fonctions d'intelligence artificielle telles que la reconnaissance optique des caractères (ROC), l'apprentissage automatique et la vision par ordinateur pour capturer des informations stratégiques à partir de documents de routine (passeports, cartes d'identité, factures, formulaires) et les utiliser pour optimiser des processus d'entreprise ultérieurs.


Connaissances stratégiques lors de la capture de documents


360core transforme les données d'image en données de texte - et les données de texte en connaissances organiques de l'entreprise. Au cours de nos services de numérisation externe (ici) ou du processus équivalent de capture par OCR, notre architecture effectue de nombreuses opérations d'enrichissement des données à fort impact:


  • Reconnaissance optique de caractères indexant automatiquement le texte du document, afin de pouvoir identifier facilement des termes ou des phrases entières par la suite par une recherche plein texte
  • Reconnaissance automatique du type de document (facture, contrat, e-mail, passeport) grâce à la reconnaissance d'images informatisée, entraînée sur des documents commerciaux suisses
  • Indexation automatique du contenu des documents (tagging) pour accélérer la recherche plein texte ultérieure (par ex. par client, patient, élève, étudiant, mandant, assuré, sujet fiscal, bien immobilier, objet, entité, département, centre de coûts, dossier, projet, cas de service)
  • Indexation automatique de contenus présentant une valeur pour l'entreprise, tels que des noms de clients et de fournisseurs, des articles de marque, des indications temporelles, des noms de pays et de villes, des événements, des devises, des taux d'intérêt ou des identifiants définis par vous (langues: allemand, anglais, espagnol, français, italien, portugais)
  • Reconnaissance automatique de la langue dominante du document pour le transmettre aux collaborateurs ayant les compétences linguistiques requises. Au fur et à mesure que l'archive s'enrichit, l'ensemble du répertoire PDF peut être filtré par langue (100+) afin de répondre à des cas d'utilisation futurs.
  • Reconnaissance automatique de données personnelles selon la LPD: Noms propres, adresses, numéros de téléphone, e-mails, numéros de carte d'identité, dates de naissance, indications d'âge, numéros d'assurance, NIF, plaques d'immatriculation, numéros de carte de crédit, IBANs, URLs, adresses IP, mots de passe
  • Masquage des données personnelles en une seule pression de touche pour anonymiser les informations sensibles et classifiées lors de la réalisation des obligations de compliance dans l'enseignement (données des étudiants), le secteur financier (numéros de compte), l'administration publique (numéros AVS), la santé (données biométriques des patients), la poursuite pénale (protection des témoins) ou durant des procédures judiciaires
  • Conversion au format PDF/A (A signifie apte à l'archivage) pour le stockage à long terme
  • Trace de contrôle: impression virtuelle ou physique d'un numéro de document enregistrant le lieu et l'heure de la numérisation ainsi que les données personnelles de l'opérateur de la machine


Quelle est l'importance d'une bonne reconnaissance optique des caractères?


La reconnaissance optique des caractères (ROC) est essentiellement une technologie d'intelligence artificielle qui convertit une image de texte (qu'il s'agisse d'un texte manuscrit ou imprimé, d'un document PDF scanné, d'un fichier image jpg ou png) en un format compréhensible par une machine afin de la rendre exploitable par le traitement de texte (ici).


La ROC touche un nerf central dans la transformation numérique des entreprises suisses, car la plupart des processus commerciaux tels que la comptabilité financière, l'acquisition de clients et les procédures administratives génèrent encore de grandes quantités de papier qui doit être archivé et classé à des fins de preuve.


Les situations dans lesquelles de tels documents probants doivent être désarchivés et présentés dans un délai relativement court sont par exemple:


  • Contrôles fiscaux: Révision de la TVA, révision des salaires, révision de l'impôt à la source
  • Enquêtes administratives: Enquêtes réglementaires, enforcements, inspections sur place
  • Procédures civiles
  • Procédures pénales
  • Demandes de personnes concernées selon la LPD
  • Familiarisation des collègues lors du transfert de dossiers


Une technologie ROC précise est essentielle pour garantir la qualité des données d'entrée et donc la fiabilité de recherches futures. 360core utilise des solutions OCR modernes dans tous leurs champs d'application (images, manuscrits, scans)..


Pour ce qui est de documents commerciaux et comptables, 360core utilise la technologie OCR la plus précise actuellement disponible sur le marché, comme l'ont prouvé des tests indépendants de précision de l'OCR.


Qu'est-ce que 360 Autoindexing?


Un proverbe français dit: "En bibliothèque, un livre mal classé est un livre perdu". Il en va de même pour le stockage de données numériques. Les PDF mal indexés sont quasiment perdus et rendent pratiquement inutiles tous les efforts préalables de numérisation et de conservation.


Grâce à notre solution d'indexation automatique («360 Autoindexing»), les erreurs de saisie lors de la classification des documents sont minimisées. L'algorithme est particulièrement efficace pour des formulaires standard qui présentent une structure uniforme, comme les e-mails, les factures ou les documents d'identité, dans lesquels les unités d'information se trouvent systématiquement à la même position.


Une telle indexation d'identifiants clés permet par la suite de retrouver presque instantanément les pièces correspondantes via une recherche plein texte. Lors de la mise en place d'instances pour la clientèle commerciale, nous déterminons donc à l'avance quels sont les champs de documents que l'entreprise traite - et quelles sont dès lors les données qu'il est judicieux d'indexer. En effet, un système bien indexé permet une recherche rapide et fiable des documents, ce qui peut s'avérer crucial en cas d'audits de compliance ou de litiges juridiques.


De manière générale, dans les secteurs fortement réglementés tels que les services financiers et les services de santé, la qualité de l'indexation peut être considérée comme un facteur critique dans le domaine de la gestion des risques.


1. Détection automatique des données de factures


L'état actuel de la technique permet d'importer des données de factures directement dans le logiciel de comptabilité ou le portail de paiement, où elles sont vérifiées par la main humaine. Ce faisant, nos systèmes font abstraction de la forme, de la langue ou des caractéristiques spécifiques à chaque pays d'une facture.


En pratique, cela signifie que le montant d'une facture, son numéro de référence, la devise et l'adresse du bénéficiaire ne doivent plus être péniblement saisis à la main.


En pratique, cela signifie que le montant des factures, le numéro de référence, la devise et l'adresse du bénéficiaire ne doivent plus être péniblement saisis à la main. Avec jusqu'à dix champs nécessaires à la création d'un ordre de paiement, cela signifie également moins de paiements échoués par erreur humaine ("doigts gras").


Notre pipeline de capture des données extrait les attributs suivants des factures numérisées ou téléchargées, avec des scores de fiabilité élevés, et les remet à vous sous forme de métadonnées:


  • Informations sur le fournisseur (créanciers) et le client (débiteurs): Nom, rue, code postal, ville, canton, numéro de téléphone, site web, numéro de TVA
  • Informations sur la facture elle-même: date de la facture, numéro du document, date de la commande, numéro de la commande, date d'échéance et date de livraison
  • Informations sur la marchandise livrée ou les services fournis: numéro d'article, description du produit ou désignation du service, nombre de pièces, prix unitaire et prix total
  • Décomposition du versement: délai de paiement, montant dû, montant déjà versé, sous-total, montant final, TVA, frais de service, gratification, solde précédent, rabais, frais d'expédition


2. Détection automatique des données de passeports


La saisie automatisée de données personnelles pour la vérification de l'identité (passeports, cartes ID, permis de conduire) est d'une importance capitale dans les flux de travail d'enrôlement des clients, par exemple pour établir l'ayant droit économique au cours de l'onboarding numérique des clients pour l'ouverture d'un compte bancaire personnel en Suisse.


L'accent est mis ici sur la qualité des données de base identifiées lors de l'ingestion, en vue de leur diffusion ultérieure en temps réel dans des systèmes périphériques pour informer divers processus en aval, de la prévention contre la fraude à l'examen des sanctions et à l'évaluation des risques en général.


Lors de la numérisation ou du téléchargement vers la couche d'archivage, notre architecture extrait les dimensions suivantes des passeports et des documents d'identité et les transmet à notre clientèle sous forme de métadonnées:


  • Prénom
  • Deuxième prénom
  • Nom de famille
  • Date de naissance
  • Pays de délivrance
  • Date de délivrance
  • Date d'expiration
  • Numéro du passeport

Cas d'application

Reconnaissance des données de passeports et de cartes d'identité

Extraction du contenu de formulaires, candidatures, CVs

Cas d'utilisation : enregistrement et accueil de clients

Traitement automatique des contrats, factures et des bilans annuels

Cas d'utilisation : due diligence et flux de travail comptables

Indexation en masse des archives, du courrier, des e-mails, pièces jointes

Cas d'utilisation : scénarios d'archivage et de découverte électronique

Introduire cette solution dans notre entreprise

Share by: