È ora di semplificare l'acquisizione dei dati

Trattamento intelligente dei documenti (IDP) in Svizzera per l'onboarding, il riconoscimento delle fatture o la verifica dell'età


Ultimo aggiornamento: 15 febbraio 2025


Argomenti


Automazione con l'IA

Apprendimento automatico (ML)

Analisi aziendale (BA)

Gestione dei processi aziendali (BPM)

Indicizzazione intelligente

Intelligenza aziendale (BI)

Redazione automatica dei documenti

Riconoscimento ottico dei caratteri (ROC)

Scoperta di dati oscuri

Verifica automatica dell'età

Visione artificiale (CV)

"L'elaborazione intelligente dei documenti trasforma i dati delle immagini in dati di testo e questi ultimi in informazioni critiche per l'azienda"

Definizione dell'elaborazione intelligente dei documenti (IDP)


L'elaborazione intelligente dei documenti (IDP) è essenzialmente l'uso di funzioni di intelligenza artificiale come il riconoscimento ottico dei caratteri (OCR), l'apprendimento automatico (ML) e la visione computerizzata (CV) per acquisire dati aziendali critici da documenti di routine quotidiana (passaporti, documenti d'identità, fatture, moduli, ecc.) al fine di ottimizzare processi aziendali successivi.


Conoscenze strategiche durante il caricamento e la scansione


360core converte le immagini in dati testuali e trasforma i dati testuali in conoscenza aziendale organica. Durante i nostri servizi di scansione esterna (qui) o l'equivalente processo di acquisizione tramite OCR, la nostra architettura esegue numerose operazioni di arricchimento dei dati ad alto impatto:


  • Riconoscimento automatico del testo: il testo del documento viene indicizzato automaticamente, in modo che singoli termini o intere frasi possano essere facilmente identificati in seguito con una ricerca full text
  • Riconoscimento automatico del tipo di documento (fattura, contratto, e-mail, passaporto, ecc.) mediante il riconoscimento di immagini assistito da computer, addestrato sulla corrispondenza commerciale svizzera
  • Indicizzazione automatica dei contenuti dei documenti rilevanti dal punto di vista commerciale: nomi di clienti e fornitori, articoli di marca, date, nomi di paesi e città, eventi, valute, tassi di interesse o identificatori definiti dal cliente (lingue supportate: Inglese, francese, tedesco, italiano, portoghese, spagnolo)
  • Riconoscimento automatico della lingua dominante del documento per instradarlo ai colleghi con le competenze linguistiche richieste. Con la crescita dell'archivio, è possibile filtrare l'intero repertorio di PDF per lingua (oltre 100) al fine di facilitare futuri casi d'uso.
  • Riconoscimento automatico di dati personali secondo la LPD: Nomi propri, indirizzi, numeri di telefono, e-mail, numeri di identificazione, date di nascita, età, numeri di assicurazione, codici fiscali, targhe, codici di carte di credito, IBAN, URL, indirizzi IP, password
  • Redazione di dati personali in un solo tasto per anonimizzare informazioni sensibili e classificate nell'applicazione dei requisiti di compliance nell'istruzione (dati degli studenti), nel settore finanziario (numeri di conto), nella pubblica amministrazione (numeri AVS), nella sanità (dati biometrici), nelle forze dell'ordine (protezione dei testimoni) o durante i procedimenti giudiziari
  • Conversione in formato PDF/A (A sta per archiviabile) per l'archiviazione a lungo termine
  • Audit trail: stampa virtuale o fisica di un numero di documento che registra l'ora e il luogo della digitalizzazione, nonché l'identità dell'operatore del dispositivo


Quali sono i vantaggi di un OCR accurato?


Il riconoscimento ottico dei caratteri (OCR) è essenzialmente una tecnologia di intelligenza artificiale che converte un'immagine di testo (sia essa un testo scritto a mano o stampato, un documento PDF scansionato, un file immagine jpg o png) in un formato leggibile da una macchina per renderlo ricercabile da un software di elaborazione testi (qui).


L'OCR è un nodo centrale nella trasformazione digitale delle imprese svizzere, perché la maggior parte dei processi aziendali, come la contabilità finanziaria, l'onboarding dei clienti e i flussi di lavoro della pubblica amministrazione, prevedono ancora grandi volumi di documenti stampati che devono essere archiviati e classificati a fini probatori.


Le situazioni in cui tali documenti devono essere disarchiviati con un preavviso relativamente breve includono:


  • Audit fiscali svizzeri: Audit IVA, audit dei salari, audit della disoccupazione, audit sulle ritenute d'acconto
  • Indagini ufficiali: Indagini normative, esecuzioni, visite in loco
  • Procedimenti civili
  • Procedimenti penali
  • Richieste di informazioni da parte di soggetti interessati ai sensi della legge sulla privacy
  • Informazioni ai colleghi durante il passaggio di consegne di casi


Una tecnologia OCR accurata è di fondamentale importanza per una buona qualità dei dati e delle successive ricerche. 360core utilizza una tecnologia OCR avanzata per tutti i casi d'uso (screenshot, scrittura a mano, documenti aziendali scansionati).


Per quanto riguarda i documenti aziendali e contabili, 360core utilizza la tecnologia OCR più accurata attualmente sul mercato, come dimostrano i test indipendenti di accuratezza OCR.


Cosa è 360 Autoindexing?


Un proverbio francese dice: "In una biblioteca, un libro mal classificato è un libro perso". Lo stesso vale per l'archiviazione dei dati digitali. I PDF mal indicizzati sono come persi e rendono praticamente inutile lo sforzo iniziale di scansione e archiviazione.


Grazie alla nostra soluzione di indicizzazione automatica (“360 Autoindexing”), gli errori di inserimento sono ridotti al minimo durante la classificazione dei documenti. L'algoritmo è particolarmente efficace per i moduli standard che hanno un layout standardizzato, come le e-mail, le fatture o i documenti di identità, dove i valori delle informazioni sono sempre nella stessa posizione.


L'indicizzazione degli identificatori importanti per l'azienda consente di trovare quasi immediatamente i documenti corrispondenti utilizzando la ricerca full-text. Quando creiamo istanze per i clienti commerciali, stabiliamo quindi in anticipo quali sono gli identificatori che l'azienda tratta e quali dati devono essere indicizzati. Infatti, un sistema ben indicizzato consente di recuperare i documenti in modo rapido e affidabile, il che può essere cruciale durante le verifiche di compliance o le controversie legali.


In settori altamente regolamentati come i servizi finanziari e la sanità, la qualità dell'indicizzazione può diventare un parametro cruciale per la gestione del rischio  e la "information compliance".


1. Riconoscimento automatico dei dati delle fatture


L'attuale stato dell'arte consente di importare i dati di ricevute e fatture direttamente nel software di contabilità o nel portale dei pagamenti per poi verificarli manualmente. In questo processo, i nostri sistemi astraggono dalla specifica forma o lingua che caratterizza la fattura o dal paese in cui viene emessa.


In concreto, ciò significa che gli importi delle fatture, i numeri di riferimento, le valute e gli indirizzi dei beneficiari non devono più essere faticosamente digitati a mano. Considerando che sono necessari fino a dieci dati per registrare un ordine di pagamento, si riducono anche i pagamenti non riusciti a causa di errori umani (i cosiddetti "errori del dito grasso").


La nostra pipeline di acquisizione dati estrae i seguenti attributi dalle fatture scansionate o caricate con elevati punti di affidabilità, che mettiamo a disposizione dei nostri clienti come metadati:


  • Dati sul fornitore (creditore) e sul cliente (debitore): Nome, via, codice postale, città, cantone, numero di telefono, sito web, numero di partita IVA
  • Dettagli sulla fattura stessa: data della fattura, numero del documento, data dell'ordine, numero dell'ordine, data di scadenza e data di consegna
  • Dettagli sulla merce consegnata o sul servizio fornito: numero dell'articolo, descrizione del prodotto o del servizio, quantità, prezzo unitario e prezzo totale
  • Informazioni sul versamento: termini di pagamento, importo dovuto, importo pagato, subtotale, totale, importo dell'IVA, costo del servizio, mancia, saldo precedente, sconto, spese di spedizione e gestione


2. Riconoscimento automatico dei dati del passaporto


L'acquisizione automatica dei dati personali per la verifica dell'identità (passaporti, ID card, patenti di guida) è di fondamentale importanza nei flussi di lavoro per la registrazione dei clienti, ad esempio per stabilire il beneficiario economico durante l'onboarding digitale dei clienti per l'apertura di un conto bancario personale in Svizzera.


Qui si pone l'accento sulla qualità dei dati di base identificati durante l'ingestion, in vista della loro successiva diffusione in tempo reale ai sistemi periferici per informare vari processi a valle, dalla prevenzione contro le frodi alla revisione delle sanzioni e alla valutazione del rischio in generale.


Quando vengono scannerizzati o caricati nel layer di archivio, la nostra architettura estrae le seguenti dimensioni da passaporti e documenti d'identità e le trasmette ai nostri clienti sotto forma di metadati:


  • Primo nome
  • Secondo nome
  • Cognome
  • Data di nascita
  • Paese di emissione
  • Data di emissione
  • Data di scadenza
  • Numero del passaporto

Casi d'uso

Riconoscimento automatico dei dati di passaporti e documenti d'identità (onboarding, verifica dell'età

Estrazione automatica di contenuti da moduli, formulari di richiesta, domande et CV

Ambito di applicazione: Apertura e registrazione clienti Ambito di applicazione: Apertura e registrazione clienti

Riconoscimento automatico del contento di contratti e fatture, nonché di rendiconti finanziari annuali

Area di applicazione: Due diligence e flussi di lavoro contabili Scan contracts

Indicizzazione sistematica di archivi fisici, corrispondenza aziendale, messaggi di posta elettronica ed allegati

Ambito di applicazione: scenari di archiviazione e di e-discovery

Introdurre questa soluzione nella nostra azienda

Share by: