Zeit, Ihre Dokumentenerfassung zu optimieren
Letzte Aktualisierung: 15. Februar 2025
Themen
Automatisierung mit KI
Automatische Dokumentenschwärzung
Automatische Rechnungserkennung
Automatische Altersüberprüfung
Business Analytics (BA)
Business Intelligence (BI)
Computer Vision (CV)
Dark Data Discovery
Geschäftsprozessmanagement (BPM)
Intelligente Verschlagwortung
Maschinelle Metadatenindexierung
Maschinelles Lernen (ML)
Optische Zeichenerkennung (OCR)
"Intelligente Dokumentenverarbeitung konvertiert Bilddaten in Textdaten, und diese wiederum in strategisches Wissen"
Intelligente Dokumentenverarbeitung (IDP) ist im Wesentlichen die Nutzung von Funktionen der künstlichen Intelligenz wie optische Zeichenerkennung (OCR), maschinelles Lernen (ML) und Computer Vision (CV), um geschäftskritische Informationen aus alltäglichen Routinedokumenten (Pässe, IDs, Rechnungen, Formularen) zu erfassen und damit nachgelagerte Unternehmensabläufe zu optimieren.
360core konvertiert Bilddaten in Textdaten - und verwandelt Textdaten in organisches Firmenwissen. Während unserer externen Dokumentenscandienste (hier) oder dem äquivalenten Aufnahmeprozess durch OCR, erbringt unsere Systemarchitektur zahlreiche Operationen zur Datenanreicherung:
Optical Character Recognition (OCR) ist im Wesentlichen eine KI-Technologie, die ein Textbild (sei es ein handgeschriebener oder gedruckter Text, ein gescanntes PDF-Dokument, eine jpg- oder png-Bilddatei) in ein maschinenlesbares Format umwandelt, um es für die Textverarbeitung durchsuchbar macht (hier).
OCR trifft einen zentralen Nerv in der digitalen Transformation von Schweizer Unternehmen, denn in den meisten Geschäftsprozessen wie Buchhaltung, Kundenakquise und Verwaltungsabläufen fallen immer noch grosse Mengen an Papier an, das zu Beweiszwecken archiviert und klassifiziert werden muss.
Situationen, in denen beweiskräftige Unterlagen relativ kurzfristig vorgelegt werden müssen, sind beispielsweise:
Eine präzise OCR-Technologie ist von entscheidender Bedeutung für gute Datenqualität und Suchbarkeit. 360core verwendet modernste OCR-Lösungen in allen Anwendungsfällen (Bilddaten, Handschrift, gescannte Geschäftsunterlagen).
Für Geschäftsdokumente und Buchhaltungsunterlagen verwendet 360core die genaueste OCR-Technologie, die derzeit auf dem Markt verfügbar ist, wie unabhängige Tests der OCR-Genauigkeit bewiesen haben.
Ein französisches Sprichwort sagt: "Im Bibliothekswesen ist ein schlecht klassifiziertes Buch ein verlorenes Buch". Dasselbe gilt für digitale Datenspeicher. Schlecht indizierte PDFs sind so gut wie verloren und machen den ganzen Aufwand des Scannens und Speicherns praktisch nutzlos.
Dank unserer Lösung zur automatischen Indizierung ("360 Autoindexing") werden Eingabefehler bei der Klassifizierung von Dokumenten minimiert. Besonders effektiv ist der Algorithmus für Standardformulare, die ein einheitliches Layout aufweisen, wie etwa E-Mails, Rechnungen oder Ausweisdokumente, bei denen sich Informationswerte durchweg an gleicher Position befinden.
Die Indizierung von unternehmensrelevanten Identifikatoren ermöglicht im Folgenden das nahezu sofortige Auffinden von den entsprechenden Unterlagen über die Volltextsuche. Bei der Einrichtung von Instanzen für Geschäftskunden ermitteln wir folglich im Voraus, welche Identifikatoren ein Unternehmen verarbeitet - und welche Daten sinnvollerweise indiziert werden müssen. Ein gut indiziertes System ermöglicht ein schnelles und zuverlässiges Auffinden von Dokumenten, was bei zeitkritischen Compliance-Audits oder Gerichtsverfahren entscheidend sein kann.
Generell wird die Indexierungsqualität in stark regulierten Branchen wie Finanzdienstleistungen und Gesundheitswesen zum kritischen Messwert im Bereich Risikomanagement und Information-Compliance.
Der heutige Stand der Technik macht es möglich, Datensätze aus Belegen und Rechnungen via OCR direkt in die Buchhaltungssoftware oder das Zahlungsportal zu importieren, um dort von menschlicher Hand verifiziert zu werden. Dabei abstrahieren unsere Systeme von der jeweiligen Form, Sprache oder den länderspezifischen Merkmalen einer Rechnung.
Somit müssen Rechnungsbeträge, Referenznummern, Währungen sowie Adressfelder von Zahlungsempfängern nicht mehr mühsam von Hand eingetippt werden. Mit bis zu 10 Eingabefeldern, die zur Erfassung eines Zahlungsauftrags nötig sind, heisst das auch weniger fehlgeschlagene Überweisungen durch menschliches Versehen (sog. "Fat-Finger-Fehler").
Unsere Pipeline zur Erfassung von Rechnungsdaten extrahiert bei hohen Zuverlässigkeitswerten folgende Attribute aus gescannten oder hochgeladenen Rechnungen, welche dem Kunden als Metadaten zur Verfügung gestellt werden:
Die automatisierte Erfassung von Personendaten aus Ausweisen zur Identitätsprüfung (Passausweise, IDs, Führerscheine) ist von zentraler Bedeutung beim Kunden-Onboarding oder der Altersverifizierung, so etwa zur Feststellung des wirtschaftlich Berechtigten im Zuge der digitalen Bankkontoeröffnung in der Schweiz oder im Rahmen eines Studentenabonnements einer Zeitung oder Zeitschrift.
Der Schwerpunkt liegt hier auf der Qualität der bei der Ingestion ermittelten Stammdaten im Hinblick auf ihre spätere Echtzeitverteilung an periphere Systeme und Workflows, von der Betrugsprävention bis zum Sanktionsscreening und der Risikobewertung im Allgemeinen.
Beim Scannen oder Hochladen auf die Archivebene (hier) extrahiert unsere Architektur die folgenden Messwerte aus Pässen und Ausweisdokumenten und gibt sie in Form von Metadaten an den Kunden weiter:
Anwendungsfälle