2019/12 | Fachbeitrag | Dokumentenmanagement

KI richtig nutzen: Wie Unternehmen von Document Intelligence profitieren

von Karolin Köstler

Inhaltsübersicht:

Typ 1 – Dokumentenklassifizierung KI

Der erste Document-Intelligence-Typ ist die KI-gestützte Klassifizierung von Dokumenten. Dabei werden Dokumente automatisiert einer oder mehreren Kategorien zugeordnet. Mithilfe maschinellen Lernens wird der Inhalt eines Dokuments analysiert, indiziert und mit Strukturinformationen versehen (Tagging). Mittels Taggings können Dokumente automatisiert in definierte Ordner abgelegt bzw. an bestimmte Gruppen oder Personen weitergeleitet werden. Davon profitieren insbesondere Organisationen wie Bibliotheken oder Medienunternehmen, die mit einer riesigen Menge unterschiedlicher Inhalte konfrontiert sind. Es kann aber auch für eine Vielzahl anderer Funktionen hilfreich sein. Beispielsweise werden im Rahmen der Dokumentenklassifizierung Rechnungen erkannt, als solche gekennzeichnet und an die Kreditorenbuchhaltung weitergegeben. Dieser Klassifizierungsprozess lässt sich durch das Erlernen von Benutzeraktionen mit Dokumenten weiter verfeinern. Dokumente werden dann – basierend auf aktuellen Arbeitsabläufen und spezifischen Inhaltsanforderungen – einzelnen Personen automatisch zugewiesen.

Typ 2 – Dokumenteninhalt KI

Ein KI-gestützter Dokumenteninhalt greift die Klassifizierung (Typ 1) auf und erweitert sie. Nachdem die Algorithmen des maschinellen Lernens die Klassifizierung verstanden haben, können sie weiter in die Tiefe gehen und untersuchen, ob domänenspezifische Begriffe erkannt und extrahiert werden können. Falls dies gelingt, werden sie in geordnete Objekte umgewandelt und mithilfe von APIs (Application Programming Interfaces; deutsch: Programmierschnittstellen) anderen Anwendungen, wie Rechnungswesen- oder Finanzsystemen, zugeordnet. Für Dokumente, die Standardformaten wie Rechnungen oder Bestellformulare entsprechen, ist dies leichter umsetzbar. Beispielsweise können Daten wie der Zahlungsempfänger, der Zahlungsbetrag und die Zahlungsbedingungen aus einer Rechnung extrahiert und direkt in ein Kreditorensystem eingespeist werden. So wird die Verarbeitung weiter automatisiert und die Datengenauigkeit erhöht, da menschliche Übertragungsfehler ausgeschlossen sind.

Typ 3 – Textanalyse oder Zusammenfassung mittels KI

Eine KI-basierte Textanalyse oder inhaltliche Zusammenfassung ist ein weiterer Ansatz zur Analyse des Dokumenteninhalts. Im Gegensatz zu Typ 2, bei dem Daten in geordneten Objekten extrahiert und strukturiert werden, versteht Typ 3 das Thema und die Semantik des Inhalts als Ganzes und stellt diese in Form einer Zusammenfassung zur Verfügung. Dieser KI-Typ eignet sich am besten für Unternehmen, die sehr große und komplexe Dokumente erhalten und schnell verstehen müssen, welche Informationen das Dokument enthält. Beispiele dafür sind rechtliche Überprüfungen oder die Prüfung neuer Arzneimittel.

Der Status quo in Unternehmen

Derzeit sind viele Unternehmen dabei, eine KI-gestützte Dokumentenklassifizierung (Typ 1) zu implementieren und den Einsatz KI-gestützter Dokumenteninhalte (Typ 2) zu evaluieren. Großunternehmen, wie Versicherungsunternehmen oder Banken mit großen internen Data-Science-Teams, sind dahingegen häufig schon einen Schritt weiter und interessieren sich für eine Einführung von Typ 3, um Dokumente inhaltlich zu verstehen.

Das bringt die Zukunft: Typ 4 – Deep Document Recognition KI

Die zuvor beschriebenen Typen von Künstlicher Intelligenz eignen sich am besten für Dokumente mit reinem Text, ohne ausgefallene Formatierungen oder komplexe Inhalte. Welche Art von Dokumenten enthält erweiterte Formatierungen und Inhalte? Beispiele hierfür wären eine Zeitung, in der Artikel von einer Seite zu einer bestimmten Stelle auf einer anderen Seite „springen“, Dokumente mit mehreren Spalten oder solche, die Inhalte mit vielen Sprüngen über Tabellen, Bilder oder Diagramme hinweg enthalten. Ebenso sind es Dokumente in einer Fremdsprache, die übersetzt werden müssen. Ein weiteres Beispiel sind Dokumente, die gescannte Diagramme oder Tabellen enthalten, die in eine CSV-Datei oder nach Excel konvertiert werden müssen. Beides kann durch automatische Verarbeitung mit einer Deep Document Recognition gelingen. Doch wie können Algorithmen für maschinelles Lernen die Lesereihenfolge und den Inhalt der Informationen in diesen Dokumententypen genau erkennen und erlernen? KI-Entwickler haben diese Probleme noch nicht gelöst, aber sie werden in den kommenden Jahren im Mittelpunkt von Anbietern im Bereich Document Intelligence stehen.

Das Kosten- vs. Genauigkeits-Dilemma

Algorithmen für maschinelles Lernen sind sehr komplex und erfordern eine hohe Rechenleistung, um präzise zu sein. Infolgedessen wird die KI-basierte Dokumentenverarbeitung meist in der Cloud ausgeführt, in der weit mehr Rechenressourcen verfügbar sind als auf dem Desktop. Daher müssen Client-Anwendungen KI-Dienste entweder von Private Clouds anfordern (d. h. Cloud-Diensten, die „on premise“ sind; das bedeutet, die Dienste werden auf Servern innerhalb der unternehmensinternen Firewall installiert) oder von Public Clouds (das heißt, die Dienste werden auf Servern außerhalb der Firewall des Unternehmens installiert). Der Vorteil von Public Clouds besteht darin, dass sie in der Regel kostengünstiger sind und durch eine monatliche Gebühr sowohl der Service als auch die Kosten für die IT-Verwaltung abgedeckt sind. Der Vorteil von Private Clouds besteht darin, dass die Daten die Unternehmensinfrastruktur nicht verlassen. Das vermittelt Unternehmen das Gefühl, dass ihre Daten besser geschützt sind.

Das Kosten- vs. Genauigkeits-Dilemma besteht also darin, dass mehr Rechenleistung maschinellen Lernalgorithmen mehr Komplexität ermöglicht und sie mit einer höheren Präzision lernen können. Gleichzeitig bedeutet das aber auch, dass höhere Kosten und längere Verarbeitungszeiten für Dokumente anfallen. Unternehmen können die Kosten senken und die Leistung steigern, indem sie die Algorithmen vereinfachen, was allerdings die Genauigkeit des maschinellen Lernens beeinträchtigt.

Welche der vorgestellten Document-Intelligence-Typen am besten geeignet sind, hängt vom Unternehmen und der Art der empfangenen, verarbeiteten und gespeicherten Dokumente ab. IT-Verantwortliche sollten das Kosten-Nutzen-Verhältnis der aufwendigen Verarbeitungsinfrastruktur abwägen. Ehe sie hochkomplexe Algorithmen für maschinelles Lernen implementieren, sollten sie prüfen, ob der operative Nutzen eine erweiterte Dokumentenmanagement-Automatisierung rechtfertigt. Nach Abschluss dieser Analyse ist in der Regel klar, welcher Typ der KI-gestützten Dokumentenverarbeitung für das jeweilige Unternehmen am besten geeignet ist.

Unabhängig von der Art der Document Intelligence, die Unternehmen auswählen, kann die Leistungsfähigkeit von KI und maschinellem Lernen einen außergewöhnlichen Nutzen und ROI liefern, indem Document Intelligence die Geschäftsprozesse weiter automatisiert und verbessert.

Diese Artikel könnten Sie auch interessieren

In the Loop: Input & Output Management verknüpfen

WISSENplus
In der Kommunikation gilt: Des einen Input ist des anderen Output - und umgekehrt. Im Sinne eines ganzheitlichen Informationsmanagements sollten daher dokumentenbasierte Prozesse als "Closed Loop" technisch und organisatorisch verknüpft sein....

Weiterlesen

Suchen Sie noch oder finden Sie schon?

WISSENplus
Ein Großteil der Arbeitszeit wird damit verbracht, wichtige Informationen und bereits erarbeitete Unterlagen oder Lösungen zu suchen. Häufig werden die gewünschten Inhalte jedoch auch nach längerem Durchstöbern der Fileserver nicht gefunden. Meist liegt die erfolglose Suche an der dezentral organisierten und unstrukturierten Ablage....

Weiterlesen

Digitalisiert & vernetzt: Daten im (Work-)Flow

Daten gelten als Gold des 21. Jahrhunderts. Sie haben sich als vierter Produktionsfaktor neben Boden, Arbeit und Kapital fest etabliert. In vielen Organisationen tragen sie - als elementarer Wissensbaustein - mittlerweile sogar mit mehr als 60 Prozent zur Wertschöpfung bei. Doch trotz ihrer wachsenden Bedeutung für die Wettbewerbsfähigkeit werden Daten in vielen Organisationen nach wie vor vernachlässig...

Weiterlesen

Veränderung als Chance nutzen!

Die heutige Arbeitswelt ist dynamischer als je zuvor! Sie verlangt von Organisationen, sich ständig zu hinterfragen und ihre Abläufe zu verbessern. Kleinere und größere Change-Prozesse sind daher allgegenwärtig und aus dem Unternehmensalltag nicht mehr wegzudenken. Um Veränderungen rasch und effektiv umzusetzen, ist eine transparente Kommunikation einer der wichtigsten Grundpfeiler. Nur wenn all...

Weiterlesen

Die E-Rechnung kommt! Fristen, Hintergründe & Chancen

Deutschland rückt dem Ziel einer standardisierten digitalen Arbeitswelt ein wichtiges Stück näher. Denn die letzte Frist für die Umsetzung der E-Rechnungsverordnung (ERechV) steht kurz bevor: Ab dem 27. November 2020 dürfen öffentliche Auftraggeber - bis auf wenige Ausnahmen - nur noch sogenannte E-Rechnungen annehmen. Für manche Dienstleister ist die Umstellungspflicht ein alter Hut. Doch für...

Weiterlesen

Drei Szenarien für das Digital Office

WISSENplus
Gerade zu Beginn der Corona-Krise gab es eine hohe Nachfrage nach cloudbasierten Digital-Office-Lösungen. Denn der Großteil an Unternehmen musste aus der Not heraus schnell neue Arbeits- und Kommunikationsweisen etablieren. Laut einer Sonderauswertung des Bitkom-ifo-Digitalindexes arbeiteten im April diesen Jahres 75 Prozent aller Unternehmen von zu Hause aus - in der Informations- und Kommunikatio...

Weiterlesen