Next Level RPA: Individuelle Formulare und Dokumente automatisieren

Prozessmanager stehen heute vor der Aufgabe hochindividuelle und immer komplexer werdende Dokumente automatisiert zu verarbeiten. Dabei stoßen klassische RPA-Lösungen oftmals an ihre Grenzen. Deshalb werden modernere Technologien wie OCR (Optical Character Recognition) und IDP (Intelligent Document Processing) nötig, um die bestehende RPA-Systemlandschaft sinnvoll zu erweitern und die Automatisierungsquote weiter zu erhöhen.

Robotic Process Automation (RPA): Der Status Quo

Die robotergestützte Prozessautomatisierung RPA (Robotic Process Automation) hilft Unternehmen regelbasierte Geschäftsprozesse zu automatisieren. Hierfür werden RPA-Bots darauf programmiert von vornherein festgelegte Workflows exakt zu kopieren und die vorgegebenen Handlungsschritte Eins zu Eins so auszuführen, wie sie erlernt wurden. Die Vorteile dieser Technologie liegen auf der Hand. Sind die Prozessregeln einmal definiert und erlernt, können diese durch RPA-Software mit hoher Präzision und Geschwindigkeit immer wieder ausgeführt werden, ohne, dass dies ein Mensch tun muss.
Diese Prozesse können z.B. Folgende sein:

Daten zwischen zwei Softwaresystem übertragen
Daten aus Dokumenten mit immer gleichem Layout extrahieren
Transaktionen ausführen
Berechnungen durchführen
Datenbankabfragen ausführen

Anhand dieser Beispiele lässt sich bereits erahnen, wie vielfältig der Einsatz von RPA-Lösungen ist. Allerdings muss dabei beachtet werden, dass RPA lediglich auf regelbasierte Geschäftsprozesse angewendet werden kann und die Technologie nicht intelligent agiert. Möchten wir beispielsweise Daten aus einem Formular extrahieren und an ein Folgesystem übertragen, führt der Softwareroboter diesen Schritt immer wieder blind aus. So geht der Bot davon aus, dass die vorher ablaufenden Prozesse korrekt ausgeführt wurden und das jeweilige Formular auch den vorgegebenen Regeln entspricht. In der Praxis werden solche Regeln oft sehr unterschiedlich definiert:

Das Layout der zu verarbeitenden Dokumente ist immer gleich.
Die zu extrahierenden Informationen stehen immer an der gleichen Stelle.
Die Informationen liegen in einem / mehreren vordefinierten Formaten vor.
Der auszulesende Text steht immer hinter einem festen Schlagwort.

Werden diese Regeln dann nicht erfüllt, steht die RPA-Software vor Problemen und kann den Prozessschritt nicht ausführen oder extrahiert im Worst Case sogar falsche Daten.

Beispiel

Steht beispielsweise die Rechnungsnummer in dem Dokument oben rechts, statt oben links, werden die gewünschten Informationen nicht gefunden oder es werden falsche Angaben extrahiert. Gleiches gilt, wenn die Rechnungsnummer normalerweise im Format XXX/YYYY/ZZZZ angegeben wird, diese auf dem Dokument allerdings im Format XXX-YYYY-ZZZZ vorliegt. Auch dann kann diese nicht gefunden werden.

Auch wenn diese Beispiele auf den ersten Blick banal erscheinen mögen, ist es unmöglich immer alle potenziellen Sonderfälle im Vorhinein zu definieren. Deshalb beträgt der Automatisierungsgrad in der Verarbeitung mit reinen RPA-Bots oft deutlich unter 60 % und auch der Arbeitsaufwand steigt durch die Definition der vielen möglichen Sonderfälle.

RPA „intelligent“ machen: Einführung von Intelligent Document Processing (IDP)

Um den geschilderten Problemen herkömmlicher RPA-Software zu begegnen, gilt es, diese um intelligente Softwaremodule zu erweitern. Das Mittel der Wahl ist hierfür die Einführung von Modellen der Künstlichen Intelligenz (KI), insbesondere aus dem Bereich der Intelligenten Dokumentenverarbeitung (IDP). Der Vorteil von IDP-Lösungen ist, dass diese nicht vordefinierten Wenn-Dann-Regeln folgen. Sie haben ein holistisches Verständnis für Dokumente und lesen diese wie ein Mensch. Das bedeutet, dass den Modellen nicht mehr anhand von vielen vordefinierten Regeln gezeigt werden muss, wie die gewünschte Information extrahiert werden soll. Dem Modell wird lediglich gezeigt für welche Art der Informationen man sich interessiert. Es lernt dann selbstständig, wie diese Informationen zu extrahieren sind und was bei der Extraktion beachtet werden muss. So können dann auch Dokumente richtig interpretiert werden, obwohl diese ein Layout aufweisen, das die Software vorher noch nie gesehen hat. Oder ein Dokument wird aussortiert und nochmal einem Menschen vorgelegt, da sich die Software bei der Extraktion nicht ganz sicher ist. Auch die gewünschten Konfidenzniveaus können hierbei individuell festgelegt werden.

Hier steht die BIC nicht in dem vorgegebenen Feld. Da die IDP-Software allerdings weiß, dass eine BIC entweder aus 8 oder 11 Stellen besteht, wird die 1, die außerhalb des Feldes liegt, mit extrahiert.

Hier hat der Kunde eine französische IBAN, die im Gegensatz zur deutschen IBAN aus 27 Zeichen besteht, statt aus 22 Zeichen. Da die IBAN mit „FR“ beginnt, erkennt die Software, dass es sich um eine französische IBAN handelt und erwartet 27 Zeichen als Eingabe.

Hier wurde die Belegnummer auf der Quittung in beiden Fällen korrekt erkannt und ausgelesen. Dies ist selbst dann der Fall, wenn die Belegnummer, wie in diesem Fall, unterschiedlich lang ist, an unterschiedlichen Stellen steht und durch unterschiedliche Schlagworte (Beleg Nr. vs Belegnummer) „angekündigt“ wird.

Diese „Regeln“ müssen nicht erst von einem Menschen definiert werden, sondern das KI-Modell lernt diese komplett selbständig durch das Training auf Testdatensätzen. Hierbei können bereits mit kleinen Datenmengen Ergebnisse erzielt werden, die deutlich über den Ergebnissen herkömmlicher RPA-Software liegen. Zudem lernt die KI durch den Active Learning Ansatz mit jedem vorgelegten Dokument hinzu, sodass die Automatisierungsquote mit weiteren Daten zunehmend steigt und nicht selten deutlich über 90 % liegt. Dies liegt daran, dass IDP-Software Regeln beachtet, die selbst ein Mensch oftmals gar nicht als solche erkennt. So erkennt IDP-Software beispielsweise automatisch, dass eine deutsche IBAN, die mit DE beginnt, normalerweise 22 Zeichen hat. Hat der Kunde allerdings eine französische IBAN, die mit FR beginnt, so besteht diese aus 27 Zeichen. So kann IDP folgende Regel ableiten: „Beginnt eine IBAN mit DE, so erwarte ich 22 Zeichen. Beginnt die IBAN mit FR, so erwarte ich 27 Zeichen. Weicht die jeweilige Länge ab, sortiere ich das jeweilige Dokument aus und lege es nochmal einem Menschen zur Überprüfung vor.“ Ein Mensch hätte diesen Sonderfall eventuell gar nicht in Betracht gezogen und statt, dass das Dokument automatisiert verarbeitet worden wäre, hätte es nochmals manuell überprüft werden müssen und die Regel hätte im Nachhinein händisch angelegt werden müssen. Und dies ist lediglich ein Sonderfall von unendlich potenziell Möglichen, den die KI bereits beim Training erkennt. Dies zeigt wie die hohe Automatisierungsrate durch IDP zu Stande kommt.

Automatisierung durch Intelligent RPA: Die Bedeutung der OCR

Um die Einführung von IDP erfolgreich zu meistern, ist es auch wichtig, die Relevanz der OCR für IDP-Software zu verstehen. Denn nur wenn ein Dokument richtig durch die OCR gelesen wird, können die Inhalte auch richtig extrahiert werden. So setzt die OCR-Qualität die natürliche Obergrenze für den Automatisierungsgrad von Dokumentenprozessen. Deshalb haben wir bei natif.ai unsere eigene Deep-OCR entwickelt, die eine einzigartige Qualität liefert. Diese versteht Handschriften genauso wie Computerschriften, sodass auch handschriftlich ausgefüllte Dokumente und Formulare automatisiert werden können. Darüber hinaus wissen wir beim Auslesen und Verarbeiten von Dokumenten für unsere Kunden um die Sensibilität der Daten. Daher sind unsere Lösungen mit den höchsten Datenschutzbedingungen vereinbar und vollständig konform nach DSGVO und SCHREMS II.

Eigene Dokumente anlegen: Die Individualisierung von RPA-Software

Um individuelle Dokumente und die Extraktion von Informationen aus diesen zu automatisieren, können auf unserer Plattform eigenen Modelle selbstständig trainiert werden. Hierzu lädt man die gewünschten Dokumente hoch, bestimmt die zu extrahierenden Informationen und markiert diese auf den bereitgestellten Dokumenten. Dabei können verschiedene KI-Module einfach per Low Code miteinander kombiniert und eigene Workflows kreiert werden, die die Dokumente und die extrahierten Informationen dann durchlaufen. Zudem finden sich in unserer Datenbank bereits diverse vortrainierte Modelle zur Automatisierung unterschiedlichster Dokumententypen.

Wie lässt sich natif.ai in bestehende RPA-Lösungen integrieren?

Mit der einfach anzubindenden API-Schnittstelle kann jede gängige RPA-Software an unsere IDP-Lösungen angebunden und um diese erweitert werden. Hierfür sind unsere OCR-Lösungen mit Handschriften, Klassifikations- und Extraktionsalgorithmen verfügbar. Durch die API werden die Ergebnisse der Verarbeitung durch unsere Software als strukturierte Daten im JSON-Format zurückgegeben und sind somit schnell und einfach anzubinden.

Fazit

Die Ergänzung von RPA um modernere IDP-Lösungen sind unumgänglich, wenn die nächste Stufe der Automatisierung angestrebt werden soll. Dies gilt insbesondere für die Automatisierung individueller Dokumente und Formulare, die sich von Unternehmen zu Unternehmen unterscheiden. Egal ob im Onboarding Prozess für Kunden von Banken und Versicherungen, bei der Automatisierung des Mailrooms oder in der Logistik. Unsere IDP-Lösungen sind für (fast) alle Anwendungsfälle verfügbar – sprechen Sie uns gerne an!