So definieren Sie Datenfelder für Ihre Extraktion richtig

Damit unsere KI genau weiß, welche Inhalte Sie aus Ihren Dokumenten extrahieren soll, müssen Sie die entsprechenden Datenfelder klar definieren. Dies ist besonders wichtig, wenn Sie Ihr eigenes Extraktionsmodell auf unserer Plattform trainieren möchten.

Bei der Verarbeitung von Rechnungen, Kontoauszügen, Lieferscheinen und weiteren Dokumenten ist es wichtig, die exakten Inhalte, die Sie benötigen, ordnungsgemäß zu extrahieren. Eine präzise Extraktion gewährleistet nicht nur eine korrekte Verarbeitung der Daten, sondern ermöglicht auch eine effiziente Analyse und Nutzung der Informationen für verschiedene Geschäftsprozesse.

Damit unsere KI genau weiß, welche Inhalte Sie aus Ihren Dokumenten extrahieren soll, müssen Sie die entsprechenden Datenfelder klar definieren. Dies ist besonders wichtig, wenn Sie Ihr eigenes Extraktionsmodell auf unserer Plattform trainieren möchten.

Was sind Datenfelder?

Datenfelder sind spezifische Informationen bzw. Daten, die aus Dokumenten extrahiert werden. Das können beispielsweise die Rechnungsnummer, Angaben zum Kunden oder alle Zahlungsdetails sein.
Bei der Erstellung Ihres eigenen Extraktionsmodells können Sie selbst bestimmen, welche Datenfelder die KI aus Ihren Dokumenten extrahieren soll. So können Sie genau die Informationen herausfiltern, die Sie für Ihre Geschäftsprozessen benötigen.
 
Wir unterscheiden Datenfelder zwischen Basic Types und Advanced Types.

Basic Types

Zu den Basic Types gehören Datenfelder, die einen einzelnen Wert beinhalten, wie beispielsweise einen Namen oder ein Datum. Die Basic Types werden in Free Text, Number, Date und Identifier aufgeteilt.

Free Text

Free Text extrahiert einen Textstring, der aus einem oder mehreren Wörtern besteht, und kann für die Erfassung von Informationen wie dem Namen des Empfängers, der Straße und Hausnummer sowie der Beschreibung einer Dienstleistung verwendet werden.

Number

Number extrahiert einen numerischen Wert aus Ihrem Dokument, was bedeutet, dass es Zahlenwerte wie Alter, Gewicht, Anzahl der Artikel oder Preis extrahiert.

Date

Date extrahiert Datumsangaben aus Ihrem Dokument, basierend auf dem Extraktionsformat „2025-01-01“. Dadurch können Informationen wie Geburtsdatum, Lieferdatum oder Dokumentendatum strukturiert erfasst werden. Diese Funktion erleichtert die zeitliche Einordnung und Organisation von Dokumenten, indem sie eine klare und systematische Erfassung der Zeitdaten ermöglicht.

Identifier

Identifier extrahiert Buchstaben-Zahlen-Kombinationen aus Ihren Dokumenten. Diese Funktion ermöglicht die Erfassung eindeutiger Kennungen wie Steuer-ID, Personalnummer oder Dokumentennummer.

Advanced Types

Advanced Types bilden eine Kategorie, zu der mehrere Basic Types gehören. Dies ermöglicht die hierarchische Anordnung von Datenfeldern. Ein Advanced Type kann zum Beispiel aus den Basic Types Name (Free Text) und Alter (Number) bestehen. Die Advanced Types unterscheiden sich in „Combined“, „List“ und „Table“.

Combined

Combined kombiniert verschiedene Basic Fields, um mehrere Informationen zu gruppieren, was eine strukturierte Erfassung und Verarbeitung zusammenhängender Daten ermöglicht.
Zum Beispiel können unter Personenangaben der Name (Free Text), die Adresse (Free Text) und die Personalnummer (Identifier) gruppiert werden.
Ebenso können unter Zahlungsbeträgen der Nettobetrag (Number), der Bruttobetrag (Number) und der Steuerbetrag (Number) zusammengefasst werden.

List

List ermöglicht die Organisation einer Liste von Daten, sei es einzeln oder in Kombination. Diese Funktion ist besonders nützlich für die Erfassung und Analyse von Daten, die in einer bestimmten Reihenfolge oder als Gruppe vorliegen.
Beispiele hierfür sind Bestellnummern (Identifier), IBANs (Identifier) und Artikel, die mithilfe von Combined extrahiert werden.

Table

Table eignet sich für tabellarische Daten und bietet eine strukturierte Ansicht mit Spalten und Zeilen. Diese Funktion ermöglicht eine präzise und übersichtliche Darstellung von Daten, die in einem tabellarischen Format vorliegen.
Beispiele hierfür sind Artikel auf Rechnungen mit unterschiedlichen Spalten, Zählerstände auf Heizrechnungen und Einzelpositionen auf Gehaltsabrechnungen.
Nun sind Sie bereit, Informationen aus Ihren Dokumenten präzise und effizient zu extrahieren und für Ihre Geschäftsprozesse zu nutzen.

Durch die klare Definition von Datenfeldern legen Sie den Grundstein für eine erfolgreiche Verarbeitung und Analyse Ihrer Dokumente. Starten Sie jetzt und optimieren Sie Ihre Arbeitsabläufe mit einer präzisen Extraktion von relevanten Daten.

Aktuelle Beiträge