Annotation bildet die Grundlage, um Dokumente in strukturierte Daten zu verwandeln. Unsere Plattform führt Sie sicher durch die Annotation, sodass die KI effektiv lernt und präzise Ergebnisse liefert. In diesem Blogbeitrag gehen wir auf die gängigen Herausforderungen bei der Annotation ein und erklären Ihnen, wie Sie selbst komplexe Datenfelder präzise aus Ihren Dokumenten extrahieren können.
Worauf muss ich achten, wenn ich ein Datum extrahieren möchte?
Sie müssen vollständige Datumsangaben (Tag, Monat, Jahr) aus Dokumenten extrahieren.
Lösung:
Das Feld „Datum“ ist speziell für vollständige Datumsangaben vorgesehen. Für unvollständige Formate wie „März 2024“ sind alternative Methoden erforderlich.
Vorgang:
1. Verwenden Sie das Feld „Datum“ ausschließlich für vollständige Datumsangaben (Tag, Monat, Jahr).
2. Für unvollständige Formate oder unkonventionelle Datumsdarstellungen nutzen Sie das Feld „Freitext“ und lassen Sie die Daten von Ihrem System analysieren.
Tipp:
Halten Sie eine konsistente Formatierung in allen Dokumenten ein, um das Lernen der KI zu verbessern.
Wie kann ich Kalenderwochen auslesen?
Die Extraktion von Kalenderwochen, wie z. B. „Woche 12“, wird nicht nativ unterstützt.
Lösung:
Obwohl kein spezielles Feld „Kalenderwochen“ verfügbar ist, kann das Feld „Freitext“ genutzt werden, um diese Daten zu erfassen.
Vorgehen:
1. Wählen Sie das Feld „Freitext“ aus.
2. Annotieren Sie die Kalenderwoche in Ihren Dokumenten.
3. Verarbeiten Sie diese Daten nach Bedarf in Ihrem System weiter.
Wie extrahiere ich Checkboxen am besten?
Extraktion von Checkboxen zusammen mit dem zugehörigen Text.
Lösung:
Checkboxen müssen in Kombination mit dem Text, auf den sie sich beziehen, annotiert werden, um eine genaue Extraktion zu gewährleisten.
Vorgehen:
1. Erstellen Sie ein kombiniertes Feld mit zwei Textelementen.
2. Annotieren Sie sowohl die Checkbox als auch den zugehörigen Text.
3. Gruppieren Sie sie, um der KI die Beziehung zwischen Checkbox und Text beizubringen.
Tipp: Annotieren Sie Checkboxen und Text immer konsistent, um Abweichungen in den KI-Vorhersagen zu vermeiden.
Wie modelliere ich mehrere Hierarchieebenen auf meinen Dokumenten?
Dokumente mit mehreren Hierarchieebenen, z. B. Rechnungen mit mehreren Lieferungen und Produkten.
Lösung:
Mithilfe von Listen können Sie hierarchische Daten effektiv modellieren.
Vorgehen:
1. Erstellen Sie separate Listen für jede Hierarchieebene. Beispiel:
• Liste 1: Liefernummern
• Liste 2: Produkte
2. Annotieren Sie jede Ebene in der jeweiligen Liste.
3. Führen Sie die Listen bei Bedarf in Ihrem System zusammen, indem Sie die bereitgestellten Koordinaten verwenden.
Tipp:
Definieren Sie die Beziehungen zwischen den Listen klar, um die Datenintegrität zu gewährleisten.
In meinem Dokument ist oft zu viel Abstand zwischen zwei Worten. Wie kriege ich es hin, dass die KI trotzdem beide ausliest?
Zwischen zwei Worten ist zu viel Abstand. Unsere KI entscheidet sich daher nur für eines der beiden. Sie möchten aber alle Wörter im Feld extrahieren.
Lösung:
In dem Sie ein “kombiniertes Datenfeld” anlegen, welches aus einem Textfeld besteht, können Sie alle zugehörigen Worte im Textfeld gruppieren.
Vorgehen:
1. Wählen Sie „Neues Extraktionsfeld hinzufügen” aus.
2. Wählen Sie anschließend als Feldtyp “Kombiniert” aus.
3. Fügen Sie dem kombinierten Datenfeld das Feld „Freier Text“ hinzu.
Wie annotiere ich richtig wenn ein Datenfeld immer mehrmals auf einem Dokument vorkommt?
Ein Feld erscheint mehrfach in jedem Dokument.
Lösung:
Annotieren Sie nur eine Instanz des Feldes, um die Konsistenz zu wahren.
Vorgehen:
1. Wählen Sie eine Instanz des wiederholten Feldes aus, die Sie annotieren.
2. Falls Sie mehrere Instanzen annotieren müssen, erstellen Sie separate Felder (z. B. „Lieferantenname“ und „Impressumsname“).
Tipp: Annotieren Sie immer dieselbe Instanz in allen Dokumenten, um der KI zu helfen, ihren Standort zu erlernen.
Wie annotiere ich richtig, wenn ein Datenfeld auf manchen Dokumenten mehrfach, auf anderen nur einmal und an unterschiedlichen Orten vorkommt?
Ein Feld erscheint an unterschiedlichen Stellen oder unregelmäßig in den Dokumenten.
Lösung:
Listen ermöglichen es, alle Vorkommen systematisch zu annotieren.
Vorgehen:
1. Erstellen Sie eine Liste mit Textelementen.
2. Annotieren Sie alle Vorkommen innerhalb der Liste und gruppieren Sie jede Instanz.
3. Die Liste konsolidiert alle relevanten Felder für eine konsistente Ausgabe
Kann ich die Reihen einer Tabelle nochmal getrennten Kategorien zuordnen?
Extraktion von Tabellenzeilen, bei denen jede Zeile zu einer anderen Kategorie gehört.
Lösung:
Separate Listen ermöglichen eine effektive Kategorisierung von Tabellenzeilen.
Vorgehen:
1. Ordnen Sie jede Tabellenzeile einer eigenen Liste zu.
2. Annotieren Sie die Zeilen innerhalb ihrer jeweiligen Listen.
3. Fügen Sie gemeinsame Datenfelder (z. B. „Preis“) bei Bedarf in jede Liste ein.
Wie annotiere ich eine Datei, die aus mehreren Dokumenten besteht?
Dateien mit mehreren Dokumenten, von denen nur einige annotiert werden müssen.
Lösung:
Teilen Sie die Dokumente zur einfacheren Verarbeitung auf oder annotieren Sie unerwünschte Abschnitte mit „None“.
Vorgehen:
1. Verwenden Sie für gemischte Dokumentdateien den „Splitting Workflow“, um die Dokumente zu trennen.
2. Wenn ein Aufteilen nicht erforderlich ist, annotieren Sie irrelevante Seiten mit „None“, damit die KI sie ignoriert.
Profi-Tipps und bewährte Praktiken
• Konsistenz ist entscheidend: Annotieren Sie dieselben Felder konsistent in allen Dokumenten, um das Lernen der KI zu verbessern.
• Nutzen Sie Listen strategisch: Bei variierenden Feldpositionen bieten Listen Flexibilität und Organisation.
• Überprüfen Sie Ihre Annotationen: Überprüfen Sie regelmäßig die Annotationen, um sicherzustellen, dass sie das gewünschte Ergebnis liefern.
• Iteratives Training: Verfeinern Sie Ihre Annotationen, während Ihre KI lernt, um Sonderfälle oder Inkonsistenzen zu berücksichtigen.
Nächste Schritte und Ressourcen
• Sehen Sie sich das
FAQ-Video zur Annotation an.
• Entdecken Sie fortgeschrittene Tutorials: Greifen Sie auf weitere Anleitungen zu, um natif.ai effektiv zu nutzen.
• Benötigen Sie Hilfe?
Kontaktieren Sie unser Support-Team.
Indem Sie diese Annotationstechniken beherrschen, können Sie Ihre Dokumenten-Workflows transformieren und das volle Potenzial der intelligenten Plattform von natif.ai ausschöpfen. Legen Sie noch heute los!