KI trainieren ohne Daten - geht das?

Bevor wir uns mit dem Thema befassen, sollten wir zunächst verstehen, was mit dem „Trainieren einer KI ohne Daten“ gemeint ist.

Beim traditionellen Ansatz zum Trainieren einer KI füttern Entwickler den Algorithmus mit großen Datenmengen, und der Algorithmus nutzt diese Daten, um Muster zu lernen und Vorhersagen zu treffen. Beim Training einer KI ohne Daten besteht das Ziel jedoch darin, eine KI zu schaffen, die ohne bereits vorhandene Daten lernen und sich verbessern kann.

Unüberwachtes Lernen

Eine erste Möglichkeit für KI-Training ohne Daten, ist das sogenannte unüberwachte Lernen (eng. unsupervised learning).
Unüberwachtes Lernen ist eine Art des maschinellen Lernens, bei dem die KI keine markierten Daten erhält, d. h. es gibt keine vordefinierten Antworten, aus denen der Algorithmus lernen kann. Stattdessen ist die KI darauf angewiesen, selbstständig Muster und Beziehungen in den Daten zu finden.

Dieser Ansatz wird häufig bei Aufgaben wie dem Clustering verwendet, bei dem es darum geht, ähnliche Datenpunkte zusammenzufassen.

Verstärkendes Lernen

Ein anderer Ansatz für das Training einer KI ohne Daten ist das verstärkende Lernen (eng. reinforcement Learning).
Beim Verstärkungslernen erhält die KI keine bereits vorhandenen Daten, sondern ein zu erreichendes Ziel. Die KI interagiert mit einer Umgebung und erhält auf der Grundlage ihrer Aktionen Belohnungen oder Bestrafungen. Durch Versuch und Irrtum lernt die KI, welche Aktionen zu Belohnungen und welche zu Bestrafungen führen, und passt ihr Verhalten entsprechend an.

Das Verstärkungslernen wurde in einer Vielzahl von Anwendungen eingesetzt, unter anderem in KI-Spielen und in der Robotik.

Fazit

Auch wenn technisch beide Formen möglich sind, ist in der Realität jedoch immer noch eine Form der Dateneingabe erforderlich.
Beim unüberwachten Lernen müssen Rohdaten in den Algorithmus eingespeist werden, und beim verstärkenden Lernen wird eine Umgebung benötigt, mit der die KI interagieren kann.

Kurz gesagt beutetet dies, dass man für das Training einer KI immer bestimmte Trainingsdaten und Informationen braucht. Es ist jedoch möglich, eine KI zu entwickeln, die nur minimalen Dateninput benötigt oder ihre eigenen Daten generieren kann. Das Ziel sollte darin bestehen, die Menge der erforderlichen Dateneingabe zu minimieren und sicherzustellen, dass die in die KI eingespeisten Daten von hoher Qualität und unvoreingenommen sind.

KI Training bei natif.ai

Auch bei natif.ai wird die KI anhand von verschiedensten Dokumenten trainiert. Einige unserer Modelle sind bereits so gut mit Informationen angereichert worden, dass es keine neuen Trainings für die Anwendung mehr bedarf. In einigen Fällen können neue Datensätze jedoch helfen, weitere Positionsdaten aus den Dokumenten-Typen brauchbar zu machen.
Da unsere KI eigens entwickelt wurde und unsere Server ihren Standort in Deutschland haben, können wir einen sehr hohen Datenschutz gewährleisten (DSGVO, Schrems II).