Für die meisten Use Case benötigen Foundation-Modelle einen „Human in the Loop“. Das bedeutet, dass menschliche Experten oder Nutzer in den Prozess der Entwicklung, Anpassung und Validierung der Modelle einbezogen werden müssen. Wie be-reits beschrieben wurde der große Qualitätssprung von GPT-3 zu ChatGPT mit dem Reinforcement Learning auf Basis von menschlichem Feedback erreicht.
Da aktuell für die meisten Use Cases ein „Human in the Loop“ notwendig ist, stellt sich die Frage, ob dieser Prozess überhaupt ohne Mensch möglich ist.
Insbesondere bei der Modellanpassung und Validierung spielt der „Human in the Loop“ eine große Rolle. Die bekanntesten Foundation-Modelle wie GPT oder DeBER-Ta sind auf Basis der genutzten Trainingsdaten in vielen Bereichen einsetzbar und müssen für spezifische Anwendungsfälle angepasst werden. Hier müssen in der Regel menschliche Experten helfen, das Modell auf die Bedürfnisse des Anwenders an-zupassen und es zu validieren, um sicherzustellen, dass es korrekt und zuverlässig funktioniert.
Sollen Foundation-Modelle zur Inspiration und Brainstorming genutzt werden, um Im-pulse und Ideen zu erhalten, wird der Output des Modells nicht unmittelbar als fertiger Inhalt genutzt. Vielmehr unterstützt das Modell den Menschen bei der Schaffung neuer Inhalte durch Inspiration und Ideen.
Wird das Modell für Imitationen wie zum Beispiel „schreibe den Text im Stil von Shake-speer“ sind in der Regel keine oder nur eine geringe Qualitätssicherung durch den Menschen notwendig. Ebenso können Inhalte, wie Blog-Posts, die eine gewisse Feh-lertoleranz haben, ohne große menschliche Anpassung genutzt werden. Hier geht es gegeben Falls darum, dem Modell unternehmensspezifische Themen und Ausdrücke beizubringen (vgl. Abbildung).
Sollen dagegen belastbare End-to-End-Prozesse oder Unternehmensapplikationen entwickelt werden, ist ein spezifische Feinabstim-mung durch den Menschen notwendig. Zudem ist hier die Fehlertoleranz besonders gering, eine fehlerhafte Angabe in einer Produktbeschreibung oder in einem Soft-warecode können gravierende Folgen haben.