Was ist Fine-Tuning (bei LLMs)?

Fine-Tuning (auf Deutsch auch „Feintuning“ geschrieben) bedeutet, ein vortrainiertes LLM (großes Sprachmodell) an eine bestimmte Aufgabe oder ein bestimmtes Themengebiet anzupassen, indem man es auf einem spezialisierten Datensatz nachtrainiert.

Dabei werden die Gewichte (Englisch „weights“) des Modells aktualisiert, sodass es die Besonderheiten der Aufgabe oder des Themengebiets besser erfasst.

Fine-Tuning ermöglicht es also, die breite, aber oberflächliche Wissensbasis von LLMs für spezifische Anwendungsfälle zu optimieren.

Du hast eben nur Bahnhof verstanden?

Kein Problem, hier eine einfachere Erklärung:

Du musst dir ein LLM als neuen Mitarbeiter in deinem Unternehmen vorstellen, der zwar über viel Allgemeinwissen verfügt, aber noch wenig Ahnung von den internen Prozessen und der Kommunikation innerhalb des Unternehmens hat.

Durch Fine-Tuning fütterst du deinen Mitarbeiter mit dem nötigen Spezialwissen, damit er seine Rolle im Unternehmen besser erfüllen kann.

1. Vorteile von Fine-Tuning

Fine-Tuning verbessert das „Few-Shot Learning“, indem es mit viel mehr Beispielen trainiert, als in den Prompt passen würden.

Das heißt, du musst zum einen nicht mehr so viele Beispiele in deinen Prompts angeben, um den gewünschten Output zu bekommen. Zum anderen musst du dem LLM weniger Details zu seiner Aufgabe mitgeben, z. B. zum verwendeten Schreibstil, zur Zielgruppe oder der Output-Länge. Das kann viel Zeit sparen.

Zudem kann Fine-Tuning dafür sorgen, dass ein LLMs mit geringerer Latenz antwortet und weniger Token verbraucht. Durch Fine-Tuning lassen sich also auch die Kosten für API-Nutzung oder wahlweise Rechenleistung senken.

2. Welche Schritte sind für das Feintuning erforderlich?

Fine-Tuning hört sich kompliziert an. Ist aber ein relativ simpler, obwohl sehr zeitaufwändiger Prozess.

Die wichtigsten Schritte beim Fine-Tuning sind:

Trainingsdaten vorbereiten und hochladen (der Schritt, der mit Abstand am arbeitsintensivsten für dich ist)
Ein neues feingetuntes Modell trainieren
Ergebnisse auswerten und bei Bedarf zu Schritt 1 zurückkehren
Dein feingetuntes Modell nutzen

2.1 Wie bereitet man die Trainingsdaten vor?

Der wichtigste und aufwändigste Schritt beim Fine-Tuning ist die Vorbereitung der Trainingsdaten.

Dafür musst du einen vielfältigen Satz von Beispielgesprächen erstellen, die den Gesprächen ähneln, auf die das Modell in der Produktion reagieren soll.

Jedes Beispiel im Datensatz muss dafür ein bestimmtes Format haben. Beim Fine-Tuning von OpenAI-Modellen z. B. müssen die Trainingsdaten im selben Format wie die Chat Completions API sein.

Um die besten Resultate beim Fine-Tuning zu erreichen, solltest du ein LLM vor allem mit den Fällen trainieren, in denen es nicht den gewünschten Antworten gibt und ihm entsprechend in den Trainingsdaten deine Wunschantworten mitgeben.

Hier ein Beispiel von OpenAI, indem ein Chatbot namens „Marv“ darauf feingetunt wird, sarkastische Antworten zu geben:

{"messages": [{"role": „system“, „content“: "Marv ist ein faktischer Chatbot, der auch sarkastisch ist."}, {"role": „user“, „content“: "Was ist die Hauptstadt von Frankreich?"}, {"role": „assistant“, „content“: "Paris, als ob das nicht jeder wüsste."}]}
{"messages": [{"role": „system“, „content“: "Marv ist ein faktischer Chatbot, der auch sarkastisch ist."}, {"role": „user“, „content“: "Wer hat 'Romeo und Julia' geschrieben?"}, {"role": „assistant“, „content“: "Oh, nur so ein Typ namens William Shakespeare. Schon mal von dem gehört?"}]}
{"messages": [{"role": „system“, „content“: "Marv ist ein faktischer Chatbot, der auch sarkastisch ist."}, {"role": „user“, „content“: "Wie weit ist der Mond von der Erde entfernt?"}, {"role": „assistant“, „content“: "Etwa 384.400 Kilometer. Gib oder nimm ein paar, als ob das wirklich eine Rolle spielt."}]}

3. Welche KI-Modelle können finegetuned werden?

Finetuning steht bei vielen verschiedenen KI-Modellen zur Verfügung – von proprietären APIs bis hin zu Open-Source-Modellen. Hier eine umfassende Übersicht aller aktuell verfügbaren Modelle (Stand: Januar 2026):

Zeige 29 Modelle

Anbieter	Modell	Parameter	Plattform	Methode
Alibaba / Qwen	Qwen3	0.6B–235B	Open Source	FullLoRA
Alibaba / Qwen	Qwen2.5-Max	MoE	Alibaba Cloud	SFT
Alibaba / Qwen	Qwen2.5	0.5B–72B	Open Source	FullLoRA
Amazon	Amazon Nova 2 Lite	–	Amazon Bedrock	Reinforcement FT
Amazon	Amazon Titan Text	–	Amazon Bedrock	SFT
Anthropic	Claude 3 Haiku	–	Amazon Bedrock	SFT
Cohere	Command R (08-2024)	32B	Cohere API	SFTLoRA
Cohere	Command R+ (08-2024)	104B	Cohere API	SFTLoRA
DeepSeek	DeepSeek R1 Distill	1.5B–70B	Open Source	LoRAQLoRA
DeepSeek	DeepSeek V3	671B (37B MoE)	Open Source	QAT
Google	Gemini 2.5 Pro	–	Vertex AI	SFT
Google	Gemini 2.5 Flash	–	Vertex AI	SFT
Google	Gemini 2.5 Flash-Lite	–	Vertex AI	SFT
Google	Gemini 2.0 Flash	–	Vertex AI	SFT
Google	Gemma 3	1B–27B	Open Source	FullLoRA
Meta	Llama 3.3	70B	Open Source	FullLoRA
Meta	Llama 3.2	1B–90B	Open Source, Amazon Bedrock	FullLoRA
Meta	Llama 3.1	8B–405B	Open Source	FullLoRA
Mistral	Mistral Large 3	123B	Mistral API, Open Source	SFTLoRA
Mistral	Mistral Nemo	12B	Mistral API, Open Source	SFTLoRA
Mistral	Codestral	–	Mistral API	SFT
Mistral	Mistral Small	–	Mistral API	SFT
Mistral	Mistral 7B	7B	Open Source	FullLoRA
OpenAI	GPT-4.1	–	OpenAI API	SFTDPO
OpenAI	GPT-4.1 mini	–	OpenAI API	SFTDPO
OpenAI	GPT-4.1 nano	–	OpenAI API	SFTDPO
OpenAI	GPT-4o (2024-08-06)	–	OpenAI API	SFT
OpenAI	GPT-4o mini	–	OpenAI API	SFT
OpenAI	GPT-3.5 Turbo	–	OpenAI API	SFT

3.1 Erklärung der Fine-Tuning-Methoden

SFT (Supervised Fine-Tuning): Klassisches überwachtes Feintuning mit Input-Output-Paaren
DPO (Direct Preference Optimization): Training mit Präferenz-Daten (welche Antwort besser ist)
Full Fine-Tuning: Alle Modellgewichte werden angepasst
LoRA (Low-Rank Adaptation): Effiziente Methode, die nur kleine Adapter-Schichten trainiert
QLoRA: LoRA mit quantisiertem Basis-Modell (weniger VRAM benötigt)
QAT (Quantization-Aware Training): Training, das die spätere Quantisierung berücksichtigt
Reinforcement FT: Fine-Tuning mit Reinforcement Learning aus menschlichem Feedback

Hinweis: Google AI Studio unterstützt seit 2025 kein Fine-Tuning mehr. Für Gemini-Modelle muss Vertex AI verwendet werden.

Tipp: Du kannst auch ein bereits feingetuntes Modell weiter feintunen. Das ist nützlich, wenn du zusätzliche Daten erhältst und die vorherigen Trainingsschritte nicht wiederholen möchtest.

4. Wann solltest du Fine-Tuning einsetzen?

Fine-Tuning ist eine tolle Methode, um besseren Output von einem LLM zu bekommen und ist vor allem dann sinnvoll, wenn es einfacher ist, etwas zu „zeigen als zu erklären“.

Das Problem ist jedoch:

Fine-Tuning ist, wie bereits erläutert, sehr aufwändig.

Deshalb ergibt es immer Sinn, vorher zu überprüfen, ob du nicht bessere Resultate mit anderen Methoden bekommen kannst und erst auf Fine-Tuning zu setzen, wenn du mit diesen Methoden nicht mehr weiterkommst.

Dazu zählen:

Prompt Engineering (das heißt, das Formulieren von Prompts, z. B. durch Ergänzen einer Rolle, das genaue Definieren des Antwort-Formats etc.)
Prompt Chaining (Aufteilen komplexer Aufgaben in mehrere Prompts)
Function Calling (z. B. das Aufrufen externer Schnittstellen oder Datenbanken)

Ein großer Vorteil dieser Methoden ist, dass du deutlich schneller und einfacher Feedback dazu bekommst.

Wenn du z. B. in deinem Prompt eine Rolle ergänzt, kannst du dein Output direkt mit dem Prompt ohne Rolle vergleichen.

Beim Fine-Tuning musst du oft tage- oder sogar wochenlang deine Trainingsdaten vorbereiten. Dann musst du noch darauf warten, dass das Modell feingetunt ist und kannst nach diesen zwei Schritten erst testen, was das Fine-Tuning eigentlich gebracht hat.

5. Ansätze für das Fine-Tuning

Es gibt verschiedene Möglichkeiten, LLMs feinzutunen:

Ansatz	Beschreibung	Analogie
Full Fine-Tuning	Neutraining des gesamten Modells, benötigt viele Daten und Ressourcen	Einen neuen Mitarbeiten komplett ausbilden
Parameter Efficient Fine-Tuning (PEFT)	Hinzufügen neuer effizienter Adapter, ohne die Modellstruktur zu ändern	Einen Mitarbeiter weiterbilden
Distillation	Training eines kleineren spezialisierten Modells, das die Entscheidungen des großen Modells repliziert	Einen erfahrenen Mitarbeiter einen neuen Mitarbeiten anlernen lassen

Dabei werden die Gewichte (Englisch „weights“) des Modells aktualisiert, sodass es die Besonderheiten der Aufgabe oder des Themengebiets besser erfasst.

Fine-Tuning ermöglicht es also, die breite, aber oberflächliche Wissensbasis von LLMs für spezifische Anwendungsfälle zu optimieren.

Du hast eben nur Bahnhof verstanden?

Kein Problem, hier eine einfachere Erklärung:

Durch Fine-Tuning fütterst du deinen Mitarbeiter mit dem nötigen Spezialwissen, damit er seine Rolle im Unternehmen besser erfüllen kann.

1. Vorteile von Fine-Tuning

Fine-Tuning verbessert das „Few-Shot Learning“, indem es mit viel mehr Beispielen trainiert, als in den Prompt passen würden.

2. Welche Schritte sind für das Feintuning erforderlich?

Fine-Tuning hört sich kompliziert an. Ist aber ein relativ simpler, obwohl sehr zeitaufwändiger Prozess.

Die wichtigsten Schritte beim Fine-Tuning sind:

Trainingsdaten vorbereiten und hochladen (der Schritt, der mit Abstand am arbeitsintensivsten für dich ist)
Ein neues feingetuntes Modell trainieren
Ergebnisse auswerten und bei Bedarf zu Schritt 1 zurückkehren
Dein feingetuntes Modell nutzen

2.1 Wie bereitet man die Trainingsdaten vor?

Der wichtigste und aufwändigste Schritt beim Fine-Tuning ist die Vorbereitung der Trainingsdaten.

Dafür musst du einen vielfältigen Satz von Beispielgesprächen erstellen, die den Gesprächen ähneln, auf die das Modell in der Produktion reagieren soll.

Jedes Beispiel im Datensatz muss dafür ein bestimmtes Format haben. Beim Fine-Tuning von OpenAI-Modellen z. B. müssen die Trainingsdaten im selben Format wie die Chat Completions API sein.

Hier ein Beispiel von OpenAI, indem ein Chatbot namens „Marv“ darauf feingetunt wird, sarkastische Antworten zu geben:

{"messages": [{"role": „system“, „content“: "Marv ist ein faktischer Chatbot, der auch sarkastisch ist."}, {"role": „user“, „content“: "Was ist die Hauptstadt von Frankreich?"}, {"role": „assistant“, „content“: "Paris, als ob das nicht jeder wüsste."}]}
{"messages": [{"role": „system“, „content“: "Marv ist ein faktischer Chatbot, der auch sarkastisch ist."}, {"role": „user“, „content“: "Wer hat 'Romeo und Julia' geschrieben?"}, {"role": „assistant“, „content“: "Oh, nur so ein Typ namens William Shakespeare. Schon mal von dem gehört?"}]}
{"messages": [{"role": „system“, „content“: "Marv ist ein faktischer Chatbot, der auch sarkastisch ist."}, {"role": „user“, „content“: "Wie weit ist der Mond von der Erde entfernt?"}, {"role": „assistant“, „content“: "Etwa 384.400 Kilometer. Gib oder nimm ein paar, als ob das wirklich eine Rolle spielt."}]}

3. Welche KI-Modelle können finegetuned werden?

Zeige 29 Modelle

Anbieter	Modell	Parameter	Plattform	Methode
Alibaba / Qwen	Qwen3	0.6B–235B	Open Source	FullLoRA
Alibaba / Qwen	Qwen2.5-Max	MoE	Alibaba Cloud	SFT
Alibaba / Qwen	Qwen2.5	0.5B–72B	Open Source	FullLoRA
Amazon	Amazon Nova 2 Lite	–	Amazon Bedrock	Reinforcement FT
Amazon	Amazon Titan Text	–	Amazon Bedrock	SFT
Anthropic	Claude 3 Haiku	–	Amazon Bedrock	SFT
Cohere	Command R (08-2024)	32B	Cohere API	SFTLoRA
Cohere	Command R+ (08-2024)	104B	Cohere API	SFTLoRA
DeepSeek	DeepSeek R1 Distill	1.5B–70B	Open Source	LoRAQLoRA
DeepSeek	DeepSeek V3	671B (37B MoE)	Open Source	QAT
Google	Gemini 2.5 Pro	–	Vertex AI	SFT
Google	Gemini 2.5 Flash	–	Vertex AI	SFT
Google	Gemini 2.5 Flash-Lite	–	Vertex AI	SFT
Google	Gemini 2.0 Flash	–	Vertex AI	SFT
Google	Gemma 3	1B–27B	Open Source	FullLoRA
Meta	Llama 3.3	70B	Open Source	FullLoRA
Meta	Llama 3.2	1B–90B	Open Source, Amazon Bedrock	FullLoRA
Meta	Llama 3.1	8B–405B	Open Source	FullLoRA
Mistral	Mistral Large 3	123B	Mistral API, Open Source	SFTLoRA
Mistral	Mistral Nemo	12B	Mistral API, Open Source	SFTLoRA
Mistral	Codestral	–	Mistral API	SFT
Mistral	Mistral Small	–	Mistral API	SFT
Mistral	Mistral 7B	7B	Open Source	FullLoRA
OpenAI	GPT-4.1	–	OpenAI API	SFTDPO
OpenAI	GPT-4.1 mini	–	OpenAI API	SFTDPO
OpenAI	GPT-4.1 nano	–	OpenAI API	SFTDPO
OpenAI	GPT-4o (2024-08-06)	–	OpenAI API	SFT
OpenAI	GPT-4o mini	–	OpenAI API	SFT
OpenAI	GPT-3.5 Turbo	–	OpenAI API	SFT

3.1 Erklärung der Fine-Tuning-Methoden

SFT (Supervised Fine-Tuning): Klassisches überwachtes Feintuning mit Input-Output-Paaren
DPO (Direct Preference Optimization): Training mit Präferenz-Daten (welche Antwort besser ist)
Full Fine-Tuning: Alle Modellgewichte werden angepasst
LoRA (Low-Rank Adaptation): Effiziente Methode, die nur kleine Adapter-Schichten trainiert
QLoRA: LoRA mit quantisiertem Basis-Modell (weniger VRAM benötigt)
QAT (Quantization-Aware Training): Training, das die spätere Quantisierung berücksichtigt
Reinforcement FT: Fine-Tuning mit Reinforcement Learning aus menschlichem Feedback

Hinweis: Google AI Studio unterstützt seit 2025 kein Fine-Tuning mehr. Für Gemini-Modelle muss Vertex AI verwendet werden.

Tipp: Du kannst auch ein bereits feingetuntes Modell weiter feintunen. Das ist nützlich, wenn du zusätzliche Daten erhältst und die vorherigen Trainingsschritte nicht wiederholen möchtest.

4. Wann solltest du Fine-Tuning einsetzen?

Fine-Tuning ist eine tolle Methode, um besseren Output von einem LLM zu bekommen und ist vor allem dann sinnvoll, wenn es einfacher ist, etwas zu „zeigen als zu erklären“.

Das Problem ist jedoch:

Fine-Tuning ist, wie bereits erläutert, sehr aufwändig.

Dazu zählen:

Prompt Engineering (das heißt, das Formulieren von Prompts, z. B. durch Ergänzen einer Rolle, das genaue Definieren des Antwort-Formats etc.)
Prompt Chaining (Aufteilen komplexer Aufgaben in mehrere Prompts)
Function Calling (z. B. das Aufrufen externer Schnittstellen oder Datenbanken)

Ein großer Vorteil dieser Methoden ist, dass du deutlich schneller und einfacher Feedback dazu bekommst.

Wenn du z. B. in deinem Prompt eine Rolle ergänzt, kannst du dein Output direkt mit dem Prompt ohne Rolle vergleichen.

5. Ansätze für das Fine-Tuning

Es gibt verschiedene Möglichkeiten, LLMs feinzutunen:

Ansatz	Beschreibung	Analogie
Full Fine-Tuning	Neutraining des gesamten Modells, benötigt viele Daten und Ressourcen	Einen neuen Mitarbeiten komplett ausbilden
Parameter Efficient Fine-Tuning (PEFT)	Hinzufügen neuer effizienter Adapter, ohne die Modellstruktur zu ändern	Einen Mitarbeiter weiterbilden
Distillation	Training eines kleineren spezialisierten Modells, das die Entscheidungen des großen Modells repliziert	Einen erfahrenen Mitarbeiter einen neuen Mitarbeiten anlernen lassen

Was ist Fine-Tuning (bei LLMs)?

1. Vorteile von Fine-Tuning

2. Welche Schritte sind für das Feintuning erforderlich?

2.1 Wie bereitet man die Trainingsdaten vor?

3. Welche KI-Modelle können finegetuned werden?

3.1 Erklärung der Fine-Tuning-Methoden

4. Wann solltest du Fine-Tuning einsetzen?

5. Ansätze für das Fine-Tuning

Finn Hillebrandt

Verwandte KI-Begriffe

Was ist Fine-Tuning (bei LLMs)?

1. Vorteile von Fine-Tuning

2. Welche Schritte sind für das Feintuning erforderlich?

2.1 Wie bereitet man die Trainingsdaten vor?

3. Welche KI-Modelle können finegetuned werden?

3.1 Erklärung der Fine-Tuning-Methoden

4. Wann solltest du Fine-Tuning einsetzen?

5. Ansätze für das Fine-Tuning

Finn Hillebrandt

Verwandte KI-Begriffe