Frequency Penalty

Frequency Penalty ist ein Parameter, der die Wahrscheinlichkeit reduziert, dass ein Token wiederholt wird, basierend darauf, wie oft es bereits im generierten Text vorkam. Xu et al. (2024) zeigen, dass je häufiger ein Token erscheint, desto stärker wird es bestraft, wobei diese Methode allerdings ihre Grenzen hat.

1. Was ist Frequency Penalty?

Frequency Penalty wendet eine Strafe auf Tokens an, die bereits im generierten Text erschienen sind. OpenAI Research (2023) erklärt, dass die Strafe mit der Häufigkeit des Auftretens skaliert - ein Token, das dreimal vorkam, erhält eine dreimal höhere Strafe als ein Token, das nur einmal vorkam.

Einfach erklärt: Stell dir vor, die KI hat eine "Strafpunkte-Liste". Jedes Mal, wenn sie ein Wort verwendet, bekommt dieses Wort Strafpunkte. Bei der nächsten Wortauswahl werden Wörter mit vielen Strafpunkten unwahrscheinlicher gewählt.

Frequency Penalty Live Demo

Experimentiere mit verschiedenen Frequency Penalty-Werten

Aktueller Wert: 0-2 - 2

Effekt bei 0:

Keine Penalty für Wiederholungen

Beispiel-Ausgabe:

Klicke auf "Generieren" um eine Beispiel-Ausgabe mit dem aktuellen Parameter-Wert zu sehen

1.1 Mathematische Grundlage

Die Formel für Frequency Penalty lautet:

logit_neu = logit_original - (frequency_penalty × anzahl_vorkommen)

Dabei gilt:

logit_neu: Angepasster Logit-Wert des Tokens
logit_original: Ursprünglicher Logit-Wert vom Modell
frequency_penalty: Eingestellter Penalty-Wert (z.B. 0.5)
anzahl_vorkommen: Wie oft das Token bereits vorkam

2. Wie funktioniert Frequency Penalty?

2.1 Beispielberechnung

Nehmen wir an, die KI generiert einen Text über Katzen:

Token	Vorkommen	Original Logit	Penalty (0.5)	Neuer Logit
"Katze"	3×	2.0	3 × 0.5 = 1.5	0.5
"Tier"	1×	1.8	1 × 0.5 = 0.5	1.3
"Haustier"	0×	1.5	0 × 0.5 = 0	1.5

In diesem Beispiel würde "Haustier" jetzt wahrscheinlicher gewählt werden als "Katze", obwohl "Katze" ursprünglich einen höheren Logit hatte.

3. Anwendungsbereiche

3.1 Positive Werte (0.0 bis 2.0)

Positive Frequency Penalty reduziert Wiederholungen und eignet sich für:

Kreatives Schreiben: Vermeidet repetitive Phrasen und fördert Wortvielfalt
Artikel und Essays: Verhindert übermäßige Wiederholung von Schlüsselwörtern
Dialoge: Macht Konversationen natürlicher und weniger redundant
Produktbeschreibungen: Sorgt für abwechslungsreiche Formulierungen

3.2 Negative Werte (-2.0 bis 0.0)

Negative Frequency Penalty fördert Wiederholungen und kann nützlich sein für:

Technische Dokumentation: Konsistente Verwendung von Fachbegriffen
Markensprache: Wiederholung wichtiger Markenbegriffe
Lernmaterialien: Verstärkung von Schlüsselkonzepten
SEO-Texte: Häufigere Verwendung von Keywords (mit Vorsicht!)

4. Praktische Code-Beispiele

4.1 OpenAI GPT-4

from openai import OpenAI

client = OpenAI()

# Moderate Frequency Penalty für natürliche Texte
response = client.chat.completions.create(
    model="gpt-4",
    messages=[{
        "role": "user",
        "content": "Schreibe einen Blogbeitrag über gesunde Ernährung"
    }],
    frequency_penalty=0.6,  # Reduziert Wiederholungen moderat
    temperature=0.8
)

# Hohe Frequency Penalty für sehr vielfältige Texte
creative_response = client.chat.completions.create(
    model="gpt-4",
    messages=[{
        "role": "user",
        "content": "Generiere 10 kreative Slogans für ein Café"
    }],
    frequency_penalty=1.5,  # Starke Reduktion von Wiederholungen
    temperature=0.9
)

# Negative Frequency Penalty für konsistente Terminologie
technical_response = client.chat.completions.create(
    model="gpt-4",
    messages=[{
        "role": "user",
        "content": "Erkläre die Funktionsweise einer REST API"
    }],
    frequency_penalty=-0.3,  # Fördert Wiederholung von Fachbegriffen
    temperature=0.7
)

4.2 Vergleich: Mit und ohne Frequency Penalty

# Test der Auswirkungen von Frequency Penalty
prompt = "Erzähle eine Geschichte über einen Wald"

# Ohne Frequency Penalty
without_penalty = client.chat.completions.create(
    model="gpt-4",
    messages=[{"role": "user", "content": prompt}],
    frequency_penalty=0.0,
    max_tokens=150
)

# Mit hoher Frequency Penalty
with_penalty = client.chat.completions.create(
    model="gpt-4",
    messages=[{"role": "user", "content": prompt}],
    frequency_penalty=1.2,
    max_tokens=150
)

# Analysiere Wortwiederholungen
def count_word_frequency(text):
    words = text.lower().split()
    frequency = {}
    for word in words:
        frequency[word] = frequency.get(word, 0) + 1
    return frequency

freq_without = count_word_frequency(without_penalty.choices[0].message.content)
freq_with = count_word_frequency(with_penalty.choices[0].message.content)

print("Top wiederholte Wörter OHNE Penalty:")
for word, count in sorted(freq_without.items(), key=lambda x: x[1], reverse=True)[:5]:
    print(f"{word}: {count}x")

print("
Top wiederholte Wörter MIT Penalty:")
for word, count in sorted(freq_with.items(), key=lambda x: x[1], reverse=True)[:5]:
    print(f"{word}: {count}x")

5. Frequency Penalty vs. Presence Penalty

Xu et al. (2024) betonen in ihrer Arbeit über LZ Penalty, dass es wichtig ist, den Unterschied zwischen Frequency und Presence Penalty zu verstehen, da beide Standard-Methoden ihre Schwächen haben:

Aspekt	Frequency Penalty	Presence Penalty
Berechnung	Multipliziert mit Anzahl Vorkommen	Feste Strafe bei erstem Vorkommen
Skalierung	Linear mit Häufigkeit	Binär (0 oder Penalty-Wert)
Effekt	Stärker bei häufigen Tokens	Gleich für alle verwendeten Tokens
Beste für	Vermeidung von Redundanz	Themenvielfalt fördern

5.1 Beispiel: Kombination beider Penalties

# Optimale Kombination für vielfältige, aber kohärente Texte
response = client.chat.completions.create(
    model="gpt-4",
    messages=[{
        "role": "user",
        "content": "Schreibe eine Produktbeschreibung für ein Smartphone"
    }],
    frequency_penalty=0.7,  # Reduziert starke Wiederholungen
    presence_penalty=0.3,   # Fördert leichte Themenvielfalt
    temperature=0.8
)

# Für kreatives Brainstorming
creative = client.chat.completions.create(
    model="gpt-4",
    messages=[{
        "role": "user",
        "content": "Generiere innovative Geschäftsideen"
    }],
    frequency_penalty=1.0,  # Starke Variation
    presence_penalty=0.6,   # Neue Themen fördern
    temperature=0.9
)

6. Optimale Werte finden

6.1 Allgemeine Richtlinien

Texttyp	Frequency Penalty	Begründung
Nachrichtenartikel	0.3 - 0.5	Leichte Reduktion von Wiederholungen
Kreative Geschichten	0.8 - 1.2	Hohe Wortvielfalt erwünscht
Technische Docs	-0.2 - 0.2	Konsistente Terminologie wichtig
Marketing-Copy	0.5 - 0.8	Balance zwischen Vielfalt und Fokus
Chatbot-Antworten	0.4 - 0.6	Natürliche, nicht-repetitive Sprache

6.2 Test-Framework für optimale Werte

def test_frequency_penalty_values(prompt, penalty_range, samples=3):
    """
    Testet verschiedene Frequency Penalty Werte
    """
    results = []
    
    for penalty in penalty_range:
        outputs = []
        metrics = {
            'penalty': penalty,
            'avg_unique_words': 0,
            'avg_repetition_rate': 0,
            'readability': 0
        }
        
        for _ in range(samples):
            response = client.chat.completions.create(
                model="gpt-4",
                messages=[{"role": "user", "content": prompt}],
                frequency_penalty=penalty,
                max_tokens=200
            )
            
            text = response.choices[0].message.content
            outputs.append(text)
            
            # Analysiere Metriken
            words = text.lower().split()
            unique_words = len(set(words))
            total_words = len(words)
            
            metrics['avg_unique_words'] += unique_words / samples
            metrics['avg_repetition_rate'] += (1 - unique_words/total_words) / samples
        
        metrics['samples'] = outputs
        results.append(metrics)
    
    return results

# Teste verschiedene Werte
penalty_values = [-0.5, 0.0, 0.3, 0.6, 0.9, 1.2, 1.5]
results = test_frequency_penalty_values(
    "Beschreibe die Vorteile von Remote-Arbeit",
    penalty_values
)

# Visualisiere Ergebnisse
for result in results:
    print(f"Penalty: {result['penalty']}")
    print(f"Durchschn. einzigartige Wörter: {result['avg_unique_words']:.1f}")
    print(f"Wiederholungsrate: {result['avg_repetition_rate']:.2%}")
    print("-" * 40)

7. Praktische Anwendungstipps

7.1 Do's and Don'ts

Do's

Beginne mit moderaten Werten (0.3-0.6)
Teste iterativ mit deinem spezifischen Use Case
Kombiniere mit Presence Penalty für feinere Kontrolle
Behalte die Lesbarkeit im Auge
Dokumentiere erfolgreiche Werte für verschiedene Aufgaben

Don'ts

Verwende keine extremen Werte (über 1.5) ohne Tests
Ignoriere nicht den Kontext deiner Anwendung
Setze Frequency Penalty nicht als einzigen Parameter ein
Verwende keine hohen negativen Werte für öffentliche Texte

7.2 Spezialfälle

Listicles und Aufzählungen

# Für Listicles: Mittlere Frequency Penalty
response = client.chat.completions.create(
    model="gpt-4",
    messages=[{
        "role": "user",
        "content": "Liste 10 Tipps für besseren Schlaf auf"
    }],
    frequency_penalty=0.8,  # Vermeidet "Schlaf" in jedem Punkt
    presence_penalty=0.4,   # Fördert verschiedene Aspekte
)

Längere Texte

# Für längere Texte: Vorsichtig mit hohen Werten
response = client.chat.completions.create(
    model="gpt-4",
    messages=[{
        "role": "user",
        "content": "Schreibe ein 1000-Wort Essay über Klimawandel"
    }],
    frequency_penalty=0.4,  # Niedriger für längere Texte
    max_tokens=1500
)
# Zu hohe Werte können bei langen Texten zu inkohärenten Ergebnissen führen

8. API-Verfügbarkeit

Anbieter	Verfügbar	Bereich	Standard	Hinweise
OpenAI	✅	-2.0 bis 2.0	0.0	Vollständig unterstützt
Anthropic Claude	❌	-	-	Nutzt andere Ansätze
Google Gemini	⚡	Variiert	0.0	Ähnliche Funktionalität
Cohere	✅	0.0 bis 1.0	0.0	Als "frequency_penalty"
Azure OpenAI	✅	-2.0 bis 2.0	0.0	Identisch mit OpenAI

9. Fortgeschrittene Techniken

9.1 Dynamische Anpassung

class DynamicPenaltyManager:
    """
    Passt Frequency Penalty basierend auf der bisherigen Ausgabe an
    """
    def __init__(self, base_penalty=0.5):
        self.base_penalty = base_penalty
        self.history = []
    
    def calculate_penalty(self, generated_text):
        """
        Berechnet optimale Penalty basierend auf Textanalyse
        """
        words = generated_text.lower().split()
        unique_ratio = len(set(words)) / len(words) if words else 1
        
        # Wenn zu viele Wiederholungen, erhöhe Penalty
        if unique_ratio < 0.7:
            return min(self.base_penalty + 0.3, 2.0)
        # Wenn zu wenig Kohärenz, reduziere Penalty
        elif unique_ratio > 0.95:
            return max(self.base_penalty - 0.2, -0.5)
        else:
            return self.base_penalty
    
    def generate_adaptive(self, prompt, client):
        """
        Generiert Text mit adaptiver Frequency Penalty
        """
        penalty = self.base_penalty
        
        if self.history:
            # Analysiere vorherige Generierungen
            recent_text = " ".join(self.history[-3:])
            penalty = self.calculate_penalty(recent_text)
        
        response = client.chat.completions.create(
            model="gpt-4",
            messages=[{"role": "user", "content": prompt}],
            frequency_penalty=penalty
        )
        
        generated = response.choices[0].message.content
        self.history.append(generated)
        
        return generated, penalty

# Verwendung
manager = DynamicPenaltyManager(base_penalty=0.6)
for i in range(5):
    text, used_penalty = manager.generate_adaptive(
        f"Schreibe Absatz {i+1} einer Geschichte",
        client
    )
    print(f"Penalty verwendet: {used_penalty}")