Wie gut du Prompts für ChatGPT, Claude oder Gemini schreiben kannst, hat einen enormen Einfluss auf den Output, den du bekommst.
Ich habe für dich recherchiert und mir Forschungspapiere und Studien angeschaut, um dir die 10 wichtigsten und bekanntesten Prompting-Techniken vorzustellen.
In diesem Artikel erfährst du, was genau sich hinter Begriffen wie „Zero-Shot Prompting“, „Chain-of-Thought“ oder „Self-Consistency“ verbirgt.
Ich zeige dir zudem anhand von Beispielen, wie du diese Techniken praktisch anwenden kannst.
1. Zero-Shot Prompting
Beim Zero-Shot Prompting gibst du dem KI-Sprachmodell eine Aufgabe, ohne vorher Beispiele zu zeigen, wie die Aufgabe gelöst werden soll. Das Modell muss also ohne Training auf deine Anweisung hin eine Lösung generieren.
Dadurch kannst du die Fähigkeiten des Sprachmodells austesten und dir einen schnellen Überblick verschaffen, für welche Aufgaben es geeignet ist. Allerdings sind die Ergebnisse oft noch nicht optimal und können durch Verbesserung des Prompts mittels anderer Techniken verbessert werden.
Hier ein Beispiel für einen Zero-Shot Prompt:
Schreibe ein Gedicht über einen Sonnenuntergang am Meer.
Das Gedicht soll folgende Wörter enthalten:
rötlich, schimmern, sanft, Wellen, Sand, Möwen.
2. Few-Shot Prompting
Few-Shot Prompting ist eine Technik, bei der du dem Sprachmodell ein oder mehrere Beispiele gibst, die zeigen, wie eine Aufgabe gelöst werden soll. Damit trainierst du das Modell quasi im Moment der Anfrage und gibst ihm eine Vorlage, an der es sich orientieren kann.
Diese Methode führt zu deutlich besseren und spezifischeren Ergebnissen als Zero-Shot Prompting. Sie erfordert aber auch mehr Vorbereitung, da du zuerst passende Beispiele erstellen musst. Experimentiere mit unterschiedlichen Few-Shot-Prompts, um die Qualität der generierten Texte immer weiter zu optimieren.
Hier siehst du, wie ein Few-Shot Prompt aussehen könnte:
Aufgabe: Ergänze die Begrüßungsformeln um einen kreativen Zusatz.
Beispiel 1:
Hallo! - Hallo, schön dich zu sehen!
Beispiel 2:
Guten Morgen! - Guten Morgen, ich wünsche dir einen fantastischen Start in den Tag!
Beispiel 3:
Hi! - Hi, wie geht's dir heute bei diesem wunderbaren Sonnenschein?
Jetzt du:
Herzlich willkommen! -
3. Chain-of-Thought (CoT) Prompting
Das Chain-of-Thought (CoT) Prompting ist eine leistungsstarke Methode, bei der du das KI-Modell aufforderst, seine Gedankengänge bei der Lösung einer Aufgabe zu erklären. Anstatt nur eine Antwort zu generieren, beschreibt das Modell Schritt für Schritt, wie es auf die Lösung gekommen ist.
Durch die Verbalisierung des Lösungsweges können Fehler in der Logik oder im Verständnis der Aufgabe aufgedeckt werden. CoT Prompting eignet sich besonders für komplexe Probleme, die mehrere Denkschritte erfordern. Die Ergebnisse sind oft besser als bei Standard-Prompts, und du kannst die Fähigkeiten des Sprachmodells besser nachvollziehen.
Hier ist ein Beispiel für einen CoT Prompt:
Frage: Ein Bauer hat 10 Kühe, 5 Schweine und 20 Hühner. Wie viele Beine haben alle Tiere zusammen? Schritt 1: Berechne die Anzahl der Beine für jede Tierart. - Kühe haben je 4 Beine. 10 Kühe x 4 Beine = 40 Beine - Schweine haben auch je 4 Beine. 5 Schweine x 4 Beine = 20 Beine - Hühner haben je 2 Beine. 20 Hühner x 2 Beine = 40 Beine Schritt 2: Addiere alle Beine zusammen. 40 + 20 + 40 = 100 Antwort: Alle Tiere haben zusammen 100 Beine.
Gib mir ein detaillierteres Beispiel für CoT Prompting. Auch wie der Prompt ohne CoT aussehen würde.
Hier ist ein detaillierteres Beispiel für einen Prompt mit und ohne Chain-of-Thought (CoT) Prompting:
Ohne CoT:
Frage: Ein Rechteck hat eine Länge von 12 cm und eine Breite von 5 cm. Ein Quadrat hat den gleichen Umfang wie das Rechteck. Wie groß ist die Fläche des Quadrats? Antwort:
Mit CoT:
Frage: Ein Rechteck hat eine Länge von 12 cm und eine Breite von 5 cm. Ein Quadrat hat den gleichen Umfang wie das Rechteck. Wie groß ist die Fläche des Quadrats? Schritt 1: Berechne den Umfang des Rechtecks. - Formel für den Umfang eines Rechtecks: U = 2 * (Länge + Breite) - Umfang des Rechtecks: U = 2 * (12 cm + 5 cm) = 2 * 17 cm = 34 cm Schritt 2: Bestimme die Seitenlänge des Quadrats. - Da das Quadrat den gleichen Umfang hat, gilt: Umfang des Quadrats = 34 cm - Formel für den Umfang eines Quadrats: U = 4 * Seitenlänge - 34 cm = 4 * Seitenlänge - Seitenlänge = 34 cm / 4 = 8,5 cm Schritt 3: Berechne die Fläche des Quadrats. - Formel für die Fläche eines Quadrats: A = Seitenlänge^2 - Fläche des Quadrats: A = (8,5 cm)^2 = 72,25 cm^2 Antwort: Die Fläche des Quadrats beträgt 72,25 cm^2.
4. Self-Consistency
Self-Consistency ist eine Technik, die auf dem CoT-Prompting aufbaut. Hierbei werden mehrere Prompts mit leicht variierten Formulierungen oder Beispielen an das Sprachmodell gesendet. Das Modell generiert für jeden Prompt eine Antwort und wählt dann die Antwort aus, die am häufigsten vorkommt.
Durch die Betrachtung mehrerer Lösungswege und die Auswahl der konsistentesten Antwort können Fehler reduziert und die Genauigkeit verbessert werden. Self-Consistency eignet sich besonders für Aufgaben, bei denen es mehrere mögliche Lösungen gibt oder die Formulierung des Prompts die Antwort beeinflussen kann.
Hier ist ein Beispiel für Self-Consistency:
Frage: Anna ist 3 Jahre älter als Ben und 2 Jahre jünger als Clara. Ben ist 5 Jahre jünger als Clara. Wie alt ist Anna? Prompt 1: Schritt 1: Finde das Alter von Clara relativ zu Ben. - Clara ist 5 Jahre älter als Ben. Schritt 2: Finde Annas Alter relativ zu Clara. - Anna ist 2 Jahre jünger als Clara. Schritt 3: Drücke Annas Alter in Bezug auf Bens Alter aus. - Wenn Clara 5 Jahre älter ist als Ben und Anna 2 Jahre jünger ist als Clara, dann ist Anna 3 Jahre älter als Ben. Prompt 2: Schritt 1: Definiere eine Variable für Bens Alter. - Sei x das Alter von Ben. Schritt 2: Drücke Claras Alter mit der Variable aus. - Clara ist 5 Jahre älter als Ben, also ist ihr Alter x + 5. Schritt 3: Drücke Annas Alter in Bezug auf die Variable aus. - Anna ist 2 Jahre jünger als Clara, also ist Annas Alter (x + 5) - 2 = x + 3. Schritt 4: Formuliere das Ergebnis. - Anna ist 3 Jahre älter als Ben. Prompt 3: Schritt 1: Notiere die gegebenen Informationen. - Anna ist 3 Jahre älter als Ben. - Anna ist 2 Jahre jünger als Clara. - Ben ist 5 Jahre jünger als Clara. Schritt 2: Kombiniere die Informationen. - Wenn Ben 5 Jahre jünger ist als Clara und Anna 2 Jahre jünger ist als Clara, dann ist Anna 3 Jahre älter als Ben. Konsistente Antwort: Anna ist 3 Jahre älter als Ben.
5. Automatic Chain-of-Thought (Auto-CoT)
Automatic Chain-of-Thought (Auto-CoT) ist eine Weiterentwicklung des Chain-of-Thought Prompting, bei der die Beispiele für das Few-Shot Prompting automatisch generiert werden. Anstatt manuell Beispiele zu erstellen, die den Lösungsweg demonstrieren, werden diese von einem Sprachmodell erzeugt.
Der Vorteil dieser Methode liegt darin, dass der Aufwand für die Erstellung hochwertiger Few-Shot Prompts reduziert wird. Die automatisch generierten Beispiele können verwendet werden, um das Modell anzuleiten und die Qualität der Ergebnisse zu verbessern, ohne dass eine manuelle Kuratierung erforderlich ist.
Hier ist ein Beispiel für Auto-CoT:
Frage: Laura hat eine Schachtel mit 12 roten, 8 blauen und 6 grünen Perlen.
Sie nimmt 3 rote, 2 blaue und 1 grüne Perle heraus.
Wie groß ist die Wahrscheinlichkeit, dass sie als Nächstes eine rote Perle zieht?
Automatisch generierte Beispiele:
Beispiel 1:
- Ursprünglich waren 10 rote und 5 blaue Murmeln in der Schachtel.
- 3 rote und 2 blaue Murmeln wurden entfernt.
- Es sind noch 7 rote und 3 blaue Murmeln übrig.
- Die Wahrscheinlichkeit, eine rote Murmel zu ziehen, ist 7/(7+3) = 7/10.
Beispiel 2:
- Es gab 15 rote, 10 gelbe und 5 grüne Bonbons in der Tüte.
- 5 rote und 3 gelbe Bonbons wurden gegessen.
- Jetzt sind noch 10 rote, 7 gelbe und 5 grüne Bonbons übrig.
- Die Wahrscheinlichkeit, ein rotes Bonbon zu wählen, ist 10/(10+7+5) = 10/22.
Schritt 1: Berechne die Anzahl der verbleibenden Perlen.
- Rote Perlen: 12 - 3 = 9
- Blaue Perlen: 8 - 2 = 6
- Grüne Perlen: 6 - 1 = 5
Schritt 2: Berechne die Gesamtzahl der verbleibenden Perlen.
- Gesamtzahl: 9 + 6 + 5 = 20
Schritt 3: Berechne die Wahrscheinlichkeit, eine rote Perle zu ziehen.
- Wahrscheinlichkeit = Anzahl der verbleibenden roten Perlen / Gesamtzahl der verbleibenden Perlen
- Wahrscheinlichkeit = 9 / 20 = 0,45
Antwort: Die Wahrscheinlichkeit, als Nächstes eine rote Perle zu ziehen, beträgt 0,45 oder 45 %.
6. Program-of-Thoughts (PoT)
Program-of-Thoughts (PoT) ist eine Prompting-Technik, die auf der Idee basiert, dass komplexe Probleme oft leichter zu lösen sind, wenn man sie in kleinere Teilschritte zerlegt. Bei PoT wird das Sprachmodell aufgefordert, ein Programm oder einen Algorithmus zu generieren, der das Problem schrittweise löst.
Im Gegensatz zu Chain-of-Thought, bei dem das Modell den Lösungsweg in natürlicher Sprache beschreibt, verwendet PoT eine strukturiertere, pseudocodeartige Darstellung. Jeder Schritt wird als eigenständige Funktion oder Methode behandelt, die einen spezifischen Teilaspekt des Problems löst. Durch die Kombination dieser Teilschritte wird eine vollständige Lösung erreicht.
Hier ist ein Beispiel für Program-of-Thoughts:
Frage: Eine Bäckerei verkauft Kuchen für je 12 Euro und Kekse für je 2 Euro.
Insgesamt werden 32 Artikel verkauft und der Gesamtumsatz beträgt 100 Euro.
Wie viele Kuchen und wie viele Kekse wurden verkauft?
Program-of-Thoughts:
function solve_bakery_problem(total_items, total_revenue, cake_price, cookie_price):
for num_cakes in range(total_items + 1):
num_cookies = total_items - num_cakes
revenue = num_cakes * cake_price + num_cookies * cookie_price
if revenue == total_revenue:
return num_cakes, num_cookies
return „No solution found.“
# Problem parameters
total_items = 32
total_revenue = 100
cake_price = 12
cookie_price = 2
# Call the function with the problem parameters
num_cakes, num_cookies = solve_bakery_problem(total_items, total_revenue, cake_price, cookie_price)
print(f"Es wurden {num_cakes} Kuchen und {num_cookies} Kekse verkauft.“)
Antwort: Es wurden 5 Kuchen und 27 Kekse verkauft.
7. Least-to-Most Prompting
Least-to-Most Prompting ist eine Technik, bei der ein komplexes Problem in mehrere einfachere Teilprobleme zerlegt wird. Das Sprachmodell wird zunächst aufgefordert, die Teilprobleme zu identifizieren und zu lösen, bevor es sich der Gesamtlösung widmet.
Der Name „Least-to-Most“ bezieht sich darauf, dass das Modell mit den einfachsten Teilproblemen beginnt und sich dann zu den komplexeren Aspekten vorarbeitet. Durch die schrittweise Lösung der Teilprobleme kann das Modell ein besseres Verständnis für das Gesamtproblem entwickeln und eine präzisere Antwort generieren.
Hier ist ein Beispiel für Least-to-Most Prompting:
Frage: Ein Zug fährt von Stadt A nach Stadt B und legt dabei eine Strecke von 320 km zurück. Die Geschwindigkeit des Zuges beträgt 80 km/h. In Stadt B legt der Zug eine Pause von 30 Minuten ein, bevor er mit einer Geschwindigkeit von 100 km/h zurück nach Stadt A fährt. Wie lange dauert die gesamte Reise einschließlich der Pause? Schritt 1: Zerlege das Problem in Teilprobleme. - Berechne die Fahrzeit von Stadt A nach Stadt B. - Berechne die Fahrzeit von Stadt B nach Stadt A. - Addiere die Pausenzeit zur gesamten Fahrzeit. Schritt 2: Löse die Teilprobleme. Teilproblem 1: Fahrzeit von Stadt A nach Stadt B - Strecke: 320 km, Geschwindigkeit: 80 km/h - Fahrzeit = Strecke / Geschwindigkeit - Fahrzeit = 320 km / 80 km/h = 4 Stunden Teilproblem 2: Fahrzeit von Stadt B nach Stadt A - Strecke: 320 km, Geschwindigkeit: 100 km/h - Fahrzeit = Strecke / Geschwindigkeit - Fahrzeit = 320 km / 100 km/h = 3,2 Stunden Teilproblem 3: Gesamte Fahrzeit einschließlich Pause - Fahrzeit von A nach B: 4 Stunden - Fahrzeit von B nach A: 3,2 Stunden - Pausenzeit: 30 Minuten = 0,5 Stunden - Gesamte Reisezeit = Fahrzeit von A nach B + Fahrzeit von B nach A + Pausenzeit - Gesamte Reisezeit = 4 Stunden + 3,2 Stunden + 0,5 Stunden = 7,7 Stunden Schritt 3: Formuliere die Antwort. Die gesamte Reise einschließlich der Pause dauert 7,7 Stunden oder 7 Stunden und 42 Minuten.
8. Chain-of-Symbol (CoS)
Chain-of-Symbol (CoS) ist eine Prompting-Technik, die darauf abzielt, die Fähigkeit von Sprachmodellen zur Verarbeitung und Generierung von symbolischen Informationen zu verbessern. Bei CoS werden Symbole oder Tokens verwendet, um Beziehungen, Hierarchien oder Abfolgen darzustellen, anstatt natürliche Sprache zu verwenden.
Durch die Verwendung von Symbolen kann das Modell komplexe Zusammenhänge und Strukturen besser erfassen und verarbeiten. Dies ist besonders nützlich bei Aufgaben, die eine präzise Darstellung von Informationen erfordern, wie mathematische Gleichungen, chemische Formeln oder Programmiercode.
Hier ist ein Beispiel für Chain-of-Symbol Prompting:
Frage: Gegeben ist die folgende chemische Reaktionsgleichung: 2 H2 + O2 -> 2 H2O Wandle diese Gleichung in eine symbolische Darstellung um und berechne die Masse von H2O, wenn 4 g H2 und 32 g O2 reagieren. Symbolische Darstellung: - Wasserstoff (H2): [H:2] - Sauerstoff (O2): [O:2] - Wasser (H2O): [H:2][O:1] Reaktionsgleichung: 2 [H:2] + [O:2] -> 2 [H:2][O:1] Gegebene Massen: - m([H:2]) = 4 g - m([O:2]) = 32 g Molare Massen: - M([H:2]) = 2 g/mol - M([O:2]) = 32 g/mol - M([H:2][O:1]) = 18 g/mol Stoffmenge der Reaktanten: - n([H:2]) = m([H:2]) / M([H:2]) = 4 g / 2 g/mol = 2 mol - n([O:2]) = m([O:2]) / M([O:2]) = 32 g / 32 g/mol = 1 mol Limitierendes Reagenz: - Verhältnis der Stoffmengen: n([H:2]) : n([O:2]) = 2 : 1 - Verglichen mit dem stöchiometrischen Verhältnis von 2 : 1 ist keiner der Stoffe im Überschuss. - Beide Reaktanten werden vollständig verbraucht. Stoffmenge des Produkts: - n([H:2][O:1]) = 2 * min(n([H:2]) / 2, n([O:2])) = 2 * min(2 mol / 2, 1 mol) = 2 mol Masse des Produkts: - m([H:2][O:1]) = n([H:2][O:1]) * M([H:2][O:1]) = 2 mol * 18 g/mol = 36 g Antwort: Bei der Reaktion von 4 g H2 und 32 g O2 entstehen 36 g H2O.
9. Structured Chain-of-Thought (SCoT)
Structured Chain-of-Thought (SCoT) ist eine Erweiterung des Chain-of-Thought Prompting, bei der die Antwort des Sprachmodells in einer strukturierten Form generiert wird. Anstatt den Gedankengang in Fließtext zu beschreiben, verwendet SCoT eine vorgegebene Struktur wie z.B. eine Liste, eine Tabelle oder ein Diagramm.
Durch die Vorgabe einer Struktur kann das Modell dazu gebracht werden, seine Antwort besser zu organisieren und wichtige Informationen hervorzuheben. Dies verbessert die Übersichtlichkeit und erleichtert es dem Nutzer, die Antwort zu verstehen und nachzuvollziehen.
Hier ist ein Beispiel für Structured Chain-of-Thought Prompting:
Frage: Ein Sportgeschäft verkauft Tennisbälle in Packungen zu je 4 Stück. Eine Packung kostet 8,99 Euro. Ein Tennisverein möchte für ein Turnier Tennisbälle im Wert von maximal 500 Euro kaufen. Wie viele Tennisbälle kann der Verein kaufen und wie viel Geld bleibt übrig? Antwort: Gegebene Informationen: - Tennisbälle werden in Packungen zu je 4 Stück verkauft. - Eine Packung kostet 8,99 Euro. - Das Budget des Tennisvereins beträgt 500 Euro. Lösungsschritte: 1. Berechne die maximale Anzahl der Packungen, die mit dem Budget gekauft werden können. * Maximale Anzahl der Packungen = Budget / Preis pro Packung * Maximale Anzahl der Packungen = 500 Euro / 8,99 Euro ≈ 55,62 * Da nur ganze Packungen gekauft werden können, wird das Ergebnis abgerundet: 55 Packungen 2. Berechne die Anzahl der Tennisbälle, die in 55 Packungen enthalten sind. * Tennisbälle pro Packung = 4 * Gesamtzahl der Tennisbälle = Anzahl der Packungen × Tennisbälle pro Packung * Gesamtzahl der Tennisbälle = 55 × 4 = 220 3. Berechne die tatsächlichen Kosten für 55 Packungen und das verbleibende Restbudget. * Tatsächliche Kosten = Anzahl der Packungen × Preis pro Packung * Tatsächliche Kosten = 55 × 8,99 Euro = 494,45 Euro * Restbudget = Budget - Tatsächliche Kosten * Restbudget = 500 Euro - 494,45 Euro = 5,55 Euro Ergebnis: - Der Tennisverein kann 220 Tennisbälle (55 Packungen) kaufen. - Es bleiben 5,55 Euro vom Budget übrig.
10. Plan-and-Solve (PS)
Plan-and-Solve (PS) ist eine Prompting-Technik, die sich auf die Lösung komplexer Probleme konzentriert, indem zunächst ein Plan erstellt und dann schrittweise ausgeführt wird. Bei PS wird das Sprachmodell aufgefordert, das Problem zu analysieren, einen Lösungsplan zu entwickeln und diesen Plan dann Schritt für Schritt umzusetzen.
Der Hauptvorteil von PS besteht darin, dass es dem Modell ermöglicht, eine strukturierte Herangehensweise an komplexe Probleme zu entwickeln. Durch die Erstellung eines Plans kann das Modell die wichtigsten Schritte identifizieren und sich auf die wesentlichen Aspekte des Problems konzentrieren.
Hier ist ein Beispiel für Plan-and-Solve Prompting:
Frage: Ein Wanderer legt an einem Tag eine Strecke von 18 km zurück. Er startet um 8:30 Uhr und legt in den ersten 2 Stunden eine Pause von 15 Minuten ein. Nach der Hälfte der Strecke macht er eine Mittagspause von 30 Minuten. Danach setzt er seinen Weg mit einer um 1,5 km/h höheren Geschwindigkeit als am Vormittag fort. Um 16:00 Uhr erreicht er sein Ziel. Wie schnell ist der Wanderer durchschnittlich gelaufen? Antwort: Plan: 1. Berechne die effektive Wanderzeit ohne Pausen. 2. Ermittle die Geschwindigkeit am Vormittag. 3. Berechne die Geschwindigkeit am Nachmittag. 4. Bestimme die durchschnittliche Geschwindigkeit für die gesamte Strecke. Schritt 1: Berechnung der effektiven Wanderzeit - Gesamtzeit: 8:30 Uhr bis 16:00 Uhr = 7 Stunden 30 Minuten - Pausen: 15 Minuten am Vormittag, 30 Minuten am Mittag - Effektive Wanderzeit = Gesamtzeit - Pausen - Effektive Wanderzeit = 7 Stunden 30 Minuten - 45 Minuten = 6 Stunden 45 Minuten = 6,75 Stunden Schritt 2: Ermittlung der Geschwindigkeit am Vormittag - Vormittagsstrecke: Halbe Gesamtstrecke = 18 km ÷ 2 = 9 km - Vormittagszeit: 2 Stunden - 15 Minuten Pause = 1,75 Stunden - Geschwindigkeit am Vormittag = Vormittagsstrecke ÷ Vormittagszeit - Geschwindigkeit am Vormittag = 9 km ÷ 1,75 Stunden ≈ 5,14 km/h Schritt 3: Berechnung der Geschwindigkeit am Nachmittag - Geschwindigkeit am Nachmittag = Geschwindigkeit am Vormittag + 1,5 km/h - Geschwindigkeit am Nachmittag = 5,14 km/h + 1,5 km/h = 6,64 km/h Schritt 4: Bestimmung der durchschnittlichen Geschwindigkeit - Durchschnittliche Geschwindigkeit = Gesamtstrecke ÷ Effektive Wanderzeit - Durchschnittliche Geschwindigkeit = 18 km ÷ 6,75 Stunden ≈ 2,67 km/h Der Wanderer ist durchschnittlich mit einer Geschwindigkeit von etwa 2,67 km/h gelaufen.
Quellen
- Schulhoff, S., Ilie, M., Balepur, N., Kahadze, K., Liu, A., Si, C., … & Resnik, P. (2024). The Prompt Report: A Systematic Survey of Prompting Techniques.
- Vatsal, S., & Dubey, H. (2024). A Survey of Prompt Engineering Methods in Large Language Models for Different NLP Tasks.