Midjourney Cheat-Sheet für 0 €

Dein ultimativer Spickzettel für 0 €

Midjourney Cheat-Sheet: 160+ Befehle für
verlässlich großartige KI-Bilder

In unserem „Midjourney Cheat-Sheet“ findest du 160+ Befehle, um genau die Art von KI-Bildern zu generieren, die du möchtest und verlässlich großartige Resultate zu erzielen.

Versteht Midjourney deutsch? Klare Antwort: Jein!

Midjourney auf Deutsch nutzen
Mit * gekennzeichnete Links sind Affiliate-Links. Kommt über solche Links ein Kauf zustande, bekommen wir mit eine Provision. Für dich entstehen dabei keine Mehrkosten.
Foto des Autors

Nele Hillebrandt

Zuletzt aktualisiert:

Midjourney ist ein US-amerikanisches Tool, bei dem die komplette Bedienoberfläche (inklusive Anleitung und Hilfe) auf Englisch ist.

Trotzdem sieht man auf Discord und in Prompt-Sammlungen auch von Zeit zu Zeit deutsche Prompts (oder Prompts in anderen Sprachen, wie Spanisch, Italienisch oder Russisch).

Schnell stellt sich da die Frage, ob man bei Midjourney einfach deutsche Prompts eingeben kann und ähnliche gute Ergebnisse erhält.

Ich habe es für euch ausführlich getestet!

Dazu habe ich Midjourney viele verschiedene Prompts ausführen lassen. Ich habe dabei versucht, die Prompts so genau wie möglich zu übersetzen und mir angeschaut, was passiert, wenn man von der Wortwahl etwas abweicht.

Damit die Ergebnisse möglichst vergleichbar sind, habe ich immer dieselbe Seed-Nummer genutzt (Bilder mit derselben Seed-Nummer werden ähnlich in Komposition, Farbe und Detail erstellt).

1. Prompts, die nur aus Nomen bestehen

Starten wir mit einem sehr simplen Prompt, der lediglich aus einem Wort (einem Nomen) besteht:

horse vs. Pferd

Prompt 1: horse –ar 3:4 –seed 9876789
Prompt 2: pferd –ar 3:4 –seed 9876789

Anhand der Bilder sieht man, dass für beide Wörter ähnliche Trainingsdaten hinterlegt sein dürfte: eins der Bilder ist sogar fast identisch (im ersten Set das zweite Bild, im zweiten Set das dritte Bild).

Ein-Wort-Prompts sind für Midjourney toll – für den Nutzer aber nur begrenzt nützlich. Gehen wir also einen Schritt weiter und versuchen wir es mal mit mehreren Wörtern. Um es dem Tool leicht zu machen, beschränken wir uns weiterhin auf Nomen:

moon, sun, stars vs. Mond, Sonne, Sterne

Prompt 1: moon, sun, stars –ar 3:4 –seed 9876789
Prompt 2: mond, sonne, sterne –ar 3:4 –seed 9876789

Auch bei diesem Bild erkennen wir deutliche Ähnlichkeiten und der Schluss liegt nahe, dass es ähnliche Trainingsdaten für die Wörter gibt – in beiden Sprachen.

Ich persönlich finde, dass Set 1 abstraktere Details beinhaltet und mir gefällt dieses Set darum etwas besser – um dem auf den Grund zu gehen, habe ich ein einzelnes Wort ausgetauscht und mir diese Sets angeschaut:

moon, sun, night vs. Mond, Sonne, Nacht

Prompt 1: moon, sun, night –ar 3:4 –seed 9876789
Prompt 2: mond, sonne, Nacht –ar 3:4 –seed 9876789

Hier werden die Unterschiede noch einmal deutlicher und wir erkennen keine besonders großen Ähnlichkeiten mehr zwischen den Bildern. Dennoch enthalten alle Bilder Elemente aus unserem Prompt.

Das Ergebnis ist also unterschiedlich, aber beide Ergebnisse sind passend zu unserem Prompt. Was einem eher gefällt, ist Geschmacksache und in solchen Fällen kann es sich lohnen, mit Prompts in beiden Sprachen zu experimentieren, um zum gewünschten Ergebnisse zu kommen.

2. Komplexere Prompts

Prompts, die ausschließlich aus Nomen bestehen, generieren bei Midjourney in der Regel coole Bilder, wenn man etwas Bestimmtes möchte, dann führen sie aber eher selten zum Ergebnis. Probieren wir also einmal aus, was für Ergebnisse Midjourney liefert, wenn wir etwas komplexere Prompts eingeben:

castle in the sky vs. Schloss im Himmel

Prompt 1: castle in the sky –ar 3:4 –seed 9876789
Prompt 2: Schloss im Himmel –ar 3:4 –seed 9876789

Was wir hier sehen, ist spannend: obwohl man meinen mag, dass beide Prompts das gleiche Ergebnis liefern sollten, sehen wir doch einen Unterschied: Während das Schloss im deutschen Prompt einfach auf einem hohen Fels zu stehen scheint, fliegt unser englisches castle in zwei (eventuell sogar drei, beim dritten sehen wir das Ende des Felsens nach unten nicht) der Bilder in der Luft.

Außerdem ist auch die Optik der Schlösser etwas unterschiedlich: beim Castle sind die Dächer immer rot, beim Schloss haben wir bei 3 von 4 Bildern blaue Dächer – hier liegt nahe, dass die Trainingsdaten das bekannte Schloss Neuschwanstein beinhalten, das blaue Dächer hat.

Natürlich sind dies nur Ausschnitte, die nicht repräsentativ ist (ich will damit nicht sagen, dass der Begriff castle immer nur Schlösser mit roten Dächern generiert). Aber es lässt die Vermutung zu, dass die Trainingsdaten in unterschiedlichen Sprachen auch lokale Bezüge haben – was Sinn ergibt, da solche Merkmale für Bilder in bestimmten Kontexten natürlich wichtig sind.

Da ich aber gerne ein Bild von einem schwebenden Schloss im Himmel hätte, habe ich den Prompt noch einmal angepasst:

floating castle vs. schwebendes Schloss

Prompt 1: floating castle –ar 3:4 –seed 9876789
Prompt 2: schwebendes Schloss –ar 3:4 –seed 9876789

Und ja, hier sieht man dann sehr deutlich, dass Nomen zwar fein sind, Adjektive aber schon eine andere Herausforderung darstellen. Keines der deutschen Schlösser schwebt wirklich, aber alle vier englischen castle. Es liefert auch keine besseren Ergebnisse wenn man schwebend durch fliegend ersetzt.

Das ist natürlich spannend und bedarf eines weiteren Tests, bei dem wir die Schwieirgkeit noch einmal erhöhen und eine bestimmte Stimmung mit dem Bild erzeugen wollen:

burning woman, strong, dark, fierce vs. brennende Frau, stark, dunkel, erbittert

Prompt 1: burning woman, strong, dark, fierce –ar 3:4 –seed 9876789
Prompt 2: brennende Frau, stark, dunkel, erbittert –ar 3:4 –seed 9876789

Ok.

Die deutsche Frau ist zu sehen, Feuer sucht man aber vergeblich. Zwei der Frauen haben rote Haare – vielleicht sollen sie das Feuer symbolisieren? Die Stimmung stimmt zwar, aber der Vergleich zur englischen woman on fire fällt doch eher ernüchternd aus. Denn die ist literally on fire??

Statt Adjektiven kann man aber natürlich auch mit Nomen arbeiten und das ganze anders umschreiben, mal sehen, ob das funktioniert:

woman on fire, strong, dark, fierce vs. frau in feuer, stark, dunkel, erbittert

Prompt 1: woman on fire, strong, dark, fierce –ar 3:4 –seed 9876789
Prompt 2: frau in feuer, stark, dunkel, erbittert –ar 3:4 –seed 9876789

Das ist doch schon mal um einiges besser. Im Englischen wirkt unserer woman on fire meiner Meinung nach stärker und kämpferischer, aber unsere deutsche Frau in Feuer brennt zumindest dieses Mal.

Ich habe dann noch getestet, wie es sich auswirkt, einzelne Wörter im deutschen Prompt auszutauschen:

frau aus feuer vs. frau in flammen

Prompt 1: frau aus feuer, stark, dunkel, erbittert –ar 3:4 –seed 9876789
Prompt 2: frau in flammen, stark, dunkel, erbittert –ar 3:4 –seed 9876789

Und das Ergebnis ist sehr, sehr ähnlich zum ursprünglichen Prompt (Frau in Feuer).

Es scheint also, als würde Midjourney zu deutschen Nomen recht viele Daten haben – zu deutschen Adjektiven aber eher weniger. Im Englischen liefern Nomen und Adjektive hingegen oft ähnlich gute Ergebnisse.

3. Adjektive in Prompts

Diese These habe ich natürlich im Folgenden noch ein wenig weiter geteste:

yellow dog vs. gelber Hund

Prompt 1: yellow dog –ar 3:4 –seed 9876789
Prompt 2: gelber Hund –ar 3:4 –seed 9876789

Der gelbe Hund ist dem yellow dog seeehr ähnlich – auch hier scheinen ähnliche oder gleiche Trainingsdaten zugrunde zu liegen. Farben sind bei Bildern natürlich super wichtig, von daher ist es nicht verwunderlich, dass zu Farben viele Trainingdaten hinterlegt wurden (ähnlich wie bei den Nomen).

Schauen wir uns nun mal an, wie es mit Gefühlszuständen aussieht:

sad woman vs. traurige frau

Prompt 1: sad woman –ar 3:4 –seed 9876789
Prompt 2: traurige frau –ar 3:4 –seed 9876789

Auch hier haben wir ziemlich ähnliche Ergbnisse, die alle gut dem Prompt entsprechen.

Ich würde aber gerne eine Frau haben, die weint und bei der man Tränen sieht, probieren wir also das mal aus:

crying woman vs. weinende Frau

Prompt 1: crying woman –ar 3:4 –seed 9876789
Prompt 2: weinende Frau –ar 3:4 –seed 9876789

Das Ergebnis ist wieder sehr spannend, denn während unsere englische woman sehr ausdrucksstarke Tränen weint, ist bei der deutschen Frau keine Spur von Tränen zu sehen – dafür enthalten aber alle vier Bilder Elemente von Wein (-trauben-Pflanzen). Hier scheint Midjourney also das Weinen und den Wein zu verwechseln.

Ich möchte aber nun mal eine weinende Frau und probiere also, ob ich das mit einem deutschen Prompt anders gelöst bekomme:

woman tears vs. frau tränen

Prompt 1: woman tears –ar 3:4 –seed 9876789
Prompt 2: frau tränen –ar 3:4 –seed 9876789

Die englische woman tears ist der crying woman extrem ähnlich. Die deutsche Frau Tränen hat hingegen keine Ähnlichkeit zur weinenden Frau – aber Tränen sehe ich hier nicht. Die Bilder sind dunkel und von der Stimmung gedrückt, aber irgendwie treffen sie nicht ganz das, was ich erwartet hätte.

Probieren wir einmal, ob es mit anderen Gefühlen anders aussieht:

happy woman vs. fröhliche Frau

Prompt 1: happy woman –ar 3:4 –seed 9876789
Prompt 2: fröhliche frau –ar 3:4 –seed 9876789

Öhm ja. Manch einer würde sagen, der hat mich gut getroffen beim deutschen Prompt – anscheinend sehe ich auch wenn ich fröhlich bin mitunter sehr ernst aus. Generell würde man bei einem solchen Prompt aber eher das erwarten, was uns Midjourney mit dem englischen Prompt liefert.

Schauen wir auch hier noch mal, ob das Ergebnis besser wird, wenn wir den Prompt minimal anpassen:

freudige frau vs. frau lachen (/frau lacht)

Prompt 1: freudige frau –ar 3:4 –seed 9876789
Prompt 2: frau lachen –ar 3:4 –seed 9876789

Das Ergebnis ist ähnlich ernüchternd wie bei der weinende Frau / Frau mit Tränen. Egal, was ich eingebe, die Frau möchte anscheinend einfach nicht lachen. Hier ist es deutlich einfacher und schneller Erfolg bringend, einen englischen Prompt einzugeben.

4. Food-Fotografie-Prompts

Ein wahrscheinlich sehr großes Anwendungsfeld für KI-Bilder sind Rezepte: Food-Fotografie ist aufwendig, teuer und dauert lange. Wie schön wäre es da, wenn man diese Bilder einfach am PC generieren könnte?

Mittlerweile ist das Realität und die Bilder werden auch (natürlich mit etwas Fingerspitzengefühl und Training) extrem gut. Aber auch mit deutschen Prompts?

Ich habe es natürlich für euch getestet:

potatoes with salmon and dillweed vs. kartoffeln mit lachs und dill

Prompt 1: potatoes with salmon and dillweed –ar 3:4 –seed 9876789
Prompt 2: kartoffeln mit lachs und dill –ar 3:4 –seed 9876789

Die Bilder sind schon deutlich unterschiedlich und was mir besonders auffällt: Während bei den englischen die potatoe überwiegt oder zumindest auf jedem Bild zu sehen ist, haben wir bei dem deutschen Gericht einen ziemlich dominanten Lachs. Kartoffeln sucht man zum Teil vergeblich.

Probieren wir ein weiteres Gericht, dieses mal einen Klassiker: Nudeln.

farfalle with mushrooms, cream and basil vs. farfalle mit pilzen, sahne und Basilikum

Prompt 1: farfalle with mushrooms, cream and basil –ar 3:4 –seed 9876789
Prompt 2: farfalle mit pilzen, sahne und Basilikum –ar 3:4 –seed 9876789

Das Ergebnis finde ich super spannend: Beim englischen Prompt werden die farfalle für unseren Zusammenhang korrekt als Nudeln dargestellt.

Beim deutschen Prompt hingegen werden daraus Schmetterlinge und sehr fantastische Gebilde. Die Schmetterlinge kann man sich da noch leicht erklären: Farfalle heißt auf italienisch Schmetterling. Beim deutschen Prompt greift Midjourney also nicht auf die gleichen Trainingsdaten zu diesem Begriff zu, wie beim englischen.

Das heißt wiederum, dass Midjourney für die Interpretation der Prompts durchaus den restlichen Kontext einbezieht: Bei einem Prompt in englischer Sprache werden farfalle als Nudeln dargestellt – bei einem Prompt auf deutsch wird auf die italienische Bedeutung (Schmetterling) zurückgegriffen.

5. Fazit

Midjourney übersetzt deutsche Prompts (genauso wie die meisten anderen KI-Bildgeneratoren) nicht ins englische, um dann ein Bild daraus zu generieren, sondern hat für jede Sprache eigene Trainingsdaten, die jeweils angewandt werden. Im Grund kann man sagen, dass Midjourney gar nicht zwischen Sprachen differenziert, sondern einfach für jede Zusammensetzung von Buchstaben spezifische hinterlegte Dateien hat.

Dabei können aber für einen Begriffe mehrere Sets an Daten hinterlegt sein, die jeweils in bestimmten Kontexten abgerufen werden (Beispiel Farfalle).

Für englische Wörter gibt es in der Regel deutlich mehr hinterlegte Dateien, da hier der Fokus der Entwickler*innen liegt. Für Wörter aus anderen Sprachen gibt es in der Regel weniger Dateien, wobei sich grob sagen lässt, dass viel genutzte Nomen (Pferd, Wald, Mann, Frau, Sonne etc.) und Worte, die man oft zur Beschreibung von Bildern nutzt (Farben, Perspektiven, Stile) oft mehr Daten hinterlegt haben . Hier werden die Bilder also ähnlich gut egal welche Sprache man verwendet.

Große Schwierigkeiten hat Midjourney generell mit Bezugswörtern: auf, unter, neben, an, vor, hinter etc. Dies ist schon auf Englisch eine Herausforderung, auf Deutsch merkt man hier noch einmal schneller, wie man an die Grenzen stößt.

Und auch Bilder von Essen gehen mit deutschen Prompts in eher merkwürdige Richtungen.

Finn Hillebrandt

Über den Autor

Finn Hillebrandt ist der Gründer von Gradually AI (ehemals Blogmojo) und Blogmojo.ai, SEO-Experte mit 14+ Jahren Erfahrung und KI-Nerd.

Er hilft Online-Unternehmern, mehr Kunden über Google zu bekommen und ihre Prozesse mit KI-Tools zu vereinfachen und zu automatisieren.

Finn teilt sein Wissen hier auf dem Blog in 170+ Fachartikeln zu KI-Tools, WordPress und SEO sowie über seinen ChatGPT-Kurs und den SEO-Kurs New Level SEO mit zusammengenommen 600+ Teilnehmern.

Erfahre mehr über Finn und das Team, folge Finn bei Instagram und bei Threads, tritt seiner Facebook-Gruppe zu ChatGPT, OpenAI & KI-Tools bei oder mache es wie 17.500+ andere und abonniere seinen KI-Newsletter mit Tipps, News und Angeboten rund um KI-Tools und Online-Business.

Midjourney Cheat-Sheet für 0 €

Midjourney Cheat-Sheet: 160+ Befehle für verlässlich großartige Bilder

Midjourney ist der aktuell beste KI-Bildgenerator auf dem Markt.

Aber der Einstieg kann schwierig sein. 😫

In unserem Cheat-Sheet haben wir dir deshalb 160+ Befehle zusammengestellt, um genau die Art von Bildern zu generieren, die du möchtest und verlässlich gute Resultate zu erzielen. 💪

👉 Ja, zeig mir das Cheat-Sheet!