Midjourney war lange Zeit der Platzhirsch unter den KI-Bildgeneratoren. Dann kam FLUX.1 von der deutschen Entwicklerschmiede Black Forest Labs.
Und plötzlich wurde es richtig interessant.
In diesem Artikel habe ich mir beide Tools im Detail angeschaut. Welche Modelle gibt es? Wie gut sind sie wirklich? Und wann lohnt sich welches Tool?
- FLUX.1 [pro] ist bei Prompttreue und Textdarstellung besser als Midjourney v6 - generiert präzisere Bilder nach Anweisung
- Midjourney v6 überzeugt bei Ästhetik und emotionaler Tiefe - hat die charakteristische 'Midjourney-Optik' die viele lieben
- FLUX ist Open Source und lokal installierbar, Midjourney bleibt Discord-only - FLUX [schnell] sogar kostenlos nutzbar
1. Was ist FLUX?
FLUX ist eine KI, die Bilder anhand von eingegebenen Prompts generiert, also das Gleiche macht wie Midjourney. Entwickelt wurde FLUX von einem Team, das aus dem Bereich KI kommt und zum Beispiel an der Entwicklung von Stable Diffusion Modellen beteiligt war.
Falls dich die technischen Hintergründe interessieren. Die meisten Bildgeneratoren basieren momentan auf Stable Diffusion und binden dann zusätzlich Prozesse wie z. B. RLHF (Reinforcement-Learning from Human Feedback) ein.
FLUX hingegen nutzt Flow Matching, was in dem Bereich neu ist, aber recht vielversprechend aussieht. Ohne jetzt genauer darauf einzugehen, ist daran einfach spannend, dass FLUX also tatsächlich etwas anders „arbeitet“ als zum Beispiel Midjourney.
1.1 Modelle von FLUX.1
Black Forrest Labs hat von FLUX.1 direkt drei Modelle veröffentlicht:
- FLUX.1 [pro]
- FLUX.1 [dev]
- FLUX.1 [schnell]
Die Modelle unterscheiden sich dahin gehend, wie schnell die Bilder generiert werden, wie viele Details sie am Ende haben und wie „prompttreu“ sie sind.
Pro ist das Modell, das die besten Bilder liefert und unsere Empfehlung, wenn du gute Resultate haben möchtest. Für Spielereien, bei denen du etliche Bilder generieren willst und die Qualität erst mal nicht so wichtig ist, kannst du FLUX.1 [schnell] nutzen.

2. Wie gut ist FLUX.1?
Wir haben beide Tools für diesen Artikel ausführlich getestet und einige Prompts sowohl von Midjourney als auch von FLUX.1 [pro] generieren lassen.
Ein großer Unterschied ist dabei natürlich, dass MJ direkt 4 Bilder generiert und FLUX nur eins. Wir haben also gelegentlich mehrere Bilder von FLUX generieren lassen, wenn wir mit dem Ersten nicht direkt zufrieden waren.
2.1 Prompttreue
Prompttreue beschreibt, wie gut das Bild tatsächlich zu dem Text passt, den du eingegeben hast. Bei Midjourney lässt die Prompttreue leider manchmal etwas zu Wünschen übrig, vor allem dann, wenn es komplexer wird.
Der Prompt, mit dem wir getestet haben:
dreiköpfiger drache mit Cowboystiefeln und Hut, der fernsehen schaut und nachos isstMidjourney:

FLUX.1 [pro]:

Bei keinem Bild wurden alle fünf Aspekte dargestellt, aber prinzipiell kommt das Bild, das FLUX generiert hat, dem Prompt deutlich näher als die Bilder vom Midjourney. Und das ist kein zufälliges Ergebnis, sondern tatsächlich konstant.
FLUX hält sich besser an Prompts und stellt im Schnitt mehr Aspekte auf dem Bild dar als Midjourney. Besonders auffällig ist dies bei komplexen Prompts, die eher ins fantastische gehen (wie unser Beispiel).
2.2 Hände und Gliedmaße
Midjourney hat mit v6.1 und später v7 die Darstellung von Händen, Armen, Beinen und Füßen deutlich verbessert. Zum Zeitpunkt unseres Tests war v6.1 gerade neu. Schauen wir uns an, wie Midjourney sich in dieser Kategorie schlägt.
Als Prompt nutzen wir dafür:
foto von zwei judokämpfernMidjourney:

FLUX.1 [pro]:

Auch hier geht der Punkt eher an FLUX. Bei Midjourney sehen wir doch jede Menge Gliedmaße, die zu viel oder zu wenig sind.
Wir haben noch einen weiteren Prompt speziell für Hände getestet:
Foto von den Händen von einem paar, das gerade geheiratet hat. Man sieht die eheringeMidjourney:

FLUX.1 [pro]:

Bei Midjourney haben wir auf 3 von 4 Bildern Fehler, die du auf den ersten Blick siehst. Bei FLUX ist das erste Bild so gut, dass du zumindest noch mal genauer hingucken musst.
FLUX schneidet somit auch in dieser Kategorie etwas besser ab. In unserem Test war der Unterschied bei anatomischen Details durchgehend sichtbar.
2.3 Text
Text in Bildern darzustellen ist für Bildgeneratoren eine große Herausforderung, da sie Text nicht als Text darstellen und auch kein Verständnis für Wörter etc. haben, sondern es für sie einfach einzelne Pixel sind, die passend zusammengesetzt werden müssen.
Midjourney ist mit der neuen Version schon deutlich besser darin geworden, aber schauen wir mal, wie MJ sich im Vergleich zu FLUX schlägt.
Der Prompt:
vintage sunset vector t-shirt design of a dog with the text „Live more worry less.“ isolated on white backgroundMidjourney:

FLUX.1 [pro]:

Midjourney liefert uns hier ein Bild (das erste), das wirklich super ist und drei mit kleineren und größeren Fehlern. Das Bild von FLUX ist schon beim ersten Versuch fehlerfrei.
Schauen wir uns einen weiteren Prompt an:
clouds forming the word „now or never“ and a plane flying through themMidjourney:

FLUX.1 [pro]:

Auch hier haben wir bei Midjourney wieder einige Bilder, die Fehler enthalten und nicht zu gebrauchen sind. Midjourney schafft es aber auch nicht, sich an den Prompt zu halten. Die Worte sehen in keinem der Bilder aus, als wären sie aus Wolken geformt.
Bei FLUX hingegen kommen wir der Sache schon etwas näher. Bei dem Text fehlt leider das „or“ und so richtig nach Wolken sehen die Worte nun nicht aus, aber tendenziell geht es in die richtige Richtung.
Der Fairness halber haben wir FLUX den Prompt noch einmal ausführen lassen und dieses Ergebnis hat uns wirklich beeindruckt:

Der Text ist perfekt und die Worte sehen wirklich aus, als wären sie aus den Wolken entstanden.
2.4 Ästhetik
Midjourney Bilder haben ihre ganz eigene Ästhetik und die Entwickler legen viel Wert auf optisch ansprechende Bilder, die viele Emotionen transportieren.
Andere KI-Bildgeneratoren können damit oft nicht mithalten und genau darum wurde Midjourney sehr schnell so beliebt.
Der Prompt, den wir eingegeben haben:
a photo of an old couple sitting on a sofa. loving, calm, happy, sereneMidjourney:

FLUX.1 [pro]:

Und jetzt kommen wir in den Bereich, in dem es eher um persönliche Vorlieben geht. Beide Generatoren haben uns schöne und passende Bilder ausgegeben, die aber grundverschieden wirken.
Ein weiteres Beispiel:
a woman sitting near a pond, crying. sad mood, melancholicMidjourney:

FLUX.1 [pro]:

Auch hier sind alle Bilder passend zum Prompt, aber du siehst deutlich den Unterschied zwischen Midjourney und FLUX. Bewerten, was besser ist, kannst du hier aber kaum, da dies sicherlich auf den jeweiligen Anwendungsfall ankommt.
3. FLUX.1 nutzen
FLUX.1 [schnell] ist komplett kostenlos nutzbar. Für die Pro-Version gibt es verschiedene API-Anbieter. Ich empfehle FLUX.1 [pro], wenn dir Prompttreue und Textdarstellung wichtig sind, und Midjourney, wenn du vor allem Wert auf künstlerische Ästhetik legst.
FLUX.1 kannst du mittlerweile über viele Plattformen nutzen, z. B. direkt über Black Forest Labs oder über Drittanbieter wie Replicate, fal.ai oder Together AI.
Da FLUX Open Source ist, kannst du es auch lokal auf deinem eigenen Computer installieren (z. B. über ComfyUI). Dafür brauchst du allerdings eine leistungsstarke Grafikkarte mit mindestens 16 GB VRAM.






