Es gibt etwas Neues im Bereich KI-Bildgeneratoren:
Das KI-Modell FLUX.1 von der deutschen Entwicklerschmiede Black Forest Labs.
In diesem Artikel habe ich dir alles dazu zusammengefasst, was du über FLUX wissen musst, z. B. welche Modelle es gibt, wie gut es ist, wie es im Vergleich zu Midjourney abschneidet und wie du es aktuell nutzen kannst.
1. Was ist FLUX?
FLUX ist eine KI, die Bilder anhand von eingegebenen Prompts generiert – also das Gleiche macht wie Midjourney. Entwickelt wurde FLUX von einem Team, das aus dem Bereich KI kommt und zum Beispiel an der Entwicklung von Stable Diffusion Modellen beteiligt war.
Für wen die technischen Hintergründe spannend sind: Die meisten Bildgeneratoren basieren momentan auf Stable Diffusion und binden dann zusätzlich Prozesse wie z. B. RLHF (Reinforcement-Learning from Human Feedback) ein.
FLUX hingegen nutzt Flow Matching, was in dem Bereich neu ist, aber recht vielversprechend aussieht. Ohne jetzt genauer darauf einzugehen, ist daran einfach spannend, dass FLUX also tatsächlich etwas anders „arbeitet“ als zum Beispiel Midjourney.
1.1 Modelle von FLUX.1
Black Forrest Labs hat von FLUX.1 direkt drei Modelle veröffentlicht:
- FLUX.1 [pro]
- FLUX.1 [dev]
- FLUX.1 [schnell]
Die Modelle unterscheiden sich dahin gehend, wie schnell die Bilder generiert werden, wie viele Details sie am Ende haben und wie „prompttreu“ sie sind.
Pro ist das Modell, das die besten Bilder liefert und unsere Empfehlung, wenn ihr gute Resultate haben möchtet. Für Spielereien, bei denen ihr etliche Bilder generieren wollt und die Qualität erst mal nicht so wichtig ist, könnt ihr FLUX.1 [schnell] nutzen.
2. Wie gut ist FLUX.1?
Um das zu testen, haben wir einige Prompts von Midjourney und FLUX.1 [pro] ausführen lassen und uns die Ergebnisse angeschaut.
Ein großer Unterschied ist dabei natürlich, dass MJ direkt 4 Bilder generiert und FLUX nur eins. Wir haben also gelegentlich mehrere Bilder von FLUX generieren lassen, wenn wir mit dem Ersten nicht direkt zufrieden waren.
2.1 Prompttreue
Prompttreue beschreibt, wie gut das Bild tatsächlich zu dem Text passt, den man eingegeben hat. Bei Midjourney lässt die Prompttreue leider manchmal etwas zu Wünschen übrig, vor allem dann, wenn es komplexer wird.
Der Prompt, mit dem wir getestet haben:
dreiköpfiger drache mit Cowboystiefeln und Hut, der fernsehen schaut und nachos isst
Midjourney:
FLUX.1 [pro]:
Bei keinem Bild wurden alle fünf Aspekte dargestellt, aber prinzipiell kommt das Bild, das FLUX generiert hat, dem Prompt deutlich näher als die Bilder vom Midjourney. Und das ist kein zufälliges Ergebnis, sondern tatsächlich konstant:
FLUX hält sich besser an Prompts und stellt im Schnitt mehr Aspekte auf dem Bild dar als Midjourney. Besonders auffällig ist dies bei komplexen Prompts, die eher ins fantastische gehen (wie unser Beispiel).
2.2 Hände und Gliedmaße
Midjourney hat erst vor wenigen Tagen Midjourney V6.1 veröffentlicht, die Hände, Arme, Beine und Füße besser darstellen soll. Schauen wir uns einmal an, wie Midjourney sich nun in dieser Kategorie schlägt.
Als Prompt nutzen wir dafür:
foto von zwei judokämpfern
Midjourney:
FLUX.1 [pro]:
Auch hier geht der Punkt eher an FLUX. Bei Midjourney sehen wir doch jede Menge Gliedmaße, die zu viel oder zu wenig sind.
Wir haben noch einen weiteren Prompt speziell für Hände getestet:
Foto von den Händen von einem paar, das gerade geheiratet hat. Man sieht die eheringe
Midjourney:
FLUX.1 [pro]:
Bei Midjourney haben wir auf 3 von 4 Bildern Fehler, die man auf den ersten Blick sieht. Bei FLUX ist das erste Bild so gut, dass man zumindest noch mal genauer hingucken muss.
Insgesamt schneidet FLUX somit auch in dieser Kategorie etwas besser ab.
2.3 Text
Text in Bildern darzustellen ist für Bildgeneratoren eine große Herausforderung, da sie Text nicht als Text darstellen und auch kein Verständnis für Wörter etc. haben, sondern es für sie einfach einzelne Pixel sind, die passend zusammengesetzt werden müssen.
Midjourney ist mit der neuen Version schon deutlich besser darin geworden, aber schauen wir mal, wie MJ sich im Vergleich zu FLUX schlägt:
Der Prompt:
vintage sunset vector t-shirt design of a dog with the text "Live more worry less." isolated on white background
Midjourney:
FLUX.1 [pro]:
Midjourney liefert uns hier ein Bild (das erste), das wirklich super ist und drei mit kleineren und größeren Fehlern. Das Bild von FLUX ist schon beim ersten Versuch fehlerfrei.
Schauen wir uns einen weiteren Prompt an:
clouds forming the word "now or never" and a plane flying through them
Midjourney:
FLUX.1 [pro]:
Auch hier haben wir bei Midjourney wieder einige Bilder, die Fehler enthalten und nicht zu gebrauchen sind. Darüber hinaus schafft Midjourney es aber auch nicht, sich an den Prompt zu halten – die Worte sehen in keinem der Bilder aus, als wären sie aus Wolken geformt.
Bei FLUX hingegen kommen wir der Sache schon etwas näher. Bei dem Text fehlt leider das „or“ und so richtig nach Wolken sehen die Worte nun nicht aus, aber tendenziell geht es in die richtige Richtung.
Der Fairness halber haben wir FLUX den Prompt noch einmal ausführen lassen und dieses Ergebnis hat uns wirklich beeindruckt:
Der Text ist perfekt und die Worte sehen wirklich aus, als wären sie aus den Wolken entstanden.
2.4 Ästhetik
Midjourney Bilder haben ihre ganz eigene Ästhetik und die Entwickler legen viel Wert auf optisch ansprechende Bilder, die viele Emotionen transportieren.
Andere KI-Bildgeneratoren können damit oft nicht mithalten und genau darum wurde Midjourney sehr schnell so beliebt.
Der Prompt, den wir eingegeben haben:
a photo of an old couple sitting on a sofa. loving, calm, happy, serene
Midjourney:
FLUX.1 [pro]:
Und jetzt kommen wir in den Bereich, in dem es eher um persönliche Vorlieben geht: Beide Generatoren haben uns schöne und passende Bilder ausgegeben, die aber grundverschieden wirken.
Ein weiteres Beispiel:
a woman sitting near a pond, crying. sad mood, melancholic
Midjourney:
FLUX.1 [pro]:
Auch hier sind alle Bilder passend zum Prompt, aber man sieht deutlich den Unterschied zwischen Midjourney und FLUX. Bewerten, was besser ist, kann man hier aber kaum, da dies sicherlich auf den jeweiligen Anwendungsfall ankommt.
3. FLUX.1 nutzen
Derzeit kann man FLUX.1 noch kostenlos nutzen und wir würden euch auf jeden Fall empfehlen dies zu tun.
FlLUX.1 kann man nicht direkt über Black Forest Labs nutzen, sondern über Plattformen, auf denen es eine Schnittstelle dafür gibt.
Wir haben für euch Glif ausprobiert und können euch diese Plattform dafür sehr ans Herz legen.
Um FLUX auf Glif nutzen zu können, meldet euch bei Glif an und klickt dann auf diesen Link:
https://glif.app/@blogmojo/glifs/clzmfebn20000xveaoqayu2iq
Ihr kommt nun zu einem Interface, bei dem ihr links einen Prompt eingeben könnt und rechts werden euch Bilder angezeigt.
Alles, was ihr nun tun müsst, ist den Prompt in das Feld eingeben und „Run This Glif“ drücken. Ihr könnt den Prompt dabei auch auf Deutsch eingeben, wir haben eingestellt, dass dieser automatisch übersetzt und optimiert wird.
Wir wünschen euch viel Spaß beim Testen!