Mit einem KI-Bildgenerator kannst du in wenigen Sekunden Bilder und Grafiken verschiedenster Art erstellen. Seien es Logos, Porträtfotos, Tierfotos, Desktop-Hintergründe oder Ausmalbilder.
Das Problem ist:
Mittlerweile gibt es mehrere Hundert KI-Bildgeneratoren auf dem Markt. Und jeden Monat kommen dutzende neue hinzu.
Doch mit welchem lassen sich am besten KI-Bilder erstellen? Und welches Tool eignet sich am besten für welchen Typ Bild?
In diesem Artikel habe ich 20 der bekanntesten KI-Bildgeneratoren ausführlich für dich getestet. Nicht nur im Hinblick auf Bildqualität, sondern auch Bedienbarkeit und Funktionen. Zu jedem Bildgenerator findest du zudem drei Testbilder, damit du die Bildqualität selbst vergleichen kannst.
Das Beste daran:
Die meisten der Generatoren haben kostenlose Testversionen, bieten Start-Credits an oder sind sogar komplett kostenlos.
KI-Bildgeneratoren im Vergleich
Platz | KI-Bildgenerator | Bildqualität | Zeit pro Bild | KI-Modell | Preis (Monat) | Gratis Testversion? |
---|---|---|---|---|---|---|
1 | Midjourney | Sehr hoch | 10 – 20 s | Midjourney, Niji | ab 8 $ | |
2 | Artsmart.ai | Hoch bis sehr hoch | 5 s | Stable Diffusion | ab 19 $ | (50 Bilder) |
3 | Leonardo.ai | Hoch bis sehr hoch | 10 s | Stable Diffusion | ab 10 $ | (150 Bilder / Monat) |
4 | DreamStudio | Hoch bis sehr hoch | 6 – 7 s | Stable Diffusion | 10 $ / 1.000 Credits | (25 Credits / 125 Bilder) |
5 | Dall·E 3 | Hoch | 20 s | DALL·E 3 | 20 $ | (400 Bilder / Monat) |
6 | Neuroflash | Mittel bis sehr hoch | 12 s | Stable Diffusion, DALL·E 3 (ab Pro-Tarif) | ab 25 € | (5 Tage / 200 Bilder) |
7 | Ideogram | Hoch | 10 s | Ideogram v0.1 / v0.2 | ab 7 $ | (100 Bilder / Tag) |
8 | Adobe Firefly | Hoch | 20 s | Firefly Image Model | ab 5,49 € | (25 Credits / Monat) |
9 | Stockimg.ai | Hoch | 10 s | Stable Diffusion | ab 15,83 $ | |
10 | Supermachine | Mittel bis hoch | 6 s | Stable Diffusion | ab 15,83 $ | |
11 | LimeWire | Mittel bis hoch | 10 s | Blue Willow (u. a.) | ab 7,99 $ | (10 Bilder / Tag) |
12 | Dall·E 2 | Mittel | 11 – 13 s | DALL·E 2 | 15 $ / 115 Credits | (15 Bilder / Monat) |
13 | Jasper Art | Niedrig bis mittel | 9 – 10 s | DALL·E 2 | 20 $ | (5 Tage / 200 Bilder) |
14 | Canva | Niedrig bis mittel | 10 s | Stable Diffusion | ab 9,17 € | |
15 | Craiyon | Niedrig | 50 – 60 s | DALL·E mini | 5 $ | |
16 | Photosonic | Niedrig | 5 – 6 s | Stable Diffusion | ab 10 $ | (15 Credits) |
17 | Nightcafé | Niedrig | 5 s | Stable Diffusion, DALL·E 2 | 4,79 $ / 100 Credits | (20 Bilder / Tag) |
18 | Runway | Niedrig | 4 s | Stable Diffusion | ab 12 $ | (125 Credits / 25 Bilder) |
19 | ArtSpace.ai | Niedrig | 19 – 23 s | Eigene KI-Engine | 227 $ Lifetime | |
20 | Mindverse | Niedrig | 30 s | Stable Diffusion | ab 33 € | (7 Bilder) |
Tools & Testergebnisse im Detail
Im Folgenden findest du die Testergebnisse aller KI-Bildgeneratoren im Detail (in der Reihenfolge ihres Ergebnisses).
Die Ergebnisse setzen sich aus Bildqualität, Bedienbarkeit, Funktionsumfang, Generierungszeit und Preis zusammen. Die Bildqualität hat dabei die größte Gewichtung, da ein günstiges und schnell erzeugtes Bild von schlechter Qualität schließlich niemanden glücklich macht.
Zu jedem Bildgenerator findest du drei Beispielbilder, die ich für bestmögliche Vergleichbarkeit immer mit denselben Prompts (Befehlen) erstellt habe:
1. Midjourney
Midjourney ist der KI-Bildgenerator, der in unserem Test durch die beste Bildqualität überzeugt hat. Oft mit sehr großem Abstand zu anderen Tools.
Es bietet zudem viele fortgeschrittene Einstellungsmöglichkeiten, wie Parameter. Diese erlauben dir, Bilder genau so zu generieren, wie du sie haben möchtest.
So kannst du Bilder mit verschiedenen Seitenverhältnissen generieren (16:9, 2:1, 1:1 etc.) oder mit „Multi Prompts“ Doppeldeutigkeiten in deinen Befehlen vermeiden.
Midjourney ermöglicht dir auch, Bilder hochzuskalieren, Variationen eines Bildes zu erstellen, ein Bild als Referenz hochzuladen (Image-to-Image), Bilder zu beschreiben oder aus einem Bild herauszuzoomen (Outpainting). All das funktioniert sehr gut und oft auch besser als bei anderen KI-Bildgeneratoren.
Midjourney hat allerdings ein Manko, das nicht unerwähnt bleiben soll:
Die Bedienung kann für Anfänger verwirrend sein, denn es ist in den Chat-Dienst „Discord“ integriert und lässt sich (aktuell) nur innerhalb der Discord-Oberfläche nutzen:
Allerdings:
Erstens arbeitet Midjourney bereits an einer Lösung dafür. Zweitens ist das Meckern auf hohem Niveau.
Wir haben bei Gradually AI mittlerweile hunderte Stunden damit verbracht und 10.000+ Bilder mit Midjourney generiert. Und je intensiver wir uns mit Midjourney beschäftigt haben, desto mehr haben wir festgestellt, wie gut es ist und wie viel es anderen Tools in puncto Funktionen, Einstellungsmöglichkeiten und Bildqualität voraus hat. Dafür lohnt es sich, den etwas umständlichen Setup in Kauf zu nehmen.
Die KI-Bilder von Midjourney sind oft farbenfroh, lebendig und dynamisch. Sie enthalten viele Details, komplexe Texturen und Lichteffekte. Kurzum wirst du mit einer einzigartigen Bildqualität belohnt, die anderen Bildgeneratoren (teilweise) meilenweit voraus ist.
Wenn ich den Stil mit einem Adjektiv beschreiben sollte, würde ich „episch“ sagen. Aber mach dir am besten selbst ein Bild davon (oder damit).
2. Artsmart.ai
Obwohl Artsmart.ai sich bei der Bildqualität und dem Funktionsumfang Midjourney geschlagen geben musste, konnte sich der KI-Bildgenerator einen guten zweiten Platz im Test sichern:
Zum einen bietet es viele fortgeschrittene Einstellungsmöglichkeiten für die Prompts und verschiedene Modi, z. B. den Modus „Hyper Realistic“, um fotorealistische Bilder zu erzeugen.
Zum anderen bietet es tolle Bearbeitungsfunktionen, um deine Bilder nach der Generierung direkt in der App anzupassen oder zu verbessern, z. B.:
- Inpaint (eine Funktion, um Teile eines Bildes zu entfernen oder zu ändern).
- Face Enhance (um Gesichtsverzerrungen zu verbesseren)
- Upscaling
- Zuschneiden
- Text hinzufügen
- Hintergrund entfernen
- PoseCopycat (um eine Pose von einem Bild zu klonen)
- PosePerfect (um eine Pose durch Ziehen anzupassen)
In einer Kategorie konnte ArtSmart.ai gegenüber Midjourney auch deutlich punkten:
Es bietet eine übersichtlichere und intuitivere Benutzeroberfläche, die auch für Anfänger leicht verständlich ist.
Im Gegensatz zu Midjourney, das dich beim Schreiben von Prompts allein lässt, kannst du bei ArtSmart deine Prompts mit verschiedenen Modi, Presets, Kameraperspektiven, Kunststile, Künstlern über Dropdown-Menüs zusammenstellen, was uns sehr gut gefällt:
Du hast natürlich die Möglichkeit, deine Prompts auch ohne Hilfe zu schreiben, wenn dir das lieber ist.
Die Bildqualität ist, wie du in den Beispielbildern sehen kannst, sehr gut. Sie kommen zwar nicht ganz an die Qualität von Midjourney heran, überzeugen jedoch meist durch gute Belichtung, ein homogenes Farbbild und einen hohen Detailgrad.
Mit ca. 5 Sekunden generierte Artsmart.ai KI-Bilder im Test etwas schneller als Midjourney.
3. Leonardo.ai
Leonardo.ai ist ein innovativer, kreativer AI-Bildgenerator, der sich auf die Bereiche Fantasy und Gaming spezialisiert hat.
Zum Beispiel kannst du damit sehr gut Videospielcharaktere, -Hintergründe oder -Texturen generieren. Ich finde es aber auch super für fotorealistische Bilder oder Illustrationen.
Das Tool kann über das Leonardo-Dashboard auf der Website verwendet werden und ist kostenlos nutzbar:
Es kann durch eine breite Palette an Funktionen und Einstellungsmöglichkeiten überzeugen. Du kannst etwa zwischen unterschiedlichen Kunststilen wählen, deine eigenen Modelle trainieren oder auf von der Community bereitgestellte Modelle zurückgreifen.
Zudem bietet der Canvas-Modus Möglichkeiten zur Bildbearbeitung deiner zuvor erzeugten und auch hochgeladener Bilder.
Die Ergebnisse der kostenlosen Version sind bereits beeindruckend. Es sind keine Fehler auf den ersten Blick zu erkennen und sowohl der Che Guevara, die Corgis als auch die Donuts sehen sehr gut aus:
Besonders hervorzuheben ist noch Leonardo Alchemy, die kostenpflichtige Version von Leonardo.ai. Es nutzt SDXL und generiert Bilder in einer höheren Auflösung, mit mehr Details und besseren Kontrasten.
Die folgenden Bilder wurden mit Alchemy erstellt und zeigen, dass insbesondere die bessere Darstellung von Tieren oder Personen die 10 $ im Monat wert sein können:
4. Stability.ai DreamStudio
DreamStudio ist eine KI-Bildgenerator-Plattform, die von Stability.ai stammt. Du kannst damit die neusten Stable-Diffusion-Modelle live ausprobieren.
Für 10 $ kannst du 1.000 Credits kaufen, womit du ca. 5.000 Bilder generieren kannst, was sehr günstig ist.
Im Gegensatz zu vielen anderen KI-Bild-Tools bietet DreamStudio nur wenige vordefinierte Stile oder andere Hilfen bei den Prompts, weshalb ich es nicht für Anfänger empfehlen würde.
Auch gibt es nur wenige integrierte Funktionen, um KI-Bilder im Nachhinein zu bearbeiten.
Es bietet jedoch die wichtigsten Einstellungsmöglichkeiten, wie negative Prompts, Seitenverhältnis, Bilderanzahl, Generierungsschritte, die Auswahl des Stable-Diffusion-Modells und die Möglichkeit ein eigenes Bild als Vorlage hochzuladen (Image-to-Image).
Die Benutzeroberfläche ist übersichtlich und minimalistisch gehalten:
Der große Vorteil von DreamStudio ist, dass es immer die neusten Stable-Diffusion-Modelle wie SDXL 1.0 enthält.
Die Bildqualität von SDXL ist sehr gut. Die KI-Bilder sind farbenfroh, hochauflösend und enthalten weniger Bildfehler als bei Stability 2.1 und älter.
Ähnlich wie bei Midjourney ist der Hintergrundteppich bei den Corgis etwas merkwürdig. Alles in allem kommt SDXL aber nicht ganz an die Qualität von Midjourney heran:
5. DALL·E 3
DALL·E 3 ist der Nachfolger von DALL·E 2. Es handelt sich dabei um einen KI-Bildgenerator und KI-Modell von OpenAI (dem Entwickler von ChatGPT) und ist seit Oktober 2023 verfügbar.
Du kannst DALL·E 3 über drei verschiedene Tools nutzen:
1. Du kannst kostenlos KI-Bilder mit dem Bing Image Creator erstellen:
Hier erhältst du monatlich 100 Credits, was bedeutet, dass du bis zu 400 Bilder generieren kannst.
2. Du kannst DALL·E 3 innerhalb von Microsoft Copilot (ehemals Bing Chat) nutzen. Ähnlich wie beim Image Creator ist auch hier die Erstellung von KI-Bildern kostenlos:
3. Du kannst DALL·E 3 innerhalb von ChatGPT nutzen. Hier ist die Bildgenerierung allerdings nicht kostenlos, sondern erfordert ChatGPT Plus für 20 $ pro Monat:
Im Vergleich zu DALL·E 2 bietet DALL·E 3 einige bemerkenswerte Verbesserungen:
Es versteht Texte besser und generiert genauere sowie detailreichere Bilder.
Es kann mit verschiedenen Arten von Texteingaben umgehen, von einfachen Sätzen hin zu detaillierten Absätzen. DALL·E 3 hat jedoch eine sehr stark einschränkende Content-Policy. So werden unter anderem Persönlichkeiten, die in den letzten 100 Jahren noch lebten, nicht dargestellt:
Die Qualität der KI-Bilder ist sehr gut. DALL·E 3 stellt eine enorme Weiterentwicklung zu DALL·E 2 dar. Einziges Manko ist, dass es sich leider nicht so gut für photorealistische KI-Bilder eignet.
6. ImageFlash
neuroflash ist einer der beliebtesten und besten KI-Textgeneratoren, der sich vor allem für deutsche Texte gut eignet.
Das Tool bietet mit ImageFlash auch einen eigenen Bildgenerator an, den du innerhalb der App nutzen kannst:
Der KI-Bildgenerator von Neuroflash ist einfach zu bedienen und minimalistisch gehalten. Seit dem neuesten Update, kannst du deinen Prompt mithilfe von KI verbessern lassen und einige Voreinstellungen, wie “Produktpräsentation” oder “Realistische Fotos” auswählen.
Es fehlt leider immer noch die Möglichkeit, generierte KI-Bilder direkt in der App zu bearbeiten oder hochzuskalieren.
Die Ergebnisse der kostenlosen Version sind bereits ganz gut und mehr als man erwarten kann. Es sind keine Fehler auf den ersten Blick zu erkennen und sowohl der Che Guevara als auch die Corgis sehen sehr gut aus. Die Donuts konnte ich leider in der kostenlosen Version nicht besser hinkriegen:
Besonders hervorzuheben ist noch, dass man ab dem Pro-Tarif Dall-E 3 für die Bildgenerierung auswählen kann. Es generiert Bilder in einer höheren Auflösung, mit mehr Details und besseren Kontrasten.
Die folgenden Bilder wurden mit der “Premium”-Auswahl erstellt und zeigen, dass insbesondere die künstlerische Darstellung von Tieren oder Personen besser gelingt:
Leider ist ImageFlash nicht separat erhältlich, so dass es für die meisten User nur interessant sein wird, wenn man sich auch für Neuroflash als Content-Tool entscheidet.
7. Ideogram
Ideogram ist aktuell das beste Tool, um Bilder mit Text zu erstellen, was bei vielen anderen KI-Bildgeneratoren nicht so gut oder erst nach vielen Anläufen funktioniert.
So eignet es sich meiner Erfahrung nach z. B. sehr gut für Logos, Sticker, Poster, T-Shirts und viele andere Bilder, für die Textdarstellung wichtig ist.
Die Bedienung von Ideogram fand ich im Test einfach und übersichtlich. Die Startseite von Ideogram erinnert etwas an Pinterest. In einer Galerie kannst du sehen, was andere kreiert haben und dich inspirieren lassen:
Die Bildqualität ist recht gut. Schade fand ich, dass ich zum Teil lange mit den Modellen v0.1 und v0.2 und den verschiedenen Stilen (z. B. Graffiti, 3D-Render, Poster, Cinematic oder Ukiyo-E) experimentieren musste, bis ich zum gewünschten Ergebnis gekommen bin.
8. Adobe Firefly
Adobe Firefly ist der hauseigene KI-Bildgenerator von Adobe und wurde im März 2023 vorgestellt.
Adobe Firefly nutzt ein selbst entwickeltes KI-Modell, das auf Bildern von Adobe Stock, öffentlich lizenzierten und gemeinfreien Inhalten trainiert wurde.
Das fand ich ziemlich beeindruckend, vor allem, wenn man bedenkt, dass andere Modelle oft auf gestohlenen oder nicht autorisierten Inhalten aufbauen. Adobe hat hier also einen ethischen Ansatz gewählt, den ich nur loben kann.
Seit 23. Mai kann man Adobe Firefly nicht nur im Browser, sondern auch in Photoshop nutzen, unter anderem mit dem Feature „Photshop Generative Fill“.
Adobe Firefly ist einfach zu bedienen. Du gibst einen Textbefehl ein und bekommst vier KI-Bilder erstellt.
In der rechten Seitenleiste kannst du noch einige grundlegende Einstellungen zu Seitenverhältnis, Bildtyp, Stil, Belichtung oder Farbe vornehmen
Die KI-Bilder von Firefly sind meiner Meinung nach zwar gut und besser als bei vielen anderen Tools, allerdings sehen Bilder oft eher wie Stockfotos und „aalglatt“ aus. Qualitativ liegen sie also deutlich hinter Midjourney.
Ein weiterer Kritikpunkt ist, dass Firefly bei den Textbefehlen etwas restriktiv ist.
Zum Beispiel, wenn du ein Bild von einem „Kriminellen“ generieren willst, wird Firefly dir keine Ergebnisse liefern. Das liegt daran, dass Adobe bestimmte Wörter gesperrt hat, um Vorurteile und Stereotypen zu vermeiden. Das finde ich zwar lobenswert, kann aber auch nervig sein.
In meinem Fall bin ich mir nicht sicher, warum, aber Firefly weigert sich ein Bild von Che Guevara anzufertigen, daher habe ich hier einen hübschen Papagei generiert:
9. Stockimg.ai
Stockimg.ai ist ein Tool, auf das ich erst kürzlich aufmerksam geworden bin. Doch seitdem bin ich begeistert davon.
Stockimg AI kann Bilder, Wallpaper, Logos, Illustrationen, Poster uvm. erstellen und hat genau die notwendigen Einstellungs- und Auswahlmöglichkeiten, die der Kreativität freien Lauf lassen und trotzdem einen roten Faden durch die Erzeugung von Bildern führt.
So kann man mit einem Klick von 3D-Render zu Graffiti-Style, Karikaturen oder Minecraft Artworks wechseln und bekommt tolle Ergebnisse.
Wenn du dir nur ein Ergebnis anzeigen lässt, erzeugt Stockimg die Bilder auch in recht schnellen 10 Sekunden, bei 3 oder 4 Bildern dauert es entsprechend länger.
Die Bildqualität ist gut. Bemerkenswert ist z. B. die ausdrucksstarke Mimik im ersten Bild und dass die drei Hundewelpen nicht nebeneinander auf dem Teppich stehen (wie in so vielen anderen Bildern, sondern auf dem Bild verteilt sind):
10. Supermachine
Supermachine hat zwar nicht so viele Funktionen wie Midjourney oder ArtSmart.ai. Dafür hat eine übersichtliche Benutzeroberfläche und ist einfach zu bedienen:
Sehr gut gefällt mir, dass es 39 vordefinierte Modelle gibt, mit denen du Bilder in bestimmten Stilen generieren kannst. Es gibt etwa Modelle für Anime, LinkedIn-Porträts, Logos & Icons, Malbücher, fotorealistische Bilder oder 3D Art. Es gibt sogar zwei Modelle, mit denen du den „Midjourney-Stil“ imitieren kannst.
Du kannst nicht nur Text, sondern auch eigene Bilder als Prompts angeben. Zudem gibt es diverse Einstellungsmöglichkeiten zu Seitenverhältnis, Sampler, Bildgröße oder der Anzahl an Generierungsschritten.
Mit den Standardeinstellungen erhältst du innerhalb von ca. 6 Sekunden dein KI-Bild, womit Supermachine zu den schnellsten Bildgeneratoren im Test gehört.
Supermachine verwendet Stable Diffusion 1.4 bis 2.1 und SDXL zur Bildgenerierung. Die Bildqualität ist hoch, auch wenn sie nicht ganz an die von ArtSmart.ai oder Midjourney herankommt (der Che Guevara ist z. B. überbelichtet, wie du in den Beispielbildern sehen kannst).
Das Tool hat ein unverwechselbares Merkmal, das es von anderen KI-Bildgeneratoren unterscheidet:
Es erlaubt die Erstellung von FSK18-Inhalten. Du kannst also auch erotische Bilder damit erzeugen, wenn das für dich interessant ist.
11. BlueWillow by LimeWire
BlueWillow ist ein KI-Bildgenerierungsmodell, ähnlich wie Stable Diffusion, das im eigenen Generator bei LimeWire genutzt werden kann.
Die Kosten sind sehr überschaubar und durch die große Discord-Community kann man jederzeit auf Hilfe bauen.
BlueWillow v4 lässt sich im Modus „AI Studio“ ganz einfach über das Menü „Model“ auswählen. Hier hat man zusätzlich die Möglichkeit alle anderen üblichen Algorithmen, wie Stable Diffusion v2.1, v1.5, XL v1.0 sowie DALL-E 2 und DALL-E 3 auszuwählen.
Das Tool ist super einfach zu bedienen und minimalistisch gehalten. Du hast die Möglichkeit Promps sowie Negativpromts einzugeben, die Größe und Qualität des Bildes auszuwählen und festzulegen, wie viele Bilder gleichzeitig erstellt werden sollen.
Die Bildgenerierungzeit ist mit ca. 10 Sekunden angenehm kurz und nach der Erzeugung kannst du die Bilder direkt im Editor editieren, was uns sehr gut gefällt.
Die Bildqualität erscheint auf den ersten Blick gut, jedoch wurden nur zwei anstatt drei Hundewelpen erzeugt und auf die Hintergründe wurde nicht so viel Wert gelegt. Die Donuts und Erdbeeren sind auch nicht wirklich überzeugend, wenn man sich das Bild in höherer Auflösung anschaut:
Auch hier gilt natürlich, dass man mit den Prompts und Einstellungen experimentieren sollte, bis man zum gewünschten Ergebnis kommt.
12. DALL·E 2
DALL·E 2 ist ein KI-Modell von OpenAI. Neben der Bildgenerierung bietet es Outpainting, Inpainting und die Erstellung von Variationen eines Bildes an. Es ist eine Weiterentwicklung von DALL·E und seit September 2022 verfügbar.
Du kannst DALL·E 2 nicht nur als API nutzen, sondern auch direkt über die Plattform OpenAI Labs:
Die Plattform ist einfach zu bedienen. Du kannst entweder einen Text eingeben oder ein Bild hochladen. Leider kann man im Gegensatz zu den meisten anderen KI-Bildgeneratoren keinerlei weitere Einstellungen vornehmen, z. B. Angabe von Seitenverhältnis oder eines negativen Prompts.
Die Nutzung von DALL·E 2 über OpenAI Labs ist leider recht teuer. 115 Credits für die Plattform kosten 15 $, was ungefähr 0,13 $ pro Bild entspricht. Hier ergibt es eher Sinn, die API zu nutzen, mit der du für ein Bild nur 0,02 $ oder weniger bezahlst.
Die Qualität der KI-Bilder ist sehr gut. DALL·E 2 stellt eine enorme Weiterentwicklung zu DALL·E dar.
DALL·E 2 hat es als im Gegensatz zu vielen anderen KI-Bild-Tools hinbekommen, den Hintergrund-Teppich bei den Corgis fehlerfrei zu generieren. Alles in allem kann es jedoch nicht mit der Qualität von Midjourney oder SDXL mithalten.
13. Jasper Art
Jasper ist der aktuell bekannteste und beliebteste KI-Textgenerator auf dem Markt.
Mit Jasper Art erlaubt das Tool seit einiger Zeit auch, KI-Bilder zu erstellen.
Mit 20 $ pro Monat ist Jasper Art leider recht teuer, dafür kannst du jedoch unbegrenzt viele KI-Bilder erstellen. Wenn du Jasper nutzen auch möchtest, um Texte zu generieren, kann es sich lohnen, den Tarif „Boss Mode“ zu nutzen, denn darin ist der Bildgenerator bereits enthalten.
Jasper Art ist einfach zu bedienen und hat eine übersichtliche und moderne Benutzeroberfläche. Du kannst sowohl einen Text-Prompt eingeben als auch ein Bild als Vorlage wählen:
Sehr gut gefällt mir die Funktion „Enhance prompt“, mit der mehr Details zu deinen Prompts hinzugefügt werden.
Du kannst zusätzlich über Auswahlmenüs unter der Prompteingabe eine Stimmung, ein Medium (z. B. Ölgemälde), einen Künstler (z. B. Salvador Dalí), einen Stil und ein Keyword eingeben, was für Anfänger nützlich ist. Wahlweise kannst du im Reiter „Templates“ deine Bilder auf Basis von Vorlagen generieren.
Die Output-Qualität von Jasper Art ist eher mittelmäßig. Der Teppich des Corgi-Bilds ist misslungen, das Bild von Ché Guevara hat störende Spiegelungen, die Donuts sehen sehr künstlich aus:
14. Canva Create
Canva Create ist ein Sammelbegriff für eine Reihe neuer Features, die Canva im März 2023 vorgestellt hat.
Neben einer Zeichenfunktion, einem KI-Textgenerator und einem Übersetzer gehört auch ein Text-zu-Bildgenerator zu den neuen Funktionen:
Der Text-zu-Bildgenerator ist einfach zu bedienen und bietet eine intuitive Benutzeroberfläche.
Du kannst nicht nur einen Prompt eingeben, sondern auch aus 19 vordefinierten Stilen wählen, z. B. Buntstift, Retrowave, Concept-Art, Anime, Buntstift oder Aquarellfarben. Zudem kannst du beim Seitenverhältnis zwischen Quadrat, Querformat und Hochformat wählen.
Die Bildqualität des Text-zu-Bildgenerators von Canva ist gut, aber auch nicht atemberaubend. Beim Ché Guevara ist unklar, ob die Kopfbedeckung Haare oder Hut ist. Die Pfoten und der Hintergrund bei den Corgis ist misslungen. Die Donuts sehen eckig und einfach nicht lecker aus:
15. Craiyon
Craiyon wurde als eine leichtere Version von OpenAIs DALL·E entwickelt und hieß ursprünglich „DALL·E mini“.
Der Bildergenerator ist mit einigen Einschränkungen kostenlos und ohne Anmeldung nutzbar. In der kostenlosen Version wird Werbung angezeigt, die Generierung ist langsamer und die Bilder enthalten Wasserzeichen. Zudem sind alle generierten Bilder öffentlich.
Die Pro-Version, mit der alle genannten Einschränkungen wegfallen, ist ab 5 $ pro Monat erhältlich.
Die Bedienung von Craiyon ist einfach und intuitiv. Neben der Eingabe eines Prompts erlaubt dir Craivon ein Bild als Vorlage zu zeichnen, negative Wörter anzugeben und auszuwählen, ob es sich beim Bild um Kunst, eine Zeichnung oder ein Foto handelt:
Die Qualität des Craiyon-Bildergenerators liegt im oberen Mittelfeld:
Beim Ché Guevara sind die Frisur, die Augenpartie und die Farbgestaltung misslungen. Das Corgi-Bild ist, abgesehen von der Augenpartie, gut gelungen., über die Donuts brauchen wir gar nicht sprechen.
16. Photosonic
Writesonic ist einer der aktuell besten KI-Textgeneratoren. Mit Photosonic bietet das Tool, ähnlich wie Neuroflash und Jasper, einen integrierten Text-zu-Bildgenerator an.
Im Gegensatz zu Jasper kostet Photosonic keinen monatlichen Aufpreis, sondern kann mit den Credits bezahlt werden, die man im monatlichen Writesonic-Abo zur Verfügung hat.
Die Benutzeroberfläche ist einfach und übersichtlich:
Leider bietet der Text-zu-Bildgenerator kaum Zusatzfunktionen oder Einstellungsmöglichkeiten:
Du kannst lediglich die Anzahl der generierten KI-Bilder festlegen (2, 3 oder 4) und zwischen drei Ausgabeformaten wählen (512 x 512, 768 x 512, 512 x 768 Pixel). Vordefinierte Stile, Upscaling oder Tools zum Nachbearbeiten gibt es nicht.
Die Qualität der generierten KI-Bilder ist eher mittelmäßig. Der Ché Guevara ist okay, wenn auch die Schattierungen im Gesicht und Hintergrund nicht ganz stimmig sind. Der Teppich bei den Corgis hat ein komisches Muster und einer der Hunde hat eine missratene Pfote. Die Donuts sind zu unförmig und das gesamte Bild ist misslungen:
17. Nightcafé
Nightcafé ist nicht nur ein KI-Bildgenerator, sondern eine auch aktive Discord-Community mit ca. 80.000 Mitgliedern.
Das Besondere an Nightcafé ist, dass es als einziges Bildgenerator-Tool eine große Auswahl verschiedener KI-Modelle zur Bildgenerierung bietet:
- Stable Diffusion (v1.5, v2.1 und SDXL)
- DALL·E 2
- VQGAN+CLIP (für eher künstlerische KI-Bilder)
- CLIP-Guided Diffusion (bietet mehr Kontrolle über die Bildkomposition)
- Style Transfer (um Kunststile von einem Bild auf ein anderes Bild zu übertragen)
Nightcafé ist sehr benutzerfreundlich. Die Oberfläche ist übersichtlich gehalten und bietet dennoch viele Einstellungsmöglichkeiten (du hast die Möglichkeit auf „Advanced mode“ zu schalten, um Detaileinstellungen bei deinen KI-Bildern vornehmen zu können):
In der kostenlosen Version kannst du pro Tag fünf Bilder-Credits generieren. Die Credits dafür musst du dir jeden Tag aufs Neue sichern (du bekommst dazu jeden Tag eine E-Mail).
Die kostenlose Version gefällt uns allerdings nicht so gut, weil überall Werbung angezeigt wird. Wenn du das Tool regelmäßig nutzt, empfiehlt es sich, die Pro-Version zu nutzen. Mit dem kleinsten Paket für 5,99 $ pro Monat bekommt du 100 Credits, mit denen du pro Monat ca. 1.200 KI-Bilder generieren kannst.
Die Output-Qualität von Nightcafé ist leider nur mittelmäßig, was uns überrascht hat. Denn ich habe verschiedene KI-Modelle zur Bildgenerierung verwendet und daraus die besten KI-Bilder ausgewählt.
Der Ché Guevara hat einen merkwürdig gefalteten Umhang (oder Mantel?), die Corgis sehen leicht deformiert aus und der Hintergrund-Teppich ist gar keiner. Das Blech Donuts sieht auf den ersten blick gut aus, aber je genauer man hinschaut, desto mehr erkennt man kleine Fehler:
18. Runway
Runway ist einer der großen Namen im KI-Bereich und hat sich in den letzten 4 Jahren zu einem der Marktführer im Bereich Bild und Video entwickelt.
Mit seinen Modellen Gen-1 und Gen-2 hat es z. B. neue Maßstäbe bei der KI-Videogenerierung gesetzt.
Neben seiner Forschungsarbeit bietet Runway eine Plattform mit 30+ verschiedenen KI-Tools an, darunter nicht nur ein KI-Bildgenerator und ein KI-Videogenerator, sondern auch zahlreiche Tools zur KI-Bildbearbeitung, z. B. zur Animation von 2D-Bildern, Hintergrundentfernung, Inpainting und Outpainting.
Der Text-zu-Bildgenerator von Runway ist einfach zu bedienen und bietet dir nicht nur grundlegende Einstellungsmöglichkeiten zu Seitenverhältnis, Auflösung und der Anzahl ausgegebener KI-Bilder, sondern auf Wunsch auch erweiterte Einstellungen wie Prompt Weight, Medium oder verschiedene Kunststile:
Zur Generierung verwendet Runway Stable Diffusion. Die Qualität der KI-Bilder ist leider hinter unseren Erwartungen zurückgeblieben und kann nicht mit den besten Bildgenerator-Tools im Test mithalten.
Die Farben und Schattierungen beim Ché-Guevara-Bild sind nicht optimal. Bei den Corgis gibt es Fehler bei Ohren und Pfoten und die Donuts sind deformiert:
19. ArtSpace.ai
ArtSpace.ai ist ein KI-Bildgenerator, das auf einer selbst entwickelten KI-Modell beruht, also nicht auf Stable Diffusion oder DALL·E 2, wie die meisten anderen Tools.
Als Input für deine KI-Bilder kannst du eine eigene Zeichnung, eine Bild oder einen Text-Prompt nutzen.
ArtSpace.ai benutzerfreundlich und verfügt über eine übersichtliche Benutzeroberfläche:
Obwohl das Tool in unserem Test in der Lage war, realistische und kreative KI-Bilder zu erzeugen und sich größtenteils an die Vorgaben aus den Prompts gehalten, ist die Qualität der KI-Bilder im Großen und Ganzen eher enttäuschend.
Die Möbel des Raumes, in dem das Ché-Guevara-Bild hängt, sehen merkwürdig aus. Der Ché Guevara selbst hat ein verformtes Gesicht. Das Fell und der Teppich beim Corgi-Bild sind komplett misslungen. Das Donuts-Bild ist okay, wenn auch etwas langweilig:
20. Mindverse
Mindverse ist ein KI-Textgenerator und All-in-one-Tool für deutsche Inhalte, das Recherche, Brainstorming, Bilderstellung, Textgenerierung und Analyse mit künstlicher Intelligenz bietet.
Mit Mindverse kannst du z. B. Produktbeschreibungen, Rezensionen, Blogposts, E-Mails, Werbetexte und vieles mehr in nur wenigen Sekunden erstellen.
Es bietet auch einen KI-Bildgenerator an, den du in der App unter dem Menüpunkt „Bilder“ findest:
Das Tool ist einfach bedienbar und minimalistisch gehalten. Du hast die Möglichkeit, ein Bildmodell, eine Bildbeschreibung (den Prompt), das Bildverhältnis und optional den Stil auszuwählen.
Leider dauerte die Bildgenerierung mit ca. 30 Sekunden sehr lange. Zudem war Mindverse der einzige KI-Bildgenerator, der uns die Ausgabe nicht nur eines, sondern gleich zweier KI-Bilder verweigerte, da sie angeblich unangemessene Inhalte enthielten.
Ich habe eine Weile herumprobiert, aber leider keine zufriedenstellenden Ergebnisse mit unseren Eingaben erzielt, was ziemlich frustrierend war.
Die Bildqualität ist recht gut, sofern man ein Ergebnis erhält:
Was ist ein KI-Bildgenerator überhaupt?
Ein KI-Bildgenerator (engl. „AI Image Generator“ oder „AI Art Generator“) ist ein Online-Tool oder eine Software, die mithilfe von künstlicher Intelligenz Bilder erzeugt.
Dabei kannst du entweder ein Text, ein Bild oder beides als Input für dein gewünschtes KI-Bild geben (genannt „Text-to-Image“ und „Image-to-Image“).
Die Qualität heutiger KI-Bildgeneratoren ist mittlerweile beeindruckend gut. Innerhalb der letzten zwei Jahre hat die Technologie enorme Fortschritte gemacht.
Die Tools produzieren immer realistischere und detailreichere Bilder. Manche KI-Bilder sind sogar so gut, dass sie kaum noch von echten Fotos zu unterscheiden sind.
Folgendes Bild habe ich mit KI generiert und nicht nachbearbeitet:
Auch KI-Grafiken oder -Zeichnungen sind mittlerweile von extrem hoher Qualität, wie du an folgendem Beispiel sehen kannst:
Natürlich sind die Tools nicht perfekt. Sie machen manchmal immer noch Fehler oder erzeugen ungewollte Effekte, wie:
- Merkwürdige Extremitäten bei Menschen und Tieren (z. B. zu lange, zu kurze, fehlende oder zusätzliche Finger, Zehen, Arme, Beine, Pfoten etc.)
- Zu glatte und perfekte Haut
- Merkwürdige Architektur (z. B. unförmige Fenster)
- Kauderwelsch-Beschriftungen
- Doppelte oder fehlende Elemente
- Unnatürliche Belichtung oder falsche Schattierungen
Wenn du dir die beiden Beispielbilder genauer anschaust, kannst du den ersten, zweiten und fünften Effekt vielleicht erkennen.
Ich persönlich nehme solche Fehler jedoch gerne in Kauf. Durch KI-Bildgeneratoren sparen wir bei Gradually AI sehr viel Zeit und Geld. Es ersetzt für uns Stockphoto- und Bilddatenbanken und teilweise sogar den Grafikdesigner.
FAQ
Hier habe ich dir Antworten auf häufige Fragen rund um KI-Bildgeneratoren zusammengestellt:
Zum Testen der Bild-Generator-Tools habe ich folgende englische Prompts verwendet:
- A powerful portrait of Che Guevara, in color, looking to the left (Ein kraftvolles Porträt von Che Guevara, in Farbe, mit Blick nach links)
- Three small corgi puppies playing on a colorful handmade carpet decorated with different geometric shapes (Drei kleine Corgi Welpen spielen auf einem bunten, handgemachten Teppich, der mit unterschiedlichen geometrischen Formen verziert ist)
- A photo of glazed strawberry donuts with soft pink and white sprinkles on a cake rack, white background with strawberrys, overhead shot (Ein Foto glasierter Erdbeer-Donuts mit zartpinken und weißen Streuseln auf einem Kuchengestell, weißer Hintergrund mit Erdbeeren, von oben aufgenommen)
KI-Bildgeneratoren können für verschiedene Zwecke genutzt werden, wie zum Beispiel:
- Beitragsbilder für Blogartikel
- Hintergrundbilder für Webseiten
- Social-Media-Posts
- Avatare und Profilbilder
- Ausmalbilder
- Produktbilder
- Inspiration oder Experimente
- Logos oder Icons
- Mockups oder Prototypen von Produkten
- Desktop- oder Smartphone-Hintergründe
- etc.
Laut § 2 Abs. 2 UrhG gilt das Urheberrecht nur für „persönliche geistige Schöpfungen“, sprich menschengemachte Schöpfungen.
Das heißt, auf KI-generierte Bilder besteht kein urheberrechtlicher Schutz und du kannst sie beliebig verwenden.
Ob du selbst deine KI-generierten Bilder schützen kannst, hängt laut Rechtsanwältin Dr. Peggy Müller davon ab, wie hoch der menschliche Anteil am KI-Output ist (vermutlich ist er bei einer KI-Bildgenerierung ohne menschliche Nachbearbeitung eher gering).
Der Image Creator von Microsoft Bing, Craiyon und Nightcafé sind komplett kostenlos nutzbar. Allerdings nicht ohne Einschränkungen:
Craiyon und Nightcafé zeigen Werbung an, der Image Creator von Bing erfordert das Anlegen eines Microsoft-Accounts.