Welches LLM ist 2026 das beste?

Das hängt von der Aufgabe ab. Bei Coding führt Claude Fable 5 mit 95,0 % auf SWE-bench Verified, vor Claude Opus 4.8 mit 88,6 %. GPT-5.5 liegt im Vals-AI-Harness bei 82,6 %. Beim wissenschaftlichen Reasoning (GPQA Diamond) liegt Gemini 3.1 Pro mit 94,3 % vorn. In Mathematik (AIME 2025) erreicht GPT-5 Pro die volle Punktzahl. Ein einzelnes bestes Modell gibt es nicht mehr. Brandneu: Die GPT-5.6-Familie (Sol, Terra, Luna) ist seit 09.07.2026 allgemein verfügbar. Sol erreicht 88,8 % auf Terminal-Bench 2.1, Sol Ultra sogar 91,9 %, SWE-Bench Pro liegt bei 64,6 % (rund 15 Punkte hinter Claude Mythos 5 und Fable 5) und der Artificial Analysis Coding Agent Index bei 80 (Fable 5: 77,2).

Was ist das günstigste LLM?

Das günstigste Modell mit API-Zugang in unserer Datenbank ist GPT-5 nano mit 0,05 USD pro 1 Million Input-Tokens und 0,40 USD pro 1 Million Output-Tokens. Am teuersten ist GPT-5.5 Pro mit 30 USD Input und 180 USD Output. Das ist ein Faktor von 600 zwischen dem günstigsten und dem teuersten Modell.

Gibt es mehr offene oder geschlossene LLMs?

Von den 157 erfassten Modellen sind 98 proprietär und 59 offen verfügbar (54 mit offenen Gewichten, 5 vollständig quelloffen). Geschlossene Modelle führen bei der reinen Leistung noch knapp, aber die offenen Modelle sind nah dran. DeepSeek-V4-Pro erreicht 80,6 % SWE-bench und liegt damit rund 8 Prozentpunkte hinter Claude Opus 4.8.

Wie groß ist das größte Kontextfenster?

Die größten Kontextfenster bieten Llama 4 Scout und Qwen-Long mit jeweils 10 Millionen Tokens. Die aktuellen Spitzenmodelle liegen meist um 1 Million Tokens, GPT-5.5 bei 1 Million und Claude Opus 5 sowie Gemini 3.1 Pro bei 1 Million. Zum Vergleich: 10 Millionen Tokens entsprechen etwa 30 Bänden Harry Potter.

Warum geben die Hersteller keine Parameterzahlen mehr an?

Bei allen aktuellen Spitzenmodellen von OpenAI, Anthropic, Google und xAI ist die Parameterzahl offiziell nicht mehr bekannt. Die Labore behandeln Modellgröße und Architektur als Geschäftsgeheimnis. Konkrete Zahlen gibt es fast nur noch bei offenen Modellen wie Kimi K3 (offiziell 2,8 Billionen Parameter, Gewichte seit dem 27.07.2026 unter eigener „Kimi K3 License“ verfügbar), DeepSeek-V4-Pro (1,6 Billionen) oder Kimi K2.6 (1 Billion).

LLM-Statistiken 2026: Zahlen, Daten & Fakten

Q: Wie viele große Sprachmodelle gibt es 2026?

In unserer zentral gepflegten Datenbank sind aktuell 157 große Sprachmodelle von 23 Anbietern erfasst, von GPT-2 (2019) bis zu den aktuellen Flaggschiffen. Das ist eine kuratierte Auswahl der relevantesten Modelle, nicht die Gesamtzahl aller je veröffentlichten LLMs. Allein 2025 haben US-Labore laut Stanford AI Index rund 60 nennenswerte Modelle veröffentlicht, China etwa 35.

Large Language Models sind das Herz der KI-Revolution. Aber wie viele gibt es eigentlich? Wer baut sie? Was kosten sie? Und welches Modell ist wirklich das beste?

Die Antwort:

Es ist unübersichtlich geworden. Im Jahr 2026 erscheint im Schnitt jeden Monat ein neues Spitzenmodell, die Preise schwanken um den Faktor 600, und ausgerechnet die wichtigste Kennzahl der letzten Jahre, die Parameterzahl, geben die großen Labore gar nicht mehr heraus.

In diesem Artikel sortiere ich die Zahlen. Alle Werte stammen aus unserer zentral gepflegten LLM-Datenbank, die hinter Tools wie dem API-Kostenrechner steht, und sind auf dem Stand Juli 2026.

TL;DRDas Wichtigste in Kürze

In unserer Datenbank sind 157 LLMs von 23 Anbietern erfasst, davon 98 proprietär und 59 offen verfügbar.
Bei Coding führt Claude Fable 5 mit 95,0 % SWE-bench, vor Claude Opus 4.8 mit 88,6 %. GPT-5.5 liegt im Vals-AI-Harness bei 82,6 %. Open-Weights-Modelle wie DeepSeek-V4-Pro liegen nur rund 8 Prozentpunkte hinter Claude Opus 4.8.
Die Preise reichen von 0,05 USD (GPT-5 nano) bis 30 USD (GPT-5.5 Pro) pro 1 Million Input-Tokens. Parameterzahlen geben die führenden Labore nicht mehr an.

Hinweis

Dieser Artikel betrachtet eine kuratierte Auswahl der relevantesten Sprachmodelle, nicht jedes je veröffentlichte LLM. Die Zahlen zu Modellanzahl, Anbietern und Typ-Verteilung werden direkt aus unserer Modell-Datenbank berechnet und bleiben damit immer aktuell.

1. Wie viele große Sprachmodelle gibt es 2026?

In unserer Datenbank sind aktuell 157 große Sprachmodelle von 23 verschiedenen Anbietern erfasst, von GPT-2 aus dem Jahr 2019 bis zu den aktuellen Flaggschiffen vom Juli 2026. Das ist bewusst eine kuratierte Auswahl der wichtigsten Modelle und kein Anspruch auf Vollständigkeit.

Zur Einordnung:

Laut dem Stanford AI Index 2026 haben allein US-Labore im Jahr 2025 rund 60 nennenswerte Modelle veröffentlicht, chinesische Anbieter etwa 35. Über 90 % aller bedeutenden Spitzenmodelle stammen mittlerweile aus der Industrie, nicht mehr aus der akademischen Forschung. Der Markt hat sich also professionalisiert und konzentriert.

2. Die größten LLM-Anbieter nach Modellanzahl

Ein einfacher Indikator dafür, wie aktiv ein Labor ist, ist die Zahl der Modelle, die es pflegt. Die folgende Grafik zeigt, wie viele der von uns erfassten Modelle auf welchen Anbieter entfallen:

Quelle: gradually.ai LLM-Datenbank

CC BY 4.0

gradually.ai

OpenAI führt mit 35 Modellen, gefolgt von Anthropic mit 19 und Google mit 18. Diese Zahl misst allerdings nur die Pflegetiefe der Modellpalette, nicht die tatsächliche Nutzung. Bei den realen Marktanteilen sieht das Bild anders aus: Im Web-Traffic der KI-Chatbots dominiert ChatGPT, während Gemini und Claude dahinter folgen.

3. Parameter und Architektur: das Ende der Größenangaben

Jahrelang galt die Parameterzahl als wichtigste Kennzahl eines Modells. GPT-3 hatte 175 Milliarden, GPT-4 schätzungsweise 1,76 Billionen. Doch dann hörten die Labore auf, diese Zahl zu nennen.

Heute gilt:

Bei allen aktuellen Spitzenmodellen von OpenAI, Anthropic, Google und xAI ist die Parameterzahl offiziell unbekannt. Modellgröße ist zum Geschäftsgeheimnis geworden. Konkrete, bestätigte Zahlen gibt es fast nur noch bei Open-Weights-Modellen, und die sind riesig. Neuer Spitzenreiter ist Kimi K3 von Moonshot AI mit offiziell 2,8 Billionen Parametern (vorgestellt am 16.07.2026, die Gewichte sind seit dem 27.07. unter der eigenen „Kimi K3 License“ verfügbar):

Kimi K3MoE, 896 Experten (16 aktiv)

2.800 Mrd.

DeepSeek-V4-ProMoE, 49 Mrd. aktiv

1.600 Mrd.

Kimi K2.6MoE, 32 Mrd. aktiv

1.000 Mrd.

Qwen 3.6 Maxgeschätzt

~1.000 Mrd.

GLM-5.2MoE, 40 Mrd. aktiv

744 Mrd.

DeepSeek V3.2MoE, 37 Mrd. aktiv

685 Mrd.

Mistral Large 3MoE, 41 Mrd. aktiv

675 Mrd.

Llama 4 MaverickMoE, 17 Mrd. aktiv

400 Mrd.

Grok-1MoE (2024)

314 Mrd.

Quelle: gradually.ai LLM-Datenbank

CC BY 4.0

gradually.ai

Auffällig ist die Architektur. Fast alle großen Modelle nutzen heute ein Mixture-of-Experts-Design (MoE), bei dem pro Anfrage nur ein Bruchteil der Parameter aktiv ist. DeepSeek-V4-Pro hat zwar 1,6 Billionen Parameter, aktiviert davon aber nur 49 Milliarden pro Token, also rund 3 %. Das macht riesige Modelle bezahlbar im Betrieb. Insgesamt sind 44 der erfassten Modelle als MoE gebaut.

Die vollständige Parameter-Datenbank kannst du hier nach Anbieter, Größe und Typ filtern und durchsuchen. Bei den meisten aktuellen Spitzenmodellen steht in der Spalte Parameter bewusst „unbekannt“:

Legende:

500+ Mrd.

100-500 Mrd.

20-100 Mrd.

5-20 Mrd.

Unter 5 Mrd.

Zeige 157 Modelle

Parameter-Größen bekannter Large Language Models (Stand: Mai 2026)
Modell	Entwickler	Parameter	Typ	Release
GPT-5.6 Sol	OpenAI	Unbekannt	Proprietär	Juni 2026
GPT-5.6 Terra	OpenAI	Unbekannt	Proprietär	Juni 2026
GPT-5.6 Luna	OpenAI	Unbekannt	Proprietär	Juni 2026
GPT-5.5	OpenAI	Unbekannt	Proprietär	Apr. 2026
GPT-5.5 Pro	OpenAI	Unbekannt	Proprietär	Apr. 2026
GPT-5.5 Instant	OpenAI	Unbekannt	Proprietär	Mai 2026
ChatGPT chat-latest	OpenAI	Unbekannt	Proprietär	Juni 2026
GPT-5.4	OpenAI	Unbekannt	Proprietär	März 2026
GPT-5.4 Pro	OpenAI	Unbekannt	Proprietär	März 2026
GPT-5.4 mini	OpenAI	Unbekannt	Proprietär	März 2026
GPT-5.4 nano	OpenAI	Unbekannt	Proprietär	März 2026
GPT-5.3-Codex	OpenAI	Unbekannt	Proprietär	Feb. 2026
GPT-5.3 Instant	OpenAI	Unbekannt	Proprietär	Feb. 2026
GPT-5.2	OpenAI	Unbekannt	Proprietär	Dez. 2025
GPT-5.1 Instant	OpenAI	Unbekannt	Proprietär	Nov. 2025
GPT-5.1 Thinking	OpenAI	Unbekannt	Proprietär	Nov. 2025
GPT-5	OpenAI	Unbekannt	Proprietär	Aug. 2025
GPT-5 pro	OpenAI	Unbekannt	Proprietär	Aug. 2025
GPT-5 mini	OpenAI	Unbekannt	Proprietär	Aug. 2025
GPT-5 nano	OpenAI	Unbekannt	Proprietär	Aug. 2025
GPT-4.1	OpenAI	Unbekannt	Proprietär	Apr. 2025
GPT-4.1 mini	OpenAI	Unbekannt	Proprietär	Apr. 2025
GPT-4.1 nano	OpenAI	Unbekannt	Proprietär	Apr. 2025
GPT-3.5 Turbo	OpenAI	Unbekannt	Proprietär	Nov. 2022
o3	OpenAI	Unbekannt	Proprietär	Apr. 2025
o3-pro	OpenAI	Unbekannt	Proprietär	Juni 2025
o3-mini	OpenAI	Unbekannt	Proprietär	Jan. 2025
o4-mini	OpenAI	Unbekannt	Proprietär	Apr. 2025
o1	OpenAI	Unbekannt	Proprietär	Sept. 2024
o1-mini	OpenAI	Unbekannt	Proprietär	Sept. 2024
Claude Fable 5	Anthropic	Unbekannt	Proprietär	Juni 2026
Claude Mythos 5	Anthropic	Unbekannt	Proprietär	Juni 2026
Claude Sonnet 5	Anthropic	Unbekannt	Proprietär	Juni 2026
Claude Opus 5	Anthropic	Unbekannt	Proprietär	Juli 2026
Claude Opus 4.8	Anthropic	Unbekannt	Proprietär	Mai 2026
Claude Opus 4.7	Anthropic	Unbekannt	Proprietär	Apr. 2026
Claude Opus 4.6	Anthropic	Unbekannt	Proprietär	Feb. 2026
Claude Sonnet 4.6	Anthropic	Unbekannt	Proprietär	Feb. 2026
Claude Opus 4.5	Anthropic	Unbekannt	Proprietär	Nov. 2025
Claude Opus 4.1	Anthropic	Unbekannt	Proprietär	Aug. 2025
Claude Sonnet 4.5	Anthropic	Unbekannt	Proprietär	Sept. 2025
Claude Haiku 4.5	Anthropic	Unbekannt	Proprietär	Okt. 2025
Claude Sonnet 4	Anthropic	Unbekannt	Proprietär	Mai 2025
Claude Opus 4	Anthropic	Unbekannt	Proprietär	Mai 2025
Claude Sonnet 3.7	Anthropic	Unbekannt	Proprietär	Feb. 2025
Claude 3.5 Haiku	Anthropic	Unbekannt	Proprietär	Okt. 2024
Gemini 3.6 Flash MoE	Google	Unbekannt	Proprietär	Juli 2026
Gemini 3.5 Flash MoE	Google	Unbekannt	Proprietär	Mai 2026
Gemini 3.1 Pro MoE	Google	Unbekannt	Proprietär	Feb. 2026
Gemini 3 Flash MoE	Google	Unbekannt	Proprietär	Dez. 2025
Gemini 3.5 Flash-Lite MoE	Google	Unbekannt	Proprietär	Juli 2026
Gemini 3.1 Flash-Lite MoE	Google	Unbekannt	Proprietär	Feb. 2026
Gemini 2.5 Pro MoE	Google	Unbekannt	Proprietär	März 2025
Gemini 2.5 Flash MoE	Google	Unbekannt	Proprietär	Apr. 2025
Gemini 2.5 Flash-Lite MoE	Google	Unbekannt	Proprietär	Mai 2025
Gemini 3 Pro MoE	Google	Unbekannt	Proprietär	Dez. 2025
Gemini 2.0 Flash MoE	Google	Unbekannt	Proprietär	Dez. 2024
Gemini 1.5 Pro MoE	Google	Unbekannt	Proprietär	Feb. 2024
Grok 4.5	xAI	Unbekannt	Proprietär	Juli 2026
Grok 4.3	xAI	Unbekannt	Proprietär	Apr. 2026
Grok Build 0.1	xAI	Unbekannt	Proprietär	Juni 2026
Grok 4	xAI	Unbekannt	Proprietär	Juli 2025
Grok 3	xAI	Unbekannt	Proprietär	Feb. 2025
Grok 2	xAI	Unbekannt	Proprietär	Aug. 2024
Mistral Medium 3.5	Mistral AI	Unbekannt	Proprietär	Juni 2026
Mistral Small 3	Mistral AI	Unbekannt	Open Weights	Jan. 2025
MiniMax M3	MiniMax	Unbekannt	Proprietär	Juni 2026
Qwen 3.7 Max MoE	Alibaba	Unbekannt	Proprietär	Mai 2026
Qwen 3.7 Plus MoE	Alibaba	Unbekannt	Proprietär	Juni 2026
Nova 2 Lite	Amazon	Unbekannt	Proprietär	Dez. 2025
Nova Premier 1.0	Amazon	Unbekannt	Proprietär	Apr. 2025
Nova Pro 1.0	Amazon	Unbekannt	Proprietär	Dez. 2024
Nova Lite 1.0	Amazon	Unbekannt	Proprietär	Dez. 2024
Nova Micro 1.0	Amazon	Unbekannt	Proprietär	Dez. 2024
Sonar	Perplexity	Unbekannt	Proprietär	Jan. 2025
Sonar Pro	Perplexity	Unbekannt	Proprietär	Jan. 2025
Sonar Reasoning Pro	Perplexity	Unbekannt	Proprietär	Feb. 2025
Sonar Deep Research	Perplexity	Unbekannt	Proprietär	Feb. 2025
MiMo-V2.5 MoE	Xiaomi	Unbekannt	Open Weights	Apr. 2026
Solar Mini	Upstage	Unbekannt	Proprietär	Jan. 2024
Kimi K3 MoE	Moonshot AI	2,8 Billionen	Proprietär	Juli 2026
Claude 3 Opus	Anthropic	2 Billionen*	Proprietär	März 2024
Llama 4 Behemoth MoE(288 Mrd. aktiv)	Meta	2 Billionen	Open Weights	Apr. 2025
GPT-4 MoE(220 Mrd. aktiv)	OpenAI	1,76 Billionen*	Proprietär	März 2023
DeepSeek-V4-Pro MoE(49 Mrd. aktiv)	DeepSeek	1,6 Billionen	Open Weights	Apr. 2026
Kimi K2.6 MoE(32 Mrd. aktiv)	Moonshot AI	1 Billionen	Open Weights	Apr. 2026
Kimi K2.7 Code MoE(32 Mrd. aktiv)	Moonshot AI	1 Billionen	Open Weights	Juni 2026
Qwen 3.6 Max-Preview MoE	Alibaba	1 Billionen*	Proprietär	Apr. 2026
Yi-Large MoE	01.AI	1 Billionen	Proprietär	Mai 2024
MiMo-V2.5-Pro MoE(42 Mrd. aktiv)	Xiaomi	1 Billionen	Open Weights	Apr. 2026
MiMo-V2.5-Pro-UltraSpeed MoE(42 Mrd. aktiv)	Xiaomi	1 Billionen	Open Weights	Juni 2026
GLM-5.1 MoE	Z.ai	754 Mrd.	Open Weights	Apr. 2026
GLM-5.2 MoE	Z.ai	753 Mrd.	Open Weights	Juni 2026
GLM-5 MoE(40 Mrd. aktiv)	Z.ai	744 Mrd.	Open Weights	Feb. 2026
DeepSeek-V3.2 MoE(37 Mrd. aktiv)	DeepSeek	685 Mrd.	Open Weights	Dez. 2025
Mistral Large 3 MoE(41 Mrd. aktiv)	Mistral AI	675 Mrd.	Open Weights	Dez. 2025
DeepSeek-V3 MoE(37 Mrd. aktiv)	DeepSeek	671 Mrd.	Open Weights	Dez. 2024
DeepSeek-R1 MoE(37 Mrd. aktiv)	DeepSeek	671 Mrd.	Open Weights	Jan. 2025
PaLM	Google	540 Mrd.	Proprietär	Apr. 2022
Megatron-Turing NLG	NVIDIA	530 Mrd.	Proprietär	Jan. 2022
Llama 3.1 405B	Meta	405 Mrd.	Open Weights	Juli 2024
Llama 4 Maverick MoE(17 Mrd. aktiv)	Meta	400 Mrd.	Open Weights	Apr. 2025
Nemotron-4 340B	NVIDIA	340 Mrd.	Open Weights	Juni 2024
PaLM 2	Google	340 Mrd.*	Proprietär	Mai 2023
Grok 1 MoE(86 Mrd. aktiv)	xAI	314 Mrd.	Open Weights	Nov. 2023
DeepSeek-V4-Flash MoE(13 Mrd. aktiv)	DeepSeek	284 Mrd.	Open Weights	Apr. 2026
DeepSeek-V2 MoE(21 Mrd. aktiv)	DeepSeek	236 Mrd.	Open Weights	Mai 2024
GPT-4o	OpenAI	200 Mrd.*	Proprietär	Mai 2024
Step 3.7 Flash MoE(11 Mrd. aktiv)	StepFun	198 Mrd.	Open Weights	Mai 2026
Step 3.5 Flash MoE(11 Mrd. aktiv)	StepFun	196,8 Mrd.	Open Weights	Feb. 2026
Falcon 180B	TII	180 Mrd.	Open Weights	Sept. 2023
Mixtral 8x22B MoE(44 Mrd. aktiv)	Mistral AI	176 Mrd.	Open Weights	Apr. 2024
BLOOM	BigScience	176 Mrd.	Open Source	Juli 2022
GPT-3	OpenAI	175 Mrd.	Proprietär	Juni 2020
Claude 3.5 Sonnet	Anthropic	175 Mrd.*	Proprietär	Juni 2024
OPT-175B	Meta	175 Mrd.	Open Source	Mai 2022
LaMDA	Google	137 Mrd.	Proprietär	Jan. 2022
DBRX MoE(36 Mrd. aktiv)	Databricks	132 Mrd.	Open Weights	März 2024
Mistral Large 2	Mistral AI	123 Mrd.	Open Weights	Juli 2024
Mistral Small 4 MoE(6 Mrd. aktiv)	Mistral AI	119 Mrd.	Open Weights	März 2026
Command A	Cohere	111 Mrd.	Proprietär	März 2025
Llama 4 Scout MoE(17 Mrd. aktiv)	Meta	109 Mrd.	Open Weights	Apr. 2025
Command R+	Cohere	104 Mrd.	Open Weights	Apr. 2024
Solar Pro 3 MoE	Upstage	102 Mrd.	Proprietär	Jan. 2026
Qwen 2.5 72B	Alibaba	72 Mrd.	Open Weights	Sept. 2024
Claude 3 Sonnet	Anthropic	70 Mrd.*	Proprietär	März 2024
Llama 3.3 70B	Meta	70 Mrd.	Open Weights	Dez. 2024
Llama 3.1 70B	Meta	70 Mrd.	Open Weights	Juli 2024
Llama 3 70B	Meta	70 Mrd.	Open Weights	Apr. 2024
Llama 2 70B	Meta	70 Mrd.	Open Weights	Juli 2023
Mixtral 8x7B MoE(14 Mrd. aktiv)	Mistral AI	56 Mrd.	Open Weights	Dez. 2023
Falcon 40B	TII	40 Mrd.	Open Source	Mai 2023
Yi-34B	01.AI	34 Mrd.	Open Weights	Nov. 2023
Qwen 2.5 32B	Alibaba	32 Mrd.	Open Weights	Sept. 2024
Command R	Cohere	32 Mrd.	Open Weights	März 2024
Solar Pro 2	Upstage	31 Mrd.	Proprietär	Juli 2025
Gemma 2 27B	Google	27 Mrd.	Open Weights	Juni 2024
Claude 3 Haiku	Anthropic	20 Mrd.*	Proprietär	März 2024
Qwen 2.5 14B	Alibaba	14 Mrd.	Open Weights	Sept. 2024
Phi-4	Microsoft	14 Mrd.	Open Weights	Dez. 2024
Gemma 2 9B	Google	9 Mrd.	Open Weights	Juni 2024
GPT-4o mini	OpenAI	8 Mrd.*	Proprietär	Juli 2024
Llama 3.1 8B	Meta	8 Mrd.	Open Weights	Juli 2024
Llama 3 8B	Meta	8 Mrd.	Open Weights	Apr. 2024
Ministral 8B	Mistral AI	8 Mrd.	Open Weights	Okt. 2024
Mistral 7B	Mistral AI	7 Mrd.	Open Source	Sept. 2023
Qwen 2.5 7B	Alibaba	7 Mrd.	Open Weights	Sept. 2024
Command R7B	Cohere	7 Mrd.	Open Weights	Dez. 2024
Phi-4 Multimodal	Microsoft	5,6 Mrd.	Open Weights	Feb. 2025
Phi-4 mini	Microsoft	3,8 Mrd.	Open Weights	Feb. 2025
Phi-3 mini	Microsoft	3,8 Mrd.	Open Weights	Apr. 2024
Gemini Nano 2	Google	3,3 Mrd.	Proprietär	Dez. 2023
Ministral 3B	Mistral AI	3 Mrd.	Open Weights	Okt. 2024
Gemma 2 2B	Google	2 Mrd.	Open Weights	Juli 2024
Gemini Nano 1	Google	1,8 Mrd.	Proprietär	Dez. 2023
GPT-2	OpenAI	1,5 Mrd.	Open Source	Feb. 2019
Qwen 2.5 0.5B	Alibaba	0,5 Mrd.	Open Weights	Sept. 2024

Parameter-Größen bekannter Large Language Models (Stand: Mai 2026)

4. Kontextfenster: von 200.000 bis 10 Millionen Tokens

Das Kontextfenster bestimmt, wie viel Text ein Modell auf einmal verarbeiten kann. Hier haben sich die Größenordnungen in den letzten zwei Jahren vervielfacht. Die folgende Übersicht zeigt über 140 aktuelle Modelle, sortierbar und nach Anbieter filterbar:

Legende:

1 Mio.+ Tokens

200.000-1 Mio. Tokens

100.000-200.000 Tokens

32.000-100.000 Tokens

Unter 32.000 Tokens

Zeige 209 Modelle

Kontextfenster-Größen aktueller KI-Sprachmodelle (Stand: Mai 2026)
Modell	Entwickler	Kontextfenster	Entspricht ca.
Llama 4 Scout	Meta	10 Mio.	≈ 25.000 Seiten (ca. 30 Harry-Potter-Bände)
Qwen-Long	Alibaba	10 Mio.	≈ 25.000 Seiten (ca. 30 Harry-Potter-Bände)
Gemini 2.0 Pro	Google	2 Mio.	≈ 5.000 Seiten (ca. 6 Harry-Potter-Bände)
Gemini 1.5 Pro	Google	2 Mio.	≈ 5.000 Seiten (ca. 6 Harry-Potter-Bände)
Grok 4.1 Fast	xAI	2 Mio.	≈ 5.000 Seiten (ca. 6 Harry-Potter-Bände)
Grok 4 Fast	xAI	2 Mio.	≈ 5.000 Seiten (ca. 6 Harry-Potter-Bände)
Llama 4 Maverick	Meta	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 3.6 Flash	Google	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 3.5 Flash	Google	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 3.1 Pro	Google	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 3.5 Flash-Lite	Google	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 3.1 Flash-Lite	Google	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 3 Pro	Google	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 3 Flash	Google	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 2.5 Pro	Google	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 2.5 Flash	Google	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 2.5 Flash-Lite	Google	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 2.0 Flash	Google	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 1.5 Flash	Google	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Grok 4.3	xAI	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Fable 5	Anthropic	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Mythos 5	Anthropic	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Sonnet 5	Anthropic	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Opus 5	Anthropic	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Opus 4.8	Anthropic	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Opus 4.7	Anthropic	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Opus 4.6	Anthropic	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Sonnet 4.6	Anthropic	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-5.6 Sol	OpenAI	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-5.6 Terra	OpenAI	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-5.6 Luna	OpenAI	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-5.5	OpenAI	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-5.5 Pro	OpenAI	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
ChatGPT chat-latest	OpenAI	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-5.4	OpenAI	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-5.4 Pro	OpenAI	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-4.1	OpenAI	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-4.1 mini	OpenAI	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-4.1 nano	OpenAI	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
DeepSeek V4 Pro	DeepSeek	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
DeepSeek V4 Flash	DeepSeek	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Kimi K3	Moonshot AI	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
MiniMax M3	MiniMax	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Qwen 3.7 Max	Alibaba	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Qwen-Plus	Alibaba	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Qwen-Turbo	Alibaba	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Qwen 3.7 Plus	Alibaba	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GLM-5.2	Z.ai	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
MiMo-V2.5	Xiaomi	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
MiMo-V2.5-Pro	Xiaomi	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
MiMo-V2.5-Pro-UltraSpeed	Xiaomi	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Amazon Nova Premier	Amazon	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Amazon Nova 2 Lite	Amazon	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Amazon Nova 2 Sonic	Amazon	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
MiniMax-01	MiniMax	1 Mio.	≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Grok 4.5	xAI	500.000	≈ 1.250 Seiten (ca. 5 Romane)
GPT-5.5 Instant	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
GPT-5.4 mini	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
GPT-5.4 nano	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
GPT-5.3-Codex	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
GPT-5.3 Instant	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
GPT-5.2	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
GPT-5.1 Thinking	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
GPT-5.1 Instant	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
GPT-5.2 Pro	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
GPT-5.1	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
GPT-5	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
GPT-5 pro	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
GPT-5 mini	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
GPT-5 nano	OpenAI	400.000	≈ 1.000 Seiten (ca. 4 Romane)
Amazon Nova Pro	Amazon	300.000	≈ 750 Seiten (ca. 3 Romane)
Amazon Nova Lite	Amazon	300.000	≈ 750 Seiten (ca. 3 Romane)
Kimi K2.6	Moonshot AI	262.144	≈ 655 Seiten (ca. 2 Romane)
Kimi K2.7 Code	Moonshot AI	262.144	≈ 655 Seiten (ca. 2 Romane)
Qwen 3.6 Max-Preview	Alibaba	262.144	≈ 655 Seiten (ca. 2 Romane)
Qwen3-Max	Alibaba	262.144	≈ 655 Seiten (ca. 2 Romane)
Grok Build 0.1	xAI	256.000	≈ 640 Seiten (ca. 2 Romane)
Grok 4.1	xAI	256.000	≈ 640 Seiten (ca. 2 Romane)
Grok 4	xAI	256.000	≈ 640 Seiten (ca. 2 Romane)
Mistral Large 3	Mistral	256.000	≈ 640 Seiten (ca. 2 Romane)
Mistral Medium 3.5	Mistral	256.000	≈ 640 Seiten (ca. 2 Romane)
Mistral Small 4	Mistral	256.000	≈ 640 Seiten (ca. 2 Romane)
Codestral Mamba	Mistral	256.000	≈ 640 Seiten (ca. 2 Romane)
Qwen3-235B-A22B (256K Update)	Alibaba	256.000	≈ 640 Seiten (ca. 2 Romane)
Step 3.5 Flash	StepFun	256.000	≈ 640 Seiten (ca. 2 Romane)
Step 3.7 Flash	StepFun	256.000	≈ 640 Seiten (ca. 2 Romane)
Command A	Cohere	256.000	≈ 640 Seiten (ca. 2 Romane)
Command A Reasoning	Cohere	256.000	≈ 640 Seiten (ca. 2 Romane)
Jamba 1.5 Large	AI21 Labs	256.000	≈ 640 Seiten (ca. 2 Romane)
Jamba 1.5 Mini	AI21 Labs	256.000	≈ 640 Seiten (ca. 2 Romane)
Jamba	AI21 Labs	256.000	≈ 640 Seiten (ca. 2 Romane)
abab6.5s	MiniMax	245.760	≈ 614 Seiten (ca. 2 Romane)
Claude Opus 4.5	Anthropic	200.000	≈ 500 Seiten (ca. 2 Romane)
Claude Sonnet 4.5	Anthropic	200.000	≈ 500 Seiten (ca. 2 Romane)
Claude Haiku 4.5	Anthropic	200.000	≈ 500 Seiten (ca. 2 Romane)
Claude Sonnet 4	Anthropic	200.000	≈ 500 Seiten (ca. 2 Romane)
Claude Opus 4	Anthropic	200.000	≈ 500 Seiten (ca. 2 Romane)
Claude Opus 4.1	Anthropic	200.000	≈ 500 Seiten (ca. 2 Romane)
Claude Sonnet 3.7	Anthropic	200.000	≈ 500 Seiten (ca. 2 Romane)
Claude 3.5 Sonnet	Anthropic	200.000	≈ 500 Seiten (ca. 2 Romane)
Claude 3.5 Haiku	Anthropic	200.000	≈ 500 Seiten (ca. 2 Romane)
Claude 3 Opus	Anthropic	200.000	≈ 500 Seiten (ca. 2 Romane)
Claude 3 Sonnet	Anthropic	200.000	≈ 500 Seiten (ca. 2 Romane)
Claude 3 Haiku	Anthropic	200.000	≈ 500 Seiten (ca. 2 Romane)
o3	OpenAI	200.000	≈ 500 Seiten (ca. 2 Romane)
o3-pro	OpenAI	200.000	≈ 500 Seiten (ca. 2 Romane)
o4-mini	OpenAI	200.000	≈ 500 Seiten (ca. 2 Romane)
o3-mini	OpenAI	200.000	≈ 500 Seiten (ca. 2 Romane)
o1	OpenAI	200.000	≈ 500 Seiten (ca. 2 Romane)
GLM-5.1	Z.ai	200.000	≈ 500 Seiten (ca. 2 Romane)
GLM-5	Z.ai	200.000	≈ 500 Seiten (ca. 2 Romane)
Sonar Pro	Perplexity	200.000	≈ 500 Seiten (ca. 2 Romane)
Yi-34B-200K	01.AI	200.000	≈ 500 Seiten (ca. 2 Romane)
Yi-6B-200K	01.AI	200.000	≈ 500 Seiten (ca. 2 Romane)
Grok 3	xAI	131.072	≈ 328 Seiten (ca. 1 Roman)
Solar Pro 3	Upstage	131.072	≈ 328 Seiten (ca. 1 Roman)
Llama 3.3 70B	Meta	128.000	≈ 320 Seiten (ca. 1 Roman)
Llama 3.2 90B Vision	Meta	128.000	≈ 320 Seiten (ca. 1 Roman)
Llama 3.2 11B Vision	Meta	128.000	≈ 320 Seiten (ca. 1 Roman)
Llama 3.2 3B	Meta	128.000	≈ 320 Seiten (ca. 1 Roman)
Llama 3.2 1B	Meta	128.000	≈ 320 Seiten (ca. 1 Roman)
Llama 3.1 405B	Meta	128.000	≈ 320 Seiten (ca. 1 Roman)
Llama 3.1 70B	Meta	128.000	≈ 320 Seiten (ca. 1 Roman)
Llama 3.1 8B	Meta	128.000	≈ 320 Seiten (ca. 1 Roman)
Gemma 3 27B	Google	128.000	≈ 320 Seiten (ca. 1 Roman)
Gemma 3 12B	Google	128.000	≈ 320 Seiten (ca. 1 Roman)
Gemma 3 4B	Google	128.000	≈ 320 Seiten (ca. 1 Roman)
Grok 2	xAI	128.000	≈ 320 Seiten (ca. 1 Roman)
o1-mini	OpenAI	128.000	≈ 320 Seiten (ca. 1 Roman)
GPT-4.5	OpenAI	128.000	≈ 320 Seiten (ca. 1 Roman)
GPT-4o	OpenAI	128.000	≈ 320 Seiten (ca. 1 Roman)
GPT-4o mini	OpenAI	128.000	≈ 320 Seiten (ca. 1 Roman)
GPT-4 Turbo	OpenAI	128.000	≈ 320 Seiten (ca. 1 Roman)
DeepSeek V3.1	DeepSeek	128.000	≈ 320 Seiten (ca. 1 Roman)
DeepSeek V3	DeepSeek	128.000	≈ 320 Seiten (ca. 1 Roman)
DeepSeek R1	DeepSeek	128.000	≈ 320 Seiten (ca. 1 Roman)
DeepSeek R1 Distill Llama 70B	DeepSeek	128.000	≈ 320 Seiten (ca. 1 Roman)
DeepSeek R1 Distill Qwen 32B	DeepSeek	128.000	≈ 320 Seiten (ca. 1 Roman)
DeepSeek R1 Distill Qwen 14B	DeepSeek	128.000	≈ 320 Seiten (ca. 1 Roman)
DeepSeek R1 Distill Qwen 7B	DeepSeek	128.000	≈ 320 Seiten (ca. 1 Roman)
DeepSeek R1 Distill Llama 8B	DeepSeek	128.000	≈ 320 Seiten (ca. 1 Roman)
DeepSeek V2.5	DeepSeek	128.000	≈ 320 Seiten (ca. 1 Roman)
DeepSeek Coder V2	DeepSeek	128.000	≈ 320 Seiten (ca. 1 Roman)
Mistral Large 2	Mistral	128.000	≈ 320 Seiten (ca. 1 Roman)
Mistral Small 3	Mistral	128.000	≈ 320 Seiten (ca. 1 Roman)
Ministral 8B	Mistral	128.000	≈ 320 Seiten (ca. 1 Roman)
Ministral 3B	Mistral	128.000	≈ 320 Seiten (ca. 1 Roman)
Mistral NeMo	Mistral	128.000	≈ 320 Seiten (ca. 1 Roman)
Qwen3-235B-A22B	Alibaba	128.000	≈ 320 Seiten (ca. 1 Roman)
Qwen3-32B	Alibaba	128.000	≈ 320 Seiten (ca. 1 Roman)
Qwen3-14B	Alibaba	128.000	≈ 320 Seiten (ca. 1 Roman)
Qwen3-8B	Alibaba	128.000	≈ 320 Seiten (ca. 1 Roman)
Qwen3-30B-A3B	Alibaba	128.000	≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 72B	Alibaba	128.000	≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 32B	Alibaba	128.000	≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 14B	Alibaba	128.000	≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 7B	Alibaba	128.000	≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 Coder 32B	Alibaba	128.000	≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 Coder 14B	Alibaba	128.000	≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 Coder 7B	Alibaba	128.000	≈ 320 Seiten (ca. 1 Roman)
Command R7B	Cohere	128.000	≈ 320 Seiten (ca. 1 Roman)
Sonar	Perplexity	128.000	≈ 320 Seiten (ca. 1 Roman)
Sonar Reasoning Pro	Perplexity	128.000	≈ 320 Seiten (ca. 1 Roman)
Sonar Deep Research	Perplexity	128.000	≈ 320 Seiten (ca. 1 Roman)
Command R+	Cohere	128.000	≈ 320 Seiten (ca. 1 Roman)
Command R	Cohere	128.000	≈ 320 Seiten (ca. 1 Roman)
Amazon Nova Micro	Amazon	128.000	≈ 320 Seiten (ca. 1 Roman)
Phi-4-mini	Microsoft	128.000	≈ 320 Seiten (ca. 1 Roman)
Phi-3.5-mini	Microsoft	128.000	≈ 320 Seiten (ca. 1 Roman)
Phi-3.5-MoE	Microsoft	128.000	≈ 320 Seiten (ca. 1 Roman)
Phi-3 Medium	Microsoft	128.000	≈ 320 Seiten (ca. 1 Roman)
Phi-3 Small	Microsoft	128.000	≈ 320 Seiten (ca. 1 Roman)
Phi-3 Mini	Microsoft	128.000	≈ 320 Seiten (ca. 1 Roman)
Yi-Coder 9B	01.AI	128.000	≈ 320 Seiten (ca. 1 Roman)
Yi-Coder 1.5B	01.AI	128.000	≈ 320 Seiten (ca. 1 Roman)
Llama-3.1-Nemotron-70B	Nvidia	128.000	≈ 320 Seiten (ca. 1 Roman)
Llama-3.1-Nemotron-51B	Nvidia	128.000	≈ 320 Seiten (ca. 1 Roman)
Mistral-NeMo-Minitron 8B	Nvidia	128.000	≈ 320 Seiten (ca. 1 Roman)
Reka Core	Reka	128.000	≈ 320 Seiten (ca. 1 Roman)
Reka Flash	Reka	128.000	≈ 320 Seiten (ca. 1 Roman)
Reka Edge	Reka	128.000	≈ 320 Seiten (ca. 1 Roman)
GLM-4	Zhipu AI	128.000	≈ 320 Seiten (ca. 1 Roman)
ChatGLM3-6B	Zhipu AI	128.000	≈ 320 Seiten (ca. 1 Roman)
ERNIE 4.0	Baidu	128.000	≈ 320 Seiten (ca. 1 Roman)
Mixtral 8x22B	Mistral	65.536	≈ 164 Seiten
Solar Pro 2	Upstage	65.536	≈ 164 Seiten
Phi-4-mini-flash-reasoning	Microsoft	64.000	≈ 160 Seiten
Mixtral 8x7B	Mistral	32.768	≈ 82 Seiten
Codestral	Mistral	32.768	≈ 82 Seiten
Qwen3-4B	Alibaba	32.768	≈ 82 Seiten
Qwen3-1.7B	Alibaba	32.768	≈ 82 Seiten
Qwen3-0.6B	Alibaba	32.768	≈ 82 Seiten
Solar Mini	Upstage	32.768	≈ 82 Seiten
Phi-4-reasoning	Microsoft	32.768	≈ 82 Seiten
DBRX	Databricks	32.768	≈ 82 Seiten
Gemma 3 1B	Google	32.000	≈ 80 Seiten
Yi-Large	01.AI	32.000	≈ 80 Seiten
Phi-4	Microsoft	16.384	≈ 41 Seiten
Yi-Zap	01.AI	16.000	≈ 40 Seiten
Gemma 2 27B	Google	8.192	≈ 20 Seiten
Gemma 2 9B	Google	8.192	≈ 20 Seiten
GPT-4	OpenAI	8.192	≈ 20 Seiten
Jurassic-2 Ultra	AI21 Labs	8.192	≈ 20 Seiten
GLM-4V	Zhipu AI	8.192	≈ 20 Seiten
ERNIE 3.5	Baidu	8.000	≈ 20 Seiten
Command	Cohere	4.096	≈ 10 Seiten
Nemotron-4 340B	Nvidia	4.096	≈ 10 Seiten
StableLM 2 12B	Stability AI	4.096	≈ 10 Seiten
StableLM Zephyr 3B	Stability AI	4.096	≈ 10 Seiten

Kontextfenster-Größen aktueller KI-Sprachmodelle (Stand: Mai 2026)

Die Spitze bilden Llama 4 Scout und Qwen-Long mit jeweils 10 Millionen Tokens. Das entspricht etwa 30 Bänden Harry Potter in einem einzigen Prompt. Die aktuellen Allrounder liegen meist um 1 Million Tokens. GPT-5.5 liegt bei 1 Million, Claude Opus 5 und Gemini 3.1 Pro bei 1 Million. Mehr zu den einzelnen Modellfamilien findest du in unseren Übersichten zu den Claude-Modellen und Gemini-Modellen.

5. Was kostet ein LLM? Preise pro 1 Million Tokens

Bei den API-Preisen liegen Welten zwischen den Modellen. Das günstigste Modell mit API-Zugang ist GPT-5 nano mit 0,05 USD pro 1 Million Input-Tokens. Das teuerste ist GPT-5.5 Pro mit 30 USD, also dem 600-Fachen.

Spannender als der reine Preis ist aber das Verhältnis von Preis zu Leistung. Die folgende Grafik trägt den Input-Preis gegen die Coding-Leistung (SWE-bench Verified) ab. Modelle unten rechts sind ideal: stark und günstig.

Preis-Leistung: SWE-bench gegen Input-Preis

Anthropic

OpenAI

Google

DeepSeek

Moonshot AI

Effizienz-Grenze (beste Preis-Leistung)

Quellen: gradually.ai LLM-Datenbank (Preise + Benchmarks)

CC BY 4.0

gradually.ai

Der heimliche Star dieser Grafik ist DeepSeek-V4-Pro. Mit 80,6 % SWE-bench bei nur 0,435 USD Input-Preis liegt das Modell auf der Effizienz-Grenze, kein anderes Modell ist gleichzeitig stärker und günstiger. Wer also nicht zwingend die letzten Prozentpunkte Coding-Leistung braucht, bekommt mit den offenen Modellen ein extrem gutes Preis-Leistungs-Verhältnis. Eine ausführliche Kostenrechnung für deine konkrete Nutzung liefert der API-Kostenrechner.

6. LLM-Leistung im Direktvergleich

Um die Stärken und Schwächen der führenden Modelle auf einen Blick sichtbar zu machen, vergleicht das folgende Radar fünf repräsentative Spitzenmodelle über vier Dimensionen: Reasoning, Coding, Kontextfenster und Preis-Effizienz. Jede Achse ist relativ zu den fünf Modellen skaliert, damit auch kleine Vorsprünge sichtbar werden. Die echten Werte erscheinen im Tooltip.

Claude Opus 4.8

Gemini 3.1 Pro

Gemini 3.5 Flash

Claude Sonnet 4.6

GPT-5.5

Quellen: Artificial Analysis, gradually.ai LLM-Datenbank

CC BY 4.0

gradually.ai

Das Muster ist klar erkennbar. Claude Opus 4.8 und GPT-5.5 dominieren bei der reinen Coding-Leistung, sind aber teuer. Gemini 3.5 Flash dreht das um, denn beim Reasoning liegt es fast auf Augenhöhe und nur beim Coding zurück, dafür die beste Preis-Effizienz im Feld. Auf diese eine Abwägung läuft jedes KI-Projekt am Ende hinaus, maximale Qualität gegen maximale Wirtschaftlichkeit.

7. Open Source gegen proprietär

Eine der wichtigsten Entwicklungen 2026 ist das Aufholen der offenen Modelle. Von den 157 erfassten Modellen sind 98 proprietär und 59 offen verfügbar, davon 54 mit offenen Gewichten und 5 vollständig quelloffen.

Aber an der absoluten Spitze:

Laut Stanford AI Index 2026 führte das beste geschlossene Modell Anfang 2026 mit 3,3 Prozentpunkten vor dem besten Open-Weights-Modell. Im August 2024 waren es nur 0,5 Prozentpunkte gewesen. An der Spitze ist der Abstand also nicht geschrumpft, sondern wieder gewachsen, denn sechs der zehn besten Modelle in der Chatbot Arena sind inzwischen wieder geschlossen. In unseren Daten zeigt sich derselbe Vorsprung beim Coding. DeepSeek-V4-Pro (80,6 % SWE-bench) und Kimi K2.6 (80,2 %) liegen rund 8 Prozentpunkte hinter Claude Opus 4.8 (88,6 %). GPT-5.5 kommt im Vals-AI-Harness auf 82,6 %. Eine Übersicht der besten freien Modelle findest du in unserem Artikel zu den Open-Source-LLMs.

Wie sich der Lizenz-Mix auf die einzelnen Anbieter verteilt, zeigt die folgende Übersicht. Die Spaltenbreite steht für die Anzahl getrackter Modelle je Anbieter, die Farben für den Lizenztyp.

Proprietär

Open-Source

Open-Weights

Quelle: gradually.ai LLM-Datenbank

CC BY 4.0

gradually.ai

8. Wissensstand: Wie aktuell sind die Modelle?

Jedes Modell hat einen Wissens-Stichtag, nach dem es nichts mehr über die Welt gelernt hat. Aktuell liegt der frischeste Stichtag in unserer Datenbank im Januar 2026:

Claude Fable 5

Jan. 2026

Claude Opus 4.8

Jan. 2026

GPT-5.5

Dez. 2025

GPT-5.5 Instant

Dez. 2025

GPT-5.3 Codex

Aug. 2025

GPT-5.2

Aug. 2025

Claude Opus 4.6

Mai 2025

Claude Sonnet 4.6

Mai 2025

Claude Opus 4.5

Mär. 2025

Gemini 3.1 Pro

Jan. 2025

Gemini 3 Flash

Jan. 2025

Gemini 2.5 Pro

Jan. 2025

DeepSeek R1

Jan. 2025

DeepSeek V3.1

Dez. 2024

Grok 4.1

Nov. 2024

Qwen3-Max

Nov. 2024

Mistral Large 3

Okt. 2024

GPT-5

Okt. 2024

Llama 4 Scout

Aug. 2024

Gemini 2.0 Flash

Aug. 2024

Amazon Nova Pro

Aug. 2024

GPT-4.1

Juni 2024

GPT-5 mini

Mai 2024

Quelle: gradually.ai LLM-Datenbank

CC BY 4.0

gradually.ai

Zwischen dem Wissens-Stichtag und der Veröffentlichung liegen meist sechs bis acht Monate, in denen das Modell trainiert und getestet wird. Für aktuelle Ereignisse brauchen die Modelle deshalb fast immer eine Websuche. Reines Modellwissen ist immer ein paar Monate alt.

9. Release-Tempo: Die Schlagzahl der Labore

Wie schnell sich der Markt dreht, zeigt die Release-Timeline. Was 2024 noch im Quartalsrhythmus passierte, kommt 2026 fast monatlich:

Mai 2024

GPT-4o

OpenAI macht multimodale Echtzeit-Modelle zum Standard.

Jan. 2025

DeepSeek-R1

Erstes offenes Reasoning-Modell auf Spitzenniveau, löst die Open-Weights-Welle aus.

Juni 2025

GPT-5

OpenAI bündelt Reasoning und Standard-Modus in einer Modellfamilie.

Dez. 2025

Gemini 3 Pro

Google legt mit dem ersten Modell der dritten Gemini-Generation vor.

Dez. 2025

GPT-5.2

OpenAI schiebt ein verbessertes Reasoning-Update nach.

Dez. 2025

Mistral Large 3

Mistral kontert mit einem offenen MoE-Modell aus Europa.

Feb. 2026

Claude Opus 4.6

Anthropic hebt die Reasoning-Spitze mit dem neuen Opus an.

Feb. 2026

Gemini 3.1 Pro

Google zieht bei GPQA Diamond mit 94,3 % an die Spitze.

April 2026

GPT-5.5

Erreicht 82,6 % SWE-bench Verified im Vals-AI-Harness.

April 2026

Claude Opus 4.7

Anthropic erreicht beim Coding 82,0 %, knapp hinter GPT-5.5.

April 2026

DeepSeek-V4-Pro

Offenes Modell erreicht 80,6 % SWE-bench zum Bruchteil des Preises.

Mai 2026

Claude Opus 4.8

Erreicht 88,6 % SWE-bench, damals Coding-Bestmarke unter den aktiven Modellen.

Mai 2026

Gemini 3.5 Flash

Google bringt ein schnelles, preiseffizientes Flash-Modell nach.

Juni 2026

Claude Fable 5

Anthropic erweitert die Palette um eine spezialisierte Variante. Nach einer Exportkontroll-Pause vom 12. bis 30. Juni seit 1. Juli wieder verfügbar, mit 95,0 % SWE-bench Verified die neue Coding-Bestmarke.

Juni 2026

Claude Mythos 5

Zweites Spezialmodell, zunächst nur über die API verfügbar.

Juli 2026

GPT-5.6 Sol/Terra/Luna GA

OpenAI macht die GPT-5.6-Familie am 09.07. allgemein verfügbar, laut Axios/Bloomberg einen Tag nach Aufhebung der Regierungs-Beschränkungen. Sol Standardmodell in Codex (Ultra-Modus dort ab Plus), Terra für Free/Go bislang nur in Codex kostenlos, im normalen Chat bleibt GPT-5.5 Instant Standard. Sol 88,8 % auf Terminal-Bench 2.1 (Sol Ultra 91,9 %), 64,6 % auf SWE-Bench Pro, 80 im Coding Agent Index.

Juli 2026

Kimi K3

Moonshot AI stellt am 16.07. das 2,8-Billionen-Parameter-MoE vor: 1M Kontext, native Vision, 93,5 % auf GPQA Diamond, API-Preis 3 $/15 $. Die Gewichte sind seit dem 27.07. unter der eigenen „Kimi K3 License“ verfügbar, damit ist es das größte Open-Weight-Modell überhaupt.

Juli 2026

Gemini 3.6 Flash

Google bringt am 21.07. die neue, effizientere Flash-Generation: 17 % weniger Output-Tokens als das weiterhin aktive 3.5 Flash, 7,50 $ statt 9 $ pro 1 Mio. Output-Token, Wissensstand März 2026. Dazu erscheint Gemini 3.5 Flash-Lite für High-Throughput-Aufgaben.

Juli 2026

Claude Opus 5

Anthropic veröffentlicht Opus 5 am 24.07., nah an Fable 5 in der Leistung, aber zum halben Preis (5 $/25 $) und mit dem aktuellsten Wissensstand aller Claude-Modelle (Mai 2026). Opus 4.8 gilt damit als abgelöst.

Verteilt man alle erfassten Modelle auf ihren Erscheinungsmonat, wird die Verdichtung sichtbar. Je dunkler ein Feld, desto mehr Modelle kamen in diesem Monat heraus.

Releases: wenigviel(max. 14)

Quelle: gradually.ai LLM-Datenbank

CC BY 4.0

gradually.ai

Besonders dicht war der Dezember 2025, als Google, OpenAI und Mistral im selben Monat neue Flaggschiffe veröffentlichten. Und der April 2026, in dem mit GPT-5.5, Claude Opus 4.7, DeepSeek-V4-Pro, Kimi K2.6 und Qwen 3.6 Max gleich fünf Spitzenmodelle erschienen. Wer hier den Überblick behalten will, sollte sich nicht zu sehr an einzelne Versionsnummern klammern.

10. Modell-Status: aktiv, veraltet, Legacy

Nicht jedes Modell, das je veröffentlicht wurde, ist noch nutzbar. Über die drei großen Anbieter Anthropic, Google und OpenAI verfolgen wir den Lebenszyklus von 87 Modellen. So verteilen sie sich auf die einzelnen Status:

87Modelle

Aktiv4450,6 %

Veraltet2731 %

Legacy78 %

Pro-exklusiv33,4 %

Nur API22,3 %

Preview22,3 %

Open Source22,3 %

Quelle: gradually.ai LLM-Datenbank

CC BY 4.0

gradually.ai

Gut die Hälfte der Modelle ist noch aktiv, knapp ein Drittel bereits veraltet. Und die Lebenszyklen werden kürzer. Ein gutes Beispiel ist Gemini 3 Pro, das nur rund drei Monate nach seiner Veröffentlichung schon wieder abgekündigt wurde, weil mit Gemini 3.1 Pro ein Nachfolger bereitstand. Wer produktiv auf einem Modell aufbaut, muss diese Abkündigungen aktiv im Blick behalten.

11. Marktposition und Fazit

Der LLM-Markt 2026 ist erwachsen geworden. Statt eines einzelnen dominierenden Modells gibt es ein knappes Spitzenfeld aus OpenAI, Anthropic und Google, dicht verfolgt von offenen Modellen aus China, allen voran DeepSeek und Moonshot.

Unterm Strich:

Die Leistung an der Spitze ist erstaunlich nah beieinander, der Wettbewerb verlagert sich auf Preis, Kontextlänge und Spezialisierung. Für die meisten Anwendungen kommt es 2026 weniger auf das absolut beste Modell an als auf das richtige für den jeweiligen Zweck und das Budget. Wer tiefer in einzelne Anbieter einsteigen will, findet die Details in unseren Statistiken zu OpenAI, Anthropic, Google Gemini, Grok und DeepSeek.