Zum Hauptinhalt springen
gradually.ai logogradually.ai
  • Blog
  • Über uns
KI-Newsletter
KI-Newsletter
  1. Startseite
  2. KI-Blog

LLM-Statistiken 2026: Zahlen, Daten & Fakten

Aktuelle LLM-Statistiken zu Modellen, Anbietern, Parametern, Kontextfenstern, Preisen und Benchmarks. Stand Juni 2026, aus zentral gepflegten Daten.

FHFinn Hillebrandt
16. Juni 2026
Read in English
KI-Technik
LLM-Statistiken 2026: Zahlen, Daten & Fakten
𝕏XAuf X teilenFacebookAuf Facebook teilenLinkedInAuf LinkedIn teilenPinterestAuf Pinterest teilenThreadsAuf Threads teilenFlipboardAuf Flipboard teilen
Mit * gekennzeichnete Links sind Affiliate-Links. Kommt über solche Links ein Kauf zustande, bekommen wir eine Provision.

Large Language Models sind das Herz der KI-Revolution. Aber wie viele gibt es eigentlich? Wer baut sie? Was kosten sie? Und welches Modell ist wirklich das beste?

Die ehrliche Antwort:

Es ist unübersichtlich geworden. Im Jahr 2026 erscheint im Schnitt jeden Monat ein neues Spitzenmodell, die Preise schwanken um den Faktor 600, und ausgerechnet die wichtigste Kennzahl der letzten Jahre, die Parameterzahl, geben die großen Labore gar nicht mehr heraus.

In diesem Artikel sortiere ich die Zahlen. Alle Werte stammen aus unserer zentral gepflegten LLM-Datenbank, die hinter Tools wie dem API-Kostenrechner steht, und sind auf dem Stand Juni 2026.

TL;DRDas Wichtigste in Kürze
  • In unserer Datenbank sind 93 LLMs von 16 Anbietern erfasst, davon 48 proprietär und 45 offen verfügbar.
  • Bei Coding führen GPT-5.5 und Claude Opus 4.8 mit rund 88,6 % SWE-bench. Open-Weights-Modelle wie DeepSeek-V4-Pro liegen nur noch 8 Prozentpunkte zurück.
  • Die Preise reichen von 0,05 USD (GPT-5 nano) bis 30 USD (GPT-5.5 Pro) pro 1 Million Input-Tokens. Parameterzahlen geben die Frontier-Labore nicht mehr an.
Hinweis
Dieser Artikel betrachtet eine kuratierte Auswahl der relevantesten Sprachmodelle, nicht jedes je veröffentlichte LLM. Die Zahlen zu Modellanzahl, Anbietern und Typ-Verteilung werden direkt aus unserer Modell-Datenbank berechnet und bleiben damit immer aktuell.

1. Wie viele große Sprachmodelle gibt es 2026?

In unserer Datenbank sind aktuell 93 große Sprachmodelle von 16 verschiedenen Anbietern erfasst, von GPT-2 aus dem Jahr 2019 bis zu den aktuellen Flaggschiffen vom Juni 2026. Das ist bewusst eine kuratierte Auswahl der wichtigsten Modelle und kein Anspruch auf Vollständigkeit.

Zur Einordnung:

Laut dem Stanford AI Index 2026 haben allein US-Labore im Jahr 2025 rund 50 nennenswerte Modelle veröffentlicht, chinesische Anbieter etwa 30. Über 90 % aller bedeutenden Frontier-Modelle stammen mittlerweile aus der Industrie, nicht mehr aus der akademischen Forschung. Der Markt hat sich also professionalisiert und konzentriert.

2. Die größten LLM-Anbieter nach Modellanzahl

Ein einfacher Indikator dafür, wie aktiv ein Labor ist, ist die Zahl der Modelle, die es pflegt. Die folgende Grafik zeigt, wie viele der von uns erfassten Modelle auf welchen Anbieter entfallen:

Quelle: gradually.ai LLM-Datenbank
|
CC BY 4.0
gradually.ai

OpenAI führt mit 18 Modellen, gefolgt von Anthropic und Google mit jeweils 13. Diese Zahl misst allerdings nur die Pflegetiefe der Modellpalette, nicht die tatsächliche Nutzung. Bei den realen Marktanteilen sieht das Bild anders aus: Im Web-Traffic der KI-Chatbots dominiert ChatGPT, während Gemini und Claude dahinter folgen.

3. Parameter und Architektur: das Ende der Größenangaben

Jahrelang galt die Parameterzahl als wichtigste Kennzahl eines Modells. GPT-3 hatte 175 Milliarden, GPT-4 schätzungsweise 1,76 Billionen. Doch dann hörten die Labore auf, diese Zahl zu nennen.

Heute gilt:

Bei allen aktuellen Frontier-Modellen von OpenAI, Anthropic, Google und xAI ist die Parameterzahl offiziell unbekannt. Modellgröße ist zum Geschäftsgeheimnis geworden. Konkrete, bestätigte Zahlen gibt es nur noch bei Open-Weights-Modellen, und die sind riesig:

DeepSeek-V4-ProMoE, 49 Mrd. aktiv
1.600 Mrd.
Kimi K2.6MoE, 32 Mrd. aktiv
1.000 Mrd.
Qwen 3.6 Maxgeschätzt
~1.000 Mrd.
DeepSeek V3.2MoE, 37 Mrd. aktiv
685 Mrd.
Mistral Large 3MoE, 41 Mrd. aktiv
675 Mrd.
Llama 4 MaverickMoE, 17 Mrd. aktiv
400 Mrd.
Grok-1MoE (2024)
314 Mrd.
Quelle: gradually.ai LLM-Datenbank
|
CC BY 4.0
gradually.ai

Auffällig ist die Architektur. Fast alle großen Modelle nutzen heute ein Mixture-of-Experts-Design (MoE), bei dem pro Anfrage nur ein Bruchteil der Parameter aktiv ist. DeepSeek-V4-Pro hat zwar 1,6 Billionen Parameter, aktiviert davon aber nur 49 Milliarden pro Token, also rund 3 %. Das macht riesige Modelle bezahlbar im Betrieb. Insgesamt sind 22 der erfassten Modelle als MoE gebaut.

Die vollständige Parameter-Datenbank kannst du hier nach Anbieter, Größe und Typ filtern und durchsuchen. Bei den meisten aktuellen Frontier-Modellen steht in der Spalte Parameter bewusst „unbekannt“:

Legende:

500+ Mrd.
100-500 Mrd.
20-100 Mrd.
5-20 Mrd.
Unter 5 Mrd.

Zeige 93 Modelle

Parameter-Größen bekannter Large Language Models (Stand: Mai 2026)
Modell
Entwickler
Parameter
Typ
Release
GPT-5.5
OpenAI
Unbekannt
ProprietärApr. 2026
GPT-5.5 Pro
OpenAI
Unbekannt
ProprietärApr. 2026
GPT-5.5 Instant
OpenAI
Unbekannt
ProprietärMai 2026
GPT-5.4
OpenAI
Unbekannt
ProprietärMärz 2026
GPT-5.3-Codex
OpenAI
Unbekannt
ProprietärFeb. 2026
GPT-5.2
OpenAI
Unbekannt
ProprietärDez. 2025
GPT-5
OpenAI
Unbekannt
ProprietärJuni 2025
GPT-5 pro
OpenAI
Unbekannt
ProprietärJuni 2025
GPT-5 mini
OpenAI
Unbekannt
ProprietärJuni 2025
GPT-3.5 Turbo
OpenAI
Unbekannt
ProprietärNov. 2022
o3
OpenAI
Unbekannt
ProprietärApr. 2025
o4-mini
OpenAI
Unbekannt
ProprietärApr. 2025
o1
OpenAI
Unbekannt
ProprietärSept. 2024
Claude Fable 5
Anthropic
Unbekannt
ProprietärJuni 2026
Claude Mythos 5
Anthropic
Unbekannt
ProprietärJuni 2026
Claude Opus 4.8
Anthropic
Unbekannt
ProprietärMai 2026
Claude Opus 4.7
Anthropic
Unbekannt
ProprietärApr. 2026
Claude Opus 4.6
Anthropic
Unbekannt
ProprietärFeb. 2026
Claude Sonnet 4.6
Anthropic
Unbekannt
ProprietärFeb. 2026
Claude Opus 4.5
Anthropic
Unbekannt
ProprietärNov. 2025
Claude Sonnet 4.5
Anthropic
Unbekannt
ProprietärSept. 2025
Claude Sonnet 4
Anthropic
Unbekannt
ProprietärMai 2025
Gemini 3.5 Flash
MoE
Google
Unbekannt
ProprietärMai 2026
Gemini 3.1 Pro
MoE
Google
Unbekannt
ProprietärFeb. 2026
Gemini 3 Pro
MoE
Google
Unbekannt
ProprietärDez. 2025
Gemini 2.0 Flash
MoE
Google
Unbekannt
ProprietärDez. 2024
Gemini 1.5 Pro
MoE
Google
Unbekannt
ProprietärFeb. 2024
Grok 4
xAI
Unbekannt
ProprietärJuli 2025
Grok 3
xAI
Unbekannt
ProprietärFeb. 2025
Grok 2
xAI
Unbekannt
ProprietärAug. 2024
Claude 3 Opus
Anthropic
2 Billionen*
ProprietärMärz 2024
Llama 4 Behemoth
MoE(288 Mrd. aktiv)
Meta
2 Billionen
Open WeightsApr. 2025
GPT-4
MoE(220 Mrd. aktiv)
OpenAI
1,76 Billionen*
ProprietärMärz 2023
DeepSeek-V4-Pro
MoE(49 Mrd. aktiv)
DeepSeek
1,6 Billionen
Open WeightsApr. 2026
Kimi K2.6
MoE(32 Mrd. aktiv)
Moonshot AI
1 Billionen
Open WeightsApr. 2026
Qwen 3.6 Max-Preview
MoE
Alibaba
1 Billionen*
ProprietärApr. 2026
Yi-Large
MoE
01.AI
1 Billionen
ProprietärMai 2024
DeepSeek-V3.2
MoE(37 Mrd. aktiv)
DeepSeek
685 Mrd.
Open WeightsDez. 2025
Mistral Large 3
MoE(41 Mrd. aktiv)
Mistral AI
675 Mrd.
ProprietärDez. 2025
DeepSeek-V3
MoE(37 Mrd. aktiv)
DeepSeek
671 Mrd.
Open WeightsDez. 2024
DeepSeek-R1
MoE(37 Mrd. aktiv)
DeepSeek
671 Mrd.
Open WeightsJan. 2025
PaLM
Google
540 Mrd.
ProprietärApr. 2022
Megatron-Turing NLG
NVIDIA
530 Mrd.
ProprietärJan. 2022
Llama 3.1 405B
Meta
405 Mrd.
Open WeightsJuli 2024
Llama 4 Maverick
MoE(17 Mrd. aktiv)
Meta
400 Mrd.
Open WeightsApr. 2025
Nemotron-4 340B
NVIDIA
340 Mrd.
Open WeightsJuni 2024
PaLM 2
Google
340 Mrd.*
ProprietärMai 2023
Grok 1
MoE(86 Mrd. aktiv)
xAI
314 Mrd.
Open WeightsNov. 2023
DeepSeek-V2
MoE(21 Mrd. aktiv)
DeepSeek
236 Mrd.
Open WeightsMai 2024
GPT-4o
OpenAI
200 Mrd.*
ProprietärMai 2024
Falcon 180B
TII
180 Mrd.
Open WeightsSept. 2023
Mixtral 8x22B
MoE(44 Mrd. aktiv)
Mistral AI
176 Mrd.
Open WeightsApr. 2024
BLOOM
BigScience
176 Mrd.
Open SourceJuli 2022
GPT-3
OpenAI
175 Mrd.
ProprietärJuni 2020
Claude 3.5 Sonnet
Anthropic
175 Mrd.*
ProprietärJuni 2024
OPT-175B
Meta
175 Mrd.
Open SourceMai 2022
LaMDA
Google
137 Mrd.
ProprietärJan. 2022
DBRX
MoE(36 Mrd. aktiv)
Databricks
132 Mrd.
Open WeightsMärz 2024
Mistral Large 2
Mistral AI
123 Mrd.
Open WeightsJuli 2024
Command A
Cohere
111 Mrd.
ProprietärMärz 2025
Llama 4 Scout
MoE(17 Mrd. aktiv)
Meta
109 Mrd.
Open WeightsApr. 2025
Command R+
Cohere
104 Mrd.
Open WeightsApr. 2024
Qwen 2.5 72B
Alibaba
72 Mrd.
Open WeightsSept. 2024
Claude 3 Sonnet
Anthropic
70 Mrd.*
ProprietärMärz 2024
Llama 3.3 70B
Meta
70 Mrd.
Open WeightsDez. 2024
Llama 3.1 70B
Meta
70 Mrd.
Open WeightsJuli 2024
Llama 3 70B
Meta
70 Mrd.
Open WeightsApr. 2024
Llama 2 70B
Meta
70 Mrd.
Open WeightsJuli 2023
Mixtral 8x7B
MoE(14 Mrd. aktiv)
Mistral AI
56 Mrd.
Open WeightsDez. 2023
Falcon 40B
TII
40 Mrd.
Open SourceMai 2023
Yi-34B
01.AI
34 Mrd.
Open WeightsNov. 2023
Qwen 2.5 32B
Alibaba
32 Mrd.
Open WeightsSept. 2024
Command R
Cohere
32 Mrd.
Open WeightsMärz 2024
Gemma 2 27B
Google
27 Mrd.
Open WeightsJuni 2024
Claude 3 Haiku
Anthropic
20 Mrd.*
ProprietärMärz 2024
Qwen 2.5 14B
Alibaba
14 Mrd.
Open WeightsSept. 2024
Phi-4
Microsoft
14 Mrd.
Open WeightsDez. 2024
Gemma 2 9B
Google
9 Mrd.
Open WeightsJuni 2024
GPT-4o mini
OpenAI
8 Mrd.*
ProprietärJuli 2024
Llama 3.1 8B
Meta
8 Mrd.
Open WeightsJuli 2024
Llama 3 8B
Meta
8 Mrd.
Open WeightsApr. 2024
Ministral 8B
Mistral AI
8 Mrd.
Open WeightsOkt. 2024
Mistral 7B
Mistral AI
7 Mrd.
Open SourceSept. 2023
Qwen 2.5 7B
Alibaba
7 Mrd.
Open WeightsSept. 2024
Phi-4 Multimodal
Microsoft
5,6 Mrd.
Open WeightsFeb. 2025
Phi-4 mini
Microsoft
3,8 Mrd.
Open WeightsFeb. 2025
Phi-3 mini
Microsoft
3,8 Mrd.
Open WeightsApr. 2024
Gemini Nano 2
Google
3,3 Mrd.
ProprietärDez. 2023
Ministral 3B
Mistral AI
3 Mrd.
Open WeightsOkt. 2024
Gemma 2 2B
Google
2 Mrd.
Open WeightsJuli 2024
Gemini Nano 1
Google
1,8 Mrd.
ProprietärDez. 2023
GPT-2
OpenAI
1,5 Mrd.
Open SourceFeb. 2019
Qwen 2.5 0.5B
Alibaba
0,5 Mrd.
Open WeightsSept. 2024

Parameter-Größen bekannter Large Language Models (Stand: Mai 2026)

4. Kontextfenster: von 200.000 bis 10 Millionen Tokens

Das Kontextfenster bestimmt, wie viel Text ein Modell auf einmal verarbeiten kann. Hier haben sich die Größenordnungen in den letzten zwei Jahren vervielfacht. Die folgende Übersicht zeigt über 140 aktuelle Modelle, sortierbar und nach Anbieter filterbar:

Legende:
1 Mio.+ Tokens
200.000-1 Mio. Tokens
100.000-200.000 Tokens
32.000-100.000 Tokens
Unter 32.000 Tokens
Zeige 165 Modelle
Kontextfenster-Größen aktueller KI-Sprachmodelle (Stand: Mai 2026)
Modell
Entwickler
Kontextfenster
Entspricht ca.
Llama 4 Scout
Meta
10 Mio.
≈ 25.000 Seiten (ca. 30 Harry-Potter-Bände)
Qwen-Long
Alibaba
10 Mio.
≈ 25.000 Seiten (ca. 30 Harry-Potter-Bände)
Gemini 2.0 Pro
Google
2 Mio.
≈ 5.000 Seiten (ca. 6 Harry-Potter-Bände)
Gemini 1.5 Pro
Google
2 Mio.
≈ 5.000 Seiten (ca. 6 Harry-Potter-Bände)
Grok 4.1 Fast
xAI
2 Mio.
≈ 5.000 Seiten (ca. 6 Harry-Potter-Bände)
Grok 4 Fast
xAI
2 Mio.
≈ 5.000 Seiten (ca. 6 Harry-Potter-Bände)
Llama 4 Maverick
Meta
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 3.5 Flash
Google
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 3.1 Pro
Google
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 3 Pro
Google
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 3 Flash
Google
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 2.5 Pro
Google
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 2.5 Flash
Google
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 2.5 Flash-Lite
Google
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 2.0 Flash
Google
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Gemini 1.5 Flash
Google
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Fable 5
Anthropic
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Mythos 5
Anthropic
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Opus 4.8
Anthropic
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Opus 4.7
Anthropic
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Opus 4.6 (1M Beta)
Anthropic
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Sonnet 4.6 (1M Beta)
Anthropic
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Sonnet 4.5 (1M Beta)
Anthropic
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Claude Sonnet 4 (1M Beta)
Anthropic
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-5.5
OpenAI
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-5.5 Pro
OpenAI
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-4.1
OpenAI
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-4.1 mini
OpenAI
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-4.1 nano
OpenAI
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
DeepSeek V4 Pro
DeepSeek
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Qwen-Plus
Alibaba
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Qwen-Turbo
Alibaba
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Amazon Nova Premier
Amazon
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Amazon Nova 2 Lite
Amazon
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
Amazon Nova 2 Sonic
Amazon
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
MiniMax-01
MiniMax
1 Mio.
≈ 2.500 Seiten (ca. 3 Harry-Potter-Bände)
GPT-5.5 Instant
OpenAI
400.000
≈ 1.000 Seiten (ca. 4 Romane)
GPT-5.3-Codex
OpenAI
400.000
≈ 1.000 Seiten (ca. 4 Romane)
GPT-5.2
OpenAI
400.000
≈ 1.000 Seiten (ca. 4 Romane)
GPT-5.2 Pro
OpenAI
400.000
≈ 1.000 Seiten (ca. 4 Romane)
GPT-5.1
OpenAI
400.000
≈ 1.000 Seiten (ca. 4 Romane)
GPT-5
OpenAI
400.000
≈ 1.000 Seiten (ca. 4 Romane)
GPT-5 mini
OpenAI
400.000
≈ 1.000 Seiten (ca. 4 Romane)
GPT-5 nano
OpenAI
400.000
≈ 1.000 Seiten (ca. 4 Romane)
Amazon Nova Pro
Amazon
300.000
≈ 750 Seiten (ca. 3 Romane)
Amazon Nova Lite
Amazon
300.000
≈ 750 Seiten (ca. 3 Romane)
Kimi K2.6
Moonshot AI
262.144
≈ 655 Seiten (ca. 2 Romane)
Qwen 3.6 Max-Preview
Alibaba
262.144
≈ 655 Seiten (ca. 2 Romane)
Qwen3-Max
Alibaba
262.144
≈ 655 Seiten (ca. 2 Romane)
Grok 4.1
xAI
256.000
≈ 640 Seiten (ca. 2 Romane)
Grok 4
xAI
256.000
≈ 640 Seiten (ca. 2 Romane)
Mistral Large 3
Mistral
256.000
≈ 640 Seiten (ca. 2 Romane)
Codestral Mamba
Mistral
256.000
≈ 640 Seiten (ca. 2 Romane)
Qwen3-235B-A22B (256K Update)
Alibaba
256.000
≈ 640 Seiten (ca. 2 Romane)
Command A
Cohere
256.000
≈ 640 Seiten (ca. 2 Romane)
Command A Reasoning
Cohere
256.000
≈ 640 Seiten (ca. 2 Romane)
Jamba 1.5 Large
AI21 Labs
256.000
≈ 640 Seiten (ca. 2 Romane)
Jamba 1.5 Mini
AI21 Labs
256.000
≈ 640 Seiten (ca. 2 Romane)
Jamba
AI21 Labs
256.000
≈ 640 Seiten (ca. 2 Romane)
abab6.5s
MiniMax
245.760
≈ 614 Seiten (ca. 2 Romane)
Claude Opus 4.6
Anthropic
200.000
≈ 500 Seiten (ca. 2 Romane)
Claude Sonnet 4.6
Anthropic
200.000
≈ 500 Seiten (ca. 2 Romane)
Claude Opus 4.5
Anthropic
200.000
≈ 500 Seiten (ca. 2 Romane)
Claude Sonnet 4.5
Anthropic
200.000
≈ 500 Seiten (ca. 2 Romane)
Claude Sonnet 4
Anthropic
200.000
≈ 500 Seiten (ca. 2 Romane)
Claude Opus 4
Anthropic
200.000
≈ 500 Seiten (ca. 2 Romane)
Claude 3.5 Sonnet
Anthropic
200.000
≈ 500 Seiten (ca. 2 Romane)
Claude 3.5 Haiku
Anthropic
200.000
≈ 500 Seiten (ca. 2 Romane)
Claude 3 Opus
Anthropic
200.000
≈ 500 Seiten (ca. 2 Romane)
Claude 3 Sonnet
Anthropic
200.000
≈ 500 Seiten (ca. 2 Romane)
Claude 3 Haiku
Anthropic
200.000
≈ 500 Seiten (ca. 2 Romane)
o3
OpenAI
200.000
≈ 500 Seiten (ca. 2 Romane)
o4-mini
OpenAI
200.000
≈ 500 Seiten (ca. 2 Romane)
o3-mini
OpenAI
200.000
≈ 500 Seiten (ca. 2 Romane)
o1
OpenAI
200.000
≈ 500 Seiten (ca. 2 Romane)
Yi-34B-200K
01.AI
200.000
≈ 500 Seiten (ca. 2 Romane)
Yi-6B-200K
01.AI
200.000
≈ 500 Seiten (ca. 2 Romane)
Grok 3
xAI
131.072
≈ 328 Seiten (ca. 1 Roman)
Llama 3.3 70B
Meta
128.000
≈ 320 Seiten (ca. 1 Roman)
Llama 3.2 90B Vision
Meta
128.000
≈ 320 Seiten (ca. 1 Roman)
Llama 3.2 11B Vision
Meta
128.000
≈ 320 Seiten (ca. 1 Roman)
Llama 3.2 3B
Meta
128.000
≈ 320 Seiten (ca. 1 Roman)
Llama 3.2 1B
Meta
128.000
≈ 320 Seiten (ca. 1 Roman)
Llama 3.1 405B
Meta
128.000
≈ 320 Seiten (ca. 1 Roman)
Llama 3.1 70B
Meta
128.000
≈ 320 Seiten (ca. 1 Roman)
Llama 3.1 8B
Meta
128.000
≈ 320 Seiten (ca. 1 Roman)
Gemma 3 27B
Google
128.000
≈ 320 Seiten (ca. 1 Roman)
Gemma 3 12B
Google
128.000
≈ 320 Seiten (ca. 1 Roman)
Gemma 3 4B
Google
128.000
≈ 320 Seiten (ca. 1 Roman)
Grok 2
xAI
128.000
≈ 320 Seiten (ca. 1 Roman)
o1-mini
OpenAI
128.000
≈ 320 Seiten (ca. 1 Roman)
GPT-4.5
OpenAI
128.000
≈ 320 Seiten (ca. 1 Roman)
GPT-4o
OpenAI
128.000
≈ 320 Seiten (ca. 1 Roman)
GPT-4o mini
OpenAI
128.000
≈ 320 Seiten (ca. 1 Roman)
GPT-4 Turbo
OpenAI
128.000
≈ 320 Seiten (ca. 1 Roman)
DeepSeek V3.1
DeepSeek
128.000
≈ 320 Seiten (ca. 1 Roman)
DeepSeek V3
DeepSeek
128.000
≈ 320 Seiten (ca. 1 Roman)
DeepSeek R1
DeepSeek
128.000
≈ 320 Seiten (ca. 1 Roman)
DeepSeek R1 Distill Llama 70B
DeepSeek
128.000
≈ 320 Seiten (ca. 1 Roman)
DeepSeek R1 Distill Qwen 32B
DeepSeek
128.000
≈ 320 Seiten (ca. 1 Roman)
DeepSeek R1 Distill Qwen 14B
DeepSeek
128.000
≈ 320 Seiten (ca. 1 Roman)
DeepSeek R1 Distill Qwen 7B
DeepSeek
128.000
≈ 320 Seiten (ca. 1 Roman)
DeepSeek R1 Distill Llama 8B
DeepSeek
128.000
≈ 320 Seiten (ca. 1 Roman)
DeepSeek V2.5
DeepSeek
128.000
≈ 320 Seiten (ca. 1 Roman)
DeepSeek Coder V2
DeepSeek
128.000
≈ 320 Seiten (ca. 1 Roman)
Mistral Large 2
Mistral
128.000
≈ 320 Seiten (ca. 1 Roman)
Mistral Small 3
Mistral
128.000
≈ 320 Seiten (ca. 1 Roman)
Ministral 8B
Mistral
128.000
≈ 320 Seiten (ca. 1 Roman)
Ministral 3B
Mistral
128.000
≈ 320 Seiten (ca. 1 Roman)
Mistral NeMo
Mistral
128.000
≈ 320 Seiten (ca. 1 Roman)
Qwen3-235B-A22B
Alibaba
128.000
≈ 320 Seiten (ca. 1 Roman)
Qwen3-32B
Alibaba
128.000
≈ 320 Seiten (ca. 1 Roman)
Qwen3-14B
Alibaba
128.000
≈ 320 Seiten (ca. 1 Roman)
Qwen3-8B
Alibaba
128.000
≈ 320 Seiten (ca. 1 Roman)
Qwen3-30B-A3B
Alibaba
128.000
≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 72B
Alibaba
128.000
≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 32B
Alibaba
128.000
≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 14B
Alibaba
128.000
≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 7B
Alibaba
128.000
≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 Coder 32B
Alibaba
128.000
≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 Coder 14B
Alibaba
128.000
≈ 320 Seiten (ca. 1 Roman)
Qwen 2.5 Coder 7B
Alibaba
128.000
≈ 320 Seiten (ca. 1 Roman)
Command R+
Cohere
128.000
≈ 320 Seiten (ca. 1 Roman)
Command R
Cohere
128.000
≈ 320 Seiten (ca. 1 Roman)
Amazon Nova Micro
Amazon
128.000
≈ 320 Seiten (ca. 1 Roman)
Phi-4-mini
Microsoft
128.000
≈ 320 Seiten (ca. 1 Roman)
Phi-3.5-mini
Microsoft
128.000
≈ 320 Seiten (ca. 1 Roman)
Phi-3.5-MoE
Microsoft
128.000
≈ 320 Seiten (ca. 1 Roman)
Phi-3 Medium
Microsoft
128.000
≈ 320 Seiten (ca. 1 Roman)
Phi-3 Small
Microsoft
128.000
≈ 320 Seiten (ca. 1 Roman)
Phi-3 Mini
Microsoft
128.000
≈ 320 Seiten (ca. 1 Roman)
Yi-Coder 9B
01.AI
128.000
≈ 320 Seiten (ca. 1 Roman)
Yi-Coder 1.5B
01.AI
128.000
≈ 320 Seiten (ca. 1 Roman)
Llama-3.1-Nemotron-70B
Nvidia
128.000
≈ 320 Seiten (ca. 1 Roman)
Llama-3.1-Nemotron-51B
Nvidia
128.000
≈ 320 Seiten (ca. 1 Roman)
Mistral-NeMo-Minitron 8B
Nvidia
128.000
≈ 320 Seiten (ca. 1 Roman)
Reka Core
Reka
128.000
≈ 320 Seiten (ca. 1 Roman)
Reka Flash
Reka
128.000
≈ 320 Seiten (ca. 1 Roman)
Reka Edge
Reka
128.000
≈ 320 Seiten (ca. 1 Roman)
GLM-4
Zhipu AI
128.000
≈ 320 Seiten (ca. 1 Roman)
ChatGLM3-6B
Zhipu AI
128.000
≈ 320 Seiten (ca. 1 Roman)
ERNIE 4.0
Baidu
128.000
≈ 320 Seiten (ca. 1 Roman)
Mixtral 8x22B
Mistral
65.536
≈ 164 Seiten
Phi-4-mini-flash-reasoning
Microsoft
64.000
≈ 160 Seiten
Mixtral 8x7B
Mistral
32.768
≈ 82 Seiten
Codestral
Mistral
32.768
≈ 82 Seiten
Qwen3-4B
Alibaba
32.768
≈ 82 Seiten
Qwen3-1.7B
Alibaba
32.768
≈ 82 Seiten
Qwen3-0.6B
Alibaba
32.768
≈ 82 Seiten
Phi-4-reasoning
Microsoft
32.768
≈ 82 Seiten
DBRX
Databricks
32.768
≈ 82 Seiten
Gemma 3 1B
Google
32.000
≈ 80 Seiten
Yi-Large
01.AI
32.000
≈ 80 Seiten
Phi-4
Microsoft
16.384
≈ 41 Seiten
Yi-Zap
01.AI
16.000
≈ 40 Seiten
Gemma 2 27B
Google
8.192
≈ 20 Seiten
Gemma 2 9B
Google
8.192
≈ 20 Seiten
GPT-4
OpenAI
8.192
≈ 20 Seiten
Jurassic-2 Ultra
AI21 Labs
8.192
≈ 20 Seiten
GLM-4V
Zhipu AI
8.192
≈ 20 Seiten
ERNIE 3.5
Baidu
8.000
≈ 20 Seiten
Command
Cohere
4.096
≈ 10 Seiten
Nemotron-4 340B
Nvidia
4.096
≈ 10 Seiten
StableLM 2 12B
Stability AI
4.096
≈ 10 Seiten
StableLM Zephyr 3B
Stability AI
4.096
≈ 10 Seiten

Kontextfenster-Größen aktueller KI-Sprachmodelle (Stand: Mai 2026)

Die Spitze bilden Llama 4 Scout und Qwen-Long mit jeweils 10 Millionen Tokens. Das entspricht etwa 30 Bänden Harry Potter in einem einzigen Prompt. Die aktuellen Allrounder wie GPT-5.5, Claude Opus 4.8 und Gemini 3.1 Pro liegen bei 1 Million Tokens, was für die meisten Anwendungen mehr als ausreicht. Mehr zu den einzelnen Modellfamilien findest du in unseren Übersichten zu den Claude-Modellen und Gemini-Modellen.

5. Was kostet ein LLM? Preise pro 1 Million Tokens

Bei den API-Preisen liegen Welten zwischen den Modellen. Das günstigste Modell mit API-Zugang ist GPT-5 nano mit 0,05 USD pro 1 Million Input-Tokens. Das teuerste ist GPT-5.5 Pro mit 30 USD, also dem 600-Fachen.

Spannender als der reine Preis ist aber das Verhältnis von Preis zu Leistung. Die folgende Grafik trägt den Input-Preis gegen die Coding-Leistung (SWE-bench Verified) ab. Modelle unten rechts sind ideal: stark und günstig.

Preis-Leistung: SWE-bench gegen Input-Preis
OpenAI
Anthropic
Google
DeepSeek
Moonshot AI
Effizienz-Grenze (beste Preis-Leistung)
Quellen: gradually.ai LLM-Datenbank (Preise + Benchmarks)
|
CC BY 4.0
gradually.ai

Der heimliche Star dieser Grafik ist DeepSeek-V4-Pro. Mit 80,6 % SWE-bench bei nur 0,435 USD Input-Preis liegt das Modell auf der Effizienz-Grenze, kein anderes Modell ist gleichzeitig stärker und günstiger. Wer also nicht zwingend die letzten Prozentpunkte Coding-Leistung braucht, bekommt mit den offenen Modellen ein extrem gutes Preis-Leistungs-Verhältnis. Eine ausführliche Kostenrechnung für deine konkrete Nutzung liefert der API-Kostenrechner.

6. LLM-Leistung im Direktvergleich

Um die Stärken und Schwächen der Spitzenmodelle auf einen Blick sichtbar zu machen, vergleicht das folgende Radar fünf repräsentative Frontier-Modelle über vier Dimensionen: Reasoning, Coding, Kontextfenster und Preis-Effizienz. Jede Achse ist relativ zu den fünf Modellen skaliert, damit auch kleine Vorsprünge sichtbar werden. Die echten Werte erscheinen im Tooltip.

Claude Opus 4.8
Gemini 3.1 Pro
Gemini 3.5 Flash
Claude Sonnet 4.6
GPT-5.5
Quellen: Artificial Analysis (GPQA Diamond, Stand 17.06.2026), gradually.ai LLM-Datenbank (SWE-bench, Kontext, Preise)
|
CC BY 4.0
gradually.ai

Das Muster ist klar erkennbar. Claude Opus 4.8 und GPT-5.5 dominieren bei der reinen Coding-Leistung, sind aber teuer. Gemini 3.5 Flash dreht das um, denn beim Reasoning liegt es fast auf Augenhöhe und nur beim Coding zurück, dafür die beste Preis-Effizienz im Feld. Auf diese eine Abwägung läuft jedes KI-Projekt am Ende hinaus, maximale Qualität gegen maximale Wirtschaftlichkeit.

7. Open Source gegen proprietär

Eine der wichtigsten Entwicklungen 2026 ist das Aufholen der offenen Modelle. Von den 93 erfassten Modellen sind 48 proprietär und 45 offen verfügbar, davon 40 mit offenen Gewichten und 5 vollständig quelloffen.

Aber an der absoluten Spitze:

Laut Stanford AI Index 2026 führte das beste geschlossene Modell Anfang 2026 mit 3,3 Prozentpunkten vor dem besten Open-Weights-Modell. Im August 2024 waren es nur 0,5 Prozentpunkte gewesen. An der Spitze ist der Abstand also nicht geschrumpft, sondern wieder gewachsen, denn sechs der zehn besten Modelle in der Chatbot Arena sind inzwischen wieder geschlossen. In unseren Daten zeigt sich derselbe Vorsprung beim Coding: DeepSeek-V4-Pro (80,6 % SWE-bench) und Kimi K2.6 (80,2 %) liegen rund 8 Prozentpunkte hinter dem geschlossenen Spitzenreiter GPT-5.5 (88,7 %). Eine Übersicht der besten freien Modelle findest du in unserem Artikel zu den Open-Source-LLMs.

8. Wissensstand: Wie aktuell sind die Modelle?

Jedes Modell hat einen Wissens-Stichtag, nach dem es nichts mehr über die Welt gelernt hat. Aktuell liegt der frischeste Stichtag in unserer Datenbank im Oktober 2025:

GPT-5.5 Instant
Okt. 2025
GPT-5.3 Codex
Okt. 2025
GPT-5.2
Aug. 2025
Claude Opus 4.6
Mai 2025
Claude Sonnet 4.6
Mai 2025
Claude Opus 4.5
Mär. 2025
Gemini 3.1 Pro
Jan. 2025
Gemini 3 Flash
Jan. 2025
Gemini 2.5 Pro
Jan. 2025
DeepSeek R1
Jan. 2025
DeepSeek V3.1
Dez. 2024
Grok 4.1
Nov. 2024
Qwen3-Max
Nov. 2024
Mistral Large 3
Okt. 2024
GPT-5
Okt. 2024
Llama 4 Scout
Aug. 2024
Gemini 2.0 Flash
Aug. 2024
Amazon Nova Pro
Aug. 2024
GPT-4.1
Juni 2024
GPT-5 mini
Mai 2024
Quelle: gradually.ai LLM-Datenbank
|
CC BY 4.0
gradually.ai

Zwischen dem Wissens-Stichtag und der Veröffentlichung liegen meist sechs bis acht Monate, in denen das Modell trainiert und getestet wird. Für aktuelle Ereignisse brauchen die Modelle deshalb fast immer eine Websuche. Reines Modellwissen ist immer ein paar Monate alt.

9. Release-Tempo: Die Schlagzahl der Labore

Wie schnell sich der Markt dreht, zeigt die Release-Timeline. Was 2024 noch im Quartalsrhythmus passierte, kommt 2026 fast monatlich:

Mai 2024
GPT-4o
OpenAI macht multimodale Echtzeit-Modelle zum Standard.
Jan. 2025
DeepSeek-R1
Erstes offenes Reasoning-Modell auf Frontier-Niveau, löst die Open-Weights-Welle aus.
Juni 2025
GPT-5
OpenAI bündelt Reasoning und Standard-Modus in einer Modellfamilie.
Dez. 2025
Gemini 3 Pro
Google legt mit dem ersten Modell der dritten Gemini-Generation vor.
Dez. 2025
GPT-5.2
OpenAI schiebt ein verbessertes Reasoning-Update nach.
Dez. 2025
Mistral Large 3
Mistral kontert mit einem offenen MoE-Modell aus Europa.
Feb. 2026
Claude Opus 4.6
Anthropic hebt die Reasoning-Spitze mit dem neuen Opus an.
Feb. 2026
Gemini 3.1 Pro
Google zieht bei GPQA Diamond mit 94,3 % an die Spitze.
April 2026
GPT-5.5
Setzt mit 88,7 % SWE-bench die neue Coding-Bestmarke.
April 2026
Claude Opus 4.7
Anthropic bleibt beim Coding dicht hinter GPT-5.5.
April 2026
DeepSeek-V4-Pro
Offenes Modell erreicht 80,6 % SWE-bench zum Bruchteil des Preises.
Mai 2026
Claude Opus 4.8
Erreicht 88,6 % SWE-bench, praktisch gleichauf mit GPT-5.5.
Mai 2026
Gemini 3.5 Flash
Google bringt ein schnelles, preiseffizientes Flash-Modell nach.
Juni 2026
Claude Fable 5
Anthropic erweitert die Palette um eine spezialisierte Variante.
Juni 2026
Claude Mythos 5
Zweites Spezialmodell, zunächst nur über die API verfügbar.

Besonders dicht war der Dezember 2025, als Google, OpenAI und Mistral im selben Monat neue Flaggschiffe veröffentlichten. Und der April 2026, in dem mit GPT-5.5, Claude Opus 4.7, DeepSeek-V4-Pro, Kimi K2.6 und Qwen 3.6 Max gleich fünf Spitzenmodelle erschienen. Wer hier den Überblick behalten will, sollte sich nicht zu sehr an einzelne Versionsnummern klammern.

10. Modell-Status: aktiv, veraltet, Legacy

Nicht jedes Modell, das je veröffentlicht wurde, ist noch nutzbar. Über die drei großen Anbieter Anthropic, Google und OpenAI verfolgen wir den Lebenszyklus von 77 Modellen. So verteilen sie sich auf die einzelnen Status:

77Modelle
Aktiv3950,6 %
Veraltet2431,2 %
Legacy67,8 %
Pro-exklusiv33,9 %
Nur API22,6 %
Preview11,3 %
Open Source22,6 %
Quelle: gradually.ai LLM-Datenbank
|
CC BY 4.0
gradually.ai

Gut die Hälfte der Modelle ist noch aktiv, knapp ein Drittel bereits veraltet. Und die Lebenszyklen werden kürzer. Ein gutes Beispiel ist Gemini 3 Pro, das nur rund drei Monate nach seiner Veröffentlichung schon wieder abgekündigt wurde, weil mit Gemini 3.1 Pro ein Nachfolger bereitstand. Wer produktiv auf einem Modell aufbaut, muss diese Abkündigungen aktiv im Blick behalten.

11. Marktposition und Fazit

Der LLM-Markt 2026 ist erwachsen geworden. Statt eines einzelnen dominierenden Modells gibt es ein knappes Spitzenfeld aus OpenAI, Anthropic und Google, dicht verfolgt von offenen Modellen aus China, allen voran DeepSeek und Moonshot.

Unterm Strich:

Die Leistung an der Spitze ist erstaunlich nah beieinander, der Wettbewerb verlagert sich auf Preis, Kontextlänge und Spezialisierung. Für die meisten Anwendungen kommt es 2026 weniger auf das absolut beste Modell an als auf das richtige für den jeweiligen Zweck und das Budget. Wer tiefer in einzelne Anbieter einsteigen will, findet die Details in unseren Statistiken zu OpenAI, Anthropic, Google Gemini, Grok und DeepSeek.

Häufig gestellte Fragen

𝕏XAuf X teilenFacebookAuf Facebook teilenLinkedInAuf LinkedIn teilenPinterestAuf Pinterest teilenThreadsAuf Threads teilenFlipboardAuf Flipboard teilen
FH

Finn Hillebrandt

KI-Experte & Blogger

Finn Hillebrandt ist der Gründer von Gradually AI, SEO- und KI-Experte. Er hilft Online-Unternehmern, ihre Prozesse und ihr Marketing mit KI zu vereinfachen und zu automatisieren. Finn teilt sein Wissen hier auf dem Blog in 50+ Fachartikeln sowie über seinen ChatGPT-Kurs und den KI Business Club.

Erfahre mehr über Finn und das Team, folge Finn bei LinkedIn, tritt seiner Facebook-Gruppe zu ChatGPT, OpenAI & KI-Tools bei oder mache es wie 17.500+ andere und abonniere seinen KI-Newsletter mit Tipps, News und Angeboten rund um KI-Tools und Online-Business. Besuche auch seinen anderen Blog, Blogmojo, auf dem es um WordPress, Bloggen und SEO geht.

Ähnliche Artikel

Anthropic IPO 2026: Bewertung, Aktie & Börsengang
KI-Technik

Anthropic IPO 2026: Bewertung, Aktie & Börsengang

17. Juni 2026
FHFinn Hillebrandt
OpenAI IPO 2026: Bewertung, Aktie & Börsengang
KI-Technik

OpenAI IPO 2026: Bewertung, Aktie & Börsengang

17. Juni 2026
FHFinn Hillebrandt
SpaceX IPO 2026: Bewertung, Aktie & Kurs
KI-Technik

SpaceX IPO 2026: Bewertung, Aktie & Kurs

17. Juni 2026
FHFinn Hillebrandt
SpaceX-Statistiken 2026: Zahlen, Daten & Fakten
KI-Technik

SpaceX-Statistiken 2026: Zahlen, Daten & Fakten

16. Juni 2026
FHFinn Hillebrandt
Claude-Statistiken 2026: Zahlen, Daten & Fakten zu Anthropic
KI-Technik

Claude-Statistiken 2026: Zahlen, Daten & Fakten zu Anthropic

14. Juni 2026
FHFinn Hillebrandt
DeepSeek-Statistiken 2026: Zahlen, Daten & Fakten
KI-Technik

DeepSeek-Statistiken 2026: Zahlen, Daten & Fakten

14. Juni 2026
FHFinn Hillebrandt

Bleib auf dem Laufenden mit dem KI-Newsletter

Erhalte wöchentlich die neuesten KI-Tools, Tutorials und exklusive Tipps direkt in Deinen Posteingang

Abmeldung jederzeit möglich. Etwa 4 bis 8 E-Mails im Monat. Die Einwilligung umfasst die Hinweise zu Widerruf, Versanddienstleister und Statistik gemäß unserer Datenschutzerklärung.

gradually.ai logogradually.ai

Deutschlands führende Plattform für KI-Tools und Wissen für Online-Unternehmer.

KI-Tools

  • Text-Generator
  • Prompt-Verbesserer
  • Prompt-Link-Generator
  • FLUX KI-Bildgenerator
  • KI-Kunstgenerator
  • Midjourney Prompt-Generator
  • Veo 3 Prompt-Generator
  • AI Humanizer
  • KI-Text-Detektor
  • Gemini Wasserzeichen-Entferner
  • Alle Tools →

Kreativ-Tools

  • Blognamen-Generator
  • Buchtitel-Generator
  • Songtext-Generator
  • Künstlernamen-Generator
  • Teamnamen-Generator
  • Mindmap-Generator
  • Überschriften-Generator
  • Firmennamen-Generator
  • Slogan-Generator
  • Markennamen-Generator
  • Newsletter-Namengenerator
  • YouTube-Kanal-Namengenerator

Business-Tools

  • API-Kostenrechner
  • Token-Zähler
  • Werbeanzeigen-Generator
  • Werbetext-Generator
  • Essay-Generator
  • Story-Generator
  • Text-Umschreiber
  • Blogartikel-Generator
  • SERP-Snippet-Generator
  • E-Mail-Generator
  • E-Mail-Betreffzeilen-Generator
  • Instagram-Bio-Generator
  • KI-Hashtag-Generator

Ressourcen

  • Claude Code MCP-Server
  • Claude Code Skills
  • n8n-Hosting Vergleich
  • OpenClaw-Hosting Vergleich
  • Claude Code Plugins
  • Claude Code Use Cases
  • Claude Cowork Use Cases
  • OpenClaw Use Cases
  • Changelogs

© 2026 Gradually AI. Alle Rechte vorbehalten.

  • Blog
  • Angebote
  • Über uns
  • Impressum
  • Datenschutz