Was ist ein Large Language Model (LLM)?

Spätestens seit der Veröffentlichung von ChatGPT im November 2022 sind Large Language Models (LLMs) in aller Munde.

Aber was ist ein LLM und was können diese „neuartigen Wundermaschinen“ überhaupt?

In diesem Lexikon-Eintrag erfährt du alles, was du als Anfänger über LLMs wissen musst:

1. Definition

Als Large Language Model (auf Deutsch: großes Sprachmodelle) oder kurz LLM bezeichnet man eine Software, die mit Methoden des maschinellen Lernens auf großen Textdatenmengen trainiert wurde.

Dadurch lernt es die Strukturen und Muster natürlicher Sprache und kann dann selbst sinnvolle, menschenähnliche Texte erzeugen.

Das Besondere an modernen LLMs ist, dass erzeugte Texte oft kaum von echtem, durch Menschen geschriebenen Text zu unterscheiden sind.

So ist es mit ChatGPT zum Beispiel möglich, lange und darüber hinaus auch gut gereimte Songtexte zu schreiben.

Bitte beachte:

ChatGPT und andere KI-Chatbots wie Claude, Microsoft Copilot oder Google Gemini sind selbst keine LLMs, sondern Tools. Sie basieren lediglich technisch auf einem oder mehreren LLMs.

ChatGPT basiert zum Beispiel auf der GPT-5-Reihe (GPT-5.5, GPT-5.4, GPT-5.3). Google Gemini basiert auf „Gemini 3.1 Pro“ und „Gemini 3.5 Flash“ und Claude basiert auf den Modellen Claude Opus 4.8, Claude Sonnet 4.6 und Claude Haiku 4.5.

Leider kommt es da manchmal zu Verwechselungen, weil die Tools und die Modell gleich oder sehr ähnlich heißen.

2. Was können LLMs und wofür werden sie eingesetzt?

Large Language Models sind wahre Multitalente, wenn es um die Bearbeitung, Analyse und Erstellung von Texten geht.

Sie können viele Aufgaben erledigen, für die man früher spezialisierte Systeme gebraucht hätte oder die ohne LLMs schlichtweg unmöglich waren:

Texterstellung und -bearbeitung

Zusammenfassen von Texten
Übersetzen zwischen verschiedenen Sprachen
Verfassen von Artikeln, Geschichten, Gedichten und vielen anderen Textarten
Korrigieren von Rechtschreib- und Grammatikfehlern
Paraphrasieren, also das Umschreiben von Text mit anderen Worten

Beantworten von Fragen und Führen von Dialogen

Als Wissensdatenbank zu verschiedensten Themen
Beantworten von Verständnisfragen zu einem Text oder Dokument
Führen von Dialogen als interaktive Chatbots

Analysieren und Verstehen von Texten

Textarten erkennen (Nachricht, Werbung, Fachtext etc.)
Stimmung und Tonalität erkennen (positiv, negativ, formell, informell etc.)
Identifikation von Personen, Organisationen, Orten etc. im Text

Programmieren

Erklären von Code
Generieren von Code
Debugging (das Finden und Beheben von Fehlern und Sicherheitslücken im Code)

2.1 In welchen Tools werden sie eingesetzt?

LLMs kommen zum Beispiel in folgenden Tools zum Einsatz, entweder als Haupt- oder als Nebenfunktion:

3. Wie funktionieren LLMs?

LLMs basieren auf einer Technik namens „Deep Learning“. Dabei lernt ein neuronales Netzwerk anhand riesiger Textmengen, die Struktur und Logik von Sprache zu verstehen.

Es findet Muster und Zusammenhänge in den Daten, ohne dass diese explizit programmiert werden. Durch dieses Training entsteht ein statistisches Modell, das die Wahrscheinlichkeit von Wortfolgen abbildet.

Hier ein (stark vereinfachtes) Beispiel, wie ein LLM eine Antwort generiert:

1. Prompt: „Das Wetter heute ist sehr“

2. Das LLM schaut in seinem Modell nach den wahrscheinlichsten nächsten Worten

3. Basierend auf den gelernten Mustern ermittelt es folgende Wahrscheinlichkeiten:

„gut“: 40 %
„schlecht“: 30 %
„wechselhaft“: 20 %
usw.

4. Das LLM wählt das Wort „gut“ aus, weil es mit 40 % das wahrscheinlichste ist.

5. Das Sprachmodell wiederholt die Schritte 2 bis 4 für das nächste Wort: „Das Wetter heute ist gut und die Regenwahrscheinlichkeit sehr gering.“

6. Diese Schleife wiederholt das LLM, bis es ein Stoppkriterium erreicht (z. B. ein bestimmtes Satzzeichen kommt oder eine vorgegebene Menge generierte Zeichen oder Token erreicht ist)

4. Grenzen von LLMs

Durch ihren wahrscheinlichkeitsbasierten Ansatz können LLMs Texte generieren, die kaum von menschengemachten Texten zu unterscheiden sind.

Wichtig zu verstehen, ist jedoch, dass...

LLMs kein echtes Verständnis von Konzepten oder Logik haben (sie reproduzieren nur Muster)
kein Bewusstsein haben und nicht „lebendig“ sind (obwohl sie ziemlich gut darin sind, dir das vorzugaukeln)
sie Fakten vermischen oder Dinge „halluzinieren“ (erfinden) können
sie ein Knowledge Cutoff Date haben. Das heißt, nur Daten bis zu einem bestimmten Zeitpunkt berücksichtigten und es kann sein, dass sie veraltete Zahlen, Daten oder Fakten ausspucken.
Antworten von LLMs variieren können (abhängig und unabhängig von den Befehlen oder Fragen, die man stellt)
sie keine stabile Persönlichkeit oder ein konsistentes Wertesystem haben

Dazu kommt, dass die internen Abläufe von LLMs selbst für Experten und LLM-Entwickler eine Art „Blackbox“ sind.

Das heißt, obwohl man Input und Output kennt, kann man nicht genau nachvollziehen, wie der Output „zwischendrin“ zustande gekommen ist.

5. Risiken & Herausforderungen

So hilfreich und spannend LLMs auch sein mögen, bringen sie auch diverse Risiken und Herausforderungen mit, die hier nicht unerwähnt bleiben sollen.

Dazu gehören:

Verbreitung von Fake News, Propaganda und Verschwörungstheorien
Umgehen von internen Sicherheitsmechanismen von LLMs, z. B. durch Prompt Injections
Missbrauch für Betrug, z. B. durch Imitieren von Personen und Generieren gefälschter Inhalte
Verstärkung von Vorurteilen und Diskriminierung durch verzerrte Trainingsdaten
Verletzung von Urheberrecht und Datenschutz durch Reproduzieren von Trainingsdaten (auch, wenn es durch die Arbeitsweise von LLMs eher selten dazu kommen)
Ersetzung von menschlicher Arbeitskraft und Expertise in bestimmten Bereichen

Wichtig in dem Zusammenhang ist AI Governance, das heißt das Entwickeln von Prinzipien, Richtlinien und Prozessen, die sicherstellen, dass große Sprachmodelle und darauf basierende KI-Tools ethisch und verantwortungsvoll eingesetzt werden.

6. Liste bekannter LLMs und ihre Parameter

Die folgende interaktive Tabelle zeigt über 60 bekannte Large Language Models mit ihren Parameterzahlen. Du kannst nach Namen suchen, nach Entwickler, Größenkategorie oder Modelltyp filtern und die Spalten sortieren:

Legende:

500+ Mrd.

100-500 Mrd.

20-100 Mrd.

5-20 Mrd.

Unter 5 Mrd.

Zeige 91 Modelle

Parameter-Größen bekannter Large Language Models (Stand: Mai 2026)
Modell	Entwickler	Parameter	Typ	Release
GPT-5.5	OpenAI	Unbekannt	Proprietär	Apr. 2026
GPT-5.5 Pro	OpenAI	Unbekannt	Proprietär	Apr. 2026
GPT-5.5 Instant	OpenAI	Unbekannt	Proprietär	Mai 2026
GPT-5.4	OpenAI	Unbekannt	Proprietär	März 2026
GPT-5.3-Codex	OpenAI	Unbekannt	Proprietär	Feb. 2026
GPT-5.2	OpenAI	Unbekannt	Proprietär	Dez. 2025
GPT-5	OpenAI	Unbekannt	Proprietär	Juni 2025
GPT-5 pro	OpenAI	Unbekannt	Proprietär	Juni 2025
GPT-5 mini	OpenAI	Unbekannt	Proprietär	Juni 2025
GPT-3.5 Turbo	OpenAI	Unbekannt	Proprietär	Nov. 2022
o3	OpenAI	Unbekannt	Proprietär	Apr. 2025
o4-mini	OpenAI	Unbekannt	Proprietär	Apr. 2025
o1	OpenAI	Unbekannt	Proprietär	Sept. 2024
Claude Opus 4.8	Anthropic	Unbekannt	Proprietär	Mai 2026
Claude Opus 4.7	Anthropic	Unbekannt	Proprietär	Apr. 2026
Claude Opus 4.6	Anthropic	Unbekannt	Proprietär	Feb. 2026
Claude Sonnet 4.6	Anthropic	Unbekannt	Proprietär	Feb. 2026
Claude Opus 4.5	Anthropic	Unbekannt	Proprietär	Nov. 2025
Claude Sonnet 4.5	Anthropic	Unbekannt	Proprietär	Sept. 2025
Claude Sonnet 4	Anthropic	Unbekannt	Proprietär	Mai 2025
Gemini 3.5 Flash MoE	Google	Unbekannt	Proprietär	Mai 2026
Gemini 3.1 Pro MoE	Google	Unbekannt	Proprietär	Feb. 2026
Gemini 3 Pro MoE	Google	Unbekannt	Proprietär	Dez. 2025
Gemini 2.0 Flash MoE	Google	Unbekannt	Proprietär	Dez. 2024
Gemini 1.5 Pro MoE	Google	Unbekannt	Proprietär	Feb. 2024
Grok 4	xAI	Unbekannt	Proprietär	Juli 2025
Grok 3	xAI	Unbekannt	Proprietär	Feb. 2025
Grok 2	xAI	Unbekannt	Proprietär	Aug. 2024
Claude 3 Opus	Anthropic	2 Billionen*	Proprietär	März 2024
Llama 4 Behemoth MoE(288 Mrd. aktiv)	Meta	2 Billionen	Open Weights	Apr. 2025
GPT-4 MoE(220 Mrd. aktiv)	OpenAI	1,76 Billionen*	Proprietär	März 2023
DeepSeek-V4-Pro MoE(49 Mrd. aktiv)	DeepSeek	1,6 Billionen	Open Weights	Apr. 2026
Kimi K2.6 MoE(32 Mrd. aktiv)	Moonshot AI	1 Billionen	Open Weights	Apr. 2026
Qwen 3.6 Max-Preview MoE	Alibaba	1 Billionen*	Proprietär	Apr. 2026
Yi-Large MoE	01.AI	1 Billionen	Proprietär	Mai 2024
DeepSeek-V3.2 MoE(37 Mrd. aktiv)	DeepSeek	685 Mrd.	Open Weights	Dez. 2025
Mistral Large 3 MoE(41 Mrd. aktiv)	Mistral AI	675 Mrd.	Proprietär	Dez. 2025
DeepSeek-V3 MoE(37 Mrd. aktiv)	DeepSeek	671 Mrd.	Open Weights	Dez. 2024
DeepSeek-R1 MoE(37 Mrd. aktiv)	DeepSeek	671 Mrd.	Open Weights	Jan. 2025
PaLM	Google	540 Mrd.	Proprietär	Apr. 2022
Megatron-Turing NLG	NVIDIA	530 Mrd.	Proprietär	Jan. 2022
Llama 3.1 405B	Meta	405 Mrd.	Open Weights	Juli 2024
Llama 4 Maverick MoE(17 Mrd. aktiv)	Meta	400 Mrd.	Open Weights	Apr. 2025
Nemotron-4 340B	NVIDIA	340 Mrd.	Open Weights	Juni 2024
PaLM 2	Google	340 Mrd.*	Proprietär	Mai 2023
Grok 1 MoE(86 Mrd. aktiv)	xAI	314 Mrd.	Open Weights	Nov. 2023
DeepSeek-V2 MoE(21 Mrd. aktiv)	DeepSeek	236 Mrd.	Open Weights	Mai 2024
GPT-4o	OpenAI	200 Mrd.*	Proprietär	Mai 2024
Falcon 180B	TII	180 Mrd.	Open Weights	Sept. 2023
Mixtral 8x22B MoE(44 Mrd. aktiv)	Mistral AI	176 Mrd.	Open Weights	Apr. 2024
BLOOM	BigScience	176 Mrd.	Open Source	Juli 2022
GPT-3	OpenAI	175 Mrd.	Proprietär	Juni 2020
Claude 3.5 Sonnet	Anthropic	175 Mrd.*	Proprietär	Juni 2024
OPT-175B	Meta	175 Mrd.	Open Source	Mai 2022
LaMDA	Google	137 Mrd.	Proprietär	Jan. 2022
DBRX MoE(36 Mrd. aktiv)	Databricks	132 Mrd.	Open Weights	März 2024
Mistral Large 2	Mistral AI	123 Mrd.	Open Weights	Juli 2024
Command A	Cohere	111 Mrd.	Proprietär	März 2025
Llama 4 Scout MoE(17 Mrd. aktiv)	Meta	109 Mrd.	Open Weights	Apr. 2025
Command R+	Cohere	104 Mrd.	Open Weights	Apr. 2024
Qwen 2.5 72B	Alibaba	72 Mrd.	Open Weights	Sept. 2024
Claude 3 Sonnet	Anthropic	70 Mrd.*	Proprietär	März 2024
Llama 3.3 70B	Meta	70 Mrd.	Open Weights	Dez. 2024
Llama 3.1 70B	Meta	70 Mrd.	Open Weights	Juli 2024
Llama 3 70B	Meta	70 Mrd.	Open Weights	Apr. 2024
Llama 2 70B	Meta	70 Mrd.	Open Weights	Juli 2023
Mixtral 8x7B MoE(14 Mrd. aktiv)	Mistral AI	56 Mrd.	Open Weights	Dez. 2023
Falcon 40B	TII	40 Mrd.	Open Source	Mai 2023
Yi-34B	01.AI	34 Mrd.	Open Weights	Nov. 2023
Qwen 2.5 32B	Alibaba	32 Mrd.	Open Weights	Sept. 2024
Command R	Cohere	32 Mrd.	Open Weights	März 2024
Gemma 2 27B	Google	27 Mrd.	Open Weights	Juni 2024
Claude 3 Haiku	Anthropic	20 Mrd.*	Proprietär	März 2024
Qwen 2.5 14B	Alibaba	14 Mrd.	Open Weights	Sept. 2024
Phi-4	Microsoft	14 Mrd.	Open Weights	Dez. 2024
Gemma 2 9B	Google	9 Mrd.	Open Weights	Juni 2024
GPT-4o mini	OpenAI	8 Mrd.*	Proprietär	Juli 2024
Llama 3.1 8B	Meta	8 Mrd.	Open Weights	Juli 2024
Llama 3 8B	Meta	8 Mrd.	Open Weights	Apr. 2024
Ministral 8B	Mistral AI	8 Mrd.	Open Weights	Okt. 2024
Mistral 7B	Mistral AI	7 Mrd.	Open Source	Sept. 2023
Qwen 2.5 7B	Alibaba	7 Mrd.	Open Weights	Sept. 2024
Phi-4 Multimodal	Microsoft	5,6 Mrd.	Open Weights	Feb. 2025
Phi-4 mini	Microsoft	3,8 Mrd.	Open Weights	Feb. 2025
Phi-3 mini	Microsoft	3,8 Mrd.	Open Weights	Apr. 2024
Gemini Nano 2	Google	3,3 Mrd.	Proprietär	Dez. 2023
Ministral 3B	Mistral AI	3 Mrd.	Open Weights	Okt. 2024
Gemma 2 2B	Google	2 Mrd.	Open Weights	Juli 2024
Gemini Nano 1	Google	1,8 Mrd.	Proprietär	Dez. 2023
GPT-2	OpenAI	1,5 Mrd.	Open Source	Feb. 2019
Qwen 2.5 0.5B	Alibaba	0,5 Mrd.	Open Weights	Sept. 2024

Parameter-Größen bekannter Large Language Models (Stand: Mai 2026)

Spätestens seit der Veröffentlichung von ChatGPT im November 2022 sind Large Language Models (LLMs) in aller Munde.

Aber was ist ein LLM und was können diese „neuartigen Wundermaschinen“ überhaupt?

In diesem Lexikon-Eintrag erfährt du alles, was du als Anfänger über LLMs wissen musst:

1. Definition

Als Large Language Model (auf Deutsch: großes Sprachmodelle) oder kurz LLM bezeichnet man eine Software, die mit Methoden des maschinellen Lernens auf großen Textdatenmengen trainiert wurde.

Dadurch lernt es die Strukturen und Muster natürlicher Sprache und kann dann selbst sinnvolle, menschenähnliche Texte erzeugen.

Das Besondere an modernen LLMs ist, dass erzeugte Texte oft kaum von echtem, durch Menschen geschriebenen Text zu unterscheiden sind.

So ist es mit ChatGPT zum Beispiel möglich, lange und darüber hinaus auch gut gereimte Songtexte zu schreiben.

Bitte beachte:

ChatGPT und andere KI-Chatbots wie Claude, Microsoft Copilot oder Google Gemini sind selbst keine LLMs, sondern Tools. Sie basieren lediglich technisch auf einem oder mehreren LLMs.

Leider kommt es da manchmal zu Verwechselungen, weil die Tools und die Modell gleich oder sehr ähnlich heißen.

2. Was können LLMs und wofür werden sie eingesetzt?

Large Language Models sind wahre Multitalente, wenn es um die Bearbeitung, Analyse und Erstellung von Texten geht.

Sie können viele Aufgaben erledigen, für die man früher spezialisierte Systeme gebraucht hätte oder die ohne LLMs schlichtweg unmöglich waren:

Texterstellung und -bearbeitung

Zusammenfassen von Texten
Übersetzen zwischen verschiedenen Sprachen
Verfassen von Artikeln, Geschichten, Gedichten und vielen anderen Textarten
Korrigieren von Rechtschreib- und Grammatikfehlern
Paraphrasieren, also das Umschreiben von Text mit anderen Worten

Beantworten von Fragen und Führen von Dialogen

Als Wissensdatenbank zu verschiedensten Themen
Beantworten von Verständnisfragen zu einem Text oder Dokument
Führen von Dialogen als interaktive Chatbots

Analysieren und Verstehen von Texten

Textarten erkennen (Nachricht, Werbung, Fachtext etc.)
Stimmung und Tonalität erkennen (positiv, negativ, formell, informell etc.)
Identifikation von Personen, Organisationen, Orten etc. im Text

Programmieren

Erklären von Code
Generieren von Code
Debugging (das Finden und Beheben von Fehlern und Sicherheitslücken im Code)

2.1 In welchen Tools werden sie eingesetzt?

LLMs kommen zum Beispiel in folgenden Tools zum Einsatz, entweder als Haupt- oder als Nebenfunktion:

3. Wie funktionieren LLMs?

LLMs basieren auf einer Technik namens „Deep Learning“. Dabei lernt ein neuronales Netzwerk anhand riesiger Textmengen, die Struktur und Logik von Sprache zu verstehen.

Hier ein (stark vereinfachtes) Beispiel, wie ein LLM eine Antwort generiert:

1. Prompt: „Das Wetter heute ist sehr“

2. Das LLM schaut in seinem Modell nach den wahrscheinlichsten nächsten Worten

3. Basierend auf den gelernten Mustern ermittelt es folgende Wahrscheinlichkeiten:

„gut“: 40 %
„schlecht“: 30 %
„wechselhaft“: 20 %
usw.

4. Das LLM wählt das Wort „gut“ aus, weil es mit 40 % das wahrscheinlichste ist.

5. Das Sprachmodell wiederholt die Schritte 2 bis 4 für das nächste Wort: „Das Wetter heute ist gut und die Regenwahrscheinlichkeit sehr gering.“

6. Diese Schleife wiederholt das LLM, bis es ein Stoppkriterium erreicht (z. B. ein bestimmtes Satzzeichen kommt oder eine vorgegebene Menge generierte Zeichen oder Token erreicht ist)

4. Grenzen von LLMs

Durch ihren wahrscheinlichkeitsbasierten Ansatz können LLMs Texte generieren, die kaum von menschengemachten Texten zu unterscheiden sind.

Wichtig zu verstehen, ist jedoch, dass...

LLMs kein echtes Verständnis von Konzepten oder Logik haben (sie reproduzieren nur Muster)
kein Bewusstsein haben und nicht „lebendig“ sind (obwohl sie ziemlich gut darin sind, dir das vorzugaukeln)
sie Fakten vermischen oder Dinge „halluzinieren“ (erfinden) können
sie ein Knowledge Cutoff Date haben. Das heißt, nur Daten bis zu einem bestimmten Zeitpunkt berücksichtigten und es kann sein, dass sie veraltete Zahlen, Daten oder Fakten ausspucken.
Antworten von LLMs variieren können (abhängig und unabhängig von den Befehlen oder Fragen, die man stellt)
sie keine stabile Persönlichkeit oder ein konsistentes Wertesystem haben

Dazu kommt, dass die internen Abläufe von LLMs selbst für Experten und LLM-Entwickler eine Art „Blackbox“ sind.

Das heißt, obwohl man Input und Output kennt, kann man nicht genau nachvollziehen, wie der Output „zwischendrin“ zustande gekommen ist.

5. Risiken & Herausforderungen

So hilfreich und spannend LLMs auch sein mögen, bringen sie auch diverse Risiken und Herausforderungen mit, die hier nicht unerwähnt bleiben sollen.

Dazu gehören:

Verbreitung von Fake News, Propaganda und Verschwörungstheorien
Umgehen von internen Sicherheitsmechanismen von LLMs, z. B. durch Prompt Injections
Missbrauch für Betrug, z. B. durch Imitieren von Personen und Generieren gefälschter Inhalte
Verstärkung von Vorurteilen und Diskriminierung durch verzerrte Trainingsdaten
Verletzung von Urheberrecht und Datenschutz durch Reproduzieren von Trainingsdaten (auch, wenn es durch die Arbeitsweise von LLMs eher selten dazu kommen)
Ersetzung von menschlicher Arbeitskraft und Expertise in bestimmten Bereichen

6. Liste bekannter LLMs und ihre Parameter

Legende:

500+ Mrd.

100-500 Mrd.

20-100 Mrd.

5-20 Mrd.

Unter 5 Mrd.

Zeige 91 Modelle

Parameter-Größen bekannter Large Language Models (Stand: Mai 2026)
Modell	Entwickler	Parameter	Typ	Release
GPT-5.5	OpenAI	Unbekannt	Proprietär	Apr. 2026
GPT-5.5 Pro	OpenAI	Unbekannt	Proprietär	Apr. 2026
GPT-5.5 Instant	OpenAI	Unbekannt	Proprietär	Mai 2026
GPT-5.4	OpenAI	Unbekannt	Proprietär	März 2026
GPT-5.3-Codex	OpenAI	Unbekannt	Proprietär	Feb. 2026
GPT-5.2	OpenAI	Unbekannt	Proprietär	Dez. 2025
GPT-5	OpenAI	Unbekannt	Proprietär	Juni 2025
GPT-5 pro	OpenAI	Unbekannt	Proprietär	Juni 2025
GPT-5 mini	OpenAI	Unbekannt	Proprietär	Juni 2025
GPT-3.5 Turbo	OpenAI	Unbekannt	Proprietär	Nov. 2022
o3	OpenAI	Unbekannt	Proprietär	Apr. 2025
o4-mini	OpenAI	Unbekannt	Proprietär	Apr. 2025
o1	OpenAI	Unbekannt	Proprietär	Sept. 2024
Claude Opus 4.8	Anthropic	Unbekannt	Proprietär	Mai 2026
Claude Opus 4.7	Anthropic	Unbekannt	Proprietär	Apr. 2026
Claude Opus 4.6	Anthropic	Unbekannt	Proprietär	Feb. 2026
Claude Sonnet 4.6	Anthropic	Unbekannt	Proprietär	Feb. 2026
Claude Opus 4.5	Anthropic	Unbekannt	Proprietär	Nov. 2025
Claude Sonnet 4.5	Anthropic	Unbekannt	Proprietär	Sept. 2025
Claude Sonnet 4	Anthropic	Unbekannt	Proprietär	Mai 2025
Gemini 3.5 Flash MoE	Google	Unbekannt	Proprietär	Mai 2026
Gemini 3.1 Pro MoE	Google	Unbekannt	Proprietär	Feb. 2026
Gemini 3 Pro MoE	Google	Unbekannt	Proprietär	Dez. 2025
Gemini 2.0 Flash MoE	Google	Unbekannt	Proprietär	Dez. 2024
Gemini 1.5 Pro MoE	Google	Unbekannt	Proprietär	Feb. 2024
Grok 4	xAI	Unbekannt	Proprietär	Juli 2025
Grok 3	xAI	Unbekannt	Proprietär	Feb. 2025
Grok 2	xAI	Unbekannt	Proprietär	Aug. 2024
Claude 3 Opus	Anthropic	2 Billionen*	Proprietär	März 2024
Llama 4 Behemoth MoE(288 Mrd. aktiv)	Meta	2 Billionen	Open Weights	Apr. 2025
GPT-4 MoE(220 Mrd. aktiv)	OpenAI	1,76 Billionen*	Proprietär	März 2023
DeepSeek-V4-Pro MoE(49 Mrd. aktiv)	DeepSeek	1,6 Billionen	Open Weights	Apr. 2026
Kimi K2.6 MoE(32 Mrd. aktiv)	Moonshot AI	1 Billionen	Open Weights	Apr. 2026
Qwen 3.6 Max-Preview MoE	Alibaba	1 Billionen*	Proprietär	Apr. 2026
Yi-Large MoE	01.AI	1 Billionen	Proprietär	Mai 2024
DeepSeek-V3.2 MoE(37 Mrd. aktiv)	DeepSeek	685 Mrd.	Open Weights	Dez. 2025
Mistral Large 3 MoE(41 Mrd. aktiv)	Mistral AI	675 Mrd.	Proprietär	Dez. 2025
DeepSeek-V3 MoE(37 Mrd. aktiv)	DeepSeek	671 Mrd.	Open Weights	Dez. 2024
DeepSeek-R1 MoE(37 Mrd. aktiv)	DeepSeek	671 Mrd.	Open Weights	Jan. 2025
PaLM	Google	540 Mrd.	Proprietär	Apr. 2022
Megatron-Turing NLG	NVIDIA	530 Mrd.	Proprietär	Jan. 2022
Llama 3.1 405B	Meta	405 Mrd.	Open Weights	Juli 2024
Llama 4 Maverick MoE(17 Mrd. aktiv)	Meta	400 Mrd.	Open Weights	Apr. 2025
Nemotron-4 340B	NVIDIA	340 Mrd.	Open Weights	Juni 2024
PaLM 2	Google	340 Mrd.*	Proprietär	Mai 2023
Grok 1 MoE(86 Mrd. aktiv)	xAI	314 Mrd.	Open Weights	Nov. 2023
DeepSeek-V2 MoE(21 Mrd. aktiv)	DeepSeek	236 Mrd.	Open Weights	Mai 2024
GPT-4o	OpenAI	200 Mrd.*	Proprietär	Mai 2024
Falcon 180B	TII	180 Mrd.	Open Weights	Sept. 2023
Mixtral 8x22B MoE(44 Mrd. aktiv)	Mistral AI	176 Mrd.	Open Weights	Apr. 2024
BLOOM	BigScience	176 Mrd.	Open Source	Juli 2022
GPT-3	OpenAI	175 Mrd.	Proprietär	Juni 2020
Claude 3.5 Sonnet	Anthropic	175 Mrd.*	Proprietär	Juni 2024
OPT-175B	Meta	175 Mrd.	Open Source	Mai 2022
LaMDA	Google	137 Mrd.	Proprietär	Jan. 2022
DBRX MoE(36 Mrd. aktiv)	Databricks	132 Mrd.	Open Weights	März 2024
Mistral Large 2	Mistral AI	123 Mrd.	Open Weights	Juli 2024
Command A	Cohere	111 Mrd.	Proprietär	März 2025
Llama 4 Scout MoE(17 Mrd. aktiv)	Meta	109 Mrd.	Open Weights	Apr. 2025
Command R+	Cohere	104 Mrd.	Open Weights	Apr. 2024
Qwen 2.5 72B	Alibaba	72 Mrd.	Open Weights	Sept. 2024
Claude 3 Sonnet	Anthropic	70 Mrd.*	Proprietär	März 2024
Llama 3.3 70B	Meta	70 Mrd.	Open Weights	Dez. 2024
Llama 3.1 70B	Meta	70 Mrd.	Open Weights	Juli 2024
Llama 3 70B	Meta	70 Mrd.	Open Weights	Apr. 2024
Llama 2 70B	Meta	70 Mrd.	Open Weights	Juli 2023
Mixtral 8x7B MoE(14 Mrd. aktiv)	Mistral AI	56 Mrd.	Open Weights	Dez. 2023
Falcon 40B	TII	40 Mrd.	Open Source	Mai 2023
Yi-34B	01.AI	34 Mrd.	Open Weights	Nov. 2023
Qwen 2.5 32B	Alibaba	32 Mrd.	Open Weights	Sept. 2024
Command R	Cohere	32 Mrd.	Open Weights	März 2024
Gemma 2 27B	Google	27 Mrd.	Open Weights	Juni 2024
Claude 3 Haiku	Anthropic	20 Mrd.*	Proprietär	März 2024
Qwen 2.5 14B	Alibaba	14 Mrd.	Open Weights	Sept. 2024
Phi-4	Microsoft	14 Mrd.	Open Weights	Dez. 2024
Gemma 2 9B	Google	9 Mrd.	Open Weights	Juni 2024
GPT-4o mini	OpenAI	8 Mrd.*	Proprietär	Juli 2024
Llama 3.1 8B	Meta	8 Mrd.	Open Weights	Juli 2024
Llama 3 8B	Meta	8 Mrd.	Open Weights	Apr. 2024
Ministral 8B	Mistral AI	8 Mrd.	Open Weights	Okt. 2024
Mistral 7B	Mistral AI	7 Mrd.	Open Source	Sept. 2023
Qwen 2.5 7B	Alibaba	7 Mrd.	Open Weights	Sept. 2024
Phi-4 Multimodal	Microsoft	5,6 Mrd.	Open Weights	Feb. 2025
Phi-4 mini	Microsoft	3,8 Mrd.	Open Weights	Feb. 2025
Phi-3 mini	Microsoft	3,8 Mrd.	Open Weights	Apr. 2024
Gemini Nano 2	Google	3,3 Mrd.	Proprietär	Dez. 2023
Ministral 3B	Mistral AI	3 Mrd.	Open Weights	Okt. 2024
Gemma 2 2B	Google	2 Mrd.	Open Weights	Juli 2024
Gemini Nano 1	Google	1,8 Mrd.	Proprietär	Dez. 2023
GPT-2	OpenAI	1,5 Mrd.	Open Source	Feb. 2019
Qwen 2.5 0.5B	Alibaba	0,5 Mrd.	Open Weights	Sept. 2024

Parameter-Größen bekannter Large Language Models (Stand: Mai 2026)

Was ist ein Large Language Model (LLM)?

1. Definition

2. Was können LLMs und wofür werden sie eingesetzt?

Texterstellung und -bearbeitung

Beantworten von Fragen und Führen von Dialogen

Analysieren und Verstehen von Texten

Programmieren

2.1 In welchen Tools werden sie eingesetzt?

3. Wie funktionieren LLMs?

4. Grenzen von LLMs

5. Risiken & Herausforderungen

6. Liste bekannter LLMs und ihre Parameter

Finn Hillebrandt

Verwandte KI-Begriffe

Was ist ein Large Language Model (LLM)?

1. Definition

2. Was können LLMs und wofür werden sie eingesetzt?

Texterstellung und -bearbeitung

Beantworten von Fragen und Führen von Dialogen

Analysieren und Verstehen von Texten

Programmieren

2.1 In welchen Tools werden sie eingesetzt?

3. Wie funktionieren LLMs?

4. Grenzen von LLMs

5. Risiken & Herausforderungen

6. Liste bekannter LLMs und ihre Parameter

Finn Hillebrandt

Verwandte KI-Begriffe