Zum Hauptinhalt springen

Large Language Model (LLM)

Die Grundlage moderner KI-Anwendungen wie ChatGPT, Claude und Co.

Was ist ein Large Language Model?

Ein Large Language Model (LLM) ist ein künstliches neuronales Netzwerk mit Milliarden oder sogar Billionen von Parametern, das auf riesigen Textmengen trainiert wurde. Diese Modelle können menschenähnliche Texte verstehen und generieren, Fragen beantworten, übersetzen und viele weitere sprachbasierte Aufgaben ausführen.

Fun Fact: GPT-4 wurde auf geschätzten 45TB Textdaten trainiert – das entspricht etwa 45 Millionen Büchern!

Wie funktionieren LLMs?

1. Training (Pre-Training)

Das Modell lernt Sprachmuster aus riesigen Textmengen durch "Next Token Prediction" – es versucht vorherzusagen, welches Wort als nächstes kommt.

Eingabe: "Der Himmel ist..."
Modell lernt: "blau" (wahrscheinlich), "grau" (möglich), "grün" (unwahrscheinlich)

2. Transformer-Architektur

LLMs basieren auf der Transformer-Architektur mit Attention-Mechanismen, die es dem Modell ermöglichen, Beziehungen zwischen Wörtern über große Distanzen zu verstehen.

3. Tokenisierung

Text wird in kleinere Einheiten (Tokens) zerlegt – etwa 1 Token ≈ 0.75 Wörter.

Bekannte Large Language Models

GPT-4

OpenAI

2023
Parameter: ~1.76 Billionen

Claude 3

Anthropic

2024
Parameter: Nicht bekannt

Gemini Pro

Google

2023
Parameter: ~1.56 Billionen

LLaMA 2

Meta

2023
Parameter: 7B - 70B
Umfassende Liste populärer LLMs (Juli 2025)
ModellEntwicklerParameterReleaseVerfügbarkeit
Kommerzielle Modelle
GPT-4oOpenAI~1.76TMai 2024API
GPT-4.1OpenAI~1.76TQ1 2025API
GPT-4.5OpenAI~5-7T (est.)Februar 2025API
o3OpenAIUnbekannt16. April 2025API
o3-miniOpenAIUnbekannt31. Jan 2025API
Claude 4 OpusAnthropicUnbekannt22. Mai 2025API
Claude 3.5 SonnetAnthropicUnbekannt2024API
Gemini 2.5 ProGoogleUnbekannt25. März 2025API
Gemini 2.0 FlashGoogleUnbekannt2024API
Open Source Modelle
LLaMA 4 ScoutMeta109B (17B aktiv)5. April 2025Open Source
LLaMA 3.3 70BMeta70B2024Open Source
LLaMA 3.1-405BMeta405B2024Open Source
DeepSeek R1DeepSeek671B (37B aktiv)20. Jan 2025MIT License
DeepSeek V3DeepSeek671B (MoE)2024Open Source
Qwen 3Alibaba0.6B-235B28. April 2025Apache 2.0
QwQ-32BAlibaba32BDez 2024Open Source
Mistral Large 2Mistral AI123B2024Kommerziell
Mixtral 8x22BMistral AI141B (39B aktiv)2024Apache 2.0
Falcon 3TII1B-10BJan 2025Apache 2.0
Falcon 180BTII180BSep 2023Apache 2.0
Spezialisierte Modelle
CodeLlama 70BMeta70B2023Code
StarCoder2BigCode3B-15B2024Code
DeepSeek CoderDeepSeek33B2024Code
Med-PaLM 2GoogleUnbekannt2023Medizin
BioMistralMistral AI7B2024Medizin
Small/Edge Modelle
Phi-4Microsoft16B2025API
Phi-3.xMicrosoft3.8B-42B2024MIT
Gemma 3Google1B-27B2025Apache 2.0
Gemma 2Google2B-7BJuni 2024Apache 2.0
MiniCPMOpenBMB1B-4B2024Open Source
MobileLLaMACommunity1.4B-2.7B2024Edge
StableLM-ZephyrStability AI3B2024Apache 2.0
Chinesische Modelle
Qwen 2.5-MaxAlibaba110B2024API
Doubao ProByteDanceUnbekannt2024API
Ernie BotBaidu260B2024Kommerziell
HunyuanTencent52B2024API
PanguHuawei230B2024Kommerziell
Europäische Modelle
Pixtral LargeMistral AI124B2025Multimodal
MagistralMistral AIUnbekannt2025Reasoning
Mistral Small 3Mistral AI24BJan 2025Apache 2.0
BLOOMBigScience176B2022BigScience
Pharia-1-LLM-7BAleph Alpha7BSep 2024EU Konform
Multimodale Modelle
Amazon NovaAmazonUnbekannt2024Video/Audio
LLaVA-NextCommunity34B2024Vision
CLIP-L/14OpenAI427M2024Vision
Reasoning Modelle
o3-miniOpenAIUnbekannt2025Reasoning
Claude 4 SonnetAnthropicUnbekanntMai 2025Reasoning

* Parameteranzahl und Verfügbarkeit können sich ändern. Stand: Juli 2025

Was können LLMs?

Textgenerierung

Erstellen von kohärenten, kontextbezogenen Texten in verschiedenen Stilen

Übersetzung

Übersetzen zwischen dutzenden Sprachen mit hoher Genauigkeit

Code-Generierung

Schreiben und Erklären von Code in verschiedenen Programmiersprachen

Reasoning

Logisches Denken und Problemlösung bei komplexen Aufgaben

Größenvergleich: Evolution der Modelle
GPT-2 (2019)1.5B Parameter
GPT-3 (2020)175B Parameter
GPT-4 (2023)~1.76T Parameter

Die Anzahl der Parameter ist exponentiell gewachsen – moderne LLMs haben 1000x mehr Parameter als ihre Vorgänger von vor 5 Jahren.

Zukunftsausblick

Die Entwicklung von LLMs schreitet rasant voran. Zukünftige Trends umfassen:

  • Effizienz: Kleinere, spezialisierte Modelle mit vergleichbarer Leistung
  • Multimodalität: Integration von Text, Bild, Audio und Video
  • Längere Kontexte: Verarbeitung von ganzen Büchern oder Dokumentensammlungen
  • Reasoning: Verbesserte logische Schlussfolgerungen und Problemlösung
Quellen und Referenzen