Claude Code oder OpenAI Codex? Die Frage bekomme ich ständig gestellt.
Beide Tools sind mittlerweile ausgereift und haben sich seit ihrem Launch stark weiterentwickelt. Claude Code führt mit 134.713 GitHub-Sternen. OpenAI Codex wurde von TypeScript auf Rust umgeschrieben, kommt auf 94.100 Sterne und laut OpenAI auf über 5 Millionen wöchentlich aktive Nutzer (Stand: 2. Juni 2026).
Die Unterschiede liegen weniger in der reinen Code-Qualität (beide erzielen starke SWE-bench-Ergebnisse) als in der Architektur, den Oberflächen, den Kosten und dem Workflow. Dieser Vergleich zeigt dir, welches Tool zu deinem Entwicklungsalltag passt.
- SWE-bench Verified: Claude Opus 4.8 (88,6 %), GPT-5.3-Codex (85,0 %), GPT-5.5 (82,6 % im Vals-AI-Harness). Auf Terminal-Bench 2.1 zieht die OpenAI-Preview GPT-5.6 Sol (26.06.2026, ca. 20 Partner inkl. Codex CLI) mit 88,8 % gleich
- Beide starten bei 20 $/Monat (Claude Pro bzw. ChatGPT Plus) und skalieren bis 200 $/Monat (Claude Max 20x bzw. ChatGPT Pro). Kostenlos ist keines der beiden Tools
- Beide erreichen bis zu 1M Token Kontext und bieten MCP-Support, eine Desktop-App für macOS und Windows, autonomes Arbeiten und IDE-Integration
Detaillierter Feature-Vergleich: Alle Funktionen im Überblick
Die folgende interaktive Tabelle zeigt alle Features, Modelle, Limits und Standards der beiden Tools im direkten Vergleich. Du kannst die Spalten über die Buttons ausblenden und Kategorien auf- oder zuklappen. Der Stand ist Juni 2026.
| Feature | Claude Code | OpenAI Codex |
|---|---|---|
Grundlagen(6 Einträge) | ||
| Hersteller | Anthropic | OpenAI |
| Erstveröffentlichung | Februar 2025 | April 2025 |
| Open Source | Nein | Nur CLI |
| Primäre Schnittstelle | Terminal (CLI) | Terminal (CLI) |
| Installation | npm i -g @anthropic-ai/claude-code | npm i -g @openai/codex |
| Betriebssysteme | Mac/Linux/Win | Mac/Linux/Win |
Preise & Limits(6 Einträge) | ||
| Basispreis | $20/mo (Pro) | $20/mo (Plus) |
| Premium-Tarif | $100-200/mo (Max) | $200/mo (Pro) |
| Free Tier | Nein | Nein |
| API Input-Kosten | $5/1M (Opus 4.8) | $5/1M (GPT-5.5) |
| API Output-Kosten | $25/1M (Opus 4.8) | $30/1M (GPT-5.5) |
| Prompt Caching | 90% | Auto 90% |
Modelle & Kontext(9 Einträge) | ||
| Standard-Modell | Claude Sonnet 4.6 | GPT-5.4 |
| Premium-Modell | Claude Opus 4.8 | GPT-5.5 |
| Schnelles Modell | Claude Haiku 4.5 | GPT-5.4-mini |
| Preview-Modell | Nein | GPT-5.6 Sol |
| Modellauswahl | /model | /model |
| Standard-Kontext | 200K Token | 256K Token |
| Max Kontext | 1M (Opus 4.8) | 1M (GPT-5.5) |
| Output-Limit | 128K Token | 64K Token |
| Reasoning-Modus | Extended Think | Deep Thinking |
Standards & Konfiguration(5 Einträge) | ||
| Config-Datei | CLAUDE.md | AGENTS.md |
| MCP-Support | Voll | Voll |
| Skills/Plugins | Skills/Plugins | Agent Skills |
| Custom Instructions | System Prompt | Custom Instructions |
| Projekt-Kontext | Automatisch | Automatisch |
Integration & Oberflächen(8 Einträge) | ||
| Git-Integration | Nativ | GitHub Native |
| VS Code | Extension | Extension |
| JetBrains IDEs | Plugin (Beta) | Terminal |
| Cursor Support | Nativ | Nativ |
| Neovim | Plugin | Terminal |
| Desktop-App | macOS/Win | macOS/Win |
| Web/Cloud | claude.ai/Mobile | Codex Cloud |
| API-Zugang | Voll | Voll |
Features & Fähigkeiten(11 Einträge) | ||
| Datei-Operationen | Lesen/Schreiben | Lesen/Schreiben |
| Shell-Befehle | Bash/Zsh | Sandbox |
| Code-Generierung | Exzellent | Sehr gut |
| Refactoring | Exzellent | Sehr gut |
| Debugging | Exzellent | Sehr gut |
| Test-Generierung | Ja | Ja |
| Code Review | /review | PR Review |
| Dokumentation | Automatisch | Ja |
| Bild-Input | Screenshots | Vision |
| Web-Suche | Ja | Ja |
| Codebase-Analyse | Voll | Context Comp. |
Autonomie & Agenten(8 Einträge) | ||
| Autonomes Arbeiten | Ja | Ja |
| Subagents | Nativ | Cloud Tasks |
| Parallele Agents | Ja | Ja |
| Task-Planung | Automatisch | Automatisch |
| Checkpoints | Rewind | Rollback |
| Kontext-Kompression | /compact | Nativ |
| Session-Fortführung | -c Flag | Ja |
| Headless/Batch | -p Flag | codex exec |
Sicherheit & Datenschutz(5 Einträge) | ||
| Lokale Ausführung | Ja | Sandbox/Cloud |
| Permissions-System | Granular | Sandbox |
| SOC 2 Compliance | Ja | Ja |
| Enterprise-Optionen | Ja | Enterprise |
| Daten-Training | Opt-out | Opt-out |
Performance(3 Einträge) | ||
| SWE-bench Score | 88.6% | 85.0% |
| Antwortzeit | 3-6 Sek. | Variable |
| Sprachen-Support | 20+ | 20+ |
Claude Code: Präzision und Git-Integration
Claude Code ist das ältere der beiden Tools (seit Februar 2025) und hat sich als zuverlässiger Terminal-Partner etabliert. Mit Claude Opus 4.8 erreicht es 88,6 % auf SWE-bench Verified und bietet die beste native Git-Integration im Vergleich.
Was Claude Code auszeichnet
Der entscheidende Vorteil ist die durchdachte Git-Integration in Kombination mit der Zuverlässigkeit. Claude Code versteht Kontext, erstellt sinnvolle Commit-Messages, gruppiert zusammenhängende Änderungen und kann Pull Requests vorbereiten. Das spart nicht nur Zeit, sondern sorgt für eine saubere Commit-History.
# Claude Code installieren (einmalig)
$ npm install -g @anthropic-ai/claude-code
# Claude Code starten
$ claude
# Projekt analysieren
> Analyze the current project structure and tech stack
# Funktion implementieren mit natürlicher Sprache
> Build a newsletter signup with email validation,
> rate limiting, and Resend integration
# Claude Code:
# - Erstellt React-Komponente
# - Implementiert Zod-Validierung
# - Baut API-Endpoint
# - Schreibt Tests
# - Macht Git-Commits mit sinnvollen MessagesDie technische Stärke
Alle aktuellen Claude-Modelle (Sonnet 4.6, Opus 4.7, Opus 4.8) bieten ein 1 Million Token Kontextfenster. Opus 4.8 liefert bis zu 128K Token Output, was für umfangreiche Refactorings in einem Rutsch wichtig ist.
Claude Code bietet zudem Subagents für paralleles Arbeiten, MCP-Support und eine Desktop-App für Mac und Windows.
Die Git-Integration ist durchdacht
Claude Code versteht Git auf einem beeindruckenden Level und:
- Erstellt sinnvolle Commit-Messages automatisch
- Gruppiert zusammenhängende Änderungen
- Kann Pull Requests vorbereiten
- Versteht Branch-Strategien
# Claude Code generiert das automatisch:
git add src/components/Newsletter.tsx
git commit -m "feat: Add newsletter signup component with email validation
- Implement form validation using Zod
- Add rate limiting to prevent spam
- Include success/error state handling
- Add responsive design for mobile"
git add src/api/newsletter/route.ts
git commit -m "feat: Add newsletter API endpoint with email service integration"
# Gruppiert logisch zusammen, perfekte Commit-HistoryOpenAI Codex: Drei Oberflächen, ein Agent
OpenAI Codex hat sich seit dem Launch im April 2025 stark verändert. Die CLI wurde im Juni 2025 von TypeScript auf Rust umgeschrieben (heute 95,6 % Rust), dazu kam im Februar 2026 eine Desktop-App für Mac und Windows. Auf SWE-bench Verified liegt Claude Opus 4.8 mit 88,6 % vorn, während GPT-5.3-Codex 85,0 % erreicht und GPT-5.5 im Vals-AI-Harness bei 82,6 % liegt.
Seit dem 26. Juni 2026 läuft zusätzlich GPT-5.6 Sol als Limited Preview an rund 20 OpenAI-Partner. Codex CLI ist eines der zwei offiziellen Preview-Vehikel und damit das erste Coding-Tool, in dem das neue OpenAI-Standardmodell produktiv getestet wird. Sol erreicht 88,8 % auf Terminal-Bench 2.1, Sol Ultra 91,9 %. Quelle: openai.com/index/previewing-gpt-5-6-sol/.
Was macht Codex anders?
Codex bietet drei Oberflächen, nämlich die CLI (Terminal, Open Source), die Desktop-App (Mac und Windows) und Codex Cloud (Web unter chatgpt.com/codex). Während Claude Code stärker auf das Terminal als primäre Oberfläche setzt, hat Codex damit die breiteste Plattform-Abdeckung.
Die Besonderheit ist die parallele Aufgabenbearbeitung in isolierten Cloud-Sandboxes. Du startest mehrere Programmier-Aufgaben gleichzeitig, und Codex bearbeitet sie in separaten Containern parallel.
# Codex CLI installieren
$ npm install -g @openai/codex
# Oder über GitHub Integration
@codex "Implement user authentication system"
@codex "Add payment integration with Stripe"
@codex "Write comprehensive tests for API"
# Alle drei Tasks laufen parallel in separaten Cloud-Containern
# Codex erstellt automatisch Pull Requests für Review
# Jeder Task hat seine eigene isolierte UmgebungDie Benchmark-Ergebnisse
OpenAI hat die Modelle für Codex kontinuierlich verbessert. Die wichtigsten Code-Benchmarks im Überblick, jeweils mit Claude Opus 4.8 als Referenz an der Spitze:
Modell | Benchmark | Verfügbar seit |
|---|---|---|
| Claude Opus 4.8 | SWE-bench Verified: 88,6 % | Mai 2026 |
| GPT-5.3-Codex | SWE-bench Verified: 85,0 % | Februar 2026 |
| GPT-5.5 | SWE-bench Verified: 82,6 % (Vals AI) | April 2026 |
| GPT-5.6 Sol (Preview) | Terminal-Bench 2.1: 88,8 % | Juni 2026 (Limited Preview) |
Visualisiert zeigt sich, wie eng das Rennen an der Spitze ist:
Claude Opus 4.8 führt SWE-bench vor GPT-5.3-Codex
| Benchmark | Opus 4.8 | GPT-5.3-Codex | GPT-5.5 |
|---|---|---|---|
| SWE-bench | 88,6 % | 85,0 % | 82,6 % |
Quellen: Anthropic, OpenAI, Vals AI
Besonders stark ist die GitHub-Integration. Codex kann automatisch Pull Requests erstellen, Code-Reviews durchführen, Issues verarbeiten und über @mentions mit Teams kollaborieren.
Die Preise: Gestaffelt nach Bedarf
Codex ist in allen ChatGPT-Abos enthalten:
- ChatGPT Plus: 20 $/Monat (30 bis 150 Nachrichten pro 5 Stunden)
- ChatGPT Pro: 200 $/Monat (rund zehnfache Kapazität, 300 bis 1.500 Nachrichten pro 5 Stunden)
- Business: 25 $/Platz/Monat (Team- und Admin-Funktionen)
In allen ChatGPT-Abos ist Codex im Rahmen der Fair-Use-Policy enthalten. Wer lieber nutzungsbasiert zahlt, kann Codex auch über die OpenAI-API mit Token-Credits betreiben.
CLI gegen CLI: Befehle, Sandbox und Automatisierung
Beide Tools leben primär im Terminal, gehen es aber unterschiedlich an. Claude Code ist eine einzige, stark konfigurierbare REPL mit nativen Git-Worktrees, Hooks und Subagents. Codex setzt mehr auf eigenständige Unterbefehle wie codex exec, codex review und codex cloud und bringt ein explizites Sandbox- und Approval-Modell mit.
Die wichtigsten Befehle im Vergleich
Für die meisten Aufgaben gibt es auf beiden Seiten ein Gegenstück. Die folgende Tabelle stellt die gängigsten Befehle nebeneinander.
Aufgabe | Claude Code | OpenAI Codex |
|---|---|---|
| Interaktiv starten | claude | codex |
| Mit Prompt starten | claude "Prompt" | codex "Prompt" |
| Headless (nicht-interaktiv) | claude -p | codex exec |
| Session fortsetzen | [object Object], / ,[object Object] | codex resume |
| Session forken | claude --fork-session | codex fork |
| Code-Review | /review | codex review |
| Cloud-Task starten | claude --remote | codex cloud exec |
| Diff anwenden | In der laufenden Session | codex apply |
| MCP-Server verwalten | claude mcp add | codex mcp add |
| Selbst als MCP-Server laufen | Nicht vorgesehen | codex mcp-server |
| Isolierter Git-Worktree | claude -w | Manuell anlegen |
| Aktualisieren | claude update | codex update |
Der wichtigste konzeptionelle Unterschied liegt im Aufbau. Bei Claude Code passiert fast alles in der laufenden Session, gesteuert über Slash-Commands und Flags. Bei Codex sind viele Funktionen eigene Unterbefehle, was sich gut in Skripte und CI-Pipelines einbauen lässt.
Sandbox, Berechtigungen und Autonomie
Beim Thema Sicherheit unterscheiden sich die Philosophien deutlich. Claude Code arbeitet mit einem granularen Permission-System, das pro Tool und Befehl entscheidet und sich über Hooks erweitern lässt. Codex bringt eine echte Betriebssystem-Sandbox mit drei Stufen plus vier Approval-Policies mit.
Aspekt | Claude Code | OpenAI Codex |
|---|---|---|
| Grundmodell | Permission-System pro Tool und Befehl | OS-Sandbox plus Approval-Policy |
| Stufen / Modi | Permission-Modi (z. B. plan) | read-only, workspace-write, danger-full-access |
| Genehmigung | Prompts pro Aktion, regelbasiert | untrusted, on-failure, on-request, never |
| Feinsteuerung | --allowedTools / --disallowedTools, Hooks | --sandbox / --ask-for-approval, execpolicy |
| Volles Vertrauen | --dangerously-skip-permissions | danger-full-access plus never |
| Netzwerkzugriff | tool- bzw. MCP-abhängig | nur in danger-full-access |
In der Praxis bedeutet das zweierlei. Codex gibt dir ein klares, abgestuftes Sandbox-Modell, mit dem du genau festlegst, was der Agent lesen, schreiben und im Netz tun darf. Claude Code setzt auf feingranulare Tool-Berechtigungen plus Hooks, mit denen du eigene Prüf- und Automatisierungslogik einklinken kannst.
Automatisierung und Headless-Betrieb
Für Skripte und CI-Pipelines bieten beide einen nicht-interaktiven Modus. Claude Code nutzt dafür claude -p mit strukturierter Ausgabe (--output-format json oder stream-json), optionalem --json-schema und Schutzschaltern wie --max-turns und --max-budget-usd. Codex nutzt codex exec, streamt das Ergebnis nach stdout und lässt sich mit codex exec resume fortsetzen.
# Claude Code: headless mit JSON-Ausgabe und Budget-Limit
$ claude -p "Fix all type errors" --output-format json --max-budget-usd 2.00
# Codex: nicht-interaktiv, Ergebnis nach stdout
$ codex exec "Fix all type errors"
# Codex: Cloud-Task in isolierter Sandbox starten
$ codex cloud exec "Migrate the test suite to Vitest"Desktop-App gegen Desktop-App
Beide Tools sind im Terminal groß geworden, und beide haben inzwischen eine Desktop-App für macOS und Windows. Der Ansatz dahinter ist aber grundverschieden.
Claude Code: Terminal-first mit Brücke auf alle Geräte
Bei Claude Code bleibt das Terminal die Hauptoberfläche. Mit dem Befehl /desktop (Alias /app, seit Version 2.0.51) setzt du eine laufende CLI-Session in der Claude Code Desktop-App fort, also grafisch statt im Terminal. Dazu kommt eine ganze Geräte-Brücke. /mobile öffnet die Claude Mobile App per QR-Code (iOS und Android), /remote-control (Alias /rc) macht eine Session über claude.ai oder die Claude App fernsteuerbar, --remote startet eine Web-Session direkt auf claude.ai und --teleport holt sie wieder lokal zurück. Die Desktop-App ist hier eine von mehreren Oberflächen, das Terminal bleibt das Zuhause.
Codex: eigenständige GUI für viele Threads
Codex geht den umgekehrten Weg. Die Desktop-App (gestartet mit codex app, gelauncht im Februar 2026) ist eine vollwertige GUI neben der CLI, gebaut für mehrgleisiges agentisches Coding. Sie bringt eine Command-Palette (Cmd+Shift+P bzw. Cmd+K), eine Sidebar (Cmd+B), ein Diff-Panel (Cmd+Option+B), ein integriertes Terminal (Cmd+J), Thread-Navigation (Cmd+Shift+[ und ]) und sogar Diktat (Ctrl+M) mit. In der App stehen fünf Slash-Commands zur Verfügung, in der CLI sind es 34. Modelle und Konfiguration sind in beiden identisch. Zusammen mit Codex Cloud kannst du mehrere Aufgaben parallel anstoßen und im Blick behalten.
Aspekt | Claude Code Desktop-App | Codex Desktop-App |
|---|---|---|
| Plattformen | macOS und Windows | macOS und Windows |
| Start | /desktop bzw. /app aus der CLI-Session | codex app (eigenständig) |
| Grundidee | GUI-Fortsetzung der Terminal-Session | Eigenständige GUI neben der CLI |
| Verfügbar seit | Claude Code 2.0.51 | Februar 2026 |
| Oberfläche | Vertraute Claude-Code-Ansicht | Command-Palette, Sidebar, Diff-Panel, integriertes Terminal |
| Slash-Commands | Fortgesetzte CLI-Session | 5 eigene (CLI: 34) |
| Parallele Aufgaben | Subagents und parallele Agenten | Multi-Thread-GUI plus Codex Cloud |
| Modelle & Config | Identisch zur CLI | Identisch zur CLI |
| Weitere Geräte | Mobile-App per QR (/mobile), Steuerung via claude.ai (/rc) | Codex Cloud im Browser, Remote-Control via Chrome-Extension |
Claude Codes Desktop-App ist also die grafische Erweiterung eines terminal-first Workflows, inklusive Handoff aufs Handy und in den Browser. Codex' Desktop-App ist eine vollwertige zweite Oberfläche, die zusammen mit der Cloud auf parallele Agenten-Tasks ausgelegt ist. Wer am liebsten im Terminal bleibt und nur gelegentlich eine GUI braucht, fühlt sich bei Claude Code wohler. Wer eine grafische Kommandozentrale für viele parallele Threads will, findet sie bei Codex.
Stärken nach Anwendungsfall
Wo hat jedes Tool seine dokumentierten Stärken?
Große Codebases und Refactoring
Beide erreichen bis zu 1 Million Token Kontext. Claude Code punktet mit 128K Token Output (deutlich mehr als Codex), was bei großen Refactorings den Unterschied macht. Codex kann parallele Tasks in separaten Cloud-Sandboxes ausführen, was bei Migrationen über viele Dateien nützlich ist.
Team-Workflows und Code-Review
Codex hat hier die Nase vorn. Die native GitHub-Integration bringt automatische Pull Requests, Code-Review via @mentions und Issue-Verarbeitung. Claude Code bietet solide Git-Integration (Commits, Branches, PRs), aber ohne die GitHub-spezifischen Automatismen.
Autonomes Arbeiten und Agenten
Beide unterstützen autonomes Arbeiten, aber mit unterschiedlichen Ansätzen. Claude Code nutzt Subagents und parallele Agenten, primär lokal auf deinem Rechner. Codex arbeitet zusätzlich in Cloud-Sandboxes und kann mehrere Tasks komplett unabhängig parallel bearbeiten.
Kosten und Verfügbarkeit
Preislich nehmen sich beide wenig. Claude Code startet bei 20 $/Monat (Pro) und reicht über Max 5x (100 $) und Max 20x (200 $) bis zum Team-Abo. OpenAI Codex beginnt ebenfalls bei 20 $/Monat (ChatGPT Plus) und skaliert bis 200 $/Monat (ChatGPT Pro). Beide sind in bestehenden Abos enthalten, wer also schon ChatGPT Plus oder einen Anthropic-Pro-Account hat, zahlt nichts extra.
Die Limitierungen: Was jedes Tool nicht kann
Kein Tool ist perfekt. Hier sind die realen Einschränkungen, die du kennen solltest:
Claude Code
- Rate Limits: Bei intensiver Nutzung spürbar, für Max 20x gilt seit dem 13. Mai 2026 ein zusätzliches Wochenlimit
- Kosten: 20 $/Monat für reine Hobby-Projekte ist nicht wenig
- Kontext-Kompression: Bei langen Sessions werden frühere Diskussionen komprimiert
- Keine Offline-Option: Internet-Pflicht, auch für simple Aufgaben
- Nicht Open Source: Code ist einsehbar, aber unter proprietärer Lizenz
OpenAI Codex
- Cloud-Abhängigkeit: Codex Cloud arbeitet komplett in der Cloud, du siehst nur das Ergebnis
- Wartezeiten: Cloud-Tasks können je nach Komplexität Minuten dauern
- Kosten skalieren: Für intensive Nutzung landet man schnell bei ChatGPT Pro (200 $/Monat)
- SWE-bench-Abstand: Beim höchsten SWE-bench-Wert liegt Claude Opus 4.8 (88,6 %) vor GPT-5.3-Codex (85,0 %)
- Keine native JetBrains-Integration: Für JetBrains-IDEs nur Terminal-Support
Welches Tool für welchen Entwickler?
Hier sind die Empfehlungen für verschiedene Anwendungsfälle:
Nimm Claude Code wenn du...
- Native Git-Integration brauchst (Commits, PRs, Branches)
- Hohe Benchmark-Ergebnisse wichtig sind (88,6 % SWE-bench)
- Maximalen Output brauchst (128K Token)
- Terminal-first arbeitest und nur gelegentlich eine GUI brauchst
- Konsistente, zuverlässige Performance schätzt
- 20 $/Monat verschmerzen kannst
Nimm OpenAI Codex wenn du...
- In einem Team mit GitHub-zentrierten Workflows arbeitest
- Automatische Pull Requests und Code-Review brauchst
- Parallele Task-Bearbeitung in Cloud-Sandboxes willst
- Eine vollwertige Desktop-App und Codex Cloud im Browser bevorzugst
- Die Codex CLI als Open Source (Apache 2.0) schätzt
- Budget für 20 bis 200 $/Monat hast
Meine Empfehlung
Die ehrliche Antwort ist unbefriedigend. Es gibt keinen eindeutigen Gewinner. Beide Tools haben sich 2026 massiv weiterentwickelt und liegen bei den Benchmarks nah beieinander.
Für die meisten Entwickler empfehle ich, das Tool zu nehmen, das zum bestehenden Abo passt. Wer schon ChatGPT Plus oder Pro hat, fährt mit Codex ohne Zusatzkosten. Wer einen Anthropic-Pro- oder Max-Account hat, nimmt Claude Code.
Mein Setup sieht so aus. Ich nutze Claude Code als Haupt-Tool, weil die Git-Integration und die Zuverlässigkeit zu meinem Workflow passen. Für GitHub-zentrierte Team-Aufgaben und parallele Cloud-Tasks greife ich zu Codex.
Die wichtigste Erkenntnis ist simpel. Beide Tools sind gut genug für professionelle Entwicklung. Wähle das Tool, das zu deinem Workflow und Budget passt, nicht das mit der höchsten Benchmark-Zahl.






