Das „Knowledge Cutoff Date“ (deutsch etwa: Wissensstichtag) bezeichnet bei Large Language Models (LLMs) den Zeitpunkt, bis zu dem Informationen in die Trainingsdaten eines Modells eingeflossen sind.
Wissen über Ereignisse, Entwicklungen und Fakten nach diesem Datum ist im LLM nicht enthalten.
1. Bedeutung des Knowledge Cutoff Dates
Stell dir vor, du willst aktuelle Infos über ein Ereignis, das gerade erst passiert ist. Wenn das Knowledge Cutoff Date deines LLMs aber schon ein paar Monate oder sogar Jahre zurückliegt, dann hat es von diesem Ereignis keine Ahnung und kann dir keine Infos dazu geben.
So weiß ChatGPT (mit GPT-3.5) etwa nicht, wer den Super Bowl 2024 gewonnen hat:
Das kann manchmal ziemlich unpraktisch sein, besonders wenn du auf dem neuesten Stand bleiben möchtest.
Außerdem kann es passieren, dass das LLM aufgrund seines veralteten Wissensstands „halluziniert“. Das heißt, es generiert Antworten, die nicht mehr aktuell oder sogar falsch sind.
Um das zu umgehen, nutzen manche Tools Techniken wie Retrieval-Augmented Generation (RAG), bei der das LLM auf aktuelle externe Datenquellen zugreifen kann, um sein Wissen zu erweitern und aktuellere Antworten zu liefern.
2. Wie finde ich das Knowledge Cutoff Date heraus?
Bei den meisten LLMs kannst du einfach nach dem Knowledge Cutoff Date fragen, um es herauszufinden:
Folgende Prompts kannst du dafür benutzen:
Was ist dein Knowledge Cutoff Date?
Oder wahlweise:
Bis wann reichen deine Trainingsdaten?
3. Knowledge Cutoff Date bekannter LLMs
KI-Modell | Knowledge Cutoff Date | Lizenz | Entwickler |
---|---|---|---|
OLMo-7B-instruct | 2024/2 | Apache-2.0 | Allen AI |
Gemma-7B-it | 2024/2 | Gemma license | |
Gemma-2B-it | 2024/2 | Gemma license | |
Qwen1.5-72B-Chat | 2024/2 | Qianwen LICENSE | Alibaba |
Qwen1.5-7B-Chat | 2024/2 | Qianwen LICENSE | Alibaba |
Qwen1.5-4B-Chat | 2024/2 | Qianwen LICENSE | Alibaba |
OpenChat-3.5-0106 | 2024/1 | Apache-2.0 | OpenChat |
Nous-Hermes-2-Mixtral-8x7B-DPO | 2024/1 | Apache-2.0 | NousResearch |
CodeLlama-70B-instruct | 2024/1 | Llama 2 Community | Meta |
Mixtral-8x7b-Instruct-v0.1 | 2023/12 | Apache 2.0 | Mistral |
StripedHyena-Nous-7B | 2023/12 | Apache 2.0 | Together AI |
Mistral-7B-Instruct-v0.2 | 2023/12 | Apache-2.0 | Mistral |
GPT-4-0125-preview | 2023/12 | proprietär | OpenAI |
Tulu-2-DPO-70B | 2023/11 | AI2 ImpACT Low-risk | AllenAI/UW |
OpenChat-3.5 | 2023/11 | Apache-2.0 | OpenChat |
OpenHermes-2.5-Mistral-7b | 2023/11 | Apache-2.0 | NousResearch |
Starling-LM-7B-alpha | 2023/11 | CC-BY-NC-4.0 | UC Berkeley |
SOLAR-10.7B-Instruct-v1.0 | 2023/11 | CC-BY-NC-4.0 | Upstage AI |
DeepSeek-LLM-67B-Chat | 2023/11 | DeepSeek License | DeepSeek AI |
NV-Llama2-70B-SteerLM-Chat | 2023/11 | Llama 2 Community | Nvidia |
Dolphin-2.2.1-Mistral-7B | 2023/10 | Apache-2.0 | Cognitive Computations |
ChatGLM3-6B | 2023/10 | Apache-2.0 | Tsinghua |
Zephyr-7b-beta | 2023/10 | MIT | HuggingFace |
Zephyr-7b-alpha | 2023/10 | MIT | HuggingFace |
Mistral-7B-Instruct-v0.1 | 2023/9 | Apache 2.0 | Mistral |
falcon-180b-chat | 2023/9 | Falcon-180B TII License | TII |
WizardLM-70B-v1.0 | 2023/8 | Llama 2 Community | Microsoft |
Vicuna-33B | 2023/8 | nicht-kommerziell | LMSYS |
Claude 3 Sonnet | 2023/8 | proprietär | Anthropic |
Claude 3 Opus | 2023/8 | proprietär | Anthropic |
Qwen-14B-Chat | 2023/8 | Qianwen LICENSE | Alibaba |
Vicuna-13B-16k | 2023/7 | Llama 2 Community | LMSYS |
Vicuna-7B-16k | 2023/7 | Llama 2 Community | LMSYS |
Llama-2-70b-chat | 2023/7 | Llama 2 Community | Meta |
WizardLM-13b-v1.2 | 2023/7 | Llama 2 Community | Microsoft |
Vicuna-13B | 2023/7 | Llama 2 Community | LMSYS |
CodeLlama-34B-instruct | 2023/7 | Llama 2 Community | Meta |
Llama-2-13b-chat | 2023/7 | Llama 2 Community | Meta |
Llama-2-7b-chat | 2023/7 | Llama 2 Community | Meta |
Vicuna-7B | 2023/7 | Llama 2 Community | LMSYS |
WizardLM-13B-v1.1 | 2023/7 | nicht-kommerziell | Microsoft |
XGen-7B-8K-Inst | 2023/7 | nicht-kommerziell | Salesforce |
H2O-Oasst-OpenLLaMA-13B | 2023/6 | Apache 2.0 | h2oai |
ChatGLM2-6B | 2023/6 | Apache-2.0 | Tsinghua |
MPT-30B-chat | 2023/6 | CC-BY-NC-SA-4.0 | MosaicML |
MPT-30B-Instruct | 2023/6 | CC-BY-SA 3.0 | MosaicML |
WizardLM-30B | 2023/6 | nicht-kommerziell | Microsoft |
Tulu-30B | 2023/6 | nicht-kommerziell | AllenAI/UW |
Nous-Hermes-13B | 2023/6 | nicht-kommerziell | NousResearch |
Yi-34B-Chat | 2023/6 | Yi License | 01 AI |
Falcon-40B-Instruct | 2023/5 | Apache 2.0 | TII |
MPT-7B-Chat | 2023/5 | CC-BY-NC-SA-4.0 | MosaicML |
Guanaco-65B | 2023/5 | nicht-kommerziell | UW |
WizardLM-13B-v1.0 | 2023/5 | nicht-kommerziell | Microsoft |
Guanaco-33B | 2023/5 | nicht-kommerziell | UW |
RWKV-4-Raven-14B | 2023/4 | Apache 2.0 | RWKV |
OpenAssistant-Pythia-12B | 2023/4 | Apache 2.0 | OpenAssistant |
FastChat-T5-3B | 2023/4 | Apache 2.0 | LMSYS |
StableLM-Tuned-Alpha-7B | 2023/4 | CC-BY-NC-SA-4.0 | Stability AI |
Dolly-V2-12B | 2023/4 | MIT | Databricks |
OpenAssistant-LLaMA-30B | 2023/4 | nicht-kommerziell | OpenAssistant |
Baize-v2-13B | 2023/4 | nicht-kommerziell | UCSD |
Koala-13B | 2023/4 | nicht-kommerziell | UC Berkeley |
GPT-4-1106-preview | 2023/4 | proprietär | OpenAI |
Gemini Pro | 2023/4 | proprietär | |
Gemini Pro (Dev API) | 2023/4 | proprietär | |
GPT4All-13B-Snoozy | 2023/3 | nicht-kommerziell | Nomic AI |
Alpaca-13B | 2023/3 | nicht-kommerziell | Stanford |
ChatGLM-6B | 2023/3 | nicht-kommerziell | Tsinghua |
LLaMA-13B | 2023/2 | nicht-kommerziell | Meta |
GPT-4-0314 | 2021/9 | proprietär | OpenAI |
GPT-4-0613 | 2021/9 | proprietär | OpenAI |
GPT-3.5-Turbo-0613 | 2021/9 | proprietär | OpenAI |
GPT-3.5-Turbo-0314 | 2021/9 | proprietär | OpenAI |
GPT-3.5-Turbo-1106 | 2021/9 | proprietär | OpenAI |
GPT-3.5-Turbo-0125 | 2021/9 | proprietär | OpenAI |
PaLM-Chat-Bison-001 | 2021/6 | proprietär | |
Gemini Advanced | online | proprietär | |
Gemini (Bard) | online | proprietär | |
pplx-70b-online | online | proprietär | Perplexity AI |
pplx-7b-online | online | proprietär | Perplexity AI |
Claude-1 | unbekannt | proprietär | Anthropic |
Claude-2.0 | unbekannt | proprietär | Anthropic |
Claude-2.1 | unbekannt | proprietär | Anthropic |
Claude-Instant-1 | unbekannt | proprietär | Anthropic |
Mistral Medium | unbekannt | proprietär | Mistral |
Mistral-Next | unbekannt | proprietär | Mistral |
Mistral-Large-2402 | unbekannt | proprietär | Mistral |
Bitte beachte, dass manche LLMs auch nach dem Wissensstichtag noch mit neuen Daten nachtrainiert werden können – dies ist aber nicht bei allen Modellen der Fall bzw. in unterschiedlichem Ausmaß.
Bei manchen LLMs ist das Knowledge Cutoff Date auch nicht bekannt oder die Modell sind online, das heißt, sie haben kein Knowledge Cutoff Date.