Modeltyper
- LLM (Large Language Model / Stor sprogmodel) — Neuralt netværk trænet på enorme tekstmængder til at forudsige næste token; motoren bag ChatGPT, Claude, Gemini.
- LRM (Large Reasoning Model / Ræsonnerende model) — En LLM trænet til at "tænke" før den svarer ved at producere lange interne tankerækker (f.eks. OpenAI o1/o3, Claude med extended thinking, DeepSeek R1).
- SLM (Small Language Model / Lille sprogmodel) — Mindre, billigere, ofte lokalt-kørbar model (Phi, Llama 3 8B, Gemma) — hurtig og privat, mindre kapabel.
- Foundation Model (Grundmodel) — En stor pre-trænet model beregnet til at blive tilpasset mange forskellige opgaver (LLM'er er en delmængde).
- Multimodal model — Håndterer mere end én inputtype: tekst + billeder + lyd + video.
- VLM (Vision-Language Model) — Multimodal model specialiseret i at forstå billeder sammen med tekst.
- MoE (Mixture of Experts) — Arkitektur der sender hver token gennem kun nogle få "ekspert"-subnetværk; gør en model kæmpestor totalt set, men billig pr. forespørgsel.
- Transformer — 2017-arkitekturen (baseret på attention) der ligger under stort set alle moderne LLM'er.
- Diffusion Model — Arkitekturen bag de fleste billede-/videogeneratorer (Stable Diffusion, Sora, Midjourney) — virker ved at "rense" tilfældig støj.
Træning
- Pre-training (Forhåndstræning) — Den indledende massive træningskørsel på rå internet-/tekstdata; her bruges størstedelen af compute og penge.
- Fine-tuning (Finjustering) — Yderligere træning på et mindre, målrettet datasæt for at specialisere modellen til en opgave eller stil.
- SFT (Supervised Fine-Tuning) — Finjustering på mærkede prompt/svar-par.
- RLHF (Reinforcement Learning from Human Feedback) — Mennesker rangerer modeloutputs; modellen lærer at foretrække de højest rangerede. Det der gjorde ChatGPT mulig.
- RLAIF — Samme idé, men en anden AI rangerer i stedet for mennesker. Billigere, skalerer bedre.
- Constitutional AI — Anthropics alignment-metode: modellen kritiserer sine egne outputs op imod en skriftlig "forfatning" af principper.
- DPO (Direct Preference Optimization) — Enklere, billigere alternativ til RLHF der springer reward-model-trinnet over.
- Distillation (Destillation) — At træne en mindre "elev"-model til at efterligne en større "lærer"-model — sådan får man billige hurtige modeller ud af store langsomme.
- Quantization (Kvantisering) — Komprimering af modelvægte (f.eks. 16-bit → 4-bit) så modellen kan køre på mindre hardware med begrænset kvalitetstab.
- LoRA (Low-Rank Adaptation) — Måde at finjustere en model på ved kun at træne et lille sæt ekstra vægte i stedet for hele modellen.
Inferens og runtime
- Token — En tekstbid (typisk ~4 tegn eller ~¾ ord) — det modellen faktisk læser og producerer.
- Context window (Kontekstvindue) — Det maksimale antal tokens modellen kan "se" på én gang (prompt + historik + svar).
- Temperature — Tilfældighedsknap; 0 = deterministisk, 1+ = kreativ/vild.
- Top-p / Top-k — Andre tilfældighedsstyringer der begrænser hvilke tokens modellen må vælge mellem.
- Streaming — At sende tokens til klienten efterhånden som de genereres frem for at vente på hele svaret.
- Test-time / Inference-time compute — At lade modellen "tænke længere" når den kører (flere ræsonnerings-tokens) for at forbedre svar — den store idé bag LRM'er.
- Chain-of-Thought (CoT) / Tankerække — At prompte (eller træne) modellen til at vise sit trin-for-trin-ræsonnement før den svarer.
Evner og teknikker
- Prompt engineering — Håndværket at formulere inputs så man får bedre outputs.
- System prompt / Systemprompt — En skjult instruktion i starten af en samtale der sætter adfærd, rolle og regler.
- Few-shot / Zero-shot — At give modellen nogle få eksempler (few-shot) eller ingen (zero-shot) før man beder den løse opgaven.
- In-context learning — Modellen tilpasser sig på farten ud fra eksempler i prompten, uden egentlig træning.
- Function calling / Tool use (Værktøjsbrug) — Modellen returnerer en struktureret anmodning om at kalde en ekstern funktion/API, og inkorporerer derefter resultatet.
- RAG (Retrieval-Augmented Generation) — Slå relevante dokumenter op i en database, prop dem ind i prompten, lad LLM'en svare ud fra dem. Standardmønsteret for "chat med dine dokumenter."
- Embedding — En numerisk vektor-repræsentation af tekst (eller billeder) hvor lignende ting ligger tæt på hinanden; grundlaget for semantisk søgning.
- Vector database (Vektordatabase) — En database optimeret til at finde "nærmeste" embeddings (Pinecone, Weaviate, pgvector).
- Semantic search (Semantisk søgning) — Søgning efter mening i stedet for nøgleords-match, ved hjælp af embeddings.
- Grounding (Forankring) — At binde modeloutputs til verificerbare kilder (RAG, citater, værktøjsresultater) for at reducere hallucinationer.
Fejltyper og sikkerhed
- Hallucination — Modellen finder selvsikkert på ting.
- Sycophancy (Smigeri) — Modellen siger det du vil høre, frem for hvad der er sandt.
- Jailbreak — At narre en model til at omgå sine sikkerhedsregler via smart prompting.
- Prompt injection — Fjendtlige instruktioner skjult i inputdata (en webside, mail, dokument) der kaprer modellen.
- Red-teaming — Bevidst at angribe sin egen model for at finde sikkerhedsfejl før de onde gør det.
- Guardrails (Værn) — Filtre og regler omkring modellen der blokerer dårlige inputs/outputs.
- Alignment — Det generelle problem med at få AI-systemer til faktisk at gøre det mennesker vil have.
Evaluering
- Benchmark — Standardiseret test til at sammenligne modeller.
- MMLU — Bred vidensbenchmark (57 fagområder, bachelor-niveau).
- GPQA — Spørgsmål på kandidatniveau i naturvidenskab; sværere, mere ræsonnementstungt.
- HumanEval — Python-kodningsbenchmark — skriv en funktion ud fra en docstring.
- SWE-bench — Rigtige GitHub-issues; modellen skal levere en patch der består repoets tests. Den nuværende guldstandard for "kan den faktisk kode."
- Chatbot Arena (LMSYS) — Crowd-sourced head-to-head-rangering hvor mennesker stemmer blindt mellem to modelsvar.
Det store billede / økosystem
- AGI (Artificial General Intelligence) — Hypotetisk AI der matcher mennesker på stort set alle kognitive opgaver. Definitionen er omstridt og flytter sig efter hvem der prøver at sælge noget.
- ASI (Artificial Super Intelligence) — Hypotetisk AI der overgår mennesker på alle områder.
- Scaling laws (Skaleringslove) — Den empiriske observation at mere compute + mere data + flere parametre → forudsigeligt bedre modeller.
- Open-weights — Modelvægtene kan frit hentes (Llama, DeepSeek, Mistral) — ikke det samme som fuld open-source (som også kræver træningskode/-data).
- Frontier model (Grænsemodel) — De nuværende top-modeller fra de førende laboratorier (GPT-5, Claude Opus 4.7, Gemini 2.x, Grok 4).
- Inference cost (Inferens-omkostning) — Pris pr. million tokens — er kollapset med ca. 10× om året siden GPT-4 udkom.
Udgivet: