Koncepter inden for AI & LLMS

Modeltyper

LLM (Large Language Model / Stor sprogmodel) — Neuralt netværk trænet på enorme tekstmængder til at forudsige næste token; motoren bag ChatGPT, Claude, Gemini.

LRM (Large Reasoning Model / Ræsonnerende model) — En LLM trænet til at "tænke" før den svarer ved at producere lange interne tankerækker (f.eks. OpenAI o1/o3, Claude med extended thinking, DeepSeek R1).

SLM (Small Language Model / Lille sprogmodel) — Mindre, billigere, ofte lokalt-kørbar model (Phi, Llama 3 8B, Gemma) — hurtig og privat, mindre kapabel.

Foundation Model (Grundmodel) — En stor pre-trænet model beregnet til at blive tilpasset mange forskellige opgaver (LLM'er er en delmængde).

Multimodal model — Håndterer mere end én inputtype: tekst + billeder + lyd + video.

VLM (Vision-Language Model) — Multimodal model specialiseret i at forstå billeder sammen med tekst.

MoE (Mixture of Experts) — Arkitektur der sender hver token gennem kun nogle få "ekspert"-subnetværk; gør en model kæmpestor totalt set, men billig pr. forespørgsel.

Transformer — 2017-arkitekturen (baseret på attention) der ligger under stort set alle moderne LLM'er.

Diffusion Model — Arkitekturen bag de fleste billede-/videogeneratorer (Stable Diffusion, Sora, Midjourney) — virker ved at "rense" tilfældig støj.

Træning

Pre-training (Forhåndstræning) — Den indledende massive træningskørsel på rå internet-/tekstdata; her bruges størstedelen af compute og penge.

Fine-tuning (Finjustering) — Yderligere træning på et mindre, målrettet datasæt for at specialisere modellen til en opgave eller stil.

SFT (Supervised Fine-Tuning) — Finjustering på mærkede prompt/svar-par.

RLHF (Reinforcement Learning from Human Feedback) — Mennesker rangerer modeloutputs; modellen lærer at foretrække de højest rangerede. Det der gjorde ChatGPT mulig.

RLAIF — Samme idé, men en anden AI rangerer i stedet for mennesker. Billigere, skalerer bedre.

Constitutional AI — Anthropics alignment-metode: modellen kritiserer sine egne outputs op imod en skriftlig "forfatning" af principper.

DPO (Direct Preference Optimization) — Enklere, billigere alternativ til RLHF der springer reward-model-trinnet over.

Distillation (Destillation) — At træne en mindre "elev"-model til at efterligne en større "lærer"-model — sådan får man billige hurtige modeller ud af store langsomme.

Quantization (Kvantisering) — Komprimering af modelvægte (f.eks. 16-bit → 4-bit) så modellen kan køre på mindre hardware med begrænset kvalitetstab.

LoRA (Low-Rank Adaptation) — Måde at finjustere en model på ved kun at træne et lille sæt ekstra vægte i stedet for hele modellen.

Inferens og runtime

Token — En tekstbid (typisk ~4 tegn eller ~¾ ord) — det modellen faktisk læser og producerer.

Context window (Kontekstvindue) — Det maksimale antal tokens modellen kan "se" på én gang (prompt + historik + svar).

Temperature — Tilfældighedsknap; 0 = deterministisk, 1+ = kreativ/vild.

Top-p / Top-k — Andre tilfældighedsstyringer der begrænser hvilke tokens modellen må vælge mellem.

Streaming — At sende tokens til klienten efterhånden som de genereres frem for at vente på hele svaret.

Test-time / Inference-time compute — At lade modellen "tænke længere" når den kører (flere ræsonnerings-tokens) for at forbedre svar — den store idé bag LRM'er.

Chain-of-Thought (CoT) / Tankerække — At prompte (eller træne) modellen til at vise sit trin-for-trin-ræsonnement før den svarer.

Evner og teknikker

Prompt engineering — Håndværket at formulere inputs så man får bedre outputs.

System prompt / Systemprompt — En skjult instruktion i starten af en samtale der sætter adfærd, rolle og regler.

Few-shot / Zero-shot — At give modellen nogle få eksempler (few-shot) eller ingen (zero-shot) før man beder den løse opgaven.

In-context learning — Modellen tilpasser sig på farten ud fra eksempler i prompten, uden egentlig træning.

Function calling / Tool use (Værktøjsbrug) — Modellen returnerer en struktureret anmodning om at kalde en ekstern funktion/API, og inkorporerer derefter resultatet.

RAG (Retrieval-Augmented Generation) — Slå relevante dokumenter op i en database, prop dem ind i prompten, lad LLM'en svare ud fra dem. Standardmønsteret for "chat med dine dokumenter."

Embedding — En numerisk vektor-repræsentation af tekst (eller billeder) hvor lignende ting ligger tæt på hinanden; grundlaget for semantisk søgning.

Vector database (Vektordatabase) — En database optimeret til at finde "nærmeste" embeddings (Pinecone, Weaviate, pgvector).

Semantic search (Semantisk søgning) — Søgning efter mening i stedet for nøgleords-match, ved hjælp af embeddings.

Grounding (Forankring) — At binde modeloutputs til verificerbare kilder (RAG, citater, værktøjsresultater) for at reducere hallucinationer.

Fejltyper og sikkerhed

Hallucination — Modellen finder selvsikkert på ting.

Sycophancy (Smigeri) — Modellen siger det du vil høre, frem for hvad der er sandt.

Jailbreak — At narre en model til at omgå sine sikkerhedsregler via smart prompting.

Prompt injection — Fjendtlige instruktioner skjult i inputdata (en webside, mail, dokument) der kaprer modellen.

Red-teaming — Bevidst at angribe sin egen model for at finde sikkerhedsfejl før de onde gør det.

Guardrails (Værn) — Filtre og regler omkring modellen der blokerer dårlige inputs/outputs.

Alignment — Det generelle problem med at få AI-systemer til faktisk at gøre det mennesker vil have.

Evaluering

Benchmark — Standardiseret test til at sammenligne modeller.

MMLU — Bred vidensbenchmark (57 fagområder, bachelor-niveau).

GPQA — Spørgsmål på kandidatniveau i naturvidenskab; sværere, mere ræsonnementstungt.

HumanEval — Python-kodningsbenchmark — skriv en funktion ud fra en docstring.

SWE-bench — Rigtige GitHub-issues; modellen skal levere en patch der består repoets tests. Den nuværende guldstandard for "kan den faktisk kode."

Chatbot Arena (LMSYS) — Crowd-sourced head-to-head-rangering hvor mennesker stemmer blindt mellem to modelsvar.

Det store billede / økosystem

AGI (Artificial General Intelligence) — Hypotetisk AI der matcher mennesker på stort set alle kognitive opgaver. Definitionen er omstridt og flytter sig efter hvem der prøver at sælge noget.

ASI (Artificial Super Intelligence) — Hypotetisk AI der overgår mennesker på alle områder.

Scaling laws (Skaleringslove) — Den empiriske observation at mere compute + mere data + flere parametre → forudsigeligt bedre modeller.

Open-weights — Modelvægtene kan frit hentes (Llama, DeepSeek, Mistral) — ikke det samme som fuld open-source (som også kræver træningskode/-data).

Frontier model (Grænsemodel) — De nuværende top-modeller fra de førende laboratorier (GPT-5, Claude Opus 4.7, Gemini 2.x, Grok 4).

Inference cost (Inferens-omkostning) — Pris pr. million tokens — er kollapset med ca. 10× om året siden GPT-4 udkom.

Udgivet: 16-01-2026