Modeltyper


  • LLM (Large Language Model / Stor sprogmodel) — Neuralt netværk trænet på enorme tekstmængder til at forudsige næste token; motoren bag ChatGPT, Claude, Gemini.

  • LRM (Large Reasoning Model / Ræsonnerende model) — En LLM trænet til at "tænke" før den svarer ved at producere lange interne tankerækker (f.eks. OpenAI o1/o3, Claude med extended thinking, DeepSeek R1).

  • SLM (Small Language Model / Lille sprogmodel) — Mindre, billigere, ofte lokalt-kørbar model (Phi, Llama 3 8B, Gemma) — hurtig og privat, mindre kapabel.

  • Foundation Model (Grundmodel) — En stor pre-trænet model beregnet til at blive tilpasset mange forskellige opgaver (LLM'er er en delmængde).

  • Multimodal model — Håndterer mere end én inputtype: tekst + billeder + lyd + video.

  • VLM (Vision-Language Model) — Multimodal model specialiseret i at forstå billeder sammen med tekst.

  • MoE (Mixture of Experts) — Arkitektur der sender hver token gennem kun nogle få "ekspert"-subnetværk; gør en model kæmpestor totalt set, men billig pr. forespørgsel.

  • Transformer — 2017-arkitekturen (baseret på attention) der ligger under stort set alle moderne LLM'er.

  • Diffusion Model — Arkitekturen bag de fleste billede-/videogeneratorer (Stable Diffusion, Sora, Midjourney) — virker ved at "rense" tilfældig støj.

Træning


  • Pre-training (Forhåndstræning) — Den indledende massive træningskørsel på rå internet-/tekstdata; her bruges størstedelen af compute og penge.

  • Fine-tuning (Finjustering) — Yderligere træning på et mindre, målrettet datasæt for at specialisere modellen til en opgave eller stil.

  • SFT (Supervised Fine-Tuning) — Finjustering på mærkede prompt/svar-par.

  • RLHF (Reinforcement Learning from Human Feedback) — Mennesker rangerer modeloutputs; modellen lærer at foretrække de højest rangerede. Det der gjorde ChatGPT mulig.

  • RLAIF — Samme idé, men en anden AI rangerer i stedet for mennesker. Billigere, skalerer bedre.

  • Constitutional AI — Anthropics alignment-metode: modellen kritiserer sine egne outputs op imod en skriftlig "forfatning" af principper.

  • DPO (Direct Preference Optimization) — Enklere, billigere alternativ til RLHF der springer reward-model-trinnet over.

  • Distillation (Destillation) — At træne en mindre "elev"-model til at efterligne en større "lærer"-model — sådan får man billige hurtige modeller ud af store langsomme.

  • Quantization (Kvantisering) — Komprimering af modelvægte (f.eks. 16-bit → 4-bit) så modellen kan køre på mindre hardware med begrænset kvalitetstab.

  • LoRA (Low-Rank Adaptation) — Måde at finjustere en model på ved kun at træne et lille sæt ekstra vægte i stedet for hele modellen.

Inferens og runtime


  • Token — En tekstbid (typisk ~4 tegn eller ~¾ ord) — det modellen faktisk læser og producerer.

  • Context window (Kontekstvindue) — Det maksimale antal tokens modellen kan "se" på én gang (prompt + historik + svar).

  • Temperature — Tilfældighedsknap; 0 = deterministisk, 1+ = kreativ/vild.

  • Top-p / Top-k — Andre tilfældighedsstyringer der begrænser hvilke tokens modellen må vælge mellem.

  • Streaming — At sende tokens til klienten efterhånden som de genereres frem for at vente på hele svaret.

  • Test-time / Inference-time compute — At lade modellen "tænke længere" når den kører (flere ræsonnerings-tokens) for at forbedre svar — den store idé bag LRM'er.

  • Chain-of-Thought (CoT) / Tankerække — At prompte (eller træne) modellen til at vise sit trin-for-trin-ræsonnement før den svarer.

Evner og teknikker


  • Prompt engineering — Håndværket at formulere inputs så man får bedre outputs.

  • System prompt / Systemprompt — En skjult instruktion i starten af en samtale der sætter adfærd, rolle og regler.

  • Few-shot / Zero-shot — At give modellen nogle få eksempler (few-shot) eller ingen (zero-shot) før man beder den løse opgaven.

  • In-context learning — Modellen tilpasser sig på farten ud fra eksempler i prompten, uden egentlig træning.

  • Function calling / Tool use (Værktøjsbrug) — Modellen returnerer en struktureret anmodning om at kalde en ekstern funktion/API, og inkorporerer derefter resultatet.

  • RAG (Retrieval-Augmented Generation) — Slå relevante dokumenter op i en database, prop dem ind i prompten, lad LLM'en svare ud fra dem. Standardmønsteret for "chat med dine dokumenter."

  • Embedding — En numerisk vektor-repræsentation af tekst (eller billeder) hvor lignende ting ligger tæt på hinanden; grundlaget for semantisk søgning.

  • Vector database (Vektordatabase) — En database optimeret til at finde "nærmeste" embeddings (Pinecone, Weaviate, pgvector).

  • Semantic search (Semantisk søgning) — Søgning efter mening i stedet for nøgleords-match, ved hjælp af embeddings.

  • Grounding (Forankring) — At binde modeloutputs til verificerbare kilder (RAG, citater, værktøjsresultater) for at reducere hallucinationer.

Fejltyper og sikkerhed


  • Hallucination — Modellen finder selvsikkert på ting.

  • Sycophancy (Smigeri) — Modellen siger det du vil høre, frem for hvad der er sandt.

  • Jailbreak — At narre en model til at omgå sine sikkerhedsregler via smart prompting.

  • Prompt injection — Fjendtlige instruktioner skjult i inputdata (en webside, mail, dokument) der kaprer modellen.

  • Red-teaming — Bevidst at angribe sin egen model for at finde sikkerhedsfejl før de onde gør det.

  • Guardrails (Værn) — Filtre og regler omkring modellen der blokerer dårlige inputs/outputs.

  • Alignment — Det generelle problem med at få AI-systemer til faktisk at gøre det mennesker vil have.

Evaluering


  • Benchmark — Standardiseret test til at sammenligne modeller.

  • MMLU — Bred vidensbenchmark (57 fagområder, bachelor-niveau).

  • GPQA — Spørgsmål på kandidatniveau i naturvidenskab; sværere, mere ræsonnementstungt.

  • HumanEval — Python-kodningsbenchmark — skriv en funktion ud fra en docstring.

  • SWE-bench — Rigtige GitHub-issues; modellen skal levere en patch der består repoets tests. Den nuværende guldstandard for "kan den faktisk kode."

  • Chatbot Arena (LMSYS) — Crowd-sourced head-to-head-rangering hvor mennesker stemmer blindt mellem to modelsvar.

Det store billede / økosystem


  • AGI (Artificial General Intelligence) — Hypotetisk AI der matcher mennesker på stort set alle kognitive opgaver. Definitionen er omstridt og flytter sig efter hvem der prøver at sælge noget.

  • ASI (Artificial Super Intelligence) — Hypotetisk AI der overgår mennesker på alle områder.

  • Scaling laws (Skaleringslove) — Den empiriske observation at mere compute + mere data + flere parametre → forudsigeligt bedre modeller.

  • Open-weights — Modelvægtene kan frit hentes (Llama, DeepSeek, Mistral) — ikke det samme som fuld open-source (som også kræver træningskode/-data).

  • Frontier model (Grænsemodel) — De nuværende top-modeller fra de førende laboratorier (GPT-5, Claude Opus 4.7, Gemini 2.x, Grok 4).

  • Inference cost (Inferens-omkostning) — Pris pr. million tokens — er kollapset med ca. 10× om året siden GPT-4 udkom.

Udgivet: