Dokumentasjon: arkitekturvurdering — sikkerhet, backup, kostnad, nye forslag

Oppdaterer dokumentasjon basert på tre eksterne arkitekturvurderinger: - RLS Leak Hunter med CI-test og audit-trigger (migration_safety.md) - pgvector-migrasjon flyttet til Lag 2, WAL-arkivering med pgBackRest (ARCHITECTURE.md, produksjon.md) - Off-site backup med rclone, Docker cgroups for workers (ARCHITECTURE.md, produksjon.md) - Kostnadskontroll i AI Gateway: workspace-budsjett, auto-fallback (ai_gateway.md) - Gjeste-token sikkerhetsdybde: ClamAV, rate limiting, auto-revoke (den_asynkrone_gjesten.md) - SpacetimeDB fase 1-vurdering: PG LISTEN/NOTIFY som mellomsteg (synkronisering.md) - Kritiske events (Aha-markører) flushes umiddelbart (synkronisering.md) - Ekstern helsesjekk, observability-utvidelser (ARCHITECTURE.md) - Tre nye forslag: Contradiction Detector, Auto-Highlight Reel, Audience Voice Memo Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-15 03:56:21 +01:00 · 2026-03-15 03:56:21 +01:00 · 024a91e1b3
commit 024a91e1b3
parent fef4e537fd
10 changed files with 400 additions and 15 deletions
--- a/ARCHITECTURE.md
+++ b/ARCHITECTURE.md
@ -6,7 +6,14 @@
 Sidelinja er ikke bare en podcast-host; det er et **redaksjonelt operativsystem** og en **kunnskapsgraf**. Målet er å bygge en plattform som sømløst integrerer research, asynkron kommunikasjon (chat), sanntids innspilling (Lyd/Video) og automatisert publisering. Visjonen inkluderer også at plattformen skal fungere som en "live co-host" (virtuell assistent) under innspilling ved å boble opp relevant informasjon fra kunnskapsgrafen i sanntid. Systemet er bygget for full datakontroll, eierskap og minimal bruk av lukkede tredjepartstjenester.
 ## 2. Infrastruktur og DevOps
-* **Produksjonsserver:** Hetzner VPS (Ubuntu, 8 vCPU, 16 GB RAM). Kapasiteten er tilstrekkelig for nåværende behov. Ved behov kan VPS-en dobles (16 vCPU, 32 GB). Mest CPU-krevende tjenester er faster-whisper og LiveKit under samtidig bruk — disse bør overvåkes først ved kapasitetsproblemer.
+* **Produksjonsserver:** Hetzner VPS (Ubuntu, 8 vCPU, 16 GB RAM, 320 GB SSD). Kapasiteten er tilstrekkelig for nåværende behov. Ved behov kan VPS-en dobles (16 vCPU, 32 GB). Mest CPU-krevende tjenester er faster-whisper og LiveKit under samtidig bruk — disse bør overvåkes først ved kapasitetsproblemer.
 * **CPU-ressursstyring:** `faster-whisper` (medium) bruker ~18 min på 30 min lyd og kan stjele CPU fra LiveKit under live-innspilling (risiko for audio glitches). To-lags beskyttelse:
  1. **Docker cgroups (harde grenser):** `docker-compose.yml` skal sette `deploy.resources.limits` på worker-containere: maks 4 CPU og 8 GB RAM for Whisper-workers, slik at LiveKit og PostgreSQL alltid har garantert kapasitet.
  2. **Applikasjonsnivå (dynamisk):** Rust-workeren implementerer en "Resource Governor" som reduserer Whisper-tråder ytterligere (f.eks. `--threads 2`) når et LiveKit-rom er aktivt. Sjekkes via LiveKit room-status i jobbkøen.
 * **Diskstrategi:** 320 GB SSD fylles raskt med råopptak og MP3-er. Tre tiltak:
  1. **Block Storage:** Mediafiler serveres fra en separat Hetzner Block Storage-volum montert på `/srv/sidelinja/media/`, skalerbart uavhengig av OS-disken.
  2. **S3-abstraksjon:** SvelteKit sin filopplasting bør abstrahere lagring bak et S3-kompatibelt grensesnitt (Hetzner Object Storage eller Cloudflare R2), slik at vi kan flytte til ekstern lagring uten å endre applikasjonskode. Caddy kan proxy-e eller redirecte til S3 for servering.
  3. **Arkiveringspolicy:** Råopptak eldre enn 6 mnd flyttes automatisk til Object Storage via nattlig jobb. Kun ferdig-redigerte MP3-er beholdes lokalt for rask servering.
 * **Orkestrering:** Docker / Docker Compose. Alle tjenester kjører i isolerte containere på et internt Docker-nettverk.
 * **Reverse Proxy & Webserver:** **Caddy**. Håndterer all innkommende trafikk for flere domener, automatisk HTTPS (Let's Encrypt), og ruting til interne containere. Port 80/443 er de *eneste* portene som er eksponert mot internett.
 * **Domener:**
@ -38,7 +45,7 @@ Data som ikke kan gjenskapes. Tap = permanent informasjonstap.
 | Data | Lagring | Backup |
 |---|---|---|
-| PostgreSQL (kunnskapsgraf, brukere, metadata, episoder) | `data/postgres/` | Daglig pg_dump + fil-backup |
+| PostgreSQL (kunnskapsgraf, brukere, metadata, episoder) | `data/postgres/` | Daglig pg_dump + WAL-arkivering (PITR) |
 | Lydfiler (MP3, råopptak) | `media/` | Daglig fil-backup |
 | `.env` (hemmeligheter) | `/srv/sidelinja/.env` | Manuell kopi, ikke i Git |
@ -75,6 +82,27 @@ Arbeidsdata med begrenset levetid. Ryddes automatisk.
 | Jobbkø-historikk (fullførte jobber) | PostgreSQL | 30 dager | Feilsøking |
 | Whisper-modeller | `.docker-data/` (lokal) | Ingen TTL | Re-download fra HuggingFace ved behov |
 #### Off-site backup (kritisk)
 Lokal backup på samme server beskytter kun mot logiske feil (slettet fil, korrupt dump). Ved fysisk diskfeil eller nodefeil hos Hetzner tapes både produksjon og backup. Kategori 1-data **må** pushes ut av serveren:
 | Data | Mål | Verktøy | Frekvens |
 |---|---|---|---|
 | PostgreSQL-dumper | Hetzner Object Storage (S3-kompatibel) | `rclone sync` | Daglig etter pg_dump |
 | Lydfiler (media/) | Hetzner Object Storage | `rclone sync` (inkrementell) | Daglig |
 | `.env` | Kryptert kopi i Object Storage | `gpg -c` + `rclone` | Ved endring |
 **Retensjon off-site:** 90 dager for PG-dumper, ubegrenset for media. Kostnad: ~€5/mnd for 100 GB på Hetzner Object Storage.
 #### PostgreSQL WAL-arkivering (Point-In-Time Recovery)
 Daglig pg_dump kl. 03:00 betyr opptil 24 timers datatap ved korrupsjon midt på dagen. For å redusere dette til minutter, settes opp kontinuerlig WAL-arkivering:
 * **Verktøy:** pgBackRest eller WAL-G (foretrukket for S3-kompatibel lagring)
 * **Flyt:** PostgreSQL streamer WAL-segmenter kontinuerlig til Hetzner Object Storage. Ved behov kan databasen gjenopprettes til et vilkårlig tidspunkt (PITR).
 * **Konfigurasjon:** `archive_mode = on`, `archive_command` peker på pgBackRest/WAL-G som pusher til S3.
 * **Full backup:** Ukentlig full backup via pgBackRest, daglige inkrementelle. WAL-segmenter fyller gapet.
 * **Recovery:** `pgbackrest restore --target-time="2026-03-15 13:59:00"` gjenoppretter til minuttet før krasjet.
 * **Kostnad:** Minimal — WAL-segmenter er komprimerte og kompakte. ~1-5 GB/mnd avhengig av skriveaktivitet.
 #### Retningslinjer for nye komponenter
 Når en ny feature eller komponent introduserer data:
 1. **Klassifiser** — hvilken kategori faller dataen i?
@ -161,7 +189,7 @@ Detaljerte spesifikasjoner ligger i `docs/concepts/` (brukeropplevelser) og `doc
 * **Den Asynkrone Gjesten:** Tidsbegrenset lenke til gjester for asynkrone lydopptak som lander i redaksjonens arbeidsflyt.
 ### Features (byggeklosser)
-Chat (channels), Kanban, Kalender, Notater/Scratchpad, Whiteboard, Live transkripsjon, Live AI (faktoid + referent), Visuell graf, AI Research-Klipper, Lydmeldinger & Diktering, Podcast-statistikk, Kunnskaps-Bridge (cross-workspace), Prompt-Laboratorium.
+Chat (channels), Kanban, Kalender, Notater/Scratchpad, Whiteboard, Live transkripsjon, Live AI (faktoid + referent), Visuell graf, AI Research-Klipper, Lydmeldinger & Diktering, Podcast-statistikk, Kunnskaps-Bridge (cross-workspace), Prompt-Laboratorium, Graf-vedlikehold (nattlig jobb som finner isolerte noder og foreslår koblinger basert på co-occurrence i transkripsjoner).
 ## 8. Bygge-rekkefølge (Avhengighetskart)
@ -182,6 +210,8 @@ Chat (channels), Kanban, Kalender, Notater/Scratchpad, Whiteboard, Live transkri
 ### Lag 2 — Kjernekomponenter (krever Lag 1)
 - [ ] Jobbkø-worker (Rust)
 - [ ] Kunnskapsgraf CRUD (SvelteKit server-side)
 - [ ] pgvector-migrasjon (0005): `CREATE EXTENSION vector;` + embedding-kolonner på nodes — gjøres tidlig for å unngå smertefull migrasjon i Lag 4
 - [ ] RLS Leak Hunter i CI (se `docs/setup/migration_safety.md`)
 - [~] Chat med channels (PG-adapter + SpacetimeDB hybrid-adapter ferdig, sync-worker gjenstår)
 - [~] Kanban (PG-adapter ferdig med drag & drop, redigeringsmodal, CRUD API. SpacetimeDB-sync gjenstår)
 - [~] Kalender (PG-adapter ferdig med månedsvisning, fargekoder, heldags/tidshendelser. SpacetimeDB-sync gjenstår)
@ -202,6 +232,7 @@ Chat (channels), Kanban, Kalender, Notater/Scratchpad, Whiteboard, Live transkri
 - [ ] Møterommet: AI-Referent (LiveKit + Whisper + møte-oppsummering)
 - [ ] Visuell Kunnskapsgraf (D3.js/Vis.js graf-visning)
 - [ ] Kunnskaps-Bridge (pgvector, cross-workspace discovery)
 - [ ] Graf-vedlikehold (nattlig jobb: finn isolerte noder, foreslå koblinger basert på co-occurrence)
 - [ ] Valgomat (selvstendig, lav prioritet)
 ## 9. Observabilitet
@ -228,13 +259,26 @@ Alle Docker-containere skal ha `healthcheck` definert i `docker-compose.yml`:
 SvelteKit-appen inkluderer en intern admin-side (`/admin/observability`) som samler:
 - **Container-status:** Healthcheck-resultater fra Docker (via `docker compose ps` / Docker socket)
 - **Jobbkø:** Pending/running/error-count med sparkline-grafer (siste 24t)
- **AI Gateway:** Token-bruk per jobbtype, kostnad per workspace, failover-hendelser (fra LiteLLMs innebygde logging)
+- **AI Gateway:** Token-bruk per jobbtype, kostnad per workspace, failover-hendelser (fra LiteLLMs innebygde logging). Inkluderer workspace-budsjett status (se `docs/infra/ai_gateway.md` §6).
- **Disk/Minne:** Mediamappe-størrelse per workspace, PG-størrelse, SpacetimeDB-minnebruk
+- **Disk/Minne:** Mediamappe-størrelse per workspace, PG-størrelse, SpacetimeDB-minnebruk (med graf over tid)
 - **Sikkerhet:** Siste secret-rotasjon timestamp (`.env`-endringer), RLS Leak Hunter siste kjøring, antall aktive guest-tokens
 - **SpacetimeDB:** Minnebruk-graf, `sync_outbox`-størrelse (indikerer sync-etterslep), tilkoblede klienter per workspace
 Ingen eksterne tjenester (Prometheus, Grafana) — alt bygges som SvelteKit-sider med data hentet server-side fra PG, Docker og LiteLLM. Konsistent med self-hosted-filosofien.
-### 9.5 Ingen eksterne observability-tjenester
+### 9.5 Ekstern helsesjekk (utenfor stacken)
-All overvåking og varsling skjer internt i Sidelinja-suiten. Ingen avhengighet til Discord, Slack eller andre tredjepartstjenester.
+Intern overvåking er verdiløs hvis hele serveren er nede. En ekstern uptime-monitor **utenfor** Hetzner-stacken skal polle følgende endepunkter og varsle ved feil:
 | Endepunkt | Sjekk | Varsel |
 |---|---|---|
 | `https://sidelinja.org/api/health` | HTTP 200 | E-post/push ved 2 min nedetid |
 | `https://auth.sidelinja.org` | HTTP 200 | E-post/push ved 2 min nedetid |
 | `sidelinja.org:443` | SSL-utløp < 7 dager | E-post |
 **Implementering:** Bruk en gratis/billig ekstern tjeneste (UptimeRobot, Hetrixtools, eller lignende) — dette er det eneste unntaket fra self-hosted-filosofien, da en helsesjekk per definisjon må leve utenfor systemet den overvåker.
 ### 9.6 Ingen andre eksterne observability-tjenester
 Utover ekstern helsesjekk (§9.5) skjer all overvåking og varsling internt i Sidelinja-suiten. Ingen avhengighet til Discord, Slack eller andre tredjepartstjenester.
 ## 10. Erfaringslogg
 Mappen `docs/erfaringer/` samler praktiske lærdommer fra implementering — ikke hva vi valgte, men hva vi lærte som ikke er åpenbart fra koden. Formålet er å treffe raskere blink med neste komponent. Nye komponenter BØR legge til erfaringer etter ferdig implementering.
--- a/docs/concepts/den_asynkrone_gjesten.md
+++ b/docs/concepts/den_asynkrone_gjesten.md
@ -63,6 +63,30 @@ guest_tokens (
 - Ingen tilgang til andre channels, workspaces eller funksjoner.
 - Tokenet kan revokeres manuelt av redaksjonen.
 ### 4.2b Sikkerhetsdybde (mot token-lekkasje og misbruk)
 Et lekket gjeste-token gir direkte filopplasting uten autentisering — dette er høyrisiko. Følgende tiltak begrenser skadepotensialet:
 | Tiltak | Implementering | Formål |
 |---|---|---|
 | **Rate limiting per token** | SvelteKit middleware: maks 1 opplasting per 30 sek per token | Forhindrer spam/flooding |
 | **Filtype-validering** | SvelteKit: kun `audio/*` MIME-typer aksepteres, filstørrelse maks 50 MB | Blokkerer malware-opplasting |
 | **Malware-scanning** | ClamAV sidecar-container scanner opplastede filer før de lagres | Fanger kjent malware |
 | **Auto-revoke** | Token deaktiveres automatisk når `recordings_count >= max_recordings` | Begrenser eksponering |
 | **IP-logging** | Logger klient-IP per opplasting i `guest_token_usage`-tabell | Sporbarhet ved misbruk |
 | **Geo-begrensning** (valgfritt) | Caddy-nivå: blokker requests fra uventede geolokasjoner | Reduserer angrepsflate |
 **ClamAV Docker-oppsett:**
 ```yaml
 clamav:
  image: clamav/clamav:latest
  restart: unless-stopped
  volumes:
    - /srv/sidelinja/media:/scan:ro
  networks:
    - sidelinja-net
 ```
 SvelteKit kaller ClamAV via `clamdscan` (socket) etter filopplasting, før filen flyttes til endelig plassering. Infiserte filer slettes umiddelbart og tokenet flagges for manuell gjennomgang.
 ### 4.3 Flyt (teknisk)
 ```
 Gjest åpner URL med token
--- a/docs/infra/ai_gateway.md
+++ b/docs/infra/ai_gateway.md
@ -151,7 +151,37 @@ tests/prompts/
    └── dataset.json
 ```
-## 6. Dataklassifisering (ref. ARCHITECTURE.md 2.2)
+## 6. Kostnadskontroll
 LiteLLM har innebygd logging, men mangler workspace-nivå budsjettering. For å forhindre kostnadssprekk:
 ### 6.1 Workspace-budsjett
 Hver workspace har et månedlig AI-budsjett lagret i `workspaces.settings` (JSONB):
 ```json
 {
  "ai_budget": {
    "monthly_limit_usd": 50,
    "alert_threshold_pct": 80,
    "auto_fallback": true
  }
 }
 ```
 - **Sporing:** SvelteKit logger token-bruk per AI-kall med workspace_id og jobbtype i `ai_usage_log`-tabellen (flyktig, TTL 90 dager).
 - **Alert:** Når 80 % av budsjettet er brukt, postes varsel i workspace-chat (system-channel).
 - **Auto-fallback:** Når budsjettet er nådd og `auto_fallback: true`, rutes alle kall til `sidelinja/rutine` (billigste modell). Ellers blokkeres AI-kall med feilmelding.
 ### 6.2 Per-episode maks-kostnad
 Podcastfabrikken-jobber (whisper + metadata + oppsummering) kan estimere totalkostnad basert på lydlengde. Jobben avbrytes med varsel hvis estimert kostnad overstiger `max_cost_per_episode` (default: $5).
 ### 6.3 Modell-nedgradering
 Jobbkøen støtter automatisk modell-nedgradering ved kostnadsmål:
 1. Prøv `sidelinja/resonering` (Claude)
 2. Ved budsjett-nær: fall tilbake til `sidelinja/rutine` (Gemini gratis)
 3. Ved budsjett-nådd: sett jobb i `paused`-status med varsel
 ## 7. Dataklassifisering (ref. ARCHITECTURE.md 2.2)
 | Data | Kategori | Detaljer |
 |---|---|---|
@ -161,7 +191,7 @@ tests/prompts/
 | Promptfoo testsett | Gjenskapbar (Git) | `tests/prompts/` — versjonskontrollert |
 | Promptfoo testresultater | Flyktig (lokal) | Kjøres on-demand, ikke lagret permanent |
-## 6. Instruks for Claude Code
+## 8. Instruks for Claude Code
 * All AI-kode skal peke på `http://ai-gateway:4000/v1` — aldri direkte til leverandør
 * Bruk modellaliaser (`sidelinja/rutine`, `sidelinja/resonering`) — aldri hardkod leverandør-spesifikke modellnavn i applikasjonskode
 * API-nøkler i `.env`, aldri i config-filer eller kode
--- a/docs/infra/synkronisering.md
+++ b/docs/infra/synkronisering.md
@ -24,6 +24,8 @@ SpacetimeDB-modulene (Rust) produserer persisterings-events ved dataendringer. E
 **Akseptabelt datatap:** Maks 5 sekunder ved hard krasj av SpacetimeDB. Dette er akseptabelt for chat, kanban og show notes.
 **Unntak — kritiske events:** Aha-markører fra studioet (live-innspilling) er tidssensitive og vanskelige å gjenskape. Disse bør flushes til PG umiddelbart (ikke batched) via en dedikert `sync_critical()`-funksjon som skriver direkte til PG i stedet for via `sync_outbox`. Alternativt kan SpacetimeDB-modulen skrive kritiske events til sin egen WAL/disk umiddelbart. Hvilke event-typer som er "kritiske" defineres per workspace i `workspaces.settings`.
 ## 3. Dataflyt
 ```
@ -113,6 +115,13 @@ Meldinger er append-only. Redigering av egne meldinger er last-write-wins — ak
 - **Graceful degradation:** SpacetimeDB-tilkoblingsfeil faller stille tilbake til PG. Brukeren ser ingen feilmelding — PG-data beholdes.
 - **Adapter-mønster:** `ChatConnection`-interface med to implementasjoner (PG og SpacetimeDB hybrid). Factory velger basert på env-variabel. Gjør det trivielt å teste hver adapter isolert.
 ### Åpent spørsmål: SpacetimeDB i fase 1?
 PG-polling (3 sek) fungerer godt nok for chat og kanban med nåværende brukertall. SpacetimeDB + sync-worker innfører betydelig kompleksitet (outbox, oppvarming, workspace-partisjonering, feilhåndtering) som ennå ikke gir målbar gevinst.
 **Alternativ:** Bruk PostgreSQL `LISTEN/NOTIFY` → SvelteKit SSE (Server-Sent Events) som neste steg fra polling. Dette gir sub-sekund sanntid uten ny infrastruktur-avhengighet. SpacetimeDB introduseres først når vi har et konkret behov det ikke dekker (f.eks. LiveKit-studio med høyfrekvent state-sync mellom mange klienter).
 **Beslutning:** Utsatt. PG-adapter med polling er "god nok" for Lag 2. SpacetimeDB-koden beholdes men aktiveres ikke i prod før behovet er bevist. Adapter-mønsteret gjør at vi kan bytte uten frontend-endring.
 ## 10. Instruks for Claude Code
 - `sync_outbox`-tabellen i SpacetimeDB bør ha et `synced`-flagg og `created_at`-tidsstempel
 - Workeren skal bruke jobbkø-infrastrukturen (se `docs/infra/jobbkø.md`) for sin egen helse/observabilitet, men selve pollingen er en egen loop — ikke en vanlig jobb i køen
--- a/docs/proposals/README.md
+++ b/docs/proposals/README.md
@ -28,8 +28,11 @@ Når en idé modnes nok til å bli implementert, skrives en full spec i `docs/fe
 | [Artikkel-publisering](artikkel_publisering.md) | Middels | Høy | Kunnskapsgraf, Caddy, jobbkø, AI Gateway |
 | [Sosial publisering](social_posting.md) | Lav–Middels | Høy | Chat, jobbkø, workspace settings |
 | [Komponerbare sider](komponerbare_sider.md) | Lav (Fase 1) | Middels–Høy | Workspace-modell, SvelteKit, alle feature-komponenter |
 | [Contradiction Detector](contradiction_detector.md) | Middels | Høy | Live AI, kunnskapsgraf, pgvector, segmenter |
 | [Auto-Highlight Reel](auto_highlight_reel.md) | Middels | Høy | Podcastfabrikken, jobbkø, AI Gateway, Caddy byte-range |
 | [Audience Voice Memo](audience_voice_memo.md) | Lav | Høy | Den Asynkrone Gjesten, Live transkripsjon, Live AI |
-**Lavthengende frukter** (lav innsats, høy wow): Serendipity Roulette, Podcast Time Machine, Meme Generator.
+**Lavthengende frukter** (lav innsats, høy wow): Serendipity Roulette, Podcast Time Machine, Meme Generator, Audience Voice Memo.
 ## Format
 Forslagsfiler er lette — ingen streng mal. Minimum:
--- a/docs/proposals/audience_voice_memo.md
+++ b/docs/proposals/audience_voice_memo.md
@ -0,0 +1,41 @@
 # Forslag: Audience Voice Memo (Live publikums-innspill)
 **Innsats:** Lav | **Wow-faktor:** Høy
 ## Idé
 Under live-innspilling vises en QR-kode (eller kort-URL) som publikum kan skanne. Den åpner en minimal nettside (gjenbruker Den Asynkrone Gjestens tech) der de kan sende voice memos. Memoene dukker opp i studio-chatten som `voice_memo`-meldinger, transkriberes live, og AI matcher innholdet til kunnskapsgrafen:
 *"Lytter 'Kari fra Bergen' spør om vindkraft — du har 3 faktoider om dette fra Episode 12 og 17."*
 ## Hvorfor
 - Gjør live-innspilling interaktiv uten at publikum trenger app eller konto
 - Gjenbruker nesten alt fra Den Asynkrone Gjesten (guest_tokens, lydopplasting, Whisper)
 - Kombinert med Live AI gir det programlederen kontekst på publikums-spørsmål i sanntid
 - Viralt: "Send oss en voice memo LIVE mens vi spiller inn"
 ## Bygger på
 - **Den Asynkrone Gjesten** (guest_tokens, `/guest/[token]`-rute, lydopplasting)
 - **Live transkripsjon** (Whisper transkriberer voice memos via jobbkø)
 - **Live AI** (matcher transkriberte memos mot kunnskapsgraf)
 - **SpacetimeDB / PG-polling** (memos dukker opp i studio-chat i sanntid)
 ## Forskjell fra Den Asynkrone Gjesten
 - **Asynkron gjest:** Én person, navngitt, forberedte spørsmål, tidsbegrenset
 - **Audience Voice Memo:** Mange anonyme/pseudonyme lyttere, fritt innhold, kun aktivt under innspilling
 ## Teknisk skisse
 1. Redaksjonen oppretter en "Live Q&A-sesjon" (spesiell guest_token med `type: 'audience'`)
 2. QR-kode genereres med kort-URL → `/live/[token]`
 3. Publikum åpner, skriver inn kallenavn, tar opp voice memo (maks 30 sek)
 4. Voice memo lastes opp, Whisper transkriberer, AI matcher mot graf
 5. Studio-chatten viser: "[Kari fra Bergen]: <transkribert tekst>" + AI-kontekst
 ## Dataklassifisering
 - Audience voice memos: Flyktig (TTL 7 dager) — kun relevant rundt innspilling
 - Transkripsjoner av memos: Flyktig (TTL 7 dager)
 - Kuraterte memos (valgt ut av redaksjonen): Kritisk (flyttes til workspace media/)
 ## Åpne spørsmål
 - Moderering: skal alle memos dukke opp automatisk, eller må en produsent godkjenne først?
 - Skalering: hva om 100+ lyttere sender memos samtidig? Whisper-kø kan bli overbelastet
 - Kan dette kombineres med Live Audience Q&A-forslaget (stemmegiving på spørsmål)?
 - Personvern: skal lytterne akseptere at memoet kan brukes i podcasten?
--- a/docs/proposals/auto_highlight_reel.md
+++ b/docs/proposals/auto_highlight_reel.md
@ -0,0 +1,39 @@
 # Forslag: Auto-Highlight Reel (Post-innspilling)
 **Innsats:** Middels | **Wow-faktor:** Høy
 ## Idé
 Etter innspilling analyserer Podcastfabrikken transkripsjonen for humor, emosjonelle topper, sterke meninger og "punchlines". AI genererer automatisk 5-10 klipp (15-45 sek) med:
 - Tidsstempler (start/slutt) i originalt opptak
 - Foreslått teksting (fra transkripsjon, formatert for sosiale medier)
 - Auto-generert thumbnail-tekst (det sterkeste sitatet)
 - Foreslått hashtags basert på kunnskapsgraf-tags
 Klippene havner i en "Highlights"-channel i workspace-chatten for review, med ett-klikk godkjenning og auto-posting via sosial publisering.
 ## Hvorfor
 - Podcast-klipp er den viktigste vekstmotoren, men manuell klipping er tidkrevende
 - Bygger på eksisterende Whisper-transkripsjon + jobbkø + AI Gateway
 - Kombinert med sosial publisering-forslaget gir dette en komplett "innspilling → distribusjon"-pipeline
 - Differensiator: ingen annen podcast-plattform gjør dette automatisk med kvalitetskontroll
 ## Bygger på
 - **Podcastfabrikken** (Whisper SRT + AI-metadata — allerede spesifisert)
 - **Auto-Clipper** (eksisterende forslag — dette er post-innspilling-versjonen)
 - **Jobbkø** (`highlight_extract`-jobb, kjøres etter `whisper_postprocess`)
 - **AI Gateway** (`sidelinja/resonering` for klipp-vurdering)
 - **Caddy byte-range** (klipp serveres som range-requests mot original MP3)
 - **Sosial publisering** (eksisterende forslag — ett-klikk posting)
 ## Forskjell fra Auto-Clipper
 Auto-Clipper kjører *live* under innspilling og fanger øyeblikk i sanntid. Auto-Highlight Reel kjører *etter* innspilling og har tilgang til hele transkripsjonen — kan dermed finne narrative buer og tematiske høydepunkter som bare er synlige i kontekst.
 ## Dataklassifisering
 - Klipp-metadata (tidsstempler, teksting, score): Kritisk (PG)
 - Klipp-lydfiler: Avledet (kategori 3) — genereres on-demand fra original MP3 + tidsstempler
 - Highlight-forslag (før godkjenning): Flyktig (TTL 30 dager)
 ## Åpne spørsmål
 - Scoring: hva gjør et øyeblikk "klippverdig"? Humor, nyhet, kontrovers, emosjon?
 - Videostøtte: trenger vi waveform-video med teksting for TikTok/Shorts, eller holder lyd + bilde?
 - Skal AI-en foreslå rekkefølge/gruppering av klipp til en "highlight reel" (2-3 min sammenklipp)?
 - Kan den lære av hvilke klipp redaksjonen godkjenner over tid (feedback loop)?
--- a/docs/proposals/contradiction_detector.md
+++ b/docs/proposals/contradiction_detector.md
@ -0,0 +1,41 @@
 # Forslag: Contradiction Detector (Live i Studioet)
 **Innsats:** Middels | **Wow-faktor:** Høy
 ## Idé
 Under live-innspilling matcher Live AI nye utsagn mot eksisterende `CONTRADICTS`-edges og gamle segmenter i kunnskapsgrafen. Når en selvmotsigelse oppdages, popper det opp et diskret varsel i studio-UI:
 *"Du sa akkurat «vi må kutte støtte til vindkraft» — men i Episode 17 (segment 3, 14:22) sa du «vindkraft er fremtiden». Vil du adressere det?"*
 Programlederen kan:
 1. Ignorere (ingen handling)
 2. Markere for oppfølging (Aha-markør)
 3. Spille inn et 12-sekunders "correction clip" på stedet
 ## Hvorfor
 - Den ultimate "live co-host"-funksjonen — AI som faktisk gjør programlederen bedre
 - Bygger direkte på eksisterende infrastruktur (Live AI + segmenter + kunnskapsgraf)
 - Øker troverdigheten til podcasten (selvkorreksjon er sterkere enn å bli tatt i feil)
 - Viralt potensial: "Denne podcasten har en AI som fanger selvmotsigelser i sanntid"
 ## Bygger på
 - **Live transkripsjon** (Whisper-chunks i sanntid)
 - **Live AI** (eksisterende faktoid-oppslag-pipeline)
 - **Kunnskapsgraf** (segmenter med NER-tags, `CONTRADICTS`-edges)
 - **pgvector** (semantisk matching for "lignende men motstridende" utsagn)
 - **Caddy byte-range** (for å hente originalt lydklipp fra gammel episode)
 ## Teknisk skisse
 1. Whisper-chunk → NER-uttrekk (aktører, temaer, påstander)
 2. Søk i kunnskapsgrafen: finnes det segmenter med samme aktør/tema men motstridende innhold?
 3. pgvector cosine similarity for semantisk matching + LLM-vurdering via `sidelinja/resonering`
 4. Resultat med confidence score > terskel → push til studio-UI via SpacetimeDB
 ## Dataklassifisering
 - Contradiction-alerts: Flyktig (TTL 24t) — kun relevant under/etter innspilling
 - Godkjente contradictions → nye `CONTRADICTS`-edges i kunnskapsgrafen (kritisk)
 ## Åpne spørsmål
 - Terskel for confidence: for lav = støy under innspilling, for høy = misser reelle motstridelser
 - Skal den kun matche mot egne episoder, eller også mot eksterne faktoider?
 - Kan dette kombineres med Ghost Host for å "lese opp" motstridelsen?
 - Latens-krav: må fungere innen 10-15 sek etter utsagnet for å være nyttig live
--- a/docs/setup/migration_safety.md
+++ b/docs/setup/migration_safety.md
@ -62,5 +62,87 @@ WHERE tc.table_schema = 'public'
 ORDER BY tc.table_name;
 ```
 ## RLS Leak Hunter (CI-test)
 `SET app.current_workspace_id` er en skjult single point of failure — en glemt SET i en ny feature, en feil i connection-pool, eller en ny tjeneste som kobler til PG uten middleware kan føre til cross-workspace datalekkasje. Denne testen fanger det opp.
 ### Automatisk CI-test (to-workspace leak detection)
 Kjøres i migrasjonstester og som egen CI-steg:
 ```sql
 -- Opprett to test-workspaces
 INSERT INTO workspaces (id, name, slug) VALUES
  ('aaaaaaaa-0000-0000-0000-000000000001', 'Workspace A', 'ws-a'),
  ('aaaaaaaa-0000-0000-0000-000000000002', 'Workspace B', 'ws-b');
 -- Seed testdata i begge
 INSERT INTO nodes (id, node_type, workspace_id) VALUES
  ('bbbbbbbb-0000-0000-0000-000000000001', 'tema', 'aaaaaaaa-0000-0000-0000-000000000001'),
  ('bbbbbbbb-0000-0000-0000-000000000002', 'tema', 'aaaaaaaa-0000-0000-0000-000000000002');
 -- TEST 1: Sett workspace A, forsøk å lese workspace B
 SET app.current_workspace_id = 'aaaaaaaa-0000-0000-0000-000000000001';
 DO $$
 BEGIN
  IF (SELECT count(*) FROM nodes WHERE workspace_id = 'aaaaaaaa-0000-0000-0000-000000000002') > 0 THEN
    RAISE EXCEPTION 'RLS LEAK: Workspace A kan lese Workspace B sine noder!';
  END IF;
 END $$;
 -- TEST 2: Uten SET (tom current_setting) skal returnere 0 rader
 RESET app.current_workspace_id;
 DO $$
 BEGIN
  -- For vanlig bruker (ikke superuser) bør dette returnere 0
  IF (SELECT count(*) FROM nodes) > 0 AND current_setting('is_superuser') = 'off' THEN
    RAISE EXCEPTION 'RLS LEAK: Uautentisert tilkobling kan lese data!';
  END IF;
 END $$;
 ```
 ### Audit-trigger (produksjon)
 Valgfri trigger som logger mistenkelige queries i prod:
 ```sql
 -- Tabell for RLS-audit
 CREATE TABLE IF NOT EXISTS rls_audit_log (
    id BIGSERIAL PRIMARY KEY,
    table_name TEXT NOT NULL,
    operation TEXT NOT NULL,
    current_workspace TEXT,
    session_user TEXT NOT NULL,
    query_timestamp TIMESTAMPTZ NOT NULL DEFAULT now()
 );
 -- Funksjon som logger når current_workspace_id ikke er satt
 CREATE OR REPLACE FUNCTION audit_rls_context() RETURNS TRIGGER AS $$
 BEGIN
  IF current_setting('app.current_workspace_id', true) IS NULL
     OR current_setting('app.current_workspace_id', true) = '' THEN
    IF current_setting('is_superuser') = 'off' THEN
      INSERT INTO rls_audit_log (table_name, operation, current_workspace, session_user)
      VALUES (TG_TABLE_NAME, TG_OP, current_setting('app.current_workspace_id', true), session_user);
    END IF;
  END IF;
  RETURN NEW;
 END;
 $$ LANGUAGE plpgsql;
 ```
 **Kjør leak hunter mot ALLE tabeller med workspace_id — ikke bare de som er listet over.** Nye tabeller legges til i listen automatisk via introspeksjon:
 ```sql
 -- Finn alle tabeller med workspace_id-kolonne (bør alle ha RLS)
 SELECT t.tablename
 FROM pg_tables t
 JOIN information_schema.columns c ON c.table_name = t.tablename
 WHERE c.column_name = 'workspace_id'
  AND t.schemaname = 'public'
  AND NOT EXISTS (
    SELECT 1 FROM pg_policies p WHERE p.tablename = t.tablename
  );
 -- Forventet: 0 rader. Enhver rad her = tabell med workspace_id UTEN RLS-policy.
 ```
 ## Automatisering
-Disse sjekkene kjøres automatisk i migrasjonstestene (se `ARCHITECTURE.md` §10.2). Manuell kjøring er kun nødvendig ved prod-migrasjoner til automatiserte tester er på plass.
+Disse sjekkene kjøres automatisk i migrasjonstestene (se `ARCHITECTURE.md` §10.2). Manuell kjøring er kun nødvendig ved prod-migrasjoner til automatiserte tester er på plass. **RLS Leak Hunter bør prioriteres som første CI-steg — den beskytter mot den mest alvorlige feilkategorien (cross-workspace datalekkasje).**
--- a/docs/setup/produksjon.md
+++ b/docs/setup/produksjon.md
@ -155,6 +155,9 @@ Tjenestene startes i rekkefølge fordi noen avhenger av andre. Alle defineres i
 # - Alle tjenester på samme interne nettverk (sidelinja-net)
 # - Volumer bruker bind mounts til /srv/sidelinja/
 # - .env-filen lastes automatisk av Docker Compose
 # - RESSURSGRENSER: Worker-containere (Whisper) MÅ ha deploy.resources.limits
 #   for å forhindre at de sultefôrer LiveKit og PostgreSQL.
 #   Eksempel: workers: deploy: resources: limits: cpus: '4' memory: 8G
 networks:
  sidelinja-net:
@ -254,7 +257,7 @@ Forgejo konfigureres med Authentik som OAuth2-kilde:
 Se `ARCHITECTURE.md` seksjon 2.2 for full dataklassifisering. Kun kategori 1 (kritisk) og Forgejo-data backupes.
-### 11.1 PostgreSQL (daglig, 03:00)
+### 11.1 PostgreSQL (daglig dump, 03:00)
 ```bash
 # pg_dump er konsistent selv under last — ingen nedetid
 docker compose exec -T postgres pg_dump -U sidelinja -Fc sidelinja \
@ -264,6 +267,43 @@ docker compose exec -T postgres pg_dump -U sidelinja -Fc sidelinja \
 find /srv/sidelinja/backup/pg/ -name "*.dump" -mtime +30 -delete
 ```
 ### 11.1b PostgreSQL WAL-arkivering (kontinuerlig, PITR)
 Daglig dump gir opptil 24 timers datatap. WAL-arkivering muliggjør Point-In-Time Recovery til minuttet.
 ```bash
 # Installer pgBackRest (i PostgreSQL Docker-containeren eller som sidecar)
 # Alternativt: WAL-G for enklere S3-oppsett
 # postgresql.conf (legg til i Docker-volumet eller via environment)
 archive_mode = on
 archive_command = 'pgbackrest --stanza=sidelinja archive-push %p'
 wal_level = replica
 # pgbackrest.conf
 [sidelinja]
 pg1-path=/var/lib/postgresql/data
 [global]
 repo1-type=s3
 repo1-s3-bucket=sidelinja-backup
 repo1-s3-endpoint=fsn1.your-objectstorage.com
 repo1-s3-region=fsn1
 repo1-path=/pgbackrest
 repo1-retention-full=4
 repo1-retention-diff=14
 # Ukentlig full backup (søndag kl. 02:00)
 # 0 2 * * 0 sidelinja pgbackrest --stanza=sidelinja --type=full backup
 # Daglig differensiell (man-lør kl. 02:00)
 # 0 2 * * 1-6 sidelinja pgbackrest --stanza=sidelinja --type=diff backup
 # Recovery-eksempel (gjenopprett til spesifikt tidspunkt):
 # pgbackrest --stanza=sidelinja --target="2026-03-15 13:59:00" \
 #   --target-action=promote restore
 ```
 **Merk:** WAL-arkivering erstatter IKKE daglig pg_dump — dumpen er en enkel, portabel backup som fungerer uavhengig av pgBackRest. WAL-arkivering er et tillegg for finkornet recovery.
 ### 11.2 Media-filer (daglig, 03:30)
 ```bash
 # Inkrementell med rsync til lokal backup-disk eller ekstern lagring
@ -284,15 +324,47 @@ cp /srv/sidelinja/.env /srv/sidelinja/backup/env_$(date +%Y%m%d)
 chmod 600 /srv/sidelinja/backup/env_*
 ```
-### 11.5 Cron-oppsett
+### 11.5 Off-site backup (rclone → Hetzner Object Storage)
 Lokal backup beskytter kun mot logiske feil. Ved fysisk nodefeil tapes alt. Kategori 1-data pushes daglig til Hetzner Object Storage via `rclone`.
 ```bash
 # Installer og konfigurer rclone
 curl https://rclone.org/install.sh | sudo bash
 rclone config
 # Opprett remote "hetzner-s3" med Hetzner Object Storage credentials
 # (S3-kompatibelt, endpoint: fsn1.your-objectstorage.com eller nbg1)
 # /srv/sidelinja/scripts/backup-offsite.sh
 #!/bin/bash
 set -euo pipefail
 BUCKET="s3:hetzner-s3/sidelinja-backup"
 # PG-dump (siste lokale dump)
 LATEST_DUMP=$(ls -t /srv/sidelinja/backup/pg/*.dump 2>/dev/null | head -1)
 if [ -n "$LATEST_DUMP" ]; then
  rclone copy "$LATEST_DUMP" "$BUCKET/pg/"
 fi
 # Media (inkrementell sync)
 rclone sync /srv/sidelinja/media/ "$BUCKET/media/" --transfers 4
 # Behold 90 dager PG-dumper off-site
 rclone delete "$BUCKET/pg/" --min-age 90d
 echo "$(date): Off-site backup ferdig" >> /srv/sidelinja/logs/backup-offsite.log
 ```
 ### 11.6 Cron-oppsett
 ```bash
 # /etc/cron.d/sidelinja-backup
 0  3 * * * sidelinja /srv/sidelinja/scripts/backup-pg.sh
 30 3 * * * sidelinja /srv/sidelinja/scripts/backup-media.sh
 0  4 * * * sidelinja /srv/sidelinja/scripts/backup-forgejo.sh
 30 4 * * * sidelinja /srv/sidelinja/scripts/backup-offsite.sh
 ```
-### 11.6 Hva som IKKE backupes (bevisst)
+### 11.7 Hva som IKKE backupes (bevisst)
 - **Redis** — cache, regenereres automatisk
 - **Caddy-data** — sertifikater regenereres av Let's Encrypt
 - **Avledede data i PG** (ren tekst, segmenter, søkeindeks) — regenereres fra Git
@ -300,7 +372,7 @@ chmod 600 /srv/sidelinja/backup/env_*
 - **Whisper-modeller** — re-download fra HuggingFace
 - **SpacetimeDB** — sanntidsdata synkes til PG, in-memory state er flyktig
-### 11.7 Restore-prosedyre
+### 11.8 Restore-prosedyre
 ```bash
 # 1. PostgreSQL
 docker compose exec -T postgres pg_restore -U sidelinja -d sidelinja --clean \