vegard 024a91e1b3 Dokumentasjon: arkitekturvurdering — sikkerhet, backup, kostnad, nye forslag

Oppdaterer dokumentasjon basert på tre eksterne arkitekturvurderinger:

- RLS Leak Hunter med CI-test og audit-trigger (migration_safety.md)
- pgvector-migrasjon flyttet til Lag 2, WAL-arkivering med pgBackRest (ARCHITECTURE.md, produksjon.md)
- Off-site backup med rclone, Docker cgroups for workers (ARCHITECTURE.md, produksjon.md)
- Kostnadskontroll i AI Gateway: workspace-budsjett, auto-fallback (ai_gateway.md)
- Gjeste-token sikkerhetsdybde: ClamAV, rate limiting, auto-revoke (den_asynkrone_gjesten.md)
- SpacetimeDB fase 1-vurdering: PG LISTEN/NOTIFY som mellomsteg (synkronisering.md)
- Kritiske events (Aha-markører) flushes umiddelbart (synkronisering.md)
- Ekstern helsesjekk, observability-utvidelser (ARCHITECTURE.md)
- Tre nye forslag: Contradiction Detector, Auto-Highlight Reel, Audience Voice Memo

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>

2026-03-15 03:56:21 +01:00

2.2 KiB

Raw Blame History

Forslag: Contradiction Detector (Live i Studioet)

Innsats: Middels | Wow-faktor: Høy

Idé

Under live-innspilling matcher Live AI nye utsagn mot eksisterende CONTRADICTS-edges og gamle segmenter i kunnskapsgrafen. Når en selvmotsigelse oppdages, popper det opp et diskret varsel i studio-UI:

"Du sa akkurat «vi må kutte støtte til vindkraft» — men i Episode 17 (segment 3, 14:22) sa du «vindkraft er fremtiden». Vil du adressere det?"

Programlederen kan:

Ignorere (ingen handling)
Markere for oppfølging (Aha-markør)
Spille inn et 12-sekunders "correction clip" på stedet

Hvorfor

Den ultimate "live co-host"-funksjonen — AI som faktisk gjør programlederen bedre
Bygger direkte på eksisterende infrastruktur (Live AI + segmenter + kunnskapsgraf)
Øker troverdigheten til podcasten (selvkorreksjon er sterkere enn å bli tatt i feil)
Viralt potensial: "Denne podcasten har en AI som fanger selvmotsigelser i sanntid"

Bygger på

Live transkripsjon (Whisper-chunks i sanntid)
Live AI (eksisterende faktoid-oppslag-pipeline)
Kunnskapsgraf (segmenter med NER-tags, CONTRADICTS-edges)
pgvector (semantisk matching for "lignende men motstridende" utsagn)
Caddy byte-range (for å hente originalt lydklipp fra gammel episode)

Teknisk skisse

Whisper-chunk → NER-uttrekk (aktører, temaer, påstander)
Søk i kunnskapsgrafen: finnes det segmenter med samme aktør/tema men motstridende innhold?
pgvector cosine similarity for semantisk matching + LLM-vurdering via sidelinja/resonering
Resultat med confidence score > terskel → push til studio-UI via SpacetimeDB

Dataklassifisering

Contradiction-alerts: Flyktig (TTL 24t) — kun relevant under/etter innspilling
Godkjente contradictions → nye CONTRADICTS-edges i kunnskapsgrafen (kritisk)

Åpne spørsmål

Terskel for confidence: for lav = støy under innspilling, for høy = misser reelle motstridelser
Skal den kun matche mot egne episoder, eller også mot eksterne faktoider?
Kan dette kombineres med Ghost Host for å "lese opp" motstridelsen?
Latens-krav: må fungere innen 10-15 sek etter utsagnet for å være nyttig live

2.2 KiB Raw Blame History