Oppdaterer dokumentasjon basert på tre eksterne arkitekturvurderinger: - RLS Leak Hunter med CI-test og audit-trigger (migration_safety.md) - pgvector-migrasjon flyttet til Lag 2, WAL-arkivering med pgBackRest (ARCHITECTURE.md, produksjon.md) - Off-site backup med rclone, Docker cgroups for workers (ARCHITECTURE.md, produksjon.md) - Kostnadskontroll i AI Gateway: workspace-budsjett, auto-fallback (ai_gateway.md) - Gjeste-token sikkerhetsdybde: ClamAV, rate limiting, auto-revoke (den_asynkrone_gjesten.md) - SpacetimeDB fase 1-vurdering: PG LISTEN/NOTIFY som mellomsteg (synkronisering.md) - Kritiske events (Aha-markører) flushes umiddelbart (synkronisering.md) - Ekstern helsesjekk, observability-utvidelser (ARCHITECTURE.md) - Tre nye forslag: Contradiction Detector, Auto-Highlight Reel, Audience Voice Memo Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2.2 KiB
2.2 KiB
Forslag: Contradiction Detector (Live i Studioet)
Innsats: Middels | Wow-faktor: Høy
Idé
Under live-innspilling matcher Live AI nye utsagn mot eksisterende CONTRADICTS-edges og gamle segmenter i kunnskapsgrafen. Når en selvmotsigelse oppdages, popper det opp et diskret varsel i studio-UI:
"Du sa akkurat «vi må kutte støtte til vindkraft» — men i Episode 17 (segment 3, 14:22) sa du «vindkraft er fremtiden». Vil du adressere det?"
Programlederen kan:
- Ignorere (ingen handling)
- Markere for oppfølging (Aha-markør)
- Spille inn et 12-sekunders "correction clip" på stedet
Hvorfor
- Den ultimate "live co-host"-funksjonen — AI som faktisk gjør programlederen bedre
- Bygger direkte på eksisterende infrastruktur (Live AI + segmenter + kunnskapsgraf)
- Øker troverdigheten til podcasten (selvkorreksjon er sterkere enn å bli tatt i feil)
- Viralt potensial: "Denne podcasten har en AI som fanger selvmotsigelser i sanntid"
Bygger på
- Live transkripsjon (Whisper-chunks i sanntid)
- Live AI (eksisterende faktoid-oppslag-pipeline)
- Kunnskapsgraf (segmenter med NER-tags,
CONTRADICTS-edges) - pgvector (semantisk matching for "lignende men motstridende" utsagn)
- Caddy byte-range (for å hente originalt lydklipp fra gammel episode)
Teknisk skisse
- Whisper-chunk → NER-uttrekk (aktører, temaer, påstander)
- Søk i kunnskapsgrafen: finnes det segmenter med samme aktør/tema men motstridende innhold?
- pgvector cosine similarity for semantisk matching + LLM-vurdering via
sidelinja/resonering - Resultat med confidence score > terskel → push til studio-UI via SpacetimeDB
Dataklassifisering
- Contradiction-alerts: Flyktig (TTL 24t) — kun relevant under/etter innspilling
- Godkjente contradictions → nye
CONTRADICTS-edges i kunnskapsgrafen (kritisk)
Åpne spørsmål
- Terskel for confidence: for lav = støy under innspilling, for høy = misser reelle motstridelser
- Skal den kun matche mot egne episoder, eller også mot eksterne faktoider?
- Kan dette kombineres med Ghost Host for å "lese opp" motstridelsen?
- Latens-krav: må fungere innen 10-15 sek etter utsagnet for å være nyttig live