server/docs/proposals/contradiction_detector.md
vegard 024a91e1b3 Dokumentasjon: arkitekturvurdering — sikkerhet, backup, kostnad, nye forslag
Oppdaterer dokumentasjon basert på tre eksterne arkitekturvurderinger:

- RLS Leak Hunter med CI-test og audit-trigger (migration_safety.md)
- pgvector-migrasjon flyttet til Lag 2, WAL-arkivering med pgBackRest (ARCHITECTURE.md, produksjon.md)
- Off-site backup med rclone, Docker cgroups for workers (ARCHITECTURE.md, produksjon.md)
- Kostnadskontroll i AI Gateway: workspace-budsjett, auto-fallback (ai_gateway.md)
- Gjeste-token sikkerhetsdybde: ClamAV, rate limiting, auto-revoke (den_asynkrone_gjesten.md)
- SpacetimeDB fase 1-vurdering: PG LISTEN/NOTIFY som mellomsteg (synkronisering.md)
- Kritiske events (Aha-markører) flushes umiddelbart (synkronisering.md)
- Ekstern helsesjekk, observability-utvidelser (ARCHITECTURE.md)
- Tre nye forslag: Contradiction Detector, Auto-Highlight Reel, Audience Voice Memo

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-15 03:56:21 +01:00

2.2 KiB

Forslag: Contradiction Detector (Live i Studioet)

Innsats: Middels | Wow-faktor: Høy

Idé

Under live-innspilling matcher Live AI nye utsagn mot eksisterende CONTRADICTS-edges og gamle segmenter i kunnskapsgrafen. Når en selvmotsigelse oppdages, popper det opp et diskret varsel i studio-UI:

"Du sa akkurat «vi må kutte støtte til vindkraft» — men i Episode 17 (segment 3, 14:22) sa du «vindkraft er fremtiden». Vil du adressere det?"

Programlederen kan:

  1. Ignorere (ingen handling)
  2. Markere for oppfølging (Aha-markør)
  3. Spille inn et 12-sekunders "correction clip" på stedet

Hvorfor

  • Den ultimate "live co-host"-funksjonen — AI som faktisk gjør programlederen bedre
  • Bygger direkte på eksisterende infrastruktur (Live AI + segmenter + kunnskapsgraf)
  • Øker troverdigheten til podcasten (selvkorreksjon er sterkere enn å bli tatt i feil)
  • Viralt potensial: "Denne podcasten har en AI som fanger selvmotsigelser i sanntid"

Bygger på

  • Live transkripsjon (Whisper-chunks i sanntid)
  • Live AI (eksisterende faktoid-oppslag-pipeline)
  • Kunnskapsgraf (segmenter med NER-tags, CONTRADICTS-edges)
  • pgvector (semantisk matching for "lignende men motstridende" utsagn)
  • Caddy byte-range (for å hente originalt lydklipp fra gammel episode)

Teknisk skisse

  1. Whisper-chunk → NER-uttrekk (aktører, temaer, påstander)
  2. Søk i kunnskapsgrafen: finnes det segmenter med samme aktør/tema men motstridende innhold?
  3. pgvector cosine similarity for semantisk matching + LLM-vurdering via sidelinja/resonering
  4. Resultat med confidence score > terskel → push til studio-UI via SpacetimeDB

Dataklassifisering

  • Contradiction-alerts: Flyktig (TTL 24t) — kun relevant under/etter innspilling
  • Godkjente contradictions → nye CONTRADICTS-edges i kunnskapsgrafen (kritisk)

Åpne spørsmål

  • Terskel for confidence: for lav = støy under innspilling, for høy = misser reelle motstridelser
  • Skal den kun matche mot egne episoder, eller også mot eksterne faktoider?
  • Kan dette kombineres med Ghost Host for å "lese opp" motstridelsen?
  • Latens-krav: må fungere innen 10-15 sek etter utsagnet for å være nyttig live