Oppdaterer dokumentasjon basert på tre eksterne arkitekturvurderinger: - RLS Leak Hunter med CI-test og audit-trigger (migration_safety.md) - pgvector-migrasjon flyttet til Lag 2, WAL-arkivering med pgBackRest (ARCHITECTURE.md, produksjon.md) - Off-site backup med rclone, Docker cgroups for workers (ARCHITECTURE.md, produksjon.md) - Kostnadskontroll i AI Gateway: workspace-budsjett, auto-fallback (ai_gateway.md) - Gjeste-token sikkerhetsdybde: ClamAV, rate limiting, auto-revoke (den_asynkrone_gjesten.md) - SpacetimeDB fase 1-vurdering: PG LISTEN/NOTIFY som mellomsteg (synkronisering.md) - Kritiske events (Aha-markører) flushes umiddelbart (synkronisering.md) - Ekstern helsesjekk, observability-utvidelser (ARCHITECTURE.md) - Tre nye forslag: Contradiction Detector, Auto-Highlight Reel, Audience Voice Memo Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
41 lines
2.2 KiB
Markdown
41 lines
2.2 KiB
Markdown
# Forslag: Contradiction Detector (Live i Studioet)
|
|
**Innsats:** Middels | **Wow-faktor:** Høy
|
|
|
|
## Idé
|
|
Under live-innspilling matcher Live AI nye utsagn mot eksisterende `CONTRADICTS`-edges og gamle segmenter i kunnskapsgrafen. Når en selvmotsigelse oppdages, popper det opp et diskret varsel i studio-UI:
|
|
|
|
*"Du sa akkurat «vi må kutte støtte til vindkraft» — men i Episode 17 (segment 3, 14:22) sa du «vindkraft er fremtiden». Vil du adressere det?"*
|
|
|
|
Programlederen kan:
|
|
1. Ignorere (ingen handling)
|
|
2. Markere for oppfølging (Aha-markør)
|
|
3. Spille inn et 12-sekunders "correction clip" på stedet
|
|
|
|
## Hvorfor
|
|
- Den ultimate "live co-host"-funksjonen — AI som faktisk gjør programlederen bedre
|
|
- Bygger direkte på eksisterende infrastruktur (Live AI + segmenter + kunnskapsgraf)
|
|
- Øker troverdigheten til podcasten (selvkorreksjon er sterkere enn å bli tatt i feil)
|
|
- Viralt potensial: "Denne podcasten har en AI som fanger selvmotsigelser i sanntid"
|
|
|
|
## Bygger på
|
|
- **Live transkripsjon** (Whisper-chunks i sanntid)
|
|
- **Live AI** (eksisterende faktoid-oppslag-pipeline)
|
|
- **Kunnskapsgraf** (segmenter med NER-tags, `CONTRADICTS`-edges)
|
|
- **pgvector** (semantisk matching for "lignende men motstridende" utsagn)
|
|
- **Caddy byte-range** (for å hente originalt lydklipp fra gammel episode)
|
|
|
|
## Teknisk skisse
|
|
1. Whisper-chunk → NER-uttrekk (aktører, temaer, påstander)
|
|
2. Søk i kunnskapsgrafen: finnes det segmenter med samme aktør/tema men motstridende innhold?
|
|
3. pgvector cosine similarity for semantisk matching + LLM-vurdering via `sidelinja/resonering`
|
|
4. Resultat med confidence score > terskel → push til studio-UI via SpacetimeDB
|
|
|
|
## Dataklassifisering
|
|
- Contradiction-alerts: Flyktig (TTL 24t) — kun relevant under/etter innspilling
|
|
- Godkjente contradictions → nye `CONTRADICTS`-edges i kunnskapsgrafen (kritisk)
|
|
|
|
## Åpne spørsmål
|
|
- Terskel for confidence: for lav = støy under innspilling, for høy = misser reelle motstridelser
|
|
- Skal den kun matche mot egne episoder, eller også mot eksterne faktoider?
|
|
- Kan dette kombineres med Ghost Host for å "lese opp" motstridelsen?
|
|
- Latens-krav: må fungere innen 10-15 sek etter utsagnet for å være nyttig live
|