synops/docs/proposals/graph_health_monitor.md
vegard 0a467066ba Synops v2: arkitektur, retninger og dokumentasjon
Nystart basert på arkitektonisk innsikt fra Sidelinja v1.
Koden er ny, visjon og primitiver er validert gjennom tidligere arbeid.

Inneholder:
- Komplett arkitekturdokumentasjon (docs/arkitektur.md)
- 6 vedtatte retninger (docs/retninger/)
- Alle concepts, features, proposals og erfaringer fra v1
- Server-oppsett og drift (docs/setup/)
- LiteLLM-konfigurasjon (API-nøkler via env)
- Editor.svelte referanse fra v1

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
2026-03-17 06:43:08 +01:00

39 lines
2.1 KiB
Markdown

# Forslag: Knowledge Graph Health Monitor
**Innsats:** Lav | **Wow-faktor:** Middels
## Idé
En admin-side i SvelteKit som viser "Graf-helse": tetthet, isolerte noder, svake relasjoner, ubalanserte temaer. AI-en foreslår ukentlig nye edges:
*"Du har 47 faktoider om Støre og 32 om Ap — skal vi koble dem med WORKS_FOR?"*
*"Dette segmentet nevner vindkraft 9 ganger, men ingen #Tema-knute finnes."*
## Hvorfor
- Kunnskapsgrafen vokser organisk, men kan bli rotete uten vedlikehold
- Gir redaksjonen en "huskeliste" av ting de bør koble manuelt eller godkjenne
- Synliggjør verdien av grafen — man ser den bli smartere over tid
- Forhindrer "orphan nodes" som aldri dukker opp i oppslag
## Bygger på
- Kunnskapsgrafen (nodes, graph_edges — rekursive CTEs for å finne isolerte subgrafer)
- pgvector (allerede planlagt i Kunnskaps-Bridge — brukes for å finne semantisk like noder som mangler eksplisitt kobling)
- `generate_embeddings`-jobb (eksisterende jobbtype)
- Jobbkø (`graph_suggest_edges` — ny jobbtype, scheduled ukentlig)
- AI Gateway (`sidelinja/resonering` for naturlig språk-forslag)
## Helsemetrikker
| Metrikk | SQL-skisse | Handlingsforslag |
|---|---|---|
| Isolerte noder | `nodes LEFT JOIN graph_edges ... WHERE edge IS NULL` | "Koble til tema eller slett" |
| Temaer uten faktoider | `themes LEFT JOIN factoids ... HAVING count = 0` | "Tomt tema — berik eller arkiver" |
| Aktører uten relasjoner | Samme mønster | "Ny aktør — trenger kontekst" |
| Semantisk like noder | pgvector cosine distance < 0.15 | "Mulig duplikat slå sammen?" |
| Manglende edges | AI-analyse av node-par med høy co-occurrence i segmenter | "Koble Støre Ap?" |
## Dataklassifisering
- Edge-forslag: Flyktig (TTL 30 dager) godkjente forslag blir ekte `graph_edges`
- Helsemetrikker: Avledet (beregnes on-demand fra grafen)
## Åpne spørsmål
- Skal forslagene dukke opp som "innboks-kort" i Redaksjonen, eller kun en dedikert admin-side?
- Terskel for "semantisk lik": hvor lav cosine distance = mulig duplikat?
- Bør monitoren kjøre per workspace eller globalt (cross-workspace via Bridge)?