Grunnleggende arkitekturbeslutninger tatt og dokumentert: - Alt er noder (brukere, team, innhold, mediefiler, samlings-noder) - Edges definerer hva en node er (freeform typer, metadata i JSONB) - Materialisert tilgangsmatrise (node_access) erstatter workspace-RLS - Visibility (hidden/discoverable/readable/open) på noder - Aliaser via usynlige system-edges - Maskinrommet eier all skriving (SpacetimeDB først, PG asynk) - SpacetimeDB holder hele grafen, PG er persistent backup - Node- og edge-skjema spesifisert (docs/primitiver/) Fjernet workspace-konseptet fra hele dokumentasjonen (~40 filer). Fem retninger besluttet, én åpen (rom, ikke forum). Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
81 lines
3.7 KiB
Markdown
81 lines
3.7 KiB
Markdown
# Feature: Kunnskaps-Bridge (Cross-Context Discovery)
|
|
**Filsti:** `docs/features/kunnskaps_bridge.md`
|
|
|
|
> **NB:** Dette dokumentet er en skisse fra v1 og må oppdateres til node/edge-modellen ved implementering.
|
|
|
|
## 1. Konsept
|
|
En valgfri, opt-in feature som lar brukere oppdage semantisk beslektet kunnskap på tvers av samlings-noder de har tilgang til. Bryter ikke tilgangsstyringen — resultatet er en *peker* ("dette finnes i Podcast B"), ikke selve innholdet. Brukeren må ha tilgang til begge samlings-nodene via `node_access` for å se treffet.
|
|
|
|
## 2. Avgrensning: Hva dette IKKE er
|
|
- **Ikke datadeling.** Ingen data kopieres mellom samlings-noder. Bridge viser kun at en relevant node *finnes*.
|
|
- **Ikke automatisk.** Begge samlings-noder må ha Bridge eksplisitt aktivert av en admin.
|
|
- **Ikke synlig for gjester.** Kun for brukere med tilgang til begge samlings-nodene.
|
|
- **Ikke et søk i andres data.** Du ser bare treff i samlings-noder du allerede har tilgang til.
|
|
|
|
## 3. Teknisk arkitektur
|
|
|
|
### 3.1 Vector Embeddings (pgvector)
|
|
Krever `pgvector`-extension i PostgreSQL:
|
|
|
|
```sql
|
|
CREATE EXTENSION IF NOT EXISTS vector;
|
|
|
|
ALTER TABLE actors ADD COLUMN embedding vector(768);
|
|
ALTER TABLE topics ADD COLUMN embedding vector(768);
|
|
ALTER TABLE factoids ADD COLUMN embedding vector(768);
|
|
|
|
CREATE INDEX idx_actors_embedding ON actors USING ivfflat (embedding vector_cosine_ops);
|
|
CREATE INDEX idx_topics_embedding ON topics USING ivfflat (embedding vector_cosine_ops);
|
|
CREATE INDEX idx_factoids_embedding ON factoids USING ivfflat (embedding vector_cosine_ops);
|
|
```
|
|
|
|
### 3.2 Embedding-generering (`generate_embeddings`)
|
|
En jobbkø-jobb som genererer embeddings for nye/endrede noder:
|
|
1. Rust-worker plukker opp jobben fra jobbkøen.
|
|
2. Bygger en tekst-representasjon av noden (navn, body, tilknyttede faktoider).
|
|
3. Sender til AI Gateway (`sidelinja/rutine`) for embedding-generering.
|
|
4. Lagrer vektoren i pgvector-kolonnen.
|
|
5. Re-genereres ved vesentlige endringer av noden.
|
|
|
|
### 3.3 Cross-context søk
|
|
Når en bruker utforsker en node (f.eks. Tema "Skolepolitikk"):
|
|
1. SvelteKit server-side henter brukerens tilgjengelige samlings-noder fra `node_access`-matrisen.
|
|
2. Kjører et similarity-søk med `<=>` (cosine distance), filtrert mot brukerens tilgjengelige noder:
|
|
```sql
|
|
SELECT na.node_id, e.name, e.embedding <=> $target_embedding AS distance
|
|
FROM entities e
|
|
JOIN nodes n ON e.id = n.id
|
|
JOIN node_access na ON n.id = na.node_id
|
|
WHERE na.user_id = $current_user
|
|
AND n.id != $current_node_id
|
|
AND e.embedding <=> $target_embedding < 0.3
|
|
ORDER BY distance
|
|
LIMIT 10;
|
|
```
|
|
3. Resultatet vises som en diskret "Finnes også i..."-seksjon i UI-et.
|
|
|
|
### 3.4 Samlings-node config
|
|
Bridge aktiveres per samlings-node i nodens metadata (JSONB):
|
|
```json
|
|
{
|
|
"bridge_enabled": true,
|
|
"bridge_discoverable": true
|
|
}
|
|
```
|
|
- `bridge_enabled` — samlings-noden kan søke i andre samlings-noder
|
|
- `bridge_discoverable` — andre samlings-noder kan finne noder under denne
|
|
|
|
Begge må være `true` for at en kobling skal vises.
|
|
|
|
## 4. Dataklassifisering
|
|
|
|
| Data | Kategori | Detaljer |
|
|
|---|---|---|
|
|
| Embedding-vektorer | Avledet (PG) | Kan regenereres fra nodeinnhold |
|
|
|
|
## 5. Instruks for Claude Code
|
|
* pgvector er en ny avhengighet — dokumenter i docker-compose og setup-guides.
|
|
* Cross-context søk bruker `node_access`-matrisen for tilgangsstyring. Isolér denne koden grundig — egen funksjon, aldri gjenbruk i andre kontekster.
|
|
* Embedding-dimensjon (768) bør matche modellen som brukes. Konfigurér som konstant, ikke hardkod overalt.
|
|
* Jobbtype `generate_embeddings` bruker `sidelinja/rutine` som modellalias.
|
|
* Bridge er **Lag 4+** — krever fylt kunnskapsgraf i minst to samlings-noder.
|