synops-agent: sanntids token-regnskap per modell

Harnessen akkumulerer input/output tokens per modell gjennom hele kjøringen. Brukes til budsjettovervåking, eskalering, effektivitets- måling og orkestrator-input. HashMap<String, TokenUsage> i minne, persisteres til ai_usage_log ved checkpoint/slutt. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-19 07:38:36 +00:00 · 2026-03-19 07:38:36 +00:00 · 988d60a939
commit 988d60a939
parent 87e7dd70b5
1 changed files with 36 additions and 0 deletions
--- a/docs/proposals/agent_harness.md
+++ b/docs/proposals/agent_harness.md
@ -391,6 +391,42 @@ og med tilgang til modeller Claude Code ikke har (Grok for
 sanntid, Gemini for lange kontekster, lokale modeller for
 sensitive data).

+### Token-regnskap
+
+Harnessen teller og akkumulerer token counts per modell gjennom
+hele kjøringen. Ikke bare logging i etterkant — sanntids regnskap
+som brukes til aktive beslutninger.
+
+```
+┌────────────────────────────────────────────────┐
+│ synops-agent sesjon #4721                      │
+│ Oppgave: "Fiks 10 TODO-er i kodebasen"        │
+│                                                │
+│ Modell           Input    Output    Kostnad    │
+│ gemini-flash     284k     12k       $0.02      │
+│ claude-sonnet    18k      4k        $0.08      │
+│ claude-opus      3k       1k        $0.12      │
+│ ────────────────────────────────────────────── │
+│ Totalt           305k     17k       $0.22      │
+│ Budsjett brukt: 22% av $1.00                   │
+└────────────────────────────────────────────────┘
+```
+
+Implementasjon:
+- Hvert API-kall returnerer `usage.input_tokens` og `usage.output_tokens`
+- Harnessen akkumulerer per modell i en `HashMap<String, TokenUsage>`
+- Kostnad beregnes fra modellens pris per token (konfigurerbar tabell)
+- Tilgjengelig for orkestratoren via `--stats` eller som verktøy-output
+- Ved budsjettgrense: stopp, rapporter gjenstående, foreslå billigere modell
+- Skrives til `ai_usage_log` i PG ved sesjonsslutt (og ved checkpoint)
+
+Bruksområder for sanntids token-regnskap:
+- **Budsjettovervåking:** Stopp før kostnadssprekk
+- **Modellvalg:** "Flash har brukt 200k tokens uten resultat — eskaler"
+- **Effektivitetsmåling:** Tokens per fullført oppgave per modell
+- **Rapportering:** Vegard ser daglig/ukentlig forbruk per modellnivå
+- **Orkestrator-input:** Claude Code kan lese stats og justere strategi
+
 ### Eksperimentering med modellvalg

 synops-agent logger modell, oppgavetype, kostnad, tid og resultat