synops-agent: sanntids token-regnskap per modell

Harnessen akkumulerer input/output tokens per modell gjennom hele
kjøringen. Brukes til budsjettovervåking, eskalering, effektivitets-
måling og orkestrator-input. HashMap<String, TokenUsage> i minne,
persisteres til ai_usage_log ved checkpoint/slutt.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This commit is contained in:
vegard 2026-03-19 07:38:36 +00:00
parent 87e7dd70b5
commit 988d60a939

View file

@ -391,6 +391,42 @@ og med tilgang til modeller Claude Code ikke har (Grok for
sanntid, Gemini for lange kontekster, lokale modeller for
sensitive data).
### Token-regnskap
Harnessen teller og akkumulerer token counts per modell gjennom
hele kjøringen. Ikke bare logging i etterkant — sanntids regnskap
som brukes til aktive beslutninger.
```
┌────────────────────────────────────────────────┐
│ synops-agent sesjon #4721
│ Oppgave: "Fiks 10 TODO-er i kodebasen" │
│ │
│ Modell Input Output Kostnad │
│ gemini-flash 284k 12k $0.02 │
│ claude-sonnet 18k 4k $0.08 │
│ claude-opus 3k 1k $0.12 │
│ ────────────────────────────────────────────── │
│ Totalt 305k 17k $0.22 │
│ Budsjett brukt: 22% av $1.00 │
└────────────────────────────────────────────────┘
```
Implementasjon:
- Hvert API-kall returnerer `usage.input_tokens` og `usage.output_tokens`
- Harnessen akkumulerer per modell i en `HashMap<String, TokenUsage>`
- Kostnad beregnes fra modellens pris per token (konfigurerbar tabell)
- Tilgjengelig for orkestratoren via `--stats` eller som verktøy-output
- Ved budsjettgrense: stopp, rapporter gjenstående, foreslå billigere modell
- Skrives til `ai_usage_log` i PG ved sesjonsslutt (og ved checkpoint)
Bruksområder for sanntids token-regnskap:
- **Budsjettovervåking:** Stopp før kostnadssprekk
- **Modellvalg:** "Flash har brukt 200k tokens uten resultat — eskaler"
- **Effektivitetsmåling:** Tokens per fullført oppgave per modell
- **Rapportering:** Vegard ser daglig/ukentlig forbruk per modellnivå
- **Orkestrator-input:** Claude Code kan lese stats og justere strategi
### Eksperimentering med modellvalg
synops-agent logger modell, oppgavetype, kostnad, tid og resultat