synops-agent: sanntids token-regnskap per modell
Harnessen akkumulerer input/output tokens per modell gjennom hele kjøringen. Brukes til budsjettovervåking, eskalering, effektivitets- måling og orkestrator-input. HashMap<String, TokenUsage> i minne, persisteres til ai_usage_log ved checkpoint/slutt. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This commit is contained in:
parent
87e7dd70b5
commit
988d60a939
1 changed files with 36 additions and 0 deletions
|
|
@ -391,6 +391,42 @@ og med tilgang til modeller Claude Code ikke har (Grok for
|
|||
sanntid, Gemini for lange kontekster, lokale modeller for
|
||||
sensitive data).
|
||||
|
||||
### Token-regnskap
|
||||
|
||||
Harnessen teller og akkumulerer token counts per modell gjennom
|
||||
hele kjøringen. Ikke bare logging i etterkant — sanntids regnskap
|
||||
som brukes til aktive beslutninger.
|
||||
|
||||
```
|
||||
┌────────────────────────────────────────────────┐
|
||||
│ synops-agent sesjon #4721 │
|
||||
│ Oppgave: "Fiks 10 TODO-er i kodebasen" │
|
||||
│ │
|
||||
│ Modell Input Output Kostnad │
|
||||
│ gemini-flash 284k 12k $0.02 │
|
||||
│ claude-sonnet 18k 4k $0.08 │
|
||||
│ claude-opus 3k 1k $0.12 │
|
||||
│ ────────────────────────────────────────────── │
|
||||
│ Totalt 305k 17k $0.22 │
|
||||
│ Budsjett brukt: 22% av $1.00 │
|
||||
└────────────────────────────────────────────────┘
|
||||
```
|
||||
|
||||
Implementasjon:
|
||||
- Hvert API-kall returnerer `usage.input_tokens` og `usage.output_tokens`
|
||||
- Harnessen akkumulerer per modell i en `HashMap<String, TokenUsage>`
|
||||
- Kostnad beregnes fra modellens pris per token (konfigurerbar tabell)
|
||||
- Tilgjengelig for orkestratoren via `--stats` eller som verktøy-output
|
||||
- Ved budsjettgrense: stopp, rapporter gjenstående, foreslå billigere modell
|
||||
- Skrives til `ai_usage_log` i PG ved sesjonsslutt (og ved checkpoint)
|
||||
|
||||
Bruksområder for sanntids token-regnskap:
|
||||
- **Budsjettovervåking:** Stopp før kostnadssprekk
|
||||
- **Modellvalg:** "Flash har brukt 200k tokens uten resultat — eskaler"
|
||||
- **Effektivitetsmåling:** Tokens per fullført oppgave per modell
|
||||
- **Rapportering:** Vegard ser daglig/ukentlig forbruk per modellnivå
|
||||
- **Orkestrator-input:** Claude Code kan lese stats og justere strategi
|
||||
|
||||
### Eksperimentering med modellvalg
|
||||
|
||||
synops-agent logger modell, oppgavetype, kostnad, tid og resultat
|
||||
|
|
|
|||
Loading…
Add table
Reference in a new issue