synops-agent: sanntids token-regnskap per modell
Harnessen akkumulerer input/output tokens per modell gjennom hele kjøringen. Brukes til budsjettovervåking, eskalering, effektivitets- måling og orkestrator-input. HashMap<String, TokenUsage> i minne, persisteres til ai_usage_log ved checkpoint/slutt. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
This commit is contained in:
parent
87e7dd70b5
commit
988d60a939
1 changed files with 36 additions and 0 deletions
|
|
@ -391,6 +391,42 @@ og med tilgang til modeller Claude Code ikke har (Grok for
|
||||||
sanntid, Gemini for lange kontekster, lokale modeller for
|
sanntid, Gemini for lange kontekster, lokale modeller for
|
||||||
sensitive data).
|
sensitive data).
|
||||||
|
|
||||||
|
### Token-regnskap
|
||||||
|
|
||||||
|
Harnessen teller og akkumulerer token counts per modell gjennom
|
||||||
|
hele kjøringen. Ikke bare logging i etterkant — sanntids regnskap
|
||||||
|
som brukes til aktive beslutninger.
|
||||||
|
|
||||||
|
```
|
||||||
|
┌────────────────────────────────────────────────┐
|
||||||
|
│ synops-agent sesjon #4721 │
|
||||||
|
│ Oppgave: "Fiks 10 TODO-er i kodebasen" │
|
||||||
|
│ │
|
||||||
|
│ Modell Input Output Kostnad │
|
||||||
|
│ gemini-flash 284k 12k $0.02 │
|
||||||
|
│ claude-sonnet 18k 4k $0.08 │
|
||||||
|
│ claude-opus 3k 1k $0.12 │
|
||||||
|
│ ────────────────────────────────────────────── │
|
||||||
|
│ Totalt 305k 17k $0.22 │
|
||||||
|
│ Budsjett brukt: 22% av $1.00 │
|
||||||
|
└────────────────────────────────────────────────┘
|
||||||
|
```
|
||||||
|
|
||||||
|
Implementasjon:
|
||||||
|
- Hvert API-kall returnerer `usage.input_tokens` og `usage.output_tokens`
|
||||||
|
- Harnessen akkumulerer per modell i en `HashMap<String, TokenUsage>`
|
||||||
|
- Kostnad beregnes fra modellens pris per token (konfigurerbar tabell)
|
||||||
|
- Tilgjengelig for orkestratoren via `--stats` eller som verktøy-output
|
||||||
|
- Ved budsjettgrense: stopp, rapporter gjenstående, foreslå billigere modell
|
||||||
|
- Skrives til `ai_usage_log` i PG ved sesjonsslutt (og ved checkpoint)
|
||||||
|
|
||||||
|
Bruksområder for sanntids token-regnskap:
|
||||||
|
- **Budsjettovervåking:** Stopp før kostnadssprekk
|
||||||
|
- **Modellvalg:** "Flash har brukt 200k tokens uten resultat — eskaler"
|
||||||
|
- **Effektivitetsmåling:** Tokens per fullført oppgave per modell
|
||||||
|
- **Rapportering:** Vegard ser daglig/ukentlig forbruk per modellnivå
|
||||||
|
- **Orkestrator-input:** Claude Code kan lese stats og justere strategi
|
||||||
|
|
||||||
### Eksperimentering med modellvalg
|
### Eksperimentering med modellvalg
|
||||||
|
|
||||||
synops-agent logger modell, oppgavetype, kostnad, tid og resultat
|
synops-agent logger modell, oppgavetype, kostnad, tid og resultat
|
||||||
|
|
|
||||||
Loading…
Add table
Reference in a new issue