From 988d60a93903fdee105107b9439144859beb2834 Mon Sep 17 00:00:00 2001 From: vegard Date: Thu, 19 Mar 2026 07:38:36 +0000 Subject: [PATCH] synops-agent: sanntids token-regnskap per modell MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit Harnessen akkumulerer input/output tokens per modell gjennom hele kjøringen. Brukes til budsjettovervåking, eskalering, effektivitets- måling og orkestrator-input. HashMap i minne, persisteres til ai_usage_log ved checkpoint/slutt. Co-Authored-By: Claude Opus 4.6 (1M context) --- docs/proposals/agent_harness.md | 36 +++++++++++++++++++++++++++++++++ 1 file changed, 36 insertions(+) diff --git a/docs/proposals/agent_harness.md b/docs/proposals/agent_harness.md index bdd27a4..c6bbb47 100644 --- a/docs/proposals/agent_harness.md +++ b/docs/proposals/agent_harness.md @@ -391,6 +391,42 @@ og med tilgang til modeller Claude Code ikke har (Grok for sanntid, Gemini for lange kontekster, lokale modeller for sensitive data). +### Token-regnskap + +Harnessen teller og akkumulerer token counts per modell gjennom +hele kjøringen. Ikke bare logging i etterkant — sanntids regnskap +som brukes til aktive beslutninger. + +``` +┌────────────────────────────────────────────────┐ +│ synops-agent sesjon #4721 │ +│ Oppgave: "Fiks 10 TODO-er i kodebasen" │ +│ │ +│ Modell Input Output Kostnad │ +│ gemini-flash 284k 12k $0.02 │ +│ claude-sonnet 18k 4k $0.08 │ +│ claude-opus 3k 1k $0.12 │ +│ ────────────────────────────────────────────── │ +│ Totalt 305k 17k $0.22 │ +│ Budsjett brukt: 22% av $1.00 │ +└────────────────────────────────────────────────┘ +``` + +Implementasjon: +- Hvert API-kall returnerer `usage.input_tokens` og `usage.output_tokens` +- Harnessen akkumulerer per modell i en `HashMap` +- Kostnad beregnes fra modellens pris per token (konfigurerbar tabell) +- Tilgjengelig for orkestratoren via `--stats` eller som verktøy-output +- Ved budsjettgrense: stopp, rapporter gjenstående, foreslå billigere modell +- Skrives til `ai_usage_log` i PG ved sesjonsslutt (og ved checkpoint) + +Bruksområder for sanntids token-regnskap: +- **Budsjettovervåking:** Stopp før kostnadssprekk +- **Modellvalg:** "Flash har brukt 200k tokens uten resultat — eskaler" +- **Effektivitetsmåling:** Tokens per fullført oppgave per modell +- **Rapportering:** Vegard ser daglig/ukentlig forbruk per modellnivå +- **Orkestrator-input:** Claude Code kan lese stats og justere strategi + ### Eksperimentering med modellvalg synops-agent logger modell, oppgavetype, kostnad, tid og resultat