synops

Author	SHA1	Message	Date
vegard	bd12bed77e	Implementer synops-transcribe CLI-verktøy (oppgave 21.1) Bryter ut Whisper-transkribering fra maskinrommet til selvstendig CLI-verktøy i tools/synops-transcribe/, i tråd med unix-filosofien. Verktøyet: - Leser lydfil fra CAS, sender til faster-whisper API (SRT-format) - Parser SRT til segmenter, skriver JSON til stdout - Med --write: skriver segmenter til PG, oppdaterer node metadata, logger ressursforbruk - Støtter --cas-hash, --model, --initial-prompt, --language, --mime, --node-id, --requested-by Maskinrommet sin transcribe.rs er nå en tynn dispatcher som spawner synops-transcribe som subprosess med riktige env-variabler. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 09:01:06 +00:00
vegard	eb81055ef4	Fullfører oppgave 15.7: Ressursforbruk-logging Sentralisert logging av alle ressurskrevende operasjoner til resource_usage_log-tabellen (opprettet i migrasjon 009). Ny kode: - resource_usage.rs: hjelpemodul med log() og find_collection_for_node() - bandwidth.rs: Caddy JSON-logg-parser med nattlig batch-jobb (kl 03:00) Logging lagt til i handlere: - AI: summarize, ai_edges (token-telling via LiteLLM usage-felt), agent (placeholder — claude CLI gir ikke token-info) - Whisper: duration_seconds, model, language, mode - TTS: refaktorert til sentralisert modul, lagt til collection_id - CAS: logger nye filer ved upload (ikke dedup) - LiveKit: logger join-hendelser (faktisk deltaker-minutter krever webhook-integrasjon i fremtiden) Caddy-config: JSON access logging aktivert for sidelinja.org og synops.no i /srv/synops/config/caddy/Caddyfile (utenfor repo). Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>	2026-03-18 04:24:54 +00:00
vegard	7eae02eeb5	Fullfør oppgave 7.5: Segmenttabell-migrasjon og SRT-pipeline Oppretter transcription_segments-tabellen i PostgreSQL som master-kopi for alle transkripsjoner. transcribe.rs er oppdatert fra verbose_json til SRT-format med full parse → segment-innsetting pipeline. Endringer: - Migration 005: transcription_segments med GIN fulltekstsøk (norsk) - transcribe.rs: SRT-parser, segment-innsetting, node-oppdatering - Miljøvariabler: WHISPER_MODEL (default "medium"), WHISPER_INITIAL_PROMPT - Docker-compose: nye env vars for maskinrommet-containeren - Docs: oppdatert podcastfabrikken, arkitektur, primitiver, CLAUDE.md Tabellen kjørt på server, maskinrommet restartet med nye env vars. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-17 18:19:00 +01:00
vegard	9768a24693	Fullfør oppgave 7.2: Transkripsjons-pipeline (CAS → Whisper → content) Implementerer komplett pipeline for automatisk transkripsjon av lydfiler: - PostgreSQL jobbkø (job_queue-tabell med status, retry, backoff) - Worker-loop i maskinrommet som poller hvert 2. sekund - Whisper-integrasjon: leser CAS-fil, sender multipart til faster-whisper API - Postprosessering: filtrerer hallusinerte segmenter (no_speech_prob > 0.6) - Oppdaterer media-nodens content-felt med transkripsjon og metadata - Automatisk trigger: upload_media enqueuer jobb for audio/*-filer Testet ende-til-ende på server: jobb plukkes opp, Whisper prosesserer, node oppdateres. Retry med eksponentiell backoff ved feil. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-17 17:44:54 +01:00

4 commits