synops

vegard/synops

Fork 0

Commit graph

Author	SHA1	Message	Date
vegard	9768a24693	Fullfør oppgave 7.2: Transkripsjons-pipeline (CAS → Whisper → content) Implementerer komplett pipeline for automatisk transkripsjon av lydfiler: - PostgreSQL jobbkø (job_queue-tabell med status, retry, backoff) - Worker-loop i maskinrommet som poller hvert 2. sekund - Whisper-integrasjon: leser CAS-fil, sender multipart til faster-whisper API - Postprosessering: filtrerer hallusinerte segmenter (no_speech_prob > 0.6) - Oppdaterer media-nodens content-felt med transkripsjon og metadata - Automatisk trigger: upload_media enqueuer jobb for audio/*-filer Testet ende-til-ende på server: jobb plukkes opp, Whisper prosesserer, node oppdateres. Retry med eksponentiell backoff ved feil. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-17 17:44:54 +01:00
vegard	443f60a518	Fullfør oppgave 7.1: faster-whisper Docker-oppsett for norsk STT Satt opp faster-whisper-server (fedirz/faster-whisper-server:latest-cpu) som Docker-tjeneste på produksjonsserveren. Ingen GPU tilgjengelig — bruker CPU med int8-kvantisering og large-v3 modell for best norsk kvalitet. Verifisert: - Transkripsjon fungerer via OpenAI-kompatibelt API - verbose_json med segmenter og tidskoder OK - Docker DNS-oppslag fra sidelinja-net fungerer - Maskinrommet har WHISPER_URL=http://faster-whisper:8000 - RAM-bruk ~2.5 GB med modell lastet Konfigurasjon: - Image: fedirz/faster-whisper-server:latest-cpu - Modell: large-v3 (norsk), int8, CPU - CAS montert read-only for direkte filtilgang - Healthcheck via python3 (curl ikke tilgjengelig i image) Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>	2026-03-17 17:21:29 +01:00

Author

SHA1

Message

Date

vegard

9768a24693

Fullfør oppgave 7.2: Transkripsjons-pipeline (CAS → Whisper → content)

Implementerer komplett pipeline for automatisk transkripsjon av lydfiler:

- PostgreSQL jobbkø (job_queue-tabell med status, retry, backoff)
- Worker-loop i maskinrommet som poller hvert 2. sekund
- Whisper-integrasjon: leser CAS-fil, sender multipart til faster-whisper API
- Postprosessering: filtrerer hallusinerte segmenter (no_speech_prob > 0.6)
- Oppdaterer media-nodens content-felt med transkripsjon og metadata
- Automatisk trigger: upload_media enqueuer jobb for audio/*-filer

Testet ende-til-ende på server: jobb plukkes opp, Whisper prosesserer,
node oppdateres. Retry med eksponentiell backoff ved feil.

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>

2026-03-17 17:44:54 +01:00

vegard

443f60a518

Fullfør oppgave 7.1: faster-whisper Docker-oppsett for norsk STT

Satt opp faster-whisper-server (fedirz/faster-whisper-server:latest-cpu)
som Docker-tjeneste på produksjonsserveren. Ingen GPU tilgjengelig —
bruker CPU med int8-kvantisering og large-v3 modell for best norsk kvalitet.

Verifisert:
- Transkripsjon fungerer via OpenAI-kompatibelt API
- verbose_json med segmenter og tidskoder OK
- Docker DNS-oppslag fra sidelinja-net fungerer
- Maskinrommet har WHISPER_URL=http://faster-whisper:8000
- RAM-bruk ~2.5 GB med modell lastet

Konfigurasjon:
- Image: fedirz/faster-whisper-server:latest-cpu
- Modell: large-v3 (norsk), int8, CPU
- CAS montert read-only for direkte filtilgang
- Healthcheck via python3 (curl ikke tilgjengelig i image)

Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>

2026-03-17 17:21:29 +01:00

2 commits