Implementerer komplett pipeline for automatisk transkripsjon av lydfiler: - PostgreSQL jobbkø (job_queue-tabell med status, retry, backoff) - Worker-loop i maskinrommet som poller hvert 2. sekund - Whisper-integrasjon: leser CAS-fil, sender multipart til faster-whisper API - Postprosessering: filtrerer hallusinerte segmenter (no_speech_prob > 0.6) - Oppdaterer media-nodens content-felt med transkripsjon og metadata - Automatisk trigger: upload_media enqueuer jobb for audio/*-filer Testet ende-til-ende på server: jobb plukkes opp, Whisper prosesserer, node oppdateres. Retry med eksponentiell backoff ved feil. Co-Authored-By: Claude Opus 4.6 <noreply@anthropic.com>
21 lines
829 B
TOML
21 lines
829 B
TOML
[package]
|
|
name = "maskinrommet"
|
|
version = "0.1.0"
|
|
edition = "2024"
|
|
|
|
[dependencies]
|
|
axum = { version = "0.8", features = ["multipart"] }
|
|
tokio = { version = "1", features = ["full"] }
|
|
sqlx = { version = "0.8", features = ["runtime-tokio", "tls-rustls", "postgres", "uuid", "chrono", "json"] }
|
|
serde = { version = "1", features = ["derive"] }
|
|
serde_json = "1"
|
|
uuid = { version = "1", features = ["v7", "serde"] }
|
|
chrono = { version = "0.4", features = ["serde"] }
|
|
tracing = "0.1"
|
|
tracing-subscriber = { version = "0.3", features = ["env-filter", "json"] }
|
|
tower-http = { version = "0.6", features = ["cors", "trace"] }
|
|
jsonwebtoken = "9"
|
|
reqwest = { version = "0.12", default-features = false, features = ["rustls-tls", "json", "multipart", "stream"] }
|
|
sha2 = "0.10"
|
|
hex = "0.4"
|
|
tokio-util = { version = "0.7", features = ["io"] }
|