Fullfører oppgave 18.2: AI-prosessering endepunkt

POST /intentions/ai_process med source_node_id, ai_preset_id og direction (node_to_tool / tool_to_node). Endepunktet validerer input, sjekker at kilde-node og AI-preset finnes, verifiserer skrivetilgang for tool_to_node-retning, og legger en ai_process-jobb i køen. Jobb-handleren (ai_process.rs) henter kilde-content og preset-prompt, mapper modellprofil → LiteLLM-alias (flash → sidelinja/rutine, standard → sidelinja/resonering), kaller AI Gateway, og logger forbruk i både ai_usage_log og resource_usage_log. Direction-logikk (opprett ny node vs. oppdater eksisterende) implementeres i oppgave 18.3. Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-18 06:24:31 +00:00 · 2026-03-18 06:24:31 +00:00 · bca0ff1deb
commit bca0ff1deb
parent 7224cf9897
6 changed files with 450 additions and 3 deletions
--- a/docs/features/ai_verktoy.md
+++ b/docs/features/ai_verktoy.md
@ -225,7 +225,7 @@ Flere AI-verktøy i serie: dra output fra "Oversett" videre til
 ### Fase A: Grunnleggende verktøy-panel
 - [x] AI-preset node-type (`node_kind: 'ai_preset'`) + metadata-skjema
 - [x] Standard-presets som seed-data (rens tekst, korrektør, oppsummering osv.)
- [ ] `POST /intentions/ai_process` endepunkt i maskinrommet
+- [x] `POST /intentions/ai_process` endepunkt i maskinrommet
 - [ ] Verktøy-panel UI med prompt-velger og modell-indikator
 - [ ] Jobbkø-integrasjon med AI Gateway
--- a/maskinrommet/src/ai_process.rs
+++ b/maskinrommet/src/ai_process.rs
@ -0,0 +1,314 @@
 // AI-prosessering — hent kilde-content + preset-prompt, kall AI Gateway.
 //
 // Jobbtype: "ai_process"
 // Payload: {
 //   "source_node_id": "<uuid>",
 //   "ai_preset_id": "<uuid>",
 //   "direction": "node_to_tool" | "tool_to_node",
 //   "requested_by": "<uuid>"
 // }
 //
 // Flyten:
 // 1. Hent kilde-node content fra PG
 // 2. Hent AI-preset prompt + modellprofil fra PG
 // 3. Map modellprofil → LiteLLM-alias (flash → sidelinja/rutine, standard → sidelinja/resonering)
 // 4. Send til AI Gateway (LiteLLM)
 // 5. Logg forbruk i ai_usage_log
 // 6. Returner AI-output (direction-logikk implementeres i oppgave 18.3)
 //
 // Ref: docs/features/ai_verktoy.md, docs/infra/ai_gateway.md
 use serde::{Deserialize, Serialize};
 use sqlx::PgPool;
 use uuid::Uuid;
 use crate::jobs::JobRow;
 use crate::resource_usage;
 #[derive(sqlx::FromRow)]
 struct SourceNodeRow {
    content: Option<String>,
    #[allow(dead_code)] // Brukes i oppgave 18.3 (direction-logikk)
    title: Option<String>,
    #[allow(dead_code)] // Brukes i oppgave 18.3 (direction-logikk)
    node_kind: String,
 }
 #[derive(sqlx::FromRow)]
 struct PresetRow {
    title: Option<String>,
    metadata: Option<serde_json::Value>,
 }
 /// OpenAI-kompatibel chat completion request.
 #[derive(Serialize)]
 struct ChatRequest {
    model: String,
    messages: Vec<ChatMessage>,
    temperature: f32,
 }
 #[derive(Serialize)]
 struct ChatMessage {
    role: String,
    content: String,
 }
 /// OpenAI-kompatibel chat completion response.
 #[derive(Deserialize)]
 struct ChatResponse {
    choices: Vec<Choice>,
    #[serde(default)]
    usage: Option<UsageInfo>,
    #[serde(default)]
    model: Option<String>,
 }
 #[derive(Deserialize, Clone)]
 struct UsageInfo {
    #[serde(default)]
    prompt_tokens: i64,
    #[serde(default)]
    completion_tokens: i64,
 }
 #[derive(Deserialize)]
 struct Choice {
    message: MessageContent,
 }
 #[derive(Deserialize)]
 struct MessageContent {
    content: Option<String>,
 }
 /// Mapper modellprofil til LiteLLM-alias.
 /// Ref: docs/features/ai_verktoy.md § 4, docs/infra/ai_gateway.md § 3.4
 fn model_profile_to_alias(profile: &str) -> &'static str {
    match profile {
        "flash" => "sidelinja/rutine",
        "standard" => "sidelinja/resonering",
        _ => "sidelinja/rutine", // fallback til billigste
    }
 }
 /// Håndterer ai_process-jobb.
 pub async fn handle_ai_process(
    job: &JobRow,
    db: &PgPool,
 ) -> Result<serde_json::Value, String> {
    let source_node_id: Uuid = job
        .payload
        .get("source_node_id")
        .and_then(|v| v.as_str())
        .and_then(|s| s.parse().ok())
        .ok_or("Mangler source_node_id i payload")?;
    let ai_preset_id: Uuid = job
        .payload
        .get("ai_preset_id")
        .and_then(|v| v.as_str())
        .and_then(|s| s.parse().ok())
        .ok_or("Mangler ai_preset_id i payload")?;
    let direction = job
        .payload
        .get("direction")
        .and_then(|v| v.as_str())
        .ok_or("Mangler direction i payload")?;
    let requested_by: Uuid = job
        .payload
        .get("requested_by")
        .and_then(|v| v.as_str())
        .and_then(|s| s.parse().ok())
        .ok_or("Mangler requested_by i payload")?;
    // 1. Hent kilde-node
    let source = sqlx::query_as::<_, SourceNodeRow>(
        "SELECT content, title, node_kind FROM nodes WHERE id = $1",
    )
    .bind(source_node_id)
    .fetch_optional(db)
    .await
    .map_err(|e| format!("PG-feil ved henting av kilde-node: {e}"))?
    .ok_or("Kilde-node finnes ikke")?;
    let source_content = source
        .content
        .filter(|c| !c.is_empty())
        .ok_or("Kilde-noden har ikke innhold å behandle")?;
    // 2. Hent AI-preset
    let preset = sqlx::query_as::<_, PresetRow>(
        "SELECT title, metadata FROM nodes WHERE id = $1 AND node_kind = 'ai_preset'",
    )
    .bind(ai_preset_id)
    .fetch_optional(db)
    .await
    .map_err(|e| format!("PG-feil ved henting av AI-preset: {e}"))?
    .ok_or("AI-preset finnes ikke")?;
    let metadata = preset
        .metadata
        .ok_or("AI-preset mangler metadata")?;
    let prompt = metadata
        .get("prompt")
        .and_then(|v| v.as_str())
        .ok_or("AI-preset mangler prompt i metadata")?;
    let model_profile = metadata
        .get("model_profile")
        .and_then(|v| v.as_str())
        .unwrap_or("flash");
    // 3. Map modellprofil → LiteLLM-alias
    let model_alias = model_profile_to_alias(model_profile);
    tracing::info!(
        source_node_id = %source_node_id,
        ai_preset_id = %ai_preset_id,
        direction = %direction,
        model_alias = %model_alias,
        preset_title = ?preset.title,
        source_content_len = source_content.len(),
        "Starter AI-prosessering"
    );
    // 4. Kall AI Gateway
    let (ai_output, usage, actual_model) =
        call_ai_gateway(model_alias, prompt, &source_content).await?;
    tracing::info!(
        source_node_id = %source_node_id,
        output_len = ai_output.len(),
        actual_model = ?actual_model,
        "AI-prosessering fullført"
    );
    // 5. Logg forbruk i ai_usage_log
    let collection_id = resource_usage::find_collection_for_node(db, source_node_id).await;
    let (tokens_in, tokens_out) = usage
        .as_ref()
        .map(|u| (u.prompt_tokens, u.completion_tokens))
        .unwrap_or((0, 0));
    let total_tokens = tokens_in + tokens_out;
    // ai_usage_log — detaljert AI-forbrukslogg
    if let Err(e) = sqlx::query(
        r#"
        INSERT INTO ai_usage_log
            (collection_node_id, job_id, model_alias, model_actual,
             prompt_tokens, completion_tokens, total_tokens, job_type)
        VALUES ($1, $2, $3, $4, $5, $6, $7, 'ai_process')
        "#,
    )
    .bind(collection_id)
    .bind(job.id)
    .bind(model_alias)
    .bind(actual_model.as_deref())
    .bind(tokens_in as i32)
    .bind(tokens_out as i32)
    .bind(total_tokens as i32)
    .execute(db)
    .await
    {
        tracing::warn!(error = %e, "Kunne ikke logge AI-forbruk i ai_usage_log");
    }
    // resource_usage_log — generell ressurslogging
    if let Err(e) = resource_usage::log(
        db,
        source_node_id,
        Some(requested_by),
        collection_id,
        "ai",
        serde_json::json!({
            "model_level": model_profile,
            "model_id": actual_model.unwrap_or_else(|| "unknown".to_string()),
            "model_alias": model_alias,
            "tokens_in": tokens_in,
            "tokens_out": tokens_out,
            "job_type": "ai_process",
            "preset_id": ai_preset_id.to_string(),
            "direction": direction
        }),
    )
    .await
    {
        tracing::warn!(error = %e, "Kunne ikke logge AI-ressursforbruk");
    }
    // 6. Returner resultat
    // Direction-logikk (opprett ny node / oppdater eksisterende) implementeres i oppgave 18.3
    Ok(serde_json::json!({
        "status": "completed",
        "source_node_id": source_node_id.to_string(),
        "ai_preset_id": ai_preset_id.to_string(),
        "direction": direction,
        "ai_output": ai_output,
        "tokens_in": tokens_in,
        "tokens_out": tokens_out,
        "total_tokens": total_tokens
    }))
 }
 /// Kall AI Gateway (LiteLLM) for tekstbehandling.
 /// Returnerer (output_text, usage, actual_model_name).
 async fn call_ai_gateway(
    model_alias: &str,
    system_prompt: &str,
    user_content: &str,
 ) -> Result<(String, Option<UsageInfo>, Option<String>), String> {
    let gateway_url = std::env::var("AI_GATEWAY_URL")
        .unwrap_or_else(|_| "http://localhost:4000".to_string());
    let api_key = std::env::var("LITELLM_MASTER_KEY").unwrap_or_default();
    let request = ChatRequest {
        model: model_alias.to_string(),
        messages: vec![
            ChatMessage {
                role: "system".to_string(),
                content: system_prompt.to_string(),
            },
            ChatMessage {
                role: "user".to_string(),
                content: user_content.to_string(),
            },
        ],
        temperature: 0.3,
    };
    let client = reqwest::Client::new();
    let url = format!("{gateway_url}/v1/chat/completions");
    let resp = client
        .post(&url)
        .header("Authorization", format!("Bearer {api_key}"))
        .header("Content-Type", "application/json")
        .json(&request)
        .timeout(std::time::Duration::from_secs(120))
        .send()
        .await
        .map_err(|e| format!("AI Gateway-kall feilet: {e}"))?;
    if !resp.status().is_success() {
        let status = resp.status();
        let body = resp.text().await.unwrap_or_default();
        return Err(format!("AI Gateway returnerte {status}: {body}"));
    }
    let chat_resp: ChatResponse = resp
        .json()
        .await
        .map_err(|e| format!("Kunne ikke parse AI Gateway-respons: {e}"))?;
    let content = chat_resp
        .choices
        .first()
        .and_then(|c| c.message.content.as_deref())
        .ok_or("AI Gateway returnerte ingen content")?;
    Ok((content.to_string(), chat_resp.usage, chat_resp.model))
 }
--- a/maskinrommet/src/intentions.rs
+++ b/maskinrommet/src/intentions.rs
@ -3228,6 +3228,134 @@ pub async fn summarize(
    Ok(Json(SummarizeResponse { job_id }))
 }
 // =============================================================================
 // POST /intentions/ai_process — AI-prosessering via AI Gateway
 // =============================================================================
 #[derive(Deserialize)]
 pub struct AiProcessRequest {
    /// Kilde-noden som skal prosesseres.
    pub source_node_id: Uuid,
    /// AI-preset som definerer prompt og modellprofil.
    pub ai_preset_id: Uuid,
    /// Retning: "node_to_tool" (opprett ny node) eller "tool_to_node" (modifiser in-place).
    pub direction: String,
 }
 #[derive(Serialize)]
 pub struct AiProcessResponse {
    pub job_id: Uuid,
 }
 /// POST /intentions/ai_process
 ///
 /// Legger en `ai_process`-jobb i køen.
 /// AI-prosesseringen skjer asynkront — kilde-content sendes til AI Gateway
 /// med preset-prompt, og forbruk logges i ai_usage_log.
 ///
 /// Direction-logikk (opprett ny node vs. oppdater eksisterende) implementeres
 /// i oppgave 18.3.
 ///
 /// Ref: docs/features/ai_verktoy.md § 6.1
 pub async fn ai_process(
    State(state): State<AppState>,
    user: AuthUser,
    Json(req): Json<AiProcessRequest>,
 ) -> Result<Json<AiProcessResponse>, (StatusCode, Json<ErrorResponse>)> {
    // Valider direction
    if req.direction != "node_to_tool" && req.direction != "tool_to_node" {
        return Err(bad_request(
            "direction må være 'node_to_tool' eller 'tool_to_node'",
        ));
    }
    // Sjekk at kilde-noden finnes
    let source_exists: bool = sqlx::query_scalar::<_, bool>(
        "SELECT EXISTS(SELECT 1 FROM nodes WHERE id = $1)",
    )
    .bind(req.source_node_id)
    .fetch_one(&state.db)
    .await
    .map_err(|e| {
        tracing::error!(error = %e, "PG-feil ved kilde-node-sjekk");
        internal_error("Databasefeil")
    })?;
    if !source_exists {
        return Err(bad_request("Kilde-node finnes ikke"));
    }
    // Sjekk at AI-preset finnes
    let preset_exists: bool = sqlx::query_scalar::<_, bool>(
        "SELECT EXISTS(SELECT 1 FROM nodes WHERE id = $1 AND node_kind = 'ai_preset')",
    )
    .bind(req.ai_preset_id)
    .fetch_one(&state.db)
    .await
    .map_err(|e| {
        tracing::error!(error = %e, "PG-feil ved preset-sjekk");
        internal_error("Databasefeil")
    })?;
    if !preset_exists {
        return Err(bad_request("AI-preset finnes ikke"));
    }
    // For tool_to_node-retning trengs skrivetilgang til kilde-noden
    if req.direction == "tool_to_node" {
        let can_modify = user_can_modify_node(&state.db, user.node_id, req.source_node_id)
            .await
            .map_err(|e| {
                tracing::error!(error = %e, "PG-feil ved tilgangssjekk");
                internal_error("Databasefeil")
            })?;
        if !can_modify {
            return Err(forbidden(
                "Ingen tilgang til å endre kilde-noden (tool_to_node krever skrivetilgang)",
            ));
        }
    }
    // Finn samlings-ID for kilde-noden (for prioritering)
    let collection_id = crate::resource_usage::find_collection_for_node(
        &state.db,
        req.source_node_id,
    )
    .await;
    let payload = serde_json::json!({
        "source_node_id": req.source_node_id.to_string(),
        "ai_preset_id": req.ai_preset_id.to_string(),
        "direction": req.direction,
        "requested_by": user.node_id.to_string()
    });
    let job_id = crate::jobs::enqueue(
        &state.db,
        "ai_process",
        payload,
        collection_id,
        5, // Medium prioritet
    )
    .await
    .map_err(|e| {
        tracing::error!(error = %e, "Kunne ikke legge ai_process-jobb i kø");
        internal_error("Kunne ikke starte AI-prosessering")
    })?;
    tracing::info!(
        job_id = %job_id,
        source_node_id = %req.source_node_id,
        ai_preset_id = %req.ai_preset_id,
        direction = %req.direction,
        user = %user.node_id,
        "ai_process-jobb lagt i kø"
    );
    Ok(Json(AiProcessResponse { job_id }))
 }
 // =============================================================================
 // POST /intentions/generate_tts — tekst-til-tale via ElevenLabs
 // =============================================================================
--- a/maskinrommet/src/jobs.rs
+++ b/maskinrommet/src/jobs.rs
@ -16,6 +16,7 @@ use uuid::Uuid;
 use crate::agent;
 use crate::ai_edges;
 use crate::ai_process;
 use crate::audio;
 use crate::cas::CasStore;
 use crate::maintenance::MaintenanceState;
@ -184,6 +185,9 @@ async fn dispatch(
        "audio_process" => {
            audio::handle_audio_process_job(job, db, stdb, cas).await
        }
        "ai_process" => {
            ai_process::handle_ai_process(job, db).await
        }
        "render_article" => {
            handle_render_article(job, db, cas).await
        }
--- a/maskinrommet/src/main.rs
+++ b/maskinrommet/src/main.rs
@ -1,6 +1,7 @@
 pub mod agent;
 pub mod ai_admin;
 pub mod ai_edges;
 pub mod ai_process;
 pub mod audio;
 pub mod bandwidth;
 mod auth;
@ -202,6 +203,7 @@ async fn main() {
        .route("/intentions/retranscribe", post(intentions::retranscribe))
        .route("/intentions/resolve_retranscription", post(intentions::resolve_retranscription))
        .route("/intentions/summarize", post(intentions::summarize))
        .route("/intentions/ai_process", post(intentions::ai_process))
        .route("/intentions/generate_tts", post(intentions::generate_tts))
        .route("/intentions/join_communication", post(intentions::join_communication))
        .route("/intentions/leave_communication", post(intentions::leave_communication))
--- a/tasks.md
+++ b/tasks.md
@ -202,8 +202,7 @@ Ref: Kodegjennomgang av `b4c4bb8` (Lydstudio: lydredigering via FFmpeg).
 Ref: `docs/features/ai_verktoy.md`, `docs/retninger/arbeidsflaten.md`
 - [x] 18.1 AI-preset node-type: `node_kind: 'ai_preset'` med metadata (prompt, model_profile, category, icon, color). Maskinrommet validerer ved opprettelse. Seed standardprompter (rens tekst, korrektør, oppsummering, oversett, skriv om, trekk ut fakta, forenkle, endre tone).
- [~] 18.2 AI-prosessering endepunkt: `POST /intentions/ai_process` med source_node_id, ai_preset_id, direction (node_to_tool / tool_to_node). Maskinrommet henter kilde-content og preset-prompt, mapper modellprofil → LiteLLM-alias, sender til AI Gateway. Logg forbruk i ai_usage_log.
+- [x] 18.2 AI-prosessering endepunkt: `POST /intentions/ai_process` med source_node_id, ai_preset_id, direction (node_to_tool / tool_to_node). Maskinrommet henter kilde-content og preset-prompt, mapper modellprofil → LiteLLM-alias, sender til AI Gateway. Logg forbruk i ai_usage_log.
  > Påbegynt: 2026-03-18T06:14
 - [ ] 18.3 Direction-logikk: `tool_to_node` → lagre original som revisjon, oppdater node content. `node_to_tool` → opprett ny node med AI-output, opprett `derived_from`-edge til kilde + `processed_by`-edge til AI-preset.
 - [ ] 18.4 AI-verktøy panel (frontend): Svelte-komponent for arbeidsflaten. Prompt-velger med standardprompter, fritekst-felt for egendefinert prompt, modell-indikator (readonly). Drag-and-drop mottak for tekstnoder.
 - [ ] 18.5 Drag-and-drop integrasjon: node → verktøy (ny node), verktøy → node (in-place revisjon). Drop-sone feedback med verktøyets farge. Inkompatibilitet for lyd/bilde-noder med forklaring.