Implementer Adaptive Context Compaction (ACC) i synops-agent

Automatisk kontekstkomprimering når meldingshistorikken nærmer seg kontekstvinduets grense. Bruker prompt_tokens fra API-respons som kalibreringsanker. - Ny context.rs-modul med to kompaksjonsnivåer: - Moderat (>70%): trunkerer gamle tool-resultater - Aggressiv (>85%): kollapser eldre historikk til oppsummering - Siste 5 meldinger bevares alltid urørt - context_window() på LlmProvider-trait med automatisk estimering - 5 enhetstester for kompaksjonslogikk
2026-03-19 18:07:51 +00:00 · 2026-03-19 18:07:51 +00:00 · 703a0addca
commit 703a0addca
parent 6099d0b209
3 changed files with 417 additions and 0 deletions
--- a/tools/synops-agent/src/context.rs
+++ b/tools/synops-agent/src/context.rs
@ -0,0 +1,385 @@
+//! Adaptive Context Compaction (ACC).
+//!
+//! Monitors token usage and compresses message history when approaching
+//! the model's context window limit. Two compaction levels:
+//!
+//! - **Moderate** (>70% capacity): Summarize old tool results
+//! - **Aggressive** (>85% capacity): Summarize entire older history
+//!
+//! The last N messages are always preserved untouched.
+//! Uses `prompt_tokens` from API responses as the calibration anchor.
+
+use crate::provider::Message;
+
+/// Configuration for context compaction.
+#[derive(Debug, Clone)]
+pub struct CompactionConfig {
+    /// Context window size in tokens for the current model.
+    pub context_window: u64,
+    /// Threshold for moderate compaction (fraction, e.g. 0.70).
+    pub moderate_threshold: f64,
+    /// Threshold for aggressive compaction (fraction, e.g. 0.85).
+    pub aggressive_threshold: f64,
+    /// Number of recent messages to always preserve.
+    pub preserve_recent: usize,
+}
+
+impl Default for CompactionConfig {
+    fn default() -> Self {
+        Self {
+            context_window: 128_000,
+            moderate_threshold: 0.70,
+            aggressive_threshold: 0.85,
+            preserve_recent: 5,
+        }
+    }
+}
+
+/// Result of a compaction check.
+#[derive(Debug, PartialEq)]
+pub enum CompactionLevel {
+    /// Under threshold — no action needed.
+    None,
+    /// >70% — summarize old tool results.
+    Moderate,
+    /// >85% — aggressively summarize entire older history.
+    Aggressive,
+}
+
+/// Check what compaction level is needed based on current prompt_tokens.
+pub fn check_compaction_level(prompt_tokens: u64, config: &CompactionConfig) -> CompactionLevel {
+    let ratio = prompt_tokens as f64 / config.context_window as f64;
+    if ratio >= config.aggressive_threshold {
+        CompactionLevel::Aggressive
+    } else if ratio >= config.moderate_threshold {
+        CompactionLevel::Moderate
+    } else {
+        CompactionLevel::None
+    }
+}
+
+/// Apply compaction to the message history.
+///
+/// Modifies `messages` in-place. The system message (index 0) and
+/// the last `preserve_recent` messages are never touched.
+///
+/// Returns true if any compaction was performed.
+pub fn compact_messages(
+    messages: &mut Vec<Message>,
+    level: CompactionLevel,
+    config: &CompactionConfig,
+) -> bool {
+    if level == CompactionLevel::None {
+        return false;
+    }
+
+    // We need at least: system + user + some history + preserved tail
+    // system is at index 0, user task at index 1
+    let fixed_prefix = 2; // system + initial user message
+    let total = messages.len();
+
+    if total <= fixed_prefix + config.preserve_recent {
+        // Not enough messages to compact
+        return false;
+    }
+
+    let compactable_end = total - config.preserve_recent;
+
+    match level {
+        CompactionLevel::Moderate => {
+            compact_tool_results(messages, fixed_prefix, compactable_end)
+        }
+        CompactionLevel::Aggressive => {
+            compact_history_aggressive(messages, fixed_prefix, compactable_end)
+        }
+        CompactionLevel::None => false,
+    }
+}
+
+/// Moderate compaction: replace tool result contents with short summaries.
+/// Keeps assistant messages and their tool_calls intact, but truncates
+/// the tool response bodies.
+fn compact_tool_results(
+    messages: &mut Vec<Message>,
+    start: usize,
+    end: usize,
+) -> bool {
+    let mut compacted = false;
+
+    for i in start..end {
+        if messages[i].role == "tool" {
+            if let Some(ref content) = messages[i].content {
+                if content.len() > 200 {
+                    // Keep first 150 chars + note
+                    let preview = &content[..content.len().min(150)];
+                    messages[i].content = Some(format!(
+                        "[compacted] {}... ({} bytes omitted)",
+                        preview,
+                        content.len() - 150
+                    ));
+                    compacted = true;
+                }
+            }
+        }
+    }
+
+    if compacted {
+        tracing::info!("ACC: moderate compaction — truncated old tool results");
+    }
+
+    compacted
+}
+
+/// Aggressive compaction: replace the entire compactable range with a
+/// single summary message. This collapses all old assistant/tool
+/// exchanges into one user message that describes what happened.
+fn compact_history_aggressive(
+    messages: &mut Vec<Message>,
+    start: usize,
+    end: usize,
+) -> bool {
+    if end <= start {
+        return false;
+    }
+
+    // Build a summary of what happened in the compacted range
+    let mut summary_parts: Vec<String> = Vec::new();
+    let mut tool_calls_seen: Vec<String> = Vec::new();
+    let mut assistant_snippets: Vec<String> = Vec::new();
+
+    for msg in &messages[start..end] {
+        match msg.role.as_str() {
+            "assistant" => {
+                if let Some(ref tc) = msg.tool_calls {
+                    for call in tc {
+                        tool_calls_seen.push(call.function.name.clone());
+                    }
+                }
+                if let Some(ref text) = msg.content {
+                    if !text.is_empty() {
+                        let snippet = if text.len() > 100 {
+                            format!("{}...", &text[..100])
+                        } else {
+                            text.clone()
+                        };
+                        assistant_snippets.push(snippet);
+                    }
+                }
+            }
+            "tool" => {
+                // Already captured via tool_calls on assistant
+            }
+            _ => {}
+        }
+    }
+
+    if !tool_calls_seen.is_empty() {
+        summary_parts.push(format!(
+            "Tools used: {}",
+            tool_calls_seen.join(", ")
+        ));
+    }
+    if !assistant_snippets.is_empty() {
+        let max_snippets = assistant_snippets.len().min(5);
+        summary_parts.push(format!(
+            "Key outputs:\n{}",
+            assistant_snippets[..max_snippets].join("\n- ")
+        ));
+    }
+
+    let summary = if summary_parts.is_empty() {
+        "[compacted] Previous conversation history was summarized to save context.".to_string()
+    } else {
+        format!(
+            "[compacted] Previous conversation summary ({} messages compressed):\n{}",
+            end - start,
+            summary_parts.join("\n")
+        )
+    };
+
+    // Replace the range [start..end) with a single summary message
+    let preserved_tail: Vec<Message> = messages.drain(end..).collect();
+    messages.truncate(start);
+    messages.push(Message {
+        role: "user".into(),
+        content: Some(summary),
+        tool_calls: None,
+        tool_call_id: None,
+    });
+    messages.extend(preserved_tail);
+
+    tracing::info!(
+        removed = end - start,
+        "ACC: aggressive compaction — collapsed old history into summary"
+    );
+
+    true
+}
+
+/// Estimate context window size from model name.
+/// Returns a conservative estimate if unknown.
+pub fn estimate_context_window(model: &str) -> u64 {
+    let m = model.to_lowercase();
+
+    // Anthropic
+    if m.contains("claude") {
+        if m.contains("opus") || m.contains("sonnet") || m.contains("haiku") {
+            return 200_000;
+        }
+        return 200_000;
+    }
+
+    // Google Gemini
+    if m.contains("gemini") {
+        if m.contains("flash") || m.contains("pro") {
+            return 1_000_000;
+        }
+        return 1_000_000;
+    }
+
+    // Grok
+    if m.contains("grok") {
+        return 131_072;
+    }
+
+    // OpenAI
+    if m.contains("gpt-4o") || m.contains("gpt-4-turbo") {
+        return 128_000;
+    }
+    if m.contains("gpt-4") {
+        return 8_192;
+    }
+    if m.contains("o1") || m.contains("o3") || m.contains("o4") {
+        return 200_000;
+    }
+
+    // Llama / local
+    if m.contains("llama") {
+        return 128_000;
+    }
+
+    // Conservative default
+    128_000
+}
+
+#[cfg(test)]
+mod tests {
+    use super::*;
+
+    fn make_msg(role: &str, content: &str) -> Message {
+        Message {
+            role: role.into(),
+            content: Some(content.into()),
+            tool_calls: None,
+            tool_call_id: None,
+        }
+    }
+
+    #[test]
+    fn test_compaction_level() {
+        let config = CompactionConfig {
+            context_window: 100_000,
+            ..Default::default()
+        };
+
+        assert_eq!(
+            check_compaction_level(50_000, &config),
+            CompactionLevel::None
+        );
+        assert_eq!(
+            check_compaction_level(75_000, &config),
+            CompactionLevel::Moderate
+        );
+        assert_eq!(
+            check_compaction_level(90_000, &config),
+            CompactionLevel::Aggressive
+        );
+    }
+
+    #[test]
+    fn test_moderate_compaction_truncates_tool_results() {
+        let long_output = "x".repeat(500);
+        let mut messages = vec![
+            make_msg("system", "system prompt"),
+            make_msg("user", "do something"),
+            make_msg("assistant", "I'll read the file"),
+            Message {
+                role: "tool".into(),
+                content: Some(long_output),
+                tool_calls: None,
+                tool_call_id: Some("call_1".into()),
+            },
+            make_msg("assistant", "recent 1"),
+            make_msg("user", "recent 2"),
+        ];
+
+        let config = CompactionConfig {
+            preserve_recent: 2,
+            ..Default::default()
+        };
+
+        let compacted = compact_messages(&mut messages, CompactionLevel::Moderate, &config);
+        assert!(compacted);
+        assert!(messages[3].content.as_ref().unwrap().starts_with("[compacted]"));
+        assert_eq!(messages.len(), 6); // same count, just truncated
+    }
+
+    #[test]
+    fn test_aggressive_compaction_collapses_history() {
+        let mut messages = vec![
+            make_msg("system", "system prompt"),
+            make_msg("user", "do something"),
+            make_msg("assistant", "step 1"),
+            make_msg("tool", "result 1"),
+            make_msg("assistant", "step 2"),
+            make_msg("tool", "result 2"),
+            make_msg("assistant", "step 3"),
+            make_msg("tool", "result 3"),
+            // These should be preserved:
+            make_msg("assistant", "recent assistant"),
+            make_msg("user", "recent user"),
+        ];
+
+        let config = CompactionConfig {
+            preserve_recent: 2,
+            ..Default::default()
+        };
+
+        let compacted = compact_messages(&mut messages, CompactionLevel::Aggressive, &config);
+        assert!(compacted);
+        // system + user + summary + 2 preserved = 5
+        assert_eq!(messages.len(), 5);
+        assert_eq!(messages[0].role, "system");
+        assert_eq!(messages[1].role, "user");
+        assert!(messages[2].content.as_ref().unwrap().contains("[compacted]"));
+        assert_eq!(messages[3].content.as_deref(), Some("recent assistant"));
+        assert_eq!(messages[4].content.as_deref(), Some("recent user"));
+    }
+
+    #[test]
+    fn test_no_compaction_when_too_few_messages() {
+        let mut messages = vec![
+            make_msg("system", "sys"),
+            make_msg("user", "task"),
+            make_msg("assistant", "done"),
+        ];
+
+        let config = CompactionConfig {
+            preserve_recent: 3,
+            ..Default::default()
+        };
+
+        let compacted = compact_messages(&mut messages, CompactionLevel::Aggressive, &config);
+        assert!(!compacted);
+        assert_eq!(messages.len(), 3);
+    }
+
+    #[test]
+    fn test_estimate_context_window() {
+        assert_eq!(estimate_context_window("claude-sonnet-4"), 200_000);
+        assert_eq!(estimate_context_window("gemini-2.5-flash"), 1_000_000);
+        assert_eq!(estimate_context_window("grok-3"), 131_072);
+        assert_eq!(estimate_context_window("gpt-4o"), 128_000);
+        assert_eq!(estimate_context_window("unknown-model"), 128_000);
+    }
+}
--- a/tools/synops-agent/src/main.rs
+++ b/tools/synops-agent/src/main.rs
@ -8,10 +8,12 @@
 //!   synops-agent --model gemini/gemini-2.5-flash --task "oppsummer denne filen"
 //!   synops-agent --model ollama/llama3 --task "skriv en test"

+mod context;
 mod provider;
 mod tools;

 use clap::Parser;
+use context::{CompactionConfig, CompactionLevel, check_compaction_level, compact_messages};
 use provider::{ApiKeys, CompletionResponse, Message, TokenUsage, create_provider};
 use std::collections::HashMap;
 use std::path::PathBuf;
@ -98,6 +100,16 @@ async fn main() -> Result<(), Box<dyn std::error::Error>> {
    let mut total_usage: HashMap<String, TokenUsage> = HashMap::new();
    let mut iteration = 0;

+    // Context compaction config
+    let compaction_config = CompactionConfig {
+        context_window: provider.context_window(),
+        ..Default::default()
+    };
+    tracing::info!(
+        context_window = compaction_config.context_window,
+        "ACC konfigurert"
+    );
+
    // === Agent loop ===
    loop {
        iteration += 1;
@ -125,6 +137,21 @@ async fn main() -> Result<(), Box<dyn std::error::Error>> {
            );
        }

+        // === Adaptive Context Compaction ===
+        // Use prompt_tokens from the API response as calibration anchor
+        let level = check_compaction_level(response.usage.input_tokens, &compaction_config);
+        if level != CompactionLevel::None {
+            let ratio = response.usage.input_tokens as f64 / compaction_config.context_window as f64;
+            tracing::warn!(
+                prompt_tokens = response.usage.input_tokens,
+                context_window = compaction_config.context_window,
+                ratio = format!("{:.1}%", ratio * 100.0),
+                level = ?level,
+                "ACC: kontekstkomprimering trigget"
+            );
+            compact_messages(&mut messages, level, &compaction_config);
+        }
+
        // Check for tool calls
        let has_tool_calls = response
            .message
--- a/tools/synops-agent/src/provider.rs
+++ b/tools/synops-agent/src/provider.rs
@ -79,6 +79,11 @@ pub trait LlmProvider: Send + Sync {

    /// Model identifier
    fn model_id(&self) -> &str;
+
+    /// Context window size in tokens.
+    fn context_window(&self) -> u64 {
+        crate::context::estimate_context_window(self.model_id())
+    }
 }

 #[derive(Debug, thiserror::Error)]