synops/config/litellm/config.yaml
vegard 01ad35557f LiteLLM AI Gateway: Docker, DB-ruting, config-generering (oppgave 10.1)
Setter opp AI Gateway med LiteLLM som sentralisert proxy for alle
AI-kall. PG eier all modellkonfigurasjon — LiteLLM er stateløs.

- Migrasjon 008: ai_model_aliases, ai_model_providers, ai_job_routing
  med seed-data for sidelinja/rutine og sidelinja/resonering
- Config-generering fra PG: scripts/generate-litellm-config.sh
  filtrerer bort providers med tomme API-nøkler
- Docker-container kjører på sidelinja-net (intern, ingen eksponert port)
- Maskinrommet har AI_GATEWAY_URL via maskinrommet-env.sh
- API-nøkkel-placeholders i .env (GEMINI, ANTHROPIC, XAI)
- Oppdatert docs/infra/ai_gateway.md med faktisk config

Verifisert: container healthy, modellaliaser eksponert, maskinrommet
har korrekt gateway-URL. Reelle API-kall krever at Vegard fyller
inn leverandør-nøkler i /srv/synops/.env.

Co-Authored-By: Claude Opus 4.6 (1M context) <noreply@anthropic.com>
2026-03-17 23:12:46 +00:00

42 lines
1.2 KiB
YAML

# LiteLLM config — GENERERT FIL
#
# Denne filen genereres fra PostgreSQL-tabellene ai_model_aliases
# og ai_model_providers. Rediger ikke manuelt — bruk admin-panelet
# eller kjør scripts/generate-litellm-config.sh.
#
# Bare providers med gyldige API-nøkler i .env inkluderes.
# Fyll inn GEMINI_API_KEY, ANTHROPIC_API_KEY, XAI_API_KEY i
# /srv/synops/.env for å aktivere flere leverandører.
model_list:
# === sidelinja/resonering ===
- model_name: "sidelinja/resonering"
litellm_params:
model: "openrouter/anthropic/claude-sonnet-4"
api_key: "os.environ/OPENROUTER_API_KEY"
model_info:
priority: 1
- model_name: "sidelinja/resonering"
litellm_params:
model: "openrouter/google/gemini-2.5-flash"
api_key: "os.environ/OPENROUTER_API_KEY"
model_info:
priority: 2
# === sidelinja/rutine ===
- model_name: "sidelinja/rutine"
litellm_params:
model: "openrouter/google/gemini-2.5-flash"
api_key: "os.environ/OPENROUTER_API_KEY"
model_info:
priority: 4
router_settings:
routing_strategy: "simple-shuffle"
num_retries: 3
timeout: 60
allowed_fails: 1
retry_after: 5
enable_pre_call_checks: true
general_settings:
master_key: "os.environ/LITELLM_MASTER_KEY"