Synops — redaksjonelt OS og kunnskapsgraf
Find a file
vegard 5dead5dac9 synops-clip: CLI for web article extraction (oppgave 25.1)
Nytt verktøy som henter og parser webartikler til ren tekst + metadata.
Bruker Mozilla Readability (via Node.js) for artikkelekstraksjon, med
Playwright som fallback for JS-rendrede sider.

Arkitektur:
- Rust CLI (clap, reqwest) håndterer HTTP-henting, paywall-deteksjon, JSON-output
- Node.js-hjelpeskript (readability.mjs) bruker @mozilla/readability + jsdom
- Playwright-script (playwright.mjs) for headless browser-fallback
- Støtter --payload-json for maskinrommet/jobbkø-integrasjon

Paywall-deteksjon basert på:
- Kort innhold (<200 tegn)
- Norske/engelske paywall-fraser i innholdet
- CSS-klasser/HTML-attributter (piano, schibsted, amedia, etc.)
- Schema.org isAccessibleForFree meta-tagg

Output: JSON med title, author, date, content, url, paywall, excerpt, source
2026-03-18 18:24:22 +00:00
config Opprydding: arkiver STDB-docs, fjern Caddy-konfig, rydd referanser (oppgave 22.5) 2026-03-18 13:45:30 +00:00
docs Seed-orkestreringer og flerords-verbstøtte (oppgave 24.9) 2026-03-18 18:11:02 +00:00
frontend AI-assistert oppretting: synops-ai genererer orkestreringsscript fra fritekst (oppgave 24.7) 2026-03-18 17:47:32 +00:00
logs Validering 23.1: fase 1–2 (infra + maskinrommet) verifisert 2026-03-18 13:58:50 +00:00
maskinrommet Seed-orkestreringer og flerords-verbstøtte (oppgave 24.9) 2026-03-18 18:11:02 +00:00
migrations Seed-orkestreringer og flerords-verbstøtte (oppgave 24.9) 2026-03-18 18:11:02 +00:00
ops Fjern SpacetimeDB komplett (oppgave 22.4) 2026-03-18 13:39:09 +00:00
reference Fjern SpacetimeDB komplett (oppgave 22.4) 2026-03-18 13:39:09 +00:00
scripts Legg til fase 30: komplett podcast-hosting uten ekstern avhengighet 2026-03-18 17:59:59 +00:00
tools synops-clip: CLI for web article extraction (oppgave 25.1) 2026-03-18 18:24:22 +00:00
.env.example Fjern SpacetimeDB komplett (oppgave 22.4) 2026-03-18 13:39:09 +00:00
.gitignore Synops v2: arkitektur, retninger og dokumentasjon 2026-03-17 06:43:08 +01:00
CLAUDE.md Opprydding: arkiver STDB-docs, fjern Caddy-konfig, rydd referanser (oppgave 22.5) 2026-03-18 13:45:30 +00:00
tasks.md synops-clip: CLI for web article extraction (oppgave 25.1) 2026-03-18 18:24:22 +00:00