saferpage-crawler.timer · 30min after previous unit activation · RandomizedDelay 8min
Persistent: ja · Start nach Boot: 10min
Crawler Timer Runner
Crawler-Timer-Runner: systemd alle 30 Minuten, maximal 8 Hosts pro Lauf, 724 DACH-/DE-Checks, Queue 596, letzter Batch 8 Host(s), Fehlerquote 2,97%.
Dieser Nachweis zeigt Timervertrag, Runner-State, Queue, letzte Reports und Betriebsregeln. Er veroeffentlicht keine Secrets, keine internen IPs, keine Rohpayloads und keine personenbezogenen Besucherlogs.
Seedquelle
Versioned DACH seed file plus recent public checks; bounded timer batch keeps discovery controlled.
Timer-Vertrag
Der öffentliche Nachweis beschreibt den Deploy-Vertrag; Live-Timerstatus wird auf dem Server per systemctl geprüft, nicht aus PHP heraus ausgeführt.
saferpage-crawler.timer · 30min after previous unit activation · RandomizedDelay 8min
Persistent: ja · Start nach Boot: 10min
saferpage-crawler.service
python3 scripts/crawl-german-sites.py --from-recent --seed-file config/dach-seed-domains.txt --refresh-days 7 --refresh-limit 2000 --max 8 --concurrency 2 --timeout 90 --delay 1
Nice=10 und IO-Scheduling im systemd-Service; kleine Batches statt breiter Crawls.
Headless Chromium nur fuer Screenshot-, Cookie-, Storage- und Consent-Nachweise, nicht fuer jeden Link blind.
SaferPageCrawler/0.3 (+https://saferpage.de/bot; schedules passive DACH website checks; report examples: https://saferpage.de/tests)
SaferPageCrawler respektiert robots.txt; Betreiber finden Opt-out und Zweck unter /bot.
Readiness-Gates
Die lokale Crawler-API liefert Queue, Laufhistorie und Fehlerstatus.
finished_at=2026-06-09T22:34:41+00:00
saferpage-crawler.timer: OnBootSec=10min, OnUnitActiveSec=30min, RandomizedDelaySec=8min, Persistent=true.
max=8, concurrency=2, timeout=90s.
config/dach-seed-domains.txt: 86 Host(s), 0 neu in der Queue.
SaferPageCrawler/0.3 (+https://saferpage.de/bot; schedules passive DACH website checks; report examples: https://saferpage.de/tests)
Runner nutzt einen eigenen SaferPageCrawler und dokumentiert Opt-out unter /bot und /crawler.
2,97% bei 29 Fehlern.
596 Hosts in der Queue.
36 direkte Kurz-URL-Links im Export.
Der Timer-Runner-Export enthält Betriebsdaten, Reportlinks und Runbook, aber keine Secrets oder Besucherlogs.
Letzter Lauf
Der Ausbau bleibt kontrolliert: zuerst Evidence prüfen, dann Seeds erweitern, dann erst Lastgrenzen ändern.
Diese Signale stoppen Seed-Ausbau, Parallelitätserhöhung oder produktive Crawl-Ausweitung.
Zuletzt geprüft
Die Links führen direkt zur kanonischen Kurz-URL des jeweiligen Reports.
Nur mit Vorsicht nutzen
09.06.2026 23:06 UTCNur mit Vorsicht nutzen
09.06.2026 23:06 UTCNur mit Vorsicht nutzen
09.06.2026 23:06 UTCNur mit Vorsicht nutzen
09.06.2026 23:02 UTCNur mit Vorsicht nutzen
09.06.2026 23:02 UTCNur mit Vorsicht nutzen
09.06.2026 23:02 UTCNur mit Vorsicht nutzen
09.06.2026 23:01 UTCNur mit Vorsicht nutzen
09.06.2026 23:01 UTCNur mit Vorsicht nutzen
09.06.2026 23:01 UTCNur mit Vorsicht nutzen
09.06.2026 23:01 UTCNur mit Vorsicht nutzen
09.06.2026 23:01 UTCNur mit Vorsicht nutzen
09.06.2026 23:01 UTCNur mit Vorsicht nutzen
09.06.2026 23:01 UTCNur mit Vorsicht nutzen
09.06.2026 23:01 UTCNur mit Vorsicht nutzen
09.06.2026 23:01 UTCNur mit Vorsicht nutzen
09.06.2026 23:00 UTCNur mit Vorsicht nutzen
09.06.2026 23:00 UTCNur mit Vorsicht nutzen
09.06.2026 23:00 UTCNur mit Vorsicht nutzen
09.06.2026 23:00 UTCNur mit Vorsicht nutzen
09.06.2026 23:00 UTCNur mit Vorsicht nutzen
09.06.2026 23:00 UTCNur mit Vorsicht nutzen
09.06.2026 23:00 UTCNur mit Vorsicht nutzen
09.06.2026 22:55 UTCNur mit Vorsicht nutzen
09.06.2026 22:55 UTCQueue