✓ Verified 🌐 Web Scrapers ✓ Enhanced Data

Tageblatt Headlines

Download and archive daily Schlagzeilen from https://www.tageblatt.de/.

Rating
4.8 (42 reviews)
Downloads
8,172 downloads
Version
1.0.0

Overview

Download and archive daily Schlagzeilen from https://www.tageblatt.de/.

Complete Documentation

View Source →

Tageblatt Headlines

Überblick

Dieses Skill-Paket lädt die Startseite von tageblatt.de, extrahiert die sichtbaren Artikelüberschriften (

), bereinigt sie und speichert sie lokal als Text- oder JSON-Datei. Nutze es für Ad-hoc-Abfragen ("Schlagzeilen jetzt"), tägliche Archive oder automatisierte Benachrichtigungen.

Quick Start

  • Headlines ziehen
bash
python3 skills/tageblatt-headlines/scripts/fetch_headlines.py \
     --limit 15 \
     --output data/tageblatt/$(date +%Y-%m-%d)_headlines.txt
  • JSON statt Text (falls du die Daten weiterverarbeiten willst):
bash
python3 skills/tageblatt-headlines/scripts/fetch_headlines.py \
     --format json --output data/tageblatt/$(date +%Y-%m-%d).json
  • Die Skriptausgabe wird zusätzlich auf STDOUT geloggt – perfekt, um die Liste sofort per Telegram zu senden.

Automatischer 07:00-Job

  • Cronjob anlegen (lokale Zeit Europe/Berlin):
bash
openclaw cron add <<'JSON'
   {
     "name": "tageblatt-headlines-07",
     "schedule": {
       "kind": "cron",
       "expr": "0 7 * * *",
       "tz": "Europe/Berlin"
     },
     "sessionTarget": "isolated",
     "payload": {
       "kind": "agentTurn",
       "model": "default",
       "message": "Run `python3 skills/tageblatt-headlines/scripts/fetch_headlines.py --limit 15 --output data/tageblatt/$(date +%F)_headlines.txt`. Send Master the list via Telegram (bulleted) and mention where the file was saved."
     }
   }
   JSON
  • Automation optionalen Versand hinzufügen: Nach erfolgreichem Lauf kann derselbe Job eine Telegram-Zusammenfassung verschicken (siehe Payload oben).
  • Aufbewahrung: Lege data/tageblatt/ an und committe Archivdateien, falls sie langfristig gespeichert werden sollen.

Fehlerbehebung & Hinweise

  • Das Skript nutzt nur Standardbibliotheken (urllib, re). Keine zusätzlichen Pip-Abhängigkeiten nötig.
  • Falls Consent-Banner den HTML-Aufbau ändert, prüfe die Regex in scripts/fetch_headlines.py (Pattern HEADING_PATTERN).
  • Bei Netzwerkfehlern gibt das Skript Exit-Code 1 zurück. Cronjobs sollten in diesem Fall automatisch beim nächsten Zyklus erneut laufen.
  • Begrenze --limit, falls du nur eine kurze Liste brauchst (z. B. Top 5).

Ressourcen

  • scripts/fetch_headlines.py – HTTP-Download & Parser für Schlagzeilen (Text/JSON-Ausgabe, limitierbar).

Installation

Terminal bash

openclaw install tageblatt-headlines
    
Copied!

💻Code Examples

example.sh
python3 skills/tageblatt-headlines/scripts/fetch_headlines.py \
     --limit 15 \
     --output data/tageblatt/$(date +%Y-%m-%d)_headlines.txt
example.sh
openclaw cron add <<'JSON'
   {
     "name": "tageblatt-headlines-07",
     "schedule": {
       "kind": "cron",
       "expr": "0 7 * * *",
       "tz": "Europe/Berlin"
     },
     "sessionTarget": "isolated",
     "payload": {
       "kind": "agentTurn",
       "model": "default",
       "message": "Run `python3 skills/tageblatt-headlines/scripts/fetch_headlines.py --limit 15 --output data/tageblatt/$(date +%F)_headlines.txt`. Send Master the list via Telegram (bulleted) and mention where the file was saved."
     }
   }
   JSON

Tags

#browser_and-automation

Quick Info

Category Web Scrapers
Model Claude 3.5
Complexity One-Click
Author zopyx
Last Updated 3/10/2026
🚀
Optimized for
Claude 3.5
🧠

Ready to Install?

Get started with this skill in seconds

openclaw install tageblatt-headlines