PDF- & Dokumentenanalyse

OpenClaw enthält ein dediziertes PDF-Analysetool, das deinem Agenten ermöglicht, PDF-Dokumente zu lesen, zu interpretieren und Informationen zu extrahieren. Egal, ob du einen Bericht zusammenfassen, Daten aus einer Tabelle ziehen oder Fragen zu einem Vertrag beantworten möchtest, das PDF-Tool erledigt das direkt in deiner Konversation.

Wie die PDF-Analyse funktioniert

Das PDF-Tool unterstützt zwei Verarbeitungsmodi, abhängig von deinem konfigurierten Model-Provider. Wenn ein Modell nativen PDF-Input unterstützt, wird die Datei direkt zur Interpretation gesendet. Andernfalls extrahiert OpenClaw Text und Bilder aus dem PDF und übergibt sie als separate Eingaben.

Native PDF-Verarbeitung

Anthropic Claude und Google Gemini akzeptieren PDF-Dateien nativ. Das Modell sieht die vollständige Dokumentstruktur: Text, Bilder, Tabellen, Kopf- und Fußzeilen sowie Layout. Native Verarbeitung liefert die besten Ergebnisse bei komplexen Dokumenten mit gemischtem Inhalt.

Fallback-Extraktion

Für Provider ohne native PDF-Unterstützung extrahiert OpenClaw automatisch Textinhalt und Seitenbilder. Der extrahierte Text wird als strukturierter Input gesendet, und Seitenbilder werden über das Vision-Modell verarbeitet. Das funktioniert bei den meisten Dokumenten gut, kann aber subtile Layout-Hinweise verfehlen.

Das PDF-Tool verwenden

Du kannst ein einzelnes PDF oder bis zu 10 Dateien in einem Aufruf übergeben. Jede Analyse benötigt einen Prompt, der dem Modell mitteilt, wonach es suchen soll.

Einzelne Datei analysieren

Übergib einen lokalen Dateipfad oder eine URL an den pdf-Parameter. Ergänze einen klaren Prompt, der beschreibt, was extrahiert oder analysiert werden soll.

Lokale Pfade: /home/user/dokumente/bericht.pdf
URLs: https://example.com/dokument.pdf
Kombiniere mit einem klaren Prompt für beste Ergebnisse

Stapelverarbeitung

Nutze den pdfs-Parameter mit einem Array von bis zu 10 Dateien. Stapelverarbeitung eignet sich zum Vergleichen von Dokumenten, Querprüfen von Daten oder Verarbeiten eines Ordners voller Rechnungen.

Seitenauswahl

Für große Dokumente nutze den pages-Parameter, um nur bestimmte Seiten zu analysieren. Akzeptierte Formate:

"1-5" für einen Bereich
"1,3,7" für einzelne Seiten
"1,3,5-7" für gemischte Bereiche

Seitenauswahl reduziert den Token-Verbrauch und die Verarbeitungszeit erheblich bei Dokumenten mit hunderten Seiten.

Praktische Anwendungsfälle

Berichtszusammenfassung

Lade einen Quartalsbericht oder ein Research-Paper hoch und bitte um eine strukturierte Zusammenfassung. Das Modell kann Kernergebnisse, Finanzdaten und Empfehlungen über alle Seiten hinweg extrahieren.

Vertragsprüfung

Lade Verträge oder juristische Dokumente hoch und frage nach spezifischen Klauseln, Verpflichtungen oder Risiken. Native PDF-Verarbeitung erhält die Dokumentstruktur und erleichtert die Referenzierung einzelner Abschnitte.

Datenextraktion

Extrahiere strukturierte Daten aus Formularen, Rechnungen oder Tabellen. Bei nativen PDF-Providern bleibt die Tabellenstruktur erhalten. Im Fallback-Modus verbessert die Beschreibung des Tabellenformats im Prompt die Genauigkeit.

Mehrdokumenten-Vergleich

Nutze Stapelverarbeitung, um Versionen desselben Dokuments zu vergleichen, Diskrepanzen zwischen Verträgen zu prüfen oder zu verifizieren, dass aktualisierte Bedingungen den Erwartungen entsprechen.

Konfiguration und Limits

Dateigröße und Anzahl

Parameter	Standard	Hinweise
maxBytesMb	20 MB	Maximale einzelne Dateigröße
pdfs (Stapel)	10 Dateien	Maximale Dateien pro Aufruf
pages	Alle Seiten	Optional: Seitenbereichsfilter

Modellauswahl

Für beste Ergebnisse bei PDFs mit Bildern, Tabellen oder komplexen Layouts verwende ein Modell mit nativer PDF-Unterstützung (Claude oder Gemini). Für textlastige Dokumente funktioniert jedes Modell mit dem Fallback-Extraktor gut.

Du kannst das Standardmodell mit dem model-Parameter im PDF-Tool-Aufruf überschreiben. So leitest du die PDF-Analyse an ein fähiges Modell weiter, ohne deine globale Konfiguration zu ändern.

Tipps für bessere Ergebnisse

Sei spezifisch im Prompt: Statt "analysiere dieses PDF" frage "extrahiere die Umsatzzahlen aus der Q3-Finanztabelle auf Seite 4"
Nutze Seitenauswahl: Bei großen Dokumenten den Umfang auf relevante Seiten eingrenzen
Extrahierte Daten verifizieren: Kritische Zahlen und Fakten im Output immer gegenprüfen
Mit anderen Tools kombinieren: Browser-Automatisierung nutzen, um PDFs aus Portalen herunterzuladen, dann mit dem PDF-Tool analysieren
Sehr große Dokumente aufteilen: Wenn ein Dokument die Größenbeschränkung überschreitet, die Analyse auf mehrere Aufrufe mit unterschiedlichen Seitenbereichen verteilen

Fehlerbehebung

Häufige Probleme

Datei zu groß: maxBytesMb reduzieren oder das Dokument aufteilen
Schlechte Extraktionsqualität: Auf ein natives PDF-Modell wechseln (Claude oder Gemini)
Fehlende Bilder: Sicherstellen, dass das Modell Vision-Fähigkeiten aktiviert hat
Timeout bei großen Dateien: Seitenauswahl nutzen, um kleinere Chunks zu verarbeiten
Kodierungsfehler: Verifizieren, dass das PDF nicht passwortgeschützt oder beschädigt ist

Sicherheitshinweise

PDF-Dateien werden vom Model-Provider verarbeitet und können gemäß deren Datenrichtlinien vorübergehend gespeichert werden
Keine Dokumente mit Secrets, Zugangsdaten oder sensiblen persönlichen Daten an öffentliche Modell-Endpunkte hochladen
Für vertrauliche Dokumente ein lokales Modell oder einen Provider mit expliziten Datenschutzgarantien nutzen

Need help from people who already use this stuff?

Fragen zur PDF-Analyse?

Hilfe bei Dokumenten-Verarbeitungsworkflows und Modellauswahl erhältst du in der OpenClaw-Community.

Join My AI Agent Profit Lab See the community page

FAQ

Welche Modelle unterstützen native PDF-Analyse?

Anthropic Claude und Google Gemini Modelle unterstützen native PDF-Verarbeitung. Sie können Layout, Bilder und Tabellen direkt interpretieren. Andere Provider nutzen eine Text- und Bildextraktion als Fallback.

Was ist die maximale Dateigröße für die PDF-Analyse?

Das Standardlimit liegt bei 20 MB pro Datei. Du kannst den Parameter maxBytesMb anpassen, wenn dein Provider größere Uploads unterstützt.

Kann ich mehrere PDFs gleichzeitig analysieren?

Ja. Nutze den Parameter pdfs (Array), um bis zu 10 PDF-Dateien in einem einzigen Aufruf zu übergeben. Jede Datei wird unabhängig verarbeitet.

Funktioniert die PDF-Analyse mit gescannten Dokumenten?

Für gescannte Dokumente extrahiert OpenClaw Bilder aus den PDF-Seiten und übergibt sie an das Vision-Modell. Die OCR-Qualität hängt von den Fähigkeiten des jeweiligen Modells ab.

Kann ich die Analyse auf bestimmte Seiten beschränken?

Ja. Nutze den Parameter pages mit Bereichen wie '1-5' oder '1,3,5-7', um nur die gewünschten Seiten zu analysieren. Das spart Tokens und Verarbeitungszeit.