Dokumentation
ParseJet-Dokumentation
ParseJet extrahiert Text aus beliebigen Dateien oder URLs. Ein API-Aufruf verarbeitet PDF, DOCX, YouTube, Webseiten, Bilder, Audio, Video und 25+ weitere Formate.
Schnellstart
Erhalten Sie Ihr erstes Parse-Ergebnis in unter 60 Sekunden. Keine Anmeldung erforderlich.
Sofort ausprobieren
Fügen Sie eine beliebige URL in ParseJet ein — für die ersten 3 Anfragen pro Tag ist kein API-Schlüssel nötig.
API-Schlüssel erhalten
Melden Sie sich mit Google oder GitHub an, um einen kostenlosen API-Schlüssel zu erhalten. Der kostenlose Tarif umfasst 300 Anfragen pro Monat.
Ergebnis verwenden
Jede Antwort liefert die gleiche JSON-Struktur, unabhängig vom Eingabeformat:
Authentifizierung
ParseJet bietet drei Zugriffsebenen. Sie können die API sofort ohne Authentifizierung nutzen.
Tipp: Sie benötigen keinen API-Schlüssel, um loszulegen. Senden Sie einfach Anfragen direkt — die ersten 3 pro Tag sind kostenlos und ohne Anmeldung.
Kernkonzepte
Unterstützte Formate
ParseJet erkennt das Format automatisch anhand der Dateiendung oder des URL-Musters. Sie müssen das Format nicht angeben – senden Sie einfach die Datei oder URL an /v1/parse/auto und ParseJet erledigt den Rest.
Credits
Jede API-Anfrage verbraucht Credits basierend auf der Komplexität des zu parsenden Formats. Einfache Textdateien kosten 1 Credit, YouTube-Transkripte kosten 5. Ihr monatliches Credit-Kontingent hängt von Ihrem Tarif ab.
Ausgabeformat
Standardmäßig gibt ParseJet den rohen extrahierten Text zurück. Fügen Sie ?output_format=markdown zu einer Anfrage hinzu, um nachbearbeitete Ausgabe mit erkannten Überschriften, Listen, Tabellen und Codeblöcken zu erhalten.
Anleitung
Eine PDF parsen
Extrahieren Sie Text aus jeder PDF-Datei, einschließlich gescannter Dokumente und mehrseitiger Berichte.
PDF-Datei hochladen
In Markdown konvertieren
Fügen Sie output_format=markdown hinzu, um die Dokumentstruktur zu erhalten:
Credit-Kosten: 3 Credits pro PDF. Unterstützt Dateien bis zur Dateigrößenbeschränkung Ihres Tarifs (10MB-200MB).
Anleitung
YouTube-Transkripte
Erhalten Sie das vollständige Transkript eines beliebigen YouTube-Videos. Unterstützt automatisch generierte Untertitel in über 100 Sprachen.
Transkript abrufen
Sprache angeben
Verwenden Sie den language-Parameter für nicht-englische Videos:
Oder automatisch erkennen lassen
Der Endpunkt /v1/parse/auto/url erkennt YouTube-URLs automatisch:
Credit-Kosten: 5 Credits pro YouTube-Video. Metadaten enthalten video_id, Kanal und Dauer.
Anleitung
Web-Scraping
Extrahiere den Hauptinhalt von jeder Webseite. ParseJet entfernt automatisch Navigation, Werbung, Sidebars und Boilerplate.
Credit-Kosten: 3 Credits pro Webseite. Liefert sauberen Text mit Titel und Quell-URL in den Metadaten.
Anleitung
Office-Dokumente
Parse Word (DOCX), Excel (XLSX), PowerPoint (PPTX) und CSV-Dateien. Lade einfach die Datei hoch — ParseJet erkennt das Format automatisch.
Credit-Kosten: 2 Credits pro Dokument. Unterstützt: DOCX, PPTX, XLSX, CSV.
API-Referenz
Antwortformat
Alle Endpunkte liefern die gleiche JSON-Struktur:
/v1/parse/auto
Der empfohlene Endpunkt. Erkennt das Format automatisch anhand der Dateiendung oder URL. Akzeptiert file (multipart) oder url (Formularfeld), nicht beides.
/v1/parse/auto/url
Parse jede URL. Unterscheidet automatisch zwischen YouTube und regulären Webseiten.
/v1/parse/auto/file
Parse jede hochgeladene Datei. Erkennt Format anhand der Dateiendung, greift auf inhaltsbasierte Erkennung zurück.
/v1/parse/webpage
Extrahiere Hauptinhalt von einer Webseite. Entfernt Navigation, Werbung und Boilerplate.
/v1/parse/youtube
Extrahiere Transkript von einem YouTube-Video. Metadaten enthalten video_id, Kanal und Dauer.
/v1/parse/audio
Parse Audio-Dateien. Unterstützt MP3, WAV, M4A, OGG, FLAC, WebM. Max. 25MB.
/v1/parse/video
Extrahiere Audio aus Video zur Transkription. Unterstützt MP4, MKV, AVI, MOV, WebM.
/v1/parse/epub
Parse EPUB-E-Book. Extrahiert nach Kapiteln organisierten Text.
/v1/parse/feed
Parse RSS- oder Atom-Feed. Unterstützt auch OPML via /v1/parse/opml.
/v1/parse/image
Analysiere Bild. Unterstützt JPG, PNG, GIF, BMP, WebP, TIFF. Max. 20MB.
/v1/parse/image/ocr
Extrahiere Text aus Bild via OCR.
SDKs
Offizielle SDKs
TypeScript / JavaScript
Python
KI-Agenten
MCP-Server
Verwende ParseJet als MCP (Model Context Protocol) Server mit Claude Code, Cursor oder jedem MCP-kompatiblen KI-Agenten.
Installieren
Claude Code
Füge zu deiner Projektdatei .claude/settings.json hinzu:
Cursor
Gehe zu Einstellungen → MCP-Server, füge einen neuen Server hinzu:
Claude.ai (Remote)
Für Claude.ai Web, verwende den Remote-HTTP-Endpunkt — keine lokale Installation nötig:
Gehe zu Claude.ai → Einstellungen → Integrationen → MCP-Server hinzufügen → Gib die obige URL ein.
Verfügbare Tools
Ratenbegrenzungen & Preise
ParseJet verwendet ein kreditbasiertes System. Jede Anfrage verbraucht Credits basierend auf der Formatkomplexität.
Antwort-Header enthalten X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset und bei 429-Antworten Retry-After.
Fehlercodes
Alle Fehler geben JSON mit den Feldern error und message zurück.