Documentation
Documentation ParseJet
ParseJet extrait le texte de n'importe quel fichier ou URL. Un seul appel API gère le PDF, DOCX, YouTube, les pages web, les images, l'audio, la vidéo et 25+ autres formats.
Démarrage rapide
Obtenez votre premier résultat d'analyse en moins de 60 secondes. Aucune inscription requise.
Essayez instantanément
Collez n'importe quelle URL dans ParseJet — aucune clé API nécessaire pour vos 3 premières requêtes par jour.
Obtenez votre clé API
Connectez-vous avec Google ou GitHub pour obtenir une clé API gratuite. Le plan gratuit inclut 300 requêtes par mois.
Utilisez le résultat
Chaque réponse renvoie la même structure JSON, quel que soit le format d'entrée :
Authentification
ParseJet propose trois niveaux d'accès. Vous pouvez commencer à utiliser l'API immédiatement sans aucune authentification.
Astuce : Vous n'avez pas besoin d'une clé API pour commencer. Envoyez simplement des requêtes directement — les 3 premières par jour sont gratuites sans inscription.
Concepts fondamentaux
Formats pris en charge
ParseJet détecte automatiquement le format à partir de l'extension du fichier ou du motif de l'URL. Vous n'avez pas besoin de spécifier le format — envoyez simplement le fichier ou l'URL à /v1/parse/auto et ParseJet s'occupe du reste.
Crédits
Chaque requête API consomme des crédits en fonction de la complexité du format analysé. Les fichiers texte simples coûtent 1 crédit, tandis que les transcriptions YouTube coûtent 5. Votre allocation mensuelle de crédits dépend de votre forfait.
Format de sortie
Par défaut, ParseJet renvoie le texte extrait brut. Ajoutez ?output_format=markdown à toute requête pour obtenir une sortie post-traitée avec les titres, listes, tableaux et blocs de code détectés.
Guide
Analyser un PDF
Extrayez le texte de n'importe quel fichier PDF, y compris les documents scannés et les rapports multipages.
Téléverser un fichier PDF
Convertir en Markdown
Ajoutez output_format=markdown pour préserver la structure du document :
Coût en crédits : 3 crédits par PDF. Prend en charge les fichiers jusqu'à la limite de taille de votre forfait (10 Mo-200 Mo).
Guide
Transcriptions YouTube
Obtenez la transcription complète de n'importe quelle vidéo YouTube. Prend en charge les sous-titres générés automatiquement dans plus de 100 langues.
Obtenir une transcription
Spécifier la langue
Utilisez le paramètre language pour les vidéos non anglaises :
Ou utilisez la détection automatique
Le point de terminaison /v1/parse/auto/url détecte automatiquement les URLs YouTube :
Coût en crédits : 5 crédits par vidéo YouTube. Les métadonnées incluent video_id, chaîne et durée.
Guide
Web Scraping
Extrayez le contenu principal de n'importe quelle page web. ParseJet supprime automatiquement la navigation, les publicités, les barres latérales et le contenu standard.
Coût en crédits : 3 crédits par page web. Retourne un texte propre avec le titre et l'URL source dans les métadonnées.
Guide
Documents Office
Analysez les fichiers Word (DOCX), Excel (XLSX), PowerPoint (PPTX) et CSV. Téléchargez simplement le fichier — ParseJet détecte automatiquement le format.
Coût en crédits : 2 crédits par document. Formats pris en charge : DOCX, PPTX, XLSX, CSV.
Référence API
Format de réponse
Tous les endpoints renvoient la même structure JSON :
/v1/parse/auto
L'endpoint recommandé. Détecte automatiquement le format à partir de l'extension du fichier ou du type d'URL. Accepte file (multipart) ou url (champ de formulaire), pas les deux.
/v1/parse/auto/url
Analysez n'importe quelle URL. Distingue automatiquement YouTube des pages web classiques.
/v1/parse/auto/file
Analysez n'importe quel fichier téléchargé. Détecte le format à partir de l'extension, sinon utilise une détection basée sur le contenu.
/v1/parse/webpage
Extrayez le contenu principal d'une page web. Supprime la navigation, les publicités et le contenu standard.
/v1/parse/youtube
Extrayez la transcription d'une vidéo YouTube. Les métadonnées incluent video_id, chaîne et durée.
/v1/parse/audio
Analysez les fichiers audio. Prend en charge MP3, WAV, M4A, OGG, FLAC, WebM. Max 25 Mo.
/v1/parse/video
Extrayez l'audio d'une vidéo pour la transcription. Prend en charge MP4, MKV, AVI, MOV, WebM.
/v1/parse/epub
Analysez un livre électronique EPUB. Extrait le texte organisé par chapitres.
/v1/parse/feed
Analysez un flux RSS ou Atom. Prend également en charge OPML via /v1/parse/opml.
/v1/parse/image
Analysez une image. Prend en charge JPG, PNG, GIF, BMP, WebP, TIFF. Max 20 Mo.
/v1/parse/image/ocr
Extrayez le texte d'une image via OCR.
SDKs
SDKs officiels
TypeScript / JavaScript
Python
Agents IA
Serveur MCP
Utilisez ParseJet comme serveur MCP (Model Context Protocol) avec Claude Code, Cursor, ou tout agent IA compatible MCP.
Installer
Claude Code
Ajoutez à votre .claude/settings.json de projet :
Cursor
Allez dans Paramètres → Serveurs MCP, ajoutez un nouveau serveur :
Claude.ai (Distant)
Pour Claude.ai web, utilisez le point de terminaison HTTP distant — aucune installation locale requise :
Allez sur Claude.ai → Paramètres → Intégrations → Ajouter un serveur MCP → Saisissez l'URL ci-dessus.
Outils disponibles
Limites de débit & Tarification
ParseJet utilise un système basé sur des crédits. Chaque requête consomme des crédits selon la complexité du format.
Les en-têtes de réponse incluent X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset, et Retry-After sur les réponses 429.
Codes d'erreur
Toutes les erreurs renvoient un JSON avec les champs error et message.