ParseJet

Documentatie

ParseJet Documentatie

ParseJet extraheert tekst uit elk bestand of elke URL. Eรฉn API-aanroep verwerkt PDF, DOCX, YouTube, webpagina's, afbeeldingen, audio, video en 25+ andere formaten.

Snelstart

Krijg je eerste parse-resultaat in minder dan 60 seconden. Geen aanmelding vereist.

1

Probeer het direct

Plak een willekeurige URL in ParseJet โ€” geen API-sleutel nodig voor je eerste 3 verzoeken per dag.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
2

Krijg je API-sleutel

Meld je aan met Google of GitHub om een gratis API-sleutel te krijgen. Gratis laag bevat 300 verzoeken per maand.

# Add your API key to requests
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
3

Gebruik het resultaat

Elk antwoord retourneert dezelfde JSON-structuur, ongeacht het invoerformaat:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "webpage",
  "metadata": { "url": "https://example.com" }
}

Authenticatie

ParseJet biedt drie toegangsniveaus. Je kunt de API direct gaan gebruiken zonder enige authenticatie.

Niveau Toegang verkrijgen Snelheidslimiet Geschikt voor
AnoniemGeen headers3/dag, 2MBSnel testen
SessieAanmelden (cookie)10/dag, 5MBDashboard-tool
API-sleutelAuthorization: Bearer pj_xxxVolgens planProductie

Tip: Je hebt geen API-sleutel nodig om te beginnen. Stuur gewoon direct verzoeken โ€” de eerste 3 per dag zijn gratis zonder aanmelding.

Kernconcepten

Ondersteunde formaten

ParseJet detecteert automatisch het formaat op basis van de bestandsextensie of URL-patroon. Je hoeft het formaat niet te specificeren โ€” stuur gewoon het bestand of de URL naar /v1/parse/auto en ParseJet regelt de rest.

Categorie Formaten Credits
TekstTXT, MD, JSON, CSV, XML, HTML1
DocumentenDOCX, PPTX, XLSX, EPUB2
ComplexPDF, webpagina's, video3
YouTubeYouTube video-URL's5
OverigAudio (MP3, WAV), afbeeldingen (JPG, PNG), RSS, OPML, e-mail, notebooks1

Credits

Elke API-aanvraag verbruikt credits op basis van de complexiteit van het te parseren formaat. Eenvoudige tekstbestanden kosten 1 credit, terwijl YouTube-transcripties 5 kosten. Je maandelijkse creditlimiet hangt af van je abonnement.

Uitvoerformaat

Standaard retourneert ParseJet onbewerkte geรซxtraheerde tekst. Voeg ?output_format=markdown toe aan een aanvraag om na-verwerkte uitvoer te krijgen met gedetecteerde koppen, lijsten, tabellen en codeblokken.

Handleiding

Een PDF parsen

Extraheer tekst uit elk PDF-bestand, inclusief gescande documenten en rapporten met meerdere pagina's.

Upload een PDF-bestand

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Converteren naar Markdown

Voeg output_format=markdown toe om de documentstructuur te behouden:

curl -X POST https://api.parsejet.com/v1/parse/auto/file?output_format=markdown \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Creditkosten: 3 credits per PDF. Ondersteunt bestanden tot de bestandsgrootte limiet van je abonnement (10MB-200MB).

Handleiding

YouTube-transcripties

Verkrijg het volledige transcript van elke YouTube-video. Ondersteunt automatisch gegenereerde ondertiteling in 100+ talen.

Een transcript verkrijgen

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID"}'

Taal specificeren

Gebruik de language parameter voor niet-Engelse video's:

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "ja"}'

Of gebruik automatische detectie

Het /v1/parse/auto/url endpoint detecteert automatisch YouTube-URL's:

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtu.be/VIDEO_ID"}'

Creditkosten: 5 credits per YouTube-video. Metadata bevat video_id, kanaal en duur.

Handleiding

Web Scraping

Haal de hoofdinhoud van elke webpagina op. ParseJet verwijdert automatisch navigatie, advertenties, zijbalken en standaardteksten.

curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/blog/article"}'

Creditkosten: 3 credits per webpagina. Retourneert schone tekst met titel en bron-URL in de metadata.

Handleiding

Office-documenten

Parse Word (DOCX), Excel (XLSX), PowerPoint (PPTX) en CSV-bestanden. Upload gewoon het bestand โ€” ParseJet detecteert het formaat automatisch.

# Works with any Office format
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

# Also works with spreadsheets
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Creditkosten: 2 credits per document. Ondersteund: DOCX, PPTX, XLSX, CSV.

API-referentie

Antwoordformaat

Alle endpoints retourneren dezelfde JSON-structuur:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "pdf",
  "metadata": { "pages": 12, "author": "Jane Doe" }
}
Veld Type Beschrijving
textstringDe geรซxtraheerde tekstinhoud
titlestringDocument- of paginatitel
source_typestringFormaatidentificatie (pdf, webpage, youtube, etc.)
metadataobjectFormaatspecifieke metadata (aantal pagina's, auteur, duur, etc.)
POST

/v1/parse/auto

De aanbevolen endpoint. Detecteert automatisch het formaat op basis van bestandsextensie of URL-type. Accepteert file (multipart) of url (formulierveld), niet beide.

curl -X POST https://api.parsejet.com/v1/parse/auto \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/auto/url

Parse elke URL. Maakt automatisch onderscheid tussen YouTube en reguliere webpagina's.

ParameterTypeVerplichtBeschrijving
urlstringjaURL om te parseren
languagestringneeISO 639-1 code voor YouTube-transcripttaal
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
POST

/v1/parse/auto/file

Parse elk geรผpload bestand. Detecteert formaat op basis van bestandsextensie, valt terug op detectie op basis van inhoud.

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/webpage

Haal hoofdinhoud van een webpagina op. Verwijdert navigatie, advertenties en standaardteksten.

ParameterTypeVerplichtBeschrijving
urlstringjaWebpagina-URL
curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/article"}'
POST

/v1/parse/youtube

Haal transcript op van een YouTube-video. Metadata bevat video_id, kanaal en duur.

ParameterTypeVerplichtBeschrijving
urlstringjaYouTube-video-URL of video-ID
languagestringneeISO 639-1 taalcode
curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "en"}'
POST

/v1/parse/audio

Parse audiobestanden. Ondersteunt MP3, WAV, M4A, OGG, FLAC, WebM. Max. 25MB.

VeldTypeVerplichtBeschrijving
filefilejaAudio bestand
languagestringneeISO 639-1 code
with_timestampsbooleanneeWoordniveau-tijdstempels toevoegen
curl -X POST https://api.parsejet.com/v1/parse/audio \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/video

Haal audio uit video voor transcriptie. Ondersteunt MP4, MKV, AVI, MOV, WebM.

curl -X POST https://api.parsejet.com/v1/parse/video \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/epub

Parse EPUB e-book. Extraheert tekst georganiseerd per hoofdstuk.

curl -X POST https://api.parsejet.com/v1/parse/epub \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/feed

Parse RSS- of Atom-feed. Ondersteunt ook OPML via /v1/parse/opml.

curl -X POST https://api.parsejet.com/v1/parse/feed \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/image

Analyseer afbeelding. Ondersteunt JPG, PNG, GIF, BMP, WebP, TIFF. Max. 20MB.

VeldTypeVerplichtBeschrijving
filefilejaAfbeelding bestand
promptstringneeAangepaste prompt voor beeldanalyse
modelstringneeVision model overschrijven
curl -X POST https://api.parsejet.com/v1/parse/image \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "prompt=Describe this image"
POST

/v1/parse/image/ocr

Extraheer tekst uit afbeelding via OCR.

curl -X POST https://api.parsejet.com/v1/parse/image/ocr \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

SDK's

Officiรซle SDK's

TypeScript / JavaScript

npm install parsejet
import { ParseJet } from "parsejet";

const client = new ParseJet({ apiKey: "pj_YOUR_KEY" });

// Parse a URL
const result = await client.parse.url("https://example.com");
console.log(result.text);

// Parse a file
const result = await client.parse.file(buffer, "report.pdf");
console.log(result.text);

Python

pip install parsejet
from parsejet import ParseJet

client = ParseJet(api_key="pj_YOUR_KEY")

# Parse a URL
result = client.parse.url("https://example.com")
print(result.text)

# Parse a file
with open("report.pdf", "rb") as f:
    result = client.parse.file(f, "report.pdf")
    print(result.text)

AI Agents

MCP Server

Gebruik ParseJet als een MCP (Model Context Protocol) server met Claude Code, Cursor, of elke MCP-compatibele AI-agent.

Installeren

npm install -g @parsejet/mcp-server

Claude Code

Voeg toe aan het .claude/settings.json bestand van je project:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Cursor

Ga naar Instellingen โ†’ MCP Servers, voeg een nieuwe server toe:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Claude.ai (Remote)

Voor Claude.ai web, gebruik het externe HTTP endpoint โ€” geen lokale installatie nodig:

Endpoint:  https://api.parsejet.com/mcp
Transport: Streamable HTTP
Auth:      Bearer pj_YOUR_KEY (in Authorization header)

Ga naar Claude.ai โ†’ Instellingen โ†’ Integraties โ†’ MCP Server toevoegen โ†’ Voer de bovenstaande URL in.

Beschikbare tools

Tool Beschrijving
parse_urlParse een URL (webpagina, YouTube, etc.)
parse_fileParse een lokaal bestand (PDF, DOCX, afbeeldingen, etc.)
get_youtube_transcriptHaal YouTube-videotranscript op met optionele taal

Rate Limits & Prijzen

ParseJet gebruikt een creditsysteem. Elk verzoek verbruikt credits op basis van de complexiteit van het formaat.

Plan Prijs Credits/maand RPM Max. bestand
Free$0300510MB
Pro$19/mo3,0003050MB
Business$49/mo20,00060100MB
Scale$99/mo50,000200200MB
EnterpriseCustomCustomCustomCustom

Response headers bevatten X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset, en Retry-After bij 429 responses.

Foutcodes

Alle fouten retourneren JSON met error en message velden.

StatusCodeBeschrijving
400unsupported_formatBestandstype niet ondersteund
401invalid_api_keyAPI-sleutel ontbreekt of is ongeldig
413file_too_largeBestand overschrijdt planlimiet
422parse_errorBestand beschadigd of onleesbaar
429rate_limit_exceededRPM of dagelijkse/maandelijkse limiet bereikt
502parser_unavailableParser-backend niet bereikbaar
504parser_timeoutParse-bewerking time-out