ParseJet

Documentazione

Documentazione ParseJet

ParseJet estrae testo da qualsiasi file o URL. Una chiamata API gestisce PDF, DOCX, YouTube, pagine web, immagini, audio, video e oltre 25 altri formati.

Guida Rapida

Ottieni il tuo primo risultato in meno di 60 secondi. Nessuna registrazione richiesta.

1

Provalo subito

Incolla qualsiasi URL in ParseJet โ€” nessuna chiave API necessaria per le prime 3 richieste al giorno.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
2

Ottieni la tua chiave API

Accedi con Google o GitHub per ottenere una chiave API gratuita. Il piano gratuito include 300 richieste al mese.

# Add your API key to requests
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
3

Usa il risultato

Ogni risposta restituisce la stessa struttura JSON indipendentemente dal formato di input:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "webpage",
  "metadata": { "url": "https://example.com" }
}

Autenticazione

ParseJet offre tre livelli di accesso. Puoi iniziare a usare l'API immediatamente senza alcuna autenticazione.

Livello Come accedere Limite di richieste Ideale per
AnonimoNessun header3/giorno, 2MBTest rapidi
SessioneAccedi (cookie)10/giorno, 5MBStrumento dashboard
Chiave APIAuthorization: Bearer pj_xxxIn base al pianoProduzione

Suggerimento: Non hai bisogno di una chiave API per iniziare. Invia semplicemente le richieste direttamente โ€” le prime 3 al giorno sono gratuite senza registrazione.

Concetti Fondamentali

Formati supportati

ParseJet rileva automaticamente il formato dall'estensione del file o dal pattern dell'URL. Non รจ necessario specificare il formato โ€” basta inviare il file o l'URL a /v1/parse/auto e ParseJet gestisce il resto.

Categoria Formati Crediti
TestoTXT, MD, JSON, CSV, XML, HTML1
DocumentiDOCX, PPTX, XLSX, EPUB2
ComplessiPDF, pagine web, video3
YouTubeURL video YouTube5
AltroAudio (MP3, WAV), immagini (JPG, PNG), RSS, OPML, email, notebook1

Crediti

Ogni richiesta API consuma crediti in base alla complessitร  del formato analizzato. I file di testo semplici costano 1 credito, mentre le trascrizioni YouTube costano 5. La tua dotazione mensile di crediti dipende dal tuo piano.

Formato di output

Di default, ParseJet restituisce il testo estratto grezzo. Aggiungi ?output_format=markdown a qualsiasi richiesta per ottenere un output post-elaborato con titoli, elenchi, tabelle e blocchi di codice rilevati.

Guida

Analizza un PDF

Estrai testo da qualsiasi file PDF, inclusi documenti scansionati e report multipagina.

Carica un file PDF

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Converti in Markdown

Aggiungi output_format=markdown per preservare la struttura del documento:

curl -X POST https://api.parsejet.com/v1/parse/auto/file?output_format=markdown \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Costo in crediti: 3 crediti per PDF. Supporta file fino al limite di dimensione del tuo piano (10MB-200MB).

Guida

Trascrizioni YouTube

Ottieni la trascrizione completa di qualsiasi video YouTube. Supporta sottotitoli generati automaticamente in oltre 100 lingue.

Ottieni una trascrizione

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID"}'

Specifica la lingua

Usa il parametro language per video non in inglese:

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "ja"}'

Oppure usa il rilevamento automatico

L'endpoint /v1/parse/auto/url rileva automaticamente gli URL di YouTube:

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtu.be/VIDEO_ID"}'

Costo in crediti: 5 crediti per video YouTube. I metadati includono video_id, canale e durata.

Guida

Web Scraping

Estrai il contenuto principale da qualsiasi pagina web. ParseJet rimuove automaticamente navigazione, annunci, barre laterali e boilerplate.

curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/blog/article"}'

Costo crediti: 3 crediti per pagina web. Restituisce testo pulito con titolo e URL di origine nei metadati.

Guida

Documenti Office

Analizza file Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e CSV. Basta caricare il file โ€” ParseJet rileva automaticamente il formato.

# Works with any Office format
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

# Also works with spreadsheets
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Costo crediti: 2 crediti per documento. Supportati: DOCX, PPTX, XLSX, CSV.

Riferimento API

Formato Risposta

Tutti gli endpoint restituiscono la stessa struttura JSON:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "pdf",
  "metadata": { "pages": 12, "author": "Jane Doe" }
}
Campo Tipo Descrizione
textstringIl contenuto testuale estratto
titlestringTitolo del documento o della pagina
source_typestringIdentificatore del formato (pdf, webpage, youtube, ecc.)
metadataobjectMetadati specifici del formato (numero pagine, autore, durata, ecc.)
POST

/v1/parse/auto

L'endpoint consigliato. Rileva automaticamente il formato dall'estensione del file o dal tipo di URL. Accetta file (multipart) o url (campo form), non entrambi.

curl -X POST https://api.parsejet.com/v1/parse/auto \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/auto/url

Analizza qualsiasi URL. Distingue automaticamente YouTube dalle normali pagine web.

ParametroTipoObbligatorioDescrizione
urlstringsรฌURL da analizzare
languagestringnoCodice ISO 639-1 per la lingua dei sottotitoli YouTube
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
POST

/v1/parse/auto/file

Analizza qualsiasi file caricato. Rileva il formato dall'estensione del file, altrimenti usa il rilevamento basato sul contenuto.

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/webpage

Estrai il contenuto principale da una pagina web. Rimuove navigazione, annunci e boilerplate.

ParametroTipoObbligatorioDescrizione
urlstringsรฌURL pagina web
curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/article"}'
POST

/v1/parse/youtube

Estrai la trascrizione da un video YouTube. I metadati includono video_id, canale e durata.

ParametroTipoObbligatorioDescrizione
urlstringsรฌURL video YouTube o ID video
languagestringnoCodice lingua ISO 639-1
curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "en"}'
POST

/v1/parse/audio

Analizza file audio. Supporta MP3, WAV, M4A, OGG, FLAC, WebM. Max 25MB.

CampoTipoObbligatorioDescrizione
filefilesรฌFile audio
languagestringnoCodice ISO 639-1
with_timestampsbooleannoIncludi timestamp a livello di parola
curl -X POST https://api.parsejet.com/v1/parse/audio \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/video

Estrai audio dal video per la trascrizione. Supporta MP4, MKV, AVI, MOV, WebM.

curl -X POST https://api.parsejet.com/v1/parse/video \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/epub

Analizza ebook EPUB. Estrae il testo organizzato per capitoli.

curl -X POST https://api.parsejet.com/v1/parse/epub \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/feed

Analizza feed RSS o Atom. Supporta anche OPML tramite /v1/parse/opml.

curl -X POST https://api.parsejet.com/v1/parse/feed \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/image

Analizza immagine. Supporta JPG, PNG, GIF, BMP, WebP, TIFF. Max 20MB.

CampoTipoObbligatorioDescrizione
filefilesรฌFile immagine
promptstringnoPrompt personalizzato per l'analisi dell'immagine
modelstringnoOverride modello visione
curl -X POST https://api.parsejet.com/v1/parse/image \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "prompt=Describe this image"
POST

/v1/parse/image/ocr

Estrai testo dall'immagine tramite OCR.

curl -X POST https://api.parsejet.com/v1/parse/image/ocr \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

SDK

SDK ufficiali

TypeScript / JavaScript

npm install parsejet
import { ParseJet } from "parsejet";

const client = new ParseJet({ apiKey: "pj_YOUR_KEY" });

// Parse a URL
const result = await client.parse.url("https://example.com");
console.log(result.text);

// Parse a file
const result = await client.parse.file(buffer, "report.pdf");
console.log(result.text);

Python

pip install parsejet
from parsejet import ParseJet

client = ParseJet(api_key="pj_YOUR_KEY")

# Parse a URL
result = client.parse.url("https://example.com")
print(result.text)

# Parse a file
with open("report.pdf", "rb") as f:
    result = client.parse.file(f, "report.pdf")
    print(result.text)

Agenti AI

Server MCP

Usa ParseJet come server MCP (Model Context Protocol) con Claude Code, Cursor o qualsiasi agente AI compatibile MCP.

Installa

npm install -g @parsejet/mcp-server

Claude Code

Aggiungi al file .claude/settings.json del tuo progetto:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Cursor

Vai su Impostazioni โ†’ Server MCP, aggiungi un nuovo server:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Claude.ai (Remoto)

Per Claude.ai web, usa l'endpoint HTTP remoto โ€” nessuna installazione locale necessaria:

Endpoint:  https://api.parsejet.com/mcp
Transport: Streamable HTTP
Auth:      Bearer pj_YOUR_KEY (in Authorization header)

Vai su Claude.ai โ†’ Impostazioni โ†’ Integrazioni โ†’ Aggiungi Server MCP โ†’ Inserisci l'URL sopra.

Strumenti disponibili

Strumento Descrizione
parse_urlAnalizza qualsiasi URL (pagina web, YouTube, ecc.)
parse_fileAnalizza un file locale (PDF, DOCX, immagini, ecc.)
get_youtube_transcriptOttieni trascrizione video YouTube con lingua opzionale

Limiti di frequenza e Prezzi

ParseJet utilizza un sistema basato su crediti. Ogni richiesta consuma crediti in base alla complessitร  del formato.

Piano Prezzo Crediti/mese RPM File max
Free$0300510MB
Pro$19/mo3,0003050MB
Business$49/mo20,00060100MB
Scale$99/mo50,000200200MB
EnterpriseCustomCustomCustomCustom

Gli header di risposta includono X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset e Retry-After per risposte 429.

Codici di Errore

Tutti gli errori restituiscono JSON con i campi error e message.

StatoCodiceDescrizione
400unsupported_formatTipo di file non supportato
401invalid_api_keyChiave API mancante o non valida
413file_too_largeFile supera il limite del piano
422parse_errorFile danneggiato o illeggibile
429rate_limit_exceededLimite RPM o giornaliero/mensile raggiunto
502parser_unavailableBackend del parser non raggiungibile
504parser_timeoutOperazione di parsing scaduta