Documentazione

Documentazione ParseJet

Name: ParseJet
Author: ParseJet

ParseJet estrae testo da qualsiasi file o URL. Una chiamata API gestisce PDF, DOCX, YouTube, pagine web, immagini, audio, video e oltre 25 altri formati.

Guida Rapida

Ottieni il tuo primo risultato in meno di 60 secondi. Nessuna registrazione richiesta.

Provalo subito

Incolla qualsiasi URL in ParseJet — nessuna chiave API necessaria per le prime 3 richieste al giorno.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

Ottieni la tua chiave API

Accedi con Google o GitHub per ottenere una chiave API gratuita. Il piano gratuito include 300 richieste al mese.

# Add your API key to requests
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

Usa il risultato

Ogni risposta restituisce la stessa struttura JSON indipendentemente dal formato di input:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "webpage",
  "metadata": { "url": "https://example.com" }
}

Autenticazione

ParseJet offre tre livelli di accesso. Puoi iniziare a usare l'API immediatamente senza alcuna autenticazione.

Livello	Come accedere	Limite di richieste	Ideale per
Anonimo	Nessun header	3/giorno, 2MB	Test rapidi
Sessione	Accedi (cookie)	10/giorno, 5MB	Strumento dashboard
Chiave API	`Authorization: Bearer pj_xxx`	In base al piano	Produzione

Suggerimento: Non hai bisogno di una chiave API per iniziare. Invia semplicemente le richieste direttamente — le prime 3 al giorno sono gratuite senza registrazione.

Concetti Fondamentali

Formati supportati

ParseJet rileva automaticamente il formato dall'estensione del file o dal pattern dell'URL. Non è necessario specificare il formato — basta inviare il file o l'URL a /v1/parse/auto e ParseJet gestisce il resto.

Categoria	Formati	Crediti
Testo	TXT, MD, JSON, CSV, XML, HTML	1
Documenti	DOCX, PPTX, XLSX, EPUB	2
Complessi	PDF, pagine web, video	3
YouTube	URL video YouTube	5
Altro	Audio (MP3, WAV), immagini (JPG, PNG), RSS, OPML, email, notebook	1

Crediti

Ogni richiesta API consuma crediti in base alla complessità del formato analizzato. I file di testo semplici costano 1 credito, mentre le trascrizioni YouTube costano 5. La tua dotazione mensile di crediti dipende dal tuo piano.

Formato di output

Di default, ParseJet restituisce il testo estratto grezzo. Aggiungi ?output_format=markdown a qualsiasi richiesta per ottenere un output post-elaborato con titoli, elenchi, tabelle e blocchi di codice rilevati.

Guida

Analizza un PDF

Estrai testo da qualsiasi file PDF, inclusi documenti scansionati e report multipagina.

Carica un file PDF

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Converti in Markdown

Aggiungi output_format=markdown per preservare la struttura del documento:

curl -X POST https://api.parsejet.com/v1/parse/auto/file?output_format=markdown \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Costo in crediti: 3 crediti per PDF. Supporta file fino al limite di dimensione del tuo piano (10MB-200MB).

Guida

Trascrizioni YouTube

Ottieni la trascrizione completa di qualsiasi video YouTube. Supporta sottotitoli generati automaticamente in oltre 100 lingue.

Ottieni una trascrizione

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID"}'

Specifica la lingua

Usa il parametro language per video non in inglese:

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "ja"}'

Oppure usa il rilevamento automatico

L'endpoint /v1/parse/auto/url rileva automaticamente gli URL di YouTube:

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtu.be/VIDEO_ID"}'

Costo in crediti: 5 crediti per video YouTube. I metadati includono video_id, canale e durata.

Guida

Web Scraping

Estrai il contenuto principale da qualsiasi pagina web. ParseJet rimuove automaticamente navigazione, annunci, barre laterali e boilerplate.

curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/blog/article"}'

Costo crediti: 3 crediti per pagina web. Restituisce testo pulito con titolo e URL di origine nei metadati.

Guida

Documenti Office

Analizza file Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e CSV. Basta caricare il file — ParseJet rileva automaticamente il formato.

# Works with any Office format
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

# Also works with spreadsheets
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Costo crediti: 2 crediti per documento. Supportati: DOCX, PPTX, XLSX, CSV.

Riferimento API

Formato Risposta

Tutti gli endpoint restituiscono la stessa struttura JSON:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "pdf",
  "metadata": { "pages": 12, "author": "Jane Doe" }
}

Campo	Tipo	Descrizione
text	string	Il contenuto testuale estratto
title	string	Titolo del documento o della pagina
source_type	string	Identificatore del formato (pdf, webpage, youtube, ecc.)
metadata	object	Metadati specifici del formato (numero pagine, autore, durata, ecc.)

POST

/v1/parse/auto

L'endpoint consigliato. Rileva automaticamente il formato dall'estensione del file o dal tipo di URL. Accetta file (multipart) o url (campo form), non entrambi.

curl -X POST https://api.parsejet.com/v1/parse/auto \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

POST

/v1/parse/auto/url

Analizza qualsiasi URL. Distingue automaticamente YouTube dalle normali pagine web.

Parametro	Tipo	Obbligatorio	Descrizione
url	string	sì	URL da analizzare
language	string	no	Codice ISO 639-1 per la lingua dei sottotitoli YouTube

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

POST

/v1/parse/auto/file

Analizza qualsiasi file caricato. Rileva il formato dall'estensione del file, altrimenti usa il rilevamento basato sul contenuto.

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

POST

/v1/parse/webpage

Estrai il contenuto principale da una pagina web. Rimuove navigazione, annunci e boilerplate.

Parametro	Tipo	Obbligatorio	Descrizione
url	string	sì	URL pagina web

curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/article"}'

POST

/v1/parse/youtube

Estrai la trascrizione da un video YouTube. I metadati includono video_id, canale e durata.

Parametro	Tipo	Obbligatorio	Descrizione
url	string	sì	URL video YouTube o ID video
language	string	no	Codice lingua ISO 639-1

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "en"}'

POST

/v1/parse/audio

Analizza file audio. Supporta MP3, WAV, M4A, OGG, FLAC, WebM. Max 25MB.

Campo	Tipo	Obbligatorio	Descrizione
file	file	sì	File audio
language	string	no	Codice ISO 639-1
with_timestamps	boolean	no	Includi timestamp a livello di parola

curl -X POST https://api.parsejet.com/v1/parse/audio \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"

POST

/v1/parse/video

Estrai audio dal video per la trascrizione. Supporta MP4, MKV, AVI, MOV, WebM.

curl -X POST https://api.parsejet.com/v1/parse/video \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"

POST

/v1/parse/epub

Analizza ebook EPUB. Estrae il testo organizzato per capitoli.

curl -X POST https://api.parsejet.com/v1/parse/epub \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

POST

/v1/parse/feed

Analizza feed RSS o Atom. Supporta anche OPML tramite /v1/parse/opml.

curl -X POST https://api.parsejet.com/v1/parse/feed \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

POST

/v1/parse/image

Analizza immagine. Supporta JPG, PNG, GIF, BMP, WebP, TIFF. Max 20MB.

Campo	Tipo	Obbligatorio	Descrizione
file	file	sì	File immagine
prompt	string	no	Prompt personalizzato per l'analisi dell'immagine
model	string	no	Override modello visione

curl -X POST https://api.parsejet.com/v1/parse/image \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "prompt=Describe this image"

POST

/v1/parse/image/ocr

Estrai testo dall'immagine tramite OCR.

curl -X POST https://api.parsejet.com/v1/parse/image/ocr \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

SDK

SDK ufficiali

TypeScript / JavaScript

npm install parsejet

import { ParseJet } from "parsejet";

const client = new ParseJet({ apiKey: "pj_YOUR_KEY" });

// Parse a URL
const result = await client.parse.url("https://example.com");
console.log(result.text);

// Parse a file
const result = await client.parse.file(buffer, "report.pdf");
console.log(result.text);

Python

pip install parsejet

from parsejet import ParseJet

client = ParseJet(api_key="pj_YOUR_KEY")

# Parse a URL
result = client.parse.url("https://example.com")
print(result.text)

# Parse a file
with open("report.pdf", "rb") as f:
    result = client.parse.file(f, "report.pdf")
    print(result.text)

Agenti AI

Server MCP

Usa ParseJet come server MCP (Model Context Protocol) con Claude Code, Cursor o qualsiasi agente AI compatibile MCP.

Installa

npm install -g @parsejet/mcp-server

Claude Code

Aggiungi al file .claude/settings.json del tuo progetto:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Cursor

Vai su Impostazioni → Server MCP, aggiungi un nuovo server:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Claude.ai (Remoto)

Per Claude.ai web, usa l'endpoint HTTP remoto — nessuna installazione locale necessaria:

Endpoint:  https://api.parsejet.com/mcp
Transport: Streamable HTTP
Auth:      Bearer pj_YOUR_KEY (in Authorization header)

Vai su Claude.ai → Impostazioni → Integrazioni → Aggiungi Server MCP → Inserisci l'URL sopra.

Strumenti disponibili

Strumento	Descrizione
parse_url	Analizza qualsiasi URL (pagina web, YouTube, ecc.)
parse_file	Analizza un file locale (PDF, DOCX, immagini, ecc.)
get_youtube_transcript	Ottieni trascrizione video YouTube con lingua opzionale

Limiti di frequenza e Prezzi

ParseJet utilizza un sistema basato su crediti. Ogni richiesta consuma crediti in base alla complessità del formato.

Piano	Prezzo	Crediti/mese	RPM	File max
Free	$0	300	5	10MB
Pro	$19/mo	3,000	30	50MB
Business	$49/mo	20,000	60	100MB
Scale	$99/mo	50,000	200	200MB
Enterprise	Custom	Custom	Custom	Custom

Gli header di risposta includono X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset e Retry-After per risposte 429.

Codici di Errore

Tutti gli errori restituiscono JSON con i campi error e message.

Stato	Codice	Descrizione
400	unsupported_format	Tipo di file non supportato
401	invalid_api_key	Chiave API mancante o non valida
413	file_too_large	File supera il limite del piano
422	parse_error	File danneggiato o illeggibile
429	rate_limit_exceeded	Limite RPM o giornaliero/mensile raggiunto
502	parser_unavailable	Backend del parser non raggiungibile
504	parser_timeout	Operazione di parsing scaduta