ParseJet

Documentación

Documentación de ParseJet

ParseJet extrae texto de cualquier archivo o URL. Una llamada a la API maneja PDF, DOCX, YouTube, páginas web, imágenes, audio, video y más de 25 formatos.

Inicio Rápido

Obtén tu primer resultado de análisis en menos de 60 segundos. No se requiere registro.

1

Pruébalo al instante

Pega cualquier URL en ParseJet — no se necesita clave de API para tus primeras 3 solicitudes por día.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
2

Obtén tu clave de API

Inicia sesión con Google o GitHub para obtener una clave de API gratuita. El plan gratuito incluye 300 solicitudes por mes.

# Add your API key to requests
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
3

Usa el resultado

Cada respuesta devuelve la misma estructura JSON independientemente del formato de entrada:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "webpage",
  "metadata": { "url": "https://example.com" }
}

Autenticación

ParseJet ofrece tres niveles de acceso. Puedes empezar a usar la API inmediatamente sin ninguna autenticación.

Nivel Cómo acceder Límite de tasa Ideal para
AnónimoSin cabeceras3/día, 2MBPruebas rápidas
SesiónIniciar sesión (cookie)10/día, 5MBHerramienta del panel
Clave de APIAuthorization: Bearer pj_xxxPor planProducción

Consejo: No necesitas una clave de API para empezar. Solo envía solicitudes directamente — las primeras 3 por día son gratuitas sin registro.

Conceptos Fundamentales

Formatos admitidos

ParseJet detecta automáticamente el formato a partir de la extensión del archivo o el patrón de la URL. No necesitas especificar el formato — solo envía el archivo o la URL a /v1/parse/auto y ParseJet se encarga del resto.

Categoría Formatos Créditos
TextoTXT, MD, JSON, CSV, XML, HTML1
DocumentosDOCX, PPTX, XLSX, EPUB2
ComplejosPDF, páginas web, video3
YouTubeURLs de videos de YouTube5
OtrosAudio (MP3, WAV), imágenes (JPG, PNG), RSS, OPML, correo electrónico, cuadernos1

Créditos

Cada solicitud a la API consume créditos según la complejidad del formato que se está analizando. Los archivos de texto simples cuestan 1 crédito, mientras que las transcripciones de YouTube cuestan 5. Tu asignación mensual de créditos depende de tu plan.

Formato de salida

Por defecto, ParseJet devuelve el texto extraído en bruto. Añade ?output_format=markdown a cualquier solicitud para obtener una salida procesada con encabezados, listas, tablas y bloques de código detectados.

Guía

Analizar un PDF

Extrae texto de cualquier archivo PDF, incluidos documentos escaneados e informes de varias páginas.

Subir un archivo PDF

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Convertir a Markdown

Añade output_format=markdown para preservar la estructura del documento:

curl -X POST https://api.parsejet.com/v1/parse/auto/file?output_format=markdown \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Costo en créditos: 3 créditos por PDF. Admite archivos hasta el límite de tamaño de tu plan (10MB-200MB).

Guía

Transcripciones de YouTube

Obtén la transcripción completa de cualquier video de YouTube. Admite subtítulos generados automáticamente en más de 100 idiomas.

Obtener una transcripción

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID"}'

Especificar idioma

Usa el parámetro language para videos que no estén en inglés:

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "ja"}'

O usar detección automática

El endpoint /v1/parse/auto/url detecta automáticamente las URLs de YouTube:

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtu.be/VIDEO_ID"}'

Costo en créditos: 5 créditos por video de YouTube. Los metadatos incluyen video_id, canal y duración.

Guía

Web Scraping

Extrae el contenido principal de cualquier página web. ParseJet elimina automáticamente la navegación, anuncios, barras laterales y contenido repetitivo.

curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/blog/article"}'

Costo en créditos: 3 créditos por página web. Devuelve texto limpio con título y URL de origen en los metadatos.

Guía

Documentos de Oficina

Analiza archivos de Word (DOCX), Excel (XLSX), PowerPoint (PPTX) y CSV. Solo sube el archivo — ParseJet detecta el formato automáticamente.

# Works with any Office format
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

# Also works with spreadsheets
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Costo en créditos: 2 créditos por documento. Compatible con: DOCX, PPTX, XLSX, CSV.

Referencia de la API

Formato de Respuesta

Todos los endpoints devuelven la misma estructura JSON:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "pdf",
  "metadata": { "pages": 12, "author": "Jane Doe" }
}
Campo Tipo Descripción
textstringEl contenido de texto extraído
titlestringTítulo del documento o página
source_typestringIdentificador de formato (pdf, webpage, youtube, etc.)
metadataobjectMetadatos específicos del formato (número de páginas, autor, duración, etc.)
POST

/v1/parse/auto

El endpoint recomendado. Detecta automáticamente el formato por extensión de archivo o tipo de URL. Acepta file (multipart) o url (campo de formulario), no ambos.

curl -X POST https://api.parsejet.com/v1/parse/auto \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/auto/url

Analiza cualquier URL. Distingue automáticamente YouTube de páginas web regulares.

ParámetroTipoObligatorioDescripción
urlstringURL a analizar
languagestringnoCódigo ISO 639-1 para el idioma de la transcripción de YouTube
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
POST

/v1/parse/auto/file

Analiza cualquier archivo subido. Detecta el formato por extensión de archivo, recurre a detección basada en contenido.

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/webpage

Extrae el contenido principal de una página web. Elimina navegación, anuncios y contenido repetitivo.

ParámetroTipoObligatorioDescripción
urlstringURL de la página web
curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/article"}'
POST

/v1/parse/youtube

Extrae la transcripción de un video de YouTube. Los metadatos incluyen video_id, canal y duración.

ParámetroTipoObligatorioDescripción
urlstringURL del video de YouTube o ID del video
languagestringnoCódigo de idioma ISO 639-1
curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "en"}'
POST

/v1/parse/audio

Analiza archivos de audio. Compatible con MP3, WAV, M4A, OGG, FLAC, WebM. Máx. 25MB.

CampoTipoObligatorioDescripción
filefileArchivo de audio
languagestringnoCódigo ISO 639-1
with_timestampsbooleannoIncluir marcas de tiempo a nivel de palabra
curl -X POST https://api.parsejet.com/v1/parse/audio \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/video

Extrae audio de video para transcripción. Compatible con MP4, MKV, AVI, MOV, WebM.

curl -X POST https://api.parsejet.com/v1/parse/video \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/epub

Analiza libro electrónico EPUB. Extrae texto organizado por capítulos.

curl -X POST https://api.parsejet.com/v1/parse/epub \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/feed

Analiza feed RSS o Atom. También compatible con OPML vía /v1/parse/opml.

curl -X POST https://api.parsejet.com/v1/parse/feed \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/image

Analiza imagen. Compatible con JPG, PNG, GIF, BMP, WebP, TIFF. Máx. 20MB.

CampoTipoObligatorioDescripción
filefileArchivo de imagen
promptstringnoPrompt personalizado para análisis de imagen
modelstringnoAnulación del modelo de visión
curl -X POST https://api.parsejet.com/v1/parse/image \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "prompt=Describe this image"
POST

/v1/parse/image/ocr

Extrae texto de imagen mediante OCR.

curl -X POST https://api.parsejet.com/v1/parse/image/ocr \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

SDKs

SDKs oficiales

TypeScript / JavaScript

npm install parsejet
import { ParseJet } from "parsejet";

const client = new ParseJet({ apiKey: "pj_YOUR_KEY" });

// Parse a URL
const result = await client.parse.url("https://example.com");
console.log(result.text);

// Parse a file
const result = await client.parse.file(buffer, "report.pdf");
console.log(result.text);

Python

pip install parsejet
from parsejet import ParseJet

client = ParseJet(api_key="pj_YOUR_KEY")

# Parse a URL
result = client.parse.url("https://example.com")
print(result.text)

# Parse a file
with open("report.pdf", "rb") as f:
    result = client.parse.file(f, "report.pdf")
    print(result.text)

Agentes de IA

Servidor MCP

Usa ParseJet como un servidor MCP (Model Context Protocol) con Claude Code, Cursor o cualquier agente de IA compatible con MCP.

Instalar

npm install -g @parsejet/mcp-server

Claude Code

Agrega al .claude/settings.json de tu proyecto:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Cursor

Ve a Configuración → Servidores MCP, agrega un nuevo servidor:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Claude.ai (Remoto)

Para Claude.ai web, usa el endpoint HTTP remoto — no se necesita instalación local:

Endpoint:  https://api.parsejet.com/mcp
Transport: Streamable HTTP
Auth:      Bearer pj_YOUR_KEY (in Authorization header)

Ve a Claude.ai → Configuración → Integraciones → Agregar servidor MCP → Ingresa la URL de arriba.

Herramientas disponibles

Herramienta Descripción
parse_urlAnalizar cualquier URL (página web, YouTube, etc.)
parse_fileAnalizar un archivo local (PDF, DOCX, imágenes, etc.)
get_youtube_transcriptObtener transcripción de video de YouTube con idioma opcional

Límites de tasa y Precios

ParseJet usa un sistema basado en créditos. Cada solicitud consume créditos según la complejidad del formato.

Plan Precio Créditos/mes RPM Archivo máx.
Free$0300510MB
Pro$19/mo3,0003050MB
Business$49/mo20,00060100MB
Scale$99/mo50,000200200MB
EnterpriseCustomCustomCustomCustom

Los encabezados de respuesta incluyen X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset, y Retry-After en respuestas 429.

Códigos de Error

Todos los errores devuelven JSON con los campos error y message.

EstadoCódigoDescripción
400unsupported_formatTipo de archivo no compatible
401invalid_api_keyClave de API faltante o inválida
413file_too_largeArchivo excede el límite del plan
422parse_errorArchivo corrupto o ilegible
429rate_limit_exceededLímite de RPM o diario/mensual alcanzado
502parser_unavailableBackend del parser inalcanzable
504parser_timeoutLa operación de análisis expiró