Documentación

Documentación de ParseJet

Name: ParseJet
Author: ParseJet

ParseJet extrae texto de cualquier archivo o URL. Una llamada a la API maneja PDF, DOCX, YouTube, páginas web, imágenes, audio, video y más de 25 formatos.

Inicio Rápido

Obtén tu primer resultado de análisis en menos de 60 segundos. No se requiere registro.

Pruébalo al instante

Pega cualquier URL en ParseJet — no se necesita clave de API para tus primeras 3 solicitudes por día.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

Obtén tu clave de API

Inicia sesión con Google o GitHub para obtener una clave de API gratuita. El plan gratuito incluye 300 solicitudes por mes.

# Add your API key to requests
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

Usa el resultado

Cada respuesta devuelve la misma estructura JSON independientemente del formato de entrada:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "webpage",
  "metadata": { "url": "https://example.com" }
}

Autenticación

ParseJet ofrece tres niveles de acceso. Puedes empezar a usar la API inmediatamente sin ninguna autenticación.

Nivel	Cómo acceder	Límite de tasa	Ideal para
Anónimo	Sin cabeceras	3/día, 2MB	Pruebas rápidas
Sesión	Iniciar sesión (cookie)	10/día, 5MB	Herramienta del panel
Clave de API	`Authorization: Bearer pj_xxx`	Por plan	Producción

Consejo: No necesitas una clave de API para empezar. Solo envía solicitudes directamente — las primeras 3 por día son gratuitas sin registro.

Conceptos Fundamentales

Formatos admitidos

ParseJet detecta automáticamente el formato a partir de la extensión del archivo o el patrón de la URL. No necesitas especificar el formato — solo envía el archivo o la URL a /v1/parse/auto y ParseJet se encarga del resto.

Categoría	Formatos	Créditos
Texto	TXT, MD, JSON, CSV, XML, HTML	1
Documentos	DOCX, PPTX, XLSX, EPUB	2
Complejos	PDF, páginas web, video	3
YouTube	URLs de videos de YouTube	5
Otros	Audio (MP3, WAV), imágenes (JPG, PNG), RSS, OPML, correo electrónico, cuadernos	1

Créditos

Cada solicitud a la API consume créditos según la complejidad del formato que se está analizando. Los archivos de texto simples cuestan 1 crédito, mientras que las transcripciones de YouTube cuestan 5. Tu asignación mensual de créditos depende de tu plan.

Formato de salida

Por defecto, ParseJet devuelve el texto extraído en bruto. Añade ?output_format=markdown a cualquier solicitud para obtener una salida procesada con encabezados, listas, tablas y bloques de código detectados.

Guía

Analizar un PDF

Extrae texto de cualquier archivo PDF, incluidos documentos escaneados e informes de varias páginas.

Subir un archivo PDF

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Convertir a Markdown

Añade output_format=markdown para preservar la estructura del documento:

curl -X POST https://api.parsejet.com/v1/parse/auto/file?output_format=markdown \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Costo en créditos: 3 créditos por PDF. Admite archivos hasta el límite de tamaño de tu plan (10MB-200MB).

Guía

Transcripciones de YouTube

Obtén la transcripción completa de cualquier video de YouTube. Admite subtítulos generados automáticamente en más de 100 idiomas.

Obtener una transcripción

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID"}'

Especificar idioma

Usa el parámetro language para videos que no estén en inglés:

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "ja"}'

O usar detección automática

El endpoint /v1/parse/auto/url detecta automáticamente las URLs de YouTube:

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtu.be/VIDEO_ID"}'

Costo en créditos: 5 créditos por video de YouTube. Los metadatos incluyen video_id, canal y duración.

Guía

Web Scraping

Extrae el contenido principal de cualquier página web. ParseJet elimina automáticamente la navegación, anuncios, barras laterales y contenido repetitivo.

curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/blog/article"}'

Costo en créditos: 3 créditos por página web. Devuelve texto limpio con título y URL de origen en los metadatos.

Guía

Documentos de Oficina

Analiza archivos de Word (DOCX), Excel (XLSX), PowerPoint (PPTX) y CSV. Solo sube el archivo — ParseJet detecta el formato automáticamente.

# Works with any Office format
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

# Also works with spreadsheets
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Costo en créditos: 2 créditos por documento. Compatible con: DOCX, PPTX, XLSX, CSV.

Referencia de la API

Formato de Respuesta

Todos los endpoints devuelven la misma estructura JSON:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "pdf",
  "metadata": { "pages": 12, "author": "Jane Doe" }
}

Campo	Tipo	Descripción
text	string	El contenido de texto extraído
title	string	Título del documento o página
source_type	string	Identificador de formato (pdf, webpage, youtube, etc.)
metadata	object	Metadatos específicos del formato (número de páginas, autor, duración, etc.)

POST

/v1/parse/auto

El endpoint recomendado. Detecta automáticamente el formato por extensión de archivo o tipo de URL. Acepta file (multipart) o url (campo de formulario), no ambos.

curl -X POST https://api.parsejet.com/v1/parse/auto \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

POST

/v1/parse/auto/url

Analiza cualquier URL. Distingue automáticamente YouTube de páginas web regulares.

Parámetro	Tipo	Obligatorio	Descripción
url	string	sí	URL a analizar
language	string	no	Código ISO 639-1 para el idioma de la transcripción de YouTube

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

POST

/v1/parse/auto/file

Analiza cualquier archivo subido. Detecta el formato por extensión de archivo, recurre a detección basada en contenido.

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

POST

/v1/parse/webpage

Extrae el contenido principal de una página web. Elimina navegación, anuncios y contenido repetitivo.

Parámetro	Tipo	Obligatorio	Descripción
url	string	sí	URL de la página web

curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/article"}'

POST

/v1/parse/youtube

Extrae la transcripción de un video de YouTube. Los metadatos incluyen video_id, canal y duración.

Parámetro	Tipo	Obligatorio	Descripción
url	string	sí	URL del video de YouTube o ID del video
language	string	no	Código de idioma ISO 639-1

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "en"}'

POST

/v1/parse/audio

Analiza archivos de audio. Compatible con MP3, WAV, M4A, OGG, FLAC, WebM. Máx. 25MB.

Campo	Tipo	Obligatorio	Descripción
file	file	sí	Archivo de audio
language	string	no	Código ISO 639-1
with_timestamps	boolean	no	Incluir marcas de tiempo a nivel de palabra

curl -X POST https://api.parsejet.com/v1/parse/audio \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"

POST

/v1/parse/video

Extrae audio de video para transcripción. Compatible con MP4, MKV, AVI, MOV, WebM.

curl -X POST https://api.parsejet.com/v1/parse/video \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"

POST

/v1/parse/epub

Analiza libro electrónico EPUB. Extrae texto organizado por capítulos.

curl -X POST https://api.parsejet.com/v1/parse/epub \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

POST

/v1/parse/feed

Analiza feed RSS o Atom. También compatible con OPML vía /v1/parse/opml.

curl -X POST https://api.parsejet.com/v1/parse/feed \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

POST

/v1/parse/image

Analiza imagen. Compatible con JPG, PNG, GIF, BMP, WebP, TIFF. Máx. 20MB.

Campo	Tipo	Obligatorio	Descripción
file	file	sí	Archivo de imagen
prompt	string	no	Prompt personalizado para análisis de imagen
model	string	no	Anulación del modelo de visión

curl -X POST https://api.parsejet.com/v1/parse/image \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "prompt=Describe this image"

POST

/v1/parse/image/ocr

Extrae texto de imagen mediante OCR.

curl -X POST https://api.parsejet.com/v1/parse/image/ocr \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

SDKs

SDKs oficiales

TypeScript / JavaScript

npm install parsejet

import { ParseJet } from "parsejet";

const client = new ParseJet({ apiKey: "pj_YOUR_KEY" });

// Parse a URL
const result = await client.parse.url("https://example.com");
console.log(result.text);

// Parse a file
const result = await client.parse.file(buffer, "report.pdf");
console.log(result.text);

Python

pip install parsejet

from parsejet import ParseJet

client = ParseJet(api_key="pj_YOUR_KEY")

# Parse a URL
result = client.parse.url("https://example.com")
print(result.text)

# Parse a file
with open("report.pdf", "rb") as f:
    result = client.parse.file(f, "report.pdf")
    print(result.text)

Agentes de IA

Servidor MCP

Usa ParseJet como un servidor MCP (Model Context Protocol) con Claude Code, Cursor o cualquier agente de IA compatible con MCP.

Instalar

npm install -g @parsejet/mcp-server

Claude Code

Agrega al .claude/settings.json de tu proyecto:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Cursor

Ve a Configuración → Servidores MCP, agrega un nuevo servidor:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Claude.ai (Remoto)

Para Claude.ai web, usa el endpoint HTTP remoto — no se necesita instalación local:

Endpoint:  https://api.parsejet.com/mcp
Transport: Streamable HTTP
Auth:      Bearer pj_YOUR_KEY (in Authorization header)

Ve a Claude.ai → Configuración → Integraciones → Agregar servidor MCP → Ingresa la URL de arriba.

Herramientas disponibles

Herramienta	Descripción
parse_url	Analizar cualquier URL (página web, YouTube, etc.)
parse_file	Analizar un archivo local (PDF, DOCX, imágenes, etc.)
get_youtube_transcript	Obtener transcripción de video de YouTube con idioma opcional

Límites de tasa y Precios

ParseJet usa un sistema basado en créditos. Cada solicitud consume créditos según la complejidad del formato.

Plan	Precio	Créditos/mes	RPM	Archivo máx.
Free	$0	300	5	10MB
Pro	$19/mo	3,000	30	50MB
Business	$49/mo	20,000	60	100MB
Scale	$99/mo	50,000	200	200MB
Enterprise	Custom	Custom	Custom	Custom

Los encabezados de respuesta incluyen X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset, y Retry-After en respuestas 429.

Códigos de Error

Todos los errores devuelven JSON con los campos error y message.

Estado	Código	Descripción
400	unsupported_format	Tipo de archivo no compatible
401	invalid_api_key	Clave de API faltante o inválida
413	file_too_large	Archivo excede el límite del plan
422	parse_error	Archivo corrupto o ilegible
429	rate_limit_exceeded	Límite de RPM o diario/mensual alcanzado
502	parser_unavailable	Backend del parser inalcanzable
504	parser_timeout	La operación de análisis expiró