Convertidor de PDF a Texto
Extrae texto de archivos PDF al instante. Maneja documentos escaneados, informes de varias páginas y diseños complejos. Convierte PDF a texto plano o markdown con un clic.
Herramienta online gratuita para convertir PDF a texto, obtener transcripciones de YouTube y extraer páginas web. Una API para 25+ formatos — potencia tus agentes de IA o úsala directamente. Incluye clave API gratuita.
Suelta un archivo aquí o explorar
PDF, DOCX, XLSX, imágenes, audio, video y más
Gratis — 3 solicitudes/día, sin registro. para 300 créditos/mes gratis.
Deja de instalar bibliotecas separadas para cada formato. ParseJet los maneja todos.
Extrae texto de archivos PDF al instante. Maneja documentos escaneados, informes de varias páginas y diseños complejos. Convierte PDF a texto plano o markdown con un clic.
Obtén la transcripción completa de cualquier video de YouTube. Soporta todos los idiomas, subtítulos automáticos y manuales. Perfecto para reutilizar contenido, investigación y toma de notas.
Extrae el contenido principal de cualquier URL de página web. Elimina automáticamente navegación, anuncios y texto repetitivo. Devuelve texto limpio y legible de cualquier sitio web.
Analiza documentos de Word (DOCX), hojas de cálculo de Excel (XLSX), presentaciones de PowerPoint (PPTX) y archivos CSV. Extrae texto estructurado de cualquier formato de documento de Office.
Extrae texto de imágenes usando OCR. Soporta formatos JPG, PNG, GIF, WebP y TIFF. Lee texto de capturas de pantalla, fotos de documentos y páginas escaneadas.
Transcribe archivos de audio (MP3, WAV, M4A) y extrae audio de archivos de video (MP4, MKV, AVI) para transcripción. Convierte contenido hablado en texto buscable.
Un endpoint. Todo tipo de archivo. Salida de texto estructurado.
Suelta una URL o archivo. ParseJet detecta automáticamente el formato — PDF, DOCX, enlace de YouTube, página web, imagen, audio o cualquiera de los 25+ tipos admitidos.
El texto, título y metadatos se extraen automáticamente. Obtén una salida limpia y estructurada sin importar el formato de entrada.
Copia el resultado para tu proyecto, o integra a través de la API de ParseJet para automatizar la extracción de texto a gran escala.
Compara construir tu propia canalización de análisis frente a usar ParseJet.
Funciona con cualquier lenguaje. No se requiere SDK — solo HTTP.
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
-H "Content-Type: application/json" \
-d '{"url": "https://example.com"}' import httpx
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/url",
json={"url": "https://youtube.com/watch?v=dQw4w9WgXcQ"}
)
print(resp.json()["text"]) # Full transcript const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
method: "POST",
body: formData, // FormData with your PDF
});
const { text, title, source_type } = await res.json(); Dale a tu IA la capacidad de leer cualquier documento o URL. Una llamada a la API, salida de texto estructurado.
Usa ParseJet como un servidor MCP o herramienta HTTP. Permite que Claude extraiga texto de PDFs, páginas web y documentos durante las conversaciones.
Añade ParseJet como una acción personalizada en GPTs. Tu agente puede analizar cualquier archivo o URL y razonar sobre el texto extraído.
Integra mediante llamadas a funciones. ParseJet maneja el análisis para que Gemini pueda centrarse en entender el contenido.
Usa ParseJet como un cargador de documentos. Un endpoint reemplaza docenas de cargadores específicos de formato en tu pipeline RAG.
Cualquier agente de IA que pueda hacer peticiones HTTP puede usar ParseJet. Soporta el Protocolo de Pagos Automatizados (MPP) para pagos autónomos por petición.
Construye pipelines automatizados con n8n, Make o Zapier. ParseJet extrae el texto, tu IA lo procesa. No se requiere código.
ParseJet API te ofrece el mismo poder de análisis a través de un único endpoint HTTP. Sin ffmpeg, sin poppler, sin tesseract — solo una llamada a la API.
Sube tu PDF a ParseJet o usa la API: POST /v1/parse/auto/file con tu PDF. ParseJet extrae todo el contenido de texto, preservando la estructura y manejando documentos de varias páginas. También funciona con PDF escaneados mediante OCR.
Pega la URL de YouTube en ParseJet o llama a POST /v1/parse/youtube con la URL del video. ParseJet devuelve la transcripción completa con marcas de tiempo. Soporta subtítulos generados automáticamente en más de 100 idiomas.
Sí. Añade ?output_format=markdown a tu solicitud. ParseJet detecta encabezados, listas, tablas y bloques de código en tu PDF y los convierte a una sintaxis Markdown limpia.
Sí. Obtienes 3 solicitudes gratuitas al día sin registro. Crea una cuenta gratuita para 300 solicitudes al mes. Los planes de pago comienzan en $19/mes por 3,000 solicitudes.
ParseJet soporta más de 25 formatos: PDF, DOCX, XLSX, PPTX, CSV, TXT, HTML, Markdown, JSON, XML, EPUB, videos de YouTube, páginas web, MP3, WAV, M4A (audio), MP4, MKV, AVI (video), JPG, PNG, GIF (imágenes), feeds RSS, Atom, OPML, cuadernos de Jupyter y archivos de correo electrónico.
No. El acceso anónimo funciona para pruebas (3 solicitudes/día). Para uso en producción, crea una clave API gratuita en parsejet.com — obtienes 300 solicitudes al mes sin costo.
ParseJet reemplaza múltiples bibliotecas con una sola API. En lugar de instalar pdfplumber para PDFs, trafilatura para páginas web, yt-dlp para YouTube y python-docx para archivos de Word, haces una sola llamada HTTP a ParseJet y este maneja todo.
Sí. ParseJet soporta el Protocolo de Pagos por Máquina (MPP) para acceso por petición sin cuentas. Los agentes de IA también pueden usar acceso anónimo (3/día) o claves API para límites más altos.
No requiere registro. Analiza tu primer archivo en segundos.