Extraia texto de
qualquer arquivo ou URL

Name: ParseJet
Author: ParseJet

Ferramenta online gratuita para converter PDF em texto, obter transcrições do YouTube e extrair conteúdo de páginas web. Uma API para 25+ formatos — alimente seus agentes de IA ou use diretamente. Chave de API gratuita incluída.

Solte um arquivo aqui ou procure

PDF, DOCX, XLSX, imagens, áudio, vídeo e mais

Grátis — 3 requisições/dia, sem cadastro. para 300 créditos/mês grátis.

Uma ferramenta para cada tarefa de extração de texto

Pare de instalar bibliotecas separadas para cada formato. O ParseJet cuida de todos.

Conversor de PDF para Texto

Extraia texto de arquivos PDF instantaneamente. Lida com documentos digitalizados, relatórios de várias páginas e layouts complexos. Converta PDF para texto simples ou markdown com um clique.

Gerador de Transcrição do YouTube

Obtenha a transcrição completa de qualquer vídeo do YouTube. Suporta todos os idiomas, legendas automáticas e manuais. Perfeito para reutilização de conteúdo, pesquisa e anotações.

Extrator de Conteúdo da Web

Extraia o conteúdo principal de qualquer URL de página da web. Remove automaticamente navegação, anúncios e conteúdo padrão. Retorna texto limpo e legível de qualquer site.

Analisador de Documentos

Analise documentos do Word (DOCX), planilhas do Excel (XLSX), apresentações do PowerPoint (PPTX) e arquivos CSV. Extraia texto estruturado de qualquer formato de documento do Office.

Imagem para Texto (OCR)

Extraia texto de imagens usando OCR. Suporta formatos JPG, PNG, GIF, WebP e TIFF. Leia texto de capturas de tela, fotos de documentos e páginas digitalizadas.

Transcrição de Áudio e Vídeo

Transcreva arquivos de áudio (MP3, WAV, M4A) e extraia áudio de arquivos de vídeo (MP4, MKV, AVI) para transcrição. Converta conteúdo falado em texto pesquisável.

Mais de 25 formatos suportados

Um endpoint. Todos os tipos de arquivo. Saída de texto estruturada.

PDF

DOCX

XLSX

PPTX

CSV

TXT

HTML

Markdown

JSON

XML

EPUB

YouTube

Web Pages

MP3 / Audio

MP4 / Video

JPG / Images

RSS / Atom

OPML

Notebooks

Como funciona

Cole ou faça upload

Insira uma URL ou arquivo. O ParseJet detecta automaticamente o formato — PDF, DOCX, link do YouTube, página web, imagem, áudio ou qualquer um dos 25+ tipos suportados.

Extrair

Texto, título e metadados são extraídos automaticamente. Obtenha uma saída limpa e estruturada, independentemente do formato de entrada.

Use o texto

Copie o resultado para o seu projeto ou integre via API do ParseJet para automatizar a extração de texto em escala.

Por que o ParseJet?

Compare construir seu próprio pipeline de análise com usar o ParseJet.

Faça Você Mesmo

✗ Instale 5-10 bibliotecas separadas (pdfplumber, yt-dlp, trafilatura, python-docx...)
✗ Lide com dependências binárias (ffmpeg, poppler, tesseract)
✗ Escreva lógica de detecção e roteamento de formatos
✗ Enfrente conflitos de versão e problemas de plataforma
✗ Mantenha e atualize cada analisador separadamente
✗ 50-200 linhas de código por formato

Com o ParseJet

✓ Um endpoint HTTP para todos os 25+ formatos
✓ Zero dependências para instalar
✓ Detecção automática — basta enviar o arquivo ou URL
✓ Analisadores sempre atualizados e mantidos para você
✓ Resposta JSON consistente para cada formato
✓ Apenas 3-5 linhas de código no total

Integre em minutos

Funciona com qualquer linguagem. Nenhum SDK necessário — apenas HTTP.

cURL

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

Python

import httpx

resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/url",
    json={"url": "https://youtube.com/watch?v=dQw4w9WgXcQ"}
)
print(resp.json()["text"])  # Full transcript

JavaScript

const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  body: formData, // FormData with your PDF
});
const { text, title, source_type } = await res.json();

Construído para agentes de IA

Dê à sua IA a capacidade de ler qualquer documento ou URL. Uma chamada de API, saída de texto estruturada.

Claude & Claude Code

Use o ParseJet como um servidor MCP ou ferramenta HTTP. Permita que o Claude extraia texto de PDFs, páginas web e documentos durante conversas.

ChatGPT & Agentes GPT

Adicione o ParseJet como uma ação personalizada em GPTs. Seu agente pode analisar qualquer arquivo ou URL e raciocinar sobre o texto extraído.

Gemini & Google AI

Integre via chamada de função. O ParseJet cuida da análise para que o Gemini possa focar em entender o conteúdo.

LangChain & LlamaIndex

Use o ParseJet como um carregador de documentos. Um endpoint substitui dezenas de carregadores específicos de formato no seu pipeline RAG.

OpenClaw & Agentes Open Source

Qualquer agente de IA que possa fazer requisições HTTP pode usar o ParseJet. Suporta o Machine Payments Protocol (MPP) para pagamento autônomo por requisição.

Fluxos de Trabalho de IA Personalizados

Construa pipelines automatizados com n8n, Make ou Zapier. O ParseJet extrai o texto, sua IA o processa. Nenhum código necessário.

Quer automatizar isso?

A ParseJet API oferece o mesmo poder de análise através de um único endpoint HTTP. Sem ffmpeg, sem poppler, sem tesseract — apenas uma chamada de API.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url":"https://example.com"}'

Ler Documentação da API

Perguntas frequentes

Como extrair texto de um arquivo PDF?

Faça upload do seu PDF no ParseJet ou use a API: POST /v1/parse/auto/file com seu PDF. O ParseJet extrai todo o conteúdo de texto, preservando a estrutura e lidando com documentos de várias páginas. Também funciona com PDFs digitalizados via OCR.

Como obter a transcrição de um vídeo do YouTube?

Cole o URL do YouTube no ParseJet ou chame POST /v1/parse/youtube com o URL do vídeo. O ParseJet retorna a transcrição completa com carimbos de tempo. Suporta legendas geradas automaticamente em mais de 100 idiomas.

Posso converter PDF para Markdown?

Sim. Adicione ?output_format=markdown à sua requisição. O ParseJet detecta títulos, listas, tabelas e blocos de código no seu PDF e os converte para uma sintaxe Markdown limpa.

O ParseJet é gratuito?

Sim. Você recebe 3 requisições gratuitas por dia sem cadastro. Crie uma conta gratuita para 300 requisições por mês. Planos pagos começam em US$ 19/mês para 3.000 requisições.

Quais formatos de arquivo o ParseJet suporta?

O ParseJet suporta mais de 25 formatos: PDF, DOCX, XLSX, PPTX, CSV, TXT, HTML, Markdown, JSON, XML, EPUB, vídeos do YouTube, páginas web, MP3, WAV, M4A (áudio), MP4, MKV, AVI (vídeo), JPG, PNG, GIF (imagens), feeds RSS, Atom, OPML, notebooks Jupyter e arquivos de e-mail.

Preciso de uma chave de API?

Não. O acesso anônimo funciona para testes (3 requisições/dia). Para uso em produção, crie uma chave de API gratuita em parsejet.com — você recebe 300 requisições por mês sem custo.

Como o ParseJet se compara ao pdfplumber ou trafilatura?

O ParseJet substitui múltiplas bibliotecas por uma única API. Em vez de instalar pdfplumber para PDFs, trafilatura para páginas web, yt-dlp para YouTube e python-docx para arquivos Word, você faz uma única chamada HTTP para o ParseJet e ele cuida de tudo.

Agentes de IA podem usar o ParseJet?

Sim. O ParseJet suporta o Machine Payments Protocol (MPP) para acesso pago por requisição sem contas. Agentes de IA também podem usar o acesso anônimo (3/dia) ou chaves de API para limites maiores.

Comece a extrair texto gratuitamente

Sem necessidade de cadastro. Analise seu primeiro arquivo em segundos.

Ver Preços

Extraia texto de qualquer arquivo ou URL