Documentação
Documentação do ParseJet
O ParseJet extrai texto de qualquer arquivo ou URL. Uma chamada de API lida com PDF, DOCX, YouTube, páginas web, imagens, áudio, vídeo e mais de 25 formatos.
Início Rápido
Obtenha seu primeiro resultado de análise em menos de 60 segundos. Sem necessidade de cadastro.
Teste instantaneamente
Cole qualquer URL no ParseJet — nenhuma chave de API é necessária para suas primeiras 3 requisições por dia.
Obtenha sua chave de API
Faça login com Google ou GitHub para obter uma chave de API gratuita. O plano gratuito inclui 300 requisições por mês.
Use o resultado
Toda resposta retorna a mesma estrutura JSON, independentemente do formato de entrada:
Autenticação
O ParseJet oferece três níveis de acesso. Você pode começar a usar a API imediatamente sem qualquer autenticação.
Dica: Você não precisa de uma chave de API para começar. Basta enviar requisições diretamente — as 3 primeiras por dia são gratuitas e sem cadastro.
Conceitos Fundamentais
Formatos suportados
O ParseJet detecta automaticamente o formato pela extensão do arquivo ou padrão da URL. Você não precisa especificar o formato — basta enviar o arquivo ou URL para /v1/parse/auto e o ParseJet cuida do resto.
Créditos
Cada requisição à API consome créditos com base na complexidade do formato sendo analisado. Arquivos de texto simples custam 1 crédito, enquanto transcrições do YouTube custam 5. Sua cota mensal de créditos depende do seu plano.
Formato de saída
Por padrão, o ParseJet retorna o texto extraído bruto. Adicione ?output_format=markdown a qualquer requisição para obter uma saída pós-processada com títulos, listas, tabelas e blocos de código detectados.
Guia
Analisar um PDF
Extraia texto de qualquer arquivo PDF, incluindo documentos digitalizados e relatórios com várias páginas.
Enviar um arquivo PDF
Converter para Markdown
Adicione output_format=markdown para preservar a estrutura do documento:
Custo em créditos: 3 créditos por PDF. Suporta arquivos até o limite de tamanho do seu plano (10MB-200MB).
Guia
Transcrições do YouTube
Obtenha a transcrição completa de qualquer vídeo do YouTube. Suporta legendas geradas automaticamente em mais de 100 idiomas.
Obter uma transcrição
Especificar idioma
Use o parâmetro language para vídeos não em inglês:
Ou use detecção automática
O endpoint /v1/parse/auto/url detecta automaticamente URLs do YouTube:
Custo em créditos: 5 créditos por vídeo do YouTube. Os metadados incluem video_id, canal e duração.
Guia
Web Scraping
Extraia o conteúdo principal de qualquer página da web. O ParseJet remove automaticamente navegação, anúncios, barras laterais e conteúdo padrão.
Custo em créditos: 3 créditos por página da web. Retorna texto limpo com título e URL de origem nos metadados.
Guia
Documentos de Escritório
Analise arquivos do Word (DOCX), Excel (XLSX), PowerPoint (PPTX) e CSV. Basta fazer o upload do arquivo — o ParseJet detecta o formato automaticamente.
Custo em créditos: 2 créditos por documento. Suportados: DOCX, PPTX, XLSX, CSV.
Referência da API
Formato da Resposta
Todos os endpoints retornam a mesma estrutura JSON:
/v1/parse/auto
O endpoint recomendado. Detecta automaticamente o formato pela extensão do arquivo ou tipo de URL. Aceita file (multipart) ou url (campo de formulário), não ambos.
/v1/parse/auto/url
Analise qualquer URL. Distingue automaticamente YouTube de páginas da web regulares.
/v1/parse/auto/file
Analise qualquer arquivo enviado. Detecta o formato pela extensão do arquivo, com fallback para detecção baseada em conteúdo.
/v1/parse/webpage
Extraia o conteúdo principal de uma página da web. Remove navegação, anúncios e conteúdo padrão.
/v1/parse/youtube
Extraia a transcrição de um vídeo do YouTube. Os metadados incluem video_id, canal e duração.
/v1/parse/audio
Analise arquivos de áudio. Suporta MP3, WAV, M4A, OGG, FLAC, WebM. Máx. 25MB.
/v1/parse/video
Extraia áudio de vídeo para transcrição. Suporta MP4, MKV, AVI, MOV, WebM.
/v1/parse/epub
Analise e-book EPUB. Extrai texto organizado por capítulos.
/v1/parse/feed
Analise feed RSS ou Atom. Também suporta OPML via /v1/parse/opml.
/v1/parse/image
Analise imagem. Suporta JPG, PNG, GIF, BMP, WebP, TIFF. Máx. 20MB.
/v1/parse/image/ocr
Extraia texto de imagem via OCR.
SDKs
SDKs Oficiais
TypeScript / JavaScript
Python
Agentes de IA
Servidor MCP
Use o ParseJet como um servidor MCP (Model Context Protocol) com Claude Code, Cursor ou qualquer agente de IA compatível com MCP.
Instalar
Claude Code
Adicione ao .claude/settings.json do seu projeto:
Cursor
Vá para Configurações → Servidores MCP, adicione um novo servidor:
Claude.ai (Remoto)
Para o Claude.ai web, use o endpoint HTTP remoto — nenhuma instalação local necessária:
Vá para Claude.ai → Configurações → Integrações → Adicionar Servidor MCP → Insira a URL acima.
Ferramentas disponíveis
Limites de Taxa e Preços
O ParseJet usa um sistema baseado em créditos. Cada requisição consome créditos com base na complexidade do formato.
Os cabeçalhos de resposta incluem X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset e Retry-After em respostas 429.
Códigos de Erro
Todos os erros retornam JSON com os campos error e message.