ParseJet

PDF Ayrıştırıcı

ParseJet, tek bir API çağrısıyla herhangi bir PDF'den metin, başlık ve meta veri çıkaran geliştirici dostu bir PDF ayrıştırıcıdır. Kurulacak bağımlılık yok — pdf-parse, pdfplumber veya PyMuPDF'yi tek bir HTTP endpoint'i ile değiştirin.

Bir dosyayı buraya bırakın veya göz atın

PDF dosyalarını kabul eder

Ücretsiz — günde 3 istek, kayıt gerekmez. ayda 300 kredi ücretsiz için.

Nasıl çalışır

1

PDF'nizi gönderin

Yukarıdaki araçla bir dosya yükleyin veya API'ye POST yapın. ParseJet formatı otomatik algılar — yapılandırma gerekmez.

2

Ayrıştırın ve çıkarın

ParseJet, metin, başlık, yazar, sayfa sayısı ve içerik yapısını çıkarır. Taranmış sayfalara OCR otomatik olarak uygulanır.

3

Yapılandırılmış JSON alın

Uygulamanızda kullanıma hazır, metin, başlık, source_type ve meta veri içeren temiz bir JSON yanıtı alın.

Temel özellikler

Bu pdf parser aracını öne çıkaran özellikler.

Sıfır bağımlılık

poppler, pdftotext veya herhangi bir yerel kütüphane kurmanıza gerek yok. ParseJet barındırılan bir API'dir — sadece bir HTTP isteği yapın.

Doğrudan değiştirme

pdf-parse (Node.js), pdfplumber (Python) veya PyMuPDF'yi tek bir API çağrısı ile değiştirin. Herhangi bir dilden çalışır.

Zengin meta veri

Sadece ham metin değil, belge başlığı, yazar, oluşturulma tarihi, sayfa sayısı ve algılanan içerik türünü döndürür.

Tutarlı JSON çıktısı

Her yanıt aynı şemayı izler: { text, title, source_type, metadata }. Format'a özel işleme gerekmez.

Dahili OCR

Taranmış PDF'ler otomatik olarak OCR ile işlenir. Ayrı bir OCR adımı veya yapılandırma gerekmez.

Tablo algılama

PDF'lerdeki tablo verilerini algılar. Düzgün biçimlendirilmiş tablolar için Markdown çıktısı isteyin.

Kullanım senaryoları

Bu aracın size zaman kazandırdığı yaygın senaryolar.

Node.js'de pdf-parse'ı değiştirin

npm pdf-parse paketini kullanıyorsanız ve yerel bağımlılıklar veya bakım sorunları yaşıyorsanız, ParseJet HTTP üzerinden doğrudan bir değiştirme seçeneğidir.

Python'da pdfplumber'ı değiştirin

pdfplumber, Python ve yerel kütüphaneler gerektirir. ParseJet, API üzerinden aynı çıkarma işlemini sağlar, böylece herhangi bir dilden veya sunucusuz fonksiyondan çağırabilirsiniz.

Belge işleme hatları

Gelen PDF'leri — faturalar, raporlar, formlar — ayrıştıran ve çıkarılan verileri veritabanınıza veya CRM'inize yönlendiren otomatik iş akışları oluşturun.

RAG belge alımı

Alım-güçlendirilmiş üretim hattınızın bir parçası olarak PDF'leri ayrıştırın. ParseJet, LLM'lere daha iyi bağlam sağlayan yapılandırılmış metin döndürür.

API ile otomatikleştirin

Aynı aracı programatik olarak kullanın. Herhangi bir dil ile çalışır — sadece HTTP.

cURL
# Parse a PDF and get text + metadata
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]"

# Response:
# {
#   "text": "Invoice #1234\nDate: 2026-03-15\n...",
#   "title": "Invoice #1234",
#   "source_type": "pdf",
#   "metadata": { "pages": 2, "author": "Acme Corp" }
# }
Python
import httpx

# Before (pdf-parse / pdfplumber):
#   import pdfplumber
#   with pdfplumber.open("invoice.pdf") as pdf:
#       text = "\n".join(p.extract_text() for p in pdf.pages)

# After (ParseJet — no dependencies):
resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/file",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    files={"file": open("invoice.pdf", "rb")},
)
result = resp.json()
text = result["text"]          # All text, all pages
title = result["title"]        # Document title
pages = result["metadata"]["pages"]  # Page count
JavaScript
// Before (pdf-parse):
//   const pdfParse = require("pdf-parse");
//   const data = await pdfParse(buffer);

// After (ParseJet — no native dependencies):
const formData = new FormData();
formData.append("file", pdfBuffer, "invoice.pdf");

const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  headers: { Authorization: "Bearer YOUR_API_KEY" },
  body: formData,
});
const { text, title, source_type, metadata } = await res.json();
// Works in Node.js, Deno, Bun, Cloudflare Workers — anywhere with fetch

Bunu otomatikleştirmek mi istiyorsunuz?

ParseJet API, aynı ayrıştırma gücünü tek bir HTTP endpoint'i ile sunar. ffmpeg yok, poppler yok, tesseract yok — sadece bir API çağrısı.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Content-Type: application/json" \ -d '{"url":"https://example.com"}'
API Dokümanlarını Okuyun

Sıkça sorulan sorular

ParseJet, pdf-parse (npm) ile nasıl karşılaştırılır?

pdf-parse, yerel kurulum gerektiren ve sadece temel metin çıkarma işlemi yapan bir Node.js kütüphanesidir. ParseJet, OCR ile taranmış belgeler dahil herhangi bir PDF'den metin, meta veri ve yapı çıkaran, sıfır bağımlılıklı barındırılan bir API'dir.

pdfplumber (Python) ile nasıl karşılaştırılır?

pdfplumber tablo çıkarma için mükemmeldir ancak Python ve yerel işleme gerektirir. ParseJet, HTTP üzerinden benzer yetenekler sunar, böylece Python veya yerel bağımlılıklar kurmadan herhangi bir dilden kullanabilirsiniz.

PDF ayrıştırıcı hangi meta verileri çıkarır?

ParseJet, belge başlığı, yazar, oluşturulma tarihi, sayfa sayısı ve algılanan içerik türünü çıkarır. Tam metin ve meta veriler yapılandırılmış bir JSON yanıtında döndürülür.

Sunucusuz bir ortamda kullanabilir miyim?

Evet. ParseJet bir HTTP API'si olduğu için AWS Lambda, Vercel Functions, Cloudflare Workers ve herhangi bir sunucusuz platformda çalışır — paketlenecek yerel ikili bağımlılık yoktur.

PDF tablo çıkarmayı destekliyor mu?

Evet. ParseJet PDF'lerdeki tabloları algılar ve çıkarır, varsayılan olarak bunları düzgün biçimlendirilmiş Markdown tabloları olarak döndürür.

Ücretsiz mi?

Evet. Kayıt olmadan günde 3 ücretsiz ayrıştırma hakkınız var. Aylık 300 kredi için ücretsiz bir hesap oluşturun. Ücretli planlar daha yüksek oran limitleri ve dosya boyutu kotaları ile ayda $19'dan başlar.

Ücretsiz metin çıkarmaya başlayın

Kayıt gerekmez. İlk dosyanızı saniyeler içinde ayrıştırın.