PDF Ayrıştırıcı
ParseJet, tek bir API çağrısıyla herhangi bir PDF'den metin, başlık ve meta veri çıkaran geliştirici dostu bir PDF ayrıştırıcıdır. Kurulacak bağımlılık yok — pdf-parse, pdfplumber veya PyMuPDF'yi tek bir HTTP endpoint'i ile değiştirin.
Bir dosyayı buraya bırakın veya göz atın
PDF dosyalarını kabul eder
Ücretsiz — günde 3 istek, kayıt gerekmez. ayda 300 kredi ücretsiz için.
Nasıl çalışır
PDF'nizi gönderin
Yukarıdaki araçla bir dosya yükleyin veya API'ye POST yapın. ParseJet formatı otomatik algılar — yapılandırma gerekmez.
Ayrıştırın ve çıkarın
ParseJet, metin, başlık, yazar, sayfa sayısı ve içerik yapısını çıkarır. Taranmış sayfalara OCR otomatik olarak uygulanır.
Yapılandırılmış JSON alın
Uygulamanızda kullanıma hazır, metin, başlık, source_type ve meta veri içeren temiz bir JSON yanıtı alın.
Temel özellikler
Bu pdf parser aracını öne çıkaran özellikler.
Sıfır bağımlılık
poppler, pdftotext veya herhangi bir yerel kütüphane kurmanıza gerek yok. ParseJet barındırılan bir API'dir — sadece bir HTTP isteği yapın.
Doğrudan değiştirme
pdf-parse (Node.js), pdfplumber (Python) veya PyMuPDF'yi tek bir API çağrısı ile değiştirin. Herhangi bir dilden çalışır.
Zengin meta veri
Sadece ham metin değil, belge başlığı, yazar, oluşturulma tarihi, sayfa sayısı ve algılanan içerik türünü döndürür.
Tutarlı JSON çıktısı
Her yanıt aynı şemayı izler: { text, title, source_type, metadata }. Format'a özel işleme gerekmez.
Dahili OCR
Taranmış PDF'ler otomatik olarak OCR ile işlenir. Ayrı bir OCR adımı veya yapılandırma gerekmez.
Tablo algılama
PDF'lerdeki tablo verilerini algılar. Düzgün biçimlendirilmiş tablolar için Markdown çıktısı isteyin.
Kullanım senaryoları
Bu aracın size zaman kazandırdığı yaygın senaryolar.
Node.js'de pdf-parse'ı değiştirin
npm pdf-parse paketini kullanıyorsanız ve yerel bağımlılıklar veya bakım sorunları yaşıyorsanız, ParseJet HTTP üzerinden doğrudan bir değiştirme seçeneğidir.
Python'da pdfplumber'ı değiştirin
pdfplumber, Python ve yerel kütüphaneler gerektirir. ParseJet, API üzerinden aynı çıkarma işlemini sağlar, böylece herhangi bir dilden veya sunucusuz fonksiyondan çağırabilirsiniz.
Belge işleme hatları
Gelen PDF'leri — faturalar, raporlar, formlar — ayrıştıran ve çıkarılan verileri veritabanınıza veya CRM'inize yönlendiren otomatik iş akışları oluşturun.
RAG belge alımı
Alım-güçlendirilmiş üretim hattınızın bir parçası olarak PDF'leri ayrıştırın. ParseJet, LLM'lere daha iyi bağlam sağlayan yapılandırılmış metin döndürür.
API ile otomatikleştirin
Aynı aracı programatik olarak kullanın. Herhangi bir dil ile çalışır — sadece HTTP.
# Parse a PDF and get text + metadata curl -X POST https://api.parsejet.com/v1/parse/auto/file \ -H "Authorization: Bearer YOUR_API_KEY" \ -F "[email protected]" # Response: # { # "text": "Invoice #1234\nDate: 2026-03-15\n...", # "title": "Invoice #1234", # "source_type": "pdf", # "metadata": { "pages": 2, "author": "Acme Corp" } # }
import httpx
# Before (pdf-parse / pdfplumber):
# import pdfplumber
# with pdfplumber.open("invoice.pdf") as pdf:
# text = "\n".join(p.extract_text() for p in pdf.pages)
# After (ParseJet — no dependencies):
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/file",
headers={"Authorization": "Bearer YOUR_API_KEY"},
files={"file": open("invoice.pdf", "rb")},
)
result = resp.json()
text = result["text"] # All text, all pages
title = result["title"] # Document title
pages = result["metadata"]["pages"] # Page count // Before (pdf-parse):
// const pdfParse = require("pdf-parse");
// const data = await pdfParse(buffer);
// After (ParseJet — no native dependencies):
const formData = new FormData();
formData.append("file", pdfBuffer, "invoice.pdf");
const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
});
const { text, title, source_type, metadata } = await res.json();
// Works in Node.js, Deno, Bun, Cloudflare Workers — anywhere with fetch Bunu otomatikleştirmek mi istiyorsunuz?
ParseJet API, aynı ayrıştırma gücünü tek bir HTTP endpoint'i ile sunar. ffmpeg yok, poppler yok, tesseract yok — sadece bir API çağrısı.
Sıkça sorulan sorular
ParseJet, pdf-parse (npm) ile nasıl karşılaştırılır?
pdf-parse, yerel kurulum gerektiren ve sadece temel metin çıkarma işlemi yapan bir Node.js kütüphanesidir. ParseJet, OCR ile taranmış belgeler dahil herhangi bir PDF'den metin, meta veri ve yapı çıkaran, sıfır bağımlılıklı barındırılan bir API'dir.
pdfplumber (Python) ile nasıl karşılaştırılır?
pdfplumber tablo çıkarma için mükemmeldir ancak Python ve yerel işleme gerektirir. ParseJet, HTTP üzerinden benzer yetenekler sunar, böylece Python veya yerel bağımlılıklar kurmadan herhangi bir dilden kullanabilirsiniz.
PDF ayrıştırıcı hangi meta verileri çıkarır?
ParseJet, belge başlığı, yazar, oluşturulma tarihi, sayfa sayısı ve algılanan içerik türünü çıkarır. Tam metin ve meta veriler yapılandırılmış bir JSON yanıtında döndürülür.
Sunucusuz bir ortamda kullanabilir miyim?
Evet. ParseJet bir HTTP API'si olduğu için AWS Lambda, Vercel Functions, Cloudflare Workers ve herhangi bir sunucusuz platformda çalışır — paketlenecek yerel ikili bağımlılık yoktur.
PDF tablo çıkarmayı destekliyor mu?
Evet. ParseJet PDF'lerdeki tabloları algılar ve çıkarır, varsayılan olarak bunları düzgün biçimlendirilmiş Markdown tabloları olarak döndürür.
Ücretsiz mi?
Evet. Kayıt olmadan günde 3 ücretsiz ayrıştırma hakkınız var. Aylık 300 kredi için ücretsiz bir hesap oluşturun. Ücretli planlar daha yüksek oran limitleri ve dosya boyutu kotaları ile ayda $19'dan başlar.
İlgili araçlar
PDF to Text Converter
Convert PDF to plain text online for free. Handles multi-page documents, scanned PDFs with OCR, and complex layouts. No signup required — use instantly or automate via API.
PDF to Markdown Converter
Convert PDF to Markdown online for free. Preserves headings, lists, tables, and code blocks. No signup required — try it instantly or automate with the ParseJet API.
Extract Text from PDF
Extract text from PDF files online for free. Supports scanned documents, multi-page PDFs, and complex layouts. No installation needed — works in your browser.
Ücretsiz metin çıkarmaya başlayın
Kayıt gerekmez. İlk dosyanızı saniyeler içinde ayrıştırın.