ParseJet

PDF'den Metne Dönüştürücü

Herhangi bir PDF dosyasından saniyeler içinde tüm metni çıkarın. ParseJet, çok sayfalı raporları, taranmış belgeleri (OCR ile) ve karmaşık düzenleri işler — kopyalayabileceğiniz, arayabileceğiniz veya AI işlem hattınıza besleyebileceğiniz temiz, yapılandırılmış düz metin döndürür.

Bir dosyayı buraya bırakın veya göz atın

PDF dosyalarını kabul eder

Ücretsiz — günde 3 istek, kayıt gerekmez. ayda 300 kredi ücretsiz için.

Nasıl çalışır

1

Bir PDF Yükleyin

PDF'nizi sürükleyip bırakın veya seçmek için tıklayın. Dijital, taranmış veya karma içerikli herhangi bir PDF ile çalışır.

2

Düz metin çıkarın

ParseJet her sayfayı okur, okuma sırasını ve paragraf yapısını korur. Taranmış sayfalar otomatik olarak OCR ile işlenir.

3

Kopyalayın veya indirin

Çıkarılan metni panonuza kopyalayın. Toplu dönüştürme için, yüzlerce PDF'yi programlı olarak işlemek üzere API'yi kullanın.

Temel özellikler

Bu pdf to text converter aracını öne çıkaran özellikler.

Okuma sırası koruması

Metni, çok sütunlu düzenlerden ve karmaşık sayfa tasarımlarından bile, doğal okuma sırasını takip ederek çıkarır.

Otomatik OCR

Görsel tabanlı sayfaları algılar ve şeffaf bir şekilde OCR uygular — ekstra yapılandırma gerekmez.

Çok sayfalı çıkarma

Tüm belgeleri tek seferde işler. Tüm sayfalardaki tüm metni tek bir yanıtta döndürür.

Düzen işleme

Üstbilgileri, altbilgileri, kenar çubuklarını ve dipnotları, bunları ana metinle karıştırmadan doğru şekilde işler.

Hızlı işleme

Çoğu PDF 2 saniyenin altında dönüştürülür. Büyük belgeler (100+ sayfa) tipik olarak 10 saniyenin altında tamamlanır.

Kullanım senaryoları

Bu aracın size zaman kazandırdığı yaygın senaryolar.

Arama ve indeksleme

PDF arşivlerini, Elasticsearch veya Algolia gibi tam metin arama motorları için aranabilir metne dönüştürün.

Veri çıkarma

Faturalardan, fişlerden, sözleşmelerden ve formlardan, sonraki işlemler veya veri girişi otomasyonu için metin çekin.

Erişilebilirlik

PDF içeriğini düz metne dönüştürerek ekran okuyuculara ve metinden konuşmaya araçlara erişilebilir hale getirin.

AI ve NLP girdisi

PDF içeriğini duygu analizi, özetleme, sınıflandırma veya herhangi bir NLP işlem hattı için hazırlayın.

API ile otomatikleştirin

Aynı aracı programatik olarak kullanın. Herhangi bir dil ile çalışır — sadece HTTP.

cURL
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]"

# Response: { "text": "Full extracted text...", "title": "...", "source_type": "pdf" }
Python
import httpx

# Convert a single PDF to text
resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/file",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    files={"file": open("report.pdf", "rb")},
)
text = resp.json()["text"]
print(text)  # Plain text from all pages
JavaScript
const formData = new FormData();
formData.append("file", pdfFile);  // File object or Blob

const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  headers: { Authorization: "Bearer YOUR_API_KEY" },
  body: formData,
});
const { text, title, source_type } = await res.json();
console.log(text);  // Full plain text

Bunu otomatikleştirmek mi istiyorsunuz?

ParseJet API, aynı ayrıştırma gücünü tek bir HTTP endpoint'i ile sunar. ffmpeg yok, poppler yok, tesseract yok — sadece bir API çağrısı.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Content-Type: application/json" \ -d '{"url":"https://example.com"}'
API Dokümanlarını Okuyun

Sıkça sorulan sorular

Bir PDF'yi metne nasıl dönüştürürüm?

PDF'nizi yukarıya yükleyin veya API'yi kullanın: PDF'nizle birlikte POST /v1/parse/auto/file. ParseJet tüm metin içeriğini çıkarır ve okuma sırasını koruyarak düz metin olarak döndürür.

Taranmış PDF'lerle çalışır mı?

Evet. ParseJet, görsel tabanlı sayfaları otomatik olarak algılar ve taranmış PDF'lerden, belge fotoğraflarından ve gömülü görsellerden metin çıkarmak için OCR kullanır.

Çok sütunlu PDF'leri nasıl işler?

ParseJet, okuma sırasını belirlemek için sayfa düzenini analiz eder. Çok sütunlu metin, mantıksal akışı koruyarak, soldan sağa, sütun sütun çıkarılır.

Tablolu PDF'ler ne olacak?

Tablolar yapısı korunarak çıkarılır. ParseJet varsayılan olarak Markdown biçimli çıktı döndürür, böylece tablolar uygun Markdown tabloları olarak işlenir.

Ücretsiz mi? Sınırlar neler?

Evet. Kayıt olmadan günde 3 ücretsiz dönüştürme hakkınız var. Aylık 300 kredi için ücretsiz bir hesap oluşturun. Ücretli planlar, daha büyük dosya boyutu sınırları (200 MB'a kadar) ve daha yüksek kotalarla ayda 19$'dan başlar.

Ücretsiz metin çıkarmaya başlayın

Kayıt gerekmez. İlk dosyanızı saniyeler içinde ayrıştırın.