ParseJet

PDF'den Metin Çıkar

Bir PDF'den metin çıkarmanız mı gerekiyor? Dosyanızı yükleyin, ParseJet her kelimeyi — OCR ile taranmış sayfalar dahil — çıkarır. Araştırma, veri çıkarma, içerik taşıma ve belgeleri AI modellerine besleme için idealdir.

Bir dosyayı buraya bırakın veya göz atın

PDF dosyalarını kabul eder

Ücretsiz — günde 3 istek, kayıt gerekmez. ayda 300 kredi ücretsiz için.

Nasıl çalışır

1

PDF'nizi seçin

Bilgisayarınızdan bir PDF yükleyin. Metin tabanlı PDF'leri, taranmış belgeleri ve 200 MB'a kadar karma içerikli dosyaları destekler.

2

Metin çıkarma

ParseJet her sayfayı işler — dijital metin doğrudan çıkarılır, taranmış sayfalar ise OCR'dan geçer. Tüm metin okuma sırasına göre birleştirilir.

3

Metninizi kullanın

Çıkarılan metni kopyalayın, istediğiniz yere yapıştırın veya uygulamanızda PDF'lerden metin çıkarmak için API ile entegre edin.

Temel özellikler

Bu extract text from pdf aracını öne çıkaran özellikler.

Kopyala-yapıştır'dan daha iyi

Manuel kopyala-yapıştır'dan farklı olarak, ParseJet satır sonlarını korur, çok sütunlu düzenleri işler ve metin sırasını karıştırmaz.

Taranmış belge desteği

Tarayıcılardan veya kameralardan gelen sadece görüntü içeren PDF'ler, tüm görünür metni çıkarmak için OCR ile işlenir.

Meta veri çıkarma

Çıkarılan metinle birlikte belge başlığını, yazarını, sayfa sayısını ve oluşturulma tarihini döndürür.

Kurulum gerekmez

Çevrimiçi araç için tamamen tarayıcınızda veya programlı erişim için HTTP API üzerinden çalışır — yüklenecek yazılım yoktur.

Gizlilik öncelikli

Dosyalar işlenir ve hemen silinir. Çıkarma işleminden sonra sunucularımızda hiçbir şey saklanmaz.

Kullanım senaryoları

Bu aracın size zaman kazandırdığı yaygın senaryolar.

Akademik araştırma

Araştırma makalelerinden ve dergi yazılarından, alıntı, açıklama veya literatür tarama araçları için metin çıkarın.

Yasal belge işleme

Sözleşmelerden, mahkeme dosyalarından ve yasal dilekçelerden, inceleme, karşılaştırma veya e-keşif iş akışları için metin çekin.

İçerik taşıma

Sadece PDF'deki içeriği, metni çıkarıp yeniden biçimlendirerek bir CMS'ye, bilgi tabanına veya wiki'ye taşıyın.

Eğitim verisi hazırlama

Makine öğrenimi modelleri için eğitim veri setleri oluşturmak üzere belge PDF'lerinden metin çıkarın.

API ile otomatikleştirin

Aynı aracı programatik olarak kullanın. Herhangi bir dil ile çalışır — sadece HTTP.

cURL
# Extract text from a local PDF file
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]"

# Extract text from a PDF URL
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/report.pdf"}'
Python
import httpx

# Extract text from a local PDF
with open("contract.pdf", "rb") as f:
    resp = httpx.post(
        "https://api.parsejet.com/v1/parse/auto/file",
        headers={"Authorization": "Bearer YOUR_API_KEY"},
        files={"file": ("contract.pdf", f, "application/pdf")},
    )
data = resp.json()
print(data["text"])      # Extracted text
print(data["title"])     # Document title
print(data["metadata"])  # Page count, author, etc.
JavaScript
// Extract text from a PDF URL
const res = await fetch("https://api.parsejet.com/v1/parse/auto/url", {
  method: "POST",
  headers: {
    Authorization: "Bearer YOUR_API_KEY",
    "Content-Type": "application/json",
  },
  body: JSON.stringify({ url: "https://example.com/report.pdf" }),
});
const { text, title, metadata } = await res.json();

Bunu otomatikleştirmek mi istiyorsunuz?

ParseJet API, aynı ayrıştırma gücünü tek bir HTTP endpoint'i ile sunar. ffmpeg yok, poppler yok, tesseract yok — sadece bir API çağrısı.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Content-Type: application/json" \ -d '{"url":"https://example.com"}'
API Dokümanlarını Okuyun

Sıkça sorulan sorular

Bir PDF dosyasından nasıl metin çıkarabilirim?

Yukarıdaki aracı kullanarak PDF'nizi yükleyin. ParseJet anında işler ve çıkarılan tüm metni döndürür. Ayrıca API'yi de kullanabilirsiniz: POST /v1/parse/auto/file.

Parola korumalı bir PDF'den metin çıkarabilir miyim?

ParseJet, metin kopyalamaya izin veren PDF'lerden metin çıkarabilir. Tüm erişimi kısıtlayan tamamen şifrelenmiş PDF'ler işlenemez.

Bu, kopyala-yapıştır'dan nasıl farklı?

PDF'lerden kopyala-yapıştır yapmak genellikle biçimlendirmeyi bozar, satır sonlarını kaybeder ve sütunları karıştırır. ParseJet okuma sırasını korur, çok sütunlu düzenleri işler ve kopyala-yapıştır'ın ulaşamadığı taranmış sayfalardan metin çıkarır.

Önce indirmeden bir PDF URL'sinden metin çıkarabilir miyim?

Evet. URL endpoint'ini kullanın: POST /v1/parse/auto/url ile PDF URL'nizi gönderin. ParseJet sunucu tarafında indirir ve işler — dosyayı kendiniz indirmenize gerek yoktur.

ParseJet hangi çıktı formatını döndürür?

ParseJet varsayılan olarak, başlıkları, listeleri ve tabloları koruyarak Markdown biçimli metin döndürür. Bu, belgelendirme, AI iş hatları ve Markdown okuyan herhangi bir araç için harika çalışır.

Ücretsiz mi?

Evet. Kaydolmadan günde 3 ücretsiz çıkarma hakkınız var. Aylık 300 kredi için ücretsiz bir hesap oluşturun. Ücretli planlar, daha büyük dosya boyutu limitleri ve daha yüksek kotalarla ayda 19$'dan başlar.

Ücretsiz metin çıkarmaya başlayın

Kayıt gerekmez. İlk dosyanızı saniyeler içinde ayrıştırın.