PDF'den Metin Çıkar
Bir PDF'den metin çıkarmanız mı gerekiyor? Dosyanızı yükleyin, ParseJet her kelimeyi — OCR ile taranmış sayfalar dahil — çıkarır. Araştırma, veri çıkarma, içerik taşıma ve belgeleri AI modellerine besleme için idealdir.
Bir dosyayı buraya bırakın veya göz atın
PDF dosyalarını kabul eder
Ücretsiz — günde 3 istek, kayıt gerekmez. ayda 300 kredi ücretsiz için.
Nasıl çalışır
PDF'nizi seçin
Bilgisayarınızdan bir PDF yükleyin. Metin tabanlı PDF'leri, taranmış belgeleri ve 200 MB'a kadar karma içerikli dosyaları destekler.
Metin çıkarma
ParseJet her sayfayı işler — dijital metin doğrudan çıkarılır, taranmış sayfalar ise OCR'dan geçer. Tüm metin okuma sırasına göre birleştirilir.
Metninizi kullanın
Çıkarılan metni kopyalayın, istediğiniz yere yapıştırın veya uygulamanızda PDF'lerden metin çıkarmak için API ile entegre edin.
Temel özellikler
Bu extract text from pdf aracını öne çıkaran özellikler.
Kopyala-yapıştır'dan daha iyi
Manuel kopyala-yapıştır'dan farklı olarak, ParseJet satır sonlarını korur, çok sütunlu düzenleri işler ve metin sırasını karıştırmaz.
Taranmış belge desteği
Tarayıcılardan veya kameralardan gelen sadece görüntü içeren PDF'ler, tüm görünür metni çıkarmak için OCR ile işlenir.
Meta veri çıkarma
Çıkarılan metinle birlikte belge başlığını, yazarını, sayfa sayısını ve oluşturulma tarihini döndürür.
Kurulum gerekmez
Çevrimiçi araç için tamamen tarayıcınızda veya programlı erişim için HTTP API üzerinden çalışır — yüklenecek yazılım yoktur.
Gizlilik öncelikli
Dosyalar işlenir ve hemen silinir. Çıkarma işleminden sonra sunucularımızda hiçbir şey saklanmaz.
Kullanım senaryoları
Bu aracın size zaman kazandırdığı yaygın senaryolar.
Akademik araştırma
Araştırma makalelerinden ve dergi yazılarından, alıntı, açıklama veya literatür tarama araçları için metin çıkarın.
Yasal belge işleme
Sözleşmelerden, mahkeme dosyalarından ve yasal dilekçelerden, inceleme, karşılaştırma veya e-keşif iş akışları için metin çekin.
İçerik taşıma
Sadece PDF'deki içeriği, metni çıkarıp yeniden biçimlendirerek bir CMS'ye, bilgi tabanına veya wiki'ye taşıyın.
Eğitim verisi hazırlama
Makine öğrenimi modelleri için eğitim veri setleri oluşturmak üzere belge PDF'lerinden metin çıkarın.
API ile otomatikleştirin
Aynı aracı programatik olarak kullanın. Herhangi bir dil ile çalışır — sadece HTTP.
# Extract text from a local PDF file curl -X POST https://api.parsejet.com/v1/parse/auto/file \ -H "Authorization: Bearer YOUR_API_KEY" \ -F "[email protected]" # Extract text from a PDF URL curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"url": "https://example.com/report.pdf"}'
import httpx
# Extract text from a local PDF
with open("contract.pdf", "rb") as f:
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/file",
headers={"Authorization": "Bearer YOUR_API_KEY"},
files={"file": ("contract.pdf", f, "application/pdf")},
)
data = resp.json()
print(data["text"]) # Extracted text
print(data["title"]) # Document title
print(data["metadata"]) # Page count, author, etc. // Extract text from a PDF URL
const res = await fetch("https://api.parsejet.com/v1/parse/auto/url", {
method: "POST",
headers: {
Authorization: "Bearer YOUR_API_KEY",
"Content-Type": "application/json",
},
body: JSON.stringify({ url: "https://example.com/report.pdf" }),
});
const { text, title, metadata } = await res.json(); Bunu otomatikleştirmek mi istiyorsunuz?
ParseJet API, aynı ayrıştırma gücünü tek bir HTTP endpoint'i ile sunar. ffmpeg yok, poppler yok, tesseract yok — sadece bir API çağrısı.
Sıkça sorulan sorular
Bir PDF dosyasından nasıl metin çıkarabilirim?
Yukarıdaki aracı kullanarak PDF'nizi yükleyin. ParseJet anında işler ve çıkarılan tüm metni döndürür. Ayrıca API'yi de kullanabilirsiniz: POST /v1/parse/auto/file.
Parola korumalı bir PDF'den metin çıkarabilir miyim?
ParseJet, metin kopyalamaya izin veren PDF'lerden metin çıkarabilir. Tüm erişimi kısıtlayan tamamen şifrelenmiş PDF'ler işlenemez.
Bu, kopyala-yapıştır'dan nasıl farklı?
PDF'lerden kopyala-yapıştır yapmak genellikle biçimlendirmeyi bozar, satır sonlarını kaybeder ve sütunları karıştırır. ParseJet okuma sırasını korur, çok sütunlu düzenleri işler ve kopyala-yapıştır'ın ulaşamadığı taranmış sayfalardan metin çıkarır.
Önce indirmeden bir PDF URL'sinden metin çıkarabilir miyim?
Evet. URL endpoint'ini kullanın: POST /v1/parse/auto/url ile PDF URL'nizi gönderin. ParseJet sunucu tarafında indirir ve işler — dosyayı kendiniz indirmenize gerek yoktur.
ParseJet hangi çıktı formatını döndürür?
ParseJet varsayılan olarak, başlıkları, listeleri ve tabloları koruyarak Markdown biçimli metin döndürür. Bu, belgelendirme, AI iş hatları ve Markdown okuyan herhangi bir araç için harika çalışır.
Ücretsiz mi?
Evet. Kaydolmadan günde 3 ücretsiz çıkarma hakkınız var. Aylık 300 kredi için ücretsiz bir hesap oluşturun. Ücretli planlar, daha büyük dosya boyutu limitleri ve daha yüksek kotalarla ayda 19$'dan başlar.
İlgili araçlar
PDF to Text Converter
Convert PDF to plain text online for free. Handles multi-page documents, scanned PDFs with OCR, and complex layouts. No signup required — use instantly or automate via API.
PDF to Markdown Converter
Convert PDF to Markdown online for free. Preserves headings, lists, tables, and code blocks. No signup required — try it instantly or automate with the ParseJet API.
OCR — Extract Text from Images
Free online OCR tool to extract text from images. Supports JPG, PNG, GIF, WebP, and TIFF. Also available as a developer API for Python, JavaScript, and more.
Ücretsiz metin çıkarmaya başlayın
Kayıt gerekmez. İlk dosyanızı saniyeler içinde ayrıştırın.