ParseJet

PDF'den TXT Dosya Dönüştürücü

PDF'nizden bir .txt dosyası mı gerekiyor? Belgenizi yükleyin ve saf düz metin çıktısı alın — Markdown yok, HTML yok, biçimlendirme etiketleri yok. Sadece ham metin içeriği; .txt dosyası olarak kaydedebilir, bir betiğe yönlendirebilir veya düz metin girişi kabul eden herhangi bir sisteme aktarabilirsiniz.

Bir dosyayı buraya bırakın veya göz atın

PDF dosyalarını kabul eder

Ücretsiz — günde 3 istek, kayıt gerekmez. ayda 300 kredi ücretsiz için.

Nasıl çalışır

1

PDF'nizi yükleyin

Bir PDF dosyasını yukarıya bırakın veya gözatmak için tıklayın. Metin tabanlı, taranmış veya karma içerikli her türlü PDF ile çalışır.

2

Düz metin olarak çıkarın

ParseJet tüm biçimlendirmeyi — kalın, italik, renkler, yazı tipleri, başlıklar, altbilgiler, sayfa numaraları — kaldırır ve okuma sırasına göre saf metin içeriği döndürür.

3

.txt olarak kaydedin

Çıktıyı kopyalayın ve yerel olarak .txt dosyası olarak kaydedin. Veya API'yi kullanarak tüm PDF klasörlerini programlı bir şekilde .txt dosyalarına toplu dönüştürün.

Temel özellikler

Bu pdf to txt aracını öne çıkaran özellikler.

Saf .txt çıktı

Markdown sözdizimi yok, HTML etiketleri yok, biçimlendirme kalıntıları yok. Sadece ham metin — grep, awk ve sed gibi araçların giriş olarak beklediği tam olarak bu.

UTF-8 kodlamalı

Çıktı her zaman UTF-8 kodlamalıdır, uluslararası karakterleri, CJK metnini ve özel sembolleri ortaya çıkan .txt dosyasında doğru şekilde işler.

Taranmış PDF → TXT

Sadece görüntü içeren PDF'ler otomatik olarak OCR ile işlenir. Tara sayfalar, .txt çıktınızda gerçek metne dönüşür.

Toplu dönüşüme hazır

Bir PDF dizininin tamamını tek bir betikle .txt dosyalarına dönüştürmek için API'yi kullanın. Aşağıdaki Python ve Node.js örneklerine bakın.

Gürültü temizleme

.txt dosyasını karıştıracak başlıkları, altbilgileri, sayfa numaralarını ve filigranları otomatik olarak kaldırır.

Kullanım senaryoları

Bu aracın size zaman kazandırdığı yaygın senaryolar.

Veri işlem hattı girişi

PDF'leri, ETL işlem hatlarına, Apache Spark'a, pandas DataFrame'lerine veya veri ambarlarına alım için .txt dosyalarına dönüştürün. Düz metin evrensel giriş formatıdır.

Arama motoru indeksleme

Elasticsearch, Solr, Meilisearch veya düz metin okuyan herhangi bir tam metin arama motorunda indekslemek için bir PDF arşivini toplu olarak .txt dosyalarına dönüştürün.

ML/AI için eğitim verisi

PDF belge koleksiyonlarından metin derlemleri oluşturun. Dil modelleri, sınıflandırıcılar veya NER sistemleri için temiz eğitim veri kümeleri oluşturmak üzere her PDF'yi .txt dosyası olarak kaydedin.

Eski sistem aktarımı

Birçok eski sistem, veritabanı ve ana bilgisayar uygulaması sadece .txt veya CSV girişi kabul eder. Manuel yeniden yazmadan bu sistemlere aktarmak için PDF'leri .txt'ye dönüştürün.

API ile otomatikleştirin

Aynı aracı programatik olarak kullanın. Herhangi bir dil ile çalışır — sadece HTTP.

cURL
# Convert a single PDF to .txt
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]" \
  | jq -r '.text' > output.txt
Python
import httpx
from pathlib import Path

# Batch-convert all PDFs in a folder to .txt files
pdf_dir = Path("pdfs/")
txt_dir = Path("txt_output/")
txt_dir.mkdir(exist_ok=True)

for pdf_file in pdf_dir.glob("*.pdf"):
    resp = httpx.post(
        "https://api.parsejet.com/v1/parse/auto/file",
        headers={"Authorization": "Bearer YOUR_API_KEY"},
        files={"file": (pdf_file.name, pdf_file.read_bytes(), "application/pdf")},
    )
    txt_path = txt_dir / pdf_file.with_suffix(".txt").name
    txt_path.write_text(resp.json()["text"], encoding="utf-8")
    print(f"Saved {txt_path}")
JavaScript
import { readdir, readFile, writeFile } from "fs/promises";
import { join, basename } from "path";

// Batch-convert all PDFs in a folder to .txt files
const pdfDir = "./pdfs";
const outDir = "./txt_output";

for (const file of await readdir(pdfDir)) {
  if (!file.endsWith(".pdf")) continue;
  const formData = new FormData();
  formData.append("file", new Blob([await readFile(join(pdfDir, file))]));

  const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  });
  const { text } = await res.json();
  await writeFile(join(outDir, basename(file, ".pdf") + ".txt"), text);
}

Bunu otomatikleştirmek mi istiyorsunuz?

ParseJet API, aynı ayrıştırma gücünü tek bir HTTP endpoint'i ile sunar. ffmpeg yok, poppler yok, tesseract yok — sadece bir API çağrısı.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Content-Type: application/json" \ -d '{"url":"https://example.com"}'
API Dokümanlarını Okuyun

Sıkça sorulan sorular

Bir PDF'yi .txt dosyasına nasıl dönüştürürüm?

PDF'nizi yukarıya yükleyin — ParseJet tüm metni çıkarır ve temiz düz metin çıktısı döndürür. Kopyalayın ve .txt dosyası olarak kaydedin veya doğrudan kaydetmek için API'yi çıktı yönlendirmesi ile kullanın (cURL örneğine bakın).

PDF'den TXT ve PDF'den Markdown arasındaki fark nedir?

PDF'den TXT, size biçimlendirme olmadan ham düz metin verir — veri işleme, arama indeksleme ve betikler için idealdir. PDF'den Markdown, yapıyı (başlıklar, tablolar, listeler) Markdown sözdizimi kullanarak korur — belgeleme ve içerik taşıma için daha iyidir.

Birden fazla PDF'yi toplu olarak .txt dosyalarına dönüştürebilir miyim?

Evet. ParseJet API'sini kullanarak bir PDF klasöründe döngü yapın ve her birini .txt dosyası olarak kaydedin. Yukarıdaki Python ve JavaScript toplu dönüşüm örneklerine bakın.

Taranmış bir PDF'yi TXT'ye dönüştürebilir miyim?

Evet. ParseJet, taranmış PDF'lerden ve görüntü tabanlı sayfalardan metin çıkarmak için otomatik olarak OCR kullanır. Sonuç aynı temiz .txt çıktısıdır.

.txt çıktısı hangi kodlamayı kullanır?

ParseJet, tüm dilleri ve özel karakterleri destekleyen UTF-8 kodlamalı metin döndürür. .txt dosyası olarak kaydederken, içeriği doğru şekilde korumak için UTF-8 kodlamasını kullanın.

Ücretsiz mi?

Evet. Kaydolmadan günde 3 ücretsiz dönüşüm alırsınız. Aylık 300 kredi için ücretsiz bir hesap oluşturun. Toplu dönüşüm iş akışları için ücretli planlar ayda 19$'dan başlar.

Ücretsiz metin çıkarmaya başlayın

Kayıt gerekmez. İlk dosyanızı saniyeler içinde ayrıştırın.