ParseJet

Konverter File PDF ke TXT

Butuh file .txt dari PDF Anda? Unggah dokumen Anda dan dapatkan keluaran teks biasa murni — tanpa Markdown, tanpa HTML, tanpa tag pemformatan. Hanya konten teks mentah yang bisa Anda simpan sebagai file .txt, masukkan ke skrip, atau impor ke sistem apa pun yang menerima masukan teks biasa.

Letakkan file di sini atau telusuri

Menerima file PDF

Gratis — 3 permintaan/hari, tanpa pendaftaran. untuk 300 kredit/bulan gratis.

Cara kerjanya

1

Unggah PDF Anda

Letakkan file PDF di atas atau klik untuk menjelajah. Berfungsi dengan PDF apa pun — berbasis teks, hasil pindai, atau konten campuran.

2

Ekstrak sebagai teks biasa

ParseJet menghapus semua pemformatan — tebal, miring, warna, font, header, footer, nomor halaman — dan mengembalikan konten teks murni sesuai urutan baca.

3

Simpan sebagai .txt

Salin keluaran dan simpan sebagai file .txt secara lokal. Atau gunakan API untuk mengonversi seluruh folder PDF ke file .txt secara terprogram.

Fitur utama

Apa yang membuat pdf to txt ini menonjol.

Keluaran .txt murni

Tidak ada sintaks Markdown, tidak ada tag HTML, tidak ada artefak pemformatan. Hanya teks mentah — persis seperti yang diharapkan alat seperti grep, awk, dan sed sebagai masukan.

Terkode UTF-8

Keluaran selalu terkode UTF-8, menangani karakter internasional, teks CJK, dan simbol khusus dengan benar di file .txt yang dihasilkan.

PDF Hasil Pindai → TXT

PDF yang hanya berisi gambar diproses dengan OCR secara otomatis. Halaman hasil pindai menjadi teks nyata dalam keluaran .txt Anda.

Siap untuk konversi batch

Gunakan API untuk mengonversi seluruh direktori PDF ke file .txt dalam satu skrip. Lihat contoh Python dan Node.js di bawah.

Penghapusan noise

Secara otomatis menghapus header, footer, nomor halaman, dan watermark yang akan mengacaukan file .txt.

Kasus penggunaan

Skenario umum di mana alat ini menghemat waktu Anda.

Masukan pipa data

Konversi PDF ke file .txt untuk dimasukkan ke pipa ETL, Apache Spark, pandas DataFrame, atau gudang data. Teks biasa adalah format masukan universal.

Pengindeksan mesin pencari

Konversi batch arsip PDF ke file .txt untuk diindeks di Elasticsearch, Solr, Meilisearch, atau mesin pencari teks lengkap apa pun yang membaca teks biasa.

Data pelatihan untuk ML/AI

Buat korpus teks dari koleksi dokumen PDF. Simpan setiap PDF sebagai file .txt untuk membuat kumpulan data pelatihan yang bersih untuk model bahasa, pengklasifikasi, atau sistem NER.

Impor sistem warisan

Banyak sistem lama, basis data, dan aplikasi mainframe hanya menerima masukan .txt atau CSV. Konversi PDF ke .txt untuk diimpor ke sistem ini tanpa pengetikan ulang manual.

Otomatisasi dengan API

Gunakan alat yang sama secara terprogram. Bekerja dengan bahasa apa pun — cukup HTTP.

cURL
# Convert a single PDF to .txt
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]" \
  | jq -r '.text' > output.txt
Python
import httpx
from pathlib import Path

# Batch-convert all PDFs in a folder to .txt files
pdf_dir = Path("pdfs/")
txt_dir = Path("txt_output/")
txt_dir.mkdir(exist_ok=True)

for pdf_file in pdf_dir.glob("*.pdf"):
    resp = httpx.post(
        "https://api.parsejet.com/v1/parse/auto/file",
        headers={"Authorization": "Bearer YOUR_API_KEY"},
        files={"file": (pdf_file.name, pdf_file.read_bytes(), "application/pdf")},
    )
    txt_path = txt_dir / pdf_file.with_suffix(".txt").name
    txt_path.write_text(resp.json()["text"], encoding="utf-8")
    print(f"Saved {txt_path}")
JavaScript
import { readdir, readFile, writeFile } from "fs/promises";
import { join, basename } from "path";

// Batch-convert all PDFs in a folder to .txt files
const pdfDir = "./pdfs";
const outDir = "./txt_output";

for (const file of await readdir(pdfDir)) {
  if (!file.endsWith(".pdf")) continue;
  const formData = new FormData();
  formData.append("file", new Blob([await readFile(join(pdfDir, file))]));

  const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
    method: "POST",
    headers: { Authorization: "Bearer YOUR_API_KEY" },
    body: formData,
  });
  const { text } = await res.json();
  await writeFile(join(outDir, basename(file, ".pdf") + ".txt"), text);
}

Ingin mengotomatiskan ini?

ParseJet API memberikan kemampuan parsing yang sama melalui satu endpoint HTTP. Tanpa ffmpeg, tanpa poppler, tanpa tesseract — cukup satu panggilan API.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Content-Type: application/json" \ -d '{"url":"https://example.com"}'
Baca Dokumentasi API

Pertanyaan yang sering diajukan

Bagaimana cara mengonversi PDF ke file .txt?

Unggah PDF Anda di atas — ParseJet mengekstrak semua teks dan mengembalikan keluaran teks biasa yang bersih. Salin dan simpan sebagai file .txt, atau gunakan API dengan pengalihan keluaran (lihat contoh cURL) untuk menyimpan langsung.

Apa perbedaan antara PDF ke TXT dan PDF ke Markdown?

PDF ke TXT memberi Anda teks biasa mentah tanpa pemformatan — ideal untuk pemrosesan data, pengindeksan pencarian, dan skrip. PDF ke Markdown mempertahankan struktur (judul, tabel, daftar) menggunakan sintaks Markdown — lebih baik untuk dokumentasi dan migrasi konten.

Bisakah saya mengonversi banyak PDF ke file .txt secara batch?

Ya. Gunakan API ParseJet untuk mengulangi folder PDF dan menyimpan masing-masing sebagai file .txt. Lihat contoh konversi batch Python dan JavaScript di atas.

Bisakah saya mengonversi PDF hasil pindai ke TXT?

Ya. ParseJet menggunakan OCR untuk mengekstrak teks dari PDF hasil pindai dan halaman berbasis gambar secara otomatis. Hasilnya adalah keluaran .txt yang sama bersihnya.

Pengkodean apa yang digunakan keluaran .txt?

ParseJet mengembalikan teks terkode UTF-8, yang mendukung semua bahasa dan karakter khusus. Saat menyimpan sebagai file .txt, gunakan pengkodean UTF-8 untuk mempertahankan konten dengan benar.

Apakah gratis?

Ya. Anda mendapatkan 3 konversi gratis per hari tanpa pendaftaran. Buat akun gratis untuk 300 kredit per bulan. Paket berbayar mulai dari $19/bulan untuk alur kerja konversi batch.

Mulai ekstraksi teks secara gratis

Tidak perlu mendaftar. Parse file pertama Anda dalam hitungan detik.

Lihat Harga