Konverter File PDF ke TXT
Butuh file .txt dari PDF Anda? Unggah dokumen Anda dan dapatkan keluaran teks biasa murni — tanpa Markdown, tanpa HTML, tanpa tag pemformatan. Hanya konten teks mentah yang bisa Anda simpan sebagai file .txt, masukkan ke skrip, atau impor ke sistem apa pun yang menerima masukan teks biasa.
Letakkan file di sini atau telusuri
Menerima file PDF
Gratis — 3 permintaan/hari, tanpa pendaftaran. untuk 300 kredit/bulan gratis.
Cara kerjanya
Unggah PDF Anda
Letakkan file PDF di atas atau klik untuk menjelajah. Berfungsi dengan PDF apa pun — berbasis teks, hasil pindai, atau konten campuran.
Ekstrak sebagai teks biasa
ParseJet menghapus semua pemformatan — tebal, miring, warna, font, header, footer, nomor halaman — dan mengembalikan konten teks murni sesuai urutan baca.
Simpan sebagai .txt
Salin keluaran dan simpan sebagai file .txt secara lokal. Atau gunakan API untuk mengonversi seluruh folder PDF ke file .txt secara terprogram.
Fitur utama
Apa yang membuat pdf to txt ini menonjol.
Keluaran .txt murni
Tidak ada sintaks Markdown, tidak ada tag HTML, tidak ada artefak pemformatan. Hanya teks mentah — persis seperti yang diharapkan alat seperti grep, awk, dan sed sebagai masukan.
Terkode UTF-8
Keluaran selalu terkode UTF-8, menangani karakter internasional, teks CJK, dan simbol khusus dengan benar di file .txt yang dihasilkan.
PDF Hasil Pindai → TXT
PDF yang hanya berisi gambar diproses dengan OCR secara otomatis. Halaman hasil pindai menjadi teks nyata dalam keluaran .txt Anda.
Siap untuk konversi batch
Gunakan API untuk mengonversi seluruh direktori PDF ke file .txt dalam satu skrip. Lihat contoh Python dan Node.js di bawah.
Penghapusan noise
Secara otomatis menghapus header, footer, nomor halaman, dan watermark yang akan mengacaukan file .txt.
Kasus penggunaan
Skenario umum di mana alat ini menghemat waktu Anda.
Masukan pipa data
Konversi PDF ke file .txt untuk dimasukkan ke pipa ETL, Apache Spark, pandas DataFrame, atau gudang data. Teks biasa adalah format masukan universal.
Pengindeksan mesin pencari
Konversi batch arsip PDF ke file .txt untuk diindeks di Elasticsearch, Solr, Meilisearch, atau mesin pencari teks lengkap apa pun yang membaca teks biasa.
Data pelatihan untuk ML/AI
Buat korpus teks dari koleksi dokumen PDF. Simpan setiap PDF sebagai file .txt untuk membuat kumpulan data pelatihan yang bersih untuk model bahasa, pengklasifikasi, atau sistem NER.
Impor sistem warisan
Banyak sistem lama, basis data, dan aplikasi mainframe hanya menerima masukan .txt atau CSV. Konversi PDF ke .txt untuk diimpor ke sistem ini tanpa pengetikan ulang manual.
Otomatisasi dengan API
Gunakan alat yang sama secara terprogram. Bekerja dengan bahasa apa pun — cukup HTTP.
# Convert a single PDF to .txt curl -X POST https://api.parsejet.com/v1/parse/auto/file \ -H "Authorization: Bearer YOUR_API_KEY" \ -F "[email protected]" \ | jq -r '.text' > output.txt
import httpx
from pathlib import Path
# Batch-convert all PDFs in a folder to .txt files
pdf_dir = Path("pdfs/")
txt_dir = Path("txt_output/")
txt_dir.mkdir(exist_ok=True)
for pdf_file in pdf_dir.glob("*.pdf"):
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/file",
headers={"Authorization": "Bearer YOUR_API_KEY"},
files={"file": (pdf_file.name, pdf_file.read_bytes(), "application/pdf")},
)
txt_path = txt_dir / pdf_file.with_suffix(".txt").name
txt_path.write_text(resp.json()["text"], encoding="utf-8")
print(f"Saved {txt_path}") import { readdir, readFile, writeFile } from "fs/promises";
import { join, basename } from "path";
// Batch-convert all PDFs in a folder to .txt files
const pdfDir = "./pdfs";
const outDir = "./txt_output";
for (const file of await readdir(pdfDir)) {
if (!file.endsWith(".pdf")) continue;
const formData = new FormData();
formData.append("file", new Blob([await readFile(join(pdfDir, file))]));
const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
});
const { text } = await res.json();
await writeFile(join(outDir, basename(file, ".pdf") + ".txt"), text);
} Ingin mengotomatiskan ini?
ParseJet API memberikan kemampuan parsing yang sama melalui satu endpoint HTTP. Tanpa ffmpeg, tanpa poppler, tanpa tesseract — cukup satu panggilan API.
Pertanyaan yang sering diajukan
Bagaimana cara mengonversi PDF ke file .txt?
Unggah PDF Anda di atas — ParseJet mengekstrak semua teks dan mengembalikan keluaran teks biasa yang bersih. Salin dan simpan sebagai file .txt, atau gunakan API dengan pengalihan keluaran (lihat contoh cURL) untuk menyimpan langsung.
Apa perbedaan antara PDF ke TXT dan PDF ke Markdown?
PDF ke TXT memberi Anda teks biasa mentah tanpa pemformatan — ideal untuk pemrosesan data, pengindeksan pencarian, dan skrip. PDF ke Markdown mempertahankan struktur (judul, tabel, daftar) menggunakan sintaks Markdown — lebih baik untuk dokumentasi dan migrasi konten.
Bisakah saya mengonversi banyak PDF ke file .txt secara batch?
Ya. Gunakan API ParseJet untuk mengulangi folder PDF dan menyimpan masing-masing sebagai file .txt. Lihat contoh konversi batch Python dan JavaScript di atas.
Bisakah saya mengonversi PDF hasil pindai ke TXT?
Ya. ParseJet menggunakan OCR untuk mengekstrak teks dari PDF hasil pindai dan halaman berbasis gambar secara otomatis. Hasilnya adalah keluaran .txt yang sama bersihnya.
Pengkodean apa yang digunakan keluaran .txt?
ParseJet mengembalikan teks terkode UTF-8, yang mendukung semua bahasa dan karakter khusus. Saat menyimpan sebagai file .txt, gunakan pengkodean UTF-8 untuk mempertahankan konten dengan benar.
Apakah gratis?
Ya. Anda mendapatkan 3 konversi gratis per hari tanpa pendaftaran. Buat akun gratis untuk 300 kredit per bulan. Paket berbayar mulai dari $19/bulan untuk alur kerja konversi batch.
Alat terkait
PDF to Text Converter
Convert PDF to plain text online for free. Handles multi-page documents, scanned PDFs with OCR, and complex layouts. No signup required — use instantly or automate via API.
Extract Text from PDF
Extract text from PDF files online for free. Supports scanned documents, multi-page PDFs, and complex layouts. No installation needed — works in your browser.
PDF to Markdown Converter
Convert PDF to Markdown online for free. Preserves headings, lists, tables, and code blocks. No signup required — try it instantly or automate with the ParseJet API.
Mulai ekstraksi teks secara gratis
Tidak perlu mendaftar. Parse file pertama Anda dalam hitungan detik.