OCR — Ekstrak Teks dari Gambar
Unggah gambar dan ekstrak teks secara instan menggunakan OCR. ParseJet membaca teks dari tangkapan layar, foto dokumen, halaman pindaian, dan format gambar apa pun — lalu mengembalikan teks bersih yang siap disalin. Gunakan secara online atau integrasikan API OCR ke dalam alur kerja Anda.
Letakkan file di sini atau telusuri
Menerima file JPG,JPEG,PNG,GIF,WEBP,TIFF,BMP
Gratis — 3 permintaan/hari, tanpa pendaftaran. untuk 300 kredit/bulan gratis.
Cara kerjanya
Unggah gambar
Seret file gambar JPG, PNG, WebP, atau lainnya. Anda juga dapat menempelkan URL ke gambar yang dihosting online.
Pemrosesan OCR
ParseJet menerapkan pengenalan karakter optik untuk mendeteksi dan mengekstrak semua teks dalam gambar, termasuk konten multi-bahasa.
Dapatkan teks bersih
Salin teks yang diekstrak atau gunakan API untuk mengintegrasikan OCR ke dalam aplikasi Anda. Secara default mengembalikan teks biasa.
Fitur utama
Apa yang membuat ocr api ini menonjol.
Berbagai format gambar
Mendukung JPG, JPEG, PNG, GIF, WebP, TIFF, dan BMP — unggah format gambar umum apa pun.
OCR multi-bahasa
Membaca teks dalam aksara Latin, CJK (Cina, Jepang, Korea), Sirilik, Arab, Devanagari, dan aksara lainnya.
Ramah tangkapan layar
Dioptimalkan untuk tangkapan layar, mockup UI, dan tangkapan layar — bukan hanya pindaian dokumen.
Tidak perlu pra-pemrosesan
ParseJet menangani rotasi, koreksi kemiringan, dan pengurangan noise secara internal. Cukup unggah gambar Anda apa adanya.
Desain API-first
Gunakan REST API untuk menambahkan OCR ke aplikasi apa pun. Mengembalikan JSON dengan teks yang diekstrak, siap untuk pemrosesan lebih lanjut.
Kasus penggunaan
Skenario umum di mana alat ini menghemat waktu Anda.
Ekstraksi teks dari tangkapan layar
Ekstrak teks dari tangkapan layar pesan kesalahan, percakapan obrolan, cuplikan kode, atau konten apa pun di layar.
Digitalisasi dokumen
Konversi foto dokumen kertas, kuitansi, kartu nama, dan catatan tulisan tangan menjadi teks digital yang dapat dicari.
Pemrosesan PDF berbasis gambar
Saat dikombinasikan dengan parsing PDF, ekstrak teks dari dokumen PDF pindaian yang hanya berisi gambar.
Entri data otomatis
Baca teks dari label produk, formulir, kartu identitas, dan media fisik lainnya melalui API OCR untuk pengambilan data otomatis.
Otomatisasi dengan API
Gunakan alat yang sama secara terprogram. Bekerja dengan bahasa apa pun — cukup HTTP.
# OCR on a local image file curl -X POST https://api.parsejet.com/v1/parse/auto/file \ -H "Authorization: Bearer YOUR_API_KEY" \ -F "[email protected]" # OCR on an image URL curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"url": "https://example.com/photo.jpg"}'
import httpx
# Extract text from an image using OCR
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/file",
headers={"Authorization": "Bearer YOUR_API_KEY"},
files={"file": open("screenshot.png", "rb")},
)
ocr_text = resp.json()["text"]
print(ocr_text)
# Batch OCR: process multiple images
from pathlib import Path
for img in Path("scans/").glob("*.jpg"):
with open(img, "rb") as f:
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/file",
headers={"Authorization": "Bearer YOUR_API_KEY"},
files={"file": (img.name, f, "image/jpeg")},
)
print(f"{img.name}: {resp.json()['text'][:100]}...") // OCR on a file input from a web form
const fileInput = document.querySelector('input[type="file"]');
const file = fileInput.files[0];
const formData = new FormData();
formData.append("file", file);
const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
});
const { text } = await res.json();
console.log(text); // Extracted text from image Ingin mengotomatiskan ini?
ParseJet API memberikan kemampuan parsing yang sama melalui satu endpoint HTTP. Tanpa ffmpeg, tanpa poppler, tanpa tesseract — cukup satu panggilan API.
Pertanyaan yang sering diajukan
Format gambar apa yang didukung oleh OCR?
OCR ParseJet mendukung JPG, JPEG, PNG, GIF, WebP, TIFF, dan BMP. Unggah salah satu format ini dan dapatkan teks yang diekstrak secara instan.
Seberapa akurat OCR-nya?
ParseJet menggunakan model OCR mutakhir yang menangani teks cetak, tangkapan layar, dan pindaian dokumen bersih dengan akurasi tinggi. Teks tulisan tangan dan gambar beresolusi sangat rendah mungkin memiliki akurasi yang berkurang.
Bisakah saya menggunakan API OCR dengan Python?
Ya. Instal ParseJet Python SDK (pip install parsejet) atau buat permintaan POST ke /v1/parse/auto/file dengan file gambar Anda. Lihat contoh kode di atas.
Apakah mendukung banyak bahasa?
Ya. OCR ParseJet dapat mengekstrak teks dalam sebagian besar bahasa yang menggunakan aksara Latin, CJK (Cina, Jepang, Korea), Sirilik, Arab, dan aksara umum lainnya.
Bisakah saya melakukan OCR pada PDF dengan halaman pindaian?
Ya. Saat Anda mengunggah PDF pindaian, ParseJet secara otomatis mendeteksi halaman berbasis gambar dan menerapkan OCR. Gunakan alat PDF ke Teks atau PDF ke Markdown untuk ini.
Apakah ini gratis?
Ya. Anda mendapatkan 3 permintaan OCR gratis per hari tanpa pendaftaran. Buat akun gratis untuk 300 kredit per bulan. Paket berbayar mulai dari $19/bulan dengan kuota lebih tinggi.
Alat terkait
Extract Text from PDF
Extract text from PDF files online for free. Supports scanned documents, multi-page PDFs, and complex layouts. No installation needed — works in your browser.
PDF to Text Converter
Convert PDF to plain text online for free. Handles multi-page documents, scanned PDFs with OCR, and complex layouts. No signup required — use instantly or automate via API.
PDF Parser
Parse PDF files to extract text, metadata, and structure. Free online tool and developer API. A modern alternative to pdf-parse and pdfplumber.
Mulai ekstraksi teks secara gratis
Tidak perlu mendaftar. Parse file pertama Anda dalam hitungan detik.