OCR — Ekstrak Teks dari Gambar

Unggah gambar dan ekstrak teks secara instan menggunakan OCR. ParseJet membaca teks dari tangkapan layar, foto dokumen, halaman pindaian, dan format gambar apa pun — lalu mengembalikan teks bersih yang siap disalin. Gunakan secara online atau integrasikan API OCR ke dalam alur kerja Anda.

Letakkan file di sini atau telusuri

Menerima file JPG,JPEG,PNG,GIF,WEBP,TIFF,BMP

Gratis — 3 permintaan/hari, tanpa pendaftaran. untuk 300 kredit/bulan gratis.

Cara kerjanya

Unggah gambar

Seret file gambar JPG, PNG, WebP, atau lainnya. Anda juga dapat menempelkan URL ke gambar yang dihosting online.

Pemrosesan OCR

ParseJet menerapkan pengenalan karakter optik untuk mendeteksi dan mengekstrak semua teks dalam gambar, termasuk konten multi-bahasa.

Dapatkan teks bersih

Salin teks yang diekstrak atau gunakan API untuk mengintegrasikan OCR ke dalam aplikasi Anda. Secara default mengembalikan teks biasa.

Fitur utama

Apa yang membuat ocr api ini menonjol.

Berbagai format gambar

Mendukung JPG, JPEG, PNG, GIF, WebP, TIFF, dan BMP — unggah format gambar umum apa pun.

OCR multi-bahasa

Membaca teks dalam aksara Latin, CJK (Cina, Jepang, Korea), Sirilik, Arab, Devanagari, dan aksara lainnya.

Ramah tangkapan layar

Dioptimalkan untuk tangkapan layar, mockup UI, dan tangkapan layar — bukan hanya pindaian dokumen.

Tidak perlu pra-pemrosesan

ParseJet menangani rotasi, koreksi kemiringan, dan pengurangan noise secara internal. Cukup unggah gambar Anda apa adanya.

Desain API-first

Gunakan REST API untuk menambahkan OCR ke aplikasi apa pun. Mengembalikan JSON dengan teks yang diekstrak, siap untuk pemrosesan lebih lanjut.

Kasus penggunaan

Skenario umum di mana alat ini menghemat waktu Anda.

Ekstraksi teks dari tangkapan layar

Ekstrak teks dari tangkapan layar pesan kesalahan, percakapan obrolan, cuplikan kode, atau konten apa pun di layar.

Digitalisasi dokumen

Konversi foto dokumen kertas, kuitansi, kartu nama, dan catatan tulisan tangan menjadi teks digital yang dapat dicari.

Pemrosesan PDF berbasis gambar

Saat dikombinasikan dengan parsing PDF, ekstrak teks dari dokumen PDF pindaian yang hanya berisi gambar.

Entri data otomatis

Baca teks dari label produk, formulir, kartu identitas, dan media fisik lainnya melalui API OCR untuk pengambilan data otomatis.

Otomatisasi dengan API

Gunakan alat yang sama secara terprogram. Bekerja dengan bahasa apa pun — cukup HTTP.

cURL

# OCR on a local image file
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]"

# OCR on an image URL
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/photo.jpg"}'

Python

import httpx

# Extract text from an image using OCR
resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/file",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    files={"file": open("screenshot.png", "rb")},
)
ocr_text = resp.json()["text"]
print(ocr_text)

# Batch OCR: process multiple images
from pathlib import Path

for img in Path("scans/").glob("*.jpg"):
    with open(img, "rb") as f:
        resp = httpx.post(
            "https://api.parsejet.com/v1/parse/auto/file",
            headers={"Authorization": "Bearer YOUR_API_KEY"},
            files={"file": (img.name, f, "image/jpeg")},
        )
    print(f"{img.name}: {resp.json()['text'][:100]}...")

JavaScript

// OCR on a file input from a web form
const fileInput = document.querySelector('input[type="file"]');
const file = fileInput.files[0];

const formData = new FormData();
formData.append("file", file);

const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  headers: { Authorization: "Bearer YOUR_API_KEY" },
  body: formData,
});
const { text } = await res.json();
console.log(text);  // Extracted text from image

Ingin mengotomatiskan ini?

ParseJet API memberikan kemampuan parsing yang sama melalui satu endpoint HTTP. Tanpa ffmpeg, tanpa poppler, tanpa tesseract — cukup satu panggilan API.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url":"https://example.com"}'

Baca Dokumentasi API

Pertanyaan yang sering diajukan

Format gambar apa yang didukung oleh OCR?

OCR ParseJet mendukung JPG, JPEG, PNG, GIF, WebP, TIFF, dan BMP. Unggah salah satu format ini dan dapatkan teks yang diekstrak secara instan.

Seberapa akurat OCR-nya?

ParseJet menggunakan model OCR mutakhir yang menangani teks cetak, tangkapan layar, dan pindaian dokumen bersih dengan akurasi tinggi. Teks tulisan tangan dan gambar beresolusi sangat rendah mungkin memiliki akurasi yang berkurang.

Bisakah saya menggunakan API OCR dengan Python?

Ya. Instal ParseJet Python SDK (pip install parsejet) atau buat permintaan POST ke /v1/parse/auto/file dengan file gambar Anda. Lihat contoh kode di atas.

Apakah mendukung banyak bahasa?

Ya. OCR ParseJet dapat mengekstrak teks dalam sebagian besar bahasa yang menggunakan aksara Latin, CJK (Cina, Jepang, Korea), Sirilik, Arab, dan aksara umum lainnya.

Bisakah saya melakukan OCR pada PDF dengan halaman pindaian?

Ya. Saat Anda mengunggah PDF pindaian, ParseJet secara otomatis mendeteksi halaman berbasis gambar dan menerapkan OCR. Gunakan alat PDF ke Teks atau PDF ke Markdown untuk ini.

Apakah ini gratis?

Ya. Anda mendapatkan 3 permintaan OCR gratis per hari tanpa pendaftaran. Buat akun gratis untuk 300 kredit per bulan. Paket berbayar mulai dari $19/bulan dengan kuota lebih tinggi.

Mulai ekstraksi teks secara gratis

Tidak perlu mendaftar. Parse file pertama Anda dalam hitungan detik.

Lihat Harga