OCR — Rasmlardan matn ajratish

Rasm yuklang va OCR yordamida matnni darhol ajrating. ParseJet skrinshotlar, hujjatlar suratlari, skanerlangan sahifalar va har qanday rasm formatidagi matnlarni o‘qiydi — so‘ngra toza, nusxalashga tayyor matnni qaytaradi. Uni onlayn ishlating yoki OCR API-ni o‘z ish jarayoningizga integratsiya qiling.

Faylni bu erga tashlang yoki ko‘rib chiqing

JPG,JPEG,PNG,GIF,WEBP,TIFF,BMP fayllarni qabul qiladi

Bepul — kuniga 3 so‘rov, ro‘yxatdan o‘tish shart emas. oyiga 300 kredit bepul olish uchun.

Qanday ishlaydi

Rasm yuklang

JPG, PNG, WebP yoki boshqa rasm faylini tashlang. Shuningdek, onlayn joylashtirilgan rasm URL manzilini ham joylashtirishingiz mumkin.

OCR qayta ishlash

ParseJet optik belgi tanib olishni qo‘llab, rasm ichidagi barcha matnni, shu jumladan ko‘p tilli kontentni aniqlash va ajratadi.

Toza matn oling

Ajratilgan matnni nusxalang yoki OCR-ni ilovangizga integratsiya qilish uchun API-dan foydalaning. Sukut bo‘yicha oddiy matn qaytaradi.

Asosiy xususiyatlar

Bu ocr api ni nima ajralib turadigan qiladi.

Bir nechta rasm formatlari

JPG, JPEG, PNG, GIF, WebP, TIFF va BMP formatlarini qo‘llab-quvvatlaydi — har qanday keng tarqalgan rasm formatini yuklang.

Ko‘p tilli OCR

Lotin, CJK (Xitoy, Yapon, Koreya), Kirill, Arab, Devanagari va boshqa yozuv tizimlaridagi matnlarni o‘qiydi.

Skrinshotlar uchun qulay

Faqat hujjat skanerlari emas, balki skrinshotlar, UI maketlari va ekran tasvirlari uchun optimallashtirilgan.

Oldindan qayta ishlash talab qilinmaydi

ParseJet aylantirish, qiyshaytirishni tuzatish va shovqinni kamaytirishni ichki tarzda boshqaradi. Rasmni shunchaki o‘z holicha yuklang.

API-ga asoslangan dizayn

Har qanday ilovaga OCR qo‘shish uchun REST API-dan foydalaning. Keyingi qayta ishlash uchun tayyor, ajratilgan matn bilan JSON qaytaradi.

Foydalanish holatlari

Ushbu vositangiz vaqtni tejaydigan umumiy holatlar.

Skrinshotlardan matn ajratish

Xato xabarlari, suhbat muloqotlari, kod parchalari yoki har qanday ekrandagi kontent skrinshotlaridan matn ajrating.

Hujjat raqamlashtirish

Qog‘oz hujjatlar, cheklar, vizit kartalar va qo‘lda yozilgan eslatmalar suratlarini qidirish mumkin bo‘lgan raqamli matnga aylantiring.

Rasmga asoslangan PDF qayta ishlash

PDF tahlili bilan birlashtirilganda, faqat rasmlardan iborat skanerlangan PDF hujjatlaridan matn ajrating.

Avtomatlashtirilgan ma'lumot kiritish

Mahsulor yorliqlari, shakllar, ID kartalari va boshqa jismoniy vositalardagi matnlarni avtomatlashtirilgan ma'lumot yig‘ish uchun OCR API orqali o‘qing.

API bilan avtomatlashtiring

Xuddi shu vositaning dasturiy ta'minotidan foydalaning. Har qanday til bilan ishlaydi — faqat HTTP.

cURL

# OCR on a local image file
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]"

# OCR on an image URL
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/photo.jpg"}'

Python

import httpx

# Extract text from an image using OCR
resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/file",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    files={"file": open("screenshot.png", "rb")},
)
ocr_text = resp.json()["text"]
print(ocr_text)

# Batch OCR: process multiple images
from pathlib import Path

for img in Path("scans/").glob("*.jpg"):
    with open(img, "rb") as f:
        resp = httpx.post(
            "https://api.parsejet.com/v1/parse/auto/file",
            headers={"Authorization": "Bearer YOUR_API_KEY"},
            files={"file": (img.name, f, "image/jpeg")},
        )
    print(f"{img.name}: {resp.json()['text'][:100]}...")

JavaScript

// OCR on a file input from a web form
const fileInput = document.querySelector('input[type="file"]');
const file = fileInput.files[0];

const formData = new FormData();
formData.append("file", file);

const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  headers: { Authorization: "Bearer YOUR_API_KEY" },
  body: formData,
});
const { text } = await res.json();
console.log(text);  // Extracted text from image

Buni avtomatlashtirmoqchimisiz?

ParseJet API sizga bitta HTTP endpoint orqali bir xil tahlil qilish quvvatini beradi. Ffmpeg yo'q, poppler yo'q, tesseract yo'q — faqat bitta API chaqiruvi.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url":"https://example.com"}'

API Hujjatlarini O'qing

Tez-tez so'raladigan savollar

OCR qaysi rasm formatlarini qo‘llab-quvvatlaydi?

ParseJet OCR JPG, JPEG, PNG, GIF, WebP, TIFF va BMP formatlarini qo‘llab-quvvatlaydi. Ushbu formatlardan birini yuklang va ajratilgan matnni darhol oling.

OCR qanchalik aniq?

ParseJet bosma matn, skrinshotlar va toza hujjat skanerlari bilan yuqori aniqlikda ishlaydigan zamonaviy OCR modellaridan foydalanadi. Qo‘lda yozilgan matn va juda past o‘lchamdagi rasmlar aniqligi pastroq bo‘lishi mumkin.

OCR API-ni Python bilan ishlata olamanmi?

Ha. ParseJet Python SDK-ni o‘rnating (pip install parsejet) yoki rasm faylingiz bilan /v1/parse/auto/file manziliga POST so‘rov yuboring. Yuqoridagi kod misollariga qarang.

U bir nechta tillarni qo‘llab-quvvatlaydimi?

Ha. ParseJet OCR Lotin, CJK (Xitoy, Yapon, Koreya), Kirill, Arab va boshqa keng tarqalgan yozuv tizimlaridan foydalanadigan ko‘pgina tillardagi matnlarni ajrata oladi.

Skanerlangan sahifalari bo‘lgan PDF faylini OCR qila olamanmi?

Ha. Skanerlangan PDF yuklaganingizda, ParseJet avtomatik ravishda rasmga asoslangan sahifalarni aniqlaydi va OCR qo‘llaydi. Buning uchun PDF to Text yoki PDF to Markdown vositalaridan foydalaning.

Bepulmi?

Ha. Ro‘yxatdan o‘tmagan holda kuniga 3 ta bepul OCR so‘rovi olasiz. Oylik 300 kredit uchun bepul hisob yarating. Pullik rejalar yuqori kvotalar bilan oyiga $19 dan boshlanadi.

Matnni bepul ajratishni boshlang

Ro'yxatdan o'tish talab etilmaydi. Birinchi faylingizni soniyalar ichida tahlil qiling.

Narxlarni Ko'rish