ParseJet

OCR — Wyodrębnij tekst z obrazów

Prześlij obraz i natychmiast wyodrębnij tekst za pomocą OCR. ParseJet odczytuje tekst ze zrzutów ekranu, zdjęć dokumentów, zeskanowanych stron i dowolnego formatu obrazu — a następnie zwraca czysty, gotowy do skopiowania tekst. Używaj go online lub zintegruj API OCR do swojego przepływu pracy.

Upuść plik tutaj lub przeglądaj

Akceptuje pliki JPG,JPEG,PNG,GIF,WEBP,TIFF,BMP

Darmowe — 3 żądania/dzień, bez rejestracji. za 300 kredytów/miesiąc za darmo.

Jak to działa

1

Prześlij obraz

Upuść plik obrazu JPG, PNG, WebP lub inny. Możesz także wkleić URL do obrazu hostowanego online.

2

Przetwarzanie OCR

ParseJet stosuje rozpoznawanie znaków optycznych, aby wykryć i wyodrębnić cały tekst na obrazie, w tym treści wielojęzyczne.

3

Otrzymaj czysty tekst

Skopiuj wyodrębniony tekst lub użyj API, aby zintegrować OCR z Twoją aplikacją. Domyślnie zwraca zwykły tekst.

Kluczowe funkcje

Co wyróżnia to ocr api.

Wiele formatów obrazów

Obsługuje JPG, JPEG, PNG, GIF, WebP, TIFF i BMP — prześlij dowolny popularny format obrazu.

Wielojęzyczne OCR

Odczytuje tekst w alfabecie łacińskim, CJK (chińskim, japońskim, koreańskim), cyrylicy, arabskim, dewanagari i innych pismach.

Przyjazne dla zrzutów ekranu

Zoptymalizowane dla zrzutów ekranu, makiet UI i przechwytywania ekranu — nie tylko dla skanów dokumentów.

Bez potrzeby wstępnego przetwarzania

ParseJet wewnętrznie obsługuje rotację, korekcję pochylenia i redukcję szumów. Po prostu prześlij swój obraz taki, jaki jest.

Projektowanie z myślą o API

Użyj REST API, aby dodać OCR do dowolnej aplikacji. Zwraca JSON z wyodrębnionym tekstem, gotowym do dalszego przetwarzania.

Przykłady zastosowań

Typowe scenariusze, w których to narzędzie oszczędza czas.

Wyodrębnianie tekstu ze zrzutów ekranu

Wyodrębnij tekst ze zrzutów ekranu komunikatów o błędach, rozmów na czacie, fragmentów kodu lub dowolnej treści na ekranie.

Digitalizacja dokumentów

Konwertuj zdjęcia dokumentów papierowych, paragonów, wizytówek i odręcznych notatek na przeszukiwalny tekst cyfrowy.

Przetwarzanie PDF-ów opartych na obrazach

Po połączeniu z parsowaniem PDF, wyodrębniaj tekst z zeskanowanych dokumentów PDF, które zawierają tylko obrazy.

Automatyczne wprowadzanie danych

Odczytuj tekst z etykiet produktów, formularzy, dowodów osobistych i innych nośników fizycznych za pomocą API OCR do automatycznego przechwytywania danych.

Automatyzuj za pomocą API

Użyj tego samego narzędzia programistycznie. Działa z dowolnym językiem — wystarczy HTTP.

cURL
# OCR on a local image file
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]"

# OCR on an image URL
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/photo.jpg"}'
Python
import httpx

# Extract text from an image using OCR
resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/file",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    files={"file": open("screenshot.png", "rb")},
)
ocr_text = resp.json()["text"]
print(ocr_text)

# Batch OCR: process multiple images
from pathlib import Path

for img in Path("scans/").glob("*.jpg"):
    with open(img, "rb") as f:
        resp = httpx.post(
            "https://api.parsejet.com/v1/parse/auto/file",
            headers={"Authorization": "Bearer YOUR_API_KEY"},
            files={"file": (img.name, f, "image/jpeg")},
        )
    print(f"{img.name}: {resp.json()['text'][:100]}...")
JavaScript
// OCR on a file input from a web form
const fileInput = document.querySelector('input[type="file"]');
const file = fileInput.files[0];

const formData = new FormData();
formData.append("file", file);

const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  headers: { Authorization: "Bearer YOUR_API_KEY" },
  body: formData,
});
const { text } = await res.json();
console.log(text);  // Extracted text from image

Chcesz to zautomatyzować?

ParseJet API daje Ci tę samą moc parsowania przez jeden punkt końcowy HTTP. Bez ffmpeg, bez poppler, bez tesseract — tylko jedno wywołanie API.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Content-Type: application/json" \ -d '{"url":"https://example.com"}'
Przeczytaj dokumentację API

Często zadawane pytania

Jakie formaty obrazów obsługuje OCR?

ParseJet OCR obsługuje JPG, JPEG, PNG, GIF, WebP, TIFF i BMP. Prześlij dowolny z tych formatów i natychmiast otrzymaj wyodrębniony tekst.

Jak dokładne jest OCR?

ParseJet używa najnowocześniejszych modeli OCR, które obsługują tekst drukowany, zrzuty ekranu i czyste skany dokumentów z wysoką dokładnością. Tekst odręczny i obrazy o bardzo niskiej rozdzielczości mogą mieć obniżoną dokładność.

Czy mogę użyć API OCR z Pythonem?

Tak. Zainstaluj ParseJet Python SDK (pip install parsejet) lub wyślij żądanie POST na /v1/parse/auto/file z plikiem obrazu. Zobacz przykłady kodu powyżej.

Czy obsługuje wiele języków?

Tak. ParseJet OCR może wyodrębniać tekst w większości języków używających alfabetu łacińskiego, CJK (chińskiego, japońskiego, koreańskiego), cyrylicy, arabskiego i innych popularnych pism.

Czy mogę zastosować OCR do PDF-a ze zeskanowanymi stronami?

Tak. Gdy prześlesz zeskanowany PDF, ParseJet automatycznie wykryje strony oparte na obrazach i zastosuje OCR. Użyj do tego narzędzi PDF na tekst lub PDF na Markdown.

Czy jest darmowe?

Tak. Otrzymujesz 3 darmowe żądania OCR dziennie bez rejestracji. Utwórz darmowe konto na 300 kredytów miesięcznie. Płatne plany zaczynają się od 19 USD/miesiąc z wyższymi limitami.

Zacznij bezpłatnie wyodrębniać tekst

Bez rejestracji. Przeanalizuj swój pierwszy plik w kilka sekund.

Zobacz cennik