OCR — Wyodrębnij tekst z obrazów

Prześlij obraz i natychmiast wyodrębnij tekst za pomocą OCR. ParseJet odczytuje tekst ze zrzutów ekranu, zdjęć dokumentów, zeskanowanych stron i dowolnego formatu obrazu — a następnie zwraca czysty, gotowy do skopiowania tekst. Używaj go online lub zintegruj API OCR do swojego przepływu pracy.

Upuść plik tutaj lub przeglądaj

Akceptuje pliki JPG,JPEG,PNG,GIF,WEBP,TIFF,BMP

Darmowe — 3 żądania/dzień, bez rejestracji. za 300 kredytów/miesiąc za darmo.

Jak to działa

Prześlij obraz

Upuść plik obrazu JPG, PNG, WebP lub inny. Możesz także wkleić URL do obrazu hostowanego online.

Przetwarzanie OCR

ParseJet stosuje rozpoznawanie znaków optycznych, aby wykryć i wyodrębnić cały tekst na obrazie, w tym treści wielojęzyczne.

Otrzymaj czysty tekst

Skopiuj wyodrębniony tekst lub użyj API, aby zintegrować OCR z Twoją aplikacją. Domyślnie zwraca zwykły tekst.

Kluczowe funkcje

Co wyróżnia to ocr api.

Wiele formatów obrazów

Obsługuje JPG, JPEG, PNG, GIF, WebP, TIFF i BMP — prześlij dowolny popularny format obrazu.

Wielojęzyczne OCR

Odczytuje tekst w alfabecie łacińskim, CJK (chińskim, japońskim, koreańskim), cyrylicy, arabskim, dewanagari i innych pismach.

Przyjazne dla zrzutów ekranu

Zoptymalizowane dla zrzutów ekranu, makiet UI i przechwytywania ekranu — nie tylko dla skanów dokumentów.

Bez potrzeby wstępnego przetwarzania

ParseJet wewnętrznie obsługuje rotację, korekcję pochylenia i redukcję szumów. Po prostu prześlij swój obraz taki, jaki jest.

Projektowanie z myślą o API

Użyj REST API, aby dodać OCR do dowolnej aplikacji. Zwraca JSON z wyodrębnionym tekstem, gotowym do dalszego przetwarzania.

Przykłady zastosowań

Typowe scenariusze, w których to narzędzie oszczędza czas.

Wyodrębnianie tekstu ze zrzutów ekranu

Wyodrębnij tekst ze zrzutów ekranu komunikatów o błędach, rozmów na czacie, fragmentów kodu lub dowolnej treści na ekranie.

Digitalizacja dokumentów

Konwertuj zdjęcia dokumentów papierowych, paragonów, wizytówek i odręcznych notatek na przeszukiwalny tekst cyfrowy.

Przetwarzanie PDF-ów opartych na obrazach

Po połączeniu z parsowaniem PDF, wyodrębniaj tekst z zeskanowanych dokumentów PDF, które zawierają tylko obrazy.

Automatyczne wprowadzanie danych

Odczytuj tekst z etykiet produktów, formularzy, dowodów osobistych i innych nośników fizycznych za pomocą API OCR do automatycznego przechwytywania danych.

Automatyzuj za pomocą API

Użyj tego samego narzędzia programistycznie. Działa z dowolnym językiem — wystarczy HTTP.

cURL

# OCR on a local image file
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]"

# OCR on an image URL
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/photo.jpg"}'

Python

import httpx

# Extract text from an image using OCR
resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/file",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    files={"file": open("screenshot.png", "rb")},
)
ocr_text = resp.json()["text"]
print(ocr_text)

# Batch OCR: process multiple images
from pathlib import Path

for img in Path("scans/").glob("*.jpg"):
    with open(img, "rb") as f:
        resp = httpx.post(
            "https://api.parsejet.com/v1/parse/auto/file",
            headers={"Authorization": "Bearer YOUR_API_KEY"},
            files={"file": (img.name, f, "image/jpeg")},
        )
    print(f"{img.name}: {resp.json()['text'][:100]}...")

JavaScript

// OCR on a file input from a web form
const fileInput = document.querySelector('input[type="file"]');
const file = fileInput.files[0];

const formData = new FormData();
formData.append("file", file);

const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  headers: { Authorization: "Bearer YOUR_API_KEY" },
  body: formData,
});
const { text } = await res.json();
console.log(text);  // Extracted text from image

Chcesz to zautomatyzować?

ParseJet API daje Ci tę samą moc parsowania przez jeden punkt końcowy HTTP. Bez ffmpeg, bez poppler, bez tesseract — tylko jedno wywołanie API.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url":"https://example.com"}'

Przeczytaj dokumentację API

Często zadawane pytania

Jakie formaty obrazów obsługuje OCR?

ParseJet OCR obsługuje JPG, JPEG, PNG, GIF, WebP, TIFF i BMP. Prześlij dowolny z tych formatów i natychmiast otrzymaj wyodrębniony tekst.

Jak dokładne jest OCR?

ParseJet używa najnowocześniejszych modeli OCR, które obsługują tekst drukowany, zrzuty ekranu i czyste skany dokumentów z wysoką dokładnością. Tekst odręczny i obrazy o bardzo niskiej rozdzielczości mogą mieć obniżoną dokładność.

Czy mogę użyć API OCR z Pythonem?

Tak. Zainstaluj ParseJet Python SDK (pip install parsejet) lub wyślij żądanie POST na /v1/parse/auto/file z plikiem obrazu. Zobacz przykłady kodu powyżej.

Czy obsługuje wiele języków?

Tak. ParseJet OCR może wyodrębniać tekst w większości języków używających alfabetu łacińskiego, CJK (chińskiego, japońskiego, koreańskiego), cyrylicy, arabskiego i innych popularnych pism.

Czy mogę zastosować OCR do PDF-a ze zeskanowanymi stronami?

Tak. Gdy prześlesz zeskanowany PDF, ParseJet automatycznie wykryje strony oparte na obrazach i zastosuje OCR. Użyj do tego narzędzi PDF na tekst lub PDF na Markdown.

Czy jest darmowe?

Tak. Otrzymujesz 3 darmowe żądania OCR dziennie bez rejestracji. Utwórz darmowe konto na 300 kredytów miesięcznie. Płatne plany zaczynają się od 19 USD/miesiąc z wyższymi limitami.

Zacznij bezpłatnie wyodrębniać tekst

Bez rejestracji. Przeanalizuj swój pierwszy plik w kilka sekund.

Zobacz cennik