OCR — Wyodrębnij tekst z obrazów
Prześlij obraz i natychmiast wyodrębnij tekst za pomocą OCR. ParseJet odczytuje tekst ze zrzutów ekranu, zdjęć dokumentów, zeskanowanych stron i dowolnego formatu obrazu — a następnie zwraca czysty, gotowy do skopiowania tekst. Używaj go online lub zintegruj API OCR do swojego przepływu pracy.
Upuść plik tutaj lub przeglądaj
Akceptuje pliki JPG,JPEG,PNG,GIF,WEBP,TIFF,BMP
Darmowe — 3 żądania/dzień, bez rejestracji. za 300 kredytów/miesiąc za darmo.
Jak to działa
Prześlij obraz
Upuść plik obrazu JPG, PNG, WebP lub inny. Możesz także wkleić URL do obrazu hostowanego online.
Przetwarzanie OCR
ParseJet stosuje rozpoznawanie znaków optycznych, aby wykryć i wyodrębnić cały tekst na obrazie, w tym treści wielojęzyczne.
Otrzymaj czysty tekst
Skopiuj wyodrębniony tekst lub użyj API, aby zintegrować OCR z Twoją aplikacją. Domyślnie zwraca zwykły tekst.
Kluczowe funkcje
Co wyróżnia to ocr api.
Wiele formatów obrazów
Obsługuje JPG, JPEG, PNG, GIF, WebP, TIFF i BMP — prześlij dowolny popularny format obrazu.
Wielojęzyczne OCR
Odczytuje tekst w alfabecie łacińskim, CJK (chińskim, japońskim, koreańskim), cyrylicy, arabskim, dewanagari i innych pismach.
Przyjazne dla zrzutów ekranu
Zoptymalizowane dla zrzutów ekranu, makiet UI i przechwytywania ekranu — nie tylko dla skanów dokumentów.
Bez potrzeby wstępnego przetwarzania
ParseJet wewnętrznie obsługuje rotację, korekcję pochylenia i redukcję szumów. Po prostu prześlij swój obraz taki, jaki jest.
Projektowanie z myślą o API
Użyj REST API, aby dodać OCR do dowolnej aplikacji. Zwraca JSON z wyodrębnionym tekstem, gotowym do dalszego przetwarzania.
Przykłady zastosowań
Typowe scenariusze, w których to narzędzie oszczędza czas.
Wyodrębnianie tekstu ze zrzutów ekranu
Wyodrębnij tekst ze zrzutów ekranu komunikatów o błędach, rozmów na czacie, fragmentów kodu lub dowolnej treści na ekranie.
Digitalizacja dokumentów
Konwertuj zdjęcia dokumentów papierowych, paragonów, wizytówek i odręcznych notatek na przeszukiwalny tekst cyfrowy.
Przetwarzanie PDF-ów opartych na obrazach
Po połączeniu z parsowaniem PDF, wyodrębniaj tekst z zeskanowanych dokumentów PDF, które zawierają tylko obrazy.
Automatyczne wprowadzanie danych
Odczytuj tekst z etykiet produktów, formularzy, dowodów osobistych i innych nośników fizycznych za pomocą API OCR do automatycznego przechwytywania danych.
Automatyzuj za pomocą API
Użyj tego samego narzędzia programistycznie. Działa z dowolnym językiem — wystarczy HTTP.
# OCR on a local image file curl -X POST https://api.parsejet.com/v1/parse/auto/file \ -H "Authorization: Bearer YOUR_API_KEY" \ -F "[email protected]" # OCR on an image URL curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"url": "https://example.com/photo.jpg"}'
import httpx
# Extract text from an image using OCR
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/file",
headers={"Authorization": "Bearer YOUR_API_KEY"},
files={"file": open("screenshot.png", "rb")},
)
ocr_text = resp.json()["text"]
print(ocr_text)
# Batch OCR: process multiple images
from pathlib import Path
for img in Path("scans/").glob("*.jpg"):
with open(img, "rb") as f:
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/file",
headers={"Authorization": "Bearer YOUR_API_KEY"},
files={"file": (img.name, f, "image/jpeg")},
)
print(f"{img.name}: {resp.json()['text'][:100]}...") // OCR on a file input from a web form
const fileInput = document.querySelector('input[type="file"]');
const file = fileInput.files[0];
const formData = new FormData();
formData.append("file", file);
const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
});
const { text } = await res.json();
console.log(text); // Extracted text from image Chcesz to zautomatyzować?
ParseJet API daje Ci tę samą moc parsowania przez jeden punkt końcowy HTTP. Bez ffmpeg, bez poppler, bez tesseract — tylko jedno wywołanie API.
Często zadawane pytania
Jakie formaty obrazów obsługuje OCR?
ParseJet OCR obsługuje JPG, JPEG, PNG, GIF, WebP, TIFF i BMP. Prześlij dowolny z tych formatów i natychmiast otrzymaj wyodrębniony tekst.
Jak dokładne jest OCR?
ParseJet używa najnowocześniejszych modeli OCR, które obsługują tekst drukowany, zrzuty ekranu i czyste skany dokumentów z wysoką dokładnością. Tekst odręczny i obrazy o bardzo niskiej rozdzielczości mogą mieć obniżoną dokładność.
Czy mogę użyć API OCR z Pythonem?
Tak. Zainstaluj ParseJet Python SDK (pip install parsejet) lub wyślij żądanie POST na /v1/parse/auto/file z plikiem obrazu. Zobacz przykłady kodu powyżej.
Czy obsługuje wiele języków?
Tak. ParseJet OCR może wyodrębniać tekst w większości języków używających alfabetu łacińskiego, CJK (chińskiego, japońskiego, koreańskiego), cyrylicy, arabskiego i innych popularnych pism.
Czy mogę zastosować OCR do PDF-a ze zeskanowanymi stronami?
Tak. Gdy prześlesz zeskanowany PDF, ParseJet automatycznie wykryje strony oparte na obrazach i zastosuje OCR. Użyj do tego narzędzi PDF na tekst lub PDF na Markdown.
Czy jest darmowe?
Tak. Otrzymujesz 3 darmowe żądania OCR dziennie bez rejestracji. Utwórz darmowe konto na 300 kredytów miesięcznie. Płatne plany zaczynają się od 19 USD/miesiąc z wyższymi limitami.
Powiązane narzędzia
Extract Text from PDF
Extract text from PDF files online for free. Supports scanned documents, multi-page PDFs, and complex layouts. No installation needed — works in your browser.
PDF to Text Converter
Convert PDF to plain text online for free. Handles multi-page documents, scanned PDFs with OCR, and complex layouts. No signup required — use instantly or automate via API.
PDF Parser
Parse PDF files to extract text, metadata, and structure. Free online tool and developer API. A modern alternative to pdf-parse and pdfplumber.
Zacznij bezpłatnie wyodrębniać tekst
Bez rejestracji. Przeanalizuj swój pierwszy plik w kilka sekund.