OCR — Извлечение текста из изображений
Загрузите изображение и мгновенно извлеките текст с помощью OCR. ParseJet читает текст со скриншотов, фотографий документов, отсканированных страниц и любых форматов изображений — и возвращает чистый, готовый к копированию текст. Используйте его онлайн или интегрируйте OCR API в ваш рабочий процесс.
Перетащите файл сюда или выберите
Принимает файлы JPG,JPEG,PNG,GIF,WEBP,TIFF,BMP
Бесплатно — 3 запроса/день, без регистрации. для 300 кредитов/месяц бесплатно.
Как это работает
Загрузите изображение
Перетащите файл JPG, PNG, WebP или другой формат изображения. Также можно вставить URL изображения, размещённого в сети.
Обработка OCR
ParseJet применяет оптическое распознавание символов для обнаружения и извлечения всего текста на изображении, включая многоязычный контент.
Получите чистый текст
Скопируйте извлечённый текст или используйте API для интеграции OCR в ваше приложение. По умолчанию возвращает обычный текст.
Ключевые особенности
Что отличает этот ocr api.
Множество форматов
Поддерживает JPG, JPEG, PNG, GIF, WebP, TIFF и BMP — загружайте любой распространённый формат изображений.
Многоязычный OCR
Читает текст на латинице, CJK (китайский, японский, корейский), кириллице, арабском, деванагари и других письменностях.
Оптимизация для скриншотов
Оптимизирован для скриншотов, макетов интерфейсов и захвата экрана — не только для сканированных документов.
Предобработка не требуется
ParseJet самостоятельно обрабатывает поворот, коррекцию наклона и снижение шума. Просто загрузите изображение как есть.
API-ориентированный дизайн
Используйте REST API для добавления OCR в любое приложение. Возвращает JSON с извлечённым текстом, готовым для дальнейшей обработки.
Примеры использования
Типичные сценарии, где этот инструмент экономит ваше время.
Извлечение текста со скриншотов
Извлекайте текст со скриншотов сообщений об ошибках, чатов, фрагментов кода или любого контента на экране.
Оцифровка документов
Преобразуйте фотографии бумажных документов, чеков, визиток и рукописных заметок в доступный для поиска цифровой текст.
Обработка PDF с изображениями
В сочетании с парсингом PDF извлекайте текст из отсканированных PDF-документов, содержащих только изображения.
Автоматический ввод данных
Считывайте текст с этикеток товаров, форм, удостоверений личности и других физических носителей через OCR API для автоматического сбора данных.
Автоматизируйте с помощью API
Используйте тот же инструмент программно. Работает с любым языком — только HTTP.
# OCR on a local image file curl -X POST https://api.parsejet.com/v1/parse/auto/file \ -H "Authorization: Bearer YOUR_API_KEY" \ -F "[email protected]" # OCR on an image URL curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"url": "https://example.com/photo.jpg"}'
import httpx
# Extract text from an image using OCR
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/file",
headers={"Authorization": "Bearer YOUR_API_KEY"},
files={"file": open("screenshot.png", "rb")},
)
ocr_text = resp.json()["text"]
print(ocr_text)
# Batch OCR: process multiple images
from pathlib import Path
for img in Path("scans/").glob("*.jpg"):
with open(img, "rb") as f:
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/file",
headers={"Authorization": "Bearer YOUR_API_KEY"},
files={"file": (img.name, f, "image/jpeg")},
)
print(f"{img.name}: {resp.json()['text'][:100]}...") // OCR on a file input from a web form
const fileInput = document.querySelector('input[type="file"]');
const file = fileInput.files[0];
const formData = new FormData();
formData.append("file", file);
const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
});
const { text } = await res.json();
console.log(text); // Extracted text from image Хотите автоматизировать это?
ParseJet API предоставляет те же возможности парсинга через один HTTP-эндпоинт. Никакого ffmpeg, poppler или tesseract — всего один вызов API.
Часто задаваемые вопросы
Какие форматы изображений поддерживает OCR?
ParseJet OCR поддерживает JPG, JPEG, PNG, GIF, WebP, TIFF и BMP. Загрузите любой из этих форматов и мгновенно получите извлечённый текст.
Насколько точен OCR?
ParseJet использует современные модели OCR, которые с высокой точностью обрабатывают печатный текст, скриншоты и чистые сканы документов. Точность может быть ниже для рукописного текста и изображений очень низкого разрешения.
Можно ли использовать OCR API с Python?
Да. Установите ParseJet Python SDK (pip install parsejet) или отправьте POST-запрос на /v1/parse/auto/file с вашим файлом изображения. См. примеры кода выше.
Поддерживаются ли несколько языков?
Да. ParseJet OCR может извлекать текст на большинстве языков, использующих латиницу, CJK (китайский, японский, корейский), кириллицу, арабский и другие распространённые письменности.
Можно ли распознать PDF со сканированными страницами?
Да. При загрузке сканированного PDF ParseJet автоматически определяет страницы на основе изображений и применяет OCR. Используйте для этого инструменты PDF в текст или PDF в Markdown.
Это бесплатно?
Да. Вы получаете 3 бесплатных OCR-запроса в день без регистрации. Создайте бесплатный аккаунт для получения 300 кредитов в месяц. Платные тарифы начинаются от $19/мес. с увеличенными квотами.
Связанные инструменты
Extract Text from PDF
Extract text from PDF files online for free. Supports scanned documents, multi-page PDFs, and complex layouts. No installation needed — works in your browser.
PDF to Text Converter
Convert PDF to plain text online for free. Handles multi-page documents, scanned PDFs with OCR, and complex layouts. No signup required — use instantly or automate via API.
PDF Parser
Parse PDF files to extract text, metadata, and structure. Free online tool and developer API. A modern alternative to pdf-parse and pdfplumber.
Начните извлекать текст бесплатно
Регистрация не требуется. Обработайте первый файл за секунды.