OCR — Извлечение текста из изображений

Загрузите изображение и мгновенно извлеките текст с помощью OCR. ParseJet читает текст со скриншотов, фотографий документов, отсканированных страниц и любых форматов изображений — и возвращает чистый, готовый к копированию текст. Используйте его онлайн или интегрируйте OCR API в ваш рабочий процесс.

Перетащите файл сюда или выберите

Принимает файлы JPG,JPEG,PNG,GIF,WEBP,TIFF,BMP

Бесплатно — 3 запроса/день, без регистрации. для 300 кредитов/месяц бесплатно.

Как это работает

Загрузите изображение

Перетащите файл JPG, PNG, WebP или другой формат изображения. Также можно вставить URL изображения, размещённого в сети.

Обработка OCR

ParseJet применяет оптическое распознавание символов для обнаружения и извлечения всего текста на изображении, включая многоязычный контент.

Получите чистый текст

Скопируйте извлечённый текст или используйте API для интеграции OCR в ваше приложение. По умолчанию возвращает обычный текст.

Ключевые особенности

Что отличает этот ocr api.

Множество форматов

Поддерживает JPG, JPEG, PNG, GIF, WebP, TIFF и BMP — загружайте любой распространённый формат изображений.

Многоязычный OCR

Читает текст на латинице, CJK (китайский, японский, корейский), кириллице, арабском, деванагари и других письменностях.

Оптимизация для скриншотов

Оптимизирован для скриншотов, макетов интерфейсов и захвата экрана — не только для сканированных документов.

Предобработка не требуется

ParseJet самостоятельно обрабатывает поворот, коррекцию наклона и снижение шума. Просто загрузите изображение как есть.

API-ориентированный дизайн

Используйте REST API для добавления OCR в любое приложение. Возвращает JSON с извлечённым текстом, готовым для дальнейшей обработки.

Примеры использования

Типичные сценарии, где этот инструмент экономит ваше время.

Извлечение текста со скриншотов

Извлекайте текст со скриншотов сообщений об ошибках, чатов, фрагментов кода или любого контента на экране.

Оцифровка документов

Преобразуйте фотографии бумажных документов, чеков, визиток и рукописных заметок в доступный для поиска цифровой текст.

Обработка PDF с изображениями

В сочетании с парсингом PDF извлекайте текст из отсканированных PDF-документов, содержащих только изображения.

Автоматический ввод данных

Считывайте текст с этикеток товаров, форм, удостоверений личности и других физических носителей через OCR API для автоматического сбора данных.

Автоматизируйте с помощью API

Используйте тот же инструмент программно. Работает с любым языком — только HTTP.

cURL

# OCR on a local image file
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]"

# OCR on an image URL
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/photo.jpg"}'

Python

import httpx

# Extract text from an image using OCR
resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/file",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    files={"file": open("screenshot.png", "rb")},
)
ocr_text = resp.json()["text"]
print(ocr_text)

# Batch OCR: process multiple images
from pathlib import Path

for img in Path("scans/").glob("*.jpg"):
    with open(img, "rb") as f:
        resp = httpx.post(
            "https://api.parsejet.com/v1/parse/auto/file",
            headers={"Authorization": "Bearer YOUR_API_KEY"},
            files={"file": (img.name, f, "image/jpeg")},
        )
    print(f"{img.name}: {resp.json()['text'][:100]}...")

JavaScript

// OCR on a file input from a web form
const fileInput = document.querySelector('input[type="file"]');
const file = fileInput.files[0];

const formData = new FormData();
formData.append("file", file);

const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  headers: { Authorization: "Bearer YOUR_API_KEY" },
  body: formData,
});
const { text } = await res.json();
console.log(text);  // Extracted text from image

Хотите автоматизировать это?

ParseJet API предоставляет те же возможности парсинга через один HTTP-эндпоинт. Никакого ffmpeg, poppler или tesseract — всего один вызов API.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url":"https://example.com"}'

Читать документацию API

Часто задаваемые вопросы

Какие форматы изображений поддерживает OCR?

ParseJet OCR поддерживает JPG, JPEG, PNG, GIF, WebP, TIFF и BMP. Загрузите любой из этих форматов и мгновенно получите извлечённый текст.

Насколько точен OCR?

ParseJet использует современные модели OCR, которые с высокой точностью обрабатывают печатный текст, скриншоты и чистые сканы документов. Точность может быть ниже для рукописного текста и изображений очень низкого разрешения.

Можно ли использовать OCR API с Python?

Да. Установите ParseJet Python SDK (pip install parsejet) или отправьте POST-запрос на /v1/parse/auto/file с вашим файлом изображения. См. примеры кода выше.

Поддерживаются ли несколько языков?

Да. ParseJet OCR может извлекать текст на большинстве языков, использующих латиницу, CJK (китайский, японский, корейский), кириллицу, арабский и другие распространённые письменности.

Можно ли распознать PDF со сканированными страницами?

Да. При загрузке сканированного PDF ParseJet автоматически определяет страницы на основе изображений и применяет OCR. Используйте для этого инструменты PDF в текст или PDF в Markdown.

Это бесплатно?

Да. Вы получаете 3 бесплатных OCR-запроса в день без регистрации. Создайте бесплатный аккаунт для получения 300 кредитов в месяц. Платные тарифы начинаются от $19/мес. с увеличенными квотами.

Начните извлекать текст бесплатно

Регистрация не требуется. Обработайте первый файл за секунды.

Посмотреть тарифы