OCR — 从图片提取文字

上传图片，使用OCR即时提取文字。ParseJet可从截图、文档照片、扫描页面及任何图片格式中读取文字，并返回干净、可直接复制的文本。在线使用或集成OCR API到您的工作流中。

拖放文件到此处或浏览

支持JPG,JPEG,PNG,GIF,WEBP,TIFF,BMP文件

免费 — 每天3次请求，无需注册。获取每月300个免费额度。

工作原理

上传图片

拖放JPG、PNG、WebP或其他图片文件。您也可以粘贴在线图片的URL。

OCR处理

ParseJet应用光学字符识别技术，检测并提取图片中的所有文字，包括多语言内容。

获取干净文本

复制提取出的文字，或使用API将OCR集成到您的应用中。默认返回纯文本。

主要特性

这款ocr api脱颖而出的原因。

支持多种图片格式

支持JPG、JPEG、PNG、GIF、WebP、TIFF和BMP格式 — 可上传任何常见图片格式。

多语言OCR

可读取拉丁文、CJK（中文、日文、韩文）、西里尔文、阿拉伯文、天城文及其他文字体系的文本。

优化截图处理

针对截图、UI模型图和屏幕捕获进行了优化，而不仅仅是文档扫描。

无需预处理

ParseJet内部处理旋转、倾斜校正和降噪。直接上传您的原始图片即可。

API优先设计

使用REST API将OCR添加到任何应用中。返回包含提取文本的JSON，便于下游处理。

使用场景

此工具能为您节省时间的常见场景。

截图文字提取

从错误信息、聊天对话、代码片段或任何屏幕内容的截图中提取文字。

文档数字化

将纸质文档、收据、名片和手写笔记的照片转换为可搜索的数字文本。

基于图片的PDF处理

结合PDF解析功能，从仅包含图片的扫描PDF文档中提取文字。

自动化数据录入

通过OCR API读取产品标签、表格、身份证件及其他物理介质上的文字，实现自动化数据采集。

通过API自动化

以编程方式使用相同的工具。适用于任何语言——仅需HTTP。

cURL

# OCR on a local image file
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]"

# OCR on an image URL
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/photo.jpg"}'

Python

import httpx

# Extract text from an image using OCR
resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/file",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    files={"file": open("screenshot.png", "rb")},
)
ocr_text = resp.json()["text"]
print(ocr_text)

# Batch OCR: process multiple images
from pathlib import Path

for img in Path("scans/").glob("*.jpg"):
    with open(img, "rb") as f:
        resp = httpx.post(
            "https://api.parsejet.com/v1/parse/auto/file",
            headers={"Authorization": "Bearer YOUR_API_KEY"},
            files={"file": (img.name, f, "image/jpeg")},
        )
    print(f"{img.name}: {resp.json()['text'][:100]}...")

JavaScript

// OCR on a file input from a web form
const fileInput = document.querySelector('input[type="file"]');
const file = fileInput.files[0];

const formData = new FormData();
formData.append("file", file);

const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  headers: { Authorization: "Bearer YOUR_API_KEY" },
  body: formData,
});
const { text } = await res.json();
console.log(text);  // Extracted text from image

想自动化处理吗？

ParseJet API 通过一个 HTTP 端点提供相同的解析能力。无需 ffmpeg、poppler 或 tesseract — 只需一次 API 调用。

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url":"https://example.com"}'

查看 API 文档

常见问题

OCR支持哪些图片格式？

ParseJet OCR支持JPG、JPEG、PNG、GIF、WebP、TIFF和BMP格式。上传这些格式中的任意一种，即可即时获取提取的文字。

OCR的准确度如何？

ParseJet使用先进的OCR模型，对印刷文本、截图和清晰的文档扫描具有高准确度。手写文本和极低分辨率图片的准确度可能有所降低。

我可以用Python使用OCR API吗？

可以。安装ParseJet Python SDK（pip install parsejet）或向/v1/parse/auto/file发送包含图片文件的POST请求。请参阅上方的代码示例。

它支持多种语言吗？

是的。ParseJet OCR可以提取使用拉丁文、CJK（中文、日文、韩文）、西里尔文、阿拉伯文及其他常见文字体系的大多数语言的文本。

我可以对包含扫描页面的PDF进行OCR吗？

可以。当您上传扫描的PDF时，ParseJet会自动检测基于图片的页面并应用OCR。请使用PDF转文本或PDF转Markdown工具来实现此功能。

它是免费的吗？

是的。您每天可获得3次免费的OCR请求，无需注册。创建免费账户每月可获得300个积分。付费计划起价为每月19美元，提供更高的配额。

免费开始提取文本

无需注册。几秒钟内解析您的第一个文件。

查看价格