OCR — 从图片提取文字
上传图片,使用OCR即时提取文字。ParseJet可从截图、文档照片、扫描页面及任何图片格式中读取文字,并返回干净、可直接复制的文本。在线使用或集成OCR API到您的工作流中。
拖放文件到此处或 浏览
支持JPG,JPEG,PNG,GIF,WEBP,TIFF,BMP文件
免费 — 每天3次请求,无需注册。 获取每月300个免费额度。
工作原理
上传图片
拖放JPG、PNG、WebP或其他图片文件。您也可以粘贴在线图片的URL。
OCR处理
ParseJet应用光学字符识别技术,检测并提取图片中的所有文字,包括多语言内容。
获取干净文本
复制提取出的文字,或使用API将OCR集成到您的应用中。默认返回纯文本。
主要特性
这款ocr api脱颖而出的原因。
支持多种图片格式
支持JPG、JPEG、PNG、GIF、WebP、TIFF和BMP格式 — 可上传任何常见图片格式。
多语言OCR
可读取拉丁文、CJK(中文、日文、韩文)、西里尔文、阿拉伯文、天城文及其他文字体系的文本。
优化截图处理
针对截图、UI模型图和屏幕捕获进行了优化,而不仅仅是文档扫描。
无需预处理
ParseJet内部处理旋转、倾斜校正和降噪。直接上传您的原始图片即可。
API优先设计
使用REST API将OCR添加到任何应用中。返回包含提取文本的JSON,便于下游处理。
使用场景
此工具能为您节省时间的常见场景。
截图文字提取
从错误信息、聊天对话、代码片段或任何屏幕内容的截图中提取文字。
文档数字化
将纸质文档、收据、名片和手写笔记的照片转换为可搜索的数字文本。
基于图片的PDF处理
结合PDF解析功能,从仅包含图片的扫描PDF文档中提取文字。
自动化数据录入
通过OCR API读取产品标签、表格、身份证件及其他物理介质上的文字,实现自动化数据采集。
通过API自动化
以编程方式使用相同的工具。适用于任何语言——仅需HTTP。
# OCR on a local image file curl -X POST https://api.parsejet.com/v1/parse/auto/file \ -H "Authorization: Bearer YOUR_API_KEY" \ -F "[email protected]" # OCR on an image URL curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Authorization: Bearer YOUR_API_KEY" \ -H "Content-Type: application/json" \ -d '{"url": "https://example.com/photo.jpg"}'
import httpx
# Extract text from an image using OCR
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/file",
headers={"Authorization": "Bearer YOUR_API_KEY"},
files={"file": open("screenshot.png", "rb")},
)
ocr_text = resp.json()["text"]
print(ocr_text)
# Batch OCR: process multiple images
from pathlib import Path
for img in Path("scans/").glob("*.jpg"):
with open(img, "rb") as f:
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/file",
headers={"Authorization": "Bearer YOUR_API_KEY"},
files={"file": (img.name, f, "image/jpeg")},
)
print(f"{img.name}: {resp.json()['text'][:100]}...") // OCR on a file input from a web form
const fileInput = document.querySelector('input[type="file"]');
const file = fileInput.files[0];
const formData = new FormData();
formData.append("file", file);
const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
method: "POST",
headers: { Authorization: "Bearer YOUR_API_KEY" },
body: formData,
});
const { text } = await res.json();
console.log(text); // Extracted text from image 常见问题
OCR支持哪些图片格式?
ParseJet OCR支持JPG、JPEG、PNG、GIF、WebP、TIFF和BMP格式。上传这些格式中的任意一种,即可即时获取提取的文字。
OCR的准确度如何?
ParseJet使用先进的OCR模型,对印刷文本、截图和清晰的文档扫描具有高准确度。手写文本和极低分辨率图片的准确度可能有所降低。
我可以用Python使用OCR API吗?
可以。安装ParseJet Python SDK(pip install parsejet)或向/v1/parse/auto/file发送包含图片文件的POST请求。请参阅上方的代码示例。
它支持多种语言吗?
是的。ParseJet OCR可以提取使用拉丁文、CJK(中文、日文、韩文)、西里尔文、阿拉伯文及其他常见文字体系的大多数语言的文本。
我可以对包含扫描页面的PDF进行OCR吗?
可以。当您上传扫描的PDF时,ParseJet会自动检测基于图片的页面并应用OCR。请使用PDF转文本或PDF转Markdown工具来实现此功能。
它是免费的吗?
是的。您每天可获得3次免费的OCR请求,无需注册。创建免费账户每月可获得300个积分。付费计划起价为每月19美元,提供更高的配额。
相关工具
Extract Text from PDF
Extract text from PDF files online for free. Supports scanned documents, multi-page PDFs, and complex layouts. No installation needed — works in your browser.
PDF to Text Converter
Convert PDF to plain text online for free. Handles multi-page documents, scanned PDFs with OCR, and complex layouts. No signup required — use instantly or automate via API.
PDF Parser
Parse PDF files to extract text, metadata, and structure. Free online tool and developer API. A modern alternative to pdf-parse and pdfplumber.