ParseJet

OCR — 画像からテキストを抽出

画像をアップロードしてOCRで即座にテキストを抽出。ParseJetはスクリーンショット、文書写真、スキャンされたページ、あらゆる画像形式からテキストを読み取り、クリーンでコピー可能なテキストを返します。オンラインで使用するか、OCR APIをワークフローに統合できます。

ここにファイルをドロップするか、 参照

JPG,JPEG,PNG,GIF,WEBP,TIFF,BMPファイルを受け付けます

無料 — 1日3リクエスト、登録不要。 して月300クレジットを無料で。

仕組み

1

画像をアップロード

JPG、PNG、WebPなどの画像ファイルをドロップ。オンラインでホストされている画像のURLを貼り付けることもできます。

2

OCR処理

ParseJetは光学文字認識を適用し、多言語コンテンツを含む画像内のすべてのテキストを検出・抽出します。

3

クリーンなテキストを取得

抽出されたテキストをコピーするか、APIを使用してOCRをアプリケーションに統合。デフォルトでプレーンテキストを返します。

主な機能

このocr apiが際立つ理由。

複数の画像形式

JPG、JPEG、PNG、GIF、WebP、TIFF、BMPをサポート — 一般的な画像形式をアップロードできます。

多言語OCR

ラテン文字、CJK(中国語、日本語、韓国語)、キリル文字、アラビア文字、デーヴァナーガリー文字などのテキストを読み取ります。

スクリーンショット対応

スクリーンショット、UIモックアップ、画面キャプチャに最適化 — 文書スキャンだけでなく。

前処理不要

ParseJetは回転、傾き補正、ノイズ低減を内部で処理。画像をそのままアップロードするだけです。

APIファースト設計

REST APIを使用してあらゆるアプリケーションにOCRを追加。抽出されたテキストを含むJSONを返し、ダウンストリーム処理にすぐに使用できます。

ユースケース

このツールが時間を節約する一般的なシナリオ。

スクリーンショットからのテキスト抽出

エラーメッセージ、チャット会話、コードスニペット、または画面上のあらゆるコンテンツのスクリーンショットからテキストを抽出。

文書のデジタル化

紙の文書、領収書、名刺、手書きメモの写真を検索可能なデジタルテキストに変換。

画像ベースのPDF処理

PDF解析と組み合わせることで、画像のみを含むスキャンされたPDF文書からテキストを抽出。

自動データ入力

OCR APIを介して製品ラベル、フォーム、IDカード、その他の物理メディアからテキストを読み取り、自動データキャプチャを実現。

APIで自動化

同じツールをプログラムで使用。HTTPのみで、あらゆる言語で動作します。

cURL
# OCR on a local image file
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]"

# OCR on an image URL
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/photo.jpg"}'
Python
import httpx

# Extract text from an image using OCR
resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/file",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    files={"file": open("screenshot.png", "rb")},
)
ocr_text = resp.json()["text"]
print(ocr_text)

# Batch OCR: process multiple images
from pathlib import Path

for img in Path("scans/").glob("*.jpg"):
    with open(img, "rb") as f:
        resp = httpx.post(
            "https://api.parsejet.com/v1/parse/auto/file",
            headers={"Authorization": "Bearer YOUR_API_KEY"},
            files={"file": (img.name, f, "image/jpeg")},
        )
    print(f"{img.name}: {resp.json()['text'][:100]}...")
JavaScript
// OCR on a file input from a web form
const fileInput = document.querySelector('input[type="file"]');
const file = fileInput.files[0];

const formData = new FormData();
formData.append("file", file);

const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  headers: { Authorization: "Bearer YOUR_API_KEY" },
  body: formData,
});
const { text } = await res.json();
console.log(text);  // Extracted text from image

自動化をお求めですか?

ParseJet APIは、単一のHTTPエンドポイントで同じ解析機能を提供します。ffmpeg、poppler、tesseractは不要。APIコール一つだけです。

curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Content-Type: application/json" \ -d '{"url":"https://example.com"}'
APIドキュメントを読む

よくある質問

OCRはどの画像形式をサポートしていますか?

ParseJet OCRはJPG、JPEG、PNG、GIF、WebP、TIFF、BMPをサポートしています。これらの形式をアップロードすると、即座に抽出されたテキストを取得できます。

OCRの精度はどのくらいですか?

ParseJetは最先端のOCRモデルを使用し、印刷テキスト、スクリーンショット、クリーンな文書スキャンを高精度で処理します。手書きテキストや解像度が非常に低い画像は精度が低下する可能性があります。

PythonでOCR APIを使用できますか?

はい。ParseJet Python SDK(pip install parsejet)をインストールするか、画像ファイルを/v1/parse/auto/fileにPOSTリクエストしてください。上記のコード例を参照してください。

複数の言語をサポートしていますか?

はい。ParseJet OCRは、ラテン文字、CJK(中国語、日本語、韓国語)、キリル文字、アラビア文字、その他の一般的な文字を使用するほとんどの言語のテキストを抽出できます。

スキャンされたページを含むPDFをOCRできますか?

はい。スキャンされたPDFをアップロードすると、ParseJetは自動的に画像ベースのページを検出しOCRを適用します。この場合はPDFからテキストまたはPDFからMarkdownツールを使用してください。

無料ですか?

はい。サインアップなしで1日3回の無料OCRリクエストを利用できます。無料アカウントを作成すると、月300クレジットを利用可能。有料プランは月額19ドルからで、より高いクォータを提供します。

無料でテキスト抽出を始める

サインアップ不要。数秒で最初のファイルを解析。

料金を見る