ParseJet

テキストを抽出
あらゆるファイルやURLから

PDFをテキストに変換、YouTubeの文字起こし、ウェブページのスクレイピングができる無料オンラインツール。25以上のフォーマットに対応する単一APIで、AIエージェントを強化または直接利用できます。無料APIキー付き。

ここにファイルをドロップするか、 参照

PDF、DOCX、XLSX、画像、音声、動画など

無料 — 1日3リクエスト、登録不要。 して月300クレジットを無料で。

あらゆるテキスト抽出タスクに対応する単一ツール

フォーマットごとに別々のライブラリをインストールするのはやめましょう。ParseJetがすべて処理します。

PDF から テキスト コンバーター

PDFファイルから瞬時にテキストを抽出します。スキャン文書、複数ページのレポート、複雑なレイアウトに対応。ワンクリックでPDFをプレーンテキストまたはMarkdownに変換します。

YouTube トランスクリプト ジェネレーター

あらゆるYouTube動画の完全なトランスクリプトを取得します。すべての言語、自動生成および手動キャプションをサポート。コンテンツの再利用、研究、メモ取りに最適です。

Webページ スクレイパー

あらゆるWebページのURLからメインコンテンツを抽出します。ナビゲーション、広告、定型文を自動的に除去。あらゆるWebサイトからクリーンで読みやすいテキストを返します。

ドキュメント パーサー

Word文書 (DOCX)、Excelスプレッドシート (XLSX)、PowerPointプレゼンテーション (PPTX)、CSVファイルを解析します。あらゆるOffice文書フォーマットから構造化されたテキストを抽出します。

画像 から テキスト (OCR)

OCRを使用して画像からテキストを抽出します。JPG、PNG、GIF、WebP、TIFFフォーマットをサポート。スクリーンショット、文書の写真、スキャンされたページからテキストを読み取ります。

音声 & 動画 文字起こし

音声ファイル (MP3, WAV, M4A) を文字起こしし、動画ファイル (MP4, MKV, AVI) から音声を抽出して文字起こしします。音声コンテンツを検索可能なテキストに変換します。

25以上のフォーマットに対応

1つのエンドポイント。あらゆるファイルタイプ。構造化されたテキスト出力。

PDF
DOCX
XLSX
PPTX
CSV
TXT
HTML
Markdown
JSON
XML
EPUB
YouTube
Web Pages
MP3 / Audio
MP4 / Video
JPG / Images
RSS / Atom
OPML
Notebooks
Email

仕組み

1

貼り付けまたはアップロード

URLまたはファイルをドロップしてください。ParseJetがPDF、DOCX、YouTubeリンク、Webページ、画像、音声など、25種類以上のサポート形式を自動検出します。

2

抽出

テキスト、タイトル、メタデータが自動的に抽出されます。入力形式に関わらず、クリーンで構造化された出力を取得できます。

3

テキストの利用

結果をプロジェクト用にコピーするか、ParseJet APIを介して統合し、大規模なテキスト抽出を自動化できます。

ParseJetを選ぶ理由

独自の解析パイプライン構築とParseJet利用の比較

自分で構築する場合

  • 5〜10個の個別ライブラリをインストール(pdfplumber、yt-dlp、trafilatura、python-docx...)
  • バイナリ依存関係の管理(ffmpeg、poppler、tesseract)
  • フォーマット検出とルーティングロジックの作成
  • バージョン競合とプラットフォーム問題への対応
  • 各パーサーの個別メンテナンスと更新
  • フォーマットごとに50〜200行のコード

ParseJetを利用する場合

  • 25+フォーマットすべてに対応する単一のHTTPエンドポイント
  • インストールが必要な依存関係ゼロ
  • 自動検出 — ファイルまたはURLを送信するだけ
  • 常に最新の状態でメンテナンスされるパーサー
  • すべてのフォーマットで一貫したJSONレスポンス
  • 合計3〜5行のコード

数分で統合

あらゆる言語で動作。SDK不要 — HTTPのみで利用可能。

cURL
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
Python
import httpx

resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/url",
    json={"url": "https://youtube.com/watch?v=dQw4w9WgXcQ"}
)
print(resp.json()["text"])  # Full transcript
JavaScript
const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  body: formData, // FormData with your PDF
});
const { text, title, source_type } = await res.json();

AIエージェント向けに構築

AIにあらゆるドキュメントやURLを読み取る能力を。1回のAPIコールで、構造化されたテキスト出力を。

Claude & Claude Code

ParseJetをMCPサーバーまたはHTTPツールとして使用。Claudeが会話中にPDF、Webページ、ドキュメントからテキストを抽出できます。

ChatGPT & GPTエージェント

ParseJetをGPTのカスタムアクションとして追加。エージェントはあらゆるファイルやURLを解析し、抽出されたテキストを推論できます。

Gemini & Google AI

関数呼び出し経由で統合。ParseJetが解析を処理するので、Geminiはコンテンツの理解に集中できます。

LangChain & LlamaIndex

ParseJetをドキュメントローダーとして使用。1つのエンドポイントがRAGパイプライン内の数十のフォーマット固有ローダーを置き換えます。

OpenClaw & オープンソースエージェント

HTTPリクエストを実行できるあらゆるAIエージェントがParseJetを使用可能。自律的なリクエストごとの支払いのためのMachine Payments Protocol (MPP)をサポート。

カスタムAIワークフロー

n8n、Make、Zapierで自動化パイプラインを構築。ParseJetがテキストを抽出し、AIが処理します。コードは不要です。

自動化をお求めですか?

ParseJet APIは、単一のHTTPエンドポイントで同じ解析機能を提供します。ffmpeg、poppler、tesseractは不要。APIコール一つだけです。

curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Content-Type: application/json" \ -d '{"url":"https://example.com"}'
APIドキュメントを読む

よくある質問

PDFファイルからテキストを抽出するにはどうすればよいですか?

PDFをParseJetにアップロードするか、APIを使用してください: POST /v1/parse/auto/file にPDFを送信します。ParseJetはすべてのテキストコンテンツを抽出し、構造を保持し、複数ページのドキュメントを処理します。OCRによるスキャンされたPDFにも対応しています。

YouTube動画のトランスクリプトを取得するにはどうすればよいですか?

YouTubeのURLをParseJetに貼り付けるか、POST /v1/parse/youtube を動画URLで呼び出してください。ParseJetはタイムスタンプ付きの完全なトランスクリプトを返します。100以上の言語の自動生成キャプションをサポートしています。

PDFをMarkdownに変換できますか?

はい。リクエストに ?output_format=markdown を追加してください。ParseJetはPDF内の見出し、リスト、表、コードブロックを検出し、きれいなMarkdown構文に変換します。

ParseJetは無料で使用できますか?

はい。サインアップなしで1日3回の無料リクエストが利用できます。無料アカウントを作成すると、月300回のリクエストが利用可能です。有料プランは月額$19からで、3,000回のリクエストが含まれます。

ParseJetはどのファイル形式をサポートしていますか?

ParseJetは25以上の形式をサポートしています: PDF、DOCX、XLSX、PPTX、CSV、TXT、HTML、Markdown、JSON、XML、EPUB、YouTube動画、ウェブページ、MP3、WAV、M4A(オーディオ)、MP4、MKV、AVI(ビデオ)、JPG、PNG、GIF(画像)、RSS、Atom、OPMLフィード、Jupyterノートブック、メールファイル。

APIキーは必要ですか?

いいえ。匿名アクセスでテストが可能です(1日3回)。本番環境での使用には、parsejet.comで無料のAPIキーを作成してください。無料で月300回のリクエストが利用できます。

ParseJetはpdfplumberやtrafilaturaと比べてどうですか?

ParseJetは複数のライブラリを1つのAPIで置き換えます。PDF用にpdfplumber、ウェブページ用にtrafilatura、YouTube用にyt-dlp、Wordファイル用にpython-docxをインストールする代わりに、ParseJetに1回のHTTP呼び出しを行うだけで、すべてを処理します。

AIエージェントはParseJetを使用できますか?

はい。ParseJetは、アカウントなしでリクエストごとに支払うアクセスを可能にするMachine Payments Protocol (MPP)をサポートしています。AIエージェントは、匿名アクセス(1日3回)や、より高い制限のためのAPIキーも使用できます。

無料でテキスト抽出を始める

サインアップ不要。数秒で最初のファイルを解析。

料金を見る