PDF から テキスト コンバーター
PDFファイルから瞬時にテキストを抽出します。スキャン文書、複数ページのレポート、複雑なレイアウトに対応。ワンクリックでPDFをプレーンテキストまたはMarkdownに変換します。
PDFをテキストに変換、YouTubeの文字起こし、ウェブページのスクレイピングができる無料オンラインツール。25以上のフォーマットに対応する単一APIで、AIエージェントを強化または直接利用できます。無料APIキー付き。
ここにファイルをドロップするか、 参照
PDF、DOCX、XLSX、画像、音声、動画など
無料 — 1日3リクエスト、登録不要。 して月300クレジットを無料で。
フォーマットごとに別々のライブラリをインストールするのはやめましょう。ParseJetがすべて処理します。
PDFファイルから瞬時にテキストを抽出します。スキャン文書、複数ページのレポート、複雑なレイアウトに対応。ワンクリックでPDFをプレーンテキストまたはMarkdownに変換します。
あらゆるYouTube動画の完全なトランスクリプトを取得します。すべての言語、自動生成および手動キャプションをサポート。コンテンツの再利用、研究、メモ取りに最適です。
あらゆるWebページのURLからメインコンテンツを抽出します。ナビゲーション、広告、定型文を自動的に除去。あらゆるWebサイトからクリーンで読みやすいテキストを返します。
Word文書 (DOCX)、Excelスプレッドシート (XLSX)、PowerPointプレゼンテーション (PPTX)、CSVファイルを解析します。あらゆるOffice文書フォーマットから構造化されたテキストを抽出します。
OCRを使用して画像からテキストを抽出します。JPG、PNG、GIF、WebP、TIFFフォーマットをサポート。スクリーンショット、文書の写真、スキャンされたページからテキストを読み取ります。
音声ファイル (MP3, WAV, M4A) を文字起こしし、動画ファイル (MP4, MKV, AVI) から音声を抽出して文字起こしします。音声コンテンツを検索可能なテキストに変換します。
1つのエンドポイント。あらゆるファイルタイプ。構造化されたテキスト出力。
URLまたはファイルをドロップしてください。ParseJetがPDF、DOCX、YouTubeリンク、Webページ、画像、音声など、25種類以上のサポート形式を自動検出します。
テキスト、タイトル、メタデータが自動的に抽出されます。入力形式に関わらず、クリーンで構造化された出力を取得できます。
結果をプロジェクト用にコピーするか、ParseJet APIを介して統合し、大規模なテキスト抽出を自動化できます。
独自の解析パイプライン構築とParseJet利用の比較
あらゆる言語で動作。SDK不要 — HTTPのみで利用可能。
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
-H "Content-Type: application/json" \
-d '{"url": "https://example.com"}' import httpx
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/url",
json={"url": "https://youtube.com/watch?v=dQw4w9WgXcQ"}
)
print(resp.json()["text"]) # Full transcript const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
method: "POST",
body: formData, // FormData with your PDF
});
const { text, title, source_type } = await res.json(); AIにあらゆるドキュメントやURLを読み取る能力を。1回のAPIコールで、構造化されたテキスト出力を。
ParseJetをMCPサーバーまたはHTTPツールとして使用。Claudeが会話中にPDF、Webページ、ドキュメントからテキストを抽出できます。
ParseJetをGPTのカスタムアクションとして追加。エージェントはあらゆるファイルやURLを解析し、抽出されたテキストを推論できます。
関数呼び出し経由で統合。ParseJetが解析を処理するので、Geminiはコンテンツの理解に集中できます。
ParseJetをドキュメントローダーとして使用。1つのエンドポイントがRAGパイプライン内の数十のフォーマット固有ローダーを置き換えます。
HTTPリクエストを実行できるあらゆるAIエージェントがParseJetを使用可能。自律的なリクエストごとの支払いのためのMachine Payments Protocol (MPP)をサポート。
n8n、Make、Zapierで自動化パイプラインを構築。ParseJetがテキストを抽出し、AIが処理します。コードは不要です。
ParseJet APIは、単一のHTTPエンドポイントで同じ解析機能を提供します。ffmpeg、poppler、tesseractは不要。APIコール一つだけです。
PDFをParseJetにアップロードするか、APIを使用してください: POST /v1/parse/auto/file にPDFを送信します。ParseJetはすべてのテキストコンテンツを抽出し、構造を保持し、複数ページのドキュメントを処理します。OCRによるスキャンされたPDFにも対応しています。
YouTubeのURLをParseJetに貼り付けるか、POST /v1/parse/youtube を動画URLで呼び出してください。ParseJetはタイムスタンプ付きの完全なトランスクリプトを返します。100以上の言語の自動生成キャプションをサポートしています。
はい。リクエストに ?output_format=markdown を追加してください。ParseJetはPDF内の見出し、リスト、表、コードブロックを検出し、きれいなMarkdown構文に変換します。
はい。サインアップなしで1日3回の無料リクエストが利用できます。無料アカウントを作成すると、月300回のリクエストが利用可能です。有料プランは月額$19からで、3,000回のリクエストが含まれます。
ParseJetは25以上の形式をサポートしています: PDF、DOCX、XLSX、PPTX、CSV、TXT、HTML、Markdown、JSON、XML、EPUB、YouTube動画、ウェブページ、MP3、WAV、M4A(オーディオ)、MP4、MKV、AVI(ビデオ)、JPG、PNG、GIF(画像)、RSS、Atom、OPMLフィード、Jupyterノートブック、メールファイル。
いいえ。匿名アクセスでテストが可能です(1日3回)。本番環境での使用には、parsejet.comで無料のAPIキーを作成してください。無料で月300回のリクエストが利用できます。
ParseJetは複数のライブラリを1つのAPIで置き換えます。PDF用にpdfplumber、ウェブページ用にtrafilatura、YouTube用にyt-dlp、Wordファイル用にpython-docxをインストールする代わりに、ParseJetに1回のHTTP呼び出しを行うだけで、すべてを処理します。
はい。ParseJetは、アカウントなしでリクエストごとに支払うアクセスを可能にするMachine Payments Protocol (MPP)をサポートしています。AIエージェントは、匿名アクセス(1日3回)や、より高い制限のためのAPIキーも使用できます。