テキストを抽出
あらゆるファイルやURLから

Name: ParseJet
Author: ParseJet

PDFをテキストに変換、YouTubeの文字起こし、ウェブページのスクレイピングができる無料オンラインツール。25以上のフォーマットに対応する単一APIで、AIエージェントを強化または直接利用できます。無料APIキー付き。

ここにファイルをドロップするか、参照

PDF、DOCX、XLSX、画像、音声、動画など

無料 — 1日3リクエスト、登録不要。して月300クレジットを無料で。

あらゆるテキスト抽出タスクに対応する単一ツール

フォーマットごとに別々のライブラリをインストールするのはやめましょう。ParseJetがすべて処理します。

PDF からテキストコンバーター

PDFファイルから瞬時にテキストを抽出します。スキャン文書、複数ページのレポート、複雑なレイアウトに対応。ワンクリックでPDFをプレーンテキストまたはMarkdownに変換します。

YouTube トランスクリプトジェネレーター

あらゆるYouTube動画の完全なトランスクリプトを取得します。すべての言語、自動生成および手動キャプションをサポート。コンテンツの再利用、研究、メモ取りに最適です。

Webページスクレイパー

あらゆるWebページのURLからメインコンテンツを抽出します。ナビゲーション、広告、定型文を自動的に除去。あらゆるWebサイトからクリーンで読みやすいテキストを返します。

ドキュメントパーサー

Word文書 (DOCX)、Excelスプレッドシート (XLSX)、PowerPointプレゼンテーション (PPTX)、CSVファイルを解析します。あらゆるOffice文書フォーマットから構造化されたテキストを抽出します。

画像からテキスト (OCR)

OCRを使用して画像からテキストを抽出します。JPG、PNG、GIF、WebP、TIFFフォーマットをサポート。スクリーンショット、文書の写真、スキャンされたページからテキストを読み取ります。

音声 & 動画文字起こし

音声ファイル (MP3, WAV, M4A) を文字起こしし、動画ファイル (MP4, MKV, AVI) から音声を抽出して文字起こしします。音声コンテンツを検索可能なテキストに変換します。

25以上のフォーマットに対応

1つのエンドポイント。あらゆるファイルタイプ。構造化されたテキスト出力。

PDF

DOCX

XLSX

PPTX

CSV

TXT

HTML

Markdown

JSON

XML

EPUB

YouTube

Web Pages

MP3 / Audio

MP4 / Video

JPG / Images

RSS / Atom

OPML

Notebooks

仕組み

貼り付けまたはアップロード

URLまたはファイルをドロップしてください。ParseJetがPDF、DOCX、YouTubeリンク、Webページ、画像、音声など、25種類以上のサポート形式を自動検出します。

抽出

テキスト、タイトル、メタデータが自動的に抽出されます。入力形式に関わらず、クリーンで構造化された出力を取得できます。

テキストの利用

結果をプロジェクト用にコピーするか、ParseJet APIを介して統合し、大規模なテキスト抽出を自動化できます。

ParseJetを選ぶ理由

独自の解析パイプライン構築とParseJet利用の比較

自分で構築する場合

✗ 5〜10個の個別ライブラリをインストール（pdfplumber、yt-dlp、trafilatura、python-docx...）
✗ バイナリ依存関係の管理（ffmpeg、poppler、tesseract）
✗ フォーマット検出とルーティングロジックの作成
✗ バージョン競合とプラットフォーム問題への対応
✗ 各パーサーの個別メンテナンスと更新
✗ フォーマットごとに50〜200行のコード

ParseJetを利用する場合

✓ 25+フォーマットすべてに対応する単一のHTTPエンドポイント
✓ インストールが必要な依存関係ゼロ
✓ 自動検出 — ファイルまたはURLを送信するだけ
✓ 常に最新の状態でメンテナンスされるパーサー
✓ すべてのフォーマットで一貫したJSONレスポンス
✓ 合計3〜5行のコード

数分で統合

あらゆる言語で動作。SDK不要 — HTTPのみで利用可能。

cURL

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

Python

import httpx

resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/url",
    json={"url": "https://youtube.com/watch?v=dQw4w9WgXcQ"}
)
print(resp.json()["text"])  # Full transcript

JavaScript

const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  body: formData, // FormData with your PDF
});
const { text, title, source_type } = await res.json();

AIエージェント向けに構築

AIにあらゆるドキュメントやURLを読み取る能力を。1回のAPIコールで、構造化されたテキスト出力を。

Claude & Claude Code

ParseJetをMCPサーバーまたはHTTPツールとして使用。Claudeが会話中にPDF、Webページ、ドキュメントからテキストを抽出できます。

ChatGPT & GPTエージェント

ParseJetをGPTのカスタムアクションとして追加。エージェントはあらゆるファイルやURLを解析し、抽出されたテキストを推論できます。

Gemini & Google AI

関数呼び出し経由で統合。ParseJetが解析を処理するので、Geminiはコンテンツの理解に集中できます。

LangChain & LlamaIndex

ParseJetをドキュメントローダーとして使用。1つのエンドポイントがRAGパイプライン内の数十のフォーマット固有ローダーを置き換えます。

OpenClaw & オープンソースエージェント

HTTPリクエストを実行できるあらゆるAIエージェントがParseJetを使用可能。自律的なリクエストごとの支払いのためのMachine Payments Protocol (MPP)をサポート。

カスタムAIワークフロー

n8n、Make、Zapierで自動化パイプラインを構築。ParseJetがテキストを抽出し、AIが処理します。コードは不要です。

自動化をお求めですか？

ParseJet APIは、単一のHTTPエンドポイントで同じ解析機能を提供します。ffmpeg、poppler、tesseractは不要。APIコール一つだけです。

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url":"https://example.com"}'

APIドキュメントを読む

よくある質問

PDFファイルからテキストを抽出するにはどうすればよいですか？

PDFをParseJetにアップロードするか、APIを使用してください: POST /v1/parse/auto/file にPDFを送信します。ParseJetはすべてのテキストコンテンツを抽出し、構造を保持し、複数ページのドキュメントを処理します。OCRによるスキャンされたPDFにも対応しています。

YouTube動画のトランスクリプトを取得するにはどうすればよいですか？

YouTubeのURLをParseJetに貼り付けるか、POST /v1/parse/youtube を動画URLで呼び出してください。ParseJetはタイムスタンプ付きの完全なトランスクリプトを返します。100以上の言語の自動生成キャプションをサポートしています。

PDFをMarkdownに変換できますか？

はい。リクエストに ?output_format=markdown を追加してください。ParseJetはPDF内の見出し、リスト、表、コードブロックを検出し、きれいなMarkdown構文に変換します。

ParseJetは無料で使用できますか？

はい。サインアップなしで1日3回の無料リクエストが利用できます。無料アカウントを作成すると、月300回のリクエストが利用可能です。有料プランは月額$19からで、3,000回のリクエストが含まれます。

ParseJetはどのファイル形式をサポートしていますか？

ParseJetは25以上の形式をサポートしています: PDF、DOCX、XLSX、PPTX、CSV、TXT、HTML、Markdown、JSON、XML、EPUB、YouTube動画、ウェブページ、MP3、WAV、M4A（オーディオ）、MP4、MKV、AVI（ビデオ）、JPG、PNG、GIF（画像）、RSS、Atom、OPMLフィード、Jupyterノートブック、メールファイル。

APIキーは必要ですか？

いいえ。匿名アクセスでテストが可能です（1日3回）。本番環境での使用には、parsejet.comで無料のAPIキーを作成してください。無料で月300回のリクエストが利用できます。

ParseJetはpdfplumberやtrafilaturaと比べてどうですか？

ParseJetは複数のライブラリを1つのAPIで置き換えます。PDF用にpdfplumber、ウェブページ用にtrafilatura、YouTube用にyt-dlp、Wordファイル用にpython-docxをインストールする代わりに、ParseJetに1回のHTTP呼び出しを行うだけで、すべてを処理します。

AIエージェントはParseJetを使用できますか？

はい。ParseJetは、アカウントなしでリクエストごとに支払うアクセスを可能にするMachine Payments Protocol (MPP)をサポートしています。AIエージェントは、匿名アクセス（1日3回）や、より高い制限のためのAPIキーも使用できます。

無料でテキスト抽出を始める

サインアップ不要。数秒で最初のファイルを解析。

料金を見る

テキストを抽出 あらゆるファイルやURLから