ParseJet

從任何檔案或網址
提取文字

免費線上工具,可將 PDF 轉為文字、取得 YouTube 字幕、擷取網頁內容。單一 API 支援 25+ 種格式 — 為您的 AI 代理提供動力或直接使用。包含免費 API 金鑰。

將檔案拖放到此處或 瀏覽

PDF、DOCX、XLSX、圖片、音訊、影片等

免費 — 每日 3 次請求,無需註冊。 即可獲得每月 300 點免費額度。

一個工具,滿足所有文字擷取需求

無需為每種格式安裝獨立函式庫。ParseJet 一網打盡。

PDF 轉文字轉換器

立即從 PDF 檔案中擷取文字。可處理掃描文件、多頁報告及複雜版面。一鍵將 PDF 轉換為純文字或 Markdown。

YouTube 字幕產生器

取得任何 YouTube 影片的完整字幕。支援所有語言、自動生成及手動字幕。非常適合內容再利用、研究和筆記。

網頁擷取器

從任何網頁 URL 擷取主要內容。自動移除導覽列、廣告和樣板文字。從任何網站返回乾淨、易讀的文字。

文件解析器

解析 Word 文件 (DOCX)、Excel 試算表 (XLSX)、PowerPoint 簡報 (PPTX) 和 CSV 檔案。從任何 Office 文件格式擷取結構化文字。

圖片轉文字 (OCR)

使用 OCR 從圖片中擷取文字。支援 JPG、PNG、GIF、WebP 和 TIFF 格式。可讀取螢幕截圖、文件照片和掃描頁面中的文字。

音訊與視訊轉錄

轉錄音訊檔案 (MP3, WAV, M4A),並從視訊檔案 (MP4, MKV, AVI) 中擷取音訊進行轉錄。將口語內容轉換為可搜尋的文字。

支援 25+ 種格式

一個端點。所有檔案類型。結構化文字輸出。

PDF
DOCX
XLSX
PPTX
CSV
TXT
HTML
Markdown
JSON
XML
EPUB
YouTube
Web Pages
MP3 / Audio
MP4 / Video
JPG / Images
RSS / Atom
OPML
Notebooks
Email

運作方式

1

貼上或上傳

貼上一個 URL 或上傳檔案。ParseJet 會自動偵測格式 — PDF、DOCX、YouTube 連結、網頁、圖片、音訊,或任何超過 25 種支援的類型。

2

擷取

文字、標題與後設資料會自動擷取。無論輸入格式為何,都能獲得乾淨、結構化的輸出。

3

使用文字

複製結果用於您的專案,或透過 ParseJet API 整合,以自動化大規模的文字擷取。

為何選擇 ParseJet?

比較自行建構解析管線與使用 ParseJet 的差異。

自行處理

  • 安裝 5-10 個獨立的函式庫 (pdfplumber, yt-dlp, trafilatura, python-docx...)
  • 處理二進位相依項 (ffmpeg, poppler, tesseract)
  • 編寫格式偵測與路由邏輯
  • 處理版本衝突與平台問題
  • 分別維護與更新每個解析器
  • 每種格式需要 50-200 行程式碼

使用 ParseJet

  • 一個 HTTP 端點支援所有 25+ 種格式
  • 無需安裝任何相依項
  • 自動偵測 — 只需傳送檔案或 URL
  • 解析器持續為您維護更新
  • 每種格式都回傳一致的 JSON 回應
  • 總共只需 3-5 行程式碼

幾分鐘內完成整合

適用於任何語言。無需 SDK — 只需 HTTP。

cURL
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
Python
import httpx

resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/url",
    json={"url": "https://youtube.com/watch?v=dQw4w9WgXcQ"}
)
print(resp.json()["text"])  # Full transcript
JavaScript
const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  body: formData, // FormData with your PDF
});
const { text, title, source_type } = await res.json();

專為 AI 代理設計

讓您的 AI 具備讀取任何文件或 URL 的能力。一次 API 呼叫,輸出結構化文字。

Claude & Claude Code

將 ParseJet 用作 MCP 伺服器或 HTTP 工具。讓 Claude 在對話中從 PDF、網頁和文件中提取文字。

ChatGPT & GPT 代理

將 ParseJet 添加為 GPT 中的自訂動作。您的代理可以解析任何檔案或 URL,並對提取的文字進行推理。

Gemini & Google AI

透過函式呼叫整合。ParseJet 負責解析,讓 Gemini 專注於理解內容。

LangChain & LlamaIndex

將 ParseJet 用作文件載入器。一個端點即可取代 RAG 流程中數十種特定格式的載入器。

OpenClaw & 開源代理

任何能發送 HTTP 請求的 AI 代理都能使用 ParseJet。支援機器支付協議 (MPP),實現按請求自主付費。

自訂 AI 工作流程

使用 n8n、Make 或 Zapier 建構自動化流程。ParseJet 提取文字,您的 AI 進行處理。無需編寫程式碼。

想要自動化處理嗎?

ParseJet API 透過單一 HTTP 端點提供相同的解析能力。無需 ffmpeg、poppler 或 tesseract — 只需一次 API 呼叫。

curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Content-Type: application/json" \ -d '{"url":"https://example.com"}'
閱讀 API 文件

常見問題

如何從 PDF 檔案中擷取文字?

將您的 PDF 上傳到 ParseJet 或使用 API:POST /v1/parse/auto/file 並附上您的 PDF。ParseJet 會擷取所有文字內容,保留結構並處理多頁文件。也透過 OCR 支援掃描的 PDF。

如何取得 YouTube 影片的字幕稿?

將 YouTube URL 貼到 ParseJet 或呼叫 POST /v1/parse/youtube 並附上影片 URL。ParseJet 會回傳帶有時間戳記的完整字幕稿。支援 100 多種語言的自動生成字幕。

可以將 PDF 轉換為 Markdown 嗎?

可以。在您的請求中加入 ?output_format=markdown。ParseJet 會偵測 PDF 中的標題、清單、表格和程式碼區塊,並將其轉換為乾淨的 Markdown 語法。

ParseJet 是免費使用的嗎?

是的。您每天有 3 次免費請求,無需註冊。建立免費帳戶可獲得每月 300 次請求。付費方案每月 19 美元起,提供 3,000 次請求。

ParseJet 支援哪些檔案格式?

ParseJet 支援 25 種以上格式:PDF、DOCX、XLSX、PPTX、CSV、TXT、HTML、Markdown、JSON、XML、EPUB、YouTube 影片、網頁、MP3、WAV、M4A (音訊)、MP4、MKV、AVI (影片)、JPG、PNG、GIF (圖片)、RSS、Atom、OPML 摘要、Jupyter 筆記本和電子郵件檔案。

我需要 API 金鑰嗎?

不需要。匿名存取可用於測試(每天 3 次請求)。用於生產環境時,請在 parsejet.com 建立免費的 API 金鑰 — 您每月可免費獲得 300 次請求。

ParseJet 與 pdfplumber 或 trafilatura 相比如何?

ParseJet 用一個 API 取代了多個函式庫。您無需為 PDF 安裝 pdfplumber、為網頁安裝 trafilatura、為 YouTube 安裝 yt-dlp、為 Word 檔案安裝 python-docx,只需向 ParseJet 發送一個 HTTP 呼叫,它就能處理一切。

AI 代理可以使用 ParseJet 嗎?

可以。ParseJet 支援機器支付協定 (MPP),用於按次付費存取,無需帳戶。AI 代理也可以使用匿名存取(每天 3 次)或 API 金鑰來獲得更高的限制。

免費開始提取文字

無需註冊。幾秒內解析您的第一個檔案。

查看定價