PDF 轉文字轉換器
立即從 PDF 檔案中擷取文字。可處理掃描文件、多頁報告及複雜版面。一鍵將 PDF 轉換為純文字或 Markdown。
免費線上工具,可將 PDF 轉為文字、取得 YouTube 字幕、擷取網頁內容。單一 API 支援 25+ 種格式 — 為您的 AI 代理提供動力或直接使用。包含免費 API 金鑰。
將檔案拖放到此處或 瀏覽
PDF、DOCX、XLSX、圖片、音訊、影片等
免費 — 每日 3 次請求,無需註冊。 即可獲得每月 300 點免費額度。
無需為每種格式安裝獨立函式庫。ParseJet 一網打盡。
立即從 PDF 檔案中擷取文字。可處理掃描文件、多頁報告及複雜版面。一鍵將 PDF 轉換為純文字或 Markdown。
取得任何 YouTube 影片的完整字幕。支援所有語言、自動生成及手動字幕。非常適合內容再利用、研究和筆記。
從任何網頁 URL 擷取主要內容。自動移除導覽列、廣告和樣板文字。從任何網站返回乾淨、易讀的文字。
解析 Word 文件 (DOCX)、Excel 試算表 (XLSX)、PowerPoint 簡報 (PPTX) 和 CSV 檔案。從任何 Office 文件格式擷取結構化文字。
使用 OCR 從圖片中擷取文字。支援 JPG、PNG、GIF、WebP 和 TIFF 格式。可讀取螢幕截圖、文件照片和掃描頁面中的文字。
轉錄音訊檔案 (MP3, WAV, M4A),並從視訊檔案 (MP4, MKV, AVI) 中擷取音訊進行轉錄。將口語內容轉換為可搜尋的文字。
一個端點。所有檔案類型。結構化文字輸出。
貼上一個 URL 或上傳檔案。ParseJet 會自動偵測格式 — PDF、DOCX、YouTube 連結、網頁、圖片、音訊,或任何超過 25 種支援的類型。
文字、標題與後設資料會自動擷取。無論輸入格式為何,都能獲得乾淨、結構化的輸出。
複製結果用於您的專案,或透過 ParseJet API 整合,以自動化大規模的文字擷取。
比較自行建構解析管線與使用 ParseJet 的差異。
適用於任何語言。無需 SDK — 只需 HTTP。
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
-H "Content-Type: application/json" \
-d '{"url": "https://example.com"}' import httpx
resp = httpx.post(
"https://api.parsejet.com/v1/parse/auto/url",
json={"url": "https://youtube.com/watch?v=dQw4w9WgXcQ"}
)
print(resp.json()["text"]) # Full transcript const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
method: "POST",
body: formData, // FormData with your PDF
});
const { text, title, source_type } = await res.json(); 讓您的 AI 具備讀取任何文件或 URL 的能力。一次 API 呼叫,輸出結構化文字。
將 ParseJet 用作 MCP 伺服器或 HTTP 工具。讓 Claude 在對話中從 PDF、網頁和文件中提取文字。
將 ParseJet 添加為 GPT 中的自訂動作。您的代理可以解析任何檔案或 URL,並對提取的文字進行推理。
透過函式呼叫整合。ParseJet 負責解析,讓 Gemini 專注於理解內容。
將 ParseJet 用作文件載入器。一個端點即可取代 RAG 流程中數十種特定格式的載入器。
任何能發送 HTTP 請求的 AI 代理都能使用 ParseJet。支援機器支付協議 (MPP),實現按請求自主付費。
使用 n8n、Make 或 Zapier 建構自動化流程。ParseJet 提取文字,您的 AI 進行處理。無需編寫程式碼。
將您的 PDF 上傳到 ParseJet 或使用 API:POST /v1/parse/auto/file 並附上您的 PDF。ParseJet 會擷取所有文字內容,保留結構並處理多頁文件。也透過 OCR 支援掃描的 PDF。
將 YouTube URL 貼到 ParseJet 或呼叫 POST /v1/parse/youtube 並附上影片 URL。ParseJet 會回傳帶有時間戳記的完整字幕稿。支援 100 多種語言的自動生成字幕。
可以。在您的請求中加入 ?output_format=markdown。ParseJet 會偵測 PDF 中的標題、清單、表格和程式碼區塊,並將其轉換為乾淨的 Markdown 語法。
是的。您每天有 3 次免費請求,無需註冊。建立免費帳戶可獲得每月 300 次請求。付費方案每月 19 美元起,提供 3,000 次請求。
ParseJet 支援 25 種以上格式:PDF、DOCX、XLSX、PPTX、CSV、TXT、HTML、Markdown、JSON、XML、EPUB、YouTube 影片、網頁、MP3、WAV、M4A (音訊)、MP4、MKV、AVI (影片)、JPG、PNG、GIF (圖片)、RSS、Atom、OPML 摘要、Jupyter 筆記本和電子郵件檔案。
不需要。匿名存取可用於測試(每天 3 次請求)。用於生產環境時,請在 parsejet.com 建立免費的 API 金鑰 — 您每月可免費獲得 300 次請求。
ParseJet 用一個 API 取代了多個函式庫。您無需為 PDF 安裝 pdfplumber、為網頁安裝 trafilatura、為 YouTube 安裝 yt-dlp、為 Word 檔案安裝 python-docx,只需向 ParseJet 發送一個 HTTP 呼叫,它就能處理一切。
可以。ParseJet 支援機器支付協定 (MPP),用於按次付費存取,無需帳戶。AI 代理也可以使用匿名存取(每天 3 次)或 API 金鑰來獲得更高的限制。