ParseJet

Dokumentasi

Dokumentasi ParseJet

ParseJet mengekstrak teks dari file atau URL apa pun. Satu panggilan API menangani PDF, DOCX, YouTube, halaman web, gambar, audio, video, dan 25+ format lainnya.

Mulai Cepat

Dapatkan hasil parse pertama Anda dalam waktu kurang dari 60 detik. Tidak perlu mendaftar.

1

Coba langsung

Tempelkan URL apa pun ke ParseJet โ€” tidak perlu kunci API untuk 3 permintaan pertama Anda per hari.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
2

Dapatkan kunci API Anda

Masuk dengan Google atau GitHub untuk mendapatkan kunci API gratis. Paket gratis mencakup 300 permintaan per bulan.

# Add your API key to requests
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
3

Gunakan hasilnya

Setiap respons mengembalikan struktur JSON yang sama terlepas dari format input:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "webpage",
  "metadata": { "url": "https://example.com" }
}

Autentikasi

ParseJet menawarkan tiga tingkat akses. Anda dapat mulai menggunakan API segera tanpa autentikasi apa pun.

Tingkat Cara akses Batas kecepatan Terbaik untuk
AnonimTanpa header3/hari, 2MBPengujian cepat
SesiMasuk (cookie)10/hari, 5MBAlat dashboard
Kunci APIAuthorization: Bearer pj_xxxBerdasarkan paketProduksi

Tip: Anda tidak memerlukan kunci API untuk memulai. Cukup kirim permintaan langsung โ€” 3 permintaan pertama per hari gratis tanpa pendaftaran.

Konsep Inti

Format yang didukung

ParseJet mendeteksi format secara otomatis dari ekstensi file atau pola URL. Anda tidak perlu menentukan formatnya โ€” cukup kirim file atau URL ke /v1/parse/auto dan ParseJet akan menangani sisanya.

Kategori Format Kredit
TeksTXT, MD, JSON, CSV, XML, HTML1
DokumenDOCX, PPTX, XLSX, EPUB2
KompleksPDF, halaman web, video3
YouTubeURL video YouTube5
LainnyaAudio (MP3, WAV), gambar (JPG, PNG), RSS, OPML, email, notebook1

Kredit

Setiap permintaan API menggunakan kredit berdasarkan kompleksitas format yang diurai. File teks sederhana berharga 1 kredit, sedangkan transkrip YouTube berharga 5. Kuota kredit bulanan Anda bergantung pada paket Anda.

Format keluaran

Secara default, ParseJet mengembalikan teks mentah yang diekstrak. Tambahkan ?output_format=markdown ke permintaan apa pun untuk mendapatkan keluaran pasca-proses dengan heading, daftar, tabel, dan blok kode yang terdeteksi.

Panduan

Parse PDF

Ekstrak teks dari file PDF apa pun, termasuk dokumen pindaian dan laporan multi-halaman.

Unggah file PDF

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Konversi ke Markdown

Tambahkan output_format=markdown untuk mempertahankan struktur dokumen:

curl -X POST https://api.parsejet.com/v1/parse/auto/file?output_format=markdown \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Biaya kredit: 3 kredit per PDF. Mendukung file hingga batas ukuran file paket Anda (10MB-200MB).

Panduan

Transkrip YouTube

Dapatkan transkrip lengkap dari video YouTube apa pun. Mendukung teks otomatis dalam 100+ bahasa.

Dapatkan transkrip

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID"}'

Tentukan bahasa

Gunakan parameter language untuk video non-Inggris:

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "ja"}'

Atau gunakan deteksi otomatis

Endpoint /v1/parse/auto/url secara otomatis mendeteksi URL YouTube:

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtu.be/VIDEO_ID"}'

Biaya kredit: 5 kredit per video YouTube. Metadata mencakup video_id, channel, dan durasi.

Panduan

Web Scraping

Ekstrak konten utama dari halaman web apa pun. ParseJet secara otomatis menghapus navigasi, iklan, sidebar, dan boilerplate.

curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/blog/article"}'

Biaya kredit: 3 kredit per halaman web. Mengembalikan teks bersih dengan judul dan URL sumber dalam metadata.

Panduan

Dokumen Office

Parse file Word (DOCX), Excel (XLSX), PowerPoint (PPTX), dan CSV. Cukup unggah file โ€” ParseJet mendeteksi formatnya secara otomatis.

# Works with any Office format
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

# Also works with spreadsheets
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Biaya kredit: 2 kredit per dokumen. Didukung: DOCX, PPTX, XLSX, CSV.

Referensi API

Format Respons

Semua endpoint mengembalikan struktur JSON yang sama:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "pdf",
  "metadata": { "pages": 12, "author": "Jane Doe" }
}
Kolom Tipe Deskripsi
textstringKonten teks yang diekstrak
titlestringJudul dokumen atau halaman
source_typestringPengenal format (pdf, webpage, youtube, dll.)
metadataobjectMetadata spesifik format (jumlah halaman, penulis, durasi, dll.)
POST

/v1/parse/auto

Endpoint yang direkomendasikan. Mendeteksi format secara otomatis dari ekstensi file atau tipe URL. Menerima file (multipart) atau url (form field), tidak keduanya.

curl -X POST https://api.parsejet.com/v1/parse/auto \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/auto/url

Parse URL apa pun. Secara otomatis membedakan YouTube dari halaman web biasa.

ParameterTipeWajibDeskripsi
urlstringyaURL yang akan di-parse
languagestringtidakKode ISO 639-1 untuk bahasa transkrip YouTube
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
POST

/v1/parse/auto/file

Parse file yang diunggah apa pun. Mendeteksi format dari ekstensi file, fallback ke deteksi berbasis konten.

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/webpage

Ekstrak konten utama dari halaman web. Menghapus navigasi, iklan, dan boilerplate.

ParameterTipeWajibDeskripsi
urlstringyaURL halaman web
curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/article"}'
POST

/v1/parse/youtube

Ekstrak transkrip dari video YouTube. Metadata mencakup video_id, channel, dan durasi.

ParameterTipeWajibDeskripsi
urlstringyaURL video YouTube atau ID video
languagestringtidakKode bahasa ISO 639-1
curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "en"}'
POST

/v1/parse/audio

Parse file audio. Mendukung MP3, WAV, M4A, OGG, FLAC, WebM. Maks. 25MB.

KolomTipeWajibDeskripsi
filefileyaFile audio
languagestringtidakKode ISO 639-1
with_timestampsbooleantidakSertakan stempel waktu per kata
curl -X POST https://api.parsejet.com/v1/parse/audio \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/video

Ekstrak audio dari video untuk transkripsi. Mendukung MP4, MKV, AVI, MOV, WebM.

curl -X POST https://api.parsejet.com/v1/parse/video \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/epub

Parse ebook EPUB. Mengekstrak teks yang diatur berdasarkan bab.

curl -X POST https://api.parsejet.com/v1/parse/epub \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/feed

Parse feed RSS atau Atom. Juga mendukung OPML via /v1/parse/opml.

curl -X POST https://api.parsejet.com/v1/parse/feed \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/image

Analisis gambar. Mendukung JPG, PNG, GIF, BMP, WebP, TIFF. Maks. 20MB.

KolomTipeWajibDeskripsi
filefileyaFile gambar
promptstringtidakPrompt kustom untuk analisis gambar
modelstringtidakOverride model visi
curl -X POST https://api.parsejet.com/v1/parse/image \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "prompt=Describe this image"
POST

/v1/parse/image/ocr

Ekstrak teks dari gambar via OCR.

curl -X POST https://api.parsejet.com/v1/parse/image/ocr \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

SDK

SDK Resmi

TypeScript / JavaScript

npm install parsejet
import { ParseJet } from "parsejet";

const client = new ParseJet({ apiKey: "pj_YOUR_KEY" });

// Parse a URL
const result = await client.parse.url("https://example.com");
console.log(result.text);

// Parse a file
const result = await client.parse.file(buffer, "report.pdf");
console.log(result.text);

Python

pip install parsejet
from parsejet import ParseJet

client = ParseJet(api_key="pj_YOUR_KEY")

# Parse a URL
result = client.parse.url("https://example.com")
print(result.text)

# Parse a file
with open("report.pdf", "rb") as f:
    result = client.parse.file(f, "report.pdf")
    print(result.text)

Agen AI

Server MCP

Gunakan ParseJet sebagai server MCP (Model Context Protocol) dengan Claude Code, Cursor, atau agen AI apa pun yang kompatibel dengan MCP.

Instal

npm install -g @parsejet/mcp-server

Claude Code

Tambahkan ke .claude/settings.json proyek Anda:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Cursor

Buka Settings โ†’ MCP Servers, tambahkan server baru:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Claude.ai (Remote)

Untuk Claude.ai web, gunakan endpoint HTTP remote โ€” tidak perlu instalasi lokal:

Endpoint:  https://api.parsejet.com/mcp
Transport: Streamable HTTP
Auth:      Bearer pj_YOUR_KEY (in Authorization header)

Buka Claude.ai โ†’ Settings โ†’ Integrations โ†’ Add MCP Server โ†’ Masukkan URL di atas.

Alat yang tersedia

Alat Deskripsi
parse_urlParse URL apa pun (halaman web, YouTube, dll.)
parse_fileParse file lokal (PDF, DOCX, gambar, dll.)
get_youtube_transcriptDapatkan transkrip video YouTube dengan bahasa opsional

Batas Laju & Harga

ParseJet menggunakan sistem berbasis kredit. Setiap permintaan mengonsumsi kredit berdasarkan kompleksitas format.

Paket Harga Kredit/bln RPM File maks.
Free$0300510MB
Pro$19/mo3,0003050MB
Business$49/mo20,00060100MB
Scale$99/mo50,000200200MB
EnterpriseCustomCustomCustomCustom

Header respons menyertakan X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset, dan Retry-After pada respons 429.

Kode Kesalahan

Semua kesalahan mengembalikan JSON dengan bidang error dan message.

StatusKodeDeskripsi
400unsupported_formatTipe file tidak didukung
401invalid_api_keyKunci API tidak ada atau tidak valid
413file_too_largeFile melebihi batas paket
422parse_errorFile rusak atau tidak dapat dibaca
429rate_limit_exceededBatas RPM atau batas harian/bulanan tercapai
502parser_unavailableBackend parser tidak dapat dijangkau
504parser_timeoutOperasi parse melebihi batas waktu