문서
ParseJet 문서
ParseJet는 모든 파일이나 URL에서 텍스트를 추출합니다. 하나의 API 호출로 PDF, DOCX, YouTube, 웹 페이지, 이미지, 오디오, 비디오 및 25개 이상의 형식을 처리합니다.
빠른 시작
60초 안에 첫 번째 파싱 결과를 얻어보세요. 가입이 필요하지 않습니다.
1
즉시 사용해보기
ParseJet에 아무 URL이나 붙여넣으세요 — 하루에 처음 3개의 요청에는 API 키가 필요하지 않습니다.
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
-H "Content-Type: application/json" \
-d '{"url": "https://example.com"}' 2
API 키 받기
Google 또는 GitHub로 로그인하여 무료 API 키를 받으세요. 무료 티어에는 월 300회 요청이 포함됩니다.
# Add your API key to requests
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
-H "Authorization: Bearer pj_YOUR_KEY" \
-H "Content-Type: application/json" \
-d '{"url": "https://example.com"}' 3
결과 사용하기
입력 형식에 관계없이 모든 응답은 동일한 JSON 구조를 반환합니다:
{
"text": "Extracted text content...",
"title": "Document Title",
"source_type": "webpage",
"metadata": { "url": "https://example.com" }
} 인증
ParseJet는 세 가지 수준의 접근 권한을 제공합니다. 인증 없이도 즉시 API를 사용할 수 있습니다.
팁: 시작하기 위해 API 키가 필요하지 않습니다. 요청을 직접 보내기만 하면 됩니다 — 하루에 처음 3회는 가입 없이 무료입니다.
핵심 개념
지원 형식
ParseJet은 파일 확장자나 URL 패턴에서 형식을 자동으로 감지합니다. 형식을 지정할 필요 없이 파일이나 URL을 /v1/parse/auto로 보내기만 하면 ParseJet이 나머지를 처리합니다.
크레딧
각 API 요청은 파싱되는 형식의 복잡도에 따라 크레딧을 소모합니다. 간단한 텍스트 파일은 1 크레딧, YouTube 자막은 5 크레딧이 듭니다. 월간 크레딧 한도는 요금제에 따라 다릅니다.
출력 형식
기본적으로 ParseJet은 추출된 원시 텍스트를 반환합니다. 감지된 제목, 목록, 표, 코드 블록이 포함된 후처리된 출력을 얻으려면 ?output_format=markdown을 요청에 추가하세요.
가이드
PDF 파싱하기
스캔 문서와 다중 페이지 보고서를 포함한 모든 PDF 파일에서 텍스트를 추출합니다.
PDF 파일 업로드
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
-H "Authorization: Bearer pj_YOUR_KEY" \
-F "[email protected]"
Markdown으로 변환
문서 구조를 보존하려면 output_format=markdown을 추가하세요:
curl -X POST https://api.parsejet.com/v1/parse/auto/file?output_format=markdown \
-H "Authorization: Bearer pj_YOUR_KEY" \
-F "[email protected]"
크레딧 비용: PDF당 3 크레딧. 요금제의 파일 크기 제한(10MB-200MB)까지 지원합니다.
가이드
YouTube 자막
모든 YouTube 동영상의 전체 자막을 가져옵니다. 100개 이상의 언어로 자동 생성된 자막을 지원합니다.
자막 가져오기
curl -X POST https://api.parsejet.com/v1/parse/youtube \
-H "Content-Type: application/json" \
-d '{"url": "https://youtube.com/watch?v=VIDEO_ID"}' 언어 지정
영어가 아닌 동영상의 경우 language 매개변수를 사용하세요:
curl -X POST https://api.parsejet.com/v1/parse/youtube \
-H "Content-Type: application/json" \
-d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "ja"}' 또는 자동 감지 사용
/v1/parse/auto/url 엔드포인트는 YouTube URL을 자동으로 감지합니다:
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
-H "Content-Type: application/json" \
-d '{"url": "https://youtu.be/VIDEO_ID"}' 크레딧 비용: YouTube 동영상당 5 크레딧. 메타데이터에는 video_id, 채널, 재생 시간이 포함됩니다.
가이드
웹 스크래핑
어떤 웹 페이지에서든 주요 콘텐츠를 추출합니다. ParseJet이 자동으로 네비게이션, 광고, 사이드바, 보일러플레이트를 제거합니다.
curl -X POST https://api.parsejet.com/v1/parse/webpage \
-H "Content-Type: application/json" \
-d '{"url": "https://example.com/blog/article"}' 크레딧 비용: 웹 페이지당 3 크레딧. 제목과 출처 URL이 포함된 메타데이터와 함께 깔끔한 텍스트를 반환합니다.
가이드
오피스 문서
Word(DOCX), Excel(XLSX), PowerPoint(PPTX), CSV 파일을 파싱합니다. 파일을 업로드하기만 하면 ParseJet이 형식을 자동으로 감지합니다.
# Works with any Office format
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
-H "Authorization: Bearer pj_YOUR_KEY" \
-F "[email protected]"
# Also works with spreadsheets
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
-H "Authorization: Bearer pj_YOUR_KEY" \
-F "[email protected]"
크레딧 비용: 문서당 2 크레딧. 지원 형식: DOCX, PPTX, XLSX, CSV.
POST
/v1/parse/auto
권장 엔드포인트입니다. 파일 확장자나 URL 유형에서 형식을 자동 감지합니다. file(멀티파트) 또는 url(폼 필드) 중 하나만 허용하며, 둘 다는 허용하지 않습니다.
curl -X POST https://api.parsejet.com/v1/parse/auto \
-H "Authorization: Bearer pj_YOUR_KEY" \
-F "[email protected]"
POST
/v1/parse/auto/url
어떤 URL이든 파싱합니다. YouTube와 일반 웹 페이지를 자동으로 구분합니다.
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
-H "Authorization: Bearer pj_YOUR_KEY" \
-H "Content-Type: application/json" \
-d '{"url": "https://example.com"}' POST
/v1/parse/auto/file
업로드된 어떤 파일이든 파싱합니다. 파일 확장자에서 형식을 감지하고, 실패 시 콘텐츠 기반 감지로 대체합니다.
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
-H "Authorization: Bearer pj_YOUR_KEY" \
-F "[email protected]"
POST
/v1/parse/webpage
웹 페이지에서 주요 콘텐츠를 추출합니다. 네비게이션, 광고, 보일러플레이트를 제거합니다.
curl -X POST https://api.parsejet.com/v1/parse/webpage \
-H "Content-Type: application/json" \
-d '{"url": "https://example.com/article"}' POST
/v1/parse/youtube
YouTube 동영상에서 자막을 추출합니다. 메타데이터에는 video_id, 채널, 재생 시간이 포함됩니다.
curl -X POST https://api.parsejet.com/v1/parse/youtube \
-H "Content-Type: application/json" \
-d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "en"}' POST
/v1/parse/audio
오디오 파일을 파싱합니다. MP3, WAV, M4A, OGG, FLAC, WebM을 지원합니다. 최대 25MB.
curl -X POST https://api.parsejet.com/v1/parse/audio \
-H "Authorization: Bearer pj_YOUR_KEY" \
-F "[email protected]" -F "language=en"
POST
/v1/parse/video
자막 생성을 위해 동영상에서 오디오를 추출합니다. MP4, MKV, AVI, MOV, WebM을 지원합니다.
curl -X POST https://api.parsejet.com/v1/parse/video \
-H "Authorization: Bearer pj_YOUR_KEY" \
-F "[email protected]" -F "language=en"
POST
/v1/parse/epub
EPUB 전자책을 파싱합니다. 챕터별로 구성된 텍스트를 추출합니다.
curl -X POST https://api.parsejet.com/v1/parse/epub \
-H "Authorization: Bearer pj_YOUR_KEY" \
-F "[email protected]"
POST
/v1/parse/feed
RSS 또는 Atom 피드를 파싱합니다. /v1/parse/opml을 통한 OPML도 지원합니다.
curl -X POST https://api.parsejet.com/v1/parse/feed \
-H "Authorization: Bearer pj_YOUR_KEY" \
-F "[email protected]"
POST
/v1/parse/image
이미지를 분석합니다. JPG, PNG, GIF, BMP, WebP, TIFF를 지원합니다. 최대 20MB.
curl -X POST https://api.parsejet.com/v1/parse/image \
-H "Authorization: Bearer pj_YOUR_KEY" \
-F "[email protected]" -F "prompt=Describe this image"
POST
/v1/parse/image/ocr
OCR을 통해 이미지에서 텍스트를 추출합니다.
curl -X POST https://api.parsejet.com/v1/parse/image/ocr \
-H "Authorization: Bearer pj_YOUR_KEY" \
-F "[email protected]"
SDK
공식 SDK
TypeScript / JavaScript
import { ParseJet } from "parsejet";
const client = new ParseJet({ apiKey: "pj_YOUR_KEY" });
// Parse a URL
const result = await client.parse.url("https://example.com");
console.log(result.text);
// Parse a file
const result = await client.parse.file(buffer, "report.pdf");
console.log(result.text); Python
from parsejet import ParseJet
client = ParseJet(api_key="pj_YOUR_KEY")
# Parse a URL
result = client.parse.url("https://example.com")
print(result.text)
# Parse a file
with open("report.pdf", "rb") as f:
result = client.parse.file(f, "report.pdf")
print(result.text) AI 에이전트
MCP 서버
Claude Code, Cursor 또는 MCP 호환 AI 에이전트와 함께 ParseJet을 MCP(Model Context Protocol) 서버로 사용하세요.
설치
npm install -g @parsejet/mcp-server
Claude Code
프로젝트의 .claude/settings.json에 추가:
{
"mcpServers": {
"parsejet": {
"command": "npx",
"args": ["-y", "@parsejet/mcp-server"],
"env": {
"PARSEJET_API_KEY": "pj_YOUR_KEY"
}
}
}
} Cursor
설정 → MCP 서버로 이동하여 새 서버 추가:
{
"mcpServers": {
"parsejet": {
"command": "npx",
"args": ["-y", "@parsejet/mcp-server"],
"env": {
"PARSEJET_API_KEY": "pj_YOUR_KEY"
}
}
}
} Claude.ai (원격)
Claude.ai 웹의 경우 로컬 설치 없이 원격 HTTP 엔드포인트를 사용하세요:
Endpoint: https://api.parsejet.com/mcp
Transport: Streamable HTTP
Auth: Bearer pj_YOUR_KEY (in Authorization header)
Claude.ai → 설정 → 통합 → MCP 서버 추가 → 위 URL을 입력하세요.
사용 가능한 도구
속도 제한 및 가격
ParseJet은 크레딧 기반 시스템을 사용합니다. 각 요청은 형식 복잡도에 따라 크레딧을 소모합니다.
응답 헤더에는 X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset 및 429 응답 시 Retry-After가 포함됩니다.
오류 코드
모든 오류는 error 및 message 필드가 포함된 JSON을 반환합니다.