ParseJet

문서

ParseJet 문서

ParseJet는 모든 파일이나 URL에서 텍스트를 추출합니다. 하나의 API 호출로 PDF, DOCX, YouTube, 웹 페이지, 이미지, 오디오, 비디오 및 25개 이상의 형식을 처리합니다.

빠른 시작

60초 안에 첫 번째 파싱 결과를 얻어보세요. 가입이 필요하지 않습니다.

1

즉시 사용해보기

ParseJet에 아무 URL이나 붙여넣으세요 — 하루에 처음 3개의 요청에는 API 키가 필요하지 않습니다.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
2

API 키 받기

Google 또는 GitHub로 로그인하여 무료 API 키를 받으세요. 무료 티어에는 월 300회 요청이 포함됩니다.

# Add your API key to requests
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
3

결과 사용하기

입력 형식에 관계없이 모든 응답은 동일한 JSON 구조를 반환합니다:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "webpage",
  "metadata": { "url": "https://example.com" }
}

인증

ParseJet는 세 가지 수준의 접근 권한을 제공합니다. 인증 없이도 즉시 API를 사용할 수 있습니다.

수준 접근 방법 속도 제한 적합한 용도
익명헤더 없음3/일, 2MB빠른 테스트
세션로그인 (쿠키)10/일, 5MB대시보드 도구
API 키Authorization: Bearer pj_xxx플랜별프로덕션

팁: 시작하기 위해 API 키가 필요하지 않습니다. 요청을 직접 보내기만 하면 됩니다 — 하루에 처음 3회는 가입 없이 무료입니다.

핵심 개념

지원 형식

ParseJet은 파일 확장자나 URL 패턴에서 형식을 자동으로 감지합니다. 형식을 지정할 필요 없이 파일이나 URL을 /v1/parse/auto로 보내기만 하면 ParseJet이 나머지를 처리합니다.

카테고리 형식 크레딧
텍스트TXT, MD, JSON, CSV, XML, HTML1
문서DOCX, PPTX, XLSX, EPUB2
복합PDF, 웹 페이지, 비디오3
YouTubeYouTube 동영상 URL5
기타오디오 (MP3, WAV), 이미지 (JPG, PNG), RSS, OPML, 이메일, 노트북1

크레딧

각 API 요청은 파싱되는 형식의 복잡도에 따라 크레딧을 소모합니다. 간단한 텍스트 파일은 1 크레딧, YouTube 자막은 5 크레딧이 듭니다. 월간 크레딧 한도는 요금제에 따라 다릅니다.

출력 형식

기본적으로 ParseJet은 추출된 원시 텍스트를 반환합니다. 감지된 제목, 목록, 표, 코드 블록이 포함된 후처리된 출력을 얻으려면 ?output_format=markdown을 요청에 추가하세요.

가이드

PDF 파싱하기

스캔 문서와 다중 페이지 보고서를 포함한 모든 PDF 파일에서 텍스트를 추출합니다.

PDF 파일 업로드

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Markdown으로 변환

문서 구조를 보존하려면 output_format=markdown을 추가하세요:

curl -X POST https://api.parsejet.com/v1/parse/auto/file?output_format=markdown \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

크레딧 비용: PDF당 3 크레딧. 요금제의 파일 크기 제한(10MB-200MB)까지 지원합니다.

가이드

YouTube 자막

모든 YouTube 동영상의 전체 자막을 가져옵니다. 100개 이상의 언어로 자동 생성된 자막을 지원합니다.

자막 가져오기

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID"}'

언어 지정

영어가 아닌 동영상의 경우 language 매개변수를 사용하세요:

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "ja"}'

또는 자동 감지 사용

/v1/parse/auto/url 엔드포인트는 YouTube URL을 자동으로 감지합니다:

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtu.be/VIDEO_ID"}'

크레딧 비용: YouTube 동영상당 5 크레딧. 메타데이터에는 video_id, 채널, 재생 시간이 포함됩니다.

가이드

웹 스크래핑

어떤 웹 페이지에서든 주요 콘텐츠를 추출합니다. ParseJet이 자동으로 네비게이션, 광고, 사이드바, 보일러플레이트를 제거합니다.

curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/blog/article"}'

크레딧 비용: 웹 페이지당 3 크레딧. 제목과 출처 URL이 포함된 메타데이터와 함께 깔끔한 텍스트를 반환합니다.

가이드

오피스 문서

Word(DOCX), Excel(XLSX), PowerPoint(PPTX), CSV 파일을 파싱합니다. 파일을 업로드하기만 하면 ParseJet이 형식을 자동으로 감지합니다.

# Works with any Office format
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

# Also works with spreadsheets
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

크레딧 비용: 문서당 2 크레딧. 지원 형식: DOCX, PPTX, XLSX, CSV.

API 레퍼런스

응답 형식

모든 엔드포인트는 동일한 JSON 구조를 반환합니다:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "pdf",
  "metadata": { "pages": 12, "author": "Jane Doe" }
}
필드 타입 설명
textstring추출된 텍스트 콘텐츠
titlestring문서 또는 페이지 제목
source_typestring형식 식별자(pdf, webpage, youtube 등)
metadataobject형식별 메타데이터(페이지 수, 작성자, 재생 시간 등)
POST

/v1/parse/auto

권장 엔드포인트입니다. 파일 확장자나 URL 유형에서 형식을 자동 감지합니다. file(멀티파트) 또는 url(폼 필드) 중 하나만 허용하며, 둘 다는 허용하지 않습니다.

curl -X POST https://api.parsejet.com/v1/parse/auto \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/auto/url

어떤 URL이든 파싱합니다. YouTube와 일반 웹 페이지를 자동으로 구분합니다.

매개변수유형필수설명
urlstring파싱할 URL
languagestring아니오YouTube 자막 언어용 ISO 639-1 코드
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
POST

/v1/parse/auto/file

업로드된 어떤 파일이든 파싱합니다. 파일 확장자에서 형식을 감지하고, 실패 시 콘텐츠 기반 감지로 대체합니다.

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/webpage

웹 페이지에서 주요 콘텐츠를 추출합니다. 네비게이션, 광고, 보일러플레이트를 제거합니다.

매개변수유형필수설명
urlstring웹 페이지 URL
curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/article"}'
POST

/v1/parse/youtube

YouTube 동영상에서 자막을 추출합니다. 메타데이터에는 video_id, 채널, 재생 시간이 포함됩니다.

매개변수유형필수설명
urlstringYouTube 동영상 URL 또는 동영상 ID
languagestring아니오ISO 639-1 언어 코드
curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "en"}'
POST

/v1/parse/audio

오디오 파일을 파싱합니다. MP3, WAV, M4A, OGG, FLAC, WebM을 지원합니다. 최대 25MB.

필드유형필수설명
filefile오디오 파일
languagestring아니오ISO 639-1 코드
with_timestampsboolean아니오단어 수준 타임스탬프 포함
curl -X POST https://api.parsejet.com/v1/parse/audio \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/video

자막 생성을 위해 동영상에서 오디오를 추출합니다. MP4, MKV, AVI, MOV, WebM을 지원합니다.

curl -X POST https://api.parsejet.com/v1/parse/video \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/epub

EPUB 전자책을 파싱합니다. 챕터별로 구성된 텍스트를 추출합니다.

curl -X POST https://api.parsejet.com/v1/parse/epub \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/feed

RSS 또는 Atom 피드를 파싱합니다. /v1/parse/opml을 통한 OPML도 지원합니다.

curl -X POST https://api.parsejet.com/v1/parse/feed \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/image

이미지를 분석합니다. JPG, PNG, GIF, BMP, WebP, TIFF를 지원합니다. 최대 20MB.

필드유형필수설명
filefile이미지 파일
promptstring아니오이미지 분석용 사용자 지정 프롬프트
modelstring아니오비전 모델 재정의
curl -X POST https://api.parsejet.com/v1/parse/image \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "prompt=Describe this image"
POST

/v1/parse/image/ocr

OCR을 통해 이미지에서 텍스트를 추출합니다.

curl -X POST https://api.parsejet.com/v1/parse/image/ocr \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

SDK

공식 SDK

TypeScript / JavaScript

npm install parsejet
import { ParseJet } from "parsejet";

const client = new ParseJet({ apiKey: "pj_YOUR_KEY" });

// Parse a URL
const result = await client.parse.url("https://example.com");
console.log(result.text);

// Parse a file
const result = await client.parse.file(buffer, "report.pdf");
console.log(result.text);

Python

pip install parsejet
from parsejet import ParseJet

client = ParseJet(api_key="pj_YOUR_KEY")

# Parse a URL
result = client.parse.url("https://example.com")
print(result.text)

# Parse a file
with open("report.pdf", "rb") as f:
    result = client.parse.file(f, "report.pdf")
    print(result.text)

AI 에이전트

MCP 서버

Claude Code, Cursor 또는 MCP 호환 AI 에이전트와 함께 ParseJet을 MCP(Model Context Protocol) 서버로 사용하세요.

설치

npm install -g @parsejet/mcp-server

Claude Code

프로젝트의 .claude/settings.json에 추가:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Cursor

설정 → MCP 서버로 이동하여 새 서버 추가:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Claude.ai (원격)

Claude.ai 웹의 경우 로컬 설치 없이 원격 HTTP 엔드포인트를 사용하세요:

Endpoint:  https://api.parsejet.com/mcp
Transport: Streamable HTTP
Auth:      Bearer pj_YOUR_KEY (in Authorization header)

Claude.ai → 설정 → 통합 → MCP 서버 추가 → 위 URL을 입력하세요.

사용 가능한 도구

도구 설명
parse_url모든 URL 파싱 (웹 페이지, YouTube 등)
parse_file로컬 파일 파싱 (PDF, DOCX, 이미지 등)
get_youtube_transcript선택적 언어로 YouTube 동영상 자막 가져오기

속도 제한 및 가격

ParseJet은 크레딧 기반 시스템을 사용합니다. 각 요청은 형식 복잡도에 따라 크레딧을 소모합니다.

플랜 가격 월간 크레딧 RPM 최대 파일
Free$0300510MB
Pro$19/mo3,0003050MB
Business$49/mo20,00060100MB
Scale$99/mo50,000200200MB
EnterpriseCustomCustomCustomCustom

응답 헤더에는 X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset 및 429 응답 시 Retry-After가 포함됩니다.

오류 코드

모든 오류는 errormessage 필드가 포함된 JSON을 반환합니다.

상태코드설명
400unsupported_format지원되지 않는 파일 형식
401invalid_api_keyAPI 키가 없거나 유효하지 않음
413file_too_large파일이 요금제 제한을 초과함
422parse_error파일이 손상되었거나 읽을 수 없음
429rate_limit_exceededRPM 또는 일일/월간 한도 초과
502parser_unavailable파서 백엔드에 연결할 수 없음
504parser_timeout파싱 작업 시간 초과