ParseJet

Dokumentacja

Dokumentacja ParseJet

ParseJet wyodrębnia tekst z dowolnego pliku lub URL. Jedno wywołanie API obsługuje PDF, DOCX, YouTube, strony internetowe, obrazy, audio, wideo i ponad 25 innych formatów.

Szybki start

Uzyskaj pierwszy wynik parsowania w mniej niż 60 sekund. Rejestracja nie jest wymagana.

1

Wypróbuj natychmiast

Wklej dowolny URL do ParseJet — klucz API nie jest potrzebny dla pierwszych 3 żądań dziennie.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
2

Uzyskaj klucz API

Zaloguj się przez Google lub GitHub, aby otrzymać darmowy klucz API. Darmowy plan obejmuje 300 żądań miesięcznie.

# Add your API key to requests
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
3

Wykorzystaj wynik

Każda odpowiedź zwraca tę samą strukturę JSON, niezależnie od formatu wejściowego:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "webpage",
  "metadata": { "url": "https://example.com" }
}

Uwierzytelnianie

ParseJet oferuje trzy poziomy dostępu. Możesz zacząć korzystać z API natychmiast, bez żadnego uwierzytelniania.

Poziom Jak uzyskać dostęp Limit Najlepsze dla
AnonimowyBrak nagłówków3/dzień, 2MBSzybkie testy
SesjaZaloguj się (ciasteczko)10/dzień, 5MBNarzędzie panelu
Klucz APIAuthorization: Bearer pj_xxxWedług planuProdukcja

Wskazówka: Nie potrzebujesz klucza API, aby zacząć. Po prostu wysyłaj żądania bezpośrednio — pierwsze 3 dziennie są darmowe i nie wymagają rejestracji.

Podstawowe pojęcia

Obsługiwane formaty

ParseJet automatycznie wykrywa format na podstawie rozszerzenia pliku lub wzorca URL. Nie musisz określać formatu — po prostu wyślij plik lub URL do /v1/parse/auto, a ParseJet zajmie się resztą.

Kategoria Formaty Kredyty
TekstTXT, MD, JSON, CSV, XML, HTML1
DokumentyDOCX, PPTX, XLSX, EPUB2
ZłożonePDF, strony internetowe, wideo3
YouTubeAdresy URL filmów YouTube5
InneAudio (MP3, WAV), obrazy (JPG, PNG), RSS, OPML, e-mail, notatniki1

Kredyty

Każde żądanie API zużywa kredyty w zależności od złożoności parsowanego formatu. Proste pliki tekstowe kosztują 1 kredyt, a transkrypcje YouTube 5. Twój miesięczny przydział kredytów zależy od planu.

Format wyjściowy

Domyślnie ParseJet zwraca surowy wyodrębniony tekst. Dodaj ?output_format=markdown do dowolnego żądania, aby otrzymać przetworzone wyjście z wykrytymi nagłówkami, listami, tabelami i blokami kodu.

Przewodnik

Parsuj plik PDF

Wyodrębnij tekst z dowolnego pliku PDF, w tym zeskanowanych dokumentów i wielostronicowych raportów.

Prześlij plik PDF

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Konwertuj do Markdown

Dodaj output_format=markdown, aby zachować strukturę dokumentu:

curl -X POST https://api.parsejet.com/v1/parse/auto/file?output_format=markdown \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Koszt kredytów: 3 kredyty za PDF. Obsługuje pliki do limitu rozmiaru Twojego planu (10MB-200MB).

Przewodnik

Transkrypcje YouTube

Pobierz pełną transkrypcję dowolnego filmu YouTube. Obsługuje automatycznie generowane napisy w ponad 100 językach.

Pobierz transkrypcję

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID"}'

Określ język

Użyj parametru language dla filmów nieanglojęzycznych:

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "ja"}'

Lub użyj automatycznego wykrywania

Endpoint /v1/parse/auto/url automatycznie wykrywa adresy URL YouTube:

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtu.be/VIDEO_ID"}'

Koszt kredytów: 5 kredytów za film YouTube. Metadane obejmują video_id, kanał i czas trwania.

Przewodnik

Pobieranie stron internetowych

Wyodrębnij główną treść z dowolnej strony internetowej. ParseJet automatycznie usuwa nawigację, reklamy, paski boczne i szablonowe elementy.

curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/blog/article"}'

Koszt kredytów: 3 kredyty za stronę internetową. Zwraca czysty tekst z tytułem i źródłowym URL w metadanych.

Przewodnik

Dokumenty biurowe

Parsuj pliki Word (DOCX), Excel (XLSX), PowerPoint (PPTX) i CSV. Po prostu prześlij plik — ParseJet automatycznie wykrywa format.

# Works with any Office format
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

# Also works with spreadsheets
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Koszt kredytów: 2 kredyty za dokument. Obsługiwane: DOCX, PPTX, XLSX, CSV.

Dokumentacja API

Format odpowiedzi

Wszystkie punkty końcowe zwracają tę samą strukturę JSON:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "pdf",
  "metadata": { "pages": 12, "author": "Jane Doe" }
}
Pole Typ Opis
textstringWyodrębniona treść tekstowa
titlestringTytuł dokumentu lub strony
source_typestringIdentyfikator formatu (pdf, webpage, youtube, itp.)
metadataobjectMetadane specyficzne dla formatu (liczba stron, autor, czas trwania, itp.)
POST

/v1/parse/auto

Zalecany punkt końcowy. Automatycznie wykrywa format na podstawie rozszerzenia pliku lub typu URL. Akceptuje file (multipart) lub url (pole formularza), ale nie oba jednocześnie.

curl -X POST https://api.parsejet.com/v1/parse/auto \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/auto/url

Parsuj dowolny URL. Automatycznie rozróżnia YouTube od zwykłych stron internetowych.

ParametrTypWymaganeOpis
urlstringtakURL do sparsowania
languagestringnieKod ISO 639-1 dla języka transkrypcji YouTube
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
POST

/v1/parse/auto/file

Parsuj dowolny przesłany plik. Wykrywa format na podstawie rozszerzenia pliku, w razie potrzeby stosuje wykrywanie na podstawie zawartości.

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/webpage

Wyodrębnij główną treść ze strony internetowej. Usuwa nawigację, reklamy i szablonowe elementy.

ParametrTypWymaganeOpis
urlstringtakURL strony internetowej
curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/article"}'
POST

/v1/parse/youtube

Wyodrębnij transkrypcję z filmu YouTube. Metadane zawierają video_id, kanał i czas trwania.

ParametrTypWymaganeOpis
urlstringtakURL filmu YouTube lub ID filmu
languagestringnieKod języka ISO 639-1
curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "en"}'
POST

/v1/parse/audio

Parsuj pliki audio. Obsługuje MP3, WAV, M4A, OGG, FLAC, WebM. Maks. 25MB.

PoleTypWymaganeOpis
filefiletakPlik audio
languagestringnieKod ISO 639-1
with_timestampsbooleannieUwzględnij znaczniki czasowe na poziomie słów
curl -X POST https://api.parsejet.com/v1/parse/audio \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/video

Wyodrębnij audio z wideo do transkrypcji. Obsługuje MP4, MKV, AVI, MOV, WebM.

curl -X POST https://api.parsejet.com/v1/parse/video \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/epub

Parsuj ebook EPUB. Wyodrębnia tekst zorganizowany według rozdziałów.

curl -X POST https://api.parsejet.com/v1/parse/epub \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/feed

Parsuj kanał RSS lub Atom. Obsługuje również OPML przez /v1/parse/opml.

curl -X POST https://api.parsejet.com/v1/parse/feed \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/image

Analizuj obraz. Obsługuje JPG, PNG, GIF, BMP, WebP, TIFF. Maks. 20MB.

PoleTypWymaganeOpis
filefiletakPlik obrazu
promptstringnieNiestandardowy prompt do analizy obrazu
modelstringnieNadpisanie modelu wizyjnego
curl -X POST https://api.parsejet.com/v1/parse/image \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "prompt=Describe this image"
POST

/v1/parse/image/ocr

Wyodrębnij tekst z obrazu za pomocą OCR.

curl -X POST https://api.parsejet.com/v1/parse/image/ocr \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

SDK

Oficjalne SDK

TypeScript / JavaScript

npm install parsejet
import { ParseJet } from "parsejet";

const client = new ParseJet({ apiKey: "pj_YOUR_KEY" });

// Parse a URL
const result = await client.parse.url("https://example.com");
console.log(result.text);

// Parse a file
const result = await client.parse.file(buffer, "report.pdf");
console.log(result.text);

Python

pip install parsejet
from parsejet import ParseJet

client = ParseJet(api_key="pj_YOUR_KEY")

# Parse a URL
result = client.parse.url("https://example.com")
print(result.text)

# Parse a file
with open("report.pdf", "rb") as f:
    result = client.parse.file(f, "report.pdf")
    print(result.text)

Agenci AI

Serwer MCP

Użyj ParseJet jako serwera MCP (Model Context Protocol) z Claude Code, Cursor lub dowolnym agentem AI kompatybilnym z MCP.

Instalacja

npm install -g @parsejet/mcp-server

Claude Code

Dodaj do pliku .claude/settings.json twojego projektu:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Cursor

Przejdź do Ustawienia → Serwery MCP, dodaj nowy serwer:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Claude.ai (Zdalny)

Dla Claude.ai web użyj zdalnego punktu końcowego HTTP — instalacja lokalna nie jest wymagana:

Endpoint:  https://api.parsejet.com/mcp
Transport: Streamable HTTP
Auth:      Bearer pj_YOUR_KEY (in Authorization header)

Przejdź do Claude.ai → Ustawienia → Integracje → Dodaj serwer MCP → Wprowadź powyższy URL.

Dostępne narzędzia

Narzędzie Opis
parse_urlParsuj dowolny URL (strona internetowa, YouTube itp.)
parse_fileParsuj plik lokalny (PDF, DOCX, obrazy itp.)
get_youtube_transcriptPobierz transkrypcję filmu YouTube z opcjonalnym językiem

Limity i cennik

ParseJet używa systemu opartego na kredytach. Każde żądanie zużywa kredyty w zależności od złożoności formatu.

Plan Cena Kredyty/mies. RPM Maks. plik
Free$0300510MB
Pro$19/mo3,0003050MB
Business$49/mo20,00060100MB
Scale$99/mo50,000200200MB
EnterpriseCustomCustomCustomCustom

Nagłówki odpowiedzi zawierają X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset oraz Retry-After przy odpowiedziach 429.

Kody błędów

Wszystkie błędy zwracają JSON z polami error i message.

StatusKodOpis
400unsupported_formatNieobsługiwany typ pliku
401invalid_api_keyBrakujący lub nieprawidłowy klucz API
413file_too_largePlik przekracza limit planu
422parse_errorPlik uszkodzony lub nieczytelny
429rate_limit_exceededOsiągnięto limit RPM lub dzienny/miesięczny
502parser_unavailableBackend parsera niedostępny
504parser_timeoutPrzekroczono czas operacji parsowania