Dokumentacja

Dokumentacja ParseJet

Name: ParseJet
Author: ParseJet

ParseJet wyodrębnia tekst z dowolnego pliku lub URL. Jedno wywołanie API obsługuje PDF, DOCX, YouTube, strony internetowe, obrazy, audio, wideo i ponad 25 innych formatów.

Szybki start

Uzyskaj pierwszy wynik parsowania w mniej niż 60 sekund. Rejestracja nie jest wymagana.

Wypróbuj natychmiast

Wklej dowolny URL do ParseJet — klucz API nie jest potrzebny dla pierwszych 3 żądań dziennie.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

Uzyskaj klucz API

Zaloguj się przez Google lub GitHub, aby otrzymać darmowy klucz API. Darmowy plan obejmuje 300 żądań miesięcznie.

# Add your API key to requests
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

Wykorzystaj wynik

Każda odpowiedź zwraca tę samą strukturę JSON, niezależnie od formatu wejściowego:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "webpage",
  "metadata": { "url": "https://example.com" }
}

Uwierzytelnianie

ParseJet oferuje trzy poziomy dostępu. Możesz zacząć korzystać z API natychmiast, bez żadnego uwierzytelniania.

Poziom	Jak uzyskać dostęp	Limit	Najlepsze dla
Anonimowy	Brak nagłówków	3/dzień, 2MB	Szybkie testy
Sesja	Zaloguj się (ciasteczko)	10/dzień, 5MB	Narzędzie panelu
Klucz API	`Authorization: Bearer pj_xxx`	Według planu	Produkcja

Wskazówka: Nie potrzebujesz klucza API, aby zacząć. Po prostu wysyłaj żądania bezpośrednio — pierwsze 3 dziennie są darmowe i nie wymagają rejestracji.

Podstawowe pojęcia

Obsługiwane formaty

ParseJet automatycznie wykrywa format na podstawie rozszerzenia pliku lub wzorca URL. Nie musisz określać formatu — po prostu wyślij plik lub URL do /v1/parse/auto, a ParseJet zajmie się resztą.

Kategoria	Formaty	Kredyty
Tekst	TXT, MD, JSON, CSV, XML, HTML	1
Dokumenty	DOCX, PPTX, XLSX, EPUB	2
Złożone	PDF, strony internetowe, wideo	3
YouTube	Adresy URL filmów YouTube	5
Inne	Audio (MP3, WAV), obrazy (JPG, PNG), RSS, OPML, e-mail, notatniki	1

Kredyty

Każde żądanie API zużywa kredyty w zależności od złożoności parsowanego formatu. Proste pliki tekstowe kosztują 1 kredyt, a transkrypcje YouTube 5. Twój miesięczny przydział kredytów zależy od planu.

Format wyjściowy

Domyślnie ParseJet zwraca surowy wyodrębniony tekst. Dodaj ?output_format=markdown do dowolnego żądania, aby otrzymać przetworzone wyjście z wykrytymi nagłówkami, listami, tabelami i blokami kodu.

Przewodnik

Parsuj plik PDF

Wyodrębnij tekst z dowolnego pliku PDF, w tym zeskanowanych dokumentów i wielostronicowych raportów.

Prześlij plik PDF

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Konwertuj do Markdown

Dodaj output_format=markdown, aby zachować strukturę dokumentu:

curl -X POST https://api.parsejet.com/v1/parse/auto/file?output_format=markdown \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Koszt kredytów: 3 kredyty za PDF. Obsługuje pliki do limitu rozmiaru Twojego planu (10MB-200MB).

Przewodnik

Transkrypcje YouTube

Pobierz pełną transkrypcję dowolnego filmu YouTube. Obsługuje automatycznie generowane napisy w ponad 100 językach.

Pobierz transkrypcję

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID"}'

Określ język

Użyj parametru language dla filmów nieanglojęzycznych:

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "ja"}'

Lub użyj automatycznego wykrywania

Endpoint /v1/parse/auto/url automatycznie wykrywa adresy URL YouTube:

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtu.be/VIDEO_ID"}'

Koszt kredytów: 5 kredytów za film YouTube. Metadane obejmują video_id, kanał i czas trwania.

Przewodnik

Pobieranie stron internetowych

Wyodrębnij główną treść z dowolnej strony internetowej. ParseJet automatycznie usuwa nawigację, reklamy, paski boczne i szablonowe elementy.

curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/blog/article"}'

Koszt kredytów: 3 kredyty za stronę internetową. Zwraca czysty tekst z tytułem i źródłowym URL w metadanych.

Przewodnik

Dokumenty biurowe

Parsuj pliki Word (DOCX), Excel (XLSX), PowerPoint (PPTX) i CSV. Po prostu prześlij plik — ParseJet automatycznie wykrywa format.

# Works with any Office format
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

# Also works with spreadsheets
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

Koszt kredytów: 2 kredyty za dokument. Obsługiwane: DOCX, PPTX, XLSX, CSV.

Dokumentacja API

Format odpowiedzi

Wszystkie punkty końcowe zwracają tę samą strukturę JSON:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "pdf",
  "metadata": { "pages": 12, "author": "Jane Doe" }
}

Pole	Typ	Opis
text	string	Wyodrębniona treść tekstowa
title	string	Tytuł dokumentu lub strony
source_type	string	Identyfikator formatu (pdf, webpage, youtube, itp.)
metadata	object	Metadane specyficzne dla formatu (liczba stron, autor, czas trwania, itp.)

POST

/v1/parse/auto

Zalecany punkt końcowy. Automatycznie wykrywa format na podstawie rozszerzenia pliku lub typu URL. Akceptuje file (multipart) lub url (pole formularza), ale nie oba jednocześnie.

curl -X POST https://api.parsejet.com/v1/parse/auto \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

POST

/v1/parse/auto/url

Parsuj dowolny URL. Automatycznie rozróżnia YouTube od zwykłych stron internetowych.

Parametr	Typ	Wymagane	Opis
url	string	tak	URL do sparsowania
language	string	nie	Kod ISO 639-1 dla języka transkrypcji YouTube

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'

POST

/v1/parse/auto/file

Parsuj dowolny przesłany plik. Wykrywa format na podstawie rozszerzenia pliku, w razie potrzeby stosuje wykrywanie na podstawie zawartości.

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

POST

/v1/parse/webpage

Wyodrębnij główną treść ze strony internetowej. Usuwa nawigację, reklamy i szablonowe elementy.

Parametr	Typ	Wymagane	Opis
url	string	tak	URL strony internetowej

curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/article"}'

POST

/v1/parse/youtube

Wyodrębnij transkrypcję z filmu YouTube. Metadane zawierają video_id, kanał i czas trwania.

Parametr	Typ	Wymagane	Opis
url	string	tak	URL filmu YouTube lub ID filmu
language	string	nie	Kod języka ISO 639-1

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "en"}'

POST

/v1/parse/audio

Parsuj pliki audio. Obsługuje MP3, WAV, M4A, OGG, FLAC, WebM. Maks. 25MB.

Pole	Typ	Wymagane	Opis
file	file	tak	Plik audio
language	string	nie	Kod ISO 639-1
with_timestamps	boolean	nie	Uwzględnij znaczniki czasowe na poziomie słów

curl -X POST https://api.parsejet.com/v1/parse/audio \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"

POST

/v1/parse/video

Wyodrębnij audio z wideo do transkrypcji. Obsługuje MP4, MKV, AVI, MOV, WebM.

curl -X POST https://api.parsejet.com/v1/parse/video \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"

POST

/v1/parse/epub

Parsuj ebook EPUB. Wyodrębnia tekst zorganizowany według rozdziałów.

curl -X POST https://api.parsejet.com/v1/parse/epub \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

POST

/v1/parse/feed

Parsuj kanał RSS lub Atom. Obsługuje również OPML przez /v1/parse/opml.

curl -X POST https://api.parsejet.com/v1/parse/feed \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

POST

/v1/parse/image

Analizuj obraz. Obsługuje JPG, PNG, GIF, BMP, WebP, TIFF. Maks. 20MB.

Pole	Typ	Wymagane	Opis
file	file	tak	Plik obrazu
prompt	string	nie	Niestandardowy prompt do analizy obrazu
model	string	nie	Nadpisanie modelu wizyjnego

curl -X POST https://api.parsejet.com/v1/parse/image \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "prompt=Describe this image"

POST

/v1/parse/image/ocr

Wyodrębnij tekst z obrazu za pomocą OCR.

curl -X POST https://api.parsejet.com/v1/parse/image/ocr \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

SDK

Oficjalne SDK

TypeScript / JavaScript

npm install parsejet

import { ParseJet } from "parsejet";

const client = new ParseJet({ apiKey: "pj_YOUR_KEY" });

// Parse a URL
const result = await client.parse.url("https://example.com");
console.log(result.text);

// Parse a file
const result = await client.parse.file(buffer, "report.pdf");
console.log(result.text);

Python

pip install parsejet

from parsejet import ParseJet

client = ParseJet(api_key="pj_YOUR_KEY")

# Parse a URL
result = client.parse.url("https://example.com")
print(result.text)

# Parse a file
with open("report.pdf", "rb") as f:
    result = client.parse.file(f, "report.pdf")
    print(result.text)

Agenci AI

Serwer MCP

Użyj ParseJet jako serwera MCP (Model Context Protocol) z Claude Code, Cursor lub dowolnym agentem AI kompatybilnym z MCP.

Instalacja

npm install -g @parsejet/mcp-server

Claude Code

Dodaj do pliku .claude/settings.json twojego projektu:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Cursor

Przejdź do Ustawienia → Serwery MCP, dodaj nowy serwer:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Claude.ai (Zdalny)

Dla Claude.ai web użyj zdalnego punktu końcowego HTTP — instalacja lokalna nie jest wymagana:

Endpoint:  https://api.parsejet.com/mcp
Transport: Streamable HTTP
Auth:      Bearer pj_YOUR_KEY (in Authorization header)

Przejdź do Claude.ai → Ustawienia → Integracje → Dodaj serwer MCP → Wprowadź powyższy URL.

Dostępne narzędzia

Narzędzie	Opis
parse_url	Parsuj dowolny URL (strona internetowa, YouTube itp.)
parse_file	Parsuj plik lokalny (PDF, DOCX, obrazy itp.)
get_youtube_transcript	Pobierz transkrypcję filmu YouTube z opcjonalnym językiem

Limity i cennik

ParseJet używa systemu opartego na kredytach. Każde żądanie zużywa kredyty w zależności od złożoności formatu.

Plan	Cena	Kredyty/mies.	RPM	Maks. plik
Free	$0	300	5	10MB
Pro	$19/mo	3,000	30	50MB
Business	$49/mo	20,000	60	100MB
Scale	$99/mo	50,000	200	200MB
Enterprise	Custom	Custom	Custom	Custom

Nagłówki odpowiedzi zawierają X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset oraz Retry-After przy odpowiedziach 429.

Kody błędów

Wszystkie błędy zwracają JSON z polami error i message.

Status	Kod	Opis
400	unsupported_format	Nieobsługiwany typ pliku
401	invalid_api_key	Brakujący lub nieprawidłowy klucz API
413	file_too_large	Plik przekracza limit planu
422	parse_error	Plik uszkodzony lub nieczytelny
429	rate_limit_exceeded	Osiągnięto limit RPM lub dzienny/miesięczny
502	parser_unavailable	Backend parsera niedostępny
504	parser_timeout	Przekroczono czas operacji parsowania