Dokumentacja
Dokumentacja ParseJet
ParseJet wyodrębnia tekst z dowolnego pliku lub URL. Jedno wywołanie API obsługuje PDF, DOCX, YouTube, strony internetowe, obrazy, audio, wideo i ponad 25 innych formatów.
Szybki start
Uzyskaj pierwszy wynik parsowania w mniej niż 60 sekund. Rejestracja nie jest wymagana.
Wypróbuj natychmiast
Wklej dowolny URL do ParseJet — klucz API nie jest potrzebny dla pierwszych 3 żądań dziennie.
Uzyskaj klucz API
Zaloguj się przez Google lub GitHub, aby otrzymać darmowy klucz API. Darmowy plan obejmuje 300 żądań miesięcznie.
Wykorzystaj wynik
Każda odpowiedź zwraca tę samą strukturę JSON, niezależnie od formatu wejściowego:
Uwierzytelnianie
ParseJet oferuje trzy poziomy dostępu. Możesz zacząć korzystać z API natychmiast, bez żadnego uwierzytelniania.
Wskazówka: Nie potrzebujesz klucza API, aby zacząć. Po prostu wysyłaj żądania bezpośrednio — pierwsze 3 dziennie są darmowe i nie wymagają rejestracji.
Podstawowe pojęcia
Obsługiwane formaty
ParseJet automatycznie wykrywa format na podstawie rozszerzenia pliku lub wzorca URL. Nie musisz określać formatu — po prostu wyślij plik lub URL do /v1/parse/auto, a ParseJet zajmie się resztą.
Kredyty
Każde żądanie API zużywa kredyty w zależności od złożoności parsowanego formatu. Proste pliki tekstowe kosztują 1 kredyt, a transkrypcje YouTube 5. Twój miesięczny przydział kredytów zależy od planu.
Format wyjściowy
Domyślnie ParseJet zwraca surowy wyodrębniony tekst. Dodaj ?output_format=markdown do dowolnego żądania, aby otrzymać przetworzone wyjście z wykrytymi nagłówkami, listami, tabelami i blokami kodu.
Przewodnik
Parsuj plik PDF
Wyodrębnij tekst z dowolnego pliku PDF, w tym zeskanowanych dokumentów i wielostronicowych raportów.
Prześlij plik PDF
Konwertuj do Markdown
Dodaj output_format=markdown, aby zachować strukturę dokumentu:
Koszt kredytów: 3 kredyty za PDF. Obsługuje pliki do limitu rozmiaru Twojego planu (10MB-200MB).
Przewodnik
Transkrypcje YouTube
Pobierz pełną transkrypcję dowolnego filmu YouTube. Obsługuje automatycznie generowane napisy w ponad 100 językach.
Pobierz transkrypcję
Określ język
Użyj parametru language dla filmów nieanglojęzycznych:
Lub użyj automatycznego wykrywania
Endpoint /v1/parse/auto/url automatycznie wykrywa adresy URL YouTube:
Koszt kredytów: 5 kredytów za film YouTube. Metadane obejmują video_id, kanał i czas trwania.
Przewodnik
Pobieranie stron internetowych
Wyodrębnij główną treść z dowolnej strony internetowej. ParseJet automatycznie usuwa nawigację, reklamy, paski boczne i szablonowe elementy.
Koszt kredytów: 3 kredyty za stronę internetową. Zwraca czysty tekst z tytułem i źródłowym URL w metadanych.
Przewodnik
Dokumenty biurowe
Parsuj pliki Word (DOCX), Excel (XLSX), PowerPoint (PPTX) i CSV. Po prostu prześlij plik — ParseJet automatycznie wykrywa format.
Koszt kredytów: 2 kredyty za dokument. Obsługiwane: DOCX, PPTX, XLSX, CSV.
Dokumentacja API
Format odpowiedzi
Wszystkie punkty końcowe zwracają tę samą strukturę JSON:
/v1/parse/auto
Zalecany punkt końcowy. Automatycznie wykrywa format na podstawie rozszerzenia pliku lub typu URL. Akceptuje file (multipart) lub url (pole formularza), ale nie oba jednocześnie.
/v1/parse/auto/url
Parsuj dowolny URL. Automatycznie rozróżnia YouTube od zwykłych stron internetowych.
/v1/parse/auto/file
Parsuj dowolny przesłany plik. Wykrywa format na podstawie rozszerzenia pliku, w razie potrzeby stosuje wykrywanie na podstawie zawartości.
/v1/parse/webpage
Wyodrębnij główną treść ze strony internetowej. Usuwa nawigację, reklamy i szablonowe elementy.
/v1/parse/youtube
Wyodrębnij transkrypcję z filmu YouTube. Metadane zawierają video_id, kanał i czas trwania.
/v1/parse/audio
Parsuj pliki audio. Obsługuje MP3, WAV, M4A, OGG, FLAC, WebM. Maks. 25MB.
/v1/parse/video
Wyodrębnij audio z wideo do transkrypcji. Obsługuje MP4, MKV, AVI, MOV, WebM.
/v1/parse/epub
Parsuj ebook EPUB. Wyodrębnia tekst zorganizowany według rozdziałów.
/v1/parse/feed
Parsuj kanał RSS lub Atom. Obsługuje również OPML przez /v1/parse/opml.
/v1/parse/image
Analizuj obraz. Obsługuje JPG, PNG, GIF, BMP, WebP, TIFF. Maks. 20MB.
/v1/parse/image/ocr
Wyodrębnij tekst z obrazu za pomocą OCR.
SDK
Oficjalne SDK
TypeScript / JavaScript
Python
Agenci AI
Serwer MCP
Użyj ParseJet jako serwera MCP (Model Context Protocol) z Claude Code, Cursor lub dowolnym agentem AI kompatybilnym z MCP.
Instalacja
Claude Code
Dodaj do pliku .claude/settings.json twojego projektu:
Cursor
Przejdź do Ustawienia → Serwery MCP, dodaj nowy serwer:
Claude.ai (Zdalny)
Dla Claude.ai web użyj zdalnego punktu końcowego HTTP — instalacja lokalna nie jest wymagana:
Przejdź do Claude.ai → Ustawienia → Integracje → Dodaj serwer MCP → Wprowadź powyższy URL.
Dostępne narzędzia
Limity i cennik
ParseJet używa systemu opartego na kredytach. Każde żądanie zużywa kredyty w zależności od złożoności formatu.
Nagłówki odpowiedzi zawierają X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset oraz Retry-After przy odpowiedziach 429.
Kody błędów
Wszystkie błędy zwracają JSON z polami error i message.