Документация
Документация ParseJet
ParseJet извлекает текст из любого файла или URL. Один вызов API обрабатывает PDF, DOCX, YouTube, веб-страницы, изображения, аудио, видео и более 25 других форматов.
Быстрый старт
Получите первый результат парсинга менее чем за 60 секунд. Регистрация не требуется.
Попробуйте мгновенно
Вставьте любой URL в ParseJet — API-ключ не требуется для первых 3 запросов в день.
Получите API-ключ
Войдите через Google или GitHub, чтобы получить бесплатный API-ключ. Бесплатный тариф включает 300 запросов в месяц.
Используйте результат
Каждый ответ возвращает одну и ту же структуру JSON независимо от формата входных данных:
Аутентификация
ParseJet предлагает три уровня доступа. Вы можете начать использовать API немедленно без какой-либо аутентификации.
Совет: Для начала работы вам не нужен API-ключ. Просто отправляйте запросы напрямую — первые 3 в день бесплатны и не требуют регистрации.
Основные концепции
Поддерживаемые форматы
ParseJet автоматически определяет формат по расширению файла или шаблону URL. Вам не нужно указывать формат — просто отправьте файл или URL на /v1/parse/auto, и ParseJet сделает всё остальное.
Кредиты
Каждый API-запрос расходует кредиты в зависимости от сложности разбираемого формата. Простые текстовые файлы стоят 1 кредит, а расшифровки YouTube — 5. Ваш ежемесячный лимит кредитов зависит от вашего тарифного плана.
Формат вывода
По умолчанию ParseJet возвращает извлечённый сырой текст. Добавьте ?output_format=markdown к любому запросу, чтобы получить обработанный вывод с обнаруженными заголовками, списками, таблицами и блоками кода.
Руководство
Разбор PDF
Извлеките текст из любого PDF-файла, включая сканированные документы и многостраничные отчёты.
Загрузите PDF-файл
Конвертировать в Markdown
Добавьте output_format=markdown, чтобы сохранить структуру документа:
Стоимость в кредитах: 3 кредита за PDF. Поддерживаются файлы до лимита размера вашего тарифа (10MB-200MB).
Руководство
Расшифровки YouTube
Получите полную расшифровку любого видео на YouTube. Поддерживает автоматически сгенерированные субтитры на 100+ языках.
Получить расшифровку
Указать язык
Используйте параметр language для видео не на английском:
Или используйте автоопределение
Эндпоинт /v1/parse/auto/url автоматически определяет URL YouTube:
Стоимость в кредитах: 5 кредитов за видео YouTube. Метаданные включают video_id, канал и длительность.
Руководство
Веб-скрапинг
Извлекайте основной контент с любой веб-страницы. ParseJet автоматически удаляет навигацию, рекламу, боковые панели и шаблонные элементы.
Стоимость в кредитах: 3 кредита за веб-страницу. Возвращает чистый текст с заголовком и исходным URL в метаданных.
Руководство
Офисные документы
Парсите файлы Word (DOCX), Excel (XLSX), PowerPoint (PPTX) и CSV. Просто загрузите файл — ParseJet автоматически определит формат.
Стоимость в кредитах: 2 кредита за документ. Поддерживаются: DOCX, PPTX, XLSX, CSV.
Справочник API
Формат ответа
Все конечные точки возвращают одинаковую структуру JSON:
/v1/parse/auto
Рекомендуемая конечная точка. Автоматически определяет формат по расширению файла или типу URL. Принимает file (multipart) или url (поле формы), но не оба одновременно.
/v1/parse/auto/url
Парсинг любого URL. Автоматически отличает YouTube от обычных веб-страниц.
/v1/parse/auto/file
Парсинг любого загруженного файла. Определяет формат по расширению файла, при неудаче — по содержимому.
/v1/parse/webpage
Извлечение основного контента с веб-страницы. Удаляет навигацию, рекламу и шаблонные элементы.
/v1/parse/youtube
Извлечение транскрипта из видео YouTube. Метаданные включают video_id, канал и длительность.
/v1/parse/audio
Парсинг аудиофайлов. Поддерживает MP3, WAV, M4A, OGG, FLAC, WebM. Макс. 25 МБ.
/v1/parse/video
Извлечение аудио из видео для транскрипции. Поддерживает MP4, MKV, AVI, MOV, WebM.
/v1/parse/epub
Парсинг EPUB-книги. Извлекает текст, организованный по главам.
/v1/parse/feed
Парсинг RSS или Atom-ленты. Также поддерживает OPML через /v1/parse/opml.
/v1/parse/image
Анализ изображения. Поддерживает JPG, PNG, GIF, BMP, WebP, TIFF. Макс. 20 МБ.
/v1/parse/image/ocr
Извлечение текста из изображения с помощью OCR.
SDK
Официальные SDK
TypeScript / JavaScript
Python
AI-агенты
MCP сервер
Используйте ParseJet как MCP (Model Context Protocol) сервер с Claude Code, Cursor или любым совместимым с MCP AI-агентом.
Установка
Claude Code
Добавьте в .claude/settings.json вашего проекта:
Cursor
Перейдите в Настройки → MCP серверы, добавьте новый сервер:
Claude.ai (Удалённый)
Для Claude.ai в браузере используйте удалённый HTTP endpoint — локальная установка не требуется:
Перейдите в Claude.ai → Настройки → Интеграции → Добавить MCP сервер → Введите URL выше.
Доступные инструменты
Лимиты запросов и цены
ParseJet использует систему кредитов. Каждый запрос расходует кредиты в зависимости от сложности формата.
Заголовки ответа включают X-RateLimit-Limit, X-RateLimit-Remaining, X-RateLimit-Reset и Retry-After при ответах 429.
Коды ошибок
Все ошибки возвращают JSON с полями error и message.