ParseJet

التوثيق

توثيق ParseJet

يستخرج ParseJet النص من أي ملف أو عنوان URL. مكالمة API واحدة تتعامل مع PDF وDOCX وYouTube وصفحات الويب والصور والصوت والفيديو وأكثر من 25 تنسيقًا آخر.

بدء سريع

احصل على نتيجة التحليل الأولى في أقل من 60 ثانية. لا يلزم تسجيل.

1

جربه فورًا

الصق أي عنوان URL في ParseJet — لا يلزم مفتاح API للطلبات الثلاثة الأولى يوميًا.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
2

احصل على مفتاح API الخاص بك

سجل الدخول باستخدام Google أو GitHub للحصول على مفتاح API مجاني. الطبقة المجانية تشمل 300 طلب شهريًا.

# Add your API key to requests
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
3

استخدم النتيجة

كل استجابة تُرجع نفس بنية JSON بغض النظر عن تنسيق الإدخال:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "webpage",
  "metadata": { "url": "https://example.com" }
}

المصادقة

يقدم ParseJet ثلاثة مستويات من الوصول. يمكنك البدء في استخدام API على الفور دون أي مصادقة.

المستوى كيفية الوصول حد المعدل الأفضل لـ
مجهولبدون رؤوس3/يوم، 2 ميجابايتاختبار سريع
جلسةتسجيل الدخول (كوكي)10/يوم، 5 ميجابايتأداة لوحة التحكم
مفتاح APIAuthorization: Bearer pj_xxxحسب الخطةالإنتاج

تلميح: لا تحتاج إلى مفتاح API للبدء. فقط أرسل الطلبات مباشرة — الطلبات الثلاثة الأولى يوميًا مجانية دون تسجيل.

المفاهيم الأساسية

الصيغ المدعومة

ParseJet تكتشف تلقائيًا الصيغة من امتداد الملف أو نمط URL. لا تحتاج إلى تحديد الصيغة — فقط أرسل الملف أو URL إلى /v1/parse/auto وParseJet يتولى الباقي.

الفئة الصيغ الاعتمادات
نصTXT, MD, JSON, CSV, XML, HTML1
مستنداتDOCX, PPTX, XLSX, EPUB2
معقدPDF، صفحات الويب، فيديو3
YouTubeروابط فيديو YouTube5
أخرىصوت (MP3, WAV)، صور (JPG, PNG)، RSS، OPML، بريد إلكتروني، دفاتر ملاحظات1

الاعتمادات

كل طلب API يستهلك اعتمادات بناءً على تعقيد الصيغة التي يتم تحليلها. ملفات النص البسيطة تكلف 1 اعتماد، بينما نصوص YouTube تكلف 5. بدلتك الشهرية من الاعتمادات تعتمد على خطتك.

صيغة الإخراج

بشكل افتراضي، ParseJet تُرجع النص المستخرج الخام. أضف ?output_format=markdown إلى أي طلب للحصول على إخراج معالج يحتوي على العناوين والقوائم والجداول وكتل التعليمات البرمجية المكتشفة.

دليل

تحليل ملف PDF

استخراج النص من أي ملف PDF، بما في ذلك المستندات الممسوحة ضوئيًا والتقارير متعددة الصفحات.

رفع ملف PDF

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

تحويل إلى Markdown

أضف output_format=markdown للحفاظ على هيكل المستند:

curl -X POST https://api.parsejet.com/v1/parse/auto/file?output_format=markdown \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

تكلفة الاعتمادات: 3 اعتمادات لكل ملف PDF. يدعم الملفات حتى حد حجم الملف الخاص بخطتك (10MB-200MB).

دليل

نصوص YouTube

احصل على النص الكامل لأي فيديو على YouTube. يدعم الترجمة التلقائية بأكثر من 100 لغة.

الحصول على نص

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID"}'

تحديد اللغة

استخدم معامل language لمقاطع الفيديو غير الإنجليزية:

curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "ja"}'

أو استخدم الكشف التلقائي

نقطة النهاية /v1/parse/auto/url تكتشف تلقائيًا روابط YouTube:

curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtu.be/VIDEO_ID"}'

تكلفة الاعتمادات: 5 اعتمادات لكل فيديو على YouTube. البيانات الوصفية تتضمن video_id، القناة، والمدة.

دليل

استخراج محتوى الويب

استخرج المحتوى الرئيسي من أي صفحة ويب. يقوم ParseJet تلقائيًا بإزالة التنقل والإعلانات والشرائط الجانبية والمحتوى القياسي.

curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/blog/article"}'

تكلفة الرصيد: 3 رصيد لكل صفحة ويب. تُرجع نصًا نظيفًا مع العنوان وعنوان URL المصدر في البيانات الوصفية.

دليل

مستندات المكتب

حلل ملفات Word (DOCX) وExcel (XLSX) وPowerPoint (PPTX) وCSV. فقط قم برفع الملف — يكتشف ParseJet التنسيق تلقائيًا.

# Works with any Office format
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

# Also works with spreadsheets
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

تكلفة الرصيد: 2 رصيد لكل مستند. المدعومة: DOCX، PPTX، XLSX، CSV.

مرجع API

تنسيق الاستجابة

جميع نقاط النهاية تُرجع نفس بنية JSON:

{
  "text": "Extracted text content...",
  "title": "Document Title",
  "source_type": "pdf",
  "metadata": { "pages": 12, "author": "Jane Doe" }
}
الحقل النوع الوصف
textstringمحتوى النص المستخرج
titlestringعنوان المستند أو الصفحة
source_typestringمعرف التنسيق (pdf، webpage، youtube، إلخ.)
metadataobjectبيانات وصفية خاصة بالتنسيق (عدد الصفحات، المؤلف، المدة، إلخ.)
POST

/v1/parse/auto

نقطة النهاية الموصى بها. تكتشف التنسيق تلقائيًا من امتداد الملف أو نوع URL. تقبل file (متعدد الأجزاء) أو url (حقل نموذج)، وليس كلاهما.

curl -X POST https://api.parsejet.com/v1/parse/auto \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/auto/url

حلل أي URL. يميز تلقائيًا بين YouTube وصفحات الويب العادية.

المعاملالنوعمطلوبالوصف
urlstringنعمعنوان URL للمعالجة
languagestringلاكود ISO 639-1 للغة نصوص YouTube
curl -X POST https://api.parsejet.com/v1/parse/auto/url \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com"}'
POST

/v1/parse/auto/file

حلل أي ملف مرفوع. يكتشف التنسيق من امتداد الملف، مع تراجع إلى الكشف القائم على المحتوى.

curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/webpage

استخرج المحتوى الرئيسي من صفحة ويب. يزيل التنقل والإعلانات والمحتوى القياسي.

المعاملالنوعمطلوبالوصف
urlstringنعمعنوان صفحة الويب
curl -X POST https://api.parsejet.com/v1/parse/webpage \
  -H "Content-Type: application/json" \
  -d '{"url": "https://example.com/article"}'
POST

/v1/parse/youtube

استخرج النص من فيديو YouTube. تتضمن البيانات الوصفية video_id، القناة، والمدة.

المعاملالنوعمطلوبالوصف
urlstringنعمعنوان فيديو YouTube أو معرف الفيديو
languagestringلاكود اللغة ISO 639-1
curl -X POST https://api.parsejet.com/v1/parse/youtube \
  -H "Content-Type: application/json" \
  -d '{"url": "https://youtube.com/watch?v=VIDEO_ID", "language": "en"}'
POST

/v1/parse/audio

حلل ملفات الصوت. يدعم MP3، WAV، M4A، OGG، FLAC، WebM. الحد الأقصى 25 ميجابايت.

الحقلالنوعمطلوبالوصف
filefileنعمملف صوتي
languagestringلاكود ISO 639-1
with_timestampsbooleanلاتضمين الطوابع الزمنية على مستوى الكلمات
curl -X POST https://api.parsejet.com/v1/parse/audio \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/video

استخرج الصوت من الفيديو للتحويل إلى نص. يدعم MP4، MKV، AVI، MOV، WebM.

curl -X POST https://api.parsejet.com/v1/parse/video \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "language=en"
POST

/v1/parse/epub

حلل كتاب EPUB. يستخرج النص منظمًا حسب الفصول.

curl -X POST https://api.parsejet.com/v1/parse/epub \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/feed

حلل موجز RSS أو Atom. يدعم أيضًا OPML عبر /v1/parse/opml.

curl -X POST https://api.parsejet.com/v1/parse/feed \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"
POST

/v1/parse/image

حلل الصورة. يدعم JPG، PNG، GIF، BMP، WebP، TIFF. الحد الأقصى 20 ميجابايت.

الحقلالنوعمطلوبالوصف
filefileنعمملف صورة
promptstringلامطالبة مخصصة لتحليل الصورة
modelstringلاتجاوز نموذج الرؤية
curl -X POST https://api.parsejet.com/v1/parse/image \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]" -F "prompt=Describe this image"
POST

/v1/parse/image/ocr

استخرج النص من الصورة عبر OCR.

curl -X POST https://api.parsejet.com/v1/parse/image/ocr \
  -H "Authorization: Bearer pj_YOUR_KEY" \
  -F "[email protected]"

SDKs

SDKs الرسمية

TypeScript / JavaScript

npm install parsejet
import { ParseJet } from "parsejet";

const client = new ParseJet({ apiKey: "pj_YOUR_KEY" });

// Parse a URL
const result = await client.parse.url("https://example.com");
console.log(result.text);

// Parse a file
const result = await client.parse.file(buffer, "report.pdf");
console.log(result.text);

Python

pip install parsejet
from parsejet import ParseJet

client = ParseJet(api_key="pj_YOUR_KEY")

# Parse a URL
result = client.parse.url("https://example.com")
print(result.text)

# Parse a file
with open("report.pdf", "rb") as f:
    result = client.parse.file(f, "report.pdf")
    print(result.text)

وكلاء الذكاء الاصطناعي

خادم MCP

استخدم ParseJet كخادم MCP (بروتوكول سياق النموذج) مع Claude Code أو Cursor أو أي وكيل ذكاء اصطناعي متوافق مع MCP.

التثبيت

npm install -g @parsejet/mcp-server

Claude Code

أضف إلى ملف مشروعك .claude/settings.json:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Cursor

انتقل إلى الإعدادات → خوادم MCP، أضف خادمًا جديدًا:

{
  "mcpServers": {
    "parsejet": {
      "command": "npx",
      "args": ["-y", "@parsejet/mcp-server"],
      "env": {
        "PARSEJET_API_KEY": "pj_YOUR_KEY"
      }
    }
  }
}

Claude.ai (عن بُعد)

لـ Claude.ai على الويب، استخدم نقطة النهاية HTTP البعيدة — لا حاجة لتثبيت محلي:

Endpoint:  https://api.parsejet.com/mcp
Transport: Streamable HTTP
Auth:      Bearer pj_YOUR_KEY (in Authorization header)

انتقل إلى Claude.ai → الإعدادات → التكاملات → إضافة خادم MCP → أدخل عنوان URL أعلاه.

الأدوات المتاحة

الأداة الوصف
parse_urlمعالجة أي عنوان URL (صفحة ويب، YouTube، إلخ)
parse_fileمعالجة ملف محلي (PDF، DOCX، صور، إلخ)
get_youtube_transcriptالحصول على نصوص فيديو YouTube مع اللغة الاختيارية

حدود المعدل والتسعير

يستخدم ParseJet نظامًا قائمًا على الرصيد. يستهلك كل طلب رصيدًا بناءً على تعقيد التنسيق.

الخطة السعر الرصيد/شهر RPM الحد الأقصى للملف
Free$0300510MB
Pro$19/mo3,0003050MB
Business$49/mo20,00060100MB
Scale$99/mo50,000200200MB
EnterpriseCustomCustomCustomCustom

تتضمن رؤوس الاستجابة X-RateLimit-Limit، X-RateLimit-Remaining، X-RateLimit-Reset، و Retry-After على استجابات 429.

رموز الأخطاء

جميع الأخطاء تُرجع JSON مع حقول error و message.

الحالةالرمزالوصف
400unsupported_formatنوع الملف غير مدعوم
401invalid_api_keyمفتاح API مفقود أو غير صالح
413file_too_largeالملف يتجاوز حد الخطة
422parse_errorالملف تالف أو غير قابل للقراءة
429rate_limit_exceededتم الوصول إلى حد RPM أو الحد اليومي/الشهري
502parser_unavailableخادم المحلل غير قابل للوصول
504parser_timeoutانتهت مهلة عملية التحليل