التوثيق
توثيق ParseJet
يستخرج ParseJet النص من أي ملف أو عنوان URL. مكالمة API واحدة تتعامل مع PDF وDOCX وYouTube وصفحات الويب والصور والصوت والفيديو وأكثر من 25 تنسيقًا آخر.
بدء سريع
احصل على نتيجة التحليل الأولى في أقل من 60 ثانية. لا يلزم تسجيل.
جربه فورًا
الصق أي عنوان URL في ParseJet — لا يلزم مفتاح API للطلبات الثلاثة الأولى يوميًا.
احصل على مفتاح API الخاص بك
سجل الدخول باستخدام Google أو GitHub للحصول على مفتاح API مجاني. الطبقة المجانية تشمل 300 طلب شهريًا.
استخدم النتيجة
كل استجابة تُرجع نفس بنية JSON بغض النظر عن تنسيق الإدخال:
المصادقة
يقدم ParseJet ثلاثة مستويات من الوصول. يمكنك البدء في استخدام API على الفور دون أي مصادقة.
تلميح: لا تحتاج إلى مفتاح API للبدء. فقط أرسل الطلبات مباشرة — الطلبات الثلاثة الأولى يوميًا مجانية دون تسجيل.
المفاهيم الأساسية
الصيغ المدعومة
ParseJet تكتشف تلقائيًا الصيغة من امتداد الملف أو نمط URL. لا تحتاج إلى تحديد الصيغة — فقط أرسل الملف أو URL إلى /v1/parse/auto وParseJet يتولى الباقي.
الاعتمادات
كل طلب API يستهلك اعتمادات بناءً على تعقيد الصيغة التي يتم تحليلها. ملفات النص البسيطة تكلف 1 اعتماد، بينما نصوص YouTube تكلف 5. بدلتك الشهرية من الاعتمادات تعتمد على خطتك.
صيغة الإخراج
بشكل افتراضي، ParseJet تُرجع النص المستخرج الخام. أضف ?output_format=markdown إلى أي طلب للحصول على إخراج معالج يحتوي على العناوين والقوائم والجداول وكتل التعليمات البرمجية المكتشفة.
دليل
تحليل ملف PDF
استخراج النص من أي ملف PDF، بما في ذلك المستندات الممسوحة ضوئيًا والتقارير متعددة الصفحات.
رفع ملف PDF
تحويل إلى Markdown
أضف output_format=markdown للحفاظ على هيكل المستند:
تكلفة الاعتمادات: 3 اعتمادات لكل ملف PDF. يدعم الملفات حتى حد حجم الملف الخاص بخطتك (10MB-200MB).
دليل
نصوص YouTube
احصل على النص الكامل لأي فيديو على YouTube. يدعم الترجمة التلقائية بأكثر من 100 لغة.
الحصول على نص
تحديد اللغة
استخدم معامل language لمقاطع الفيديو غير الإنجليزية:
أو استخدم الكشف التلقائي
نقطة النهاية /v1/parse/auto/url تكتشف تلقائيًا روابط YouTube:
تكلفة الاعتمادات: 5 اعتمادات لكل فيديو على YouTube. البيانات الوصفية تتضمن video_id، القناة، والمدة.
دليل
استخراج محتوى الويب
استخرج المحتوى الرئيسي من أي صفحة ويب. يقوم ParseJet تلقائيًا بإزالة التنقل والإعلانات والشرائط الجانبية والمحتوى القياسي.
تكلفة الرصيد: 3 رصيد لكل صفحة ويب. تُرجع نصًا نظيفًا مع العنوان وعنوان URL المصدر في البيانات الوصفية.
دليل
مستندات المكتب
حلل ملفات Word (DOCX) وExcel (XLSX) وPowerPoint (PPTX) وCSV. فقط قم برفع الملف — يكتشف ParseJet التنسيق تلقائيًا.
تكلفة الرصيد: 2 رصيد لكل مستند. المدعومة: DOCX، PPTX، XLSX، CSV.
مرجع API
تنسيق الاستجابة
جميع نقاط النهاية تُرجع نفس بنية JSON:
/v1/parse/auto
نقطة النهاية الموصى بها. تكتشف التنسيق تلقائيًا من امتداد الملف أو نوع URL. تقبل file (متعدد الأجزاء) أو url (حقل نموذج)، وليس كلاهما.
/v1/parse/auto/url
حلل أي URL. يميز تلقائيًا بين YouTube وصفحات الويب العادية.
/v1/parse/auto/file
حلل أي ملف مرفوع. يكتشف التنسيق من امتداد الملف، مع تراجع إلى الكشف القائم على المحتوى.
/v1/parse/webpage
استخرج المحتوى الرئيسي من صفحة ويب. يزيل التنقل والإعلانات والمحتوى القياسي.
/v1/parse/youtube
استخرج النص من فيديو YouTube. تتضمن البيانات الوصفية video_id، القناة، والمدة.
/v1/parse/audio
حلل ملفات الصوت. يدعم MP3، WAV، M4A، OGG، FLAC، WebM. الحد الأقصى 25 ميجابايت.
/v1/parse/video
استخرج الصوت من الفيديو للتحويل إلى نص. يدعم MP4، MKV، AVI، MOV، WebM.
/v1/parse/epub
حلل كتاب EPUB. يستخرج النص منظمًا حسب الفصول.
/v1/parse/feed
حلل موجز RSS أو Atom. يدعم أيضًا OPML عبر /v1/parse/opml.
/v1/parse/image
حلل الصورة. يدعم JPG، PNG، GIF، BMP، WebP، TIFF. الحد الأقصى 20 ميجابايت.
/v1/parse/image/ocr
استخرج النص من الصورة عبر OCR.
SDKs
SDKs الرسمية
TypeScript / JavaScript
Python
وكلاء الذكاء الاصطناعي
خادم MCP
استخدم ParseJet كخادم MCP (بروتوكول سياق النموذج) مع Claude Code أو Cursor أو أي وكيل ذكاء اصطناعي متوافق مع MCP.
التثبيت
Claude Code
أضف إلى ملف مشروعك .claude/settings.json:
Cursor
انتقل إلى الإعدادات → خوادم MCP، أضف خادمًا جديدًا:
Claude.ai (عن بُعد)
لـ Claude.ai على الويب، استخدم نقطة النهاية HTTP البعيدة — لا حاجة لتثبيت محلي:
انتقل إلى Claude.ai → الإعدادات → التكاملات → إضافة خادم MCP → أدخل عنوان URL أعلاه.
الأدوات المتاحة
حدود المعدل والتسعير
يستخدم ParseJet نظامًا قائمًا على الرصيد. يستهلك كل طلب رصيدًا بناءً على تعقيد التنسيق.
تتضمن رؤوس الاستجابة X-RateLimit-Limit، X-RateLimit-Remaining، X-RateLimit-Reset، و Retry-After على استجابات 429.
رموز الأخطاء
جميع الأخطاء تُرجع JSON مع حقول error و message.