ParseJet

محول PDF إلى نص

استخرج كل النص من أي ملف PDF في ثوانٍ. يتعامل ParseJet مع التقارير متعددة الصفحات، والمستندات الممسوحة ضوئيًا (عبر OCR)، والتخطيطات المعقدة — ويعيد نصًا عاديًا نظيفًا ومنظمًا يمكنك نسخه أو البحث فيه أو إدخاله في خط أنابيب الذكاء الاصطناعي الخاص بك.

أسقط ملفًا هنا أو تصفح

يقبل ملفات PDF

مجاني — 3 طلبات/يوم، بدون تسجيل. للحصول على 300 رصيد/شهر مجانًا.

كيف يعمل

1

رفع ملف PDF

اسحب وأفلت ملف PDF الخاص بك أو انقر لتحديده. يعمل مع أي ملف PDF — رقمي أو ممسوح ضوئيًا أو محتوى مختلط.

2

استخراج النص العادي

يقرأ ParseJet كل صفحة، مع الحفاظ على ترتيب القراءة وبنية الفقرات. تتم معالجة الصفحات الممسوحة ضوئيًا باستخدام OCR تلقائيًا.

3

نسخ أو تنزيل

انسخ النص المستخرج إلى الحافظة الخاصة بك. للتحويل المجمع، استخدم API لمعالجة المئات من ملفات PDF برمجيًا.

الميزات الرئيسية

ما الذي يجعل pdf to text converter هذا مميزًا.

الحفاظ على ترتيب القراءة

يستخرج النص باتباع ترتيب القراءة الطبيعي، حتى من التخطيطات متعددة الأعمدة وتصميمات الصفحات المعقدة.

OCR تلقائي

يكتشف الصفحات القائمة على الصور ويطبق OCR بشكل شفاف — لا حاجة لإعدادات إضافية.

استخراج متعدد الصفحات

يعالج المستندات الكاملة دفعة واحدة. يعيد كل النص من جميع الصفحات في استجابة واحدة.

معالجة التخطيط

يتعامل بشكل صحيح مع الرؤوس والتذييلات والشريط الجانبي والحواشي دون خلطها مع نص الجسم.

معالجة سريعة

يتم تحويل معظم ملفات PDF في أقل من ثانيتين. تنتهي المستندات الكبيرة (100+ صفحة) عادةً في أقل من 10 ثوانٍ.

حالات الاستخدام

سيناريوهات شائعة حيث يوفر لك هذا الأداة الوقت.

البحث والفهرسة

حوّل أرشيفات PDF إلى نص قابل للبحث لمحركات البحث النصي الكامل مثل Elasticsearch أو Algolia.

استخراج البيانات

اسحب النص من الفواتير والإيصالات والعقود والنماذج للمعالجة اللاحقة أو أتمتة إدخال البيانات.

إمكانية الوصول

اجعل محتوى PDF متاحًا لقارئات الشاشة وأدوات تحويل النص إلى كلام عن طريق التحويل إلى نص عادي.

مدخلات الذكاء الاصطناعي ومعالجة اللغة الطبيعية

جهّز محتوى PDF لتحليل المشاعر أو التلخيص أو التصنيف أو أي خط أنابيب لمعالجة اللغة الطبيعية.

أتمتة باستخدام الـ API

استخدم نفس الأداة برمجيًا. يعمل مع أي لغة — مجرد HTTP.

cURL
curl -X POST https://api.parsejet.com/v1/parse/auto/file \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "[email protected]"

# Response: { "text": "Full extracted text...", "title": "...", "source_type": "pdf" }
Python
import httpx

# Convert a single PDF to text
resp = httpx.post(
    "https://api.parsejet.com/v1/parse/auto/file",
    headers={"Authorization": "Bearer YOUR_API_KEY"},
    files={"file": open("report.pdf", "rb")},
)
text = resp.json()["text"]
print(text)  # Plain text from all pages
JavaScript
const formData = new FormData();
formData.append("file", pdfFile);  // File object or Blob

const res = await fetch("https://api.parsejet.com/v1/parse/auto/file", {
  method: "POST",
  headers: { Authorization: "Bearer YOUR_API_KEY" },
  body: formData,
});
const { text, title, source_type } = await res.json();
console.log(text);  // Full plain text

هل تريد أتمتة هذا؟

ParseJet API تمنحك نفس قوة التحليل عبر نقطة نهاية HTTP واحدة. لا ffmpeg، لا poppler، لا tesseract — مجرد استدعاء API واحد.

curl -X POST https://api.parsejet.com/v1/parse/auto/url \ -H "Content-Type: application/json" \ -d '{"url":"https://example.com"}'
اقرأ وثائق API

الأسئلة الشائعة

كيف أحول ملف PDF إلى نص؟

ارفع ملف PDF الخاص بك أعلاه أو استخدم API: POST /v1/parse/auto/file مع ملف PDF الخاص بك. يستخرج ParseJet كل محتوى النص ويعيده كنص عادي، مع الحفاظ على ترتيب القراءة.

هل يعمل مع ملفات PDF الممسوحة ضوئيًا؟

نعم. يكتشف ParseJet تلقائيًا الصفحات القائمة على الصور ويستخدم OCR لاستخراج النص من ملفات PDF الممسوحة ضوئيًا، وصور المستندات، والصور المضمنة.

كيف يتعامل مع ملفات PDF متعددة الأعمدة؟

يحلل ParseJet تخطيط الصفحة لتحديد ترتيب القراءة. يتم استخراج النص متعدد الأعمدة عمودًا تلو الآخر، من اليسار إلى اليمين، مع الحفاظ على التسلسل المنطقي.

ماذا عن ملفات PDF التي تحتوي على جداول؟

يتم استخراج الجداول مع الحفاظ على الهيكل. يعيد ParseJet إخراجًا بتنسيق Markdown افتراضيًا، لذلك يتم عرض الجداول كجداول Markdown صحيحة.

هل هو مجاني؟ ما هي الحدود؟

نعم. تحصل على 3 تحويلات مجانية يوميًا دون تسجيل. أنشئ حسابًا مجانيًا للحصول على 300 رصيد شهريًا. تبدأ الخطط المدفوعة من 19 دولارًا شهريًا مع حدود حجم ملف أكبر (حتى 200 ميجابايت) وحصص أعلى.

ابدأ استخراج النص مجانًا

لا حاجة للتسجيل. قم بتحليل ملفك الأول في ثوانٍ.

عرض الأسعار