ایک PDF فائل آن لائن میں متن کی شناخت.


روایتی کاپی کرتے ہوئے پی ڈی ایف فائل سے متن کو نکالنے کے لئے ہمیشہ ممکن نہیں ہے. اکثر اس طرح کے دستاویزات کے صفحات اپنے کاغذ کے ورژن کے سکینڈ مواد ہیں. ایسی فائلوں کو مکمل طور پر قابل تدوین ٹیکسٹ ڈیٹا میں تبدیل کرنے کے لئے، اپٹیکل کریکٹر کی شناخت (OCR) کے ساتھ خصوصی پروگرام استعمال کیے جاتے ہیں.

اس طرح کے حل کو لاگو کرنا بہت مشکل ہے اور اس وجہ سے، بہت سارے پیسہ خرچ کرتے ہیں. اگر آپ باقاعدگی سے پی ڈی ایف کے ساتھ متن کو تسلیم کرنے کی ضرورت ہے، مناسب پروگرام خریدنے کے لۓ مشورہ دیا جاتا ہے. غیر معمولی مقدمات کے لئے، یہ دستیاب کاموں کے ساتھ دستیاب آن لائن خدمات میں سے ایک کو استعمال کرنے کے لئے زیادہ منطقی ہو جائے گا.

پی ڈی ایف آن لائن سے متن کو کیسے پہچاننا ہے

یقینا، مکمل ڈیسک ٹاپ کے حل کے مقابلے میں او سی آر آن لائن خدمات کی خصوصیت سیٹ زیادہ محدود ہے. لیکن آپ مفت وسائل کے لئے، یا نامزد فیس کے لئے یا تو اس وسائل کے ساتھ کام کرسکتے ہیں. اہم بات یہ ہے کہ اسی ویب ایپلی کیشنز کو ان کے بنیادی کام، یعنی ٹیکسٹ کی شناخت، کے ساتھ ساتھ نمٹنے.

طریقہ 1: ABBYY FineReader آن لائن

سروس کی ترقی کمپنی آپٹیکل دستاویز کی شناخت کے میدان میں رہنماؤں میں سے ایک ہے. ونڈوز اور میک کے لئے ABBYY FineReader ٹیکسٹ تبدیل کرنے اور اس کے ساتھ کام کرنے کے لئے تبدیل کرنے کے لئے ایک طاقتور حل ہے.

اس پروگرام کے ویب ہم منصب، اس کی کارکردگی میں کمتر ہے. تاہم، سروس سے زیادہ سے زیادہ 190 زبانوں میں سکین اور تصاویر سے متن کو پہچان سکتا ہے. پی ڈی ایف فائلوں کے تبادلے میں ورڈ، ایکسل وغیرہ میں تبدیل کرنے کی حمایت کرتا ہے.

ABBYY FineReader آن لائن سروس آن لائن

  1. آپ کے آلے کے ساتھ کام کرنا شروع کرنے سے پہلے، آپ کے فیس بک، گوگل یا مائیکروسافٹ اکاؤنٹ کا استعمال کرکے سائٹ پر ایک اکاؤنٹ بنائیں یا لاگ ان کریں.

    لاگ ان ونڈو پر جائیں، بٹن پر کلک کریں. "لاگ ان" اوپر مینو بار میں.
  2. ایک بار لاگ ان میں، مطلوبہ پی ڈی ایف دستاویز کو FineReader میں بٹن کا استعمال کرتے ہوئے درآمد کریں "فائلیں اپ لوڈ کریں".

    پھر کلک کریں "صفحہ نمبر منتخب کریں" اور متن کی شناخت کے لئے مطلوبہ مدت کی وضاحت کریں.
  3. اگلا، دستاویز میں موجود زبانوں کو منتخب کریں، نتیجے میں فائل کی شکل اور بٹن پر کلک کریں "تسلیم".
  4. پروسیسنگ کے بعد، جس کی مدت مکمل طور پر دستاویز کے سائز پر منحصر ہے، آپ مکمل طور پر اس کے نام پر کلک کرکے ٹیکسٹ ڈیٹا کے ساتھ مکمل فائل ڈاؤن لوڈ کرسکتے ہیں.

    یا دستیاب کلاؤڈ سروسز میں سے ایک کو برآمد کریں.

سروس ممنوع ہے، شاید، تصویروں اور پی ڈی ایف فائلوں میں سب سے درست ٹیکسٹ شناخت الورگتھڈمز کی طرف سے. لیکن، بدقسمتی سے، اس کے مفت استعمال فی ماہ عملدرآمد پانچ صفحات تک محدود ہے. زیادہ تیز دستاویزات کے ساتھ کام کرنے کے لئے، آپ کو ایک سال کی رکنیت خریدنا ہوگا.

تاہم، اگر او سی آر فنکشن کو بہت ہی کم از کم ضرورت ہوتی ہے تو، ABBYY FineReader آن لائن چھوٹے پی ڈی ایف فائلوں سے متن نکالنے کے لئے ایک بہترین اختیار ہے.

طریقہ 2: مفت آن لائن او آر سی

متناسب کرنے کے لئے آسان اور آسان سروس. رجسٹریشن کی ضرورت کے بغیر، وسائل آپ کو فی گھنٹہ 15 تک مکمل PDF-صفحات کو تسلیم کرنے کی اجازت دیتا ہے. مفت آن لائن OCR 46 زبانوں میں دستاویزات کے ساتھ مکمل طور پر کام کرتا ہے اور بغیر کسی اجازت کے بغیر ٹیکسٹ برآمد فارمیٹس - DOCX، XLSX اور TXT.

جب رجسٹر کرنا، صارف کثیر صفحات کے دستاویزات کو عمل کرنے میں کامیاب ہے، لیکن ان صفحات کی مفت تعداد 50 یونٹس تک محدود ہے.

مفت آن لائن OCR آن لائن سروس

  1. پی ڈی ایف سے متن "مہمان" کے طور پر، وسائل پر اجازت کے بغیر، اس سائٹ کے مرکزی صفحے پر مناسب فارم استعمال کریں.

    بٹن کا استعمال کرتے ہوئے مطلوبہ دستاویز منتخب کریں "فائل"، اہم ٹیکسٹ زبان، آؤٹ پٹ کی شکل کی وضاحت کریں، پھر لوڈ کرنے کے لئے فائل کا انتظار کریں اور کلک کریں "تبدیل".
  2. ڈیجیٹلائزیشن کے عمل کے اختتام پر، کلک کریں "آؤٹ پٹ فائل ڈاؤن لوڈ کریں" مکمل دستاویز کو کمپیوٹر پر متن کے ساتھ بچانے کے لئے.

مجاز صارفین کے لئے، اعمال کی ترتیب کچھ مختلف ہے.

  1. بٹن کا استعمال کریں "رجسٹریشن" یا "لاگ ان" اوپر مینو بار میں، بالترتیب، ایک اکاؤنٹ مفت آن لائن او آر سی کو تشکیل دیں یا اس میں جائیں.
  2. شناخت پینل میں اجازت کے بعد، کلید کو پکڑو "CTRL"فراہم کردہ فہرست سے منبع دستاویز کے دو زبانوں تک منتخب کریں.
  3. PDF سے متن نکالنے کے لئے مزید اختیارات کی وضاحت کریں اور بٹن پر کلک کریں. "فائل کا انتخاب کریں" دستاویز میں خدمت کو لوڈ کرنے کے لئے.

    پھر، شناخت شروع کرنے کے لئے، کلک کریں "تبدیل".
  4. دستاویز کی پروسیسنگ کے بعد، اسی کالم میں آؤٹ پٹ فائل کے نام سے لنک پر کلک کریں.

    شناخت کا نتیجہ فوری طور پر آپ کے کمپیوٹر کی یاد میں ذخیرہ کیا جائے گا.

اگر آپ کو ایک چھوٹے سے PDF دستاویز سے متن نکالنے کی ضرورت ہے تو، آپ مندرجہ بالا بیان کردہ آلے کا استعمال کرنے کے لئے محفوظ طریقے سے استعمال کرسکتے ہیں. بڑی فائلوں کے ساتھ کام کرنے کے لئے، آپ کو مفت آن لائن او آر سی میں اضافی علامتوں کو خریدنا پڑے گا یا کسی اور حل کا حل کرنا ہوگا.

طریقہ 3: نیو او سی آر آر

مکمل طور پر مفت او سی آر سروس ہے جو آپ ڈی وی او پی ڈی ایف جیسے کسی بھی گرافک اور الیکٹرانک دستاویزات سے متن نکالنے کی اجازت دیتا ہے. وسائل کی شناختی فائلوں کے سائز اور تعداد پر پابندیاں عائد نہیں ہوتی، رجسٹریشن کی ضرورت نہیں ہوتی، اور متعلقہ افعال کی وسیع حد تک پیش کرتا ہے.

نیوی او آر آر 106 زبانوں کی حمایت کرتا ہے اور یہاں تک کہ کم معیار کے معیار اسکین کو سنبھالنے میں بھی کامیاب ہے. فائل صفحہ پر متن کی شناخت کے لئے علاقے کو دستی طور پر منتخب کرنا ممکن ہے.

آن لائن سروس نیوی او آر آر

  1. لہذا، غیر ضروری اعمال انجام دینے کی ضرورت کے بغیر، آپ فوری طور پر وسائل کے ساتھ کام شروع کر سکتے ہیں.

    براہ راست مرکزی صفحے پر سائٹ پر دستاویز درآمد کرنے کے لئے ایک فارم ہے. نیوی او آر آر میں فائل اپ لوڈ کرنے کیلئے، بٹن کا استعمال کریں "فائل کا انتخاب کریں" سیکشن میں "اپنی فائل کا انتخاب کریں". پھر میدان میں "شناختی زبان (زبانیں)" ذریعہ دستاویز کے ایک یا زیادہ زبانوں کو منتخب کریں، پھر کلک کریں "اپ لوڈ کریں + او سی آر".
  2. اپنی ترجیحی شناخت کی ترتیبات کو مقرر کریں، متن کو نکالنے کے لئے مطلوبہ صفحہ کو منتخب کریں، اور بٹن پر کلک کریں. "او سی آر".
  3. تھوڑا سا نیچے سکرال اور بٹن تلاش کریں. ڈاؤن لوڈ کریں.

    اس پر کلک کریں اور ڈراپ ڈاؤن فہرست میں ڈاؤن لوڈ کرنے کے لئے ضروری دستاویز کی شکل منتخب کریں. اس کے بعد، نکالا گیا متن کے ساتھ مکمل شدہ فائل آپ کے کمپیوٹر پر ڈاؤن لوڈ کریں گے.

آلہ آسان ہے اور تمام حروف کو کافی اعلی معیار میں تسلیم کرتا ہے. تاہم، درآمد پی ڈی ایف دستاویز کے ہر صفحے کی پروسیسنگ کو آزادانہ طور پر شروع کیا جانا چاہئے اور علیحدہ فائل میں پیش کیا جانا چاہئے. آپ کر سکتے ہیں، بلاشبہ، کلپ بورڈ پر تسلیم شدہ نتائج کو فوری طور پر نقل کر سکتے ہیں اور دوسروں کے ساتھ ضم کر سکتے ہیں.

اس کے باوجود، اوپر نوانس دیا، نیو او آر آر کا استعمال کرتے ہوئے بڑے پیمانے پر متن نکالنے کے لئے بہت مشکل ہے. اسی چھوٹی فائلوں کے ساتھ خدمت کے ساتھ "ایک بینگ کے ساتھ."

طریقہ 4: OCR.Space

ڈیجیٹلائزنگ متن کے لئے ایک آسان اور قابل اعتماد ذریعہ آپ کو پی ڈی ٹی دستاویزات میں پی ڈی ایف کے دستاویزات کو تسلیم کرنے اور پیداوار کی اجازت دیتا ہے. صفحات کی تعداد پر کوئی حد نہیں ہے. صرف حد یہ ہے کہ ان پٹ دستاویز کا سائز 5 میگا بائٹس سے زیادہ نہیں ہونا چاہئے.

او ایس سی آر اسپیس آن لائن سروس

  1. آلے کے ساتھ کام کرنے کے لئے رجسٹر ضروری نہیں ہے.

    صرف لنک پر کلک کریں اور بٹن کا استعمال کرکے اپنے کمپیوٹر سے ویب سائٹ پر PDF دستاویز اپ لوڈ کریں "فائل کا انتخاب کریں" یا نیٹ ورک سے - ریفرنس کے ذریعہ.
  2. ڈراپ ڈاؤن فہرست میں "زبانی زبان منتخب کریں" درآمد شدہ دستاویز کی زبان منتخب کریں.

    پھر بٹن پر کلک کرکے ٹیکسٹ شناخت کے عمل کو شروع کریں. "او سی سی شروع کرو!".
  3. فائل پروسیسنگ کے اختتام پر، نتیجہ دیکھیں "او آر سی کا نتیجہ" اور کلک کریں ڈاؤن لوڈ کریںمکمل TXT دستاویز ڈاؤن لوڈ کرنے کے لئے.

اگر آپ کو پی ڈی ایف سے متن نکالنے کی ضرورت ہوتی ہے اور حتمی فارمیٹنگ بالکل اہم نہیں ہے تو، او سی آر ایسیس ایک اچھا انتخاب ہے. صرف ایک دستاویز "monolingual" ہونا لازمی ہے، کیونکہ سروس میں ایک ہی وقت میں دو یا زیادہ زبانوں کی شناخت فراہم نہیں کی جاتی ہے.

یہ بھی دیکھیں: مفت analogues FineReader

آرٹیکل میں پیش کردہ آن لائن ٹولز کا اندازہ کیا جانا چاہئے، یہ یاد رکھنا چاہیے کہ ABBYY سے FineReader آن لائن OCR کام زیادہ درست اور درست طریقے سے ہینڈل کرتا ہے. اگر متن کی شناخت کی زیادہ سے زیادہ درستگی آپ کے لئے اہم ہے، تو یہ خاص طور پر اس اختیار پر غور کرنا بہتر ہے. لیکن اس کے لئے ادائیگی کرنے کے لئے، سب سے زیادہ امکان ہے، بھی ہے.

اگر آپ کو چھوٹے دستاویزات کو ڈیجیٹلائز کرنے کی ضرورت ہوتی ہے اور آپ کو خدمت میں غلطیوں کو درست کرنے کے لئے تیار ہیں، تو یہ نیویو آر آر، OCR.Space یا مفت آن لائن OCR استعمال کرنے کے لئے مشورہ دیا جاتا ہے.