كم من مرة ألحت عليك الحاجة لتصوير مستند مهم ولم تمتلك الوقت لنقل البيانات مرة أخرى عبر ملفات الوورد مثلا ...ولكن الآن يمكنك تحويل بيانات الصور إلى ملفات نصية يمكن التعديل عليها وكل ذلك بالمجان.
هكذا تقوم برامج OCR باستخلاص المعلومات من الصورة وتضعها على هيئة نص قابل للتنسيق بسرعة وسهولة.
برنامج OCR هو نظام لتحويل صورة مطبوعة او مكتوبة بخط اليد إلى نص يمكن أن يقرأه الجهاز. وتقوم برامج OCR بتحليل المستند ومقارنته مع الخطوط المخزنة في قاعدة البيانات أو بالسمات النموذجية للأحرف. وتستخدم بعض برامج OCR مدقق إملائي لتخمين الكلمات المجهولة. من الصعب تحقيق دقة 100%، ولكن معظم البرامج تسعى جاهدة لتحقيق دقة مرتفعة.
في هذه التدوينة سوف نتطرق شرح ثلاث برامج OCR مشهورة لتحويل الصور المطبوعة الى نصوص يمكن التعديل عليها
برنامج : SimpleOCR
الصعوبة التى كانت في التعرف على الكتابة اليدوية باستخدام أدوات MS، تم إيجاد حل لها في SimpleOCR. ولكن البرمجيات التى تتيح التعرف على خط اليد متوفرة فقط كنسخة تجريبية مجانية لمدة 14 يوما. رغم أن التعرف على طباعة الآلة ليس عليه أي قيود.
- يمكن إعداد البرنامج للقراءة مباشرة من ماسح ضوئي أو عن طريق إضافة صفحة (jpg, bmp ,tiff).
- يقددم SimpleOCR بعض السيطرة على التحويل عن طريق تحديد النص واختيار الصورة و سمات تجاهل النص.
- التحويل إلى نص، تمر العملية بمرحلة للتحقق من صحة النص؛ حيث يمكن للمستخدم تصحيح الباينات في النص المحول باستخدام مدقق إملائي مضمن مع البرنامج.
- يمكن حفظ الملف الذي تم تحويله إلى تنسيق doc أو txt. SimpleOCR
- يعمل على ما يرام مع النص العادي، ولكن عند تعامله مع تخطيطات تحتوي عدة أعمدة متعددة. في رأيي، دقة التحويل رديئة
- برنامج : SimpleOCR حجمه 9 ميغا بايت، وهو متوافق مع Windows.
- لتحميل البرنامج اضغط هنا
برنامج : TopOCR
- المصدر هو صورة من كاميرا أو ماسح ضوئي في الإطار الأيسر يتم تحويلها إلى نص في محرر نص على اليمين. مهام محرر النص مثل WordPad ويمكن استخدام Text to Speech engineمن Microsoft .
- يدعم البرنامج JPEG، TIFF، GIF و BMP. إعدادات الصورة مثل الإضاءة، واللون، والتباين، والتمويه الداخلي، والحدة يمكن استخدامها لتحسين إمكانية قراءة الصورة.
- يمكن أيضا ضبط إعدادات فلتر الكاميرا لتحسين الصورة.
- يمكن حفظ الملف المحول بعدة تنسيقات PDF أو RTF أو HTML و TXT.
- وظائف TopOCR تعمل بشكل جيد مع نص باتجاه مستقيم ولكن فشل كالمعتاد في التعرف على النصوص المكتوبة في الاعمدة.
- على الرغم من ذلك، البرنامج أيضا يستطيع التعامل مع صفحة مختلطة (النص مع رسومات) ويجري عمليات التحويل على النص فقط.
- يعمل البرنامج مع 11 لغة.
- برنامج : TopOCR حجمه 8 ميغا بايت وهو متوافق مع Windows XP, 7 (لم يتم اختباره على فيستا).
- لتحميل البرنامج اضغط هنا
برنامج : FreeOCR
هذا البرنامج المجاني يستخدم محرك Tesseract (محرك OCR). تم وضع Tesseract OCR في مختبرات إتش بي بينعامي 985 و 1995، وهو حاليا مع جوجل. ويتم اعتباره أحد محركات OCR المفتوحة المصدر الأكثر دقة. FreeOCR هو واجهة Windows بسيطة.
- يدعم معظم ملفات الصور وملفات TIFF متعددة الصفحات.
- يستطيع التعامل مع ملفات PDF، وهو أيضا متوافق مع أجهزة TWAIN مثل الماسحات الضوئية.
- ولـ FreeOCR أيضا واجهة مألوفة ذوإطارين مع إعدادات سهلة الفهم.
- قبل بدء عملية التحويل بنقرة واحدة، يمكنك ضبط تباين الصورة لقراءة أفضل.
- برنامج : FreeOCR يتطلب Microsoft Net 2.0 framework. متوافق مع ويندوز إكس بي/فيستا
- حجم البرنامج بحجم 4.38 ميغابايت
- لتحميل البرنامج اضغط هنا