|
پردازش علائم و داده ها، جلد ۱۴، شماره ۲، صفحات ۱۴۱-۱۵۸
|
|
|
عنوان فارسی |
رفع اعوجاج هندسی متون بهکمک اطلاعات هندسی خطوط متن |
|
چکیده فارسی مقاله |
تصاویر سند تهیهشده توسط پویشگر یا دوربین دیجیتال، همواره با اعوجاجهای فتومتریک و هندسی همراه هستند. وجود هر دو نوع اعوجاج، باعث کاهش دقت عملکرد نرمافزارهای شناسایی نویسهها (OCR) میشوند. در این مقاله روشی نوین جهت رفع اعوجاجهای هندسی از تصاویر متنی ارائه شده است. در روش پیشنهادی بهمنظور تصحیح اعوجاج هندسی، در ابتدا خطوط متن از تصویر استخراج و سپس هر خط متن به ستونهایی به عرض مساوی شکسته میشوند. برای هر قطعه استخراجشده از یک خط، راستای قطعه بهنحوی تصحیح میشود که حروف موجود در آن قطعه در راستای افقی قرار گیرد. برای این منظور بهازای چرخشهای مختلف قطعۀ متن، افکنش افقی تصویر محاسبه میشود و چرخشی از قطعه که بلندترین قله افکنش را ایجاد کند، راستای تصحیحشده آن قطعه در نظر گرفته میشود. بر این اساس یک نقطه مرجع که معرف راستای مبنا است، برای هر قطعهخط همراستاشده با افق استخراج میشود. بهکمک نقاط مرجع، هر قطعه از خط، انحنای آن خط متن بهکمک برازش یک تابع درجۀ سه بهدست میآید. درنهایت با استفاده از تخمین تبدیل پرسپکتیو، اعوجاج هندسی هر خط برطرف میشود. جهت افزایش پایداری روش پیشنهادی در تخمین انحنای خطوط متن با طول کم، از انحنای خطوط با طول بزرگتر مجاور آن خط استفاده شده است. روش پیشنهادی بر روی پایگاههای دادۀ فارسی و انگلیسی پیادهسازی و با برخی روشهای همتراز آن مقایسه شده است. نتایج بیانگر قدرت و دقّت روش پیشنهادی در رفع اعوجاج هندسی است. |
|
کلیدواژههای فارسی مقاله |
|
|
عنوان انگلیسی |
Document Image Dewarping using geometrical information extracted from document lines |
|
چکیده انگلیسی مقاله |
Document images produced by scanners or digital cameras usually have photometric and geometric distortions. If either of these effects distorts document, recognition of words from such a document image using OCR is subject to errors. In this paper we propose a novel approach to significantly remove geometric distortion from document images. In this method first we extract document lines from document using morphological operators. Then, extracted document lines are divided into a number of equal size column strips. This allows to assume that each segment of line document is not curved. Each extracted document line segment is aligned horizontally. For this purpose, a segment line of document is rotated at different angels and for each rotation horizontal projection is obtained. The rotation angle with maximum peak at the corresponding projection signal is selected to align the line segment, horizontally. In order to estimate the geometrical distortion, for each document line a reference point is extracted from each line segment. These points indicate the position of a document line at starting column of line segments. Using reference points of a document line a polynomial function is fitted to each document line. At the end, geometric distortion for each part of the document is eliminated using a perspective transformation. This transformation is estimated based on the extracted polynomial function. To increase the stability of the proposed method for short text lines, the curve of adjacent text lines of longer length is used. A post processing stage is required after applying perspective transformation on document patches. Since this transformation is a continuous mapping but it is applied on digital images. To remove this distortion from the result, the consistency of each pixel value with the value of neighboring pixels are considered to correct the value of inconsistence pixels. The proposed method is implemented on Persian and English databases and has been compared with the existing methods. The results indicate the efficiency and accuracy of the proposed method in elimination of geometric distortions. |
|
کلیدواژههای انگلیسی مقاله |
|
|
نویسندگان مقاله |
محمد امین طلوع بیدختی | mohammad amin tolou beidokhti shahrood university دانشگاه صنعتی شاهرود سازمان اصلی تایید شده: دانشگاه صنعتی شاهرود (Shahrood university of technology)
علیرضا احمدی فرد | alireza ahmadyfard shahrood university دانشگاه صنعتی شاهرود سازمان اصلی تایید شده: دانشگاه صنعتی شاهرود (Shahrood university of technology)
|
|
نشانی اینترنتی |
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-134-2&slc_lang=fa&sid=fa |
فایل مقاله |
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-570069.pdf |
کد مقاله (doi) |
|
زبان مقاله منتشر شده |
fa |
موضوعات مقاله منتشر شده |
مقالات پردازش تصویر |
نوع مقاله منتشر شده |
پژوهشی |
|
|
برگشت به:
صفحه اول پایگاه |
نسخه مرتبط |
نشریه مرتبط |
فهرست نشریات
|