پردازش علائم و داده ها، جلد ۱۴، شماره ۲، صفحات ۱۴۱-۱۵۸

عنوان فارسی رفع اعوجاج هندسی متون به‌کمک اطلاعات هندسی خطوط متن
چکیده فارسی مقاله تصاویر سند تهیه‌شده توسط پویش‌گر یا دوربین دیجیتال، همواره با اعوجاج‌های فتومتریک و هندسی همراه هستند. وجود هر دو نوع اعوجاج، باعث کاهش دقت عملکرد نرم‌افزارهای شناسایی نویسه­ها (OCR) می­شوند. در این مقاله روشی نوین جهت رفع اعوجاج‌های هندسی از تصاویر متنی ارائه شده ­است. در روش پیشنهادی به‌منظور تصحیح اعوجاج هندسی، در ابتدا خطوط متن از تصویر استخراج و سپس هر خط متن به ستون­هایی به عرض مساوی شکسته می­شوند. برای هر قطعه استخراج‌شده از یک خط، راستای قطعه به‌نحوی تصحیح می‌شود که حروف موجود در آن قطعه در راستای افقی قرار گیرد. برای این منظور به‌ازای چرخش­های مختلف قطعۀ متن، افکنش افقی تصویر محاسبه می­شود و چرخشی از قطعه که بلندترین قله افکنش را ایجاد کند، راستای تصحیح‌شده آن قطعه در نظر گرفته می‌شود. بر این اساس یک نقطه مرجع که معرف راستای مبنا است، برای هر قطعه­خط هم‌راستا­شده با افق استخراج می‌شود. به‌کمک نقاط مرجع، هر قطعه از خط، انحنای آن خط متن به‌کمک برازش یک تابع درجۀ سه به‌دست می‌آید. درنهایت با استفاده از تخمین تبدیل پرسپکتیو، اعوجاج هندسی هر خط برطرف می‌شود. جهت افزایش پایداری روش پیشنهادی در تخمین انحنای خطوط متن با طول کم، از انحنای خطوط با طول بزرگ­تر مجاور آن خط استفاده شده ‌است. روش­ پیشنهادی بر روی پایگاه­های دادۀ فارسی و انگلیسی پیاده­سازی و با برخی روش‌های هم‌تراز آن مقایسه شده است. نتایج بیان‌گر قدرت و دقّت روش پیشنهادی در رفع اعوجاج هندسی است.  
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Document Image Dewarping using geometrical information extracted from document lines
چکیده انگلیسی مقاله Document images produced by scanners or digital cameras usually have photometric and geometric distortions. If either of these effects distorts document, recognition of words from such a document image using OCR is subject to errors. In this paper we propose a novel approach to significantly remove geometric distortion from document images. In this method first we extract document lines from document using morphological operators. Then, extracted document lines are divided into a number of equal size column strips.  This allows to assume that each segment of line document is not curved. Each extracted document line segment is aligned horizontally. For this purpose, a segment line of document is rotated at different angels and for each rotation horizontal projection is obtained. The rotation angle with maximum peak at the corresponding projection signal is selected to align the line segment, horizontally. In order to estimate the geometrical distortion, for each document line a reference point is extracted from each line segment. These points indicate the position of a document line at starting column of line segments. Using reference points of a document line a polynomial function is fitted to each document line. At the end, geometric distortion for each part of the document is eliminated using a perspective transformation. This transformation is estimated based on the extracted polynomial function. To increase the stability of the proposed method for short text lines, the curve of adjacent text lines of longer length is used. A post processing stage is required after applying perspective transformation on document patches. Since this transformation is a continuous mapping but it is applied on digital images. To remove this distortion from the result, the consistency of each pixel value with the value of neighboring pixels are considered to correct the value of inconsistence pixels. The proposed method is implemented on Persian and English databases and has been compared with the existing methods. The results indicate the efficiency and accuracy of the proposed method in elimination of geometric distortions.  
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله محمد امین طلوع بیدختی | mohammad amin tolou beidokhti
shahrood university
دانشگاه صنعتی شاهرود
سازمان اصلی تایید شده: دانشگاه صنعتی شاهرود (Shahrood university of technology)

علیرضا احمدی فرد | alireza ahmadyfard
shahrood university
دانشگاه صنعتی شاهرود
سازمان اصلی تایید شده: دانشگاه صنعتی شاهرود (Shahrood university of technology)


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-134-2&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-570069.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش تصویر
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات