مهندسی فناوری اطلاعات مکانی، جلد ۴، شماره ۴، صفحات ۱۰۳-۱۲۱

عنوان فارسی ترکیب داده‌های لایدار و تصاویر هوایی بر مبنای شبکه‌های عصبی کانولوشن به‌منظور تشخیص مدل ساختمان‌ها
چکیده فارسی مقاله ساختمان­ها یکی از مهمترین سازه­های شهری هستند که در کاربردهای مختلف و در نقشه­برداری شهری مورد استفاده قرار می­گیرند. در سال­های اخیر، با توسعه تکنولوژی اخذ داده­ها با توان تفکیک بالا، روش­ها و الگوریتم­های مختلفی به منظور استخراج مدل­های دقیق و بهنگام ساختمان­ها ارائه شده است. در این مقاله، روشی نوین و مدل­مبنا به منظور استخراج ساختمان­ها و شناسایی اتوماتیک مدل سقف آنها از قبیل سقف مسطح، شیروانی، شیبدار و هرمی ارائه شده است که در آن از شبکه­های عصبی با معماری عمیق به منظور یادگیری سلسله مراتبی ویژگی­های استخراج شده از داده­های لایدار و تصاویر ارتوفتو استفاده می­شود. مهمترین مراحل این روش عبارتند از: آموزش مدل و یادگیری، بخش­بندی تصویر، استخراج ویژگی، و برچسب زدن عوارض. کلیه این مراحل در یک ساختار نظارت شده و با استفاده از یک شبکه عصبی کانولوشن که از قبل آموزش دیده شده است، اجرا می­شوند تا یک سیستم تشخیص الگوی اتوماتیک برای تشخیص انواع مختلف ساختمان­ها در یک ناحیه شهری فراهم گردد. در این روش، اطلاعات ارتفاعی، تولیدکننده­ی ویژگی­های هندسی پایدار برای شبکه عصبی کانولوشن هستند که در تعیین موقعیت محدوده هر سقف به کار گرفته می­شوند. شبکه عصبی کانولوشن یکی از انواع شبکه­های عصبی رو به جلو و با مفهوم درک و فهم چندلایه­ای است که شامل تعدادی لایه کانولوشن و نمونه­برداری می­باشد. از آنجایی که در روش پیشنهادی، مجموعه داده­ی آموزشی یک کتابخانه کوچک از مدل­های برچسب­دار است، لذا زمان محاسباتی برای یادگیری با استفاده از مدل­های از قبل آموزش دیده، به طور قابل توجهی کم و در حدود چند ساعت است. نتایج حاصله، نشان­دهنده موثر بودن تلفیق داده­های ارتفاعی و تصاویر رنگی با هم در یادگیری عمیق به منظور استخراج ساختمان­ها و شناسایی مدل سقف آنها به صورت همزمان است به طوری که خطای حد بالای اول و دقت آموزش مدل حاصل از تلفیق این دو دسته داده به ترتیب حدود 05/0 و 95 درصد است. همچنین، میزان موفقیت و صحت شناسایی ساختمان­ها به ترتیب حدود 97 و 69 درصد است.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Synergistic Use of LiDAR Data and Aerial Image based on Convolutional Neural Networks for Building Model Recognition
چکیده انگلیسی مقاله Buildings are one of the most important urban structures that are used for various applications and urban mapping. In recent years, with the development of the high resolution data acquisition technologies, many different approaches and algorithms have been presented to extract the accurate and timely updated 3D models of buildings as a key element of city structures for numerous applications in urban mapping. In this paper, a novel and model-based approach is proposed for automatic recognition of buildings’ roof models such as flat, gable, hip, and pyramid hip roof models based on deep structures for hierarchical learning of features that are extracted from both LiDAR and aerial orthophotos. The main steps of this approach include building segmentation, feature extraction and learning, and finally building roof labelling in a supervised pre-trained Convolutional Neural Network (CNN) framework to have an automatic recognition system for various types of buildings over an urban area. In this framework, the height information provides invariant geometric features for CNN network to localize the boundary of each individual roofs. CNN is a kind of feed-forward neural network with the multilayer perceptron concept that consists of a number of convolutional and sub-sampling layers in an adaptable structure which is widely used in pattern recognition and object detection applications. Since the training dataset is a small library of labelled models for different shapes of roofs, via using the pre-trained models, the computation time of learning can decrease significantly. The experimental results highlight the effectiveness of the deep learning approach to detect and extract the pattern of buildings’ roofs automatically considering the complementary nature of height and RGB information. Based on the training results, the top 1 error and accuracy of training are about 0.05 and 95 %, respectively. Moreover, the average of correctness and completeness rates are about 97 % and 69 %, respectively.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله فاطمه علی دوست | fatemeh alidoost
university of tehran, college of engineering, surveying and geospatial engineering, north karegar street, tehran, iran, postal code 1439957131
دانشکده مهندسی نقشه برداری و اطلاعات مکانی، پردیس دانشکده های فنی دانشگاه تهران، کد پستی 1439957131
سازمان اصلی تایید شده: دانشگاه تهران (Tehran university)

حسین عارفی | hossein arefi
university of tehran, college of engineering, surveying and geospatial engineering, north karegar street, tehran, iran, postal code 1439957131
دانشکده مهندسی نقشه برداری و اطلاعات مکانی، پردیس دانشکده های فنی دانشگاه تهران، کد پستی 1439957131
سازمان اصلی تایید شده: دانشگاه تهران (Tehran university)


نشانی اینترنتی http://jgit.kntu.ac.ir/browse.php?a_code=A-11-395-1&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1245/article-1245-343375.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده فتوگرامتری
نوع مقاله منتشر شده کاربردی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات