این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پژوهشنامه مدیریت حوزه آبخیز، جلد ۱۵، شماره ۲، صفحات ۰-۰

عنوان فارسی بازسازی داده های گمشده جریان روزانه رودخانه با استفاده از الگوریتم جنگل گمشده در حوزه بلوچستان جنوبی، ایران
چکیده فارسی مقاله
چکیده مبسوط
مقدمه و هدف: سری‌های زمانی کامل هیدرولوژیکی برای مدیریت و مدل‌سازی منابع آب و انرژی در یک اقلیم در حال تغییر حیاتی هستند. شکاف ­های داده باعث مشکلاتی در تفسیر، کالیبراسیون ناکارآمد مدل و آماره ­های اریب­ دار می­ شوند. در این بررسی، اعتبار یک الگوریتم ماشین یادگیری تصادفی غیرپارامتری که جنگل گمشده (MissForest) نام دارد برای پرکردن شکاف سری­ های زمانی جریان روزانه در منطقه­ ای با داده کمیاب و تغییرپذیری اقلیمی قوی، ارزیابی گردیده است.
مواد و روش‌ها: داده ­های جریان روزانه در ایستگاه­ های جریان­ سنجی حوضه آبریز بلوچستان جنوبی در یک دوره طولانی­ مدت هیدرولوژیکی (23/09/1972 تا 22/09/2018) مورد بررسی قرار گرفته است. درصد گمشدگی به اساس یک معیار قراردادی (کمتر از 50 درصد) به عنوان نسبت قابل قبول از نرخ گمشدگی در داده­ های جریان انتخاب و سپس مکانیسم ­ها و الگوهای گمشدگی داده ­ها تعیین گردیده است. عملکرد الگوریتم­ بازسازی داده­ های گمشده با دو سناریوی متفاوت داده گمشده مصنوعی به چالش کشیده شده است. سپس اعتبارسنجی الگوریتم در پُرکردن داده ­های گمشده جریان روزانه با مقایسه سری ­های پُرشده با داده­ های مشاهده شده، از طریق آزمون­ های سه­ گانه نیکویی برازش (GoF) تست شده است.  
یافته‌ها: نتایج نشان داد که به طور کلی الگوریتم جنگل گمشده عملکرد رضایت ­بخش  و خوبی داشته و امکان شبیه ­سازی دقیق و مطمئن داده ­های از دست رفته را به سرعت و به صورت خودکار فراهم می ­آورد. عملکرد الگوریتم جنگل گمشده به شدت تابعی از تعداد رکوردهای پیش­بینی کننده، طول رکورد و نوع جریان رودخانه می­ باشد. در نهایت، بازسازی شکاف­ های واقعی در داده­ های جریان از طریق اعمال این الگوریتم هوشمند ممکن گردید. سری­ های زمانی جریان رودخانه­ ها با رژیم جریان طبیعی با عملکرد خوب شبیه­ سازی گردیدند؛ درحالی­که این عملکرد برای تغییرات دبی در نتیجه ذخیره ­سازی و انحراف آب برای آبیاری به ویژه در پایین دست سدها اندکی افت داشت. عملکرد این الگورتیم در پُرکردن سری زمانی روزانه جریان با تغییرات شدید رژیم جریان مانند دبی اوج، مطلوب ارزیابی نشد. این افت عملکرد بیشتر متوجه شرایط هیدرواقلیمی حوضه آبریز مورد مطالعه است تا ساختار الگوریتم. هیدروگراف ­های بازسازی شده امکان تجزیه و تحلیل تغییر و تنوع جریان و برهمکنش آن­ها با متغیرهای آب و هوایی کلیدی را فراهم می­ کنند.
نتیجه‌گیری: الگوریتم جنگل گمشده به عنوان یکی از روش ­های انتساب مبتنی بر یادگیری ماشین دارای اعتبار و عملکرد بالا در بازسازی داده ­های گمشده جریان روزانه رودخانه معرفی شده و می ­توان از آن به صورت خودکار و هوشمند در بازسازی نواقص آماری جریان رودخانه در مقیاس روزانه استفاده نمود.
 
کلیدواژه‌های فارسی مقاله الگوریتم جنگل تصادفی، جریان رودخانه، داده گمشده، یادگیری ماشین، نیکویی برازش.

عنوان انگلیسی Reconstruction of Missing Daily Streamflow Data using MissForest Algorithm in Southern Baluchestan Basin (SBB), Iran
چکیده انگلیسی مقاله
  Extended Abstract
Introduction and Objective:
Long-term hydrometeorological variables can be used for planning and managing water resources at the basin level using different physical models such as hydrological and hydraulic models. However, such variables are often accompanied by missing data, which makes analysis difficult or sometimes impossible. Data gaps cause problems in interpretation, model calibration, and biased statistics. In this study, the validity of a non-parametric random learning machine algorithm called MissForest has been evaluated to fill the gap of daily streamflow series in a region with scarce data and strong climate variability.
Material and Methods:
The daily streamflow data in the gauge stations of the Southern Baluchestan catchment have been analyzed in a long-term hydrological period (09/23/1972 to 09/22/2018). First, The missingness percentage was selected based on a conventional criterion (less than 50%) as an acceptable ratio of the missing rate in the streamflow data, and then the mechanisms and patterns of the missing data were investigated. Accordingly, the number of gauge stations reduced to 7 samples. Then, the temporal distribution of the missing daily streamflows during the months of the year and the relative frequency of gap length during the period were investigated. In the following, the performance of the missing data reconstruction algorithm is challenged with two different artificial missing data scenarios. Two types of artificial gaps were generated, namely a) Removed contiguous segments: at each gauge only a segment (having lengths of 7, 14, 21, 30, 60, 180, and 365 days) was randomly removed from the entire record (1972–2018); b) Removed single data points: observed values (30, 60, 90, 120, 180 and 365 days) were randomly removed from the entire record (1972–2018) at each of the gauges. MissForest was applied to infill the gaps contained in the records together with the artificial gaps. Our analysis includes reconstructions of the 1972–2018 period at each of any streamflow gauges. Finally, The performance of MissForest at infilling daily streamflow data was tested by comparing the filled series with the observed data using goodness-of-fit indicators (GoF): coefficient of determination (
2"" ), the percent bias (PBIAS), and the Kling-Gupta efficiency (KGE).
Results:
The results showed that, in general, the MissForest algorithm performed satisfactorily and well, and it provides the possibility of accurately and reliably simulating lost data quickly and automatically. The performance of the MissForest algorithm is highly dependent on the number of predictor records, record length, and streamflow type. Finally, reconstruction of real gaps in streamflow data was possible through the application of this intelligent algorithm. The river flow time series were simulated with the natural flow regime with good performance; While this performance had a slight drop for flow rate changes as a result of water storage and diversion for irrigation, especially downstream of dams. The performance of this algorithm in filling the daily time series of flow with severe changes in the flow regime such as peak discharge was not evaluated optimally. This drop in performance is more related to the hydroclimatic conditions of the studied watershed than the structure of the algorithm. The reconstructed hydrographs allow analysis of flow variability and their interaction with key climate variables.
Conclusion:
The MissForest algorithm is introduced as one of the imputation methods based on machine learning with high credibility and performance in reconstructing the missing data of the daily streamflow, and it can be used automatically and intelligently in the reconstruction of the statistical defects of the river flow in the scale used daily. It is suggested that the effects of different watersheds with specific hydro-physical-climatic characteristics should be analyzed in the next studies on the performance of the MissForest algorithm. Among the other issues that need to be addressed in future studies are the investigation of the proposed method of this study in other climatic and geographical regions, the sensitivity measurement to the rainfall and flow regime, and finally the investigation of its performance compared to other common methods.
کلیدواژه‌های انگلیسی مقاله MissForest algorithm, Streamflow, Missing data, Machine learning, Goodness of fit.

نویسندگان مقاله جواد آریان منش | Javad Aryanmanesh
Department of physical Geography, University of Sistan and Baluchestan, Iran
گروه جغرافیای طبیعی، دانشکده جغرافیا و برنامه ریزی محیطی، دانشگاه سیستان و بلوچستان، ایران.

حمید نظری پور | Hamid Nazaripour
Department of physical Geography, University of Sistan and Baluchestan, Iran
گروه جغرافیای طبیعی، دانشکده جغرافیا و برنامه ریزی محیطی، دانشگاه سیستان و بلوچستان، ایران

پیمان محمودی | Peyman Mahmoodi
Department of physical Geography, University of Sistan and Baluchestan, Iran
گروه جغرافیای طبیعی، دانشکده جغرافیا و برنامه ریزی محیطی، دانشگاه سیستان و بلوچستان، ایران

پرویز خسروی | Parviz Khosravi
Iran Meteorological Organization.
سازمان هواشناسی کشور.


نشانی اینترنتی http://jwmr.sanru.ac.ir/browse.php?a_code=A-10-1925-1&slc_lang=fa&sid=1
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده سایر موضوعات وابسته به مدیریت حوزه آبخیز
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات