پردازش علائم و داده ها، جلد ۱۹، شماره ۱، صفحات ۰-۰

عنوان فارسی استخراج رابطه مبتنی بر تعبیه لغات با فرآیند جمع سپاری
چکیده فارسی مقاله  برای انجام مطالعات داده کاوی، بعضا به دلیل پیچیده بودن فرآیند انتخاب ویژگی در کار مورد نظر، نیاز داریم تا بخشی از برچسب زنی را به کارگران در فعالیت جمع­سپاری واگذار کنیم. فرآیند واگذاری کارهای داده کاوی به کاربران، اغلب توسط سیستم های نرم افزاری و بدون اطلاع دقیق از موقعیت سنی یا جغرافیای محل سکونت کاربران صورت می گیرد. عدم اطمینان از عملکرد کاربران مجازی در جمع­ سپاری، میزان صحت اطلاعات دریافتی را کاهش می دهد. در این مقاله پیشنهاد داده ایم تا با استفاده از روش های ایجاد انگیزش، تعدادی از مردم را در محلی جمع کرده و از آنها در جهت وظایف جمع­سپاری استفاده کنیم. افزایش دقت در اعلام نتایج بدلیل حضور فیزیکی، سرعت بالا در گرفتن نتایج با دقت بالا در زمان تعیین شده، تحصیلات مناسب شرکت کنندگان در فعالیت و بومی بودن طرح اجرایی از ویژگی­های این پژوهش می باشند. در این پژوهش یک کار یادگیری ماشین انجام شد تا بتوانیم در ضمن آن فعالیت­های جمع سپاری را با الگوریتم­های شبکه عصبی عمیق ترکیب نماییم.  وظیفه کلاس بندی برای تعبیه لغات بصورت الگوریتمی و تلفیقی با کمک جمع سپاری انجام می­شود. روش پیشنهادی با افزودن داده های جمع سپار به داده های قبلی و تغییرات در مدل تعبیه لغات ترکیبی گلاو و وردتووک  توانست نتایج مناسبی در استخراج ویژگی بدست بیاورد.
کلیدواژه‌های فارسی مقاله جمع سپاری، تعبیه لغات، گلاو، وردتووک، طبقه بندی

عنوان انگلیسی Perform Three Data Mining Tasks with Crowdsourcing Process
چکیده انگلیسی مقاله For data mining studies, because of the complexity of doing feature selection process in tasks by hand, we need to send some of labeling to the workers with crowdsourcing activities. The process of outsourcing data mining tasks to users is often handled by software systems without enough knowledge of the age or geography of the users' residence. Uncertainty about the performance of virtual users in crowdsourcing reduces the accuracy of the received information. In this article, we propose to gather a number of people in a university and apply them for the small gathering tasks by using incentive methods. Increased accuracy in announcing results due to physical presence, high speed of obtaining high precision results at designated time, appropriate education of participants in the activity, and native implementation plan are characteristics of this study. In this study, three classifications are used to classify word embedding as well as the process of motivation to provide standard data by the crowd source. In the first task we use convolutional neural network, for doing classification in six classes: USAGE, TOPIC, COMPARE, MODEL-FEATURE, RESULT and PART-WHOLE. This article extracts the data from the abstract of 400 scientific articles and it is a total of 835 relations. One hundred of these abstracts have been selected by the crowdsourcing. Classification results in this article have been done with a slight improvement in accuracy. In the second task, classification is done by crowdsourcing on the result of a combine word embedding system. Glove and Word2vec are two of the most popular word embedding algorithms. These two algorithms have been used separately in different machine learning applications. In ad innovation was created word embedding with using a combination of glove and word2vec. In this study, we computed the classification results on a combination of vocabulary vectors with using of 450 abstract relation data (100 crowd source datasets with 350 standards). The results of the implementation of the classification algorithm give us performance improvement. The third task was to completing the process of installing the mobile applications. One of the problems with data mining is the lack of standard data. The high cost of data preparation on the one hand and the lack of a suitable population for specialized tasks have led to the design of software for doing these processes. But these methods have no incentive to install the software and often fail due to the lack of crowd workers or more precisely, lack of specialist workers. In another process, we have installed the app into this collection of specialist science people. This smart population has reduced costs and time for doing data mining processes in the future. People can make the move towards the regulation of social activity at a given time and place by the capacity created by ICT to work on a large scale. Creating a social campaign will benefit users on mobile social networks. Scientists can benefit from the capacity created by crowdsourcing in ICT and make movement to regularize social activities at specific time and place. Creating social campaign will help to form new society. The smart population created in this article was an innovation or startup in the field of event organizing that used the attention of people to the day issues as well as the importance of watching competition. This paper uses the population power to perform preparing data mining works.  
کلیدواژه‌های انگلیسی مقاله Glove, Word2vec, Crowdsourcing, word embedding, classification

نویسندگان مقاله محمد جعفرآباد | mohammad jafarabad
University of Qom
دانشگاه قم

روح الله دیانت | Rouhollah Dianat
University of Qom
دانشگاه قم


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-1944-1&slc_lang=fa&sid=1
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات