این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
پردازش علائم و داده ها، جلد ۱۲، شماره ۲، صفحات ۱۳-۲۲

عنوان فارسی شناسائی رابطه تقابل در گفتمان فارسی به کمک روش های یادگیری باسرپرستی
چکیده فارسی مقاله گفتمان به هر قطعه یا پاره‌ای از زبان گفته می‌شود که به قصد برقراری ارتباط به کار برده شده باشد‌. سیستم شناسایی روابط موجود در گفتمان سیستمی است که می‌تواند روابط موجود بین واحدهای متنی یک گفتمان را شناسایی کند. یکی از روابط موجود در گفتمان‌های زبان فارسی رابطه تقابل است که شناسایی آن به توانائی تولید و درک گفتمان کمک می-کند و در سیستم‌های متعددی مانند خلاصه‌ساز، تفسیر و... کاربرد دارد. این رابطه در یک گفتمان می‌تواند به کمک نقش-نماهای خاص رابطه تقابل مانند "اما" و "ولی" شناسایی شود؛ اما در بعضی موارد این نقش‌نماها حذف می‌شوند و شناسایی رابطه را با مشکل مواجه می‌کنند. لذا به منظور شناسایی این رابطه، از ویژگی‌هائی مانند زمان فعل‌ها، جفت کلمات و ... استفاده شد. بدین منظور و پس از گردآوری 5000 نمونه رابطه تقابل و 5000 نمونه سایر روابط از مجموعه داده پژوهشکده هوشمند علائم، برای هر نمونه بردار ویژگی تشکیل داده شد و در نهایت برای دسته‌بندی و تشخیص رابطه تقابل از چند روش‌ یادگیری باسرپرستی شامل ماشین بردار پشتیبان ، نزدیکترین همسایه، پنجره پارزن و همچنین ترکیب این دسته-بندها استفاده شد. که بهترین میزان صحت 87.13 و مربوط به ترکیب دسته‌بندها در بهترین حالت می‌باشد
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Contrast Relation Recognition in Persian discourse using supervised learning methods
چکیده انگلیسی مقاله Discourse is a part of language that intend is used to communicate. A discourse relation recognition system can identify one or more relation between the textual units in a discourse. Like other languages, Contrast relation is a one of the available relations in Persian discourse. Contrast relation recognition in discourse is useful for generation and perception of discourse, paraphrasing and summarization systems and et al. This relation in one discourse is often detected by discourse marker such as “اما” and “ولی”, But in some situation these markers are removed and relation recognition is difficult. For this reason we have proposed to use of some feature for relation recognition. These features are: tense of verbs, word pairs, and et al. In this paper, a Corpus of Research Center of Intelligent Signal Processing has been used to collect 5000 instances of contrast and 5000 other relations then created feature vector for each instance. We used three supervised methods for classification: SVM, KNN ,Parzen Window and combine of this classifiers. Finally, the best result achieved by combine classifier that accuracy is 87.13.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله حبیب خدادادی | habib khodadadi
islamic azad university
دانشگاه آزاد اسلامی واحد میناب
سازمان اصلی تایید شده: دانشگاه آزاد اسلامی علوم و تحقیقات (Islamic azad university science and research branch)

سعید راحتی قوچانی | saeed rahati quchani
islamic azad university
دانشگاه آزاد اسلامی واحد مشهد
سازمان اصلی تایید شده: دانشگاه آزاد اسلامی مشهد (Islamic azad university of mashhad)

اعظم استاجی | azam estaji
ferdowsi university
دانشگاه فردوسی مشهد
سازمان اصلی تایید شده: دانشگاه فردوسی (Ferdowsi university)


نشانی اینترنتی http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-272-1&slc_lang=fa&sid=fa
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-233353.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده مقالات پردازش متن
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات