این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
مدلسازی در مهندسی، جلد ۱۴، شماره ۴۷، صفحات ۲۴۳-۲۵۴

عنوان فارسی بسط پرس وجو با خوشه بندی اسناد شبه بازخورد با شباهت حساس به پرس وجو
چکیده فارسی مقاله بسط پرس‌وجو به‌عنوان یکی از روش‌های انطباق پرس‌وجو، اثربخشی جستجو را در بازیابی اطلاعات افزایش می‌دهد. بازخورد شبه مرتبط (PRF) روشی برای بسط پرس‌وجو است که فرض می‌کند اسناد رتبه بالا از نتایج اولیه مرتبط به موضوع پرس‌وجو هستند و کلمات بسط را از این اسناد انتخاب می‌کند. درحالی‌که ممکن است اسناد نامرتبط به پرس‌وجو در اسناد رتبه‌بالا وجود داشته باشد. روش‌هایی برای انتخاب اسناد مرتبط و نادیده گرفتن اسناد خطا از اسناد رتبه‌بالا ارائه‌شده است که از خوشه‌بندی و یا طبقه‌بندی اسناد استفاده کرده‌اند. مهم‌ترین موضوع در بسط پرس‌وجو، انتخاب کلمات بسط از مرتبط-ترین اسناد است. در این مقاله ما خوشه‌بندی اسناد شبه بازخورد را براساس شباهت حساس به پرس‌وجو ارائه می‌کنیم که در قرار دادن شبیه‌ترین اسناد در کنار هم مؤثر است. شباهت حساس به پرس‌وجو که نسبت به شباهت مبتنی بر کلمه نتایج بهتری را در بازیابی اسناد بدست آورده است، دلیل استفاده در این مقاله است. خوشه‌ها را مطابق با شباهت درونی‌شان رتبه‌بندی کرده و تعدادی از خوشه‌های رتبه‌بالا را برای بسط انتخاب می‌کنیم. کلمات بسط را از اسناد خوشه‌های انتخاب‌شده، براساس تابع رتبه‌بندی TF-IDF استخراج می‌کنیم. آزمایش‌های انجام‌شده روی مجموعه‌داده‌ی پزشکی MED نشان می‌دهد که نتایج جستجو برای پرس‌وجوهای بسط‌داده‌شده با اسناد انتخاب‌شده از خوشه‌ها، نسبت به روش بازخورد شبه مرتبط (PRF) و بازیابی اولیه (VSM) بهتر است و اثربخشی جستجو را افزایش می‌دهد.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Query expansion using the clustering of pseudo relevant documents with query sensitive similarity
چکیده انگلیسی مقاله Query expansion as one of query adaptation approaches, improves retrieval effectiveness of information retrieval. Pseudo-relevance feedback (PRF) is a query expansion approach that supposes top-ranked documents are relevant to the query concept, and selects expansion terms from top-ranked documents. However, Existing of irrelevant document in top-ranked documents is possible. Many approaches have been proposed for selecting relevant documents and ignoring irrelevant ones, which use clustering or classification of documents. Important issue in query expansion approaches is using relevant documents for selecting expansion terms. In this paper, we propose clustering of pseudo-relevant documents based on query sensitive similarity, which is efficient for placing similar documents together. Query sensitive similarity obtained good results in document retrieval rather than term-based similarity, is the reason for using in this paper. Clusters are ranked based on inner similarity, and some top ranked ones are selected for query expansion. Then, we extract expansion terms from documents of selected clusters based on Term Frequency- Inverse document frequency (TF-IDF) scoring function. Conducted experiments over Medicine dataset (MED) shows that retrieval results for expanded queries with selected documents from clusters is better than basic retrieval (VSM) and Pseudo-relevance feedback. In addition, the effectiveness of retrieval is raised.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله رضا خدایی |
دانشگاه تبریز
سازمان اصلی تایید شده: دانشگاه تبریز (Tabriz university)

محمدعلی بالافر | mohammad ali
دانشگاه تبریز
سازمان اصلی تایید شده: دانشگاه تبریز (Tabriz university)

سیدناصر رضوی | seyed naser
دانشگاه تبریز
سازمان اصلی تایید شده: دانشگاه تبریز (Tabriz university)


نشانی اینترنتی http://modelling.journals.semnan.ac.ir/article_2529_a8ea5f444f419338e48e0bac2053d423.pdf
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/1058/article-1058-457307.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات