|
پردازش علائم و داده ها، جلد ۱۳، شماره ۲، صفحات ۹۱-۱۰۳
|
|
|
عنوان فارسی |
تشخیص لهجه های زبان فارسی از روی سیگنال گفتار با استفاده از روش های استخراج ویژگی کارآمد و ترکیب طبقه بندها |
|
چکیده فارسی مقاله |
تشخیص لهجه از روی شکل موج گفتار یکی از شاخه های نسبتا جدید در علم پردازش گفتار است.تشخیص لهجه می تواند تا حد زیادی باعث بهبود سیستم های بازشناخت گفتار شود.همانند هر سیستم بازشناسی، فرآیند تشخیص لهجه نیز شامل سه مرحله پیش پردازش، استخراج ویژگی و طبقه بندی است.در این مقاله سه روش کارآمد استخراج ویژگی شامل دامنه مرکزی طیفی (SCM) ، مشتق اول آن (∆SCM) و تبدیل Zak روی سیگنال گفتار اعمال شده اند و کارآیی این روش ها با روش های متدوال استخراج ویژگی مانند ضرایب مل-کپستروم و مشتقات آن مقایسه شده است. علاوه بر این یک ویژگی جدید که با ایجاد تغییراتی در الگوریتم محاسبه ضرایب مل-کپستروم به دست می آید برای تشخیص لهجه ها در محیط های نویزی معرفی گردیده است. برای مرحله طبقه بندی از پنج طبقه بند مختلف، شامل MLP ، KNN ، PNN ، RBF و SVM و ترکیب این طبقه بندها با یکدیگر استفاده شده است.نتایج آزمایش ها بیانگر بهبود نرخ بازشناسی لهجه ها با روش های پیشنهادی هستند. |
|
کلیدواژههای فارسی مقاله |
|
|
عنوان انگلیسی |
Farsi Accent Recognition based on speech signal using efficient features extraction and Combining of Classifiers |
|
چکیده انگلیسی مقاله |
Speech recognition has achieved great improvements recently. However, robustness is still one of the big problems, e.g. performance of recognition fluctuates sharply depending on the speaker, especially when the speaker has strong accent and difference Accents dramatically decrease the accuracy of an ASR system. In this paper we apply three new methods of feature extraction including Spectral Centroid Magnitude (SCM), its first order difference (∆SCM ) and Zak transformation to the original speech signal using accents selected from FARSDAT corpus then their performance of these methods have been compared with some common methods such as MFCC. Moreover a new feature based on MFCC algorithm have been proposed in order to use in noisy environments. Five different classifications, including MLP, KNN, PNN, RBF and SVM and their combination have been used to evaluate the performance of each feature extraction methods. Experimental results demonstrate improvement in the recognition rates in our proposed method. |
|
کلیدواژههای انگلیسی مقاله |
|
|
نویسندگان مقاله |
مجتبی شریف نوقابی | mojtaba sharif noughabi گناباد نوقاب خ وحدت غربی وحدت 21 پلاک 4
حسین مروی | hossein marvi دانشگاه شاهرود- دانشکده مهندسی برق- گروه الکترونیک سازمان اصلی تایید شده: دانشگاه شاهرود (Shahrood university)
دانیال دارابیان | danial darabian نیشابور
|
|
نشانی اینترنتی |
http://jsdp.rcisp.ac.ir/browse.php?a_code=A-10-470-2&slc_lang=fa&sid=fa |
فایل مقاله |
اشکال در دسترسی به فایل - ./files/site1/rds_journals/1315/article-1315-233320.pdf |
کد مقاله (doi) |
|
زبان مقاله منتشر شده |
fa |
موضوعات مقاله منتشر شده |
مقالات پردازش گفتار |
نوع مقاله منتشر شده |
پژوهشی |
|
|
برگشت به:
صفحه اول پایگاه |
نسخه مرتبط |
نشریه مرتبط |
فهرست نشریات
|