این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
مجله دانشکده پزشکی اصفهان، جلد ۱، شماره ۱، صفحات ۹۸-۱۰۳

عنوان فارسی ارزیابی و به کارگیری مدل‌های مختلف طبقه‌بندی به منظور استخراج ژن‌های شاخص مرتبط با عود سرطان سینه از داده‌های میکرو‌آرایه
چکیده فارسی مقاله مقدمه: در این پژوهش، سعی شد تا با به کارگیری مؤثر الگوریتم‌های محاسباتی و مدل‌های ریاضی، اعتبار ژن‌های شاخص مستخرج از داده‌های میکروآرایه و تفسیرپذیری آن‌ها در مطالعات زیستی بهبود یابد. روش‌ها: ابتدا، بهترین مدل طبقه‌بند با هدف دستیابی به بیشترین صحت پیش‌بینی عود سرطان سینه در داده‌های بیان ژن میکروآرایه انتخاب شد. بدین منظور، از داده‌های بیان 50 ژن شاخص مربوط به تومور سینه در 1271 بیمار مبتلا به سرطان (379 نفر با عود سرطان و 892 نفر بدون عود) استفاده شد و با مقایسه‌ی عملکرد چند طبقه‌بند مطرح بر روی این ژن‌ها، یک سیستم پیش‌بین مناسب برای عود به دست آمد. در این راستا، ابتدا به منظور افزایش صحت از طریق کاهش بعد و انتخاب مناسب‌ترین ژن‌ها (ویژگی‌ها) روش‌های Correlation-based feature selection (CFS)، Principal component analysis (PCA)، Independent component analysis (ICA)، الگوریتم ژنتیک (GA یا Genetic algorithm) و همچنین، روش انتخاب تصادفی چند ویژگی در ترکیب با انواع مدل‌های طبقه‌بند مورد بررسی قرار گرفت. یافته‌ها: در مجموع، 5 ژن شاخص از ترکیب روش الگوریتم ژنتیک، روش Top scoring set (TSS) و انتخاب تصادفی ژن‌ها انتخاب شدند که در اغلب طبقه‌بند‌ها، بهترین نتایج را داشتند. 5 ژن‌ شاخص نهایی شامل TRIP13، KIF20A، NEK2، RACGAP1 و TYMS، به صورت معنی‌داری در ساختمان Microtubule و Spindle شرکت داشتند و فرایند زیستی اتصال میکروتوبول‌های Spindle به Kinetochore را تنظیم می‌کردند. نتیجه‌گیری: با استفاده از مدل‌های ترکیبی، علاوه بر اجتناب از بروز خطای انطباق بیش از حد مدل بر داده‌های آموزش، می‌توان به صحت مناسب با ژن‌های شاخصی که از نظر زیست‌شناسی معنی‌دار و تفسیرپذیر باشند، دست پیدا کرد.
کلیدواژه‌های فارسی مقاله

عنوان انگلیسی Evaluation of Different Classification Models to Extract Gene Signatures for Breast Cancer Recurrence Using Microarray Data
چکیده انگلیسی مقاله Background: In this study, we aimed to improve the reliability and biological interpretability of gene signatures selected from microarrays by efficient usage of computational models and mathematical algorithms. Methods: At the first step, a good model with high accuracy was chosen to predict cancer recurrence in microarray gene expression data on breast tumors. In this regard, microarray gene expression data of breast tumor in 1271 cancer patients (379 with recurrence and 892 people without recurrence) were utilized to construct an appropriate predictive model for recurrence by comparing the performance of multiple classifiers. In the pre-processing stage, different methods like correlation-based feature selection (CFS), principal component analysis (PCA), independent component analysis (ICA), and genetic algorithm as well as a random selection method were used to reduce the dimensions and choose the most appropriate genes (features). Findings: A total of five gene signatures were selected by combining genetic algorithm, top scoring set (TSS), and random selection method, which showed the best results in most classification models. The final indicator genes were TRIP13, KIF20A, NEK2, RACGAP1 and TYMS, which had significant contribution in the structure of microtubules and spindle and also regulated the attachment of spindle microtubules to kinetochore. Conclusion: By using hybrid models, we can avoid overfitting in training and achieve acceptable accuracy with biologically interpretable genes.
کلیدواژه‌های انگلیسی مقاله

نویسندگان مقاله محمدرضا صحتی | mohammad reza
گروه مهندسی الکترونیک، مؤسسه ی علوم و فن آوری سپاهان، اصفهان، ایران

مینا کاید | کاید



نشانی اینترنتی http://jims.mui.ac.ir/index.php/jims/article/view/7469
فایل مقاله اشکال در دسترسی به فایل - ./files/site1/rds_journals/103/article-103-431990.pdf
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده
نوع مقاله منتشر شده مقاله پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات