این سایت در حال حاضر پشتیبانی نمی شود و امکان دارد داده های نشریات بروز نباشند
ارمغان دانش، جلد ۲۹، شماره ۳، صفحات ۰-۰

عنوان فارسی طبقه بندی خودکار BI-RADS در گزارش های ماموگرافی با استفاده از تلفیق داده
چکیده فارسی مقاله زمینه و هدف: هدف اصلی این مقاله ارائه یک سیستم طبقه‌بندی خودکار با استفاده از روش‌های یادگیری ماشین و تلفیق‌داده می‌باشد که قادر است با دقت بالا و بطور یکپارچه درجه BI-RADS را مشخص کند.

روش بررسی: در این تحقیق، روش جدیدی برای استخراج خودکار طبقه‌بندی BI-RADS از گزارش‌های متنی پیشنهاد شده است. ابتدا برای انتخاب کلمات‌کلیدی از گزارش‌های متنی پزشکی، از واژگان ماموگرافی استفاده شد. سپس از تکنیک تبدیل کلمه به بردار به نام Word2Vec و همچنین از یک روش فراوانی وزنی کلمات کلیدی به نام TFIDF برای استخراج ویژگی‌ها استفاده شد که نهایتاً، با گزارش‌های سیستم اطلاعات بیمارستان (HIS) تلفیق شدند. از طبقه‌بندی‌کننده‌های مختلفی مانند شبکه‌های عصبی پیچشی، پرسپترون چندلایه، درخت تصمیم و k-نزدیک‌ترین همسایه استفاده شد که برای مقایسه آنها، روش‌های با استفاده از HIS و بدون استفاده از HIS مورد بررسی قرار گرفتند.

 
یافته‌ها: نتایج تأیید می‌کند رویکرد پیشنهادی یعنی استفاده از Word2Vec به همراه TFIDF و تلفیق آن‌ها با HIS تأثیر قابل‌توجهی بر دقت طبقه‌بندی متون پزشکی دارد. برای طبقه‌بندی سطح BI-RADS از بردارهای خروجی Word2Vec در زمانی که از TFIDF استفاده می‌شود و یا بدون استفاده از TFIDF و همچنین با تلفیق HIS و نیز بدون HIS برای طبقه‌بندی‌کننده‌های شبکه عصبی پیچشی، پرسپترون چندلایه، درخت تصمیم و k-نزدیک‌ترین همسایه استفاده شد و نتایج توسط معیارهای ارزیابی دقت، ویژگی، حساسیت، ارزش پیش‌بینی شده مثبت، ارزش پیش‌بینی شده منفی و امتیاز f1 با هم مقایسه شدند. نتایج نشان می‌دهد که بهترین دقت در روش پیشنهادی با طبقه‌بندی‌کننده پرسپترون چندلایه برابر با %98/74 می‌باشد اما بدون HIS دقت همین طبقه‌بندی‌کننده برابر با %92/23 بدست آمد.

نتیجه‌گیری: ترکیب Word2Vec با TFIDF می‌تواند دقت طبقه‌بندی متن را افزایش دهد، اما سابقه پزشکی که در تشخیص بیماری مهم است، می‌تواند دقت را بهبود ببخشد. نتایج نشان می‌دهد نباید صرفاً بر روی گزارشات پزشکی تمرکز کرد و از سایر اطلاعات بالینی و سابقه بیماران نیز باید استفاده کرد. بنابراین استفاده از HIS در کنار گزارش‌های پزشکی می‌تواند طبقه‌بندی BI-RADS را بهبود ببخشد و تأثیر مثبتی بر تشخیص و فرآیندهای درمانی داشته باشد.
کلیدواژه‌های فارسی مقاله طبقه‌بندی متون پزشکی، سرطان پستان، استخراج ویژگی، BIRADS، HIS

عنوان انگلیسی Automatic classification of BI-RADS in mammography reports using data fusion
چکیده انگلیسی مقاله

Introduction: The principal objective of this paper is to propose an automated classification system using machine learning techniques and data fusion, to identify BI-RADS categories with high precision and integration.
 

Methods: In this research, a novel method for automatic extraction of BI-RADS classification from text reports is proposed. At first, mammography vocabulary is used to select keywords from medical text reports. Word2Vec and TFIDF techniques were used to extract features, and finally, they were combined with Hospital Information System (HIS) reports. Different classifiers such as convolutional neural networks (CNN), multilayer perceptron (MLP), decision tree (DT), and k-nearest neighbor (k-NN) were used to compare their accuracy with and without HIS investigation.

Results: The results confirm that the proposed approach, namely the use of Word2Vec combined with TFIDF, and their integration with HIS, has a significant impact on the accuracy of medical text classification. The output vectors of Word2Vec were used for BI-RADS level classification when TFIDF is applied or not applied, as well as with and without the integration of HIS, for classifiers such as CNN, MLP, DT, and k-NN, and the results were compared using evaluation measures such as accuracy, precision, sensitivity, positive predictive value, negative predictive value, and F1 score. The results show that the best accuracy with the proposed method using the multilayer perceptron classifier is 98.74%, but without HIS, the accuracy for the same classifier is 92.23%.

Conclusion: By combining Word2Vec with TFIDF, the accuracy of text classification can be increased, but the medical history of patients is important in the diagnosis of disease and can improve the accuracy. The results show that one should not focus only on medical reports and other clinical information and patients' history should also be used. Therefore, the use of HIS along with medical text reports can improve BI-RADS classification and have a positive effect on diagnosis and treatment processes.

کلیدواژه‌های انگلیسی مقاله medical text classification, breast cancer, feature extraction, BIRADS, HIS

نویسندگان مقاله محمد ذهابی | Mohammad Zahaby
گروه مهندسی کامپیوتر، واحد بروجرد، دانشگاه آزاد اسلامی، بروجرد، ایران

محمد ابراهیم شیری | Mohammad Ebrahim Shiri
1 گروه مهندسی کامپیوتر، واحد بروجرد، دانشگاه آزاد اسلامی، بروجرد، ایران 2 گروه ریاضی و علوم کامپیوتر، دانشگاه صنعتی امیرکبیر، تهران، ایران

حمید حاج سید جوادی | Hamid Haj Seyyd Javadi
گروه ریاضی و علوم کامپیوتر، دانشگاه شاهد، تهران، ایران

مصطفی برومندزاده | Mostafa Boroumandzadeh
دانشکده فنی و مهندسی، گروه مهندسی کامپیوتر و فناوری اطلاعات، دانشگاه پیام نور، تهران، ایران


نشانی اینترنتی http://armaghanj.yums.ac.ir/browse.php?a_code=A-10-2878-1&slc_lang=fa&sid=1
فایل مقاله فایلی برای مقاله ذخیره نشده است
کد مقاله (doi)
زبان مقاله منتشر شده fa
موضوعات مقاله منتشر شده عمومی
نوع مقاله منتشر شده پژوهشی
برگشت به: صفحه اول پایگاه   |   نسخه مرتبط   |   نشریه مرتبط   |   فهرست نشریات