Using convolutional neural networks to detect the tumor size and lymph node metastasis of colon cancer patients in MRI
Subject Areas : Biomedical Engineering
Mohammadreza Hedyehzadeh
1
*
,
Mahdi Yousefi
2
1 - Department of Biomedical Engineering, Dezful Branch, Islamic Azad University, Dezful, Iran
2 - Department of Electrical Engineering, Najafabad branch, Islamic Azad University, Najafabad, Iran
Keywords: Colon cancer, VGG-16, Magnetic resonance imaging, Tumor size, Lymph node metastasis,
Abstract :
Colon cancer is the third most common cancer from all cancers in 2020. In determining the appropriate treatment, the oncologist has to know the stage of the tumor, which is the most common method of the “Tumour, Node, Metastasis” staging system. Therefore, in this study, an attempt is made to estimate the size of the tumor and the extent of its spread to the lymph nodes with the help of magnetic resonance images. The data of this study was collected from the TCIA portal and in the first processing step, after improving the image quality, segmentation was done to separate the tumor region from the whole image. In this study, in order to extract and classify the features, the convolutional neural network VGG-16 was used and for the validation, the 10-fold method was applied. The results of this study indicate an accuracy of 94.2%, which is better than pathological and CT methods with accuracy of 91% and 77%. It should be noted that the effectiveness of the implemented algorithm in separating the 1st class was higher than the other class. Still, no significant difference was seen between the average values of the parameters in the three classes.
[1] V. Mahadevan, “Anatomy of the caecum, appendix and colon,” Surg., vol. 38, no. 1, pp. 1–6, 2020. https://doi.org/10.1016/j.mpsur.2019.10.017
[2] P. Boyle and J. S. Langman, “ABC of colorectal cancer: Epidemiology,” BMJ Br. Med. J., vol. 321,
no. 7264, p. 805, 2000. https://doi.org/10.1136/sbmj.0012452
[3] M. Araghi et al., “Global trends in colorectal cancer mortality: projections to the year 2035,” Int. J. cancer, vol. 144, no. 12, pp. 2992–3000, 2019. https://doi.org/10.1002/ijc.32055
[4] M. S. Hossain et al., “Colorectal cancer: a review of carcinogenesis, global epidemiology, current challenges, risk factors, preventive and treatment strategies,” Cancers (Basel)., vol. 14, no. 7, p. 1732, 2022. https://doi.org/10.3390/cancers14071732
[5] Y. Xi and P. Xu, “Global colorectal cancer burden in 2020 and projections to 2040,” Transl. Oncol., vol. 14, no. 10, p. 101174, 2021. https://doi.org/10.1016/j.tranon.2021.101174
[6] M. L. H. Ong and J. B. Schofield, “Assessment of lymph node involvement in colorectal cancer,” World J. Gastrointest. Surg., vol. 8, no. 3, p. 179, 2016. https://doi.org/ 10.4240/wjgs.v8.i3.179
[7] D. Tamandl, T. Mang, and A. Ba-Ssalamah, “Imaging of colorectal cancer–the clue to individualized treatment,” Innov. Surg. Sci., vol. 3, no. 1, pp. 3–15, 2018. https://doi.org/10.1515/iss-2017-0049
[8] R. Vikram and R. B. Iyer, “PET/CT imaging in the diagnosis, staging, and follow-up of colorectal cancer,” Cancer Imaging, vol. 8, no. Spec Iss A, p. S46, 2008. https://doi.org/10.1102/1470-7330.2008.9009
[9] M. Tharwat, N. A. Sakr, S. El-Sappagh, H. Soliman, K.-S. Kwak, and M. Elmogy, “Colon cancer diagnosis based on machine learning and deep learning: Modalities and analysis techniques,” Sensors, vol. 22, no. 23, p. 9250, 2022. https://doi.org/10.3390/s22239250
[10] L. Buk Cardoso et al., “Machine learning for predicting survival of colorectal cancer patients,” Sci. Rep., vol. 13, no. 1, p. 8874, 2023. https://doi.org/10.1038/s41598-023-35649-9
[11] B. Burnett et al., “Machine Learning in Colorectal Cancer Risk Prediction from Routinely Collected Data: A Review,” Diagnostics, vol. 13, no. 2, p. 301, 2023. https://doi.org/10.3390/diagnostics13020301
[12] H. Abdul Rahman, M. A. Ottom, and I. D. Dinov, “Machine learning-based colorectal cancer prediction using global dietary data,” BMC Cancer, vol. 23, no. 1, p. 144, 2023 https://doi.org/10.1186/s12885-023-10587-x
[13] C. B. Finn et al., “Development of a Machine Learning Model to Identify Colorectal Cancer Stage in Medicare Claims,” JCO Clin. Cancer Informatics, vol. 7, p. e2300003, 2023. https://doi.org/10.1200/CCI.23.00003
[14] H. M. Bülbül, G. Burakgazi, and U. Kesimal, “Preoperative assessment of grade, T stage, and lymph node involvement: machine learning-based CT texture analysis in colon cancer,” Jpn. J. Radiol., pp. 1–8, 2023. https://doi.org/10.1007/s11604-023-01502-2
[15] R. Awan et al., “Glandular morphometrics for objective grading of colorectal adenocarcinom
histology images,” Sci. Rep., vol. 7, no. 1, p. 16852, 2017. https://doi.org/10.1038/s41598-017-16516-w
[16] N. Ito, H. Kawahira, H. Nakashima, M. Uesato, H. Miyauchi, and H. Matsubara, “Endoscopic diagnostic support system for cT1b colorectal cancer using deep learning,” Oncology, vol. 96, no. 1, pp. 44–50, 2018. https://doi.org/10.1159/000491636
[17] J. Jian et al., “Fully convolutional networks (FCNs)-based segmentation method for colorectal tumors on T2-weighted magnetic resonance images,” Australas. Phys. Eng. Sci. Med., vol. 41, pp. 393–401, 2018. https://doi.org/10.1007/s13246-018-0636-9
[18] J. Kim et al., “Rectal cancer: Toward fully automatic discrimination of T2 and T3 rectal cancers using deep convolutional neural network,” Int. J. Imaging Syst. Technol., vol. 29, no. 3, pp. 247–259, 2019. https://doi.org/10.1002/ima.22311
[19] J. Li, P. Wang, Y. Zhou, H. Liang, and K. Luan, “Different machine learning and deep learning methods for the classification of colorectal cancer lymph node metastasis images,” Front. Bioeng. Biotechnol., vol. 8, p. 620257, 2021. https://doi.org/10.3389/fbioe.2020.620257
[20] M. Yousefi and M. Hedyehzadeh, “Recurrence Detection of Non-small cell Lung Cancer (NSCLC) Tumors Using Imaging and Clinical Features,” J. Heal. Biomed. Informatics, vol. 9, no. 1, pp. 40–49, 2022.
[21] M. Hedyehzadeh, K. Maghooli, M. MomenGharibvand, and S. Pistorius, “A Comparison of the Efficiency of Using a Deep CNN Approach with Other Common Regression Methods for the Prediction of EGFR Expression in Glioblastoma Patients,” J. Digit. Imaging, 2020, https://doi.org/10.1007/s10278-019-00290-4.
[22] M. Hedyehzadeh, K. Maghooli, and M. MomenGharibvand, “Glioma grade detection using grasshopper optimization algorithm‐optimized machine learning methods: The Cancer Imaging Archive study,” Int. J. Imaging Syst. Technol., vol. 31, no. 3, pp. 1670–1677, 2021. https://doi.org/10.1002/ima.22536
[23] M. Hedyehzadeh, S. Y. D. Nezhad, and N. Safdarian, “EVALUATION OF CONVENTIONAL MACHINE LEARNING METHODS FOR BRAIN TUMOUR TYPE CLASSIFICATION,” COMPTES RENDUS L Acad. Bulg. DES Sci., vol. 73, no. 6, pp. 856–865, 2020. https://doi.org/10.7546/CRABS.2020.06.14
[24] M. Hedyehzadeh, J. Pu, S. Leilizadeh, S. Gezer, C. Dresser, and C. A. Beeche, “A Comparison of Deep and Conventional Regression Methods for MRI-Based Estimation of Survival Time in GBM Patients,” Available SSRN 4001112. https://doi.org/10.2139/ssrn.4001112
[25] A. Achak and M. Hedyehzadeh, “Determining the Differentiation of Benign and Malignant NME Lesions in Contrast-Enhanced Spectral Mammography Images Based on Convolutional Neural Networks,” J. Med. Biol. Eng., vol. 43, no. 5, pp. 585–595, 2023. https://doi.org/10.1007/s40846-02300814-y
[26] M. Hedyehzadeh and M. Yousefi, “Application of Machine Learning Methods to Predict the Survival Rate of Glioblastoma Patients Using MR Images,” J. Heal. Biomed. Informatics, vol. 11, no. 1, pp. 1–13, 2024. https://doi.org/10.34172/jhbmi.2024.09
[27] A. Achak and M. Hedyehzadeh, “Assessing the Efficiency of Deep Learning Methods in Estimating the Malignancy of Bi-Rads 4 Breast Lesions Using Contrast-enhanced Spectral Mammography Images,” Qom Univ. Med. Sci. J., vol. 17, no. 1, p. 0, 2023. https://doi.org/10.32598/qums.17.2756.1
[28] K. Clark et al., “The Cancer Imaging Archive (TCIA): maintaining and operating a public information repository,” J. Digit. Imaging, vol. 26, pp. 1045–1057, 2013. https://doi.org/10.1007/s10278-013-9622-7
[29] M. Ito and F. Ino, “An Automated Method for Generating Training Sets for Deep Learning based Image Registration.,” in BIOIMAGING, 2018, pp. 140–147. https://doi.org/10.5220/0006634501400147
Using convolutional neural networks to detect the tumor …/ Hedyehzadeh and Yousefi
Using convolutional neural networks to detect the tumor size and lymph node metastasis of colon cancer patients in MRI
Mohammadreza Hedyehzadeh*1,2, Mahdi Yousefi3,4
1 Department of Biomedical Engineering, Dezful Branch, Islamic Azad University, Dezful, Iran
2 School of Medicine, Dezful University of Medical Sciences, Dezful, Iran,
3 Young Researchers and Elite Club, Ahvaz Branch, Islamic Azad University, Ahvaz, Iran.
4 Department of Electrical Engineering, Najafabad branch, Islamic Azad University, Najafabad, Iran.
Abstract: Colon cancer is the third most common cancer from all cancers in 2020. In determining the appropriate treatment, the oncologist has to know the stage of the tumor, which is the most common method of the “Tumour, Node, Metastasis” staging system. Therefore, in this study, an attempt is made to estimate the size of the tumor and the extent of its spread to the lymph nodes with the help of magnetic resonance images. The data of this study was collected from the TCIA portal and in the first processing step, after improving the image quality, segmentation was done to separate the tumor region from the whole image. In this study, in order to extract and classify the features, the convolutional neural network VGG-16 was used and for the validation, the 10-fold method was applied. The results of this study indicate an accuracy of 94.2%, which is better than pathological and CT methods with accuracy of 91% and 77%. It should be noted that the effectiveness of the implemented algorithm in separating the 1st class was higher than the other class. Still, no significant difference was seen between the average values of the parameters in the three classes.
Keywords: Colon cancer, VGG-16, Magnetic resonance imaging, Tumor size, Lymph node metastasis
JCDSA, Vol. 2, No. 4, Winter 2025 | Online ISSN: 2981-1295 | Journal Homepage: https://sanad.iau.ir/en/Journal/jcdsa |
Received: 2024-09-14 | Accepted: 2024-12-30 | Published: 2025-03-20 |
CITATION | Hedyehzadeh, M., Yousefi, M., "Using convolutional neural networks to detect the tumor size and lymph node metastasis of colon cancer patients in MRI", Journal of Circuits, Data and Systems Analysis (JCDSA), JCDSA, Vol. 2, No. 4, pp. 80-89, 2025. DOI: 10.82526/jcdsa.2025.1183895 | |
COPYRIGHTS
| ©2025 by the authors. Published by the Islamic Azad University Shiraz Branch. This article is an open-access article distributed under the terms and conditions of the Creative Commons Attribution 4.0 International (CC BY 4.0) |
* Corresponding author
Extended Abstract
1- Introduction
Colon cancer is the third most common cancer from all cancers in 2020. Stage and grade of the tumor are the important factors in the process of diagnosing and treating. Today, the most common method for determining the stage of a tumor is the “Tumour, Node, Metastasis” (TNM) staging system, in which M indicates the presence of metastasis (spread of the tumor to other tissues) in the body, N indicates the extent of spread to the lymph nodes, and T indicates the size of the tumor. Computed tomography (CT) and pathological imaging are two common methods which employed to determine T and N parameters. These imaging modalities have some disadvantages like, high absorbant dose of X-ray, need to invasive procedure and time consumption process. Therefore, it is very important to use an imaging modality which uses a safe procedure(without any dangerous ray), easy accessibility to determine the stage of colon cancer tumors. In this study, at the first the magnetic resonance images of the colon cancer patients will be collected, and after that, the preprocessing, image segmentation, feature extraction and classification using modern machine learning methods, would be other steps. Considering the above-mentioned issues, this study is innovative in several aspects, including the use of a safe imaging method without hazardous absorption dose to determine the tumor stage, the simultaneous determination of the two parameters T and N, and the improvement of the accuracy of the results compared to previous studies.
2- Methodology
Data collection is usually the first step in any research project, and in this study, 1312 MR images was collected from the TCIA portal. After that, in the preprocessing, converting the image formats from DICOM to JPG, histogram equalization to homogenize the gray level histogram and a manual segmentation to extract region of interest(tumor region) wass done. Feature extraction and classification are the most important parts of our workflow. In previous studies, various methods have been used for feature extraction, and in most of these studies predefined (Hand Crafted) features such as shape-based features, histogram-based features, first-order, second-order and higher-order statistical features have been used. The most important disadvantage of using hand-crafted features is that because these features are predetermined, they are ambiguous in terms of optimal number and quality.
In other words, the user has doubts about determining the number of features that can lead to the best classification result, while another doubt in choosing each of the features is that what guarantee is there that this feature is good and why should not go for other features? By reviewing previous studies, it can be noted that among all deep neural networks, the VGG-16 has excellent capabilities in feature extraction and classification from images due to its structure and activation functions used in its different layers. Therefore we used a CNN (VGG-16) to extract a vast variety of features from each image and classification. Another important point in the discussion of network evaluation is to examine the validation of networks in the training and testing phases. To achieve this goal, the data must first be divided into three parts: training, test, and validation, and then the 10-fold cross validation method was be used.
3- Results and discussion
It should be noted that the data in the database, consists of three categories, so the output layer of the VGG-16 network in this research is designed to have three output classes (T0N0, T3N1 and T3N2). Another important point in the context of using machine learning methods is the use of validation methods. In this study, the 10-fold cross validation method was used. Therefore, the accuracy, specificity, and sensitivity of the model in the ten repetitions must be obtained and their average reported. The values of the accuracy, specificity, and sensitivity of the model are 94.2%, 95.8%, and 96.4%.
4- Conclusion
This study was conducted to determine tumor size and lymph node involvement of colon cancer using magnetic resonance imaging in 1312 patients. The results of this study (94.2%) indicate that it is possible to simultaneously assess the extent of colon tumor spread to lymph nodes and metastasis without the use of carcinogenic imaging modalities such as CT and other invasive modalities such as endoscopy or pathology. It should be noted that in this study, the data were categorized into three categories based on the two parameters T and N, which is very common in clinical work. Therefore, it can be claimed that the method used, unlike previous studies that focused only on a specific group of patients (for example, only T1b), is able to examine a more general population of patients. Another innovation used in the study is the use of safe images without the risk of radiation.
استفاده از شبکههای عصبی کانولوشن جهت تعیین اندازه تومور و متاستاز غدد لنفاوی در تصاویر تشدید مغناطیسی بیماران سرطان کولون
محمدرضا هدیهزاده*1،2 ، مهدی یوسفی4و3
1- گروه مهندسی پزشکی، واحد دزفول، دانشگاه آزاد اسلامی، دزفول، ایران.
2- دانشکده پزشکی، دانشگاه علوم پزشکی دزفول، دزفول، ایران. ( mrhedyehzadeh@iau.ir)
3-باشگاه پژوهشگران جوان و نخبگان، واحد اهواز، دانشگاه آزاد اسلامی، اهواز، ایران.
4- گروه مهندسی برق، واحد نجف آباد، دانشگاه آزاد اسلامی، نجف آباد، ایران. ( mahdiyousefi@sel.iaun.ac.ir)
چکیده: سرطان روده بزرگ سومین سرطان رایج ازکل سرطانها در سال 2020 است. انکولوژیست در تعیین درمان مناسب ناگزیر از دانستن مرحله تومور بوده که متداولترین روش سیستم مرحلهبندی "تومور، گره، متاستاز" است. لذا در این مطالعه سعی بر آن است تا به کمک تصاویر رزونانس مغناطیسی، اندازه تومور و میزان گسترش به غدد لنفاوی تخمین زده شود. دادههای این مطالعه از پرتال TCIA جمعآوری شده و در اولین گام پردازشی، پس از ارتقاء کیفیت تصویر، ناحیهبندی جهت جداسازی ناحیه تومور از کل تصویر انجام گرفت. در این مطالعه جهت استخراج ویژگی و طبقهبندی توأمان، از شبکه عصبی کانولوشن VGG-16 و برای اعتبار سنجی از روش اعتبار سنجی متقابل ده لایه استفاده شده است. نتایج این مطالعه حاکی از صحت 2/94% است که نسبت به روشهای پاتولوژیک و توموگرافی کامپیوتری با صحتهای 91% و 77%، کارایی بهتری را نشان داده است. لازم به ذکر است که کارایی الگوریتم پیاده شده در تفکیک طبقه یک از سایر طبقات بیشتر بوده است اما اختلاف معناداری بین مقادیر میانگین پارامترها در سه طبقه دیده نشده است.
واژه های کلیدی: سرطان کولون، VGG-16، تصویربرداری تشدید مغناطیسی، اندازه تومور، متاستاز به غدد لنفاوی
DOI: 10.82526/jcdsa.2025.1183895 |
| نوع مقاله: پژوهشی |
تاریخ چاپ مقاله: 30/12/1403 | تاریخ پذیرش مقاله: 10/10/1403 | تاریخ ارسال مقاله: 24/06/1403 |
1- مقدمه
یکی از اجزای مهم دستگاه گوارش، روده بزرگ به طول حدودی 1 الي 5/1 متر است که از شایعترین بیماریهای این اندام در افراد بالای 50 سال، سرطان کولون است [1]. به رشد غیرقابل کنترل سلولهای اپیتلیال در دیواره روده بزرگ سرطان روده بزرگ1 گفته که سومین سرطان رایج در بین انواع سرطانها و علت 4/9% مرگومیر ناشی از کل سرطانها در سال 2020 است [2]. پیشبینی میشود در سال 2035، میزان ابتلا به این سرطان دوبرابر شده و بیشترین افزایش متعلق به کشورهای درحالتوسعه خواهد بود [3]. عوامل مؤثر بر این بیماری شامل رژیم غذایی، سابقه خانوادگی، سبک زندگی، اختلالات ژنتیکی، سن و نژاد است. به صورت کلی سرطان کولون دارای سه مرحله شروع، پیشرفت و متاستاز بوده که اغلب متاستاز کبد، ریه و استخوان شایع است [4]. علائم بالینی سرطان کولون و رکتوم شامل: درد در قسمت فوقانی یا تحتانی شکم، اسهال، شکم متورم، افزایش آروغ زدن، نفخ شکم، نارسایی اسید، خونریزی مقعدی، تکررادرار، بیاشتهایی، خستگی غیرمعمول و کاهش غیرارادی وزن هستند [5]. در پروسه تشخیص و درمان این عارضه دانستن مرحله2 و درجه3 تومور از اهمیت بسیار بالایی برخوردار است [6]. امروزه متداولترین روش جهت تعیین مرحله تومور سیستم مرحلهبندی "تومور، گره، متاستاز"4 است که در این سیستم Mنشاندهنده وجود متاستاز (گسترش تومور به بافتهای دیگر) در بدن، N میزان سرایت به غدد لنفاوی و Tاندازه تومور را نشان میدهد. مرحلهبندی سرطان گامی است در جهت تعیین پیشرفت و نفوذ تومور در بافت درگیر که در حال حاضر تعیین مرحله سرطان کولون اغلب به کمک تصاویر مقطعنگاری کامپیوتری (CT)5 و یا تصاویر پاتولوژیک6 انجام میشود [7]. در بسیاری از گایدلاینهای پزشکی از CT بهعنوان متداولترین روش جهت مرحلهبندی اولیه تومور نام بردهشده است. این روش به علت سهولت دسترسی، پرکاربردترین روش تشخیصی سرطان کولون است. مطالعات گذشته روی تومورهای کولون نشان دادهاند که در مقایسه حساسیت تشخیصی روشهای تصویربرداری، CT کمترین مقدار (62-68 %)، PET/CT با مقدار متوسط 72 % در رتبه بعدی و روش تصویربرداری تشدید مغناطیسی MRI7 با دقت تشخیصی حدودا 85 %، بهترین مقدار را داراست. لازم به ذکر است که در تصویرگیری CT و یا PET/CT که هر دو در تشخیص و پیگیری درمان بیماران دارای سرطان کولون کاربرد بسیار دارند استفاده از منبع خارجی مولد اشعه ایکس و دوز گیری بیمار امری اجتنابناپذیر است [8].
از معضلات دیگر این روشها علاوه بر دوز جذبی بالای اشعهایکس، عدم دسترسی آسان بیمار به پروتکل تصویربرداری PET بدلیل گرانبودن دستگاه تصویرگیری است. با توجه به مطالب گفته شده در قبل لزوم بهرهگیری از یک روش تصویربرداری با کمترین دوز جذبی ممکن برای بیمار و دارای قابلیت دسترسی آسان جهت تعیین مرحله تومور سرطان کولون بسیار حائز اهمیت است. تاکنون مطالعات بسیاری در زمینه تشخیص و پیشبینی تومورهای کولون توسط پژوهشگران انجام شده [9]–[14] که در ادامه به برخی از آنها اشاره خواهد شد. در [15]، با اعمال شبکههای عصبی کانولوشن8 به تصاویر پاتولوژیک نمونههای سرطان کولون، این دادهها را به سه دسته بافت سالم، بافت سرطانی با درجه کم (گرید 1 و 2) و بافت سرطانی با درجه بالا (گرید 3 و 4) تقسیمبندی کردند. نتایج حاکی از صحت 91 % در تمایز بیماران مذکور بود. در [16]، برای تشخیص تومور مرحله T1b از بافت سالم از 190 تصویر آندوسکپی کولون (مربوط به 41 بیمار) بهره گرفته و با استفاده از شبکه عصبی کانولوشن، به این نتیجه رسیدند که با استفاده از شبکههای کانولوشن میتوان تمایز دادههای مذکور را با دقتی نزدیک به 81 %، بدون استفاده از کمک متخصصین آندوسکوپی و صرفا باتوجه به تصاویر خام آندوسکپی بدست آورد. با هدف ناحیهبندی تصاویر تشدید مغناطیسی، در [17] تومورهای سرطان کولورکتال از شبکههای تمام اتصال کانولوشن استفاده نمودند. نویسندگان این پژوهش به این نتیجه رسیدند که کارایی و صحت شبکه VGG-16 برای مشخص نمودن ناحیه تومور سرطان کولون بهتر از شبکه U-Net است. برای تفکیک تومورهای رکتوم مرحله 2 از 3 (بر اساس استاندارد AJCC) در تصاویر تشدید مغناطیسی 290 بیمار از شبکه عصبی کانولوشن استفاده کردند که نتایج حاکی از صحت 94% در افتراق این دو دسته تومور بود [18].
با هدف طبقهبندی خودکار متاستاز غدد لنفاوی سرطان روده بزرگ، در [19] نتایج حاصل از هشت روش کلاسیک یادگیری ماشین و دو روش یادگیری عمیق را مورد مقایسه قرار دادند. نتایج مطالعه نشان داد که روشهای یادگیری عمیق با صحت 75 % کارایی بهتری نسبت به روشهای کلاسیک یادگیری ماشین شامل رگرسیون لجستیک (68 %) و آدابوست (%) دارا هستند. در [19]، یک روش نوین جهت تشخیص پاسخ به درمان (میزان عود کردن تومور) با استفاده از ویژگیهای استخراج شده از تصاویر CT و ویژگی های بالینی پیشنهاد کردند. یافته اصلی این مطالعه آشکار شدن قابلیت روشهای یادگیری عمیق در استخراج ویژگی از تصاویر پزشکی است. با مقایسه مطالعات پیشین ذکر چند نکته حائز اهمیت است. اول آنکه این مطالعات با اهداف مختلفی همچون تعیین گردید [15] (جهت تخمین میزان بدخیمی تومور)، ناحیهبندی [17] (جهت استخراج ناحیه تومور از بقیه تصویر)، پیشبینی پاسخ به درمان [10], [20]–[25] (تخمین مدت زمان زنده ماندن، عود کردن تومور، متاستاز به غدد لنفاوی و بافتهای دیگر[26], [27] ترتیب داده شدهاند. دوم آن که در اکثر این مطالعات از تصاویر CT، آندوسکپی و یا پاتولوژیک جهت نیل به اهداف ذکر شده استفاده شده است؛ حال آنکه این تصاویر یا دارای دوز جذبی بالای بیمار بوده (تصاویر CT) و یا نیازمند جراحی جهت اخذ نمونه (تصاویر پاتولوژیک) و عملیاتی تهاجمی (تصاویر آندوسکپی) هستند [24]. بنابراین استفاده از یک پروتکل تصویربرداری ایمن مانند MRI پیشنهادی عالی خواهد بود.
ما در این مطالعه سعی داریم ابتدا تصاویر تشدید مغناطیسی ناحیه روده بزرگ بیماران مبتلا به سرطان را جمعآوری و پس از پیشپردازش، استخراج ناحیه تومور و استخراج ویژگی از ناحیه تومور با استفاده از روشهای یادگیری ماشین نوین به طبقهبندی تصاویر جهت دستیابی به مرحله TوN تومور مبادرت نماییم. در واقع هدف از این پژوهش تخمین اندازه تومور و تعداد غدد لنفاوی درگیر توسط تومور کولون با استفاده از تصاویر تشدید مغناطیسی است. با توجه به موارد ذکر شده، مقاله حاضر از چندین جنبه دارای نوآوری بوده که ازجمله آنها میتوان به استفاده از یک روش تصویربرداری ایمن و بدون دوز جذبی خطرزا جهت تعیین مرحله تومور، تعیین همزمان دو پارامتر T و N و بالاتر بردن صحت نتایج نسبت به مطالعات قبلی اشاره کرد. در ادامه و در قسمت دوم مقاله (بخش مواد و روش ها) روش انجام مطالعه با جزئیات بیان خواهدشد. در بخش سوم نتایج گرفتهشده از روش پیشنهادی بررسی شده و در بخش چهارم نتایج گرفتهشده مورد واکاوی و با مطالعات قبلی مقایسه خواهندشد. پنجمین بخش جمعبندی مطالعه و ششمین و آخرین بخش منابع مورد استفاده در مطالعه خواهد بود.
2- مواد و روشها
در این مطالعه گذشتهنگر، روشی نوین جهت تخمین اندازه تومور و تعداد غدد لنفاوی درگیر در بیماران دارای سرطان کولون با استفاده از تصاویر تشدید مغناطیسی پیشنهاد شدهاست. جمعآوری داده مطابق معمول، اولین مرحله هر پروژه تحقیقاتی بوده که در این مطالعه، دادهها از یک مجموعه با دسترسی آزاد گردآوری شده است. پس از آن پیشپردازش با هدف آماده سازی دادگان جهت پردازش اصلی (حذف نویز و...) استخراج ویژگی و طبقهبندی مراحل بعدی کار میباشند (شکل 1).
2-1- پايگاه داده
دادههای استفاده شده در این مطالعه از مجموعه TCGA-READ [28] در پرتال TCIA که شامل 3239 تصویر CTو MR و Pathology مربوط به بیماران دارای سرطان روده بزرگ میباشد جمعآوری شده است. از میان تمام تصاویر موجود در پایگاهداده، 1440 تصویر رزونانس مغناطیسی موجود بود که تعداد 128 تصویر به دلیل عدم کارایی و یا کیفیت تصاویر از پژوهش خارج شده و مطالعه بر اساس 1312 تصویر انجام گرفت. همچنین در این مجموعه داده اطلاعات کلینیکی، ژنتیکی و آسیبشناسی پاتولوژیک هم موجود است. از نکات مهم دیگر استفاده از این داده این است که به علت دسترسی آزاد و همگانی دادههای موجود در پرتالTCIA نیاز به اخذ مجوزهای کمیته اخلاق وجود نخواهد داشت. در شکل (2) نمونهای از تصاویر موجود در پایگاه داده را میتوان مشاهده کرد.
2-2- پیش پردازش
پیشپردازش یکی از مراحل مهم در هر کار پردازش تصویر است که در آن با توجه به دادههای جمعآوری شده یک سری پردازشها جهت یکپارچه سازی و حذف موارد نامطلوب روی کلیه دادهها انجام میگیرد. در پژوهشهای پردازش تصویر و در غالب موارد، قدم اول ورود به کار پردازشی اصلی، تبدیل فرمت تصاویر است. علت این امر فرمت خاص تصاویر پزشکی است. تصاویر پزشکی بر عکس تصاویر موجود در سایر حوزه ها که غالبا از استاندارد جهانی JPG یا PNG استفاده میکنند دارای فرمت استاندارد خاص خود یعنی9 بوده که جهت اعمال بهعنوان ورودی بسیاری از دستورات در زبانهای برنامهنویسی مختلف مناسب نیست. لذا تبدیل فرمت جزء لاینفک و اجنتابناپذیر این دست پردازشها است. لذا در اولین مرحله با تبدیل فرمت دادهها از پسوند DICOM به JPG به این مهم خواهیم رسید. تصاویر تشدید مغناطیسی و بطور عام تصاویر پزشکی بدلیل ماهیت روش تصویربرداری، مشکلات موجود در فرآیند تصویرگیری و عدم همکاری کافی بیمار دارای کیفیت مناسب نبوده و اعمال روشهای ارتقاء کیفیت تصویر در بالا بردن دقت نتایج حاصله از مراحل بعدی پردازش (ناحیهبندی، استخراج ویژگی و...) تاثیر بسزایی دارد. لذا در این مطالعه با همسانسازی هیستوگرام10 سعی بر آن است تا با یکنواختکردن هیستوگرام شدت روشنایی تصویر، از همه شدت روشناییها بصورت یکنواخت در کل تصویر وجود داشته و به این شکل کیفیت تصویر را ارتقاء ببخشیم.
یکی از عملیات بسیار مهم در پژوهشهای پردازش تصویر، ناحیهبندی تصویر11 و بهعبارتی جدا کردن ناحیه تومور از بقیه تصویر است. در این مطالعه جهت ناحیهبندی و جدا کردن ناحیه مورد نظر (تومور) از بقیه تصویر از دو رادیولوژیست با تجربه کاری 21 ساله در زمینه تشخیص سرطان کمک گرفته شد. با توجه به آناتومی رودهبزرگ و قرارگیری این بافت در چندین مقطع عرضی از تصویر به پیشنهاد رادیولوژیست دو مقطع عرضی از رودهبزرگ برای هر آزمایش درنظر گرفتهشد و بنابراین تعداد تصاویر بکار رفته در پژوهش به 2368 افزایش یافت. و در آخرین مرحله از کار پیشپردازش به جهت همسان نبودن اندازه تصاویر موجود در دیتابیس، ابعاد کلیه تصاویر به 224×224×3 تغییر یافت.
2-3- استخراج ویژگی و طبقهبندی
استخراج ویژگی و طبقهبندی مهمترین قسمت کار پردازشی در این مطالعه هستند. در مطالعات پیشین روشهای مختلفی جهت استخراج ویژگی بهکار رفتهاست که در غالب این مطالعات (11,13,24) از ویژگیهای از پیش تعیین شده12 مانند ویژگیهای مبتنی بر شکل، مبتنی بر هیستوگرام، ویژگیهای آماری مرتبه اول، دوم و بالاتر استفاده شده است. مهمترین عیب استفاده از این ویژگیها این است که چون این ویژگیها از پیش تعیین شده هستند از لحاظ تعداد بهینه و کیفیت محل ابهام هستند. به عبارت دیگر کاربر در تعیین تعداد ویژگی که میتواند منجر به بهترین نتیجه در طبقهبندی شود تردید داشته ضمن آنکه تردید دیگر در انتخاب هر یک از ویژگیها این است که چه تضمینی وجود دارد که این ویژگی خوب است و چرا نباید سراغ دیگر ویژگیها رفت؟ بهعبارت دیگر در روش انتخاب ویژگیهای از پیش تعیین شده مشکل اصلی این است که برای کاربر هیچ تضمینی وجود ندارد که مجموعه ویژگی تعیین شده بهترین بوده و نمیتوان مجموعه ویژگی بهتری تعیین نمود. لذا نیاز به یک روش جهت دستیابی به یک مجموعه ویژگی جامع احساس میشود. شبکههای عصبی کانولوشن پاسخ به این سوال هستند.
امروزه یکی از روشهای متداول در پژوهشهای پردازش تصویر جهت استخراج ویژگی و طبقهبندی استفاده از شبکههای عمیق کانولوشن است. ساختار این شبکهها به گونهای است که در لایههای با تعداد زیاد و در هرلایه عملگرهای کانولوشن بر روی تصاویر اعمال شده و خروجی هر لایه یک ویژگی از ویژگیهای مهم مانند لبههای تصویراست. در این شبکهها تصویر بعنوان ورودی وارد شده و در لایههای عمیق(تعداد لایه زیاد و تعداد نرون زیاد در هر لایه) طی تعداد بسیار زیادی از عملیات کانولوشن که روی تصویر انجام میگیرد، در هر لایه یک سری ماتریس ویژگی استخراج میشود.نکته مهم آنکه این ویژگیها در لایهها با عمقهای مختلف استخراج شده که هر کدام حاوی اطلاعات مختص به خود و در عین حال متفاوت نسبت به دیگری هستند. لذا این شبکهها راهحل مناسبی برای معضل ذکر شده در قبل هستند زیرا خروجی این شبکه در لایههای مختلف ویژگیهای مختلف بوده و لذا تعداد بسیار زیاد و جامعی از ویژگیها در دسترس است در مطالعات پیشین این امر نشان داده شده که شبکههای کانولوشن قادرند علاوه بر ویژگیهای کلاسیک مانند همبستگی، انرژی، همسایگی ها و... ویژگیهای دیگری از تصاویر استخراج کنند که بعضا کارایی بیشتری در اهداف مورد نظر مانند طبقهبندی داده و تشخیص الگو دارند [26]. تعداد شبکههای کانولوشن توسعه یافته جهت ناحیهبندی، استخراج ویژگی و طبقهبندی زیاد بوده که از جمله آنها میتوان به شبکههای GoogLeNet, AlexNet, ResNet, VGG اشاره کرد. با مروری بر مطالعات پیشین میتوان به این امر اشاره کرد که از میان همه این شبکهها، شبکه VGG-16 به دلیل ساختار و توابع فعالساز بکار رفته در لایههای مختلف آن قابلیت بسیار خوبی در استخراج ویژگی و طبقهبندی از تصاویر را دارد (17). لذا ما نیز در این مطالعه از شبکه عصبی کانولوشنی VGG-16 با لایههای مختلف است بهره بردهایم. مورد مهم در طراحی شبکه تعیین ساختار و تنظیم پارامترهای شبکه است که برای مورد اول از پیشفرض شبکه VGG کمک گرفتهشده و برای تنظیم پارامترها با بکارگیری یک روش وفقی، پارامتر بهینه انتخاب شده است. در مجموع این شبکه دارای 13 لایه کانولوشن، 15 تابع تبدیل Relu، 5 لایه Maxpooling، 3 لایه Fulyconnected، دولایه Dropout، یکلایه Softmax و یکلایه طبقهبندی در خروجی است (شکل 3). ورودی مدل پیشنهادی تصاویر تشدید مغناطیسی با ابعاد 3×224×224 می باشند.
شکل(1): مراحل روش پیشنهادی
شکل (2): تصویر MRI بیمار مبتلا به سرطان تهاجمی روده بزرگ
شکل (3): ساختار شبکه کانولوشنی بکار رفته در مطالعه
لایه اول کانولوشن شامل 64 فیلتر با ابعاد 3×3، پدینگ و بایاس با مقدار 1 به همراه تابع فعالساز13 است. از پارامترهای قابل تنظیم دیگر این شبکه میتوان به استفاده از الگوریتم گرادیان کاهشی تصادفی به منظور بروزرسانی وزنهای شبکه، Batch Size برابر با 30، نرخ یادگیری 001/0 و حداکثر تعداد تکرار14 200 اشاره کرد. منظور از قراردادن Batch size برابر30 این است که در هر بار آموزش شبکه کل دادهها بعنوان ورودی استفاده نشده و فقط تعداد 30 تصویر از کل دادها در آموزش دخیل هستند. از نکات مهم دیگر در بحث ارزیابی شبکهها بررسی اعتبارسنجی شبکهها در فرایند آموزش و آزمایش است. جهت نیل به این مقصود ابتدا باید دادگان به سه قسمت آموزش، آزمایش و اعتبارسنجی تقسیم شده و سپس با استفاده از روش اعتبارسنجی متقابل 10 لایه15 انجام گیرد. بهعبارت دیگر هر بار بصورت تصادفی 70% از دادگان (1654) بهمنظور آموزش مدل، 20% (474 تصویر) بهعنوان آزمایش و 10% از دادگان (240 تصویر) بهعنوان اعتبارسنجی نتایج حاصل از آموزش و آزمایش دادگان بر شبکه پیشنهادی مورداستفاده قرار گرفته و این کار 10 مرتبه انجام میشود. برای ارزیابی مدل پیشنهادی از پارامترهای صحت، اختصاصیت و حساسیت شبکه استفاده شده است. کلیه مطالعات آماری انجام شده در این مقاله با استفاده از نرم افزار پایتون انجام شده است.
3- یافتهها
همانگونه که در قسمت مواد و روشها اشاره شد اولین قدم در کارهای پردازش تصویر، استاندارد سازی فرمت تصاویر است که در این مطالعه فرمت تصاویر از DICOM به JPG تبدیل شده و پس از آن نوبت به ارتقاء کیفیت تصویر میرسد. در این پژوهش جهت ارتقاء کیفیت تصاویر پس از بررسی هیستوگرام تصاویر و محرز شدن عدم همسانی هیستوگرام در اکثر تصاویر، از روش همسانسازی هیستوگرام جهت همسان نمودن نسبی طیف هیستوگرام استفاده شده است (شکل 4 الف-ب). پس از ارتقاء کیفیت تصاویر نوبت به جداسازی ناحیه موردنظر (ناحیه تومور) از کل تصویر و یا بعبارتی ناحیهبندی تصویر میرسد. جداسازی ناحیه تومور بصورت دستی توسط متخصص رادیولوژیست انجام شده که نتایج در شکل (4-ج) مشخص است. آخرین مرحله در قسمت پیش پردازش یکسان سازی ابعاد کلیه تصاویر موجود در دیتابیس است. از جمله مشکلات تصاویر موجود در دیتابیس یکسان نبودن ابعاد آنها است زیرا در پردازش های بعدی نیاز است که کلیه تصاویر ورودی مدل دارای ابعاد یکسانی باشند. لذا ابعاد کلیه تصاویر موجود به 224×224×3 تغییر یافت. نکته مهم در بحث استخراج ویژگی مشکلات مربوط به ویژگیهای از پیش تعیین شده بود که مفصلا در قسمت مواد و روشها بدان اشاره شد و راهحل آن یعنی استفاده از شبکه های VGG16 جهت استخراج ویژگی ارائه گردید. در رابطه با بحث طبقهبندی نیز بواسطه قرار گرفتن لایههای تمام اتصال در انتهای شبکهی VGG16 توانایی این شبکه در طبقهبندی از موارد مهم کاربردی در بحث استفاده از آنها است. بعبارت دیگر این شبکهها قادرند علاوه بر استخراج انواع مختلفی از ویژگیها به طبقهبندی دادهها با استفاده از ویژگیهای استخراج شده بصورت توام نیز مبادرت ورزند. ساختار این شبکه در قسمت روش کار توضیح داده شده که در اینجا فقط به توضیح کارکرد کلی و نتایج حاصله اکتفا خواهیم کرد. شبکه پیشنهادی متشکل از چندین لایه کانولوشن جهت استخراج ویژگی است که در این مطالعه خروجیهای لایه آخر کانولوشن که شامل 512 ماتریس ویژگی 7×7 است بعنوان ویژگیهای نهایی مورد استفاده قرار گرفته است. پس از این لایه نوبت به شبکه تمام اتصال میرسد که شامل 4096 نرون بوده که این نرونها ویژگیهای مذکور را بعنوان ورودی دریافت کرده و در آخرین لایه که شامل 3 نرون با تابع فعالسازی Softmax است کار طبقهبندی دادهها به سه طبقه را انجام میدهند. لازم به ذکر است که دادههای موجود در دیتابیس مطابق آنچه که در جدول (1) آورده شده شامل سه دسته هستند لذا لایه خروجی شبکه در این پژوهش به شکلی طراحی شده که دارای سه طبقه خروجی باشد. نکته مهم دیگر در بحث استفاده از روشهای یادگیری ماشین بکارگیری روشهای اعتبارسنجی است. در این مطالعه از روش اعتبارسنجی متقابل 10 لایه بهره گرفته شده است.
همانگونه که در قسمت مواد و روشها توضیح داده شد در روش متقابل 10 لایه دادهها به ده قسمت تقسیم شده و ده بار آموزش و تست شبکه روی دادهها انجام میشود. لذا باید صحت، اختصاصیت و حساسیت مدل در این ده بار تکرار را بدست آورده و متوسط آنها گزارش گردد. مقادیر صحت، اختصاصیت و حساسیت مدل عبارت است از 2/94، 80/95 و 40/96. همانگونه که اشاره شد در این مقاله دادهها در سه دسته طبقهبندی شده اند که جهت تعیین کارایی و دقت مدل ارائه شده، پارامترهای صحت، حساسیت و اختصاصیت مدل برای هر سه کلاس بطور جداگانه محاسبه گردید که در ادامه هر یک به تفصیل توضیح داده خواهد شد. نکته اینکه در مسائلی که تعداد کلاسها بیش از دو مورد است، روشهای تعیین حساسیت، صحت و اختصاصیت از روش One vs. all استفاده کرده و بعبارت دیگر مثلا صحت تعیین هرکلاس نسبت به بقیه کلاسها جداگانه محاسبه و اعلام میگردد. جدول (2)، صحت، حساسیت و اختصاصیت مد در تعیین کلاسهای 0، 1 و 2 را نشان میدهد. نتایج موجود در این جدول نشان میدهد که بهترین کارایی در تمایز طبقات مختلف داده از هم مربوط به طبقه 2 است که این امر میتواند به دلیل تعداد داده کمتر مربوط به این طبقه باشد. البته ذکر این نکته حائز اهمیت است که طبق آزمون ANNOVA اختلاف معناداری بین مقادیر میانگین پارامترها در سه طبقه وجود نداشت.
4- بحث
هدف در این مطالعه بهرهگیری از یک پروتکل تصویربرداری ایمن و در دسترس مانند رزونانس مغناطیسی جهت تعیین اندازه تومور و درگیری غدد لنفاوی سرطان کولون و مقایسه آن با روشهای دیگر مانند پاتولوژی، CT، PET/CT و سونوگرافی است. از جدول (2) که نشاندهنده مقادیر صحت، حساسیت و اختصاصیت در سه طبقه داده است میتوان دریافت که مدل آموزش دیده شده در تمایز گروه دوم دادهها (طبقه 1) از سایر طبقات بهتر عمل کرده که این امر ناشی از تعداد بیشتر دادهها در این طبقه است. پرواضح است که الگوریتمهای یادگیری ماشین بدلیل ماهیت آموزشپذیر بودنشان، روی طبقهای از دادهها که تعداد بیشتری داده وجود دارد بهتر آموزش دیده و لذا صحت بهتری در مرحله آزمایش خواهند داشت. جدول (3) نتایج گرفته شده از این مطالعه را با پژوهشهای پیشین مقایسه کرده که در ادامه به تفصیل نقاط ضعف و قوت هر مطالعه را بررسی خواهیم کرد. برای بررسی جامع مطالعات انجام شده در زمینه مرحلهبندی سرطان کولون این مطالعات را به دو دسته تقسیم میکنیم. دسته اول مطالعاتی هستند که از تصاویر تشدید مغناطیسی جهت مرحلهبندی استفاده نموده و دسته دوم مطالعاتی هستند که از تصاویری غیر از تصاویر تشدید مغناطیسی استفاده کردهاند. مطالعات دسته دوم طیف وسیعی از کل مطالعات انجام شده را در برمیگیرند که در غالب این مطالعات نویسندگان با استفاده از پروتکلهای تصویرگیری مانند تصاویر پاتولوژیک و یا آندوسکپیک صرفا به پیشبینی اندازه تومور و یا فقط درگیری غدد لنفاوی بعنوان یک فاکتور پیشبینیگر میزان پیشرفت سرطان کولون پرداختهاند.
|
|
|
الف) تصویر اولیه | ب) همسان سازی | ج) ناحیهبندی شده |
شکل (4): مراحل آمادهسازی دادگان.
جدول (1): مشخصههای T و N دادههای استفاده شده در مطالعه.
تعداد داده | N | T | Description | Output |
(28%)368 | 0 | 0 | نبود تومور، عدم درگیری غدد لنفاوی | 0 |
(46%)604 | 1 | 3 | وجود تومور، درگیری 2 یا 3 گره لنفاوی | 1 |
(26%)340 | 2 | 3 | وجود تومور، درگیری بیش از 3 گره لنفاوی | 2 |
جدول (2): کارایی روش پیشنهادی در تمایز طبقات مختلف دادهها.
اختصاصیت | حساسیت | صحت | طبقه |
(±1/1)5/97 | (±0/9)7/95 | (±0/7)3/96 | 0 |
(±0/9)6/98 | (±0/4)5/98 | (±0/8)7/98 | 1 |
(±0/5)3/91 | (±0/8)95 | (±0/7)6/87 | 2 |
در این مطالعه فقط به مطالعاتی پرداخته شده که هدف آنها پیشبینی اندازه تومور و میزان درگیری غدد لنفاوی با استفاده از تصاویر پزشکی بوده است و لذا از بررسی مطالعاتی که صرفا به بررسی آماری دادههای پرونده بیماران اکتفا کرده [13]و بدنبال یافتن یک اختلاف معنادار بین بیماران دارای استیجهای متفاوت از لحاظ پارامتر T و یا N بوده صرفنظر شده است. تعداد معدودی مقاله به تخمین مرحله سرطان کولون از روی تصاویر CT با استفاده از روشهای یادگیری ماشین مبادرت ورزیدهاند، که از این تعداد فقط یک مقاله به تخمین پارامترهای T و N پرداخته اند [14]. معضل بزرگ روشهای تعیین مرحله سرطان با استفاده از تصاویری غیر از تصاویر تشدید مغناطیسی(دسته دوم مطالعات بررسی شده) به فرآیند تصویرگیری آنها برمیگردد. در تصاویر پاتولوژیک عموما نیاز به جراحی و برداشتن نمونه تومور وجود دارد و لذا در مواردی که امکان جراحی وجود نداشته و یا بیمار رغبتی به انجام آن ندارد امکان پذیر نیست. مشکل دیگر تصاویر پاتولوژیک لوکال بودن نمونه و اطلاعات اخذ شده از آن است. بعبارت دیگر چون امکان نمونهگیری از کل نواحی تومور عملا وجود ندارد لذا نتایج گرفته شده قابل تعمیم به کل تومور نیستند. در مورد تصاویر آندوسکپیک نیز بدلیل تهاجمیبودن روش، عدم رغبت بیمار به انجام آن، عدم امکان انجام آندوسکپی در برخی بیماران و عدم امکان تعمیم نتایج به کل تومور استفاده از این روش متداول نیست. در مورد تصاویر CT مشکلات ذکر شده وجود نداشته و فقط بحث دوز جذبی بیمار مطرح است. در بررسی مطالعاتی که از تصاویر MR استفاده کردهاند ذکر یک نکته حائز اهمیت است و آن اینکه بسیاری از این مطالعات صرفا به بررسی یکی از پارامترهای مرحلهبندی (T, N یا M) پرداختهاند. در سایر کارها صرفا تمایز میان استیجهای T3 از T4 مطرح بوده و یا بر پایه تشخیص درگیری غدد لنفاوی به تنهایی بنا نهاده شده است. حال آنکه پزشک انکولوژیست جهت تعیین درمان مناسب نیازمند دانستن همه پارامترهاست. لذا در این مطالعه سعی شده است تا حد ممکن به این سمت حرکت کرده و در تخمین پارامترهای بیشتری نسبت به سایر مطالعات پیشین گام برداشتهشود.
از مزایای این مطالعه و روش پیشنهادی آن در مقایسه با مطالعات قبلی میتوان به مواردی که در ادامه میآید اشاره کرد. در بسیاری از مطالعات قبلی صرفا به تخمین اندازه تومور بعنوان یک فاکتور پیشبینیگر پیشرفت تومور پرداخته شده حال آنکه در این مطالعه علاوه بر تخمین اندازه تومور وضعیت گسترش به غدد لنفاوی هم تخمین زدهشده است. نکته دیگر آنکه تخمین میزان گسترش غدد لنفاوی انجام شده در این مطالعه صرفا با استفاده از تصویر تومور و بدون نیاز به سایر اقدامات پاتولوژیک و یا تصویرگیری اضافه از خود غدد لنفاوی انجام شده که این امر برتری کار حاضر نسبت به مطالعات پیشین را نشان میدهد. در مورد روش کار نیز ذکر این نکته حائز اهمیت است که در روش بکاررفته از هیچگونه ویژگی از پیش تعیین شده استفاده نشده و ویژگیهای عمیق مستخرج از شبکه کانولوشن نمایندهای جامع و تمام عیار از تمامی ویژگیهای موردنیاز جهت طبقهبندی دادهها هستند.
روش پیشنهادی از محدودیتهایی نیز رنج میبرد. از جمله این محدودیتها تعداد داده کم بکار رفته جهت آموزش شبکه است. شبکههای عمیق جهت یادگیری مناسب نیازمند تعداد داده زیاد هستند و در صورت نبود تعداد داده کافی فرآیند آموزش شبکه به درستی انجام نشده و خروجی مطلوب حاصل نمیگردد. لذا استفاده از دیتابیسهای جمعآوری شده بصورت آیندهنگر پیشنهاد میگردد. از معضلات دیگر روش پیشنهادی عدم بکارگیری دادههای کلینیکی بیماران مانند سن، جنسیت، اطلاعات ژنتیکی و وراثتی در تخمین پارامترهای هدف است. در روش پیشنهادی فقط از اطلاعات موجود در تصویر جهت تخمین مرحله تومور استفاده شده است در صورتی که در صورت استفاده از دادههای کلینیکی مهم دیگری مانند گرید، سن، جنسیت و... درکنار ویژگیهای تصویری احتمال دستیابی به نتیجه بهتر وجود داشت. محدودیت دیگر این مطالعه عدم استفاده از روشهای کلاسیک طبقهبندی مانند درخت تصمیم، شبکههای عصبی معمولی، جنگل تصادفی و... است که میتوان نتایج این روشها را با روش شبکه عصبی عمیق استفاده شده مورد مقایسه قرار داد. در آخر ذکر این نکته خالی از لطف نیست و آن اینکه متاسفانه در دیتابیس استفاده شده فقط سه دسته ممکن (T0N0، T3N1 و T3N2) از کل حالات مختلف استیج سرطان کولون وجود داشت که این امر لزوم بهرهگیری از یک دیتابیس جامعتر را ضروری میسازد.
5- نتیجه
این مطالعه با هدف تعیین اندازه تومور و میزان درگیری غدد لنفاوی سرطان کولون با استفاده از تصاویر تشدید مغناطیسی روی 1312 بیمار انجام شده است. نتایج حاصله از یافتههای این مطالعه (2/94%) حاکی از آن است که میتوان بدون استفاده از مدالیتههای تصویرگیری سرطانزا مانند CT و دیگر مدالیتههای تهاجمی مانند اندوسکپی و یا پاتولوژی میزان سرایت تومورهای کولون به غدد لنفاوی و متاستاز را بصورت همزمان بررسی نمود. توجه شود که در این مطالعه دادهها بر اساس دو پارامتر T و N به سه طبقه دستهبندی شده که این طبقهبندی در کارهای کلینیکال بسیار متداول بوده لذا میتوان ادعا نمود که روش بکاررفته بر عکس مطالعات پیشین که فقط روی یک دسته خاص از بیماران (مثلا فقط T1b) متمرکز است قادر است جامعه کلیتری از بیماران را مورد بررسی قرار دهد. از نوآوریهای دیگر بکار رفته در مطالعه استفاده از تصاویر ایمن و بدون خطر پرتو گیری است.
6- تشکر و قدردانی
نویسندگان این مقاله از کلیه کسانی که در بررسیهای اولیه، جمعآوری و آنالیز دادهها کمکگر بوده کمال تشکر را دارند. با توجه به اینکه دادههای بکار رفته در این مطالعه از پایگاه داده با دسترسی همگانی و آزاد TCIAجمعآوری شده لذا ضرورت به اخذ کد اخلاق وجود ندارد. نویسندگان مقاله تعارض منافعی برای انتشار این مقاله ندارند.
[1] Colorectal Cancer, CRC
[2] Stage
[3] Grade
[4] Tumour, Node, Metastasis, TNM
[5] Computed Tomography, CT
[6] Haematoxylin & Eosin (H&E) staining images
[7] Magnetic resonance imaging
[8] Convolutional Neural Network, CNN
[9] Digital Imaging and Communications in Medicine, DICOM
[10] Histogram Equalization
[11] Segmentation
[12] Hand Crafted Features
[13] Relu
[14] Epoch
[15] 10-fold cross validation
جدول(3): مقایسه نتایج مطالعه حاضر با مطالعات پیشین.
صحت | هدف | روش کار | تصاویر | مطالعه-سال انتشار |
91% | تعیین گرید تومورهای کولون | CNN | پاتولوژیک | [15] آوان و همکاران-2017 |
81% | تفکیک استیجهای T1a و T1b | CNN | آندوسکپیک | [29] ایترو و همکاران-2018 |
عملکرد بهتر VGG نسبت به سایر شبکههای کانولوشن | ناحیهبندی تصاویر MRI | CNN | MRI | [17] جیان و همکاران-2018 |
94% | تفکیک استیجهای T4 و T3 | CNN | MRI | [18] کیم و همکاران-2019 |
عملکرد بهتر روشهای یادگیری عمیق | تعیین درگیری غدد لنفاوی | CNN و کلاسیک | MRI | [19] لی و همکاران-2021 |
77% | تعیین اندازه تومور و درگیری غدد لنفاوی | کلاسیک | CT | [14] بولبول و همکاران-2023 |
2%/94 | تعیین اندازه تومور و درگیری غدد لنفاوی | CNN | MRI | مطالعه حاضر |
مراجع
[1] V. Mahadevan, “Anatomy of the caecum, appendix and colon,” Surg., vol. 38, no. 1, pp. 1–6, 2020. https://doi.org/10.1016/j.mpsur.2019.10.017
[2] P. Boyle and J. S. Langman, “ABC of colorectal cancer: Epidemiology,” BMJ Br. Med. J., vol. 321,
no. 7264, p. 805, 2000. https://doi.org/10.1136/sbmj.0012452
[3] M. Araghi et al., “Global trends in colorectal cancer mortality: projections to the year 2035,” Int. J. cancer, vol. 144, no. 12, pp. 2992–3000, 2019. https://doi.org/10.1002/ijc.32055
[4] M. S. Hossain et al., “Colorectal cancer: a review of carcinogenesis, global epidemiology, current challenges, risk factors, preventive and treatment strategies,” Cancers (Basel)., vol. 14, no. 7, p. 1732, 2022. https://doi.org/10.3390/cancers14071732
[5] Y. Xi and P. Xu, “Global colorectal cancer burden in 2020 and projections to 2040,” Transl. Oncol., vol. 14, no. 10, p. 101174, 2021. https://doi.org/10.1016/j.tranon.2021.101174
[6] M. L. H. Ong and J. B. Schofield, “Assessment of lymph node involvement in colorectal cancer,” World J. Gastrointest. Surg., vol. 8, no. 3, p. 179, 2016. https://doi.org/ 10.4240/wjgs.v8.i3.179
[7] D. Tamandl, T. Mang, and A. Ba-Ssalamah, “Imaging of colorectal cancer–the clue to individualized treatment,” Innov. Surg. Sci., vol. 3, no. 1, pp. 3–15, 2018. https://doi.org/10.1515/iss-2017-0049
[8] R. Vikram and R. B. Iyer, “PET/CT imaging in the diagnosis, staging, and follow-up of colorectal cancer,” Cancer Imaging, vol. 8, no. Spec Iss A, p. S46, 2008. https://doi.org/10.1102/1470-7330.2008.9009
[9] M. Tharwat, N. A. Sakr, S. El-Sappagh, H. Soliman, K.-S. Kwak, and M. Elmogy, “Colon cancer diagnosis based on machine learning and deep learning: Modalities and analysis techniques,” Sensors, vol. 22, no. 23, p. 9250, 2022. https://doi.org/10.3390/s22239250
[10] L. Buk Cardoso et al., “Machine learning for predicting survival of colorectal cancer patients,” Sci. Rep., vol. 13, no. 1, p. 8874, 2023. https://doi.org/10.1038/s41598-023-35649-9
[11] B. Burnett et al., “Machine Learning in Colorectal Cancer Risk Prediction from Routinely Collected Data: A Review,” Diagnostics, vol. 13, no. 2, p. 301, 2023. https://doi.org/10.3390/diagnostics13020301
[12] H. Abdul Rahman, M. A. Ottom, and I. D. Dinov, “Machine learning-based colorectal cancer prediction using global dietary data,” BMC Cancer, vol. 23, no. 1, p. 144, 2023 https://doi.org/10.1186/s12885-023-10587-x
[13] C. B. Finn et al., “Development of a Machine Learning Model to Identify Colorectal Cancer Stage in Medicare Claims,” JCO Clin. Cancer Informatics, vol. 7, p. e2300003, 2023. https://doi.org/10.1200/CCI.23.00003
[14] H. M. Bülbül, G. Burakgazi, and U. Kesimal, “Preoperative assessment of grade, T stage, and lymph node involvement: machine learning-based CT texture analysis in colon cancer,” Jpn. J. Radiol., pp. 1–8, 2023. https://doi.org/10.1007/s11604-023-01502-2
[15] R. Awan et al., “Glandular morphometrics for objective grading of colorectal adenocarcinom
histology images,” Sci. Rep., vol. 7, no. 1, p. 16852, 2017. https://doi.org/10.1038/s41598-017-16516-w
[16] N. Ito, H. Kawahira, H. Nakashima, M. Uesato, H. Miyauchi, and H. Matsubara, “Endoscopic diagnostic support system for cT1b colorectal cancer using deep learning,” Oncology, vol. 96, no. 1, pp. 44–50, 2018. https://doi.org/10.1159/000491636
[17] J. Jian et al., “Fully convolutional networks (FCNs)-based segmentation method for colorectal tumors on T2-weighted magnetic resonance images,” Australas. Phys. Eng. Sci. Med., vol. 41, pp. 393–401, 2018. https://doi.org/10.1007/s13246-018-0636-9
[18] J. Kim et al., “Rectal cancer: Toward fully automatic discrimination of T2 and T3 rectal cancers using deep convolutional neural network,” Int. J. Imaging Syst. Technol., vol. 29, no. 3, pp. 247–259, 2019. https://doi.org/10.1002/ima.22311
[19] J. Li, P. Wang, Y. Zhou, H. Liang, and K. Luan, “Different machine learning and deep learning methods for the classification of colorectal cancer lymph node metastasis images,” Front. Bioeng. Biotechnol., vol. 8, p. 620257, 2021. https://doi.org/10.3389/fbioe.2020.620257
[20] M. Yousefi and M. Hedyehzadeh, “Recurrence Detection of Non-small cell Lung Cancer (NSCLC) Tumors Using Imaging and Clinical Features,” J. Heal. Biomed. Informatics, vol. 9, no. 1, pp. 40–49, 2022.
[21] M. Hedyehzadeh, K. Maghooli, M. MomenGharibvand, and S. Pistorius, “A Comparison of the Efficiency of Using a Deep CNN Approach with Other Common Regression Methods for the Prediction of EGFR Expression in Glioblastoma Patients,” J. Digit. Imaging, 2020, https://doi.org/10.1007/s10278-019-00290-4.
[22] M. Hedyehzadeh, K. Maghooli, and M. MomenGharibvand, “Glioma grade detection using grasshopper optimization algorithm‐optimized machine learning methods: The Cancer Imaging Archive study,” Int. J. Imaging Syst. Technol., vol. 31, no. 3, pp. 1670–1677, 2021. https://doi.org/10.1002/ima.22536
[23] M. Hedyehzadeh, S. Y. D. Nezhad, and N. Safdarian, “EVALUATION OF CONVENTIONAL MACHINE LEARNING METHODS FOR BRAIN TUMOUR TYPE CLASSIFICATION,” COMPTES RENDUS L Acad. Bulg. DES Sci., vol. 73, no. 6, pp. 856–865, 2020. https://doi.org/10.7546/CRABS.2020.06.14
[24] M. Hedyehzadeh, J. Pu, S. Leilizadeh, S. Gezer, C. Dresser, and C. A. Beeche, “A Comparison of Deep and Conventional Regression Methods for MRI-Based Estimation of Survival Time in GBM Patients,” Available SSRN 4001112. https://doi.org/10.2139/ssrn.4001112
[25] A. Achak and M. Hedyehzadeh, “Determining the Differentiation of Benign and Malignant NME Lesions in Contrast-Enhanced Spectral Mammography Images Based on Convolutional Neural Networks,” J. Med. Biol. Eng., vol. 43, no. 5, pp. 585–595, 2023. https://doi.org/10.1007/s40846-02300814-y
[26] M. Hedyehzadeh and M. Yousefi, “Application of Machine Learning Methods to Predict the Survival Rate of Glioblastoma Patients Using MR Images,” J. Heal. Biomed. Informatics, vol. 11, no. 1, pp. 1–13, 2024. https://doi.org/10.34172/jhbmi.2024.09
[27] A. Achak and M. Hedyehzadeh, “Assessing the Efficiency of Deep Learning Methods in Estimating the Malignancy of Bi-Rads 4 Breast Lesions Using Contrast-enhanced Spectral Mammography Images,” Qom Univ. Med. Sci. J., vol. 17, no. 1, p. 0, 2023. https://doi.org/10.32598/qums.17.2756.1
[28] K. Clark et al., “The Cancer Imaging Archive (TCIA): maintaining and operating a public information repository,” J. Digit. Imaging, vol. 26, pp. 1045–1057, 2013. https://doi.org/10.1007/s10278-013-9622-7
[29] M. Ito and F. Ino, “An Automated Method for Generating Training Sets for Deep Learning based Image Registration.,” in BIOIMAGING, 2018, pp. 140–147. https://doi.org/10.5220/0006634501400147