بهبود عملکرد تشخیص بیماری قلبی با ترکیب تبدیل کوچلیگرام و شبکه خودرمزنگار متغیر
محبوبه بحرینی
1
(
دانشکده مهندسی برق، واحد شیراز، دانشگاه آزاد اسلامی، شیراز، ایران
)
رامین براتی
2
(
دانشکده مهندسی برق، واحد شیراز، دانشگاه آزاد اسلامی، شیراز، ایران
)
عباس کمالی
3
(
دانشکده مهندسی برق، واحد شیراز، دانشگاه آزاد اسلامی، شیراز، ایران
)
کلید واژه: شبکه خود رمزنگار متغیر, ماشین بردار پشتیبان و K-نزدیکترین همسایه, تبدیل کوچلیگرام, تشخیص بیماری قلبی,
چکیده مقاله :
تشخیص اولیه صداهای غیرطبیعی قلب تا حد زیادی میتواند از مرگ ناگهانی ناشی از بیماریهای قلبی جلوگیری کند. یک روش کم هزینه و غیرهجومی برای تشخیص صداهای غیرطبیعی قلب، بکارگیری سیگنال PCG میباشد. دراین مقاله، بعد از قسمتبندی سیگنال صدای قلب، نمایش دو بعدی سیگنال توسط تبدیل کوچلیگرام حاصل میشود، سپس به کمک یادگیری عمیق و شبکه خودرمزنگار متغیر، ۴ ویژگی نهایی از هر سیگنال استخراج میشود. در نهایت از ماشین بردار پشتیبان و k-نزدیکترین همسایه با اعتبارسنجی k-fold برای طبقهبندی سیگنال صدای قلب به یکی از دستههای از پیش تعیینشدهی کلاس صدای نرمال و غیرنرمال استفاده میشود. در این پژوهش از پایگاه دادهی فیزیونت که دارای 3482 صدای قلب از یک مجموعه استاندارد جهت آموزش و ارزیابی روش پیشنهادی استفاده میشود. بهترین نتایج بدست آمده روش پیشنهادی جهت طبقهبندی دو کلاسه صدای قلب به ترتیب به دقت، حساسیت و ویژهبودن ۹۹.۵۵، ۹۸.۷۵ و ۹۹.۷۰ میباشد که توانایی بالاتر روش پیشنهادی در مقایسه با سایر روشهای موجود را اثبات میکند. از این سیستم تشخیص صداهای غیرنرمال میتوان به صورت بسیار مفید در مراکزدرمانی بهداشت روستایی و بیمارستانهای کوچک به منظور کمک به پزشکان بدون تخصص برای تشخیص مشکلات قلبی استفاده کرد.
چکیده انگلیسی :
Early detection of abnormal heart sounds can largely prevent sudden death caused by heart diseases. A low-cost and non-invasive method for detecting abnormal heart sounds is the use of PCG signal. In this article, after segmenting the heart sound signal, the two-dimensional representation of the signal is obtained by cochleogram transformation, then with the help of deep learning and variable autoencoder network, 4 final features are extracted from each signal. Finally, support vector machine and k-nearest neighbor with k-fold validation are used to classify the heart sound signal into one of the predetermined categories of normal and abnormal sound class. In this research, the Physionet database, which has 3482 heart sounds from a standard collection, is used to train and evaluate the proposed method. The best results of the proposed method for classifying the two classes of heart sounds are 99.55, 98.75 and 99.70 in terms of accuracy, sensitivity and specificity, which is the higher ability of the proposed method compared to other methods. This abnormal sound detection system can be used very usefully in rural health centers and small hospitals to help doctors without expertise to diagnose heart problems.
بانک فیلتر گاماتون اطلاعات فرکانس را از طریق تبدیل حلزون گوش استخراج می کند.
فضای پنهان از رمزگذارهای خودکار ویژگی های موثر و فشرده را برای طبقه بندی فراهم می کند.
رمزگذارهای خودکار در یادگیری بدون نظارت با فشرده سازی کارآمد ویژگی ها برتری می یابند.
رمزگذارهای خودکار که دربرابر نویز مقاوم هستند ،دقت را با استفاده از ویژگیهای پنهان فشرده بهبود میبخشند.
[1] Cardiovascular diseases (CVDs): WHO Fact Sheet. WHO (11 June 2021). https://www.who.int/en/news-room/fact-sheets/detail/cardiovascular-diseases-(cvds).
[2] E. Etchells, C. Bell and K. Robb, “Does this patient have an abnormal systolic murmur?,” Jama, vol. 277, no 7, pp. 564–571, 1997.
[3] S. Das, S. Pal and M. Mitra, “Deep learning approach of murmur detection using Cochleagram,” Biomedical Signal Processing and Control, vol. 1, no. 77, p. 103747, 2022, doi: 10.1016/j.bspc.2022.103747.
[4] S.K. Randhawa and M. Singh, “Classification of heart sound signals using multi-modal features,” Procedia Computer Science, vol. 58, pp. 165-171, 2015, doi: 10.1016/j.procs.2015.08.045 .
[5] F. Ghaderi, H. R. Mohseni and S. Sanei, "Localizing Heart Sounds in Respiratory Signals Using Singular Spectrum Analysis," in IEEE Transactions on Biomedical Engineering, vol. 58, no. 12, pp. 3360-3367, Dec. 2011, doi: 10.1109/TBME.2011.2162728.
[6] Y. Zeinali and S.T.A. Niaki, “Heart sound classification using signal processing and machine learning algorithms,” Machine Learning with Applications, vol. 7, p. 100206. 2022, doi: 10.1016/j.mlwa.2021.100206.
[7] F. Safara and A.R.A. Ramaiah, “RenyiBS: Renyi entropy basis selection from wavelet packet decomposition tree for phonocardiogram classification,” The Journal of Supercomputing, vol. 77, pp. 3710-3726, 2021, doi: 10.1007/s11227-020-03413-9.
[8] B. Daoud, K. Nayad, B. Braham and B. Messaoud, “Heart murmurs detection and characterization using wavelet analysis with Renyi entropy,” Journal of Mechanics in Medicine and Biology, vol. 17, no. 6, 2017, doi: 10.1142/S0219519417500932.
[9] E. Kay and A. Agarwal, "DropConnected neural network trained with diverse features for classifying heart sounds," Computing in Cardiology Conference (CinC), Vancouver, BC, Canada, 2016, pp. 617-620.
[10] G. Eslamizadeh and R. Barati, “Heart murmur detection based on wavelet transformation and a synergy between artifcial neural network and modified neighbor annealing methods,” Artif. Intell. Med., vol. 78, pp. 23-40, 2017, doi: 10.1016/j.artmed.2017.05.005.
[11] H. Li, Y. Ren, G. Zhang, R. Wang, J. Cui and W. Zhang, "Detection and Classification of Abnormities of First Heart Sound Using Empirical Wavelet Transform," in IEEE Access, vol. 7, pp. 139643-139652, 2019, doi: 10.1109/ACCESS.2019.2943705.
[12] H. Chowdhury, K. N. Poudel and Y. Hu, "Time-Frequency Analysis, Denoising, Compression, Segmentation, and Classification of PCG Signals," in IEEE Access, vol. 8, pp. 160882-160890, 2020, doi: 10.1109/ACCESS.2020.3020806.
[13] J. Chen, Y. Wang and D. Wang, "A Feature Study for Classification-Based Speech Separation at Low Signal-to-Noise Ratios," in IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 22, no. 12, pp. 1993-2002, Dec. 2014, doi: 10.1109/TASLP.2014.2359159.
[14] V. Maknickas and A. Maknickas, “Recognition of normal–abnormal phonocardiographic signals using deep convolutional neural networks and mel-frequency spectral coeffcients,” Physiol. Meas., vol. 38, no. 8, pp. 1671-1684, 2017, doi: 10.1088/1361-6579/aa7841.
[15] M. Hamidi, H. Ghassemian and M. Imani, “Classifcation of heart sound signal using curve ftting and fractal dimension,” Biomed. Signal Process. Control, vol. 39, pp. 351–359, 2018, doi: 10.1016/j.bspc.2017.08.002.
[16] M.S. Ahmad, J. Mir, M.O. Ullah, M.L.U.R. Shahid and M.A. Syed, “An effcient heart murmur recognition and cardiovascular disorders classifcation system,” Australas. Phys. Eng. Sci. Med., vol. 42, no. 3,pp. 733–743, 2019, doi: 10.1007/s13246-019-00778-x.
[17] G. Yaseen, Y. Son and S. Kwon, “Classifcation of heart sound signal using multiple features,” Appl. Sci., vol. 8, no. 12, 2018, doi: 10.3390/app8122344.
[18] P.T. Krishnan, P. Balasubramanian and S. Umapathy, “Automated heart sound classifcation system from unsegmented phonocardiogram (PCG) using deep neural network,” Phys. Eng. Sci. Med., vol. 43, no. 2, pp. 505–515,2020, doi: 10.1007/s13246-020-00851-w.
[19] S.L. Oh, V. Jahmunah, C.P. Ooi, R.-S. Tan, E.J. Ciaccio, T. Yamakawa, M. Tanabe, M. Kobayashi and U. Rajendra Acharya, “Classifcation of heart sound signals using a novel deep WaveNet model,” Comput. Methods Programs Biomed., vol. 196, p. 105604, 2020, doi: 10.1016/j.cmpb.2020.105604.
[20] P. Dhar, S. Dutta and V. Mukherjee, “Cross-wavelet assisted convolution neural network (AlexNet) approach for phonocardiogram signals classifcation,” Biomed. Signal Process. Control., vol. 63, p. 102142, 2021, doi: 10.1016/j.bspc.2020.102142 .
[21] . P. Dominguez-Morales, A. F. Jimenez-Fernandez, M. J. Dominguez-Morales and G. Jimenez-Moreno, "Deep Neural Networks for the Recognition and Classification of Heart Murmurs Using Neuromorphic Auditory Sensors," in IEEE Transactions on Biomedical Circuits and Systems, vol. 12, no. 1, pp. 24-34, Feb. 2018, doi: 10.1109/TBCAS.2017.2751545.
[22] S. Das, s. Pal and M. Mitra, “Acoustic feature based unsupervised approach of heart sound event detection,” Comput Biol Med., vol. 126, p. 103990, 2020, doi: 10.1016/j.compbiomed.2020.103990.
[23] C. Liu, D. Springer, Q. Li, B. Moody, R.A. Juan, F.J. Chorro, F. Castells, J.M. Roig, I. Silva, A.E.W. Johnson, Z. Syed, S.E. Schmidt, C.D. Papadaniil, L. Hadjileontiadis, H. Naseri, A. Moukadem, A. Dieterlen, C. Brandt, H. Tang, M. Samieinasab, M. R. Samieinasab, R. Sameni, R.G. Mark and G.D. Clifford, “An open access database for the evaluation of heart sound algorithms,” Physiol. Meas., vol. 37, no. 12, pp. 2181–2213, 2016, doi: 10.1088/0967-3334/37/12/2181.
[24] A.L. Goldberger, L.A.N. Amaral, L. Glass, J.M. Hausdorff, P.C. Ivanov, R.G. Mark, J. E. Mietus, G.B. Moody, C.-K. Peng and H.E. Stanley, “PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals,” Circulation, vol. 101, no. 23, 2000, doi: 10.1161/01.cir.101.23.e215.
[25] C. Xu, S.J. Chao, G. Jiang, X. Chen, Q. He and P. Xie, “Two-level multidomain feature extraction on sparse representation for motor imagery classifcation,” Biomedical Signal Processing and Control, vol. 62, p. 102160, 2020, doi: 10.1016/j.bspc.2020.102160.
[26] H. Chang and J. Yang, “Genetic-based feature selection for efcient motion imaging of a brain–computer interface framework,” Journal of neural engineering, vol. 15, no. 5, 2018, doi: 10.1088/1741-2552/aad567.
[27] P. Tan, X. Wang and Y. Wang, “Dimensionality reduction in evolutionary algorithms-based feature selection for motor imagery braincomputer interface,” Swarm and Evolutionary Computation, vol. 52, p. 100597, 2020, doi: 10.1016/j.swevo.2019.100597.
[28] Y. Baysal, S. Ketenci, I.H. Altas and T. Kayikcioglu, “Multi-objective symbiotic organism search algorithm for optimal feature selection in brain computer interfaces,” Expert Systems with Applications, vol. 165, no. 113907, 2021, doi: 10.1016/j.eswa.2020.113907.
[29] M. A. Nadoomi and S. Majid, “Using Ant Colony Algorithm and Pairwise Learning to Classify Attack in Intrusion Detection Systems,” Journal of Communication Engineering, vol. 9, no. 36, pp. 39–53, 2020 [in persian].
[30] I. Jamali, S. Javad Mirabedini and A. Haronabadi, “Offering a Model for Persian Texts Classify by Combination of Classification Methods,” Journal of Communication Engineering, vol. 10, no. 38, pp. 61-72, 2020 [in persian].
[31] F. Hajiani, Naser Parhizgar and Ahmad Keshavarz, “Hyperspectral Image Classification Using Low Rank Representation and Spectral-Spatial Information,” Journal of Southern Communication Engineering, vol. 11, no. 43, pp. 27-38, 2022, doi: 10.30495/jce.2022.689206 [in persian].
[32] M. Jalali and T. Sedghi, “Extraction of Multiple Hybrid Features to Reduce the Semantic Vacuum with the Semi-Supervised Classification,” ,” Journal of Southern Communication Engineering, vol. 12, no. 45, pp. 31-44, 2022, doi: 10.30495/jce.2022.691134 [in persian].
13 عنوان مقاله/نویسنده اول-نویسنده دوم-...
پژوهشی |
بهبود عملکرد تشخیص بیماری قلبی با ترکیب تبدیل کوچلیگرام و شبکه خود رمزنگار متغیر
1آدرس سازمانی نویسنده اول، first Author@mail.com
2آدرس سازمانی نویسنده دوم، second Author@mail.com
3آدرس سازمانی نویسنده سوم، third Author@mail.com
نویسنده مسئول *نام نویسنده مسئول مکاتبات، مرتبه علمی، آدرس سازمانی، Author@mail.com |
تشخیص اولیه صداهای غیرطبیعی قلب تا حد زیادی میتواند از مرگ ناگهانی ناشی از بیماریهای قلبی جلوگیری کند. یک روش کمهزینه و غیر هجومی برای تشخیص صداهای غیرطبیعی قلب، بهکارگیری سیگنال PCG است. در این مقاله، بعد از قسمتبندی سیگنال صدای قلب، نمایش دوبعدی سیگنال توسط تبدیل کوچلیگرام حاصل میشود، سپس به کمک یادگیری عمیق و شبکه خود رمزنگار متغیر، چهار ویژگی نهایی از هر سیگنال استخراج میشود. در نهایت از ماشین بردار پشتیبان و k-نزدیکترین همسایه با اعتبارسنجی K-fold برای طبقهبندی سیگنال صدای قلب، یکی از دستههای از پیش تعیینشده کلاس صدای نرمال و غیرنرمال استفاده میشود. در این پژوهش از مجموعهدادهی فیزیونت که دارای 3482 صدای قلب از یک مجموعه استاندارد جهت آموزش و ارزیابی روش پیشنهادی استفاده میشود. بهترین نتایج بهدستآمده روش پیشنهادی جهت طبقهبندی دو کلاسه صدای قلب به ترتیب بهدقت، حساسیت و ویژه بودن
55/99، 75/98 و 70/99 است که توانایی بالاتر روش پیشنهادی در مقایسه با سایر روشهای موجود را اثبات میکند. از این سیستم تشخیص صداهای غیرنرمال میتوان بهصورت بسیار مفید در مراکز درمانی بهداشت روستایی و بیمارستانهای کوچک بهمنظور کمک به پزشکان بدون تخصص برای تشخیص مشکلات قلبی استفاده کرد.
کلید واژهها: تبدیل کوچلیگرام، تشخیص بیماری قلبی، شبکه خود رمزنگار متغیر، ماشین بردار پشتیبان و K-نزدیکترین همسایه
تاریخ دریافت: 7 تیر 1401 تاریخ بازنگری: 1 مرداد 1401 تاریخ پذیرش: 29 شهریور 1401
|
https://doi.org/... |
1-مقدمه
بیماری قلبی عروقی یکی از مهمترین بیماریهای مهلک و نگرانکننده در کل دنیا است. بر اساس آمارهای منتشر شده ۳۲ درصد از مرگهای کل دنیا در سال ۲۰۱۹ به دلیل مرگ ناشی از بیماریهای قلبی عروقی بوده است [۱]. رشد روزافزون بیماریهای قلبی و عروقی و عوارض آنها و هزینههایی که به سیستم پزشکی جامعه وارد میکند باعث شده است که تحقیقات زیادی در زمینه بررسی روشهای شناسایی و تشخیص زودهنگام آن صورت پذیرد. اگرچه روشهای تشخیص و شناسایی متفاوتی ارائه شده است؛ اما اکثر آنها یا بسیار گران است و یا ماهیت هجومی دارد. روشهای هجومی هم میتوانند باعث ناراحتی بیمار شده وهم برای او مرگآفرین باشند. یکی از روشهای غیر هجومی، ارزان و ساده برای تشخیص اولیه بیماری قلبی، گوشکردن به صداها با استفاده از گوشی پزشکی است. هرچند که دقت این رویکرد بستگی زیادی به مهارت دکتر دارد [۲]. ازاینرو استتوسکوپ یا گوشی پزشکی بیش از هر وسیله پزشکی مورداستفاده پزشکان قرار میگیرد و فونوکاردیوگرافی (PCG) و یا ثبت گرافیکی سیگنال صدای قلب بهعنوان یک راهکار مؤثر بهمنظور تشخیص بیماریهای قلبی عروقی شناخته شده است. صدای قلب سالم دارای دو صدای واضح و مجزا به نامهای S1 و S2 میباشد و صداهای غیرعادی قلب، صدای گذر ناگهانی جریان خون از درون دریچه قلب است که ناشی از بازگشت خون از طریق دریچه سوراخدار، نقص جدار بطنی و یا جریان روبهجلو از طریق دریچههای باریک است. اکثرا این صداهای مبهم غیرطبیعی نشاندهنده مشکلات قلبی بوده؛ اما بعضاً نشان از هیچ مورد خاص بیماری نیست. صداهای غیرطبیعی قلب را میشود بر اساس مشخصههای فضایی آنها دستهبندی کرد. اگرچه روش PCG یک روش تشخیص بیماری قلبی است؛ اما عدم کارکرد مکانیکی قلب، شامل ایرادات عروقی یا نواقص SEPTAL ، با این روش قابلتشخیص نمیباشد. بطور یکه دستگاه PCG قابلیت تشخیص انسداد عروق کرونری را ندارد. اگرچه ECG یک روش استاندارد برای تشخیص نارسایی مکانیکی قلب است؛ اما بهنوعی یک روش پرهزینه است [2، 3]. همچنین نیاز به یک کارشناس حرفهای و آموزشدیده برای اخذ تصاویر، ارائه نظر کارشناسی و تفسیر صحیح دقیق دارد. سیستم خودکار بادقت بالا و هزینه کم، میتواند جایگزین قابلاعتمادی برای پزشکان در بیمارستانهای کوچک باشد. همچنین این روش نیاز به روشهای تشخیصی پرهزینه و تهاجمی را بهشدت کاهش میدهد.
در طول یک دهه اخیر، به دلیل پیشرفتهای حاصل در زمینه هوش مصنوعی، محققان به آنالیز و پردازش سیگنال PCG توسط روشهای یادگیری ماشین بهشدت علاقهمند شدهاند و تعداد قابلتوجهی از تحقیقات بر روی شناسایی و تشخیص صدای غیرطبیعی قلب و دستهبندی صداهای طبیعی و غیرطبیعی قلب انجام شده است، طور یکه اکثر این تحقیقات بر اساس ویژگیهای استخراج شده از حوزهی فرکانس [4، 6، 32] و حوزهی زمان - فرکانس است [7-12، 14، 15]. دلیل اصلی انتخاب ویژگی در حوزهی زمان - فرکانس، رفتار غیرایستا و شبهتناوبی سیگنالهای PCG است.
سافارا و همکاران، با استفاده از ترکیب تبدیل موجک بستهای و استخراج ویژگی مبتنی بر آنتروپی، راهکاری را برای دستهبندی صدای قلب بادقت ۹۶.۹۴ درصد پیشنهاد دادند [7]. با ترکیب ویژگی آنتروپی ضرایب موک بستهای با ویژگی توان ضرایب موجک رویکردی برای تشخیص صدای غیرطبیعی قلب (سیستولیک) [8] پیشنهاد شده است. علت رایج استفاده از تبدیل موجک و انواع آن در تحلیل و آنالیز سیگنال PCG، امکان دسترسی به محتوای زمان - فرکانس و تجزیه سیگنال بر اساس فرکانس مشخص (فرکانس پایین و فرکانس بالا) است. روش تبدیل موجک پیوسته CWT، بر اساس موجک مورلت، نمونهی دیگری است که برای تشخیص صداهای غیرطبیعی قلب پیشنهاد شده است [9، 10]. وارگیز و همکاران، روش تبدیل موجک تجربی (EWT) را برای آنالیز سیگنال صدای قلب پیشنهاد دادند [11]. EWT روشی است که ابتدا اجزاء فرکانس را پیدا میکند و سپس روش فیلترینگ را بر روی آن پیاده میکند. این فرایند، ترکیبی از تجزیه مد تجربی (EMD) و روش تجزیه تطبیقی تبدیل موجک (WT) است.
کیفیت تأثیر روشهای مبتنی بر WT وابسته به دو فاکتور مهم موجک مادر و تعداد سطوح تجزیه است. از دیگر ابزار پرکاربرد ویژگی حوزهی زمان-فرکانس، MFCC یا ویژگیهای ضرایب کپسترال مل فرکانسی است [12]. بعد از موفقیت چشمگیر استفاده از این روش در تجزیهوتحلیل گفتار و صدا، از آن برای آنالیز و بررسی سیگنال صدای قلب نیز استفاده شده است. ویژگی صوتی برگرفته از ضرایب کپسترال مل فرکانسی برگرفته از سیستم غیرخطی ادراک شنوایی انسان است و دارای 13 بعد است [13]. مکینتاش و همکاران، از روش MFCC برای دستهبندی سیگنال صدای طبیعی و غیرطبیعی قلب استفاده کردهاند [14و 30]. در روشهایی چون برازش منحنی برای استخراج مجموعهای از ویژگیهای فراکتال علاوه بر MFCC، به همین منظور استفاده شده است [15]. ویژگی MFCC، در حضور اعوجاج کم عملکرد خوبی دارد.
افت فاحش عملکرد این روش زمانی است که صداهای ضبط شده قلب تا حدودی با اغتشاشات و نویز آمیخته باشد که البته باتوجهبه روشهای دادهبرداری بدون کنترل قابلدرک است. روشهای یادگیری ماشین بهمنظور تجزیهوتحلیل PCG به ترتیب شامل مراحل (۱) استخراج ویژگیها، (۲) انتخاب ویژگیها (۳) و دستهبندی ویژگیها هستند. محققان بر اساس ویژگیهای انتخابیشان از انواع مختلف دستهبندیکنندهها استفاده میکنند. در سالهای اخیر اکثر محققین ترجیح میدهند از روشهای یادگیری عمیق برای دستهبندی صدای قلب استفاده کنند. در حال حاضر شبکه عصبی عمیق یکی از روشهای پراستفاده و مورد استقبال محققان در زمینههای مختلف است. پرتعدادی از تحقیقات، از شبکه عصبی عمیق DNN)) برای دستهبندی صدای قلب به دسته نرمال و غیرنرمال استفاده شده است [12، 17-15]. کریشنان و همکاران، برای دستهبندی صداهای قلب از 1081 نمونه ثبت شده PCG در مجموعه دیتا عمومی، برای آموزش و اعتبارسنجی مدلهای DNN پیشنهادی استفاده کرده است [18]. مدل WAVENET عمیق برای دستهبندی 5 نوع از صداهای غیرطبیعی قلب پیشنهاد شده است [19]. DNN فقط قادر به دستهبندی دیتاهای سری زمانی است درحالیکه CNN میتواند دیتاهای سری زمانی را به تصاویر تبدیل کند و بهعنوان لایه ورودی CNN به کار گیرد. [21،20، 14] مدلهای CNN به ترتیب در MFCC، تبدیل موج متقابل1 و سنسورهای شنوایی نورومورفیک (NAS)2 استفاده شده است. این ویژگیها برای توصیف سیگنال صدای قلب بهصورت تصویر مورداستفاده قرار گرفته است. همچنین در [۱۲] قابلیت بالای تبدیل کوچلیگرام برای طبقهبندی سیگنال PCG و بدون اعمال هیچگونه فیلتری (پیشپردازش) نشاندادهشده است [29، 31]. بانک فیلتر گاماتون با الگوبرداری از مدل بانک فیلتر سیستم شنوایی انسان، ویژگیهای کوچلیگرام را استخراج کرده است. با استفاده از ماتریس ویژگی 64 بعدی کوچلیگرام، یک مدل DNN ، برای دستهبندی صداهای طبیعی و غیرطبیعی قلب آموزشدادهشده است [۳].
در ادامه بخشبندی مقاله بهصورت زیر است. مواد و روشهای مورداستفاده در این کار در بخش (2) توضیح داده شده است. مجموعهدادهها، فرایند استخراج ویژگی و مدل دستهبندی در زیربخش (2) به طور خلاصه ارائه شده است. آزمایشها و نتایج دقیق در بخش (3) گزارش شده است. در بخش (4) خلاصه مباحث ذکرشده است و در نهایت، بخش (5) به نتیجهگیری تحقیق میپردازد.
2- مواد و روشها
1-2- تبدیل کوچلیگرام
بهطورکلی تبدیلهای زمان-فرکانس را میتوان به دودسته پویا و ایستا گروهبندی کرد. در روشهای پویا تلاش میشود که زمان بهصورت واقعی و نه انتزاعی نمایش داده شود. تبدیل کوچلیگرام در واقع همان اسپکتروگرام پویا یا اسپکتروگرام با مدل حلزونی گوش است و در آن از ضرایب کپسترال فرکانس گاماتون که یک ساختار فیلتر بانکی دارد برای استخراج اطلاعات فرکانسی استفاده میشود. ضرایب کپسترال فرکانس گاماتون مشابه ضرایب کپسترال فرکانس مل است و تنها تفاوت آن در نوع فیلتر و پهنای باند مربوط به آن است؛ طور یکه فیلتر استفاده شده در فیلتر گاماتون به کمک فیلترهای حلزونی مدل شده است. برای محاسبه ضرایب کپسترال فرکانسی گاماتون، اندازهی پاسخ فرکانسی بهدستآمده از اعمال تبدیل فوریه بر روی سیگنال صدای قلب، از فیلتر بانک گاماتون که بهصورت رابطه (۱) تعریف میشود عبور داده میشود:
(1)
که در رابطه بالا ERB پهنای باند مستطیلی متناظر با فرکانس است. که به کمک آن میتوان طیف هموارتری برای دامنه انتظار داشت. در نهایت لگاریتم طیف سیگنالهای میانگذر به حوزهی زمان انتقال داده میشود. ضرایب بدست آمده، ضرایب کپستروم گاماتون خواهد بود. بیان طیفی سیگنال صدای قلب به صورت ضرایب کپستروم گاماتون از نظر ویژگیهای طیفی محلی میتواند قابلیت بالایی در تمایز کلاسهای مختلف داشته باشد. با توجه به اینکه ضرایب طیف گاماتون در نتیجه لگاریتم اعداد حقیقی هستند به کمک تبدیل کسینوسی گسسته میتوان سیگنال حوزهی زمان را بازیابی کرد. از اینرو اگر ضرایب طیفی توان با Sk به ازای k=1,2, …, K نشان داده شود، ضرایب کپسترال فرکانس گاماتون به صورت رابطه (۲) بدست میآید:
(2)
در این مقاله از ۶۴ فیلتر گاماتون با ضریب پهنای باند 15 استفاده شده است.
2-2- ساختار روش پیشنهادی
در شکل (۱) تمام مراحل الگوریتم پیشنهادی به طور خلاصه نشاندادهشده است. در روش پیشنهادی، بعد از پیشپردازش اولیه، تبدیل کوچلیگرام سیگنال با بهکارگیری بانک فیلتر گاماتون بر روی هر پنجره از سیگنال اعمال میشود و سپس بردار بهدستآمده از تبدیل کوچلیگرام وارد شبکه خود رمزنگار میشود و از فضای پنهان آن بهعنوان ویژگی مؤثر استفاده میشود و در نهایت ویژگیهای بهدستآمده وارد تابع دستهبند میشوند و کلاس داده مشخص میگردد. در ادامه جزئیات بیشتری در مورد روش پیشنهادی ارائه میشود.
شکل 1: مراحل روش پیشنهادی
Figure 1. Steps of the Proposed Method
1-2-2- پایگاه داده
در این بخش از پایگاهداده PhysioNet-2016 برای اعتبارسنجی الگوریتم پیشنهادی مبتنی بر تشخیص صدای قلب استفاده شده است [۲۳، ۲۴] . این پایگاهداده شامل ثبت ۲۴۳۵ سیگنال صدای قلب شامل صداهای طبیعی و غیرطبیعی قلب است. اگرچه فرایند دستیابی دادهها با استفاده از دستگاههای ضبط مختلف انجام شده است، اما نتایج تمام ثبتها در فرکانس KHz۲ با استفاده از فیلتر تصحیح فرکانس دوباره نمونهبرداری میشوند (فیلتر تصحیح فرکانس فیلتری است که قبل از نمونه برداری سیگنال برای محدود کردن پهنای باند یک سیگنال مورد استفاده قرار میگیرد و از تئوری نمونه برداری نایکوئیست شانون استفاده میکند). بیشتر صداهای غیر طبیعی قلب از بیماران مبتلا به اختلالات دریچه قلب و انسداد عروق کرونری جمعآوری میشوند و جزئیات دیگری در دسترس نیست. با توجه به سیگنالهای موجود یک مجموعه داده شامل 3482 سیکل از صدای قلب بدست آمده که شامل دو کلاس صدای نرمال (۱۷۵۴) و کلاس غیرنرمال (۱۷۲۸) میباشد و از ۸۰% از کل دادهها برای آموزش و ۲۰% برای تست دسته بندی کننده استفاده شده است . دادههای آموزشی به دستههای ۱۲۸تایی تقسیم شدهاند. %30 از دادههای آموزشی برای اعتبارسنجی نگهداشته شده که به صورت تصادفی انتخاب و در هر دوره تغییر داده شدهاست.
2-2-2 پیشپردازش داده
پایگاهداده صداهای قلب PhysioNet از سراسر جهان با استفاده از سیستمهای مختلف دستیابی داده در محیطهای بالینی و غیربالینی جمعآوری میشوند؛ بنابراین در ابتدا دامنه دادههای PCG با استفاده از تکنیک Min-Max نرمالیزه شده است.
3-2-2- استخراج ویژگی اولیه با اعمال تبدیل کوچلیگرام
پس از پیشپردازش اولیه، فرایند استخراج ویژگی انجام شده است. در گام اولیه فرایند استخراج ویژگی، دادههای PCG با طول فریم ۶۴ میلیثانیه با شیفت ۱۰ میلیثانیه برای محاسبه تبدیل فوریه زمان کوتاه استفاده شده است. بهعنوانمثال، اگر فاصله زمانی صدای قلب ۱۵۸ میلیثانیه در نظر گرفته شود، درکل شامل ده فریم خواهد بود. نمونههای با طول ۴ میلیثانیه واقع در بخش انتهایی حذف خواهند شد. هر داده اضافی فراتر از چارچوب نهایی که کمتر از ms ۱۰ است، کنار گذاشته میشود. سپس از بانک فیلتر گاماتون ۶۴ فیلتری، دارای فرکانسهای مرکزی در محدوده Hz ۵۰ تا KHz ۱ برای به دست آوردن ماتریس ویژگی ۶۴ بعدی مربوط به تبدیل کوچلیگرام استفاده میشود. در شکل (۲) به عنوان نمونه یک سیگنال صوتی صدای نرمال و غیرنرمال قلب و کوچلیگرام مربوط به آن نشانداده شدهاست.
شکل 2: نمونه سیگنالهای صوتی طبیعی و غیر طبیعی قلب و خروجی مربوط به تبدیل کوچلیگرام آن
Figure 2. Samples of normal and abnormal sound signals of the heart and the output related to its cochleogram conversion
4-2-2- استخراج ویژگی با خودرمزنگار عمیق
خودرمزنگار نقش مهمی در یادگیری بدون نظارت ایفا می کند. بازسازی دادهها هدف اصلی این نوع شبکهها میباشد و اساسیترین مزیت این شبکهها استخراج ویژگیهای فشرده میباشد. به بیان دیگر خودرمزنگارها کارایی بسیار مناسبی در کاهش ابعاد و استخراج ویژگی و بازنمایی دادهها دارند و اخیراً مورد توجه پژوهشگران زیادی قرار گرفته است. بعد از اعمال تبدیل کوچلیگرام،ابعاد دادهی مسئله ۶۴ میباشد که افزونگی بسیاری دارد و برای حل مسئله کلاسبندی به تمامی مقادیر دادهها احتیاج نداریم با توجه به اینکه تعداد دادههای آموزشی محدود میباشد و برای بهبود عملکرد سیستم طبقهبندی و همچنین کاهش پیچیدگی محاسباتی نیاز به کاهش ابعاد دادهی ورودی داریم ، ساختار خودرمزنگار این امکان را فراهم میکند که با طراحی یک شبکه عمیق، بهترین ویژگیها از طریق لایه پنهان (latent) از هر سیگنال استخراج شود.
شکل 3: ساختار شبکه خودرمزنگار
Figure 3. Self-encrypting network structure
همانطور که در شکل (۳) مشخص است، ساختار کلی خودرمزنگارها به دو بخش رمزگذار و رمزگشا تقسیم میشود. در قسمت رمزگذار دادههای ورودی (خروجی فیلتربانک گاماتون) را به فضای پنهان نگاشت می کند (F بعد فضای ورودی و L بعد فضای پنهان است) که در این مقاله بعد فضای ویژگی ۴ در نظر گرفته شده است و در بخش رمزگشایی از فضای ویژگی ، دادههای اصلی بازسازی میشود. خودرمزنگار متغیر یا VAE یک نوع جدید از خودرمزنگارها میباشد که برای کاهش ابعاد دادههای نویزی از طریق فضای پنهان استفاده می شود. عملکرد کلی این شبکه مشابه یک خودرمزگذار معمولی است که مبتنی بر یادگیری بدون نظارت، یک بردار خروجی تولید کند که حدوداً مشابه بردار ورودی میباشد. تفاوت اصلی آن این است که فضای پنهان با پارامترهای یک توزیع احتمال مشخص میشود، به عبارتی خودرمزنگار متغیر مدل احتمالی خودرمزنگار کلاسیک میباشد. برای این منظور، تابع هزینه در خودرمزنگار متغیر ترکیبی از میانگین مربعات خطا و تابع KullbackLeibler است به همین دلیل خودرمزنگار متغیر قابلیت حذف نویز و دادههای پرت را دارد و فضای پنهان را می توان به عنوان بهترین و فشردهترین ویژگی ها برای بهبود دقت طبقه بندی در نظر گرفت.
-1-4-2-2- هایپرپارامترهای مورد استفاده در شبکه خودرمزنگار
به منظور همگرایی سریعتر شبکه خودرمزنگار، چندین هایپرپارامتر وجود دارد که باید آنها را به صورت سعی و خطا تنظیم کرد. در ادامه مهمترین آنها بررسی شده است:
۱. ابعاد فضای پنهان: این متغیر ابعاد نهایی فضای ویژگی را مشخص میکند. یک فضای پنهان با ابعاد کمتر میتواند ویژگیهای پیچیدهتری از دادههای ورودی را استخراج کند، اما ممکن است شبکه همگرا نگردد و یا دیرتر همگرا شود.
۲. نرخ یادگیری: همان گونه که از اسم این پارامتر مشخص است سرعت یادگیری توسط این پارامتر تعیین میگردد. نرخ یادگیری بالا سرعت یادگیری را افزایش میدهد، بااینحال ممکن است شبکه همگرا نگردد و نرخ یادگیری کوچک، همگرایی شبکه را طولانی میکند.
۳. اندازهی بچ: این پارامتر تعداد دادههای ورودی به شبکه را مشخص می کند. هرچقدر اندازهی بچ بزرگتر باشد همگرایی سریعتر میشود، اما فرایند آموزشی ثبات کمتری دارد.
۴. طراحی شبکه، تعداد لایهها و نرونهای هر لایه: این پارامتر عمق شبکههای رمزگذار و رمزگشا را مشخص میکند. هر چقدر شبکه عمیقتر باشد قابلیت یادگیری الگوهای پیچیدهتر را دارد، اما ممکن است به زمان آموزشی و منابع محاسباتی بیشتری نیز نیاز داشته باشد.
باتوجهبه اینکه تعیین مناسب این هایپرپارامترها میتواند تأثیر زیادی بر همگرایی و عملکرد نهایی شبکه داشته باشد، یکسری آزمایشها بهصورت سعی و خطا صورتگرفته است و مقادیری که بهترین نتیجه را داشتهاند برای الگوریتم پیشنهادی انتخاب شده است و در شکل (۲) جزئیات شبکه پیشنهادی نشاندادهشده است. همچنین نرخ یادگیری و اندازه بچ به ترتیب 0002/0 و 128 در نظر گرفته شده است.
شکل 4: شبکه خود رمزنگار برای استخراج ویژگی
Figure 4. Self-encrypting network for feature extraction
3-2 طبقه بندی
در نهایت، ویژگیهای استخراج شده به کمک یک تابع دستهبند مشخص دستهبندی میشوند برای اینکار توابع دستهبند زیادی وجود دارد که میتوان از آنها استفاده کرد، مانند تحلیل تفکیک خطی (LDA)، K- نزدیکترین همسایه (KNN)، ماشینهای بردار پشتیبان (SVM)، جنگلهای تصادفی و شبکههای عصبی (NN). در این پژوهش از تابع SVM و KNN برای طبقهبندی نهایی استفاده میشود که در پژوهشهای قبلی قابلیت این دستهبندها در کار با سیگنالهای حیاتی اثبات شده است [۲۵] روشی سریع با درصد صحت بالا، طبقهبندی را انجام میدهد؛ بنابراین دقت عملکرد به میزان زیادی بهبود مییابد. در این روش با استفاده از روشهای تکاملی، نمونهها میتوانند با حداقل مجموع فواصل درون خوشهای، خوشهبندی شوند و بهمنظور کاهش خطا در طبقهبندی، خوشهها در دورترین مکان نسبت به هم واقع شوند. همچنین به دلیل اینکه هایپرپارامترهای تابع دستهبند بر روی عملکرد نهایی سیستم تأثیرگذار است، یک سری بهینهسازی بر روی هایپرپارامترهای تابع دستهبند انجام میشود. در این مقاله یک تابع دستهبند SVM با هسته گاوسی 01/0= γ و 2=C و یک تابع دستهبند KNN با 5=K و بافاصله ماهالانویوس در نظر گفته میشود. در بخش بعدی نتایج بهدستآمده را گزارش میکنیم.
4 - 2 معیارهای ارزیابی
برای ارزیابی عملکرد روش پیشنهادی، بعد از تخمین ماتریس درهمریختگی محاسبه، دقت (Acc.)، حساسیت (Se.) و درصد ویژه بودن (Sp.) محاسبه میشود. نسبت نمونههای پیشبینیشده درست به تعداد کل نمونهها بهعنوان دقت شناخته میشود که اعتبار طبقهبندیکننده را اندازهگیری میکند. حساسیت بهعنوان نسبت نمونههای مثبت واقعی به همهی نمونههای که مثبت تشخیصدادهشدهاند. ویژه بودن بهعنوان نسبت موارد منفی واقعی به همهی نمونههای که منفی تشخیص داده شدهاند. روابط ریاضی برای محاسبه این معیارها عبارتاند از:
(3)
(4)
(5)
که در آن TP و TN تعداد نمونههایی هستند که به ترتیب در کلاسهای نرمال و غیرنرمال بهدرستی پیشبینیشدهاند. FP تعداد نمونههایی است که مدل به طور نادرست بهعنوان نرمال پیشبینی میکند و FN تعداد نمونههایی است که مدل بهاشتباه آنها را غیرنرمال پیشبینی میکند. همچنین برای گزارش نهایی مقادیر، اعتبارسنجی متقابل با ۵ لایه انجام میشود تا اطمینان حاصل گردد که هیچ بایاسی در عملکرد طبقهبندی وجود ندارد. در این مرحله، مجموعهدادهها به پنج زیر گروه افراز میشوند؛ از این ۵ زیر مجموعه هر بار ۴ زیر مجموعه برای آموزش و زیر مجموعه باقیمانده برای ارزیابی و تست استفاده میشود و این روال ۵ بار تکرار میشود بهطوریکه هر نمونه یکبار برای ارزیابی استفاده گردد. در نهایت میانگین این ۵ بار تست بهعنوان میزان عملکرد نهایی گزارش میشود.
۳- آنالیز و بحث
در این قسمت ابتدا آزمایشی را برای نشاندادن مزیت کاهش بعد توسط شبکه خود رمزنگار متغیر انجام میدهیم. سپس، رویکرد پیشنهادی خود را با سایر روشهای بهروز موجود مقایسه میکنیم تا مزیت و قابلیت رویکرد پیشنهادی خود را نشان دهیم. در ادامه ابتدا عملکرد رویکرد کاهش بعد مبتنی بر رویکرد پیشنهادی را با سه روش انتخاب ویژگی پیشرفته مقایسه میکنیم، همچنین حالتی که در آن انتخاب ویژگی صورت نمیپذیرد را بهعنوان روش پایه در نظر میگیریم. انتخاب ویژگی مبتنی بر الگوریتم ژنتیک (GA) [۲۶]، انتخاب ویژگی مبتنی بر الگوریتمهای تکاملی (EA) [۲۷]، و الگوریتم جستجوی ارگانیسمهای همزیست چندهدفه مرتبسازی غیرمسلط (NSMOSOS) [۲۸]، برای مقایسه استفاده شده است. نتایج عددی رویکرد پیشنهادی در جدول (1) خلاصه شده است.
جدول 1: بررسی عملکرد شبکه خود رمزنگار متغیر در کاهش ابعاد ورودی و مقایسه آن با شبکه خود رمزنگار کلاسیک و روشهای نوین دیگر
Table 1. Investigating the performance of the variable self-encryptor network in reducing input dimensions and comparing it with the classic self-encryptor network and other modern methods.
ویژه بودن | حساسیت | دقت | تابع دستهبند | کاهش ویژگی | مرجع |
۸۲.۱۹ | ۸۴.۳۸ | ۸۴.۲۲ | KNN | تمام ویژگیها | - |
۸۳.۷۲ | ۸۴.۶۲ | ۸۴.۵۶ | SVM | ||
۹۰.۱۹ | ۹۰.۲۷ | ۸۹.۹۰ | KNN | الگوریتم ژنتیک | [۲۶] |
۹۲.۶۵ | ۹۳.۳۷ | ۹۱.۲۲ | SVM | ||
۹۷.۵۶ | ۹۸.۳۸ | ۹۶.۴۹ | KNN | الگوریتم تکاملی | [۲۷] |
۹۸.۰۲ | ۹۸.۶۲ | ۹۷.۸۸ | SVM | ||
۹۷.۴۱ | ۹۸.۲۵ | ۹۷.۱۹ | KNN | جستجوی ارگانیسمهای همزیست | [۲۸] |
۹۸.۱۵ | ۹۸.۸۱ | ۹۸.۲۲ | SVM | ||
۹۸.۲۳ | ۹۸.۲۹ | ۹۸.۸۷ | KNN | خود رمزنگار کلاسیک | روش پیشنهادی |
۹۹.۱۴ | ۹۸.۳۷ | ۹۹.۰۲ | SVM | ||
۹۹.۲۱ | ۹۸.۶۲ | ۹۹.۴۳ | KNN | خود رمزنگار متغیر | روش پیشنهادی |
۹۹.۷۰ | ۹۸.۷۵ | ۹۹.۵۵ | SVM |
در این قسمت فرض شده است که تمام مراحل (پیشپردازش، استخراج ویژگی، طبقهبندیکننده) یکسان هستند و تنها تفاوت در مرحله کاهش بعد و انتخاب ویژگی است، سپس رویکرد پیشنهادی را بر اساس معیارهای دقت، حساسیت و ویژه بودن مقایسه میکنیم. اولین و بدیهیترین مشاهدات این است که استفاده از همه ویژگیها کمترین عملکرد را در طبقهبندی دارد که مشکل ابعاد بزرگ را نشان میدهد. همانطور که میبینیم، روش کاهش بعد مبتنی بر یادگیری عمیق پیشنهادی، قادر است که به عملکرد بالاتری نسبت به روشهای دیگر دست یابد. در مقایسه روش پیشنهادی مبتنی بر خود رمزنگار کلاسیک با خود رمزنگار متغیر، برتری ناچیز در روش خود رمزنگار متغیر مشخص است. برای نشاندادن مزیت اصلی روش خود رمزنگار متغیر حالتی را در نظر میگیریم که سیگنال ورودی با نویز گوسی همراه باشد. نتایج بهدستآمده از این سناریو در جدول (۲) نشاندادهشده است.
جدول 2: بررسی عملکرد شبکه خود رمزنگار متغیر در کاهش ابعاد ورودی و مقایسه آن با شبکه خود رمزنگار کلاسیک در حالت شرایط نویزی و با نسبت سیگنال به نویز dB3
Table 2. Investigating the performance of the variable self-encryptor network in reducing input dimensions and comparing it with the classic self-encryptor network in noisy conditions and with a signal-to-noise ratio of 3dB.
ویژه بودن | حساسیت | دقت | تابع دستهبند | کاهش ویژگی | مرجع |
۶۲.۳۳ | ۶۲.۷۶ | ۶۲.۸۸ | KNN | تمام ویژگیها | ----- |
۶۳.۸۷ | ۶۴.۵۵ | ۶۳.۷۸ | SVM | ||
۷۶.۰۹ | ۷۵.۱۲ | ۷۳.۸۸ | KNN | خود رمزنگار کلاسیک | روش پیشنهادی |
۷۹.۱۲ | ۷۸.۲۹ | ۷۸.۳۵ | SVM | ||
۸۲.۹۷ | ۸۱.۳۳ | ۸۲.۸۶ | KNN | خود رمزنگار متغیر | روش پیشنهادی |
۸۳.۴۲ | ۸۲.۳۲ | ۸۵.۹۱ | SVM |
جدول (2) نشان میدهد که با اضافهشدن سیگنال تنفسی به سیگنال PCG، عملکرد طبقهبندی کاهش مییابد. بااینحال، روش مبتنی بر خود رمزنگار متغیر عملکرد بهتری را در مقایسه با سایر خود رمزنگار کلاسیک نشان میدهد و این برتری به طور محسوس قابلمشاهده است. این توانایی، طرح پیشنهادی را برای طبقهبندی سیگنالهای PCG در میان نویز تنفسی بالا نشان میدهد. در نهایت عملکرد رویکرد پیشنهادی با تکنیکهای موجود مقایسه شده است. در جدول (3)، مقایسه کلی روش پیشنهادی با هفت تکنیک بهروز نشاندادهشده است. باید به این نکته اشاره کرد بهمنظور مقایسه منصفانه، مراجع با پایگاهداده مشابه با کار خودمان برای مقایسه انتخاب شده است.
جدول 3: مقایسه عملکرد روش پیشنهادی با جدیدترین روش¬های موجود
Table 3. Comparing the performance of the proposed method with the latest available methods.
ویژه بودن | حساسیت | دقت | روش کار | مرجع |
۹۴.۸۶ | ۹۹.۲۶ | ۹۷.۱۰ | استخراج ویژگی به کمک MFCC و MFSC و بهکارگیری شبکه عمیق | [۱۲] |
۸۷.۶۶ | ۸۰.۶۳ | ۸۴.۱۵ | استخراج ویژگی به کمک MFCC و بهکارگیری شبکه کانولوشنالی | [۱۴] |
۸۴.۷۵ | ۸۶.۷۳ | ۸۵.۶۵ | استخراج ویژگی از حوزهی زمان و شبکه عصبی عمیق | [۱۸] |
۹۸ | ۹۸ | ۹۸ | بهکارگیری تبدیل ویولت و شبکه عصبی کانولوشنالی | [۲۰] |
۹۲.۶۰ | ۹۳.۸۰ | ۹۱.۳۱ | استخراج ویژگی به کمک MFCC و تبدیل فوریه زمان کوتاه، بهکارگیری شبکههای عصبی کانولوشنالی و شبکه عصبی حافظهدار LSTM | [۳۱] |
۹۲.۶۰ | ۹۸.۲ | ۹۴.۵ | ترکیب ویژگیهای حوزهی زمان، فرکانس و زمان - فرکانس و بهکارگیری شبکه عصبی عمیق | [۳۲] |
۹۸.۴۵ | ۹۸.۲۰ | ۹۸.۳۳ | تبدیل کوچلیگرام و بهکارگیری شبکه عصبی عمیق | [۳] |
۹۹.۴۲ | ۹۹.۹۵ | ۹۹.۸۵ | ترکیب تبدیل کوچلیگرام و شبکه خود رمزنگار متغیر | روش پیشنهادی |
۴- نتیجهگیری
در این مقاله بهکارگیری شبکه خود رمزنگار متغیر برای استخراج ویژگی از بردار بهدستآمده از تبدیل کوچلیگرام را برای طبقهبندی صدای قلب موردمطالعه قرار دادهایم. یک مجموعهداده متعادل از سیگنال PCG نرمال و غیرنرمال شامل 3482 سیکل صدای قلب برای آموزش و ارزیابی روش پیشنهادی استفاده شده است. بانک فیلتر گاماتون برای هر فریم از سیگنال، یک بردار ۶۴ بعدی که معادل پاسخ فرکانسی سیستم شنوایی انسان است را تولید میکند. این فیلتر بانک برای استخراج ویژگی کوچلیگرام استفاده شده است و ثابت شده است که در پردازش صدای قلب بسیار دقیق و کارآمد است. در ادامه به کمک طراحی یک شبکه خود رمزنگار متغیر و با دسترسی به لایه پنهان این شبکه، ۱۰ ویژگی مفید استخراج میشود. به بیان دیگر از شبکه خود رمزنگار برای کاهش ابعاد استفاده شده است. یافتههای عددی، اثربخشی رویکرد پیشنهادی برای دستهبندی صدای قلب را اثبات میکنند طور یکه با استفاده از تابع دسته - بند SVM بهدقت ۹۹.۵۵، حساسیت ۹۸.۷۵ و ویژه بودن ۹۹.۷۰ دستیافتهایم. این مدل میتواند بهعنوان یک ابزار تشخیصی برای تشخیص ناهنجاریهای قلبی به پزشکان کمک کند. برای توسعه یک سیستم تشخیص بیماری قلبی مبتنی بر صدای قلب، این مدل میتواند توسط یک رایانه شخصی آموزش داده شود و بهعنوان یک سیستم قابلحمل برای مصارف بالینی استفاده شود.
مراجع
[1] Cardiovascular diseases (CVDs): WHO Fact Sheet. WHO (11 June 2021). https://www.who.int/en/news-room/fact-sheets/detail/cardiovascular-diseases-(cvds).
[2] E. Etchells, C. Bell, K. Robb, “Does this patient have an abnormal systolic murmur?,” Jama, vol. 277, no 7, pp. 564–571, 1997.
[3] S. Das, S. Pal, M. Mitra, “Deep learning approach of murmur detection using Cochleagram,” Biomedical Signal Processing and Control, vol. 1, no. 77, 2022.
[4] S.K. Randhawa, M. Singh, “Classification of heart sound signals using multi-modal features,” Procedia Computer Science, vol. 58, pp. 165-171, 2015.
[5] F. Ghaderi, H. R. Mohseni,S. Sanei, Localizing heart sounds in respiratory signals using singular spectrum analysis, IEEE Transactions on Biomedical Engineering, vol. 58, no. 12, pp. 3360-3367, 2011.
[6] Y. Zeinali, S.T.A. Niaki, “Heart sound classification using signal processing and machine learning algorithms,” Machine Learning with Applications, vol. 7, no. 100206. 2022
[7] F. Safara, A.R.A. Ramaiah, “RenyiBS: Renyi entropy basis selection from wavelet packet decomposition tree for phonocardiogram classification,” The Journal of Supercomputing, vol. 77, pp. 3710-3726, 2021
[8] B. Daoud, K. Nayad, B. Braham, B. Messaoud, Heart murmurs detection and characterization using wavelet analysis with Renyi entropy. Journal of Mechanics in Medicine and Biology, vol. 17, no. 6, 2017.
[9] E. Kay, A. Agarwal, Dropconnected neural network trained with diverse features for classifying heart sounds. In 2016 Computing in Cardiology Conference (CinC), pp. 617-620, 2016.
[10] G. Eslamizadeh, R. Barati, “Heart murmur detection based on wavelet transformation and a synergy between artifcial neural network and modified neighbor annealing methods,” Artif. Intell. Med., vol. 78, pp. 23-40, 2017.
[11] H. Li, Y. Ren, G. Zhang, R. Wang, J. Cui, W. Zhang, “Detection and classification of abnormities of first heart sound using empirical wavelet transform,” IEEE Access, vol. 7, pp. 139643-139652, 2019.
[12] T. H. Chowdhury, K. N. Poudel and Y. Hu, "Time-Frequency Analysis, Denoising, Compression, Segmentation, and Classification of PCG Signals," in IEEE Access, vol. 8, pp. 160882-160890, 2020.
[13] J. Chen, Y. Wang, DeLiang Wang, A feature study for classifcation-based speech separation at low signal-to-noise ratios, IEEE/ACM Trans. Audio Speech Lang. Process., vol. 22, no. 12, pp. 1993–2002, 2014.
[14] V. Maknickas, Algirdas Maknickas, Recognition of normal–abnormal phonocardiographic signals using deep convolutional neural networks and mel-frequency spectral coeffcients, Physiol. Meas., vol. 38, no. 8, 2017.
[15] M. Hamidi, H. Ghassemian, M. Imani, “Classifcation of heart sound signal using curve ftting and fractal dimension,” Biomed. Signal Process. Control, vol. 39, pp. 351–359, 2018.
[16] M.S. Ahmad, J. Mir, M.O. Ullah, M.L.U.R. Shahid, M.A. Syed, An effcient heart murmur recognition and cardiovascular disorders classifcation system, Australas. Phys. Eng. Sci. Med., vol. 42,no. 3,pp. 733–743, 2019.
[17] G. Yaseen, Y. Son, S. Kwon, Classifcation of heart sound signal using multiple features, Appl. Sci., vol. 8, no. 12, 2018.
[18] P.T. Krishnan, P. Balasubramanian, S. Umapathy, Automated heart sound classifcation system from unsegmented phonocardiogram (PCG) using deep neural network, Phys. Eng. Sci. Med., vol. 43, no. 2, pp. 505–515,2020.
[19] S.L. Oh, V. Jahmunah, C.P. Ooi, R.-S. Tan, E.J. Ciaccio, T. Yamakawa, M. Tanabe, M. Kobayashi, U. Rajendra Acharya, “Classifcation of heart sound signals using a novel deep WaveNet model,” Comput. Methods Programs Biomed., vol. 196, no. 105604, 2020.
[20] P. Dhar, S. Dutta, V. Mukherjee, “Cross-wavelet assisted convolution neural network (AlexNet) approach for phonocardiogram signals classifcation,” Biomed. Signal Process. Control., vol. 63,no. 102142, 2021.
[21] J.P. Dominguez-Morales, A.F. Jimenez-Fernandez, M.J. Dominguez-Morales, G. Jimenez-Moreno, Deep neural networks for the recognition and classifcation of heart murmurs using neuromorphic auditory sensors, IEEE Trans. Biomed. Circuits Syst., vol. 12, no. 1, pp. 24–34, 2018.
[22] S. Das, s. Pal, M. Mitra, Acoustic feature based unsupervised approach of heart sound event detection, Comput Biol Med., vol. 126,no. 103990, 2020.
[23] C. Liu, D. Springer, Q. Li, B. Moody, R.A. Juan, F.J. Chorro, F. Castells, J.M. Roig, I. Silva, A.E.W. Johnson, Z. Syed, S.E. Schmidt, C.D. Papadaniil, L. Hadjileontiadis, H. Naseri, A. Moukadem, A. Dieterlen, C. Brandt, H. Tang, M. Samieinasab, M. R. Samieinasab, R. Sameni, R.G. Mark, G.D. Clifford, An open access database for the evaluation of heart sound algorithms, Physiol. Meas., vol. 37, no. 12, pp. 2181–2213, 2016.
[24] A.L. Goldberger, L.A.N. Amaral, L. Glass, J.M. Hausdorff, P.C. Ivanov, R.G. Mark, J. E. Mietus, G.B. Moody, C.-K. Peng, H.E. Stanley, PhysioBank, PhysioToolkit, and PhysioNet: components of a new research resource for complex physiologic signals, Circulation, vol. 101, no. 23, 2000.
[25] C. Xu, S.J. Chao, G. Jiang, X. Chen, Q. He, P. Xie, Two-level multidomain feature extraction on sparse representation for motor imagery classifcation. Biomedical Signal Processing and Control, vol. 62, no. 102160, 2020.
[26] H. Chang, J. Yang, “Genetic-based feature selection for efcient motion imaging of a brain–computer interface framework,” Journal of neural engineering, vol. 15, no. 5, 2018.
[27] P. Tan, X. Wang, Y. Wang, “Dimensionality reduction in evolutionary algorithms-based feature selection for motor imagery braincomputer interface,” Swarm and Evolutionary Computation, vol. 52, no. 100597, 2020.
[28] Y. Baysal, S. Ketenci, I.H. Altas, T. Kayikcioglu, “Multi-objective symbiotic organism search algorithm for optimal feature selection in brain computer interfaces,” Expert Systems with Applications, vol. 165, no. 113907, 2021.
[29] M. A. Nadoomi, S. Majid, “Using Ant Colony Algorithm and Pairwise Learning to Classify Attack in Intrusion Detection Systems,” Journal of Communication Engineering, vol: 9, no. 36, pp. 39–53, 2020.
[30] I. Jamali, S.Javad Mirabedini and A. Haronabadi, “Offering a Model for Persian Texts Classify by Combination of Classification Methods,” Journal of Communication Engineering, vol. 10, no. 38, pp. 61-72, 2020.
[31] F. Hajiani, Naser Parhizgar and Ahmad Keshavarz,” Hyperspectral Image Classification Using Low Rank Representation and Spectral-Spatial Information,” Journal of Communication Engineering, vol. 11, no. 43, pp. 27-38, 2022.
[32] M. Jalali, T. Sedghi, “Extraction of Multiple Hybrid Features to Reduce the Semantic Vacuum with the Semi-Supervised Classification,” ,” Journal of Communication Engineering, vol. 12, no. 45, pp. 31-44, 2022.
Improving the Performance of Heart Disease Diagnosis by Combining the Cochleogram Transformation and Variable Auto-Encoder (VAE) Network
|
Abstract
Received: 21 October 2021 Revised: 16 January 2022 Accepted: 10 February 2022
|
Keywords: Cochleogram Transformation, Heart Disease Diagnosis, Variable Auto-Encoder (VAE) Network, Support Vector Machine and K-Nearest Neighbor (KNN)
[1] Coss-Wavelet Transform
[2] Nerumorphic Auditory Sensors