افزایش دقت شبکههای عصبی کانولوشنی مبتنی بر مدل چهار-جریان با فیلترهای پردازش تصویر و نگاشت خطیساز فضای عدم تشابه
محورهای موضوعی : پردازش تصویر و ویدئو
زهرا حیدران داروقه امنیه
1
,
سید محمد جلال رستگار فاطمی
2
,
مریم رستگارپور
3
,
گلناز آقایی قزوینی
4
1 - گروه برق- واحد ساوه، دانشگاه آزاد اسلامی، ساوه، ایران
2 - گروه برق- واحد ساوه، دانشگاه آزاد اسلامی، ساوه، ایران
3 - گروه کامپیوتر- واحد ساوه، دانشگاه آزاد اسلامی، ساوه، ایران
4 - گروه کامپیوتر- واحد دولت آباد، دانشگاه آزاد اسلامی، دولت آباد، ایران
کلید واژه: یادگیری عمیق, مرجع, سیستم کانولوشنی, فضای برداری عدم تشابه, ماتریس عدم تشابه بازنمایی,
چکیده مقاله :
در سالهای اخیر با گسترش و موفقیت شبکههای کانولوشنی، موضوع یادگیری عمیق بیش از پیش مورد توجه قرار گرفته است. از آنجا که شبکههای کانولوشنی شامل لایه های زیادی هستند، یادگیری بهینه لایههای شبکه از اهمیت بالایی برخوردار است. در این مقاله، مدل جدیدی به نام چهار-جریان، با هدف کمک به خطی کردن فضای داده از طریق تبدیل عدم تشابه بازنمایی ارائه و تأثیر این تبدیل روی طبقه بندهای استاندارد برای داده های مصنوعی و تصاویر سیفار-10 بررسی و دو مدل مبتنی بر پیش پردازش داده با تبدیل عدم تشابه بازنمایی و فیلترهای سوبل و آشکارساز لبه تحلیل شده است. مدل چهار-جریان به دلیل بالا رفتن تعداد پارامترهای مدل و به تبع آن ظرفیت شبکه میزان 2/3 درصد افزایش دقت داشته است و اضافه نمودن بازنمایی عدم تشابه در جایی که طبقه بند نتواند با ویژگی های اصلی، تفکیک پذیری بالایی انجام دهد، می تواند تا حدودی با افزودن ویژگی های خطی به تفکیک پذیری کلاس ها کمک کند.
With the expansion and success of convolutional networks, the topic of deep learning has attracted increasing attention in recent years; Since convolutional networks include many layers, optimal learning of network layers is of great importance. In this paper, a new model, called the 4-stream model, is presented with the aim of helping to linearize the data space using representational dissimilarity transformation, and the effects of this transformation on standard classifications for artificial data and Cifar10 images are investigated. Then, two models based on data preprocessing with dissimilarity transform representation and Sobel and Edge Detector filters are analyzed. The 4-stream model increased the accuracy by 3.2% due to the increase in the number of model parameters, and hence the capacity of the network. Besides, adding the dissimilarity representation wherever the classifier cannot perform a high-resolution classification by merely using the main features, can help to increase the discriminability of classes by adding linear features.
