Manuscript ID : JNRM-2105-2091 (R1) Visit : 125 Page: 0 - 0

Article Type: Original Research

Developing principles of neuron network based on the principle of expanding “Zadeh” with fuzzy’s parameters

Subject Areas : Statistics

sharif Malakooti ¹ , Reza Kargar ^{2
*} , zohreh Taeb ³ , Hadi Bagezadeh ⁴

1 - گروه ریاضی کاربردی، دانشکده علوم پایه، واحد یادگار امام (ره)، دانشگاه آزاد اسلامی، تهران، ایران
2 - گروه ریاضی کاربردی، دانشکده علوم پایه، واحد قم، دانشگاه آزاد اسلامی، قم، ایران
3 - گروه ریاضی کاربردی، دانشکده علوم پایه، واحد یادگار امام (ره)، دانشگاه آزاد اسلامی، تهران، ایران
4 - گروه ریاضی کاربردی، دانشکده علوم پایه، واحد یادگار امام (ره)، دانشگاه آزاد اسلامی، تهران، ایران

Received: 2021-06-19 Accepted : 2021-10-16 Published : 2024-08-13

Keywords: expansion, artificial neural network, fuzzy logic, , fuzzy discretization, Backpropagation algorithm, Zade&quot, Principle of &quot,

Abstract :

شبکههای عصبی فازی به دلیل عدم استفاده از اصل گسترش "زاده" قادر به اعمال مفهوم فازی در ساختار شبکه نیستند. در این مقاله سعی شده است که اصل گسترش زاده را به صورت گسسته بیان کنیم سپس این اصل در الگوریتم پسا انتشار است. در این مقاله ابتدا مختصری از شبکه عصبی پسا انتشار بیان میشود.

در ادامه مقاله، مطالب زیر دنبال میشود: بخش دوم تعاریف مختصر از شبکه عصبی و پس انتشار الگوریتم و مفاهیم اولیه فازی و اصل گسترش بیان میگردد.

بخش سوم معایب روشهایی که مبتنی بر اصل گسترش نمیباشند، بیان میگردد سپس با جایگزینی چهار عملگر اصلی که طبق اصل گسترش زاده باز تعریف شدهاند روشی تازه ارائه میگردد. بخش چهارم یک مثال مطرح میشود که حل آن توسط روش ارایه شده در بخش سوم خواهد بود در بخش پنجم به جمعبندی نتایح روش ارایه شده پرداخته خواهد شد.

References:

[1] Simon Haykin]McMaster University Hamilton, Ontario, Canada Neural Networks and Learning Machines 2009.
[2] [Honkela], T., 2007. “Philosphical aspects of neural, probabilistic and fuzzy modeling of language use and translation,” Proceedings of IJCNN, International Joint Conference on Neural Networks, pp. 2881–2886, Orlando, FL, August.
[3] [Hush], D., P. Kelly, C. Scovel, and I. Steinwart, 2006. “QP algorithms with guaranteed accuracy and run time for support vector machines,” J. Machine Learning Research, vol. 7, pp. 733–769.
[4] [Kruse] Kruse/Gebhardt/Klawonn, Fuzzy-Systeme, Teubner Stuttgart 1993[Hayashi] Y. Hayashi, J. Buckley, E. Czogola, Direct Fuzzification of Neural Networks and Fuzzified Delta Rule, Iizuka, Japan 1992, Proc. 2nd Intern. Conf. on Fuzzy Logic and Neural Networks, pp. 73-76.
[5] [Lin] C.-T. Lin, C. Lee, Neural-Network-Based Fuzzy Logic Control and Decision System, IEEE Transactions on Computers, Vol. 40, Nr. 12, S 1320- 1336, 1991
[6] [Okada] Hiroyuki Okada et. al., Knowledge Implementation Multilayer Neural Networks with Fuzzy Logic, Proceedings of the International Conference on Fuzzy Logic & Neural Networks, Iizuka, Japan 1990, pp. 99-102
[7] [Brause] Ruediger Brause, Neuronale Netze, Teubner Stuttgart 1991
[8] [Ro jas] Raul Ro jas, Theorie der neuronalen Netze, Springer-Verlag Berlin Heidelberg New York 1993.
[9] Krishnamraju, P. V., Buckley, J. J., Rcilly, K. D., and Hayashi, Y., Genetic learning algorithms for fuzzy neural nets, Proceedings of FUZZ-IEEE'94, Orlando, 1969-1974, 1994.
[10] Zadeh, L. A., The concept of a linguistic variable and its application to approximate reasoning. I, lI, lII, Inform. Sci. 8, 199-249, 301-357: 9, 43 80, 1975.
[11] Web of Neural Network And Deep Learning
[12] Neural Networks and Learning Machines , Simon Haykin ,2008
[13] رساله دکتری رضا کارگر استاد راهنما فرهاد حسین زاده و... دانشگاه آزاد اسلامی واحد علوم تحقیقات دانشکده علوم پایه زمستان 92
[14]محمد جواد اصغر پور ، تصمیم گیری های چند معیاره انتشارات دانشگاه تهران چاپ ششم 1387 .

Full-Text:

توسعه مبانی شبکه عصبی بر پایه اصل گسترش "زاده" با داده های فازی

چکیده

شبکه های عصبی فازی به دلیل عدم استفاده از اصل گسترش "زاده" قادر به اعمال مفهوم فازی در ساختار شبکه نیستند در این مقاله سعی شده است که اصل گسترش زاده را به صورت گسسته بیان کنیم سپس این اصل در الگوریتم پسا انتشار است در این مقاله ابتدا مختصری از شبکه عصبی پسا انتشار بیان می شود .

در ادامه مقاله، مطالب زیر دنبال می شود: بخش دوم تعاریف مختصر از شبکه عصبی و پس انتشار الگوریتم و مفاهیم اولیه فازی و اصل گسترش بیان می گردد.

بخش سوم معایب روشهایی که مبتنی بر اصل گسترش نمی باشند بیان میگردد سپس با جایگزینی ۴ اپراتور اصلی که طبق اصل گسترش زاده باز تعریف شده اند روشی تازه ارائه می گردد. بخش چهارم یک مثال مطرح می شود که حل آن توسط روش ارایه شده در بخش سوم خواهد بود در بخش پنجم به جمع بندی نتایح روش ارایه شده پرداخته خواهد شد.

کلمات کلیدی:

شبکه عصبی مصنوعی ، منطق فازی ، الگوریتم پسا انتشار، اصل گسترش "زاده" ،

1- مقدمه :

در طول دهه گذشته یا بیشتر، پیشرفت‌های قابل‌توجهی در دو حوزه تکنولوژیکی متمایز صورت‌گرفته است: منطق فازی و شبکه‌های محاسباتی . نظریه منطق فازی یک چارچوب ریاضی برای درک عدم قطعیت‌های مرتبط با فرآیندهای شناختی انسان، مانند تفکر و استدلال فراهم می‌کند. همچنین، ساختار ریاضی را برای تقلید از ویژگی‌های ادراکی و زبانی خاص مرتبط با شناخت انسان فراهم می‌کند. از سوی دیگر، الگوهای شبکه عصبی محاسباتی در فرآیند درک یادگیری باور نکردنی و ویژگی‌های تطبیقی مکانیزم‌های عصبی ذاتی در گونه‌های بیولوژیکی خاص ،تکامل یافته‌اند. شبکه‌های عصبی محاسباتی، در مقیاس کوچک، برخی از عملیات محاسباتی مشاهده‌شده در یادگیری و سازگاری زیستی را تکرار می‌کنند. یکپارچه‌سازی این دو زمینه، منطق فازی و شبکه‌های عصبی؛ یک زمینه تکنولوژیکی نوظهور - شبکه‌های عصبی فازی - را به وجود آورده‌است. شبکه‌های عصبی فازی این پتانسیل را دارند که مزایای دو زمینه جذاب، یعنی منطق فازی و شبکه‌های عصبی را در یک کپسول واحد ارائه دهند.

رویکردهای مختلفی برای ترکیب منطق فازی و شبکه های عصبی ارائه شده است. این رویکردها می توانند در چندین دسته طبقه بندی شوند. مثال زیر یک نمونه از چنین طبقه بندی شبکه های عصبی فازی است.

دسته 1: سیستم های مبتنی بر قاعده فازی با توانایی یادگیری.

دسته 2: سیستم های فازی نشان داده شده توسط معماری شبکه.

دسته 3: شبکه های عصبی برای استدلال فازی.

دسته 4: شبکه های عصبی فازی.

دسته 5: رویکردهای دیگر.[1]

نمونه های معمولی دسته اول سیستم های فازی قابل آموزش توسط واتانابه و ایشیبوچی و نومورا ¹ و و همکاران هستند.سیستم های فازی انطباقی توسط وانگ را نیز می توان در این دسته طبقه بندی کرد [2], [3]. قوانین فازی در سیستم های فازی از داده های ورودی-خروجی با روش کاهشی آموزش داده می شود که مشابه الگوریتم پس انتشار برای شبکه های عصبی است [4].

در میان این روشها، فقط شبکه عصبی فازی (FNN) توانایی ترکیب یادگیری شبکه های عصبی و تفسیرپذیری مبتنی بر قوانین پایه ای سیستمهای فازی را دارد[5و6].

با این وجود در کاربردهای عملی دو مشکل مهم و اصلی برای طراحی شبکه عصبی فازی مطرح می شود:

نحوه مشخص کردن اندازه شبکه

شیوه تنظیم و سازگار کردن پارامترها

برای تعیین اندازه FNN، چندین FNN خودسازمانده پیشنهاد شده است. برای مثال وانگ و همکارانش یک طرح خودسازمانده آنلاین، دقیق و سریع را برای FNN ،(FAOS-PFNN) در مدل‌سازی سیستم‌های غیرخطی معرفی کردند. FAOS-PFNN قادر به تنطیم ساختار خود با تکیه بر خطای مدل‌سازی در فرایند آموزش می‌باشد. نتایج نشان می‌دهد که FAOS-PFNN می‌تواند یک ساختار فشرده و مدل‌سازی بسیار دقیقی را به دست آورد.

روش های ذکر شده، تنها می‌توانند عصب‌های اضافی را در فرآیند یادگیری حذف کنند. این روش‌ها، از بار محاسباتی سنگینی برخوردارند، زیرا اکثر زمان آموزش، صرف فرآیند آموزش می‌‌شود که بیش از حد نیاز است. در اغلب FNNهای خودسازمانده، طراحی ساختار نسبت به شناسایی پارامترها از اهمیت بالاتری برخوردار می باشند.

به منظور تنظیم پارامترهای FNN، الگوریتم پسا انتشار ²به عنوان یکی از پرتکرارترین تکنیک‌ها مورد استفاده قرار گرفته است. اما آنچنانکه در مقالات به وفور دیده می‌شود، الگوریتم BP از زمان آموزش بسیار بالا و کمترین موضعی‌سازی رنج می‌برد. برای بهبود عملکرد آموزش، از یک الگوریتم آموزش هیبریدی تسریع‌یافته با ترکیب تکنیک‌های خوشه‌بندی در یک ورژن سازگار از الگوریتم BP برای FNNهای آموزشی استفاده می شود. ژائو و همکارانش یک روش بهینه‌سازی لونبرگ-مارکارد (LM) را با استفاده از یک رویکرد آموزشی گرادیان یکپارچه توسعه دادند تا تقریب دقیق‌تری را به دست آورند. ایرادی که بر الگوریتم LM و نوع‌های دیگر آن وارد است، افزایش الزامات حافظه، ناشی از محاسبه ماتریس ژاکوبین تابع خطا است. مساله دیگر اینکه این الگوریتم هنوز هم یک روش بهینه‌سازی موضعی است.

ماشینچی و همکارانش یک روش آموزش مبتنی بر الگوریتم ژنتیک دوفازی (GA) را پیشنهاد دادند که در آن FNN مبتنی بر GA، می‌تواند وزن‌های فاز بهینه را تخمین زده و برآورد خوبی از شکل تابع عضویت ارائه دهد. همچنین مائو و همکارانش یک شبکه عصب فازی را بر اساس روش بهینه‌سازی ازدحام ذرات (IOAP-FNN) ابداع کردند. این روش می‌تواند رابطه بین سیگنال‌های شناسایی فرکانس رادیو و موقعیت یک سبد خرید را تعیین کند و نتایج مدل‌سازی، اثربخشی روش را ثابت می کند. الگوریتم‌های تکاملی جدیدتری جهت بهینه‌سازی پارامترهای FNN معرفی شد که از زمان اجزایی بالایی برخوردار می باشند. [7]

ایشیبوچی و همکاران ، معماری شبکه عصبی فازی با اعداد مثلثی فازی متقارن را برای اوزان ، بایاس و ورودیهای فازی پیشنهاد کرد ، که با حد پایین ، وسط و بالا اعداد مثلث فازی مشخص می شود .[8]

بر اساس کار ایشیبوچی که در آن از وزن فازی مثلثی استفاده می شود ، یک الگوریتم یادگیری ایجاد کرد که در آن از الگوریتم برای محاسبه اوزان استفاده می شود. مقدار وزن فازی جدید به عنوان پارامترهای جدید محسوب می شود.

در این مقاله ما یک شبکه فازی ارائه میدهیم که رابطهای ورودی و خروجی بر اساس اصل گسترشزاده باز تعریف شده است.

با توجه به نوع ورودیها و اوزان سه نوع شبکه عصبی فازی معرفی خواهیم کرد:

الف) وزن قطعی و ورودی فازی

ب) وزن فازی و ورودی قطعی ³

ج) ورودی و اوزان هر دو فازی هستند.

در این مقاله در خصوص حالت (ج) که همه موارد قبلی را هم مشمول میشود و (کلیت) دارد بررسی و مطالعه انجام خواهد شد.

تحقیق و مطالعه در این موضع دو خاصیت و ویژگی دارد یکی در موضوع هوش مصنوعی که قابلیت عملکرد مستقل آن با استفاده از آموزش و یادگیری از طریق آموزش که خود امکان سازگاری با شرایط جدیدی را در پی خواهد داشت و دیگری منطق فازی به عنوان ابزاری برای توصیف دانش فازی (حلقه واصل جهان طبیعت با علم ریاضی) است. که در این تحقیق سعی بر استفاده از ترکیب هر دو موارد و استفاده از مزایای آن شده است قبلا هم در این خصوص اقداماتی صورت گرفته که در اینجا سعی بر تکمیل این ویژگی و استفاده از اصل گسترش‌زاده در همة جوانب شده است. بالاخص در محاسبات حاصلضرب اوزان بر ورودیهای فازی و مجموع آن با بایاس است که موجب محاسبات دقیق‌‌تر و نهایتاً تصمیم‌گیری صحیح‌تر خواهد شد.

در مقالات‎ ‎[15]و‎]16]و ‎]17] و ‎]18] نیز اشاره به این موضوعات شده است.

2- مفاهیم اولیه

2-1 شبکه عصبی مصنوعی:

شبکه عصبی مصنوعی⁴ یک الگوریتم محاسباتی توزیع شده بر اساس ساختار سیستم عصبی انسان است. معماری یک شبکه عصبی با اتصال چندین پردازنده ابتدایی شکل می گیرد ، این یک سیستم تطبیقی است که دارای الگوریتمی برای تنظیم اوزن و پارامترهای آزاد برای دستیابی به کارایی مورد نیاز مسئله بر اساس نمونه داده نماینده است [9].

استفاده از شبکه های عصبی در بسیاری از زمینه های تحقیقاتی گسترش و رشد یافته است به ویژه روش بسیار مهمی برای پیش بینی سری های زمانی و تشخیص الگومی باشد.

یکی از انواع شبکه های عصبی نظارتی که در مطالعه ما بیشتر مورد توجه قرار خواهد گرفت، شبکه مبتنی برپسا انتشار است . این نوع شبکه بیشتر در زمینه های ذکر شده در بالا مورد استفاده قرار می گیرد.

این شبکه عصبی مبتنی بر یادگیری نظارت شده است ، که شبکه با داشتن مقادیر صحیح ورودی و خروجی کار می کند و شبکه وزنه های یالهای خود را تنظیم و اصلاح می کند تا خطای خروجی محاسبه شده را به حداقل برساند.

اوزان شبکه عصبی در مرحله یادگیری از اهمیت ویژه برخورداراست ، و بر عملکرد فرایند یادگیری شبکه عصبی تأثیر به سزایی دارد.

مهمترین ویژگی شبکه های عصبی مصنوعی توانایی آنها در یادگیری از مجموعه ای از الگوهای آموزشی است ، یعنی قادر به یافتن مدلی متناسب با داده های جدید است [9] .

نورون مصنوعی از چندین قسمت تشکیل شده است (شکل 1 را ببینید). در یک طرف ورودی ها ، اوزن ، مجموع و در آخر تابع فعال وجود دارد. مقادیر ورودی دراوزان ضرب می شوند و در نهایت با هم جمع خواهند شد.

(1-2)

این تابع با اضافه کردن مقدار آستانه تکمیل می شود که مقدار آستانه(بایاس) در شبکه عصبی برابر با مقدار ۱+ می باشد.

, (2-2)

بعد از اضافه کردن مقدار آستانه در ادامه تابع f را به مجموع بالا اعمال می کنیم ، نتیجه مقدار نهایی خروجی است که با نمایش داده می شود ،

(3-2)

با اعمال تابع به مجموع رابطه (1) در نهایت مقدار خروجی به دست خواهد آمد که تابع میتواند یک تابع غیرخطی با ارزش باینری 1+ یا 1- باشد یا یک تابع خطی و یا یک تابع لوجستیک سیگموئید به فرمول زیر میباشد.[10]

شکل۱

2-1-1 الگوریتم پسا انتشار⁵

کارهای زیادی در خصوص تنظیم یا کنترل اوزان وجود دارد اما در این تحقیق مهمترین آن که الگوریتم پسا انتشار است مورد بررسی قرار خواهد گرفت [11], [12] .

در این روش، در هر دور (یعنی در هر تکرار) دو مرحله خواهیم داشت. مرحله‌ی اول حرکت رو به جلو(پیشرو) ⁶است ، با ضربِ داده‌های ورودی در وزن‌ها و سپس جمع آن با مقدار آستانه⁷ انجام می‌شود. سرانجام در همان مرحله‌ی اول به یک خروجی می‌رسیم که احتمالاً با خروجیِ واقعی تفاوت دارد. اینجاست که توسط تابع خطا(زیان) مشخص می‌کنیم که مرحله‌ی پیشرو چه مقدار خطایی داشته است . حال که فهمیدیم الگوریتم با توجه به وزن‌ها و انحراف‌ها چه مقدار خطایی دارد، به مرحله‌ی دوم می‌رویم. در این مرحله می‌توانیم به عقب بازگشته و وزن‌ها و انحراف‌ها را ‌هنگام‌سازی کنیم، یعنی وزن‌ها و انحراف‌ها را به شکلی تغییر دهیم تا در تکرارِ بعدی نتیجه‌ای نزدیک‌تر به خروجیِ واقعی و با خطای کم‌تر را تولید کنند. این تکرار پیشرو و پسا انتشار آنقدر انجام می‌شود تا خروجیِ شبکه برای تمامیِ داده‌های آموزشی به نزدیک‌ترین مقدارِ واقعیِ خود . به این ترتیب الگوریتم یاد گرفته و از این به بعد می‌تواند با مشاهده‌ی ویژگی‌های یک داده که تا حالا ندیده است، تصمیم بگیرد.نرخ یادگیری انطباقی ، با اجازه دادن به تغییرات در میزان یادگیری در فرایند آموزش (افزایش یا کاهش) می توان بر بهبود عملکرد الگوریتم تاثیر به سزای گذاشت [13].

در خصوص الگوریتم پسا انتشار لازم به توضیح است که با توجه به همگرایی گرادیان کاهشی و تحت تاثیر یودن الگوریتم از آن این الگوریتم نیز همگرا خواهد بود و اوزان در جهت کاهشی تغییر خواهد کرد. در ادامه به بیان ریاضی الگوریتم پسا انتشاردرساختار شبکه عصبی می پردازیم [14] .

شکل 2 را در نظر بگیرید :

-1

شکل 2

همانطور که در تصویر مشخص شده نورون j توسط مجموعه سیگنالهای فعالی تغذیه می شود که توسط یک لایه نورون در سمت چپ آن تولید شده است. مقدار حاصل مجموع ورودیهای تابع فعال مرتبط با نورون j می باشد، پس می توان نوشت:

(4-2)

که در آن m تعداد کل ورودی ها (به استثنای بایاس) اعمال شده به نورون j است. وزن سیناپسی (مربوط به ورودی ثابت ) برابر بایاس bj اعمال شده بر نورون j است. از این رو ، سیگنال فعال در خروجی نورون j در تکرار n به صورت زیر ظاهر می شود:

(5-2)

به روشمشابه الگوریتم LMS ،الگوریتم پسا انتشار یک تصحیح شده را برای وزن سیناپسی اعمال می کند ، که متناسب با مشتق جزئی می باشد.بر طبق قانون زنجیره ای حساب دیفرانسیل گرادیان را به صورت زیر بیان میکنیم:

= (6-2)

مشتق جزئی یک عامل حساس و تعیین کننده در جهتدهی جستجوی فضای وزن سیناپس است ،

لذا پس از ساده کردن خواهبم داشت:

(7-2)

تصحیح شده بر که تعریف شده بوسیله قانون دلتا است به عبارتی داریم:

(8-2)

پارامتر نرخ یادگیری الگوریتم پسا انتشار می باشد.

علامت منهای ظاهر شده در معادله (2-8) بر اساس الگوریتم گرادیان کاهشی تعریف شده است (تغییر جهت وزن به کاهشی شدن تضمین کننده کاهش مقدار است)

و با عنایت به روابط به (2-8) و(2-7) داریم :

(2-9)

که گرادیان موضعی به صورت زیر تعریف می گردد:

(10-2)

گرادیان موضعی به تغییرات مورد نیاز در وزن سیناپسی اشاره می کند.

طبق رابط (2-10) گرادیان موضعی خروجی نرون j( ) برابر با حاصلضرب خطای سیگنال نرون j () درمشتق جرئی تابع فعالساز مربوط به آن() است.

از معادلات (2-9) و (2-10) متوجه میشویم یک عامل کلیدی در محاسبه و تنظیم وزن () خطای سیگنال () خروجی نرون j میباشد.

در این صورت با دوحالت مواجه هستیم که بستگی به جایی که نورون j در شبکه واقع شده است دارد.

.در مورد اول ، نورون j یک گره خروجی است. محاسبه این مورد ساده است زیرا هر گره خروجی شبکه در واکنش مربوطه به خود ، تولید می شود که از آن میتوان مستقیماً میزان خطای سیگنال مربوطه را محاسبه نمود، اما در مورد دوم نورون j قابل مشاهده نمی باشد، در گره های پنهان گرچه مستقیماً قابل مشاهده و دسترس نیستند ولی در خطای تولیدی در خروجی شبکه سهیم هستند. با این وجود باید مقدار پاداش و جریمه گره های پنهان و میزان تأثیر آن در ایجاد خطا به نحوی محاسبه و لحاظ گردد.

- مورد اول : نرون j گره خروجی

نورون j در لایه خروجی شبکه قرار داشته باشد که آن واکنش دلخواه خود را برای پاسخ دارد . میتوانیم از معادله

برای محاسبه خطای سیگنال مربوطه به این نرون با تعیین ، محاسبه گرادیان موضعی با معادله (2-10) امری ساده است.

- مورد دوم : نرون j گره پنهان

وقتی نورون j در یک لایه مخفی(میانی) از شبکه قرار دارد ، واکنش دلخواهی نخواهد داشت . بر این اساس ، تشخیص خطای سیگنال برای یک نورون پنهان به صورت بازگشتی تعیین می شود و از نظر خطای سیگنال به تمام نورونهایی که آن نورون پنهان مستقیماً با آنها ارتباط دارد عقب گرد خواهد داشت که موجب پیچیده شدن توسعه الگوریتم پسا انتشار می شود.

نورون j را به عنوان یک گره پنهان در شبکه در نظر میگیریم.

مطابق با معادله (2-10) باید گرادیان موضعی برای نرون پنهان j به ترتیب زیر دوباره تعریف گردد:

(11-2)نرون j پنهان است

در خط دوم معادله فوق از رابطه (6.1) استفاده شده است.برای محاسبه مشتق جزئی و در ادامه فرآیند خواهیم داشت:

(12-2) نرون k یک گروه خروجی است

که از جایگزین اندیس k به جای j در معادله

بدست میآید.این تغییر را چون نرون j پنهان است به اجبار انجام میدهیم.

در ادامه با مشتق معادله (2-12) نسبت به سیگنال فعال خواهیم داشت :

(13-2)

سپس از قانون زنجیره ای برای مشتق جزئی استفاده می کنیم و معادله (13-2) را بازنویسی میکنیم.

(14-2)

و خواهیم داشت:

(2-15) نرون k یک گره خروجی است

از این رو:

(2-16)

برای نرون k داریم:

(17-2)

با توجه به مشتق رابطه (2-17) نسبت به خواهیم داشت:

(18-2)

با عنایت به رابطه (2-18) و (2-16) و اعمال آن در رابطه (2-14) خواهیم داشت:

(2-19)

که در آن از تعریف گرادیان موضعی استفاده شده در رابطه (10-2) بکار رفته است، سرانجام رابطه (2-20) را در رابطه (2-11) جایگزین کرده و داریم :

(20-2) نرون j پنهان است

رابطه فوق به فرمول پسا انتشار با گرادیان موضعی معروف می باشد.

شکل 3 نمایش نمودار سیگنال جریان رابطه (21.1) را نشان می دهد. با فرض اینکه لایه خروجی از سلولهای عصبی تشکیل شده است.

فاکتور در رابطه (20-2) که در محاسبه گرادیان موضعی نقش دارد تنها بستگی به تابع فعالساز مربوط به نرون پنهان j دارد.

روابط بدست آمده برای الگوریتم پسا انتشار را می توان به صورت ذیل خلاصه نمود:

اول : تصحیح شده و اعمال شده بر وزن سیناپسی متصل به نورون i به نورون j که طبق قانون دلتا تعریف شده است:

(21-2)

(وزن تصحیح شده )=(نرخ یادگیری )(گرادیان موضعی )(سیگنال ورودی j،)

دوم : گرادیان موضعی که وابسته به گره خروجی یا پنهان بودن نرون j می باشد.

الف- درصورتی که نرون j گره خروجی باشد مساوی است با حاصلضرب و سیگنا خطای ، که هر دو مربوط به نرون j میباشد.( رابطه (11.1) ملاحظه شود)

ب- اگر نرون j پنهان باشد برابر است با حاصلضرب مربوطه و مجموع اوزان محاسبه شده برای نرونهای جانبی یا لایه خروجی متصل به نرون j میباشد (رابطه (21.1) ملاحظه شود)

2-2 اصل گسترش زاده:

قبل از آن که به بیان اصل گسترش بپردازیم لازم است که به دو مفهوم اشاره شود:

۱-۲-۲ حاصل ضرب دکارتی مجموعه های فازی:

فرض می‌کنیم که A و B دو مجموعه نامتناهی فازی باشند آنگاه داریم :

A=}

شکل3 جریان سیگنال نمودار قسمتی از الحاقی سیستم مربوط به پسا انتشار سیگنال های خطا.

}

۲-۲-۲ گسسته سازی اعداد فازی

در این روش که جایگزینی برای محاسبات فازی با استفاده از آلفا برشها است به جهت افزایش میزان دقت محاسبات فازی بسته به توانایی سیستم پردازش متغییر است بدین منظور که هر چقدر توان پردازش بالاتر باشد محاسبات فازی دقیق تر و با همان نسبت مقدار شبکه عصبی فازی به عدد بهینه نزدیکتر خواهد بود در ادامه روش گسسته سازی فازی را تعریف و طرز استفاده آن را توضیح خواهیم داد:

گسسته سازی در عملیات ماشین‌های محاسباتی لازم است که نخست فرض کنید که یک فازی مثلثی باشد.

وقتی این عدد گسسته می‌شود به شکل زیر است تعاداد نقاط ۲۱ تا می‌باشد.

فرض کنیم تابعی چون از مجموعه قطعی به مجموعه قطعی موجود باشد به طوری که :

حال فرض کنیم که مجموعه فازی شده باشد حال می‌خواهیم برای درجه عضویت را محاسبه کنیم یعنی

برای این منظور نخست تصویر معکوس را محاسبه کنیم یعنی

دقت کنید که عبارت مذکور الزاماً مجموعه تک عضوی نخواهد بود مگز اینکه یک به یک باشد.حاصل اصل گسترش " زاده " چنین تعریف می کنیم:

هنگامی که از گسسته‌فازی استفاده کنیم می‌توانیم از مفهوم max برای sup استفاده کنیم.

مثال: فرض کنید که اعداد حقیقی به شرح ذیل فازی شده است:

بنا داریم که برای تابع با دامنه درجه عضویت محاسبه کنیم بنابراین برد تابع f اعداد حقیقی نامنفی است حال این برد را به دو قسمت افراز می کنیم :

بنابراین اگر آنگاه:

({b})=

و اگر

({b})=

بنابراین

این محاسبه ظاهراً ساده بوده ولی در توابع پیچیده به این سادگی نخواهد بود بنابراین لازم است که در عملیات محاسباتی از گسسته سازی استفاده شود.

روش اصولی آن به شرح زیر است:

الف- ابتدا اعداد فازی را گسسته کنیم.

ب- را محاسبه می‌کنیم

ج- شبیه یابی می‌کنیم

ج-۱

برای در نظر می‌گیریم

۵-۲-۲ مثال دوم جمع دو عدد فازی

در اینجا می‌خواهیم جمع دو عدد فازی را حساب کنیم عمل جمع به شرح زیر است .(شکل 4 مشاهده شود)

(Y)

(X)

شکل 4 جمع دوعدد فازی

پس

تمرکز بر بازه‌ی [1,4] و [2,4] می باشد به عنوان مثال اگر بخواهیم بینهایت زوج موجود است که

بنابراین اگر یکی از این دو خارج از بازه باشد در یا حذف می‌شوند.حال برای ، را محاسبه می‌کنیم.

}

اگر آنگاه

زیرا یک جفت یافت شد که از سویی دیگر همواره کمتر یا مساوی یک است پس حال برای است به محاسبات طولانی می‌رسیم.

حالت چهارم تنها در و رخ می‌دهد

که که قبلا بحث شد حال سه حالت دیگرمورد بررسی قرار می گیرد:

حالت اول :

()

حالت دوم : ()

اما از سویی

بنابراین

پس

حالت سوم را بررسی می‌کنیم

اما پس

در حالت اول(A)

ماکزیمم این حالت برای زمانی رخ می‌دهدکه

یعنی

پس

چون بنابراین

پس دستگاه جواب دارد بنابراین ماکزیمم در ناحیه اول یعنی:

در حالت دوم ماکزیمم زمانی رخ می‌دهد که:

که همواره 2 باشد زیرا افزایش کاهش را دربردارد و کاهش و کاهش پس

در حالت سوم نظیر حالت دوم

ماکزیمم زمانی رخ می‌دهد که زیرا افزایش کاهش و متعاقباً کاهش پس و

حال مطابق اصل گسترش زاده

اگر واگر که مشخصات

بنابراین

به همین شیوه استدلال می‌توان نشان داد که

در واقع یک فرآیند خاص محاسباتی نشان دادیم که جمع این دو عدد فازی بنابر اصل گسترش فازی مثلثی است. اثبات در حالت کلی سیار طولانی و خسته‌کننده است. در حالت ضرب و تقسیم به راحتی مثال نقص وجود دارد که ضرب دو عدد فازی مثلثی لزوماْ فازی مثلثی نیست بلکه همواره فازی مثلثی نیست.

همان طور که گفته شد اصل گسترش نیاز به گسسته سازی دارد و تنها روش ممکن نیز همین است.

اين اصل ابزاري است براي گسترش وتعميم مفاهيم رياضي غير فازي به گونه اي که بصورت کميتهاي فازي درآيند. اين اصل به ويژه درتعميم عملگرهاي جبري بين اعداد و تعريف اين عملگرها براي اعداد فازي مفيد است.

3-2-2 تعریف اعمال اصلی بر اساس اصل گسترش زاده

فرض کنید ، با توابع عضویت پیوسته باشند و یک عملگر دوتایی بر اعداد حقیقی باشد. اگر تعمیم * را برای اعداد فازی؛ نشان دهیم.

با استفاده از اصل گسترش حاصل به صورت یک مجموعه فازی یا تابع عضویت زیر تعریف می‌شود.

4-2-2 تعمیم چهار عمل اصلی برای اعداد فازی

در حالت خاص برای چهار عمل اصلی، تعریف فوق به صورت‌های زیر در می‌آید:

۳- شبکه عصبی فازی

با نگاه اجمالی به روابط و عملگرهای فازی و گسترش فرمولها و روابط قانونهای یادگیری در محاسبات با اعداد فازی اوزان یالها دراین نوع محاسبات به شکل ذیل انجام خواهد شد:

شدت تغییرات اوزان به نرخ یادگیری و میزان خطای شبکه بستگی دارد به طوری که اندازه تغییرات اوزان به خطا بستگی دارد اگر تغییرات اوزان همگرا به صفر باشد تغییرات خطا نیز به صفر همگرا است.بنابراین اگر خطای شبکه به صفر برسد همگرایی واقعی بدست میآید و اگر خطا و وزنها کوچک شوند شبکه نیز تقربیا همگرا میشود.

1-3مزایای این روش نسبت به الگوریتم استاندارد پسا انتشار:

شبکه میتواند از اعداد فازی استفاده نماید.

یادگیری در یک شبکه فازی سرعت بیشتری از یادگیری پسا انتشار در شبکه با حالت استاندارد دارد.

کار بر روی اعداد فازی هدف اصلی این کار است.

الگوریتم فازی با استفاده از آموزش، توانایی ایجاد کنترلهای جدید برای نظارت در عملکرد شبکه را به صورت غیردستی و خودکار بویژه در محاسبه مقادیر بزرگتر را دارد.

قبل از بررسی و توصیف شبکههای عصبی فازی به طور خلاصه شبکههای عصبی پیشرو استاندارد (غیرفازی) را معرفی میکنیم.یک شبکه عصبی 3 لایه پیشرو با ورودی و بخش میانی و بخش خروجی را در نظر میگیریم.

یک بردار بعدی اعمال شده به شبکه عصبی به صورت ذیل تعریف میکنیم:

رابطه ورودی- خروجی هر کدام از بخش را میتوان به صورت زیر نوشت:

بخش ورودی:

(۱-۳)

لایه میانی:

(۲-۳)

(۳-۳ )

لایه خروجی:

(۴-۳)

(۵-۳)

این مجموع بواسطه تابع سیگموئید در بازه [0,1] تصویر می‌شود.

و اوزان متصل و و بایاس هستند و تابع فعال که به صورت زیر تعریف میشود:

بردار هدف (خروجی) مربوط به بردار ورودی به طور زیر مشخص میکنیم:

تابع هزینه جهت به حداقل رساندن آموزش شبکه عصبی را میتوان به صورت زیر تعریف نمود:

(-36)

خروجی واقعی از لایه خروجی -ام که توسط روابط ورودی خروجی شبکه عصبی (۳-۱) الی (۳-5) محاسبه میگردد.

در الگوریتم اوزان و و بایاس و بروزرسانی شده و تابع هزینه در (-36( کاهش مییابد.به طور مثال: وزن بر اساس روابط و قوانین ذیل تغییر مییابد:

(3-7)

(3-8)

یک عدد مثبت که به عنوان نرخ یادگیری از آن یاد میکنیم در این مقاله مقدار آنرا در نظر میگیریم.

اندیس، عدد اصلاحی میباشد و مقدار اصلاحی به صورت زیر تعریف خواهد شد:

(3-9)

و به همین ترتیب و بایاسهای و توسط روابط (۳-۷) الی (۳-۹) اصلاح میشوند.

۲-۳ شبکه عصبی پیشرو⁸فازی:

ورودیها و اوزان و بایاس های شبکه عصبی پیشرو استاندارد که بوسیله روابط ۱ الی ۵ تعریف شده را به اعداد فازی توسعه می دهسم ، لازم به ذکر است در فازی سازی شبکه عصبی تغییری در ساختار و معماری شبکه عصبی استاندارد اتفاق نخواهد افتاد.

اعداد فازی را با نماد (~) از اعداد حقیقی ممیز می کنیم .رابطه ورودی و خروجی شبکه عصبی فازی شده را به صورت زیر بیان خواهیم کرد:

بردار ورودی فازی است .

در ادامه نیز داریم :

لایه ورودی فازی :

(۱۰-۳)

لایه میانی فازی (پنهانی):

لایه خروجی :

توجه داشته باشید که و اوزان فازی و و بایاس فازی هستند.

از طرفی داریم

3-3 محاسبات روابط ورودی و خروجی:

روابط فرمول های (۳-۱۰) الی (۳-۱۴) بوسیله اصل گسترش زاده بازنویسی شده و اعمال جبری تعریف شده در روابط فازی شده شبکه عصبی مورداستفاده قرار خواهند گرفت.

در فرمولها و روابط (۳-۱۰) الی (۳-۱۴) ضرب و جمع و نگاشتهای غیرخطی اعداد فازی در شبکه عصبی فازی شده به صورت زیر تعریف می شود:

و هر دو عدد فازی هستند و تابع عضویت مربوط به هر کدام از اعداد فازی می باشد .

در ادامه برای فازی سازی شبکه عصبی با الگوریتم پسا انتشار که هم قابلیت محاسبه و کار با اعداد واقعی و هم کار با اعداد فازی را دارد به عبارتی در شبکه عصبی علاوه بر با اعداد حقیقی با مجموعه اعداد فازی مثلثی که نوعی از اعداد فازی هم هست قابلیت کار دارد.

گسترش و توسعه شبکه عصبی به شبکه عصبی فازی دردوجهت اتفاق می افتد :

الف – فازی سازی شبکه

ب – فازی سازی الگوریتم یادگیری

الف) فازی سازی شبکه:

در شبکه عصبی با دو شیء مختلف به نامهای نورون و یال مواجه هستیم که هم باید وزنهای متصل به آنها فازی و هم نرونها هم فازی باشد.

پس لاجرم در اینجا هم با دو قسمت بخش مواجه خواهیم شد.

1) یال‌ها:اوزان‌ یالها دیگر اعداد ممیز نیستند، اعداد فازی هستند ورودیها از چپ و خروجی‌ها از راست همگی اعداد فازی هستند.

۲) نرون‌ها:فازی سازی قسمت نرون‌ها با چند روش بدیهی قابل گسترش می‌باشد.

تابع خروجی در یک نرون حقیق تابع سیگموئید در نظر گرفته شده است بنابراین در روند فازی سازی این تابع نیز باید فازی شود و برای این کار با استفاده از اصل گسترش‌زاده آن را تخمین خواهیم زد

در ادامه با فرض اینکه یک عدد فازی مثلثی باشد خواهیم داشت.

در محاسبه الگوریتم نیاز به مشتق تابع سیگموئید هم هست که داریم:

در ادامه جهت یادآوری :

پنهای چپ است.

پنهای راست است.

4- در این بخش قبل از توصیف الگوریتم آموزشی یک مثال برای شبکه عصبی فازی ارائه می‌شود:

فرض کنید مطابق شکل روبرو یک نرون با 3 ورودی و یک یال خروجی که یکی از ورودی‌ها همان بایاس با ارزش مقدار 1 می‌باشد و مابقی پارامترهای ورودی با مقدار فازی است.

بنا به تعریف اصل گسترش برای ضرب و جمع داریم:

با توجه به اینکه مقدار دو عدد فازی وو و با هم برابر است حاصلضرب و مقدار تابع عضویت آن با جدول ذیل یکی خواهد شد.

و مقدار حاصلضرب (بایاس) برابر خواهد بود با جدول (1):

در این جدول به صورت نمونه مقادیر و محاسبه و اشکال مربوطه ارائه شده است.

در این بخش ، ما یک الگوریتم یادگیری کلی از شبکه عصبی فازی را استخراج کرده، الگوریتم یادگیری بدست آمده را می توان برای تنظیم اوزان فازی در حالتهای مختلف استفاده کرد.

فرض کنید بردار ورودی فرض کنید که زوج ورودی-خروجی ( ، ) برای یادگیری شبکه عصبی فازی داده شده است.

هدف از یادگیری توسط شبکه عصبی فازی کاهش اختلاف بین و است. یعنی مطلوب است که برابری زیر تقریباً برقرار باشد:

در ادامه تابع هزینه که طی آموزش توسط شبکه عصبی فازی حداقل می رسد شبکه عصبی فازی باید اختلاف بین بردار هدف فازی "و بردار خروجی فازی را اندازه گیری کند. ابتدا یک تابع هزینه برای مجموعه های و "به شرح زیر تعریف می کنیم:

5- نتیجه گیری :

رویه ارائه شده در این مقاله دارای چندین مزیت نسبت به حالت استاندارد الگوریتم پسا و جلو انتشار دارد

الف) شبکه عصبی علاوه بر اعداد غیر فازی توانایی کار با اعداد فازی هم خواهد داشت.

ب) سرعت آموزش در این حالت سریع‌تر خواهد بود.

ج) از طرفی چون ذاتاْ شبکهها برای مسائل طبیعی استفاده میشود پس می توان گفت که کاربرد فازی خود یک مزیتی فزونی نسبت به حالت کلاسیک است.

د) در این مقاله معماری شبکه عصبی فازی معرفی شده توانایی محاسبات اعداد فازی مثلثی و ذوزنقه ای چه متقارن و چه غیر متقارن را خواهد داشت .

در آخر در این مقاله رویه نوینی به نام گسسته سازی فازی ارائه شده که به نسبت اعداد فازی تابع عضویت مربوطه را محاسبه که بسته به توان سیستم رایانه‌ای دقت و سرعت بیشتری در محاسبه ارائه می دهد که این خود نهایتاً منجر به بهبود عملکرد و تصمیم گیری آموزش شبکه عصبی با اصلاح اوزان در شبکه عصبی خواهد شد.

[1] Ichihashi , Nomura, Watanabe

[2] BackPropagation

[3] Crisp

[4] Artificial neural network(ANN)

[5] back propagation of error

[6] feed forward

[7] ‌Bias

[8] Feedforward

جدول 1

اشکال مربوط به جدول شماره 1

مراجع:

[1] [Simon Haykin]McMaster University Hamilton, Ontario, Canada Neural Networks and Learning Machines 2009.

[2] [Honkela], T., 2007. “Philosphical aspects of neural, probabilistic and fuzzy modeling of language use and translation,” Proceedings of IJCNN, International Joint Conference on Neural Networks, pp. 2881–2886, Orlando, FL, August.

[3] [Hush], D., P. Kelly, C. Scovel, and I. Steinwart, 2006. “QP algorithms with guaranteed accuracy and run time for support vector machines,” J. Machine Learning Research, vol. 7, pp. 733–769.

[4] [Kruse] Kruse/Gebhardt/Klawonn, Fuzzy-Systeme, Teubner Stuttgart 1993[Hayashi] Y. Hayashi, J. Buckley, E. Czogola, Direct Fuzzification of Neural Networks and Fuzzified Delta Rule, Iizuka, Japan 1992, Proc. 2nd Intern. Conf. on Fuzzy Logic and Neural Networks, pp. 73-76.

[5] [Lin] C.-T. Lin, C. Lee, Neural-Network-Based Fuzzy Logic Control and Decision System, IEEE Transactions on Computers, Vol. 40, Nr. 12, S 1320- 1336, 1991

[6] [Okada] Hiroyuki Okada et. al., Knowledge Implementation Multilayer Neural Networks with Fuzzy Logic, Proceedings of the International Conference on Fuzzy Logic & Neural Networks, Iizuka, Japan 1990, pp. 99-102

[7] [Brause] Ruediger Brause, Neuronale Netze, Teubner Stuttgart 1991

[8] [Ro jas] Raul Ro jas, Theorie der neuronalen Netze, Springer-Verlag Berlin Heidelberg New York 1993.

[9] Krishnamraju, P. V., Buckley, J. J., Rcilly, K. D., and Hayashi, Y., Genetic learning algorithms for fuzzy neural nets, Proceedings of FUZZ-IEEE'94, Orlando, 1969-1974, 1994.

[10] Zadeh,L.A.,The concept of a linguistic variable and its application to approximate reasoning. I, lI, lII, Inform. Sci. 8, 199-249, 301-357: 9, 43 80, 1975.

[11] Web of Neural Network And Deep Learning

[12] رساله دکتری رضا کارگر استاد راهنما فرهاد حسین زاده و... دانشگاه آزاد اسلامی واحد علوم تحقیقات دانشکده علوم پایه زمستان 92

[13] محمد جواد اصغر پور ، تصمیم گیری های چند معیاره انتشارات دانشگاه تهران چاپ ششم 1387 .

[14] Neural-Networks and Learning Machines , Simon Haykin ,2008

[15] Rostamy-Malkhalifeh,Fuzzy data envelopment analysis: an adjustable approach,Expert Systems with Applications 2019

[16] Pejman Peykani, Emran Mohammadi, Mir Saman Pishvaee, Mohsen Rostamy-Malkhalifeh, Armin Jabbarzade A novel fuzzy data envelopment analysis based on robust possibilistic programming: possibility, necessity and credibility-based approaches ,RAIRO-Operations Research 2018

[17] Nasab F Ghaemi,Malkhalifeh M Rostamy,Extension of topsis for group decision -making based based on the type-2 fuzzy positive and negatie ,Ideal solutions international journal of industrial mathematics 2010

[18] Pejman Peykani, Emran Mohammadi, Mohsen Rostamy-Malkhalifeh, Farhad Hosseinzadeh Lotfi ,Fuzzy data envelopment analysis approach for ranking of stocks with an application to Tehran stock exchange, Advances in Mathematical Finance and Applications2019

ردیف	X1		ردیف	x1*w1	(x1*w1)		ردیف	x1*w1	(x1*w1)
1	0.099	0	1	0.9801	0	31	1.00596		0
2	0.0992	0.2	2	0.98208	0	32	0.996004		0.8
3	0.0994	0.4	3	0.98406	0	33	0.998		0.8
4	0.0996	0.6	4	0.98604	0	34	0.999996		0.8
5	0.0998	0.8	5	0.98802	0	35	1.001992		0.6
6	0.1	1	6	0.99	0	36	1.003988		0.4
7	0.1002	0.8	7	0.99198	0	37	1.005984		0.2
8	0.1004	0.6	8	0.99396	0	38	1.00798		0
9	0.1006	0.4	9	0.99594	0	39	1		1
10	0.1008	0.2	10	0.99792	0	40	1.002		0.8
11	0.101	0	11	0.9999	0	41	1.004		0.6
			12	0.984064	0.2	42	1.006		0.4
			13	0.986048	0.2	43	1.008		0.2
			14	0.988032	0.2	44	1.01		0
			15	0.990016	0.2	45	1.004004		0.8
			16	0.992	0.2	46	1.006008		0.6
			17	0.993984	0.2	47	1.008012		0.4
			18	0.995968	0.2	48	1.010016		0.2
			19	0.997952	0.2	49	1.01202		0
			20	0.999936	0.2	50	1.008016		0.6
			21	1.00192	0	51	1.010024		0.4
			22	0.988036	0.4	52	1.012032		0.2
			23	0.990024	0.4	53	1.01404		0
			24	0.992012	0.4	54	1.012036		0.4
			25	0.994	0.4	55	1.014048		0.2
			26	0.995988	0.4	56	1.01606		0
			27	0.997976	0.6	57	1.016064		0.2
			28	0.999964	0.4	58	1.01808		0
			29	1.001952	0.2	59	1.0201		0
			30	1.00394	0

Seperation Axioms in the Structural Topology
Print Date : 2025-07-29
Meromorphic multivalent functions associated with Mittage-Leffler Function based on convolution product
Print Date : 2025-04-08
Describing the strategic decisions of powerful players in stock market
Print Date : 2025-04-08
Extending mathematical structures from X to P^*(X), and some equivalents of the axiom of choice
Print Date : 2025-01-19
مطالعۀ ترکیبیاتی همه گیری‌ کووید-19 با استفاده از ساختارهای درختی
Print Date : 2024-11-30
Determining and Estimating the Weights of Best-Worst Method Criteria through Solving Linear Programming or Mixed Integer Linear Programming Models
Print Date : 2024-11-30

Share To

Article Url

Developing principles of neuron network based on the principle of expanding “Zadeh” with fuzzy’s parameters