بهبود عملکرد عاملها در جامعه مصنوعی با استفاده از یادگیری تقویتی
محورهای موضوعی : پژوهش های اجتماعیامیر پویان خدابخشی 1 , آرش رحمان 2 * , محسن روحانی 3
1 - گروه مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران.amirpooyan@gmail.com
2 - گروه مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران.arashrahman@yahoo.com
3 - گروه مهندسی کامپیوتر، دانشکده فنی مهندسی، واحد تهران جنوب، دانشگاه آزاد اسلامی، تهران، ایران m.rohani@niopdc.ir
کلید واژه: کلید واژه ها: شبیهسازی اجتماعی, جامعه مصنوعی, مدل کسب و انتقال تجربه, یادگیری تقویتی,
چکیده مقاله :
چکیده معمولاً در سیستمهای چندعاملی، تعاملات بین عاملها و تعاملات عاملها با محیط، به صورت انتخاب و اجرای عملهایی از بین مجموعهای محدود از اَعمال مشخص توسط عاملها حاصل میشود. بنابراین نوع و میزان پیچیدگی رفتارهای پیدایشی حاصل از این تعاملات نیز به نحوه اجرا و تعداد رفتارهای قابل اجرا توسط عاملها وابسته است. در این پژوهش سعی شد با توسعه مدل کسب و انتقال تجربه و اضافه کردن قابلیت یادگیری به عاملها، تاثیر یادگیری در بهبود رفتار عاملها در انتخاب روش (راهبرد) های انتقال تجربه و در بهبود شاخصهای رفاهی در جامعه مصنوعی مورد مطالعه قرار گیرد. روش یادگیری پیشنهاد شده در پژوهش برای افزایش دامنه تواناییهای عاملها، یادگیری تقویتی4 بود. با استفاده از این روش، عاملها به مرور زمان یاد گرفتند که چگونه در مواجهه با شرایط مختلف محیطی، رفتارهای مناسبتری را انتخاب و اجرا کنند تا به اهداف فردی و اجتماعی نزدیکتر شوند. نتایج حاصل از شبیهسازی و انجام آزمایشها نشان داد که اِعمال فرآیند یادگیری میتواند منجر به بهبود رفتار عاملها و بهبود شاخصهای رفاهی جامعه مصنوعی شود.
Abstract Usually in multi-agent systems, interactions between agents and agents interactions with the environment would be formed as selection and implementation of operations of a limited set of specific actions by agents. Therefore, the type and complexity rate of the emergent behaviours resulting from these interactions is also dependent on the how to implementation and numbers of applicable behaviours by the agents. In the conducted research it was tried to investigate the impact of learning on improvement of agents’ behaviour in the selection of methods (strategies) of experience transfer and in improving the welfare indexes (measures) in the artificial society with the development of model of acquiring and transferring experience as well as adding learning capability to agents. Reinforcement learning was the learning method proposed in this study to increase the range of agents’ capabilities. With using this method, agents learned over time how to select and implement more appropriate actions in confrontation with different environmental conditions to be closer to the individual and social goals. The results of simulation and experiments showed that applying learning process can lead to improve behaviour of agents and improve welfare indexes (measures) in the artificial society.