توسعه یک مدل کنترل بهینه در تصمیم گیری بنگاه های انحصار دوقطبی با استفاده از تعادل نش و استکلبرگ
محورهای موضوعی : مدیریت صنعتی
1 - گروه مهندسی صنایع، دانشکده فنی و مهندسی، دانشگاه صنعتی شریف، تهران، ایران
2 - استاد دانشکده مهندسی صنایع، دانشگاه صنعتی شریف، تهران، ایران
کلید واژه: نظریه بازی ها, تعادل نش, تعادل استکلبرگ, کنترل بهینه گسسته, برنامه ریزی پویا, مدل انحصار دوقطبی,
چکیده مقاله :
در دنیای واقعی تصمیمات بنگاهها علاوه بر تصمیم بنگاه رقیب به دوره تصمیم گیری نیز وابسته است به اینصورت که ممکن است در دوره تحت بررسی عواملی از قبیل اشباع شدن بازار، تغییر ذائقه مشتریان و یا حتی فصلی بودن محصول در استراتژی انتخابی بنگاهها مؤثر واقع گردد. در این مقاله، ابتدا مسائل کنترل بهینه گسسته معرفی و فرمولبندی مربوط به آنها ارائه گردیده است. فرمولبندی مربوطه برای مدل کنترل، به همراه تکنیکهای توسعه داده شده برای برنامه ریزی پویا، امکان حل کلاس بزرگی از مسائل تصمیم را فراهم می آورد. مدل ارائه شده به گونه ای توسعه داده شده است تا حالت خاصی از بازیهای دونفره ای که در آنها زمان به عنوان یک پارامتر مستقل در پیامد بازیکنان مؤثر است را حل نماید. برای تشریح مدل مربوطه حالات خاصی از مدل انحصار دوقطبی بررسی می گردد که در آن دو بنگاه تولیدی که محصولات مشابهی تولید میکنند در پی این موضوع هستند که چه میزان کالا را در هر دوره، با توجه به ظرفیت تولید n دوره ای، به بازار عرضه نمایند تا سودشان در مجموع n دوره ماکزیمم گردد. بدین منظور تکنیکی ترکیبی ارائه شده است که از مفاهیم موجود در نظریه بازیها یعنی تعادل نش و استکلبرگ در مدل کنترل بهینه بهره می برد. جوابهای بدست آمده از مدل تلفیقی، کارایی تکنیک پیشنهادی را اثبات می کند. برای تأیید اثربخشی تکنیک ترکیبی، دو مثال عددی ارائه و روش شناسی برای حل آنها بکار گرفته شده است. مثالهای عددی و تحلیل نتایج، بینش مدیریتی مفید جهت انتخاب بهترین استراتژیها برای بنگاهها در محیط های مختلف بازار و عملیاتی را فراهم می آورد.
In the real world, in addition to the decision of the rival company, the decisions of the companies are also dependent on the decision-making period, so that factors such as market saturation, changing customers' tastes, or even the seasonality of the product may be effective in the selected strategy of the companies. In this article, discrete optimal control problems are first introduced and their related formulation is presented. The presented model has been developed to solve a special case of doubles games in which time as an independent parameter is effective in the outcome of the players. In order to explain the relevant model, special situations of the duopoly model are examined, in which two production companies that produce similar products seek the issue of how much goods to produce in each period, according to the production capacity of n periods, to supply the market so that their profits are maximized in a total of n periods. For this purpose, a Combined technique has been presented that uses the concepts in game theory, namely Nash and Stackelberg equilibrium in the optimal control model. The answers obtained from the integrated model prove the effectiveness of the proposed technique. To verify the effectiveness of the proposed integrated technique, two numerical examples are presented and the methodology used to solve them. Numerical examples and results analysis provide useful management insight to choose the best strategies for companies in different market and operational environments.
Aflaki Sam (2006), decision making based on game theory, master's thesis, Sharif University of Technology.
Barquin J, Garcia-Gonzalez J, Roman J (2000), Water Value in Competitive Markets:Dynamic Programming and Game Theory,6th Probabilistic Methods Applied to Power Systems Conference, Madeira, Portugal, September 25 to September 28.
Bellman R, Kalaba R (1965), Dynamic programming and modern control theory. Academic, New York and London.
Benjamin A. Itza-Ortiz, Raul Villafuerte-Segura, Eduardo Alvardo-Santos., (2020); Delay-dependent and delay-independent stability of Cournot duopoly model with tax evasion and time-delay, Communications in Nonlinear Science and Numerical Simulation 87:105274. DOI:10.1016/j.cnsns.2020.105274.
Boltyanskii VG (1973) , Optimal control of discrete systems. Nauca, Moscow.
Cournot A (1838) , Recherches sur les Principes Mathematiquesde la Theorie des Richesses. Paris:Hachette ( English translation: Researches into the mathematical principles of the theory of wealth. Macmillan,1897 .(Reprinted New York :Augustus M.Kelley, 1971)).
Dastgerdi Yeganeh, V. (2010). Game Theory, Encyclopedia of City Economics, 8, 134-140.
Dori, M., Jafari M. & Chaharsoghi K., (2021). Competition between two supply chains with demand dependent on price and lead time: A Games Theory Approach. Modern Research in Decision Making,. 6(3): p. 23-49.
Faraji Dizaji S.,(2010). Microeconomic theory, Iran University of Economic Science, Tehran.
Farzaneh Tatari F., Naghibi-Sistani M.B. (2015), Distributed Optimal Control of Nonlinear Differential Graphical Games based on Reinforcement Learning, Journal of Control, Volume 8, Number 4, Winter 2013, Page 15-30.
Hamdy A.Taha (1976) , Operations Research; an Introduction. Macmillan Publishing Co., Inc.
Jozsef Garay, Villo Csiszar, Tamas F Mori., (2017), Envolutionary stability for matrix games under time constraints, .J Theor Biol, 21:415:1-12.
Julio Backhoff-Veraguas, Xin Zhang. (2023); Dynamic Coutnot-Nash Equilibrium: The Non-Potential Case; Mathematics and Financial Economocs; Volume 17. P:153-174.
Kelly Anthony(2003), Decision Making using Game Theory , An introduction for managers, Cambridge University Press.
Krabs W, Pickl S (2003) , Analysis, controllability and optimization of time-discrete systems and dynamical games , lecture notes in economics and mathematical systems . Springer , Berlin Heidelberg New York.
Larson Robert E,Casti John L (1978), Principles of Dynamic Programming, Part I, Basic Analytic and Computational Methods, Marcel Dekker,INC.New York and Basel.
Lozovanue D, Pickl S (2006) , An approach for an algorithmic solution of discrete optimal control problems and their game-theoretical extension. Central Eur J Oper Res 14:357-375.
Ma, J., et al., A supply chain network economic model with time-based competition. European Journal of Operational Research, 2020. 280(3): p. 889-908.
Mahmoudinia, D., Dallali Esfahani, Engwerda J.R. & Dastjerdi, R. (2016), Game theory and its role in determining optimal policies and strategic interaction between fiscal and monetary policymakers (Application of differential game theory and stackelberg games), Quarterly Journal of Applied Economics Studies Iran, 5(18), 1-34.
Mark Broom, Vlastimil Krivan., (2020), Two-strategy games with time constraints on regular graphs; J Theor Biol, 7:506:110426. Doi: 10.1016/j.jtbi.2020.110426
Milan, M. (1996). Games strategies & managers: How managers Can Use Game Theory to Make Better Business Decision. Oxford University Press, USA, 246.
Mosleh Shirazi, A.N. & Khalifeh, M. (2015). Measuring global competitiveness of Iran compared to countries using a two-stage model of data envelopment analysis, Industrial Management Perspective, 19, 119-137.
Nash J (1950), Equilibrium points in n-person games, Proceedings of The National Academy of Sciences, 36(1):48-49.
Neumann J , Morgenstern O (1944), The Theory of Games and Economic Behavior, Princeton University Press.
Pekgun, P. P.M. Griffin, and P. Keskinocak. (2017), Centralized versus Decentralized Competiton for Price and Lead-Time Sensitive Demand. Decision Sciences, 48(6), p.109-127.
S.S. Askar, K. Alnowibet, (2016), Cooperation versus noncooperation: Cournot duopolistic game based on delay and time-dependent parameters; Chaos, Solitons Fract; Volume 91, October 2016, Pages 580-584.
Shahikitash, M. & Mohammadzadeh, A. (2014). Gain sensitivity of conjecture changes in a multilateral monopoly structure based on the Iwata approach, Journal of Agricultural Economics and development, 28(3), 272-281.
Straffin Philip D (1993) , Game Theory and Strategy, The Mathematical Association of America.
Vamvoudakis K., Lewis F.L.,(2011), “Multi- player non-zero-sum games: online adaptive learning solution of coupled Hamilton-Jacobi equations”, Automatica,47, 1556-1559.
Varga T, Garay J., (2024), Dynamically unstable ESS in matrix games under time constraints, J Math Biol, 80:1-32.
Vlastimil Krivan, Ross Cressman. (2017). Interaction times change evolutionary outcomes: Two-player matrix games; J Theor Biol, doi: 10.1016/j.jtbi.2017.01.010.
Wu, D., O. Baron, and O. Berman, Bargaining in competing supply chains with uncertainty. European Journal of Operational Research, 2009. 197(2): p. 548-556.
Zhang H., Cui L., Luo Y.,(2013), “Near- optimal control for nonzero-sum differential games of continuous-time nonlinear systems using single-network ADP”, IEEE Trans. Cybern., 43, 206-216.
