nash equilibrium,什么是纳什均衡?
纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。纳什均衡是指这样一种均衡:在这一均衡中,每个博弈参与人都确信,在给定其他参与人战略决定的情况下,他选择了最优战略以回应对手的战略。”也就是说,所有人的战略都是最优的。而讲解“纳什均衡”的最著名的案例就是“囚徒的困境”。
a,b两个囚徒,a坦白b抵赖,b判10年,a判1年.若两人均坦白则各判5年,若两人均抵赖则都判2年。a,b面临抉择。
显然最好的策略是双方都抵赖,结果是大家都只被判2年。但是由于两人处于隔离的情况下无法串供,按照亚当·斯密的理论,每一个人都是一个“理性的经济人”,都会从利己的目的出发进行选择。这两个人都会有这样一个盘算过程:假如他招了,我不招,得坐10年监狱,招了才5年,所以招了划算;假如我招了,他也招,得坐5年,他要是不招,我就只坐1年,而他会坐10年牢,也是招了划算。综合以上几种情况考虑,不管他招不招,对我而言都是招了划算。两个人都会动这样的脑筋,最终,两个人都选择了招,结果都被判5年刑期。
原本对双方都有利的策略(抵赖)和结局 (被判1年刑)就不会出现。这就是著名的“囚徒困境”。它实际上反映了一个很深刻的问题,这就是个人理性与集体理性的矛盾。
至于纳什,加拿大人,NBA现役运动员,菲尼克斯太阳队当家球星。
囚徒困境陷入的是什么平衡?
囚徒困境陷入的是一种“纳什平衡”(Nash Equilibrium),这是一种非合作博弈中的一种策略组合,其中每个参与者都认为对手的策略是已知的,而选择自己的最优策略。
在这种平衡中,每个参与者都达到了自己的最优策略,没有任何人能够通过改变自己的策略来获得更高的收益。
在囚徒困境中,两个囚犯面临同样的选择:要么坦白交代,要么保持沉默。如果其中一个囚犯选择坦白,另一个囚犯也会选择坦白,因为坦白是他的最优策略。
如果其中一个囚犯选择沉默,另一个囚犯也会选择沉默,因为沉默是他的最优策略。因此,囚徒困境陷入的是一种“纳什平衡”,即两个囚犯都选择了自己的最优策略。
什么是纳什均衡?
纳什均衡是博弈论中的概念,指的是在一个博弈中,各方选择最佳策略后,没有动机再改变策略的状态。
在纳什均衡下,每个参与者的策略选择是相互依赖的,任何一个参与者改变自己的策略都不会得到更好的结果。
纳什均衡存在于非合作博弈中,可以通过寻找各方策略选择的交叉点或者数学推导来确定。纳什均衡的概念被广泛应用于经济学、政治学等领域,有助于理解博弈参与者的行为和决策动机。
约翰纳什著作?
约翰·纳什(John Nash,1928年6月13日—2015年5月23日),提出纳什均衡的概念和均衡存在定理,是著名数学家、经济学家、《美丽心灵》男主角原型,前麻省理工学院助教,后任普林斯顿大学数学系教授,主要研究博弈论、微分几何学和偏微分方程。由于他与另外两位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献,对博弈论和经济学产生了重大影响,而获得1994年诺贝尔经济学奖。当地时间2015年5月23日,约翰·纳什与妻子在美国新泽西州遭遇车祸逝世,享年86岁。
主要著作:
Equilibrium Points in N-person Games, Proceedings of the National Academy of Sciences 36 (36): 48–9, DOI:10.1073/pnas.36.1.48, PMC 1063129, PMID 16588946, MR0031701. Nash, JF (1950)
The Bargaining Problem, Econometrica (18): 155–62, 1950. MR0035977. Nash, JF (1950)
Non-cooperative Games, Annals of Mathematics 54 (54): 286–95, JSTOR 1969529
Two-person Cooperative Games, Econometrica (21): 128–40, 1953, MR0053471.Nash, J. (1951)
纳什平衡理论是什么?
纳什平衡(Nash equilibrium),又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。
如果两个博弈的当事人的策略组合分别构成各自的支配性策略,那么这个组合就被定义为纳什平衡。



还没有评论,来说两句吧...