纯纳什均衡(纯纳什均衡和混合策略纳什均衡)

纳什均衡

又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。 在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作最佳应对。 如果两个博弈的局中人的策略组合分别构成各自的最佳应对,那么这个组合就被定义为纳什均衡。

占优策略

如果一个局中人的某个策略对其他局中人的任何策略都是最佳对应,那么这个策略就是该局中人的占优策略

在纳什均衡下,局中人没有人会想要改变改变,因为谁改变谁就可能在博弈中处于不利地位。

经典示例

首先我们来看一看在囚徒困境中纳什均衡,对于囚徒困境的问题的纳什均衡是双方都坦白,属于占优策略

妻子随机性的目的: 使丈夫无机可乘,不管丈夫选择哪个策略,其期望收益均相同

妻子选择了看足球,当丈夫以概率 1-q 也选择了看足球会得到收益 1

妻子选择看舞蹈策略的期望收益

纯策略纳什均衡(Pure-Strategy Nash Equilibrium)与混合策略纳什均衡(Mixed-Strategy Nash Equilibrium)的区别就在于此,任何一个有限的博弈都有一个混合策略纳什均衡(这个证明来自于纳什定理),但不是每一个博弈都有纯策略纳什均衡。在这里,我们表述为:任何二元矩阵博弈都有纳什均衡

当丈夫给出概率分布不会让妻子在看足球和看,关于以我对丈夫了解他更喜欢看足球,

2/3 的概率会选择去看足球1/3 的概率会选择去看舞蹈混合策略下混合策略: 每个局中人以某个概率分布在其策略集合中选择策略混合策略下的纳什均衡:定义和纯策略纳什均衡一致:基于最佳应对定义必要条件: 给定其他局中人的策略选择概率分布的情况下,当前局中人选择任意一个(纯)策略获得的期望效用相等

剪刀—石头—布的混合纳什均衡态

如果局中人没有遵循 1/3 的随机策略,谁就会失去有利位置每个玩家各以 1/3 的概率期望收益为 0纳什定理

任何有限博弈(参与人与策略数目均为有限)都至少存在一个纳什均衡,这个均衡可能是纯策略纳什均衡(例如剪刀-石头-布),也可能是混合策略均衡,纳什均衡的多重性(例如性别之战)

纳什均衡的存在性与多重性占优均衡:例如囚徒困境纯策略纳什均衡:性别之战混合策略纳什均衡

本站部分内容由互联网用户自发贡献,该文观点仅代表作者本人,本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

如发现本站有涉嫌抄袭侵权/违法违规等内容,请联系我们举报!一经查实,本站将立刻删除。