多次的囚徒困境有没有纳什均衡?为什么说混合策略一定存在纳什均衡

你这条提问包含5问。其中有的提问大前提就不对。

多次的囚徒困境,和单次发生的囚徒困境,结果是不会一样。

多次的囚徒困境,存在纳什均衡。

纳什均衡,Nash equilibrium ,又称为非合作博弈均衡,是博弈论的一个重要术语,以约翰·纳什命名。纳什均衡是一种策略组合,使得每个参与人的策略是对其他参与人策略的最优反应。

在完全信息博弈中,如果在每个给定信息下,只能选择一种特定策略,这个策略为纯策略(pure strategy)。如果在每个给定信息下只以某种概率选择不同策略,称为混合策略(mixed strategy)。

在重复的囚徒困境中,博弈被反复地进行。因而每个参与者都有机会去"惩罚"另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能被受到惩罚的威胁所克服,从而可能导向一个较好的、合作的结果。作为反复接近无限的数量,纳什均衡趋向于帕累托最优。