跳到主要内容

09 - 纳什均衡

"真正的平衡不是最优,而是没有人愿意打破的稳定状态。"

引言

**纳什均衡(Nash Equilibrium)**是博弈论中最核心、最重要的概念。它由约翰·纳什在1950年提出,并因此获得1994年诺贝尔经济学奖。理解纳什均衡,就掌握了博弈分析的关键工具。

什么是纳什均衡?

通俗定义

纳什均衡是一种策略组合,在这个组合下,没有任何参与者愿意单方面改变自己的策略。

换句话说:

  • 给定对方的策略,我的策略已经是最优的
  • 给定我的策略,对方的策略也已经是最优的
  • 双方都没有动力单独改变

日常类比

想象两辆车在窄路相遇:

场景A:双方都靠右行驶

  • 如果我单独改为靠左,会撞车(更差)
  • 如果对方单独改为靠左,也会撞车(更差)
  • 结论:双方都靠右是纳什均衡

场景B:双方都靠左行驶

  • 同样,单方面改变会撞车
  • 结论:双方都靠左也是纳什均衡

这个例子说明:

  1. 纳什均衡是稳定的(没有人愿意单方面偏离)
  2. 纳什均衡不一定唯一(可能有多个)
  3. 纳什均衡不一定是最优的(只是稳定的)

如何找到纳什均衡?

方法1:划线法(适用于简单博弈)

步骤

  1. 对每个参与者,找出在对方每种策略下的最优反应
  2. 在收益矩阵中标记出来
  3. 双方最优反应重合的地方就是纳什均衡

案例:广告投放博弈

两家竞争企业A和B,考虑是否投放广告。

B不投广告B投广告
A不投广告3, 31, 4
A投广告4, 12, 2

分析A的最优反应

  • 如果B不投广告:A投广告更好(4 > 3)✓
  • 如果B投广告:A投广告更好(2 > 1)✓

分析B的最优反应

  • 如果A不投广告:B投广告更好(4 > 3)✓
  • 如果A投广告:B投广告更好(2 > 1)✓

纳什均衡:(A投广告,B投广告),收益为(2, 2)

注意:虽然(都不投广告)能让双方获得(3, 3)的更高收益,但这不是纳什均衡,因为任何一方都有动力单方面偏离去投广告获得4。

方法2:占优策略法

如果某个策略是占优策略(无论对方怎么选都是最优),那么:

  • 该策略一定会被选择
  • 包含所有占优策略的组合就是纳什均衡

案例:囚徒困境

乙不坦白乙坦白
甲不坦白-1, -1-10, 0
甲坦白0, -10-5, -5
  • "坦白"是双方的占优策略
  • 纳什均衡:(都坦白),收益为(-5, -5)

多重均衡问题

有些博弈存在多个纳什均衡

案例:性别之战(Battle of Sexes)

一对情侣决定晚上的活动:

女方选足球女方选芭蕾
男方选足球2, 10, 0
男方选芭蕾0, 01, 2

分析

  • 如果女方选足球,男方最优选择是足球(2 > 0)

  • 如果男方选足球,女方最优选择是足球(1 > 0)

  • 均衡1:(足球,足球),收益(2, 1)

  • 如果女方选芭蕾,男方最优选择是芭蕾(1 > 0)

  • 如果男方选芭蕾,女方最优选择是芭蕾(2 > 0)

  • 均衡2:(芭蕾,芭蕾),收益(1, 2)

两个纳什均衡的挑战

  • 双方需要协调到同一个均衡
  • 如果协调失败(一个选足球,一个选芭蕾),双方都得0

解决方法

  1. 事先沟通:明确选择哪个均衡
  2. 轮流:这次足球,下次芭蕾
  3. 惯例:形成默契(如"男方决定")

混合策略纳什均衡

有些博弈没有纯策略纳什均衡(明确选择某个策略),但有混合策略纳什均衡(按一定概率随机选择)。

案例:点球大战

场景:足球点球,射手vs守门员

守门员扑左守门员扑右
射手踢左0.3, 0.70.9, 0.1
射手踢右0.9, 0.10.3, 0.7

注:数字代表射手进球概率和守门员扑出概率

分析

  • 没有纯策略纳什均衡(如果守门员总是扑左,射手就应该踢右)
  • 混合策略均衡:双方都随机选择(例如各50%概率)

现实含义

  • 优秀的射手和守门员不会有固定模式
  • 随机性是最优策略
  • 这解释了为什么点球方向难以预测

纳什均衡的特性

1. 稳定性

纳什均衡是自我实施的(Self-enforcing):

  • 不需要外部强制
  • 每个人自发地遵守
  • 因为偏离会让自己更差

2. 不一定最优

纳什均衡可能不是帕累托最优(Pareto Optimal)。

囚徒困境的例子

  • 纳什均衡:(都坦白),收益(-5, -5)
  • 帕累托最优:(都不坦白),收益(-1, -1)

纳什均衡只保证没有单方面偏离的动力,不保证集体最优

3. 不一定唯一

一个博弈可能有:

  • 唯一均衡(如囚徒困境)
  • 多个均衡(如性别之战)
  • 无纯策略均衡(如点球大战,但有混合策略均衡)

4. 预测力

纳什均衡的核心价值是预测

  • 理性参与者会选择纳什均衡策略
  • 观察到偏离均衡的行为,说明存在其他因素(非理性、信息不完全等)

纳什均衡的实战应用

应用1:市场定价

场景:两家超市的定价策略

纳什均衡分析

  • 如果对手定高价,我定低价能抢客户
  • 如果对手定低价,我也要定低价避免失去客户
  • 结果:都定低价(价格战)

启示

  • 价格战是纳什均衡,但双方利润都低
  • 需要破解囚徒困境(如差异化、合并、协议等)

应用2:技术标准竞争

场景:VHS vs Betamax录像带标准之争

多重均衡

  • 均衡1:所有人用VHS
  • 均衡2:所有人用Betamax

现实结果:VHS获胜(通过更多影片、更低价格形成雪球效应)

启示

  • 存在多重均衡时,先发优势和网络效应很重要
  • 协调到对自己有利的均衡是关键

应用3:职场晋升竞争

场景:两个同事竞争一个晋升名额

策略:努力工作 vs 正常工作

收益分析

  • 如果对方正常工作,我努力工作更可能晋升
  • 如果对方努力工作,我正常工作肯定晋升不了

纳什均衡:双方都努力工作

启示

  • 竞争导致所有人都要付出更多努力
  • 这对公司有利(获得更多产出)
  • 对员工来说是"军备竞赛"(都累,但相对位置不变)

要点总结

特征说明
定义没有人愿意单方面改变策略的稳定状态
稳定性自我实施,不需要外部强制
最优性不一定是集体最优,只是个体最优的相互适应
唯一性可能唯一、多个或不存在(纯策略)
预测力理性参与者会选择纳什均衡

实战启示

  1. 寻找均衡:分析博弈时,先找纳什均衡

    • 这是最可能出现的结果
    • 偏离均衡的行为通常不可持续
  2. 评估均衡质量:纳什均衡不一定好

    • 可能是囚徒困境(集体次优)
    • 需要考虑如何改进
  3. 应对多重均衡

    • 沟通协调
    • 争取先发优势
    • 建立惯例和规则
  4. 改变均衡

    • 改变收益结构(激励机制)
    • 改变博弈规则
    • 引入新的参与者或策略

实战练习

场景:两家共享单车公司在同一城市竞争

策略:大量投放 vs 适量投放

收益矩阵(单位:百万元利润):

B适量投放B大量投放
A适量投放5, 52, 7
A大量投放7, 23, 3

问题

  1. 找出纳什均衡
  2. 这个均衡是最优的吗?
  3. 如何改进?

答案

  1. 纳什均衡:(都大量投放),收益(3, 3)
  2. 不是最优,(都适量投放)能获得(5, 5)
  3. 改进:合并、协议限制投放量、政府监管等

下一章预告:性别之战与协调博弈——如何解决多重均衡的协调问题

思考题:在你的工作和生活中,能找到哪些纳什均衡的例子?这些均衡是好的还是坏的?能改进吗?