09 - 纳什均衡
"真正的平衡不是最优,而是没有人愿意打破的稳定状态。"
引言
**纳什均衡(Nash Equilibrium)**是博弈论中最核心、最重要的概念。它由约翰·纳什在1950年提出,并因此获得1994年诺贝尔经济学奖。理解纳什均衡,就掌握了博弈分析的关键工具。
什么是纳什均衡?
通俗定义
纳什均衡是一种策略组合,在这个组合下,没有任何参与者愿意单方面改变自己的策略。
换句话说:
- 给定对方的策略,我的策略已经是最优的
- 给定我的策略,对方的策略也已经是最优的
- 双方都没有动力单独改变
日常类比
想象两辆车在窄路相遇:
场景A:双方都靠右行驶
- 如果我单独改为靠左,会撞车(更差)
- 如果对方单独改为靠左,也会撞车(更差)
- 结论:双方都靠右是纳什均衡
场景B:双方都靠左行驶
- 同样,单方面改变会撞车
- 结论:双方都靠左也是纳什均衡
这个例子说明:
- 纳什均衡是稳定的(没有人愿意单方面偏离)
- 纳什均衡不一定唯一(可能有多个)
- 纳什均衡不一定是最优的(只是稳定的)
如何找到纳什均衡?
方法1:划线法(适用于简单博弈)
步骤:
- 对每个参与者,找出在对方每种策略下的最优反应
- 在收益矩阵中标记出来
- 双方最优反应重合的地方就是纳什均衡
案例:广告投放博弈
两家竞争企业A和B,考虑是否投放广告。
| B不投广告 | B投广告 | |
|---|---|---|
| A不投广告 | 3, 3 | 1, 4 |
| A投广告 | 4, 1 | 2, 2 |
分析A的最优反应:
- 如果B不投广告:A投广告更好(4 > 3)✓
- 如果B投广告:A投广告更好(2 > 1)✓
分析B的最优反应:
- 如果A不投广告:B投广告更好(4 > 3)✓
- 如果A投广告:B投广告更好(2 > 1)✓
纳什均衡:(A投广告,B投广告),收益为(2, 2)
注意:虽然(都不投广告)能让双方获得(3, 3)的更高收益,但这不是纳什均衡,因为任何一方都有动力单方面偏离去投广告获得4。
方法2:占优策略法
如果某个策略是占优策略(无论对方怎么选都是最优),那么:
- 该策略一定会被选择
- 包含所有占优策略的组合就是纳什均衡
案例:囚徒困境
| 乙不坦白 | 乙坦白 | |
|---|---|---|
| 甲不坦白 | -1, -1 | -10, 0 |
| 甲坦白 | 0, -10 | -5, -5 |
- "坦白"是双方的占优策略
- 纳什均衡:(都坦白),收益为(-5, -5)
多重均衡问题
有些博弈存在多个纳什均衡。
案例:性别之战(Battle of Sexes)
一对情侣决定晚上的活动:
| 女方选足球 | 女方选芭蕾 | |
|---|---|---|
| 男方选足球 | 2, 1 | 0, 0 |
| 男方选芭蕾 | 0, 0 | 1, 2 |
分析:
-
如果女方选足球,男方最优选择是足球(2 > 0)
-
如果男方选足球,女方最优选择是足球(1 > 0)
-
均衡1:(足球,足球),收益(2, 1)
-
如果女方选芭蕾,男方最优选择是芭蕾(1 > 0)
-
如果男方选芭蕾,女方最优选择是芭蕾(2 > 0)
-
均衡2:(芭蕾,芭蕾),收益(1, 2)
两个纳什均衡的挑战:
- 双方需要协调到同一个均衡
- 如果协调失败(一个选足球,一个选芭蕾),双方都得0
解决方法:
- 事先沟通:明确选择哪个均衡
- 轮流:这次足球,下次芭蕾
- 惯例:形成默契(如"男方决定")
混合策略纳什均衡
有些博弈没有纯策略纳什均衡(明确选择某个策略),但有混合策略纳什均衡(按一定概率随机选择)。
案例:点球大战
场景:足球点球,射手vs守门员
| 守门员扑左 | 守门员扑右 | |
|---|---|---|
| 射手踢左 | 0.3, 0.7 | 0.9, 0.1 |
| 射手踢右 | 0.9, 0.1 | 0.3, 0.7 |
注:数字代表射手进球概率和守门员扑出概率
分析:
- 没有纯策略纳什均衡(如果守门员总是扑左,射手就应该踢右)
- 混合策略均衡:双方都随机选择(例如各50%概率)
现实含义:
- 优秀的射手和守门员不会有固定模式
- 随机性是最优策略
- 这解释了为什么点球方向难以预测
纳什均衡的特性
1. 稳定性
纳什均衡是自我实施的(Self-enforcing):
- 不需要外部强制
- 每个人自发地遵守
- 因为偏离会让自己更差
2. 不一定最优
纳什均衡可能不是帕累托最优(Pareto Optimal)。
囚徒困境的例子:
- 纳什均衡:(都坦白),收益(-5, -5)
- 帕累托最优:(都不坦白),收益(-1, -1)
纳什均衡只保证没有单方面偏离的动力,不保证集体最优。
3. 不一定唯一
一个博弈可能有:
- 唯一均衡(如囚徒困境)
- 多个均衡(如性别之战)
- 无纯策略均衡(如点球大战,但有混合策略均衡)
4. 预测力
纳什均衡的核心价值是预测:
- 理性参与者会选择纳什均衡策略
- 观察到偏离均衡的行为,说明存在其他因素(非理性、信息不完全等)
纳什均衡的实战应用
应用1:市场定价
场景:两家超市的定价策略
纳什均衡分析:
- 如果对手定高价,我定低价能抢客户
- 如果对手定低价,我也要定低价避免失去客户
- 结果:都定低价(价格战)
启示:
- 价格战是纳什均衡,但双方利润都低
- 需要破解囚徒困境(如差异化、合并、协议等)
应用2:技术标准竞争
场景:VHS vs Betamax录像带标准之争
多重均衡:
- 均衡1:所有人用VHS
- 均衡2:所有人用Betamax
现实结果:VHS获胜(通过更多影片、更低价格形成雪球效应)
启示:
- 存在多重均衡时,先发优势和网络效应很重要
- 协调到对自己有利的均衡是关键
应用3:职场晋升竞争
场景:两个同事竞争一个晋升名额
策略:努力工作 vs 正常工作
收益分析:
- 如果对方正常工作,我努力工作更可能晋升
- 如果对方努力工作,我正常工作肯定晋升不了
纳什均衡:双方都努力工作
启示:
- 竞争导致所有人都要付出更多努力
- 这对公司有利(获得更多产出)
- 对员工来说是"军备竞赛"(都累,但相对位置不变)
要点总结
| 特征 | 说明 |
|---|---|
| 定义 | 没有人愿意单方面改变策略的稳定状态 |
| 稳定性 | 自我实施,不需要外部强制 |
| 最优性 | 不一定是集体最优,只是个体最优的相互适应 |
| 唯一性 | 可能唯一、多个或不存在(纯策略) |
| 预测力 | 理性参与者会选择纳什均衡 |
实战启示
-
寻找均衡:分析博弈时,先找纳什均衡
- 这是最可能出现的结果
- 偏离均衡的行为通常不可持续
-
评估均衡质量:纳什均衡不一定好
- 可能是囚徒困境(集体次优)
- 需要考虑如何改进
-
应对多重均衡:
- 沟通协调
- 争取先发优势
- 建立惯例和规则
-
改变均衡:
- 改变收益结构(激励机制)
- 改变博弈规则
- 引入新的参与者或策略
实战练习
场景:两家共享单车公司在同一城市竞争
策略:大量投放 vs 适量投放
收益矩阵(单位:百万元利润):
| B适量投放 | B大量投放 | |
|---|---|---|
| A适量投放 | 5, 5 | 2, 7 |
| A大量投放 | 7, 2 | 3, 3 |
问题:
- 找出纳什均衡
- 这个均衡是最优的吗?
- 如何改进?
答案:
- 纳什均衡:(都大量投放),收益(3, 3)
- 不是最优,(都适量投放)能获得(5, 5)
- 改进:合并、协议限制投放量、政府监管等
下一章预告:性别之战与协调博弈——如何解决多重均衡的协调问题
思考题:在你的工作和生活中,能找到哪些纳什均衡的例子?这些均衡是好的还是坏的?能改进吗?