44 - 行为博弈论

"理论假设人完全理性，现实中人有限理性、有情绪、有偏见。"

引言

行为博弈论研究真实人类如何博弈，而非理想化的"理性人"。人们会犯错、有情绪、重视公平——这些都影响博弈结果。理解行为博弈论,能帮你更准确预测他人行为。本章探讨人类真实的博弈行为。

传统博弈论 vs 行为博弈论

传统假设

完全理性：

精确计算
完美逻辑
利益最大化

自利：

只关心自己收益
不关心他人

完美信息处理：

无限计算能力
完美记忆

现实偏差

有限理性（Bounded Rationality）：

计算能力有限
使用启发式（捷径）
会犯系统性错误

社会偏好（Social Preferences）：

关心公平
互惠动机
利他行为

认知偏差（Cognitive Biases）：

损失厌恶
框架效应
锚定效应

有限理性

水平-k思考（Level-k Thinking）

概念：人们思考的层次有限

模型：

Level 0：随机选择（不思考）
Level 1：假设对手是Level 0
Level 2：假设对手是Level 1
...

例子：猜数字游戏

规则：

每人猜一个0-100的数字
所有数字的平均值×2/3
最接近者获胜

理论预测（完全理性）：

如果都理性，应该猜0
因为任何正数的2/3都更小
最终均衡是0

实际结果：

Level 0：随机猜（平均50）
Level 1：50×2/3=33
Level 2：33×2/3=22
实际平均：22左右

结论：大多数人是Level 1或2，非完全理性

认知负荷

概念：复杂博弈下，人们简化思考

表现：

忽略小概率事件
关注显著选项
使用经验法则

例子：

保险：过度投保小损失，不投保大损失
彩票：高估中奖概率

学习与适应

人会学习改进策略：

试错学习
模仿成功者
强化学习

但学习不完美：

学习慢
可能学到错误模式
难以适应变化环境

公平偏好

最后通牒博弈（实验结果）

理论预测：

提议者：99-1分配
回应者：接受（1>0）

实际结果：

提议者：多数提议30-50%
回应者：拒绝＜20%的分配
即使拒绝意味着一无所获

解释：

人重视公平
愿意惩罚不公平（即使有成本）

独裁者博弈

规则：

分配者独自决定如何分钱
接受者无选择权

理论预测：

分配者全拿（100-0）

实际结果：

多数人给20-30%
部分人平分

解释：

纯粹利他
社会规范
避免愧疚

公共品博弈

规则：

每人有初始资金
可以贡献到公共池
公共池×1.5后平分

理论预测：

搭便车，不贡献

实际结果：

初期贡献40-60%
重复后下降（但不到0）

解释：

条件合作（Conditional Cooperation）
看到他人贡献，自己也贡献
看到搭便车，减少贡献

互惠动机

正向互惠

概念：别人对我好，我也对他好

例子：

礼物交换
帮助回报
信任建立

实验：信任博弈

投资者给托管人钱
钱×3
托管人决定返还多少

结果：

投资者愿意信任（给钱）
托管人多数返还（超过原始投资）
互惠建立信任

负向互惠

概念：别人伤害我，我要报复

表现：

即使报复有成本
也要惩罚不公平

例子：

最后通牒中拒绝低报价
第三方惩罚（看到不公平，愿意付费惩罚）

互惠的演化意义

为什么互惠？

促进合作
维护社会秩序
演化优势

声誉：

互惠建立声誉
声誉带来长期收益

损失厌恶

概念

损失厌恶（Loss Aversion）：

损失的痛苦 > 等额收益的快乐
大约2:1

例子：

损失100元的痛苦 ≈ 获得200元的快乐

禀赋效应（Endowment Effect）

概念：拥有的东西价值更高

实验：

给一半人马克杯
问卖价和买价
卖价显著高于买价

解释：

失去马克杯是损失（痛苦）
获得马克杯是收益（快乐）
损失厌恶→卖价高

现状偏差（Status Quo Bias）

概念：倾向保持现状

例子：

不换工作（即使新工作更好）
不改投资组合
默认选项影响大

原因：

改变=损失现状
损失厌恶→不改变

框架效应（Framing Effect）

同样选择，不同表述，不同决策

例子1：医疗决策

框架A：手术成功率90%
框架B：手术失败率10%
相同信息，但框架A更吸引人

例子2：折扣vs加价

"现金9折" vs "信用卡加价10%"
前者更受欢迎（虽然等价）

原因：

参照点不同
损失厌恶

过度自信

表现

高估自己能力：

80%的人认为自己是前50%（驾驶技术）
创业者过度乐观

低估风险：

认为坏事不会发生在自己身上

过度精确：

过于自信自己的判断

博弈中的影响

过度竞争：

高估自己胜算
参与赢者诅咒的竞标

谈判：

过度自信→不愿让步
导致谈判破裂

投资：

过度交易
亏损

应对

自我认知：

承认可能犯错
寻求反馈

机制设计：

强制冷静期
第三方评估

其他认知偏差

锚定效应

首个信息影响判断

例子：

谈判开价作为锚
看到高价→觉得中价合理

可得性启发（Availability Heuristic）

易想起的事件被高估概率

例子：

看到空难新闻→高估飞行风险
实际上飞行很安全

确认偏差（Confirmation Bias）

寻找支持自己观点的信息

例子：

相信某股票好→只看利好消息
忽略风险

沉没成本谬误

考虑已付出的不可回收成本

例子：

买了电影票发现烂片，还是坚持看完
理性：票钱已付，应基于剩余价值决策

情绪与博弈

愤怒

影响：

更倾向报复
即使有成本
拒绝不公平提议

例子：

路怒症
谈判中情绪化

后悔厌恶

害怕后悔影响决策

例子：

不敢做决策（怕后悔）
从众（大家都这样，错了不后悔）

快乐与悲伤

情绪影响风险偏好：

快乐时：更愿冒险
悲伤时：更保守

文化差异

集体主义 vs 个人主义

集体主义文化（东亚）：

更重视团队
更愿合作
更关注关系

个人主义文化（西方）：

更重视个人
更竞争
更关注交易

信任水平

高信任社会：

更愿合作
交易成本低

低信任社会：

更防范
交易成本高

公平观念

不同文化对公平的定义不同：

平等（人人相同）
公正（按贡献）
需求（按需要）

应用：行为设计

助推（Nudge）

概念：利用行为偏差引导决策

例子1：默认选项

器官捐献：默认参加vs默认不参加
退休储蓄：默认加入401k

例子2：框架

"90%成功率"（正面框架）
促进接受

例子3：社会证明

"你的邻居已节能20%"
促进行动

承诺机制

利用现状偏差：

提前承诺
难以反悔

例子：

健身房年卡
自动扣款慈善

要点总结

要素	要点
有限理性	Level-k思考、认知负荷、简化策略
公平偏好	拒绝不公平、独裁者给予、条件合作
互惠动机	正向互惠、负向互惠、声誉
损失厌恶	损失痛苦>收益快乐、禀赋效应、框架效应
过度自信	高估能力、低估风险、过度竞争
情绪	愤怒、后悔、快乐/悲伤影响决策
文化差异	集体主义vs个人主义、信任、公平观

实战启示

预测他人行为：
- 考虑有限理性
- 考虑公平和互惠
- 不假设完全理性
自我认知：
- 承认自己的偏差
- 损失厌恶、过度自信
- 保持警惕
谈判与沟通：
- 框架很重要
- 考虑对方情绪
- 建立互惠关系
机制设计：
- 利用助推引导行为
- 默认选项、承诺机制
- 社会证明
文化敏感：
- 跨文化博弈考虑差异
- 信任建立方式不同
- 公平观念不同
情绪管理：
- 避免情绪化决策
- 冷静期
- 理性分析

下一章预告：演化博弈论——策略如何演化、规范如何形成

思考题：

你有哪些认知偏差？
你如何应对损失厌恶？
文化差异如何影响你的博弈？

引言​

传统博弈论 vs 行为博弈论​

传统假设​

现实偏差​

有限理性​

水平-k思考（Level-k Thinking）​

认知负荷​

学习与适应​

公平偏好​

最后通牒博弈（实验结果）​

独裁者博弈​

公共品博弈​

互惠动机​

正向互惠​

负向互惠​

互惠的演化意义​

损失厌恶​

概念​

禀赋效应（Endowment Effect）​

现状偏差（Status Quo Bias）​

框架效应（Framing Effect）​

过度自信​

表现​

博弈中的影响​

应对​

其他认知偏差​

锚定效应​

可得性启发（Availability Heuristic）​

确认偏差（Confirmation Bias）​

沉没成本谬误​

情绪与博弈​

愤怒​

后悔厌恶​

快乐与悲伤​

文化差异​

集体主义 vs 个人主义​

信任水平​

公平观念​

应用：行为设计​

助推（Nudge）​

承诺机制​

要点总结​

实战启示​

引言

传统博弈论 vs 行为博弈论

传统假设

现实偏差

有限理性

水平-k思考（Level-k Thinking）

认知负荷

学习与适应

公平偏好

最后通牒博弈（实验结果）

独裁者博弈

公共品博弈

互惠动机

正向互惠

负向互惠

互惠的演化意义

损失厌恶

概念

禀赋效应（Endowment Effect）

现状偏差（Status Quo Bias）

框架效应（Framing Effect）

过度自信

表现

博弈中的影响

应对

其他认知偏差

锚定效应

可得性启发（Availability Heuristic）

确认偏差（Confirmation Bias）

沉没成本谬误

情绪与博弈

愤怒

后悔厌恶

快乐与悲伤

文化差异

集体主义 vs 个人主义

信任水平

公平观念

应用：行为设计

助推（Nudge）

承诺机制

要点总结

实战启示