44 - 行为博弈论
"理论假设人完全理性,现实中人有限理性、有情绪、有偏见。"
引言
行为博弈论研究真实人类如何博弈,而非理想化的"理性人"。人们会犯错、有情绪、重视公平——这些都影响博弈结果。理解行为博弈论,能帮你更准确预测他人行为。本章探讨人类真实的博弈行为。
传统博弈论 vs 行为博弈论
传统假设
完全理性:
- 精确计算
- 完美逻辑
- 利益最大化
自利:
- 只关心自己收益
- 不关心他人
完美信息处理:
- 无限计算能力
- 完美记忆
现实偏差
有限理性(Bounded Rationality):
- 计算能力有限
- 使用启发式(捷径)
- 会犯系统性错误
社会偏好(Social Preferences):
- 关心公平
- 互惠动机
- 利他行为
认知偏差(Cognitive Biases):
- 损失厌恶
- 框架效应
- 锚定效应
有限理性
水平-k思考(Level-k Thinking)
概念:人们思考的层次有限
模型:
- Level 0:随机选择(不思考)
- Level 1:假设对手是Level 0
- Level 2:假设对手是Level 1
- ...
例子:猜数字游戏
规则:
- 每人猜一个0-100的数字
- 所有数字的平均值×2/3
- 最接近者获胜
理论预测(完全理性):
- 如果都理性,应该猜0
- 因为任何正数的2/3都更小
- 最终均衡是0
实际结果:
- Level 0:随机猜(平均50)
- Level 1:50×2/3=33
- Level 2:33×2/3=22
- 实际平均:22左右
结论:大多数人是Level 1或2,非完全理性
认知负荷
概念:复杂博弈下,人们简化思考
表现:
- 忽略小概率事件
- 关注显著选项
- 使用经验法则
例子:
- 保险:过度投保小损失,不投保大损失
- 彩票:高估中奖概率
学习与适应
人会学习改进策略:
- 试错学习
- 模仿成功者
- 强化学习
但学习不完美:
- 学习慢
- 可能学到错误模式
- 难以适应变化环境
公平偏好
最后通牒博弈(实验结果)
理论预测:
- 提议者:99-1分配
- 回应者:接受(1>0)
实际结果:
- 提议者:多数提议30-50%
- 回应者:拒绝<20%的分配
- 即使拒绝意味着一无所获
解释:
- 人重视公平
- 愿意惩罚不公平(即使有成本)
独裁者博弈
规则:
- 分配者独自决定如何分钱
- 接受者无选择权
理论预测:
- 分配者全拿(100-0)
实际结果:
- 多数人给20-30%
- 部分人平分
解释:
- 纯粹利他
- 社会规范
- 避免愧疚
公共品博弈
规则:
- 每人有初始资金
- 可以贡献到公共池
- 公共池×1.5后平分
理论预测:
- 搭便车,不贡献
实际结果:
- 初期贡献40-60%
- 重复后下降(但不到0)
解释:
- 条件合作(Conditional Cooperation)
- 看到他人贡献,自己也贡献
- 看到搭便车,减少贡献
互惠动机
正向互惠
概念:别人对我好,我也对他好
例子:
- 礼物交换
- 帮助回报
- 信任建立
实验:信任博弈
- 投资者给托管人钱
- 钱×3
- 托管人决定返还多少
结果:
- 投资者愿意信任(给钱)
- 托管人多数返还(超过原始投资)
- 互惠建立信任
负向互惠
概念:别人伤害我,我要报复
表现:
- 即使报复有成本
- 也要惩罚不公平
例子:
- 最后通牒中拒绝低报价
- 第三方惩罚(看到不公平,愿意付费惩罚)
互惠的演化意义
为什么互惠?
- 促进合作
- 维护社会秩序
- 演化优势
声誉:
- 互惠建立声誉
- 声誉带来长期收益
损失厌恶
概念
损失厌恶(Loss Aversion):
- 损失的痛苦 > 等额收益的快乐
- 大约2:1
例子:
- 损失100元的痛苦 ≈ 获得200元的快乐
禀赋效应(Endowment Effect)
概念:拥有的东西价值更高
实验:
- 给一半人马克杯
- 问卖价和买价
- 卖价显著高于买价
解释:
- 失去马克杯是损失(痛苦)
- 获得马克杯是收益(快乐)
- 损失厌恶→卖价高
现状偏差(Status Quo Bias)
概念:倾向保持现状
例子:
- 不换工作(即使新工作更好)
- 不改投资组合
- 默认选项影响大
原因:
- 改变=损失现状
- 损失厌恶→不改变
框架效应(Framing Effect)
同样选择,不同表述,不同决策
例子1:医疗决策
- 框架A:手术成功率90%
- 框架B:手术失败率10%
- 相同信息,但框架A更吸引人
例子2:折扣vs加价
- "现金9折" vs "信用卡加价10%"
- 前者更受欢迎(虽然等价)
原因:
- 参照点不同
- 损失厌恶
过度自信
表现
高估自己能力:
- 80%的人认为自己是前50%(驾驶技术)
- 创业者过度乐观
低估风险:
- 认为坏事不会发生在自己身上
过度精确:
- 过于自信自己的判断
博弈中的影响
过度竞争:
- 高估自己胜算
- 参与赢者诅咒的竞标
谈判:
- 过度自信→不愿让步
- 导致谈判破裂
投资:
- 过度交易
- 亏损
应对
自我认知:
- 承认可能犯错
- 寻求反馈
机制设计:
- 强制冷静期
- 第三方评估
其他认知偏差
锚定效应
首个信息影响判断
例子:
- 谈判开价作为锚
- 看到高价→觉得中价合理
可得性启发(Availability Heuristic)
易想起的事件被高估概率
例子:
- 看到空难新闻→高估飞行风险
- 实际上飞行很安全
确认偏差(Confirmation Bias)
寻找支持自己观点的信息
例子:
- 相信某股票好→只看利好消息
- 忽略风险
沉没成本谬误
考虑已付出的不可回收成本
例子:
- 买了电影票发现烂片,还是坚持看完
- 理性:票钱已付,应基于剩余价值决策
情绪与博弈
愤怒
影响:
- 更倾向报复
- 即使有成本
- 拒绝不公平提议
例子:
- 路怒症
- 谈判中情绪化
后悔厌恶
害怕后悔影响决策
例子:
- 不敢做决策(怕后悔)
- 从众(大家都这样,错了不后悔)
快乐与悲伤
情绪影响风险偏好:
- 快乐时:更愿冒险
- 悲伤时:更保守
文化差异
集体主义 vs 个人主义
集体主义文化(东亚):
- 更重视团队
- 更愿合作
- 更关注关系
个人主义文化(西方):
- 更重视个人
- 更竞争
- 更关注交易
信任水平
高信任社会:
- 更愿合作
- 交易成本低
低信任社会:
- 更防范
- 交易成本高
公平观念
不同文化对公平的定义不同:
- 平等(人人相同)
- 公正(按贡献)
- 需求(按需要)
应用:行为设计
助推(Nudge)
概念:利用行为偏差引导决策
例子1:默认选项
- 器官捐献:默认参加vs默认不参加
- 退休储蓄:默认加入401k
例子2:框架
- "90%成功率"(正面框架)
- 促进接受
例子3:社会证明
- "你的邻居已节能20%"
- 促进行动
承诺机制
利用现状偏差:
- 提前承诺
- 难以反悔
例子:
- 健身房年卡
- 自动扣款慈善
要点总结
| 要素 | 要点 |
|---|---|
| 有限理性 | Level-k思考、认知负荷、简化策略 |
| 公平偏好 | 拒绝不公平、独裁者给予、条件合作 |
| 互惠动机 | 正向互惠、负向互惠、声誉 |
| 损失厌恶 | 损失痛苦>收益快乐、禀赋效应、框架效应 |
| 过度自信 | 高估能力、低估风险、过度竞争 |
| 情绪 | 愤怒、后悔、快乐/悲伤影响决策 |
| 文化差异 | 集体主义vs个人主义、信任、公平观 |
实战启示
-
预测他人行为:
- 考虑有限理性
- 考虑公平和互惠
- 不假设完全理性
-
自我认知:
- 承认自己的偏差
- 损失厌恶、过度自信
- 保持警惕
-
谈判与沟通:
- 框架很重要
- 考虑对方情绪
- 建立互惠关系
-
机制设计:
- 利用助推引导行为
- 默认选项、承诺机制
- 社会证明
-
文化敏感:
- 跨文化博弈考虑差异
- 信任建立方式不同
- 公平观念不同
-
情绪管理:
- 避免情绪化决策
- 冷静期
- 理性分析
下一章预告:演化博弈论——策略如何演化、规范如何形成
思考题:
- 你有哪些认知偏差?
- 你如何应对损失厌恶?
- 文化差异如何影响你的博弈?