囚徒困境:在竞争与合作之间取得平衡

关键要点

  • 囚徒困境说明自私行为会导致次优结果。
  • 在囚徒困境中,合作并不总是符合个人最佳利益。
  • 在商业中,识别囚徒困境有助于平衡竞争与合作。
  • 阿尔伯特·塔克在1950年将囚徒困境引入博弈论。
  • 囚徒困境展示了个人决策如何影响群体结果。

获取基于27年以上可信专业经验的个性化AI答案。

提问

囚徒困境是由兰德公司(Rand Corporation)的梅里尔·弗拉德(Merrill Flood)和梅尔文·德雷舍(Melvin Dresher)于1950年提出的一个悖论,后来由加拿大数学家阿尔伯特·威廉·塔克(Albert William Tucker)正式化并命名。

囚徒困境基本提供了理解如何在合作与竞争之间取得平衡的框架,这些概念有时也能成为战略决策的有用工具。因此,它在商业、金融、经济、政治科学乃至哲学、心理学、生物学和社会学等多个领域都有应用。

VioletaStoimenova / Getty Images

解释囚徒困境

囚徒困境的场景如下:两名嫌疑人因犯罪被捕,现被关在警察局的不同房间中,无法相互沟通。检察官分别告诉他们以下内容:

  • 如果你认罪并同意作证指控另一名嫌疑人,而他不认罪,你的指控将被撤销,你将获释,另一嫌疑人将服三年刑期。
  • 如果你不认罪,但对方认罪,你将被判刑三年,而对方获释。
  • 如果你们都认罪,你们都将被判两年。
  • 如果你们都不认罪,你们都将被控轻罪,判一年。

嫌疑人应当怎么做?这就是囚徒困境的核心。

囚徒困境的基本原则

要使囚徒困境悖论成立,必须具备一些基本概念。这些概念包括:

  • 必须有两个参与者。 场景涉及两个个体或实体,他们都涉及到共同的情况,比如共同犯罪或面临共同决策。
  • 决策同时进行。 两个参与者在不知道对方选择的情况下做出决定。这种同时决策是困境的关键,每一方都必须在不了解对方选择的情况下做出决定。
  • 必须存在多种结果组合。 一个收益矩阵是一张表,列出双方可能的选择组合及其对应的收益或结果,帮助可视化不同决策的后果。稍后我们会详细介绍收益矩阵。
  • 可以是互相合作或互相背叛。 参与者可以选择合作(追求互利的结果)或背叛(追求自我利益最大化)。困境的张力来自个人利益与集体利益之间的冲突。
  • 每个参与者都有优势策略。 这是指无论对方选择什么,能带来最佳结果的策略。这种优势策略通常是理性选择,但当双方都采取时,可能导致次优结果。
  • 假设参与者是理性决策者。 这意味着人们倾向于最大化自身利益。这是博弈论和理性选择模型的基本假设,推动了选项之间的冲突。

评估最优策略

让我们先构建一个收益矩阵,如下表所示。这里的“收益”以服刑时间的长短(用负数表示,数字越大越好)来衡量。“合作”和“背叛”指嫌疑人合作(如都不认罪)或背叛(如一方认罪另一方不认罪)。单元格(a)到(d)中的第一个数字代表嫌疑人A的收益,第二个数字代表嫌疑人B的收益。

囚徒困境——收益矩阵
嫌疑人B
合作
背叛
嫌疑人A
合作
(a) -1, -1
© -3, 0
背叛
(b) 0, -3
(d) -2, -2

对于参与者来说,优势策略是无论对方采取什么,都能带来最佳收益的策略。这里的优势策略是双方都选择背叛(认罪),因为认罪可以最小化平均服刑时间。可能的结果包括:

  • 如果A和B都合作(不认罪),都判一年(单元格a)。
  • 如果A认罪但B不认罪,A获释,B判三年(单元格b)。
  • 如果A不认罪但B认罪,A判三年,B获释(单元格c)。
  • 如果双方都认罪,判两年(单元格d)。

因此,如果A认罪,他们要么获释,要么判两年;不认罪则可能判一年或三年。B面临的困境完全相同。

囚徒困境的后果

囚徒困境巧妙地展示了:当每个人都追求自身利益时,结果比双方合作更糟。在上述例子中,合作(双方都保持沉默、不认罪)会让两名嫌疑人都判一年。其他所有结果都意味着两到三年的刑期。

理性人只考虑最大利益,通常会选择背叛而非合作。如果双方都假设对方不会背叛,结果会是单元格(d),即双方都判两年,而不是他们期望的(b)或(c)。在囚徒的例子中,合作(保持沉默)意味着一年的刑期,而认罪可能带来自由,或最差两年。然而,不认罪的风险是如果对方认罪(背叛),自己可能面临三年刑期(反之亦然)。

这个困境——背叛的激励远大于合作的潜在收益——在商业和经济中以多种方式展现。

快速事实

阿尔伯特·塔克于1950年首次在斯坦福大学向一群研究生心理学学生介绍囚徒困境,作为博弈论的例子。

商业中的囚徒困境应用

现实中,囚徒困境的经典例子是两个竞争者在市场上的竞争。许多行业中有两个主要对手。例如,在美国,可口可乐(KO)与百事可乐(PEP)在软饮料市场激烈竞争,家得宝(HD)与洛威(LOW)在建材市场也是如此。这些竞争在商学院中成为众多案例研究的主题。其他激烈的竞争还包括星巴克(SBUX)与Tim Horton’s(QSR)在加拿大,以及苹果(AAPL)与三星在全球手机市场。

以可口可乐与百事可乐为例,假设前者考虑降低其标志性汽水的价格。如果降价,百事可能不得不跟进以保持市场份额。这可能导致两家公司利润大幅下降。

任何一方降价都可能被视为背叛,因为这打破了保持价格高、最大化利润的隐性协议。因此,如果可口可乐降价而百事保持高价,前者就是在背叛,后者则是在合作(遵守隐性协议精神)。在这种情况下,可口可乐可能通过销售更多可乐赢得市场份额和更高的额外利润。

理解囚徒困境中的收益矩阵

假设可口可乐和百事的额外利润如下:

  • 双方都保持高价,利润各增加5亿美元(因需求正常增长)。
  • 一方降价(背叛),另一方不降(合作),前者利润增加7.5亿美元,后者不变。
  • 双方都降价,软饮料消费增加抵消降价带来的利润损失,各自利润增加2.5亿美元。

收益矩阵如下(数字代表以百万元为单位的额外利润):

可口可乐与百事可乐——收益矩阵
百事可乐
合作
背叛
可口可乐
合作
500, 500
0, 750
背叛
750, 0
250, 250

其他常见的囚徒困境例子还包括新产品或技术开发,以及公司在广告和市场推广上的投入。

比如,两家公司有隐性协议在某一年保持广告预算不变。如果一方背叛,增加广告投入,可能获得更高利润,因销售增长抵消了广告支出增加。然而,如果双方都增加广告预算,广告投入相互抵消,效果可能变差,利润反而降低(因广告成本增加)。

经济中的囚徒困境应用

美国民主党与共和党之间的债务僵局是囚徒困境的经典例子。

假设解决美国债务问题的效益是下一次选举中的选票。合作意味着双方愿意维持现状,控制不断上升的预算赤字。背叛则意味着采取措施缩减赤字。

如果双方都合作,经济平稳运行,选票会有所增加。但如果A党试图主动解决债务问题,而B党不合作,B可能会失去选票,转而支持A。

如果双方都不合作,采取强硬措施,可能引发经济动荡、市场下跌、信用评级下调甚至政府关门,最终两党都可能失去更多选票。

如何利用囚徒困境

囚徒困境可以帮助个人在生活中的多种决策中,比如买车、薪资谈判等。

比如,你打算买新车,走进一家经销商。这里的“收益”是非数值的(如对交易的满意度)。你希望以最低价格、获得理想配置,而销售员希望以最高价格赚取佣金。

合作意味着不讨价还价,直接接受标价(让销售员满意),带着新车离开。背叛意味着讨价还价,争取更低价格。假设满意度用0到10的分值表示,10代表完全满意,0代表完全不满意,收益矩阵如下:

买家与销售员——收益矩阵
销售员
合作
背叛
买家
合作
(a) 7, 7
© 0, 10
背叛
(b) 10, 0
(d) 3, 3

这个矩阵告诉我们什么?如果你强硬讨价还价,成功争取大幅降价,你会非常满意(a),但销售员可能不满意(b)。反之,如果销售员坚持不让步,你会不满意(c),销售员则满意(c)。如果你直接接受标价(a),满意度较低,销售员也可能不太满意,因为你可能会觉得他可以卖出更贵的车型或加装配件赚更多。

单纯支付全价(d)会让双方都不满意,因为长时间讨价还价可能导致双方都妥协,满意度最低。类似地,在薪资谈判中,接受第一份报价可能看似简单,但可能会少拿一些钱。争取更高薪水可能会带来更丰厚的待遇,但如果雇主不愿意,最终可能不满意。

希望薪资谈判不要变得激烈,否则双方都不满意。前述买卖收益矩阵也可以扩展到求职者与雇主的满意度。

经济中的囚徒困境示例

最后,我们用经济学中的例子来说明囚徒困境。宏观经济中,政府财政政策在经济衰退时的表现就是一个典型例子。

当经济衰退时,各国政府面临是否采取扩张性财政政策以刺激经济增长的选择。然而,这些政策的效果取决于其他国家的行动。

假设所有国家同时采取扩张性政策,全球需求增加,可能实现经济复苏。但如果某个国家采取紧缩政策(如削减预算),短期内可能稳定,但对全球经济不利。

这就像囚徒困境:每个政府都必须决定是否合作(共同实施扩张政策)或背叛(采取紧缩措施)。如果所有国家合作,全球经济更有可能恢复;如果一些国家背叛,追求最大利益,整体复苏可能受阻,结果对所有国家都不利。

囚徒困境的答案是什么?

没有绝对正确的答案。它是一个悖论,展示了个人决策如何影响集体结果。

用简单的话说,囚徒困境是怎样的?

两个囚犯面对是否认罪或保持沉默的选择,不能沟通。每个人的选择都影响对方。如果一方认罪,另一方不认罪,认罪者获释,另一方判长刑;如果都不认罪,双方都判较短的刑期;如果都认罪,双方都判中等刑期。博弈论预测,通常人们会选择对自己最有利的选项。

囚徒困境的最佳策略是什么?

囚徒困境不是关于“最佳策略”或“答案”,而是展示两个自利行为体无法实现双赢的最优结果。

结论

囚徒困境告诉我们,追求个人利益并不总能带来最优结果。企业、政府和个人在行动时,考虑合作可能会带来更好的整体结果。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 赞赏
  • 评论
  • 转发
  • 分享
评论
0/400
暂无评论
交易,随时随地
qrCode
扫码下载 Gate App
社群列表
简体中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)