【精译⚡博弈论】WilliamSpaniel

本视频是系统的博弈论课程，详细讲解了囚徒困境、纳什均衡、鹿猎博弈等核心概念与策略分析方法。

UP主: 常青藤中英字幕课程 · 时长: 13h53m · 🔗 B站原视频

标签: 博弈论 · 纳什均衡 · 经济学 · 大学课程 · 思维模型

p0 Introduction

[无字幕]

p1 The Prisoner's Dilemma and Strict Dominance

[无字幕]

p2 Iterated Elimination of Strictly Dominated Strategies

[无字幕]

p3 Pure Strategy Nash Equilibrium and the Stag Hunt

嗨，我是威廉·斯潘尼尔让我们学习一些游戏理论今天的主题是鹿猎和同伴策略现在均衡我在游戏理论第一课中覆盖了这个主题三零一游戏理论101 完整的教科书在视频描述中查找更多信息这里是情况我们有两个猎人出去打猎范围内有两只鹿和一只鹿猎人只能携带捕猎一种动物的必要设备他们必须选择这种设备而不看对方选择的是什么他们无法直接协调鹿将比两只鹿加起来值更多的肉我们将其值定为六单位的肉而每只鹿只值一单位的肉鹿很难捕猎猎人必须都试图捕猎鹿以便实际上将其困住并杀死为了得到鹿他们都必须选择鹿捕猎设备以便能够得到它相比之下鹿很容易捕猎如果你是鹿猎人你可以在不需要别人的帮助下捕获所有猎物如果我们将此信息压缩到支付矩阵中看起来像这样我们有两个玩家玩家一玩家二每个玩家可以选择捕猎鹿或捕猎鹿如果他们都捕猎鹿然后他们协调得很好他们捕获六单位的肉并平均分配每人三单位如果某人试图捕猎鹿而另一个人捕猎鹿就像在这里的结果一样捕猎鹿的玩家在这个案例中玩家二失败因为她需要玩家一的帮助才能捕猎鹿所以她得到零同时玩家一只身捕获两只鹿所以他得到两单位的肉最后，在这里的结果中他们都选择捕猎鹿所以他们平均分配两只鹿每人一只鹿在最后两个视频中我们通过寻找严格主导策略来解决游戏，但这里不会带我们去任何地方让我们看看为什么假设玩家一知道玩家二会去猎鹿在这种情况下，玩家二或玩家一也应该去猎鹿因为3大于2 但如果玩家一知道玩家二会去猎兔那么玩家一也应该去猎兔原因是如果他独自猎鹿他将失败并获得零分如果他出去猎兔那么他至少能得到一分玩家一的策略我们的最优策略完全取决于玩家二的选择同样适用于玩家二从这个角度来看，这个游戏是完全对称的玩家二只想猎鹿如果玩家一猎鹿并且只想猎兔如果玩家一猎兔因此在这里没有严格的主导策略根据我们现在对游戏理论的了解我们不能以任何有意义的方式解决这个游戏除非我们引入更多的游戏规则以便确定这里的合理结果我们将引入一种新的方法来解决游戏并理解这一点我们称之为纳什均衡纳什均衡是一组策略每个玩家的策略这样没有一个玩家有动机改变他或她的策略他或她的策略这里有几点要注意我们只关心个人偏离不关心群体偏离我们检查某个结果是否是纳什均衡我们不必检查双方是否可以集体改变策略我们只需要担心一个玩家改变他的策略是否能做得更好或者另一个玩家改变她的策略是否能做得更好我们只关心个人偏离不关心群体偏离现在纳什均衡之所以有吸引力是因为它们内在的稳定性你做的事情是优化的给定我做的事情反之亦然这意味着一旦我们实际上看到了游戏的结果一旦我们选择了我们的策略并且策略被揭示我们对我们做的事情没有后悔我为我所做的感到高兴，我有我所拥有的你对你所做的感到高兴个人不能事后改变我们的策略，我们不能做得更好所以我们来看看这是如何在实践中应用的这是如何很好地工作的我们如何找到这些纳什均衡这里有四种不同的结局所以我们要做的是看看这些中是否有任何一个是纳什均衡我们将孤立那个结果并看看如果每个或者如果任何玩家可以通过改变策略而个人能做得更好所以我们从看猎鹿猎鹿结果开始任何玩家想改变他或她的策略吗给定两个玩家都将会玩猎鹿玩家一不想改变他的策略因为他在猎鹿时得到3分而在猎兔时只得2分所以他满足于保持他的策略而玩家二也在同一条船上她她在猎鹿时得到3分而在猎兔时只得2分所以她满足于保持她的猎鹿策略因此我们知道这里这个结果是一个纳什均衡这个猎鹿猎鹿结果是一个纳什均衡每个玩家都对这个结果感到满意没有玩家可以改变他的策略并期望做得更好现在这应该是直觉的因为猎鹿结果是对两个玩家来说最好的可能的结果他们都得3分而在这种情况下的3分比任何其他结果对两个玩家来说都要好所以我们应该期望这是一个稳定的策略考虑到这是对两个玩家来说最好的事情但我们需要检查看看是否有更多的纳什均衡游戏并不总是有一个纳什均衡纳什均衡总是可以有多个所以我们真的需要检查是否有更多的这里让我们再取一个结果让我们看看这个结果当玩家一猎兔而玩家二猎鹿时这是一个纳什均衡吗这内在地稳定吗答案是不为什么看看玩家一的选择如果玩家一知道玩家二在猎鹿我们已经看到过他会想从猎兔改为猎鹿因为他可以从2分上升到3分这是一个有利的改变，从猎兔到猎鹿这意味着这不是纳什均衡因为存在一个个体的偏离使得该玩家更好现在我们可能已经完成了，不再寻找更多的偏离但我们也可以注意到玩家二有一个有利可图的偏离在这个例子中因为她在这里选择了鹿并且得到了零分但她可以切换到绵羊并且那样会更好这也是一个有利可图的偏离如果我们只关心寻找纳什均衡，那么这个信息是多余的如果我们只关心寻找纳什均衡因为我们已经基于玩家一的偏离情况知道这不可能是一个纳什均衡但我们也可以通过观察玩家二的偏离来证明这一点，在这种情况下，好的所以我们知道这是一个纳什均衡那么这种情况呢，玩家一想要猎鹿而玩家二想要猎兔我们可以看出这不是一个纳什均衡因为玩家一想要改变他的策略他可以从猎鹿得到0分改为猎兔得到1分所以这对他有利这意味着这不能是纳什均衡再次我们不需要检查玩家二的偏离因为只要我们在这发现单一偏离，在这个例子中玩家一的我们知道这个结果不能在纳什均衡剩下我们需要检查的结果只有一个那就是他们都在寻找头发所以任何玩家在这个结果预期会发生的情况下有盈利的偏离吗嗯好吧答案是是的看看玩家一的选择玩家一可能从追逐一只羊到不如两个玩家都没有有利的偏离玩家一不能从追逐一只雄鹿到追逐一只鹿因为他从赚得一分变成零分这对他不利如果他从追逐羊到追逐鹿改变策略，他会感到难过，他会感到沮丧给定玩家二将会追逐一只羊对玩家二来说也是同样的道理所以如果玩家二预期玩家一会去猎鹿她会因为她坚持策略而得到1分因为她改变策略而得到0分所以这不会是一个有利可图的偏离如果她这样做她会不开心这意味着这个结果是集体稳定的这是一个纳什均衡所以我们在这里找到了两个纳什均衡有一个纳什均衡是他们都去猎鹿存在一个纳什均衡，他们都去猎兔这个显而易见这个则更反直觉因为这对双方来说都比他们选择一起猎鹿要差然而当你无法协调时如果你预期今天会猎兔例如可能在狩猎范围之外今天猎兔日这个信息设定了这种预期使得双方都会去猎兔因此这确保了他们会做一些稍微好点的事情当他们猎兔时结果这可能会偷偷潜入并让他们陷入这种低效的境地他们都去猎兔，而不是猎鹿所以纳什均衡并不总是高效并不总是好的但它们内在是稳定的在这个特定情况下，没有人后悔猎兔，给定另一方也会这样做这就是为什么我们寻找纳什均衡这是寻找纳什均衡的一种方法在下一个视频中我们将学习什么是纳什均衡的直观理解，加入我我们我们将学习什么是纳什均衡的直观理解，加入我

p4 What Is a Nash Equilibrium？

[无字幕]

p5 Best Responses

[无字幕]

p6 Mixed Strategy Nash Equilibrium and Matching Pennies

[无字幕]

p7 The Mixed Strategy Algorithm

[无字幕]

p8 How NOT to Write a Mixed Strategy Nash Equilibrium

嗨，我是威廉·斯潘尼尔让我们学习一些游戏理论今天的主题是如何不写混合策略纳什均衡我在游戏理论101课的第一课第五节中涵盖了这一点完整的教科书基本上我们今天要解决的问题是游戏理论新手常犯的一个常见错误当他们做作业和考试时他们会很容易地失去分数因为他们犯了愚蠢的错误如果你看了这个视频你将永远不会犯这个错误，也不会失去这些容易的分数所以记得上次游戏的支付表就在你屏幕上我们看到混合策略纳什均衡是玩家一以六分之一的概率向上以五分之六的概率向下以及玩家二以三分之一的概率向左以二分之二的概率向右当一个人看到分数，比如三分之一时他们通常会把它写成0.333 因为我们通常将0.333视为三分之一然而这并不是纳什均衡这不是混合策略纳什均衡如果你这样写这从技术上是错误的，你会因此而失去分数那么为什么这从技术上是错误的呢我们最初是通过这些方程推导出三分之一的我们通过设置玩家一的向上预期效用等于向下的预期效用来求解玩家二的混合策略我们将这些方程作为玩家二混合策略的函数写出来并将这两个预期效用相等然后求解sigma left，最终得到sigma left等于三分之一但如果我们实际上将三分之一写成0.333 那么这里的一切都不会改变答案是否定的那么为什么答案是否定的呢让我们在这里进行替换让我们将sigma left替换为0.333 我只是去掉了sigma并将其替换为0.333 没有什么特别的让我们求解向上的预期效用你会得到0.999和0.667乘以-2 最终计算出为-0.335 所以向上的预期效用为-0.335 那么向下的预期效用呢这个立即抵消因为我们有一个0的乘法所以预期效用为0 所以你最终得到负0.33 所以玩家一的预期效用为负0.33 这是一个矛盾对因为我们说这里向上时的预期效用等于向下时的预期效用所以这两件事明显表明这不正确因为负0.35不等于负0.33 这说的是玩家一对向下的预期效用稍微好一点比向上时的预期效用好，因为负0.33大于负0.35 所以当它来对玩家轮到玩家一实际玩这个上升概率六分之一的均衡策略并且以五分之六的概率，那是混合策略纳什均衡玩家一必须真正想执行那个策略他不能有任何从那种混合策略中获利的偏离但他有一个有利可图的偏离吗好吧他确实如此他为什么会想要每次都有六分之一的概率去玩呢当这会导致预期的收益低于这个时这稍微好一些往下走如果你将那个六分之一的概率替换掉，并且决定每次都去他玩概率的平均表现会比这更好或者与概率六分之一玩耍并且有五分之六的概率会失败因此，由于这一点是不平等的因为我们为玩家二的混合策略写了三点三玩家一不再愿意以他的混合策略来玩这个游戏这意味着我们没有均衡必须如此，玩家二以三分之一的概率在左边进行游戏不是0.33 而是确切的1/3，让玩家1处于中立状态因此愿意以1/6的概率和5/6的概率选择与玩家2合作玩家2的任何其他概率都不会让玩家1处于中立状态这意味着他不愿意执行这种混合策略这意味着这不会是纳什均衡所以这里的解决方案真的很简单故事的道德是正确的混合策略是分数而不是小数如果你用分数写它们你将永远不会遇到这些四舍五入的问题你也不会因做出这些稍微错误的结论而扣分嗯稍微错误的结论和稍微错误的论点而小数会让你陷入麻烦分数不会只需将它们写成分数你就会没事的好的这个视频到此结束，下一视频我们将把我们的混合策略概念应用到另一个叫做性别大战的游戏中加入我那个视频

p9 Battle of the Sexes

[无字幕]

p10 Calculating Payoffs

[无字幕]

p11 Strict Dominance in Mixed Strategies

[无字幕]

p12 Weak Dominance

[无字幕]

p13 Infinitely Many Equilibria

[无字幕]

p14 The Odd Rule

[无字幕]

p15 Game Theory 101 (#16)： Subgame Perfect Equilibrium

[无字幕]

p16 Backward Induction

[无字幕]

p17 How NOT to Write a Subgame Perfect Equilibrium

[无字幕]

p18 Multiple Subgame Perfect Equilibria

[无字幕]

p19 Games with Stages

[无字幕]

p20 Punishment Strategies

[无字幕]

p21 Tying Hands and Burning Bridges

[无字幕]

p22 Commitment Problems

[无字幕]

p23 The Centipede Game

[无字幕]

p24 Problems with Backward Induction

[无字幕]

p25 Forward Induction

[无字幕]

p26 Probability Distributions

[无字幕]

p27 Generalized Battle of the Sexes

[无字幕]

p28 Knife-Edge Equilibria

[无字幕]

p29 Soccer Penalty Kicks

[无字幕]

p30 Game Theory 101 (#30.5)： Establishing Causation

[无字幕]

p31 Comparative Statics

[无字幕]

p32 Game Theory 101 (#31.5)： Comparative Statics without Derivatives

[无字幕]

p33 The Support of Mixed Strategies

[无字幕]

p34 A Trick with Weak Dominance

[无字幕]

p35 Rock Paper Scissors

[无字幕]

p36 Symmetric, Zero Sum Games

[无字幕]

p37 Modified Rock Paper Scissors

[无字幕]

p38 Mixing among Three Strategies

[无字幕]

p39 A Game with No Equilibria

[无字幕]

p40 Game Theory 101 MOOC (#39)： Duels

[无字幕]

p41 Hotelling's Game and the Median Voter Theorem

[无字幕]

p42 Second Price Auctions

[无字幕]

p43 Expected Utility Theory

[无字幕]

p44 Completeness

[无字幕]

p45 Transitivity

[无字幕]

p46 Rationality

[无字幕]

p48 Lotteries

[无字幕]

p49 Independence over Lotteries

[无字幕]

p50 The Allais Paradox

[无字幕]

p51 Continuity

[无字幕]

p52 Expected Utility Transformations

[无字幕]

p53 Pareto Efficiency

[无字幕]

p54 Risk Averse, Risk Neutral, and Risk Acceptant Preferences

[无字幕]

p55 Repeated Prisoner's Dilemma (Finite)

[无字幕]

p56 Discount Factors

[无字幕]

p57 Geometric Series and Infinite Payoffs

[无字幕]

p58 The One-Shot Deviation Principle

[无字幕]

p59 Grim Trigger in the Repeated Prisoner's Dilemma

[无字幕]

p60 Tit-for-Tat in the Repeated Prisoner's Dilemma

[无字幕]

p61 Tit-for-Tat Isn't Subgame Perfect

[无字幕]

p62 The Folk Theorem

[无字幕]

p63 Repeated Games and the Prediction Problem

[无字幕]

p64 Incomplete Information

欢迎回来游戏理论一零一我是威廉·斯潘尼尔本讲座是不完整信息的介绍，开启了这一主题的单元信息结构在战略互动中至关重要到目前为止，我们已经看到了几种不同的信息结构类型，首先我们看到了完美和完全信息的情况这些是我知道所有过去发生的事情的游戏并且我知道每个人的支付是多少，这种情况的例子将是我们在这门课程的第二单元中看过的任何内容当我们使用逆向归纳和子游戏时完美的均衡作为我们的解决方案概念第二种我们分析的信息结构是不完整的信息但是完全的信息这些是我不知道别人之前做过什么的情况但我知道每个人的收益是多少实际上，我们在这门课程的第一单元中已经涵盖了这种游戏类型囚犯的困境是这种情况的一个例子想象一下你是玩家一我是囚徒困境中的玩家二你先走然后我再走但我的信息不完美因为我没有观察到在你移动时我做了什么我知道你的收益是什么但我不知道你现在做了什么这与第三种类型的信息结构不同这是一种不完全信息的情况我不知道别人的收益是什么我们可能有不完全信息的多种不同情况但这里有几个例子想象一下我们是一场性别大战风格的游戏我知道你更喜欢芭蕾而不是战斗而不是让我们完全不能协调但我不知道你对芭蕾的偏好有多强烈也许你真的真的很喜欢芭蕾而不是战斗或者你可能只是有一点偏好，你的偏好很弱与去战斗相比那是你内在属性的一部分所以我不知道你的收益是多少必然地另一个例子是志愿者的困境我们在路上看到一场事故有人需要拨打911寻求帮助我并不一定知道拨打911对你来说会有多昂贵也许你工作很忙也许花两个小时与警察交谈对你来说并不特别吸引人或者对你来说这是一个随意悠闲的日子所以你真的不介意再花这个时间这取决于事情在你生活中发生的事情，而不是我的生活所以我并不一定知道你在想什么以及这对你而言有多昂贵第三种情况可能是在足球点球情况如果我是守门员而你是前锋我并不一定知道你在左路和右路的准确性你可能天生擅长在左路准确射门而不如右路强大但这仍然是你内部的事情所以除非我观察你练习或者我们一直在重复这个动作所以我有一个好主意我可以估计出发生了什么我真的不知道关于这第三种情况的一个有趣的事情是在这里我对你的收益的不确定性你对左边的准确性与对右边的准确性实际上直接影响了我的收益这与前两种情况形成对比尽管如此，我们还是可以将所有这些都归类在这个不完全信息的信息结构下为了澄清这些与存在不完美信息的情况不同不完整的信息是一个情况，就是我不知道某人之前做了什么不完整的信息这是一种关于偏好或收益的不确定性区分这两者非常重要如果你希望成为一个正式的理论家，这一点尤为重要尤其是如果你经常做博弈论如果你混淆了这两件事任何认真从事这个工作的人都会知道你在这方面经验相对不足这是不想向其他人发出的信号你想展示你的能力所以有一种方式可以做到那就是确保你知道不完美和不完整信息的区别虽然我们知道如何解决不完美的信息游戏但我们实际上还不知道如何解决不完整信息的游戏我们知道如何解决不完美的信息游戏但我们不知道如何解决不完整信息的游戏为什么我们还不能解决不完整信息的游戏记住我们所有提出的解决方案概念到目前为止，每个演员都有一种策略但是在我刚刚给你举的例子中，战略情景中的不完全信息类型有多种类型的行动者例如在点球情况中如果我们有一个在左边射门能力更强的前锋与右边相比我们会认为那些在左边射门能力更强的前锋应该更频繁地向左边射门在志愿者困境中我们考虑谁会拨打911 一种成本较低的个体类型九一在均衡设置中，似乎应该更有可能接听电话比那些成本较高的个体但我们无法覆盖这一点我们无法使用我们目前开发的均衡概念进行分析因为我们只有每个演员的一种策略似乎我们真正需要的不仅仅是演员的策略而是不同类型的演员的策略这就是我们将在游戏理论讨论中引入的内容在这一节关于不完全信息的单元中实际上它将分为两种不同类型的情况取决于游戏的时间安排在这里我们看到了一个2x2的均衡概念表格我们非常熟悉那个顶部的行，那里的支付是完全信息我们知道在同时动作的游戏中我们有纳什均衡在顺序游戏中我们有子游戏完美均衡我们将在本单元中开发不完全信息游戏中的纳什均衡的类似概念我们将这个解决方案概念称为贝叶斯纳什均衡个体仍然会同时行动但会有多种类型的个体我们需要一个解决方案概念来覆盖这一点在本单元中，贝叶斯纳什均衡将满足我们的需求这一讲之后我们将研究顺序游戏中不完全信息的情况在那里我们将开发子游戏完美均衡的类似概念即完美贝叶斯均衡这结束了这一讲我希望你享受了这一讲我希望下次还能见到你关于贝叶斯纳什均衡，敬请期待

p65 Bayesian Nash Equilibrium

[无字幕]

p66 Solving for Bayesian Nash Equilibrium

[无字幕]

p67 Ex Ante and Interim Dominance

[无字幕]

p68 Why Are There Antes in Poker？

[无字幕]

p69 Is More Information Always Better？

[无字幕]

p70 Cutpoint Strategies, Continuous Type Spaces, and Bayesian Nash Equilibrium

[无字幕]

p71 The Purification Theorem

[无字幕]

p72 Bayes' Rule

[无字幕]

p73 The Winner's Curse, Part 1

欢迎回来游戏理论一零一我是威廉·斯潘尼尔今天的话题是赢家诅咒这个话题真的很有趣但我们实际上需要对之前讨论过的内容进行回顾以便充分欣赏结果我想让你回想起我们谈论第二次价格拍卖的时候你会记得第二次价格拍卖是一种情况拍卖师向所有相关方征集密封投标然后查看这些密封的投标将奖项授予出价最高的投标者但只让最高投标者支付第二名的出价例如如果我们是唯一的两个投标者我出价70美元，而你出价50美元那么我是拍卖的赢家因为我出价最高，70美元但并不需要支付70美元拍卖师向我收取了第二高的价格这是你的出价五十我们在第二价格拍卖中看到的是它是每个玩家的均衡提交他们对商品的真实价值所以不需要战略性地思考我要出价多少并做出最佳回应或者思考第三方会出多少然后做出最佳回应，以此类推对你来说，这是一个主导策略，让你退一步思考思考自己嗯最高价是多少我愿意支付的价格很好把你们的报价写在纸条上然后提交给拍卖师这里有一个重要的前提，只有在这种情况下，才能达到均衡但是这个前提是，奖品的价值需要独立于很多事都遵循这个例如如果我拍卖我签名的游戏理论101，完整的教科书一零一你的价值多少对你朋友的弗兰克来说，你没有影响巴布亚的价值对加拿大的巴布亚的价值对很多消费来说都是真实的商品像教科书一样这不是真的是为那些具有共同价值的事物你计划重新销售的东西例如这是几个非常重要的例子实际上包括石油储备和体育自由球员如果你试图购买一块油田你不会购买它然后消费它你没有直接拥有油田的价值你不会这样想我很高兴我拥有一座油田如果你有一座油田你会因为可以从地下提取石油而感到高兴然后出售它如果那里还有更多石油这将增加我们对该价格的价值体育自由球员的情况也是如此玩家越好我们在那个玩家身上有越多的价值我们将会看到当我们面临赌注时，出价你的真实价值并不是一个好主意当我们面临共同价值物品时这与独立价值不同独立价值只需提交你的真实价值对于共同价值不要那样做尽管让我们看看为什么这叫做赢家诅咒这是一个常见的价值拍卖我们有一个油田，可能一文不值从地下提取石油非常昂贵它可能值两五百万美元或者它可能值五千万美元五千万美元嘿提取石油真的很容易这将是伟大的这将是非常有利可图的零美元的结果将会有四分之一的时间二十五万美元的结果将会有一半的时间五百万美元的结果将会有四分之一的时间我们将有两个竞标者参与第二次价格拍卖来购买这个油田我们将会有平局将由硬币翻转来决定这里关键的是尽管每个玩家在拍卖开始前都不知道油田的真实价值他们相信油田的价值可能是零也可能是20万、50万或者更多这些价值以概率分布的形式存在但他们无法确定具体数值在拍卖开始前他们会收到油田价值的信号他们不仅拥有之前的信念还可以派人去油田查看评估油田的开采成本但这些公司收到的信息并不清晰他们无法确定在收到报告后油田是否价值连城或者一文不值或者介于两者之间他们收到的信号可能是模糊的如果油田一文不值所有人都会收到低价值信号如果油田价值20万一人收到低价值信号一人收到高价值信号如果油田价值50万所有人都会收到高价值信号这是一个贝叶斯博弈每个玩家有两种类型高价值类型和低价值类型我们需要找到每种类型的最优竞价策略以确定博弈的均衡每种类型的玩家在收到信号后会根据自己的信念进行竞价我们开始时相同但信号的不同会让我们成为不同类型的玩家我收到的信号是低价值这使我与高价值信号的玩家区分开来作为低价值类型的我必须考虑到高价值类型的玩家可能会采取的策略反过来也会影响你作为低价值类型或者高价值类型的玩家的竞价策略这是一个对称的游戏好消息是如果我们找到了一个玩家的竞价策略也就找到了两个玩家的策略现在可能是个好时机，自己尝试一下思考你的预期价值是什么如果你收到一个低或高的信号，那么你可能想要出价多少如果你想暂停视频一会儿现在就去做，试着计算也许思考你应该做什么，不应该做什么为什么这可能是一个好主意为什么这可能不是一个好主意但如果你准备好继续让我们看看如果你遵循了这个小贴士或者我之前给你的关于第二价格拍卖的建议这是要评估你的真实价值那么我们来思考一下你的价值预期在你收到一个低信号后假设你收到了一个低信号油井价值5000万美元的概率是多少嗯花一秒钟时间想想这实际上是微不足道的这是一个陷阱问题这是不可能的如果油田价值五千万美金你永远无法接收到微弱的信号现在让我们思考一下，如果接收到低信号会发生什么而你正在试图计算出油田价值两亿的概率是多少五百万美元好的，我之前提到过如何计算，你可以使用贝叶斯法则该领域的先验概率为二百五十万美元的值是二分之一接收到弱信号的概率既然这个领域价值两千五百万美元，就等于一半先前的概率，田野的价值为零，是四分之一接收到低信号的概率如果这块地毫无价值，那么这个概率是1 如果地毫无价值，你肯定会收到低信号如果地毫无价值，那么你肯定会收到低信号这是我们需要实施的贝叶斯规则的四个组成部分这就是我在这里做的事情所以我们有这块地价值250万美元的概率乘以你收到低信号的概率给定这块地价值250万美元然后你将这个除以所有收到低信号的方式这包括它是一个二百五十万美元油田的概率在条件之下接收到低信号的概率正如你在分子中看到的那样然后你也必须加上其他可能性这是从一个油田毫无价值的情况下接收到低信号的概率那就是油田毫无价值的概率乘以接收到低信号的概率在油田毫无价值的情况下，给定的低信号这个概率会给你接收到低信号的情况下拥有250万美元油田的概率二百五十万美元油田的条件下接收到低信号为了进行一些简化这实际上变成了一个非常简单的分数它就是二分之一所以得到两个的概率假设有500万美元的油田，条件是在收到低信号后的概率是二分之一，好的现在让我们考虑最后一种可能性所以你仍然收到了那个低信号油田的价值为零的概率是多少嗯你可以使用贝叶斯法则，就像我们之前所做的那样你会得到同样的答案就好像你刚刚观察到它必须是一半为什么必须是一半好外面只有三种可能性这是50亿美元的油田一个两千五十万美元的石油田或毫无价值的石油田我们知道它可能是五千万美金的概率是零我们知道概率是二五百万美元是一半因此，由于所有可能性分布都必须相加为1 这意味着剩下的一半必须落在它上面作为一个毫无价值的油田所以我们可以将所有信息结合起来提取油田的预期值，有条件地接收到低信号所以它是二分之一乘以二五百万美元加上二分之一乘以零这等于十二点五万美元在这里隐含还有一个零乘以五千万美元当然，这立即抵消所以，如果你对油田的出价是你对油田的真实价值在收到低信号井的情况下这将是1250万美元这是你对油田价值的信念在收到低信号后让我们对如果你收到高信号会发生什么做同样的事情如果你收到高信号油田价值等于零的概率是多少好吧，再次这是一个陷阱问题这是不可能的如果你有一个高的信号不可能来自一个一文不值的领域如果一个领域一文不值那么两个玩家都会收到一个低的信号接收到一个高的信号是不可能的在那种情况下那它值两千五百万美元呢好吧，我们又使用了贝叶斯法则我们知道田地值两千五百万美元的先验概率是一半我们知道接收到高信号的概率给定两个五千万美元的概率是二分之一我们知道油田价值五千万美元的前概率是四分之一我们知道接收到高信号的概率给定它值五千万美元的概率是肯定的它的概率是1 你可以把所有信息代入贝叶斯规则就像我们之前所做的这将给我们带来后验或更新信念使用贝叶斯规则计算油田值五千万美元的条件概率在接收到高信号的情况下如果我们做一些简化后替换那些值那么我们就得到了这个等于二分之一非常简单最后一个可能性是油田值五千万美元你可以使用贝叶斯规则来计算这是真实的概率就像之前一样你可以很容易地观察到这必须是二分之一因为另两个可能性的概率是零和二分之一所有可能性的概率必须相加等于一所以缺失的概率是二分之一就这样这意味着我们可以很容易地计算油田的价值在接收到高信号的情况下这将是二分之一乘以五千万美元加上二分之一乘以五千万美元结果是三百七十五万美元让我们回顾一下我给你的第二价格拍卖规则如果你在第二价格拍卖中出价你的真实价值这意味着类型接收到低信号的人会出价一千二百五十万美元而类型接收到高信号的人会出价三百七十五万美元我的问题问你是否这处于均衡状态再次这可能是你暂停并自己工作的机会如果你之前没有取得进展我已经给了你很多关于策略的提示特别是在我们声称的这个均衡中可能或不可能是真的现在你有了这些策略这是一个很好的机会来考虑是否有利可图的偏离无论是低类型还是高类型如果你准备好了我们现在将看到它并不是均衡就像我一直暗示的那样为了证明我们将使用提示我们将看看如果你是低类型并按照策略出价一千二百五十万美元如果你接收到低信号并出价一千二百五十万美元从这以后会有两种可能的结果一半的时间内油田实际值五千万美元油田实际值五千万美元如果那是情况我们知道其他玩家会收到高信号并出价3750万在这种情况下，你被出价超过了所以你输了拍卖其他玩家赢了你得不到你得不到任何东西你支付了零另一半时间里，土地价值零如果那是情况其他玩家也会收到低信号并出价1250万美元他们正在做和你一样的事情这意味着当拍卖师收到那些出价时出现了平局平局通过硬币正反面决定因此一半的时间你会输得一无所有而另一半时间你会赢得一个引号中的无用油田并支付1250万美元这应该让情况变得更加清晰这解释了这里的问题以及为什么这不会是一个最优的均衡所以总结一下这些信息转化为实际价值一些关于总体收益的数字一半的时间对方收到的信号更高并高出你的报价所以你的收益为零剩下的一半时间他们也收到了低信号他们也报价1250万美元一半的时间你赢了这个硬币翻所以你赢得了那个零美元的油田你支付1250万美元另一半时间你输了硬币翻实际上赢得了抛硬币你得不到任何东西，这与赢得抛硬币相比更好并支付了1250万美元的无用油田因此，您的整体收益是负的负310.125万美元这再次是负的你可以看到为什么现在有有利的偏差如果你是低类型的你可以开始这个游戏时只是说你知道我赌什么都没有我不在乎我对这块油田出价为零如果你这样做你将使获得负收益变得几乎不可能这对你来说比按照给出的策略出价1250万美元要好在你收到那个低信号后以便你有一个盈利的偏离策略这个盈利的偏离策略就是简单地出价零好的这里发生了什么问题赢得意味着你收到了最强的信号但是，在有条件赢得的情况下，奖品的价值低于你的信号告诉你的因为你赢得了拍卖这意味着其他人更有可能收到了低信号如果其他人收到了低信号这应该让你更新你的信念认为你面前的奖品并没有你想象的那么有价值正如你之前认为的那样这就是所谓的赢家诅咒那就是如果你出价不是你期望收到的那样但更多是你所期待的有条件的信号你将会伤害自己你将要为某事支付一大笔钱那并不是你想象中的那么有价值在这种情况下，实际上会因为那样做而获得负收益实际上这将结束这个迷你系列关于赢家诅咒的一半我们将在下次讲座中看到解决这个问题的方案这仅仅是在假设你获胜的情况下，对你奖品的预期价值进行竞价而不是你的预期价值考虑到你已经收到的任何信号我希望你们喜欢这期节目我也希望你们下次能来看我们将讨论这个游戏的均衡策略探讨赢家诅咒的一些普遍特性当你面对的竞标者很多而不是只有一个时，你该怎么做以及这个问题是否真的在现实世界中发生再次感谢希望你喜欢这个视频希望下次还能见到你保重

【精译⚡博弈论】WilliamSpaniel

On this page