📚 文稿库

【精译⚡博弈论】WilliamSpaniel

本视频是系统的博弈论课程,详细讲解了囚徒困境、纳什均衡、鹿猎博弈等核心概念与策略分析方法。

UP主: 常青藤中英字幕课程 · 时长: 13h53m · 🔗 B站原视频

标签: 博弈论 · 纳什均衡 · 经济学 · 大学课程 · 思维模型

p0 Introduction

[无字幕]

p1 The Prisoner's Dilemma and Strict Dominance

[无字幕]

p2 Iterated Elimination of Strictly Dominated Strategies

[无字幕]

p3 Pure Strategy Nash Equilibrium and the Stag Hunt

嗨,我是威廉·斯潘尼尔 让我们学习一些游戏理论 今天的主题是鹿猎和同伴策略 现在均衡 我在游戏理论第一课中覆盖了这个主题 三零一 游戏理论101 完整的教科书 在视频描述中查找更多信息 这里是情况 我们有两个猎人出去打猎 范围内有两只鹿和一只鹿 猎人只能携带捕猎一种动物的必要设备 他们必须选择这种设备而不看对方选择的是什么 他们无法直接协调 鹿将比两只鹿加起来值更多的肉 我们将其值定为六单位的肉 而每只鹿只值一单位的肉 鹿很难捕猎 猎人必须都试图捕猎鹿 以便实际上将其困住并杀死 为了得到鹿 他们都必须选择鹿捕猎设备 以便能够得到它 相比之下 鹿很容易捕猎 如果你是鹿猎人 你可以在不需要别人的帮助下捕获所有猎物 如果我们将此信息压缩到支付矩阵中 看起来像这样 我们有两个玩家 玩家一 玩家二 每个玩家可以选择捕猎鹿或捕猎鹿 如果他们都捕猎鹿 然后他们协调得很好 他们捕获六单位的肉并平均分配 每人三单位如果某人试图捕猎鹿 而另一个人捕猎鹿 就像在这里的结果一样 捕猎鹿的玩家 在这个案例中 玩家二失败因为她需要玩家一的帮助才能捕猎鹿 所以她得到零 同时玩家一只身捕获两只鹿 所以他得到两单位的肉最后,在这里的结果中 他们都选择捕猎鹿 所以他们平均分配两只鹿每人一只鹿 在最后两个视频中 我们通过寻找严格主导策略来解决游戏,但这里不会带我们去任何地方 让我们看看为什么假设 玩家一知道玩家二会去猎鹿 在这种情况下,玩家二或玩家一也应该去猎鹿 因为3大于2 但如果玩家一知道玩家二会去猎兔 那么玩家一也应该去猎兔 原因是如果他独自猎鹿 他将失败并获得零分 如果他出去猎兔 那么他至少能得到一分 玩家一的策略 我们的最优策略完全取决于玩家二的选择 同样适用于玩家二 从这个角度来看,这个游戏是完全对称的 玩家二只想猎鹿 如果玩家一猎鹿 并且只想猎兔 如果玩家一猎兔 因此 在这里没有严格的主导策略 根据我们现在对游戏理论的了解 我们不能以任何有意义的方式解决这个游戏 除非我们引入更多的游戏规则 以便确定这里的合理结果 我们将引入一种新的方法来解决游戏 并理解这一点 我们称之为纳什均衡 纳什均衡是一组策略 每个玩家的策略 这样没有一个玩家有动机改变他或她的策略 他或她的策略 这里有几点要注意 我们只关心个人偏离 不关心群体偏离 我们检查某个结果是否是纳什均衡 我们不必检查双方是否可以集体改变策略 我们只需要担心 一个玩家改变他的策略是否能做得更好 或者另一个玩家改变她的策略是否能做得更好 我们只关心个人偏离 不关心群体偏离 现在 纳什均衡之所以有吸引力 是因为它们内在的稳定性 你做的事情是优化的 给定我做的事情 反之亦然 这意味着一旦我们实际上看到了游戏的结果 一旦我们选择了我们的策略并且策略被揭示 我们对我们做的事情没有后悔 我为我所做的感到高兴,我有我所拥有的 你对你所做的感到高兴 个人不能事后改变我们的策略,我们不能做得更好 所以我们来看看这是如何在实践中应用的 这是如何很好地工作的 我们如何找到这些纳什均衡 这里有四种不同的结局 所以我们要做的是看看 这些中是否有任何一个是纳什均衡 我们将孤立那个结果 并看看如果每个 或者如果任何玩家可以通过改变策略而个人能做得更好 所以我们从看猎鹿猎鹿结果开始 任何玩家想改变他或她的策略吗 给定两个玩家都将会玩猎鹿 玩家一不想改变他的策略 因为他在猎鹿时得到3分而在猎兔时只得2分 所以他满足于保持他的策略 而玩家二也在同一条船上 她 她在猎鹿时得到3分而在猎兔时只得2分 所以她满足于保持她的猎鹿策略 因此我们知道这里 这个结果是一个纳什均衡 这个猎鹿猎鹿结果是一个纳什均衡 每个玩家都对这个结果感到满意 没有玩家可以改变他的策略并期望做得更好 现在 这应该是直觉的 因为猎鹿结果是对两个玩家来说最好的可能的结果 他们都得3分 而在这种情况下的3分比任何其他结果对两个玩家来说都要好 所以我们应该期望这是一个稳定的策略 考虑到这是对两个玩家来说最好的事情 但我们需要检查看看是否有更多的纳什均衡 游戏并不总是有一个纳什均衡 纳什均衡总是可以有多个 所以我们真的需要检查是否有更多的这里 让我们再取一个结果 让我们看看这个结果 当玩家一猎兔而玩家二猎鹿时 这是一个纳什均衡吗 这内在地稳定吗 答案是不 为什么看看玩家一的选择 如果玩家一知道玩家二在猎鹿 我们已经看到过 他会想从猎兔改为猎鹿 因为他可以从2分上升到3分 这是一个有利的改变,从猎兔到猎鹿 这意味着这不是纳什均衡 因为存在一个个体的偏离使得该玩家更好 现在我们可能已经完成了,不再寻找更多的偏离 但我们也可以注意到玩家二有一个有利可图的偏离 在这个例子中 因为她在这里选择了鹿并且得到了零分 但她可以切换到绵羊并且那样会更好 这也是一个有利可图的偏离 如果我们只关心寻找纳什均衡,那么这个信息是多余的 如果我们只关心寻找纳什均衡 因为我们已经基于玩家一的偏离情况知道 这不可能是一个纳什均衡 但我们也可以通过观察玩家二的偏离来证明这一点,在这种情况下,好的 所以我们知道这是一个纳什均衡 那么这种情况呢,玩家一想要猎鹿 而玩家二想要猎兔 我们可以看出这不是一个纳什均衡 因为玩家一想要改变他的策略 他可以从猎鹿得到0分改为猎兔得到1分 所以这对他有利 这意味着这不能是纳什均衡 再次我们不需要检查玩家二的偏离 因为只要我们在这发现单一偏离,在这个例子中玩家一的 我们知道这个结果不能在纳什均衡 剩下我们需要检查的结果只有一个 那就是他们都在寻找头发 所以任何玩家在这个结果预期会发生的情况下有盈利的偏离吗 嗯 好吧 答案是是的 看看玩家一的选择 玩家一可能从追逐一只羊到 不如 两个玩家都没有有利的偏离 玩家一不能从追逐一只雄鹿到追逐一只鹿 因为他从赚得一分变成零分 这对他不利 如果他从追逐羊到追逐鹿改变策略,他会感到难过,他会感到沮丧 给定玩家二将会追逐一只羊 对玩家二来说也是同样的道理 所以如果玩家二预期玩家一会去猎鹿 她会因为她坚持策略而得到1分 因为她改变策略而得到0分 所以这不会是一个有利可图的偏离 如果她这样做她会不开心 这意味着这个结果是集体稳定的 这是一个纳什均衡 所以我们在这里找到了两个纳什均衡 有一个纳什均衡是他们都去猎鹿 存在一个纳什均衡,他们都去猎兔 这个显而易见 这个则更反直觉 因为这对双方来说都比他们选择一起猎鹿要差 然而 当你无法协调时 如果你预期今天会猎兔 例如 可能在狩猎范围之外 今天猎兔日这个信息设定了这种预期 使得双方都会去猎兔 因此这确保了他们会做一些稍微好点的事情 当他们猎兔时 结果 这可能会偷偷潜入并让他们陷入这种低效的境地 他们都去猎兔,而不是猎鹿 所以纳什均衡并不总是高效 并不总是好的 但它们内在是稳定的 在这个特定情况下,没有人后悔猎兔,给定另一方也会这样做 这就是为什么我们寻找纳什均衡 这是寻找纳什均衡的一种方法 在下一个视频中 我们将学习什么是纳什均衡的直观理解,加入我 我们 我们将学习什么是纳什均衡的直观理解,加入我

p4 What Is a Nash Equilibrium?

[无字幕]

p5 Best Responses

[无字幕]

p6 Mixed Strategy Nash Equilibrium and Matching Pennies

[无字幕]

p7 The Mixed Strategy Algorithm

[无字幕]

p8 How NOT to Write a Mixed Strategy Nash Equilibrium

嗨,我是威廉·斯潘尼尔 让我们学习一些游戏理论 今天的主题是如何不写混合策略纳什均衡 我在游戏理论101课的第一课第五节中涵盖了这一点 完整的教科书 基本上我们今天要解决的问题 是游戏理论新手常犯的一个常见错误 当他们做作业和考试时 他们会很容易地失去分数 因为他们犯了愚蠢的错误 如果你看了这个视频 你将永远不会犯这个错误,也不会失去这些容易的分数 所以记得上次游戏的支付表就在你屏幕上 我们看到混合策略纳什均衡是玩家一以六分之一的概率向上 以五分之六的概率向下 以及玩家二以三分之一的概率向左 以二分之二的概率向右 当一个人看到分数,比如三分之一时 他们通常会把它写成0.333 因为我们通常将0.333视为三分之一 然而 这并不是纳什均衡 这不是混合策略 纳什均衡 如果你这样写 这从技术上是错误的,你会因此而失去分数 那么为什么这从技术上是错误的呢 我们最初是通过这些方程推导出三分之一的 我们通过设置玩家一的向上预期效用 等于向下的预期效用来求解玩家二的混合策略 我们将这些方程作为玩家二混合策略的函数写出来 并将这两个预期效用相等 然后求解sigma left,最终得到sigma left等于三分之一 但如果我们实际上将三分之一写成0.333 那么这里的一切都不会改变 答案是否定的 那么为什么答案是否定的呢 让我们在这里进行替换 让我们将sigma left替换为0.333 我只是去掉了sigma并将其替换为0.333 没有什么特别的 让我们求解向上的预期效用 你会得到0.999和0.667乘以-2 最终计算出为-0.335 所以向上的预期效用为-0.335 那么向下的预期效用呢 这个立即抵消 因为我们有一个0的乘法 所以预期效用为0 所以你最终得到负0.33 所以玩家一的预期效用为负0.33 这是一个矛盾 对 因为我们说这里向上时的预期效用等于向下时的预期效用 所以这两件事明显表明这不正确 因为负0.35不等于负0.33 这说的是玩家一对向下的预期效用稍微好一点 比向上时的预期效用好,因为负0.33大于负0.35 所以当它来对玩家 轮到玩家一实际玩这个上升概率六分之一的均衡策略 并且以五分之六的概率,那是混合策略 纳什均衡 玩家一必须真正想执行那个策略 他不能有任何从那种混合策略中获利的偏离 但他有一个有利可图的偏离吗 好吧 他确实如此 他为什么会想要每次都有六分之一的概率去玩呢 当这会导致预期的收益低于这个时 这稍微好一些往下走 如果你将那个六分之一的概率替换掉,并且决定每次都去 他玩概率的平均表现会比这更好 或者与概率六分之一玩耍 并且有五分之六的概率会失败 因此,由于这一点是不平等的 因为我们为玩家二的混合策略写了三点三 玩家一不再愿意以他的混合策略来玩这个游戏 这意味着我们没有均衡 必须如此,玩家二以三分之一的概率在左边进行游戏 不是0.33 而是确切的1/3,让玩家1处于中立状态 因此愿意以1/6的概率和5/6的概率选择与玩家2合作 玩家2的任何其他概率都不会让玩家1处于中立状态 这意味着他不愿意执行这种混合策略 这意味着这不会是纳什均衡 所以这里的解决方案真的很简单 故事的道德是正确的 混合策略是分数而不是小数 如果你用分数写它们 你将永远不会遇到这些四舍五入的问题 你也不会因做出这些稍微错误的结论而扣分 嗯 稍微错误的结论和稍微错误的论点 而小数会让你陷入麻烦 分数不会 只需将它们写成分数 你就会没事的 好的 这个视频到此结束,下一视频 我们将把我们的混合策略概念应用到另一个叫做性别大战的游戏中 加入我那个视频

p9 Battle of the Sexes

[无字幕]

p10 Calculating Payoffs

[无字幕]

p11 Strict Dominance in Mixed Strategies

[无字幕]

p12 Weak Dominance

[无字幕]

p13 Infinitely Many Equilibria

[无字幕]

p14 The Odd Rule

[无字幕]

p15 Game Theory 101 (#16): Subgame Perfect Equilibrium

[无字幕]

p16 Backward Induction

[无字幕]

p17 How NOT to Write a Subgame Perfect Equilibrium

[无字幕]

p18 Multiple Subgame Perfect Equilibria

[无字幕]

p19 Games with Stages

[无字幕]

p20 Punishment Strategies

[无字幕]

p21 Tying Hands and Burning Bridges

[无字幕]

p22 Commitment Problems

[无字幕]

p23 The Centipede Game

[无字幕]

p24 Problems with Backward Induction

[无字幕]

p25 Forward Induction

[无字幕]

p26 Probability Distributions

[无字幕]

p27 Generalized Battle of the Sexes

[无字幕]

p28 Knife-Edge Equilibria

[无字幕]

p29 Soccer Penalty Kicks

[无字幕]

p30 Game Theory 101 (#30.5): Establishing Causation

[无字幕]

p31 Comparative Statics

[无字幕]

p32 Game Theory 101 (#31.5): Comparative Statics without Derivatives

[无字幕]

p33 The Support of Mixed Strategies

[无字幕]

p34 A Trick with Weak Dominance

[无字幕]

p35 Rock Paper Scissors

[无字幕]

p36 Symmetric, Zero Sum Games

[无字幕]

p37 Modified Rock Paper Scissors

[无字幕]

p38 Mixing among Three Strategies

[无字幕]

p39 A Game with No Equilibria

[无字幕]

p40 Game Theory 101 MOOC (#39): Duels

[无字幕]

p41 Hotelling's Game and the Median Voter Theorem

[无字幕]

p42 Second Price Auctions

[无字幕]

p43 Expected Utility Theory

[无字幕]

p44 Completeness

[无字幕]

p45 Transitivity

[无字幕]

p46 Rationality

[无字幕]

p47 Condorcet's Paradox and Social Preferences

[无字幕]

p48 Lotteries

[无字幕]

p49 Independence over Lotteries

[无字幕]

p50 The Allais Paradox

[无字幕]

p51 Continuity

[无字幕]

p52 Expected Utility Transformations

[无字幕]

p53 Pareto Efficiency

[无字幕]

p54 Risk Averse, Risk Neutral, and Risk Acceptant Preferences

[无字幕]

p55 Repeated Prisoner's Dilemma (Finite)

[无字幕]

p56 Discount Factors

[无字幕]

p57 Geometric Series and Infinite Payoffs

[无字幕]

p58 The One-Shot Deviation Principle

[无字幕]

p59 Grim Trigger in the Repeated Prisoner's Dilemma

[无字幕]

p60 Tit-for-Tat in the Repeated Prisoner's Dilemma

[无字幕]

p61 Tit-for-Tat Isn't Subgame Perfect

[无字幕]

p62 The Folk Theorem

[无字幕]

p63 Repeated Games and the Prediction Problem

[无字幕]

p64 Incomplete Information

欢迎回来游戏理论 一零一 我是威廉·斯潘尼尔 本讲座是不完整信息的介绍,开启了这一主题的单元 信息结构在战略互动中至关重要 到目前为止,我们已经看到了几种不同的信息结构类型,首先 我们看到了完美和完全信息的情况 这些是我知道所有过去发生的事情的游戏 并且我知道每个人的支付是多少,这种情况的例子 将是我们在这门课程的第二单元中看过的任何内容 当我们使用逆向归纳和子游戏时 完美的均衡作为我们的解决方案概念 第二种我们分析的信息结构是不完整的信息 但是完全的信息 这些是我不知道别人之前做过什么的情况 但我知道每个人的收益是多少 实际上,我们在这门课程的第一单元中已经涵盖了这种游戏类型 囚犯的困境是这种情况的一个例子 想象一下你是玩家一 我是囚徒困境中的玩家二 你先走然后我再走 但我的信息不完美 因为我没有观察到在你移动时我做了什么 我知道你的收益是什么 但我不知道你现在做了什么 这与第三种类型的信息结构不同 这是一种不完全信息的情况 我不知道别人的收益是什么 我们可能有不完全信息的多种不同情况 但这里有几个例子 想象一下我们是一场性别大战风格的游戏 我知道你更喜欢芭蕾而不是战斗 而不是让我们完全不能协调 但我不知道你对芭蕾的偏好有多强烈 也许你真的真的很喜欢芭蕾而不是战斗 或者你可能只是有一点偏好,你的偏好很弱 与去战斗相比 那是你内在属性的一部分 所以我不知道你的收益是多少 必然地 另一个例子是志愿者的困境 我们在路上看到一场事故 有人需要拨打911寻求帮助 我并不一定知道拨打911对你来说会有多昂贵 也许你工作很忙 也许花两个小时与警察交谈对你来说并不特别吸引人 或者对你来说这是一个随意悠闲的日子 所以你真的不介意再花这个时间 这取决于事情 在你生活中发生的事情,而不是我的生活 所以我并不一定知道你在想什么 以及这对你而言有多昂贵 第三种情况可能是在足球点球情况 如果我是守门员而你是前锋 我并不一定知道你在左路和右路的准确性 你可能天生擅长在左路准确射门 而不如右路强大 但这仍然是你内部的事情 所以 除非我观察你练习 或者我们一直在重复这个动作 所以我有一个好主意 我可以估计出发生了什么 我真的不知道关于这第三种情况的一个有趣的事情是在这里 我对你的收益的不确定性 你对左边的准确性与对右边的准确性实际上直接影响了我的收益 这与前两种情况形成对比 尽管如此,我们还是可以将所有这些都归类在这个不完全信息的信息结构下 为了澄清 这些与存在不完美信息的情况不同 不完整的信息是一个情况,就是我不知道某人之前做了什么 不完整的信息 这是一种关于偏好或收益的不确定性 区分这两者非常重要 如果你希望成为一个正式的理论家,这一点尤为重要 尤其是如果你经常做博弈论 如果你混淆了这两件事 任何认真从事这个工作的人 都会知道你在这方面经验相对不足 这是不想向其他人发出的信号 你想展示你的能力 所以有一种方式可以做到 那就是确保你知道不完美和不完整信息的区别 虽然我们知道如何解决不完美的信息游戏 但我们实际上还不知道如何解决不完整信息的游戏 我们知道如何解决不完美的信息游戏 但我们不知道如何解决不完整信息的游戏 为什么我们还不能解决不完整信息的游戏 记住我们所有提出的解决方案概念 到目前为止,每个演员都有一种策略 但是在我刚刚给你举的例子中,战略情景中的不完全信息类型 有多种类型的行动者 例如 在点球情况中 如果我们有一个在左边射门能力更强的前锋 与右边相比 我们会认为那些在左边射门能力更强的前锋 应该更频繁地向左边射门 在志愿者困境中 我们考虑谁会拨打911 一种成本较低的个体类型 九一 在均衡设置中,似乎应该更有可能接听电话 比那些成本较高的个体 但我们无法覆盖这一点 我们无法使用我们目前开发的均衡概念进行分析 因为我们只有每个演员的一种策略 似乎我们真正需要的不仅仅是演员的策略 而是不同类型的演员的策略 这就是我们将在游戏理论讨论中引入的内容 在这一节关于不完全信息的单元中 实际上它将分为两种不同类型的情况 取决于游戏的时间安排 在这里我们看到了一个2x2的均衡概念表格 我们非常熟悉那个顶部的行,那里的支付是完全信息 我们知道在同时动作的游戏中 我们有纳什均衡 在顺序游戏中我们有子游戏完美均衡 我们将在本单元中开发 不完全信息游戏中的纳什均衡的类似概念 我们将这个解决方案概念称为贝叶斯纳什均衡 个体仍然会同时行动 但会有多种类型的个体 我们需要一个解决方案概念来覆盖这一点 在本单元中,贝叶斯纳什均衡将满足我们的需求 这一讲之后 我们将研究顺序游戏中不完全信息的情况 在那里我们将开发子游戏完美均衡的类似概念 即完美贝叶斯均衡 这结束了这一讲 我希望你享受了这一讲 我希望下次还能见到你 关于贝叶斯纳什均衡,敬请期待

p65 Bayesian Nash Equilibrium

[无字幕]

p66 Solving for Bayesian Nash Equilibrium

[无字幕]

p67 Ex Ante and Interim Dominance

[无字幕]

p68 Why Are There Antes in Poker?

[无字幕]

p69 Is More Information Always Better?

[无字幕]

p70 Cutpoint Strategies, Continuous Type Spaces, and Bayesian Nash Equilibrium

[无字幕]

p71 The Purification Theorem

[无字幕]

p72 Bayes' Rule

[无字幕]

p73 The Winner's Curse, Part 1

欢迎回来游戏理论 一零一 我是威廉·斯潘尼尔 今天的话题是赢家诅咒 这个话题真的很有趣 但我们实际上需要对之前讨论过的内容进行回顾 以便充分欣赏结果 我想让你回想起我们谈论第二次价格拍卖的时候 你会记得 第二次价格拍卖是一种情况 拍卖师向所有相关方征集密封投标 然后查看这些密封的投标 将奖项授予出价最高的投标者 但只让最高投标者支付第二名的出价 例如 如果我们是唯一的两个投标者 我出价70美元,而你出价50美元 那么我是拍卖的赢家 因为我出价最高,70美元 但并不需要支付70美元 拍卖师向我收取了第二高的价格 这是你的出价五十 我们在第二价格拍卖中看到的是 它是每个玩家的均衡提交他们对商品的真实价值 所以不需要战略性地思考我要出价多少 并做出最佳回应 或者思考第三方会出多少 然后做出最佳回应,以此类推 对你来说,这是一个主导策略,让你退一步思考 思考自己 嗯 最高价是多少 我愿意支付的价格 很好 把你们的报价写在纸条上 然后提交给拍卖师 这里有一个重要的前提,只有在这种情况下,才能达到均衡 但是 这个前提是,奖品的价值需要独立于 很多事都遵循这个 例如 如果我拍卖我签名的游戏理论101,完整的教科书 一零一 你的价值多少 对你朋友的弗兰克来说,你没有影响 巴布亚的价值 对加拿大的巴布亚的价值 对很多消费来说都是真实的 商品 像教科书一样 这不是真的 是为那些具有共同价值的事物 你计划重新销售的东西 例如 这是几个非常重要的例子 实际上包括石油储备和体育自由球员 如果你试图购买一块油田 你不会购买它 然后消费它 你没有直接拥有油田的价值 你不会这样想 我很高兴 我拥有一座油田 如果你有一座油田 你会因为可以从地下提取石油而感到高兴 然后出售它 如果那里还有更多石油 这将增加我们对该价格的价值 体育自由球员的情况也是如此 玩家越好 我们在那个玩家身上有越多的价值 我们将会看到 当我们面临赌注时,出价你的真实价值并不是一个好主意 当我们面临共同价值物品时 这与独立价值不同 独立价值 只需提交你的真实价值 对于共同价值不要那样做 尽管 让我们看看为什么 这叫做赢家诅咒 这是一个常见的价值拍卖 我们有一个油田,可能一文不值 从地下提取石油非常昂贵 它可能值两 五百万美元 或者它可能值五千万美元 五千万美元 嘿 提取石油真的很容易 这将是伟大的 这将是非常有利可图的 零美元的结果将会有四分之一的时间 二十五万美元的结果将会有一半的时间 五百万美元的结果将会有四分之一的时间 我们将有两个竞标者参与第二次价格拍卖来购买这个油田 我们将会有平局 将由硬币翻转来决定 这里关键的是 尽管 每个玩家在拍卖开始前都不知道油田的真实价值 他们相信油田的价值可能是零 也可能是20万、50万或者更多 这些价值以概率分布的形式存在 但他们无法确定具体数值 在拍卖开始前 他们会收到油田价值的信号 他们不仅拥有之前的信念 还可以派人去油田查看 评估油田的开采成本 但这些公司收到的信息并不清晰 他们无法确定 在收到报告后 油田是否价值连城 或者一文不值 或者介于两者之间 他们收到的信号可能是模糊的 如果油田一文不值 所有人都会收到低价值信号 如果油田价值20万 一人收到低价值信号 一人收到高价值信号 如果油田价值50万 所有人都会收到高价值信号 这是一个贝叶斯博弈 每个玩家有两种类型 高价值类型和低价值类型 我们需要找到每种类型的最优竞价策略 以确定博弈的均衡 每种类型的玩家 在收到信号后 会根据自己的信念进行竞价 我们开始时相同 但信号的不同 会让我们成为不同类型的玩家 我收到的信号是低价值 这使我与高价值信号的玩家区分开来 作为低价值类型的我 必须考虑到高价值类型的玩家 可能会采取的策略 反过来 也会影响你作为低价值类型 或者高价值类型的玩家 的竞价策略 这是一个对称的游戏 好消息是 如果我们找到了一个玩家的竞价策略 也就找到了两个玩家的策略 现在可能是个好时机,自己尝试一下 思考你的预期价值是什么 如果你收到一个低或高的信号,那么你可能想要出价多少 如果你想暂停视频一会儿 现在就去做,试着计算 也许思考你应该做什么,不应该做什么 为什么这可能是一个好主意 为什么这可能不是一个好主意 但如果你准备好继续 让我们看看如果你遵循了这个小贴士 或者我之前给你的关于第二价格拍卖的建议 这是要评估你的真实价值 那么我们来思考一下你的价值预期 在你收到一个低信号后 假设你收到了一个低信号 油井价值5000万美元的概率是多少 嗯 花一秒钟时间想想 这实际上是微不足道的 这是一个陷阱问题 这是不可能的 如果油田价值五千万美金 你永远无法接收到微弱的信号 现在让我们思考一下,如果接收到低信号会发生什么 而你正在试图计算出油田价值两亿的概率是多少 五百万美元 好的,我之前提到过如何计算,你可以使用贝叶斯法则 该领域的先验概率为二百五十万美元的值是二分之一 接收到弱信号的概率 既然这个领域价值两千五百万美元,就等于一半 先前的概率,田野的价值为零,是四分之一 接收到低信号的概率 如果这块地毫无价值,那么这个概率是1 如果地毫无价值,你肯定会收到低信号 如果地毫无价值,那么你肯定会收到低信号 这是我们需要实施的贝叶斯规则的四个组成部分 这就是我在这里做的事情 所以我们有这块地价值250万美元的概率 乘以你收到低信号的概率 给定这块地价值250万美元 然后你将这个除以所有收到低信号的方式 这包括它是一个二百五十万美元油田的概率 在条件之下接收到低信号的概率 正如你在分子中看到的那样 然后你也必须加上其他可能性 这是从一个油田毫无价值的情况下接收到低信号的概率 那就是油田毫无价值的概率乘以 接收到低信号的概率 在油田毫无价值的情况下,给定的低信号 这个概率会给你接收到低信号的情况下拥有250万美元油田的概率 二百五十万美元油田的条件下接收到低信号 为了进行一些简化 这实际上变成了一个非常简单的分数 它就是二分之一 所以得到两个的概率 假设有500万美元的油田,条件是在收到低信号后的概率是二分之一,好的现在 让我们考虑最后一种可能性 所以你仍然收到了那个低信号 油田的价值为零的概率是多少 嗯 你可以使用贝叶斯法则,就像我们之前所做的那样 你会得到同样的答案 就好像你刚刚观察到它必须是一半 为什么必须是一半好 外面只有三种可能性 这是50亿美元的油田 一个两千五十万美元的石油田或毫无价值的石油田 我们知道它可能是五千万美金的概率是零 我们知道概率是二 五百万美元是一半 因此,由于所有可能性分布都必须相加为1 这意味着剩下的一半必须落在它上面 作为一个毫无价值的油田 所以我们可以将所有信息结合起来 提取油田的预期值,有条件地接收到低信号 所以它是二分之一乘以二 五百万美元 加上二分之一乘以零 这等于十二点五万美元在这里隐含 还有一个零乘以五千万美元 当然,这立即抵消 所以,如果你对油田的出价是你对油田的真实价值 在收到低信号井的情况下 这将是1250万美元 这是你对油田价值的信念 在收到低信号后 让我们对如果你收到高信号会发生什么做同样的事情 如果你收到高信号 油田价值等于零的概率是多少 好吧,再次 这是一个陷阱问题 这是不可能的 如果你有一个高的信号 不可能来自一个一文不值的领域 如果一个领域一文不值 那么两个玩家都会收到一个低的信号 接收到一个高的信号是不可能的 在那种情况下 那它值两千五百万美元呢 好吧,我们又使用了贝叶斯法则 我们知道田地值两千五百万美元的先验概率是一半 我们知道接收到高信号的概率 给定两个五千万美元的概率是二分之一 我们知道油田价值五千万美元的前概率是四分之一 我们知道接收到高信号的概率 给定它值五千万美元的概率是肯定的 它的概率是1 你可以把所有信息代入贝叶斯规则 就像我们之前所做的 这将给我们带来后验或更新信念 使用贝叶斯规则计算油田值五千万美元的条件概率 在接收到高信号的情况下 如果我们做一些简化后替换那些值 那么我们就得到了这个等于二分之一 非常简单 最后一个可能性是油田值五千万美元 你可以使用贝叶斯规则来计算这是真实的概率 就像之前一样你可以很容易地观察到这必须是二分之一 因为另两个可能性的概率是零和二分之一 所有可能性的概率必须相加等于一 所以缺失的概率是二分之一 就这样 这意味着我们可以很容易地计算油田的价值 在接收到高信号的情况下 这将是二分之一乘以五千万美元 加上二分之一乘以五千万美元 结果是三百七十五万美元 让我们回顾一下我给你的第二价格拍卖规则 如果你在第二价格拍卖中出价你的真实价值 这意味着类型接收到低信号的人会出价一千二百五十万美元 而类型接收到高信号的人会出价三百七十五万美元 我的问题问你是否这处于均衡状态 再次 这可能是你暂停并自己工作的机会 如果你之前没有取得进展 我已经给了你很多关于策略的提示 特别是在我们声称的这个均衡中 可能或不可能是真的 现在你有了这些策略 这是一个很好的机会来考虑是否有利可图的偏离 无论是低类型还是高类型 如果你准备好了 我们现在将看到它并不是均衡 就像我一直暗示的那样 为了证明我们将使用提示 我们将看看如果你是低类型 并按照策略出价一千二百五十万美元 如果你接收到低信号并出价一千二百五十万美元 从这以后会有两种可能的结果 一半的时间内油田实际值五千万美元 油田实际值五千万美元 如果那是情况 我们知道其他玩家会收到高信号并出价3750万 在这种情况下,你被出价超过了 所以你输了拍卖 其他玩家赢了你得不到 你得不到任何东西 你支付了零 另一半时间里,土地价值零 如果那是情况 其他玩家也会收到低信号并出价1250万美元 他们正在做和你一样的事情 这意味着当拍卖师收到那些出价时 出现了平局 平局通过硬币正反面决定 因此一半的时间你会输得一无所有 而另一半时间你会赢得一个引号中的无用油田 并支付1250万美元 这应该让情况变得更加清晰 这解释了这里的问题 以及为什么这不会是一个最优的均衡 所以总结一下这些信息转化为实际价值 一些关于总体收益的数字 一半的时间对方收到的信号更高并高出你的报价 所以你的收益为零 剩下的一半时间他们也收到了低信号 他们也报价1250万美元 一半的时间你赢了这个硬币翻 所以你赢得了那个零美元的油田 你支付1250万美元 另一半时间你输了硬币翻 实际上赢得了抛硬币 你得不到任何东西,这与赢得抛硬币相比更好 并支付了1250万美元的无用油田 因此,您的整体收益是负的 负310.125万美元 这再次是负的 你可以看到为什么现在有有利的偏差 如果你是低类型的 你可以开始这个游戏时只是说 你知道 我赌什么都没有 我不在乎 我对这块油田出价为零 如果你这样做 你将使获得负收益变得几乎不可能 这对你来说比按照给出的策略出价1250万美元要好 在你收到那个低信号后 以便你有一个盈利的偏离策略 这个盈利的偏离策略就是简单地出价零 好的 这里发生了什么问题 赢得意味着你收到了最强的信号 但是,在有条件赢得的情况下,奖品的价值低于你的信号告诉你的 因为你赢得了拍卖 这意味着其他人更有可能收到了低信号 如果其他人收到了低信号 这应该让你更新你的信念 认为你面前的奖品并没有你想象的那么有价值 正如你之前认为的那样 这就是所谓的赢家诅咒 那就是如果你出价 不是你期望收到的那样 但更多是你所期待的 有条件的信号 你将会伤害自己 你将要为某事支付一大笔钱 那并不是你想象中的那么有价值 在这种情况下,实际上会因为那样做而获得负收益 实际上这将结束这个迷你系列关于赢家诅咒的一半 我们将在下次讲座中看到解决这个问题的方案 这仅仅是在假设你获胜的情况下,对你奖品的预期价值进行竞价 而不是你的预期价值 考虑到你已经收到的任何信号 我希望你们喜欢这期节目 我也希望你们下次能来看 我们将讨论这个游戏的均衡策略 探讨赢家诅咒的一些普遍特性 当你面对的竞标者很多而不是只有一个时,你该怎么做 以及这个问题是否真的在现实世界中发生 再次感谢 希望你喜欢这个视频 希望下次还能见到你 保重

p74 The Winner's Curse, Part 2

[无字幕]

p75 Perfect Bayesian Equilibrium

[无字幕]

p76 Screening Games

[无字幕]

p77 Adverse Selection

[无字幕]

p78 Signaling Games

[无字幕]

p79 Separating Equilibrium

[无字幕]

p80 Pooling Equilibrium

[无字幕]

p81 Off-the-Path Beliefs

[无字幕]

p82 The Beer-Quiche Game

[无字幕]

p83 Semi-Separating Equilibrium⧸Partially-Pooling Equilibrium

[无字幕]

p84 Single Raise Poker

[无字幕]

p85 Game Theory 101: Chain Store Paradox

[无字幕]

On this page

p0 Introductionp1 The Prisoner's Dilemma and Strict Dominancep2 Iterated Elimination of Strictly Dominated Strategiesp3 Pure Strategy Nash Equilibrium and the Stag Huntp4 What Is a Nash Equilibrium?p5 Best Responsesp6 Mixed Strategy Nash Equilibrium and Matching Penniesp7 The Mixed Strategy Algorithmp8 How NOT to Write a Mixed Strategy Nash Equilibriump9 Battle of the Sexesp10 Calculating Payoffsp11 Strict Dominance in Mixed Strategiesp12 Weak Dominancep13 Infinitely Many Equilibriap14 The Odd Rulep15 Game Theory 101 (#16): Subgame Perfect Equilibriump16 Backward Inductionp17 How NOT to Write a Subgame Perfect Equilibriump18 Multiple Subgame Perfect Equilibriap19 Games with Stagesp20 Punishment Strategiesp21 Tying Hands and Burning Bridgesp22 Commitment Problemsp23 The Centipede Gamep24 Problems with Backward Inductionp25 Forward Inductionp26 Probability Distributionsp27 Generalized Battle of the Sexesp28 Knife-Edge Equilibriap29 Soccer Penalty Kicksp30 Game Theory 101 (#30.5): Establishing Causationp31 Comparative Staticsp32 Game Theory 101 (#31.5): Comparative Statics without Derivativesp33 The Support of Mixed Strategiesp34 A Trick with Weak Dominancep35 Rock Paper Scissorsp36 Symmetric, Zero Sum Gamesp37 Modified Rock Paper Scissorsp38 Mixing among Three Strategiesp39 A Game with No Equilibriap40 Game Theory 101 MOOC (#39): Duelsp41 Hotelling's Game and the Median Voter Theoremp42 Second Price Auctionsp43 Expected Utility Theoryp44 Completenessp45 Transitivityp46 Rationalityp47 Condorcet's Paradox and Social Preferencesp48 Lotteriesp49 Independence over Lotteriesp50 The Allais Paradoxp51 Continuityp52 Expected Utility Transformationsp53 Pareto Efficiencyp54 Risk Averse, Risk Neutral, and Risk Acceptant Preferencesp55 Repeated Prisoner's Dilemma (Finite)p56 Discount Factorsp57 Geometric Series and Infinite Payoffsp58 The One-Shot Deviation Principlep59 Grim Trigger in the Repeated Prisoner's Dilemmap60 Tit-for-Tat in the Repeated Prisoner's Dilemmap61 Tit-for-Tat Isn't Subgame Perfectp62 The Folk Theoremp63 Repeated Games and the Prediction Problemp64 Incomplete Informationp65 Bayesian Nash Equilibriump66 Solving for Bayesian Nash Equilibriump67 Ex Ante and Interim Dominancep68 Why Are There Antes in Poker?p69 Is More Information Always Better?p70 Cutpoint Strategies, Continuous Type Spaces, and Bayesian Nash Equilibriump71 The Purification Theoremp72 Bayes' Rulep73 The Winner's Curse, Part 1p74 The Winner's Curse, Part 2p75 Perfect Bayesian Equilibriump76 Screening Gamesp77 Adverse Selectionp78 Signaling Gamesp79 Separating Equilibriump80 Pooling Equilibriump81 Off-the-Path Beliefsp82 The Beer-Quiche Gamep83 Semi-Separating Equilibrium⧸Partially-Pooling Equilibriump84 Single Raise Pokerp85 Game Theory 101: Chain Store Paradox