博弈论案例(博弈论的3个经典案例)

2022-10-04 16:25:13 发布:网友投稿
热度:150

博弈论案例(博弈论的3个经典案例)


案例一

囚徒困境

在博弈论中,含有占优战略均衡的一个有名例子是由塔克给出的"囚徒困境"(prisoner's dilemma)博弈模型。该模型用一种特殊的方法为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B结合犯事、私入民宅被警察抓住。警方将两人分离置于不同的两个房间内进行审判,对每一个犯法嫌疑人,警方给出的政策是:如果两个犯法嫌疑人都坦率了罪恶,交出了赃物,于是证据确实,两人都被判有罪,各被判刑8年;如果只有一个犯法嫌疑人坦率,另一个人没有坦率而是抵赖,则以妨害公务罪(因已有证据表明其有罪)再加刑2年,而坦率者有功被减刑8年,立即释放。如果两人都抵赖,则警方因证据不足不能判两人的偷盗罪,但可以私入民宅的罪名资源网将两人各判入狱1年。下表给出了这个博弈的支付矩阵。


对A来说,尽管他不知道B作何选择,但他知道无论B选择什么,他选择"坦率"总是最优的。显然,依据对称性,B也会选择"坦率",成果是两人都被判刑8年。但是,倘若他们都资源网选择"抵赖",每人只被判刑1年。在表2.2中的四种行为选择组合中,(抵赖、抵赖)是帕累托最优,因为偏离这个行为选择组合的任何其他行为选择组合都至少会使一个人的境况变差。但是,"坦率"是任一犯法嫌疑人的占优战略,而(坦率,坦率)是一个占优战略均衡,即纳什均衡。不难看出,此处纳什均衡与帕累托存在冲突。

单从数学角度讲,这个理论是合理的,也就是选择都坦率。但在这样多维信息共同作用的社会学范畴显然是不适合的。正如中国古代将官员之间的行贿受贿称为"陋规"而不是想方设法清查,这是因为社会系统给人行动的约束作用迫使人的策产生转变。比如,从心理学角度讲,选择坦率的成本会更大,一方坦率害得另一方加罪,那么事后的报复行动以及从而不会轻易在周围知情人当中的"出卖"角色将会使他丧失更多。而8年到10年间的增长比例会被淡化,人的尊严会使人发生复仇情感,略打破"行规"。我们正处于大数据时期,向更接近事实的处置一件事就要尽可能多地控制相干资料并合理加权剖析,人的运动动影像动因庞杂,所以囚徒困境只能作为简化模型参考,具体决策还得具体剖析。


案例二

智猪博弈

一、经济学中的"智猪博弈"(Pigs'payoffs) 这个例子讲的是:

假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽,另一头安装着掌握猪食供给的按钮,按一下按钮会有10个单位的猪食进槽,但是谁按按钮就会首先付出2个单位的成本,在去往食槽的路上会有两个单位猪食的体能消费,若大猪先到槽边,大小猪吃到食物的收益比是9∶1;同时行为(去按按钮),收益比是7∶3;小猪先到槽边,收益比是6∶4。那么,在两头猪都有智慧的前提下,最终成果是小猪选择期待。

"智猪博弈"由纳什于1950年提出。实际上小猪选择期待,让大猪去按掌握按钮,而自己选择"坐船"(或称为搭便车)的原因很简略:在大猪选择行为的前提下,小猪选择期待的话,小猪可得到4个单位的纯收益,而小猪行为的话,则仅仅可以获得大猪吃剩的1个单位的纯收益,所以期待优于行为;在大猪选择期待的前提下,小猪如果行为的话,小猪的收入将不抵成本,纯收益为-1单位,如果小猪也选择期待的话,那么小猪的收益为零,成本也为零,总之,期待还是要优于行为。


从矩阵中可以看出,当大猪选择行为的时候,小猪如果行为,其收益是1,而小猪期待的话,收益是4,所以小猪选择期待;当大猪选择期待的时候,小猪如果行为的话,其收益是-1,而小猪期待的话,收益是0,所以小猪也选择期待。综合来看,无论大猪是选择行为还是期待,小猪的选择都将是期待,即期待是小猪的占优策略。

在小企业经营中,学会如何"搭便车"是一个精明的职业经理人最为根本的素质。在某些时候,如果能够注意期待,让其他大的企业首先开发市场,是一种明智的选择。这时候有所不为能力有所为!

高超的管理者擅长应用各种有利的条件来为自己服务。"搭便车"实际上是供给给职业经理人面对每一项消费的另一种选择,对它的留心和研讨可以给企业节俭很多不必要的费用,从而使企业的管理和发展走上一个新的台阶。这种现象在经济生涯中十分常见,却很少为小企业的经理人所熟悉。

在智猪博弈中,虽然小猪的"捡现成"的行动从道义上来讲令人不齿,但是博弈策略的重要目标不正是应用谋略最大化自己的好处吗?


案例三

美女的硬币

一位生疏美女自动过来和你搭讪,并请求和你一起玩。美女提议:"让我们各自亮出硬币的一面,或正或反。如果我们都是正面,那么我给你3元,如果我们都是反面,我给你1元,剩下的情形你给我2元就可以了。"听起来不错的提议。如果我是男性,无论如何我是要玩的,不过经济学斟酌就是另外一回事了,这个游戏真的够公正吗?


假设我们出正面的概率是x,反面的概率是1-x。为了使好处最大化,应当在对手出正面或反面的时候我们的收益都相等,不然对手总是可以转变正反面涌现的概率让我们的总收入减少,由此列出方程就是3x+(-2)*(1-x)=(-2)*x+1*(1-x)

这个方程通俗的说就是在对手一直出正面你得到的好处,和你对手一直出反面得到好处是一样的且最大。解方程得x=3/8,也就是说平均每八次出示3次正面,5次反面是我们的最优策略。而将x=3/8代入到收益表达式3*x+(-2)*(1-x)中就可得到每次的期望收入,盘算成果是-1/8元。

同样,设美女出正面的概率是y,反面的概率是1-y,列方程-3y+2(1-y)=2y+(-1)*(1-y)

解得y也等于3/8,而美女每次的期望收益则是2(1-y)-3y=1/8元。这告知我们,在双方都采用最优策略的情形下,平均每次美女赢1/8元。其实只要美女采用了(3/8,5/8)这个计划,不论你再采取什么计划,都是不能转变局势的。如果全体出正面,每次的期望收益是(3+3+3-2-2-2-2-2)/8=-1/8元

如果全体出反面,每次的期望收益也是(-2-2-2+1+1+1+1+1)/8=-1/8元。而任何策略无非只是上面两种策略的线性组合,所以期望还是-1/8元。但是当你也采取最佳策略时,至少可以保证自己输得最少。否则,你确定就会被美女采取的策略针对,从而赔掉更多。看起来这个博弈模型似资源网乎没有什么用途,但是其实这可能牵涉了金融市场定价中最主要的一个模型:定价权重模型了。

总的来说"博弈论"其实质是将日常生涯中的竞争抵触以游戏的情势表示出来,并应用数学和逻辑学的办法来剖析事物的运作规律。既然有游戏的参与者那么也必定存在游戏规矩的制订者。深刻的懂得竞争行动的实质,有助于我们剖析和控制竞争中事物之间的关系,更便利我们对规矩进行制订和调剂,使其最终依照我们所预期的目标进行运作。


下一篇:汽轮机技术问答(火电厂汽轮机技术的经典问答)
上一篇:黑龙江暴雪(黑龙江多地大到暴雪)