回到博客首页

阅读时长约 5 分钟

趣学数学 | 数字电影院 |《美丽心灵》:电影中的“博弈论”

作者 LingoAce新媒体团队 |中国 |2024-04-15

学数学

获奖11次(2002年夺得奥斯卡最佳影片等4项大奖),提名7次,由梦工厂(Dream Works)出品的影片《美丽心灵》(A Beautiful Mind)的故事原型是数学家约翰·纳什(John Nash),他的研究成果《博弈论》推翻了人们接受了150年的经济思想,在经济、军事等领域产生了深远的影响,由于他与另外两位数学家在非合作博弈的均衡分析理论方面做出了开创性的贡献,而获得1994年诺贝尔经济学奖。这部影片也获得约翰·纳什本人的高度肯定。

blog-images

既然影响深远,在欣赏经典之余,有没有点想了解博弈论呢?接下来了解下博弈论中的重要术语,以约翰·纳什名字命名的“纳什平衡”。

纳什平衡

纳什平衡(Nash equilibrium),又称为非合作博弈均衡。在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。如果任意一位参与者在其他所有参与者的策略确定的情况下,其选择的策略是最优的,那么这个组合就被定义为纳什平衡。

也许我们会觉得理论枯燥难懂,那么以一个经典案例来掀开理论的一角。

1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,讲到两个囚犯的故事。这个故事可以很好的诠释纯战略纳什平衡(纳什平衡分为纯战略纳什平衡和混合战略纳什平衡两种)。

囚徒困境

警方逮捕甲、乙两名嫌疑犯,但没有足够证据指控二人犯罪。于是警方分开囚禁嫌疑犯,分别和二人见面,并向双方提供以下相同的选择:若一人认罪并作证检控对方(相关术语称“背叛”对方),而对方保持沉默,此人将即时获释,沉默者将判监10年。若二人都保持沉默(相关术语称互相“合作”),则二人同样判监1年。若二人都互相检举(相关术语称互相“背叛”),则二人同样判监8年。

囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益,这也就是经典经济学中的“理性人假设”。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。另外,没有任何其他力量干预个人决策,参与者可完全按照自己意愿选择策略。囚徒到底应该选择哪一项策略,才能将自己个人的刑期缩至最短?两名囚徒由于隔绝监禁,并不知道对方选择;而即使他们能交谈,还是未必能够尽信对方不会反口。就个人的理性选择而言,检举背叛对方所得刑期,总比沉默要来得低。

试设想困境中两名理性囚徒会如何作出选择:若对方沉默时,背叛会让我获释,所以会选择背叛。若对方背叛、指控我,我也要指控对方才能得到较低的刑期,所以也是会选择背叛。二人面对的情况一样,所以二人的理性思考都会得出相同的结论——选择背叛。背叛是两种策略之中的支配性策略。因此,这场博弈中只有一种可能能达到的纳什平衡,就是双方参与者都背叛对方,结果二人同样服刑8年。

这场博弈的纳什平衡,显然不是顾及团体利益的帕累托最优解决方案。以全体利益而言,如果两个参与者都合作保持沉默,两人都只会被判刑1年,总体利益更高,结果也比两人背叛对方、判刑8年的情况较佳。但根据以上假设,二人均为理性的个人,且只追求自己个人利益。均衡状况会使两个囚徒都选择背叛,结果二人判决均比合作为高,总体利益较合作为低。这就是“困境”所在。

案例证明了:非零和博弈中,帕累托最优和纳什平衡是相冲突的。而且纳什均衡是较常发生的。正因为较常发生,所以影响更深远吧。

电影中的博弈论神奇又神秘,让人充满好奇。生活中,数学作为最基础应用学科,在任何领域都有着至关重要的地位!

由于数学学科整体难度较高,同学们在学习和备考时可能会遇到许多难题和疑惑, LingoAce在线数学课以北美版新加坡数学教材为主,帮助孩子扎实基础,提升应用能力,举一反三,不再受难题困扰。我们的可成选用北美本土数学老师授课,教龄5年以上,教学经验丰富。培养数学思维,激发孩子数学潜能,校内竞赛两手抓,高效有趣又实用。  

立即预约免费试听! 

订阅我们,获取最有价值的海外学习信息!

团队全员均拥有语言学教育背景、良好双语能力及至少2年以上的跨国生活经验,了解海外生活环境与语言环境,专注于3-15岁儿童语言学习经验分享的输出者,持续向海外儿童普及中华文化的拓展者,LingoAce里最会讲故事的编撰者,争做海外父母语言学习的帮助者。