友情提示：如果本网页打开太慢或显示不完整，请尝试鼠标右键“刷新”本网页！阅读过程发现任何错误请告诉我们，谢谢！！报告错误

纳什均衡与博弈论-第17章

按键盘上方向键 ← 或 → 可快速上下翻页，按键盘上的 Enter 键可回到本书目录页，按键盘上方向键 ↑ 可回到本页顶部！
————未阅读完？加入书签已便下次继续阅读！

，只要对手选择背叛，以牙还牙的游戏者在下一轮比赛中也会选择背叛。直到对手选择合作之前，他一直会采用背叛这种方式。

　　在任意给定游戏次数，并与固定对手对弈的比赛中，使用以牙还牙的策略也许会输。但是如果比赛次数无限多，并与不同的策略对抗时，平均来说，以牙还牙的策略是优于其他策略的。或者至少在艾克斯的比赛中是这样。

　　一旦采用以牙还牙的策略者取胜，那么看起来更好的策略似乎是可能发掘的。所以艾克斯又举办了一次比赛，这次有62个人参加，在第二轮的参赛者中，只有一个人使用以牙还牙的策略。他就是拉波波特，而且他又一次赢了。

　　你可以明白以牙还牙策略是如何在一个群体中增加合作机会的。作为以牙还牙的游戏者，信誉会促使你的对手与你合作，知道他们这样做后，你也会选择合作。如果他们不合作，你也不合作。

　　奈何，如此一来，事情变得更为复杂。仅仅因为以牙还牙的策略赢得艾克斯的比赛，这并不意味着它在现实世界中是最佳策略。首先，在肉搏战中和其他策略相比，它很少能赢；总体来说，它做得很好（因为采用以牙还牙策略击败对手，和其他策略相比，对手也要损失惨重）。

　　诺瓦克在会议上，探讨以牙还牙策略在广泛背景下的细微差别，乍看，以牙还牙的成功似乎否定了纳什均衡理论，暗示最佳策略就是一直背叛。进化博弈论的数学基础是分析无限多的群体数量，似乎证实了那种以牙还牙的策略。然而，诺瓦克指出，对于一个现实的有限的群体，在一定的情况下，你可以证明以牙还牙的策略能够成功侵犯所有具有背叛行为的种群。

　　但是如果游戏继续，你一直计算下一步会发生什么，这样会变得更复杂。以牙还牙采取的是不原谅策略——如果你的对手本来打算合作，但是由于意外他背叛了你，于是你开始背叛他，并终止合作。如果你能计算出博弈中将会发生什么，那么你会发现以牙还牙策略并不是很成功，而改进后的策略，即宽宏大量的以牙还牙策略则比改进前要好很多。所以宽宏大量的以牙还牙策略被用来管理种群中的事务。

　　“宽宏大量的以牙还牙策略以合作开始。无论你什么时候开始合作，我都会采取合作的方式。有时即使你背叛我，我也会和你合作”，诺瓦克补充道。“这允许我们为自己犯下的错误进行改正——如果是不小心犯下的错误，你有机会改正它。”

　　诺瓦克说，随着游戏的继续进行，情况变得更让人吃惊。宽宏大量的以牙还牙的方法开始被全部合作的方法代替！“因为如果每个人都采用宽宏大量的以牙还牙的策略，或者以牙还牙策略，那么没有人会故意的试图背叛；即每个人都是合作者。”啊，多么快乐的时光啊！

　　“一直合作”不是一个稳定的策略。一旦每个人都合作，那么一直背叛策略就会入侵，就像一头鹰出现在一群鸽子身边，那么鸽子会灭亡。所以你开始选择全部背叛，然后转向以牙还牙，接着是宽宏大量的以牙还牙，接着是合作，然后再全部背叛。“这，”诺瓦克说，“就是人类的战争与和平的理论”。

　　第六节　博弈与惩罚

　　尽管如此，人类还是会合作。如果间接互惠不是合作的原因，那么什么是呢？后来，一种流行的看法是由于害怕受到惩罚的威胁，所以合作才会兴起。并且博弈论证明了这种情况是如何产生的。

　　经济学家萨缪尔·鲍尔斯、赫伯特·金迪斯，以及人类学者罗伯特·博依德是这一观点的倡导者。他们称该观点为“强互惠”。一个强互惠者奖励合作者，同时惩罚背叛者。在这种情况下，一个比较复杂的游戏描述了相互作用。不像玩囚徒困境游戏——一系列的一对一对抗——强互惠博弈研究者在不同的公共利益下进行实验游戏。

　　第三章里曾描述过一系列的游戏。在这些游戏中，不同的个体会采取不同的策略——有些是自私者，有些是合作者，还有一些是互惠者。在一个典型的公共利益的游戏中，在开始时给游戏者一些“分”（以后可用真实钱收回）。在每一轮，游戏者可能捐献一些分给社会基金组织，自己留一部分。然后每个人收到一部分的社会基金。然而一个贪婪者为确保自己个人的收益最大化，什么都没捐，整个群体的结果可能更遭。利他主义者为增加整个群体的收益，会把他们自己的一些分给群体。而互惠者基于“他人捐献什么，相应地自己就捐献什么”，惩罚那些捐献很少却贪享整个群体福利的“吝啬鬼”（但是这样做的话，也惩罚了群体中的其他人，包括他们自己）。正如我们已经看到的，人类由三种类型的游戏者组成。进一步的研究表明，为什么人类种族已经演化到包含惩罚者。

　　在一个公共利益游戏的测试中，大部分人在一开始就捐献了大约一半的分。然而，在几轮后，捐献逐渐减少。在一个测试中，在第十轮中，将近有3/4的游戏者什么都没捐。显然地，研究者发现，人们对于那些一开始捐献很少的人很生气，为了报复，他们也减少了捐献数额，以此来惩罚每个人。也就是说，大部分游戏者变成互惠者了。

　　但是在另一个版本的游戏中，一名研究者公布每一个游戏者的捐献数额，并恳求其他参赛者给予评价。如果捐献少的人会被嘲笑，该吝啬者在后几轮会勉强地慷慨地捐献。如果没有人批评少捐赠者，那么他后面几轮的捐献会更少。显然，羞辱会促使行为发生改善。

　　其他的实验证明，非合作者具有被惩罚的危险。所以可能在过去的进化过程中，种群中会包括惩罚者，这样能更多地鼓励合作——而没有实施惩罚的群体被淘汰。惩罚的趋势可能因此在存活的人类种群中根深蒂固，即使惩罚者自己这样做的话也会遭受损失（“根深蒂固”可能不仅仅只在基因中遗传，一些专家认为文化将惩罚的态度延续给下一代）。

　　当然，在人类的进化历史中，惩罚的形式可能很不明显。鲍尔斯和金迪斯已经提出惩罚的措施可能主要是放逐，使惩罚者承受相对低的代价却仍然让非合作者承受沉重的代价。他们证明，博弈论的相互作用是如何自然地引导人类社会形成3种类型的人——非合作者（免费乘车者）、合作者和惩罚者（互惠者），正如其他电脑程序模拟所说明的一样。人类种族采取的是混合策略。

　　然而专家仍在争论这些问题。我见过一篇文章这样认为：事实上，利他主义通过利他主义者个体的所得利益单独进行发展演化，而并非一定演化自种群的利益。这一结论基于另外一个流行的博弈游戏的模拟结果，这个游戏便是著名的最后通牒游戏，今天，它在由诸如科林·卡麦勒等科学家探索的另一个博弈论的领域——“行为博弈论”得以广泛地运用。行为博弈论专家认为，要深刻理解人类社会行为的深层原因——理解自然法则——根本上是需要知道是什么促使个体在行动。换句话说，你需要知道人们是怎么想的。现在，开展这些研究的流行做法是将博弈论、经济学、心理学和神经系统学结合起来，并以一个新的具有争议的学科即神经经济学为人们所认识。

　　第五章　弗洛伊德的梦——博弈和大脑

　　我们旨在将心理学建立为一门自然科学：亦即将心理过程表示为确定物质的定量状态，使其精确明了。

　　——西格蒙德·弗洛伊德，《科学心理学方案》，1895

　　弗洛伊德渴望读懂大脑。

　　他学医期间专攻神经病学，希望能破解联系大脑物理过程和神秘的精神世界的密码。1895年，他起草了一项“科学心理学”方案，用大脑中神经细胞的物理性交互来解释精神状态和人类行为。但是弗洛伊德发现十九世纪末期的脑科学远未发展到能将颅内化学和思想行为相联系的水平。因此他跳过了大脑，直接走向精神世界，通过分析梦来寻找操纵精神生活的无意识记忆的线索。

　　其他人甚至从未憧憬过弗洛伊德预见的“大脑物理学”。很多人简单地将大脑视作研究的禁区，称其为科学无法检验的“黑匣子”。这些“行为主义者”宣称心理学应该专注于行为观察，研究刺激和反应。

　　20世纪以后，弗洛伊德主义和行为主义都走向了衰退。随着分子医学开始揭示一些大脑的内部活动，黑匣子逐渐变得透明。现如今，得益于各种造影技术的发展，我们能看到大脑活动时的影像，大脑对我们来说几乎是完全透明。一个多世纪前被弗洛伊德抛弃的神经科学的雏形此刻已经成熟，离他最初的目标不过咫尺之遥。

　　然而，弗洛伊德不可能梦想过将神经科学和经济学联系在一起，因为在他有生之年，博弈论还未崛起。尽管博弈论的创始人将博弈论看作通往人类行为的一扇窗，他们想象不到，有朝一日他们的数学会推动脑科学的发展。他们不曾预见到有一天博弈论会和神经科学结为伙伴，也不可能预见到这种联合将为博弈论征服经济学界添加筹码。但在20世纪90年代末期，在一个被称为神经经济学的新兴交叉领域，博弈论的数学成为了联合神经科学和经济学的不二选择。

　　第一节　大脑和经济学

　　博弈论的一个吸引人之处在于它能反映现实生活的很多侧面。要赢得一场纸牌游戏，或者在丛林中生存，或者在商场上制胜，你必须懂得如何玩你的牌。你要聪明地选择是补牌还是不补，是押还是过，或者可能是下空注。你必须知道什么时候该持牌，什么时候该退出。而且通常你必须想得很快。胜者善于快速地做出聪明的决策。在丛林中，你没有时间去计算，不管是用博弈论还是别的什么，比如对比战斗和逃跑、躲藏或寻找孰优孰劣。

　

返回目录上一页下一页回到顶部赞（0）踩（0）

未阅读完？加入书签已便下次继续阅读！

温馨提示：温看小说的同时发表评论，说出自己的看法和其它小伙伴们分享也不错哦！发表书评还可以获得积分和经验奖励，认真写原创书评被采纳为精评可以获得大量金币、积分和经验奖励哦！