人生如牌局 – Thinking in bet

less than 1 minute read

Thinking in Bet这本书是我为数不多看第二遍的书。个人认为这本书对于提升我们的思维及决策能力有所帮助。

drawing

作者Annie有着独特的人生经历。她原本是哥伦比亚大学心理系博士生。她在博士答辩前一个月放弃了学位,决定成为了一名职业的德州扑克选手。Annie在这本书中以德州扑克作为出发点,结合她认知心理学的专业知识,深入浅出地介绍了她从德州扑克中学习并泛化而得的思维及决策方法。

算力致胜的棋局

棋类的高手都会算棋。传闻国际象棋大师卡斯帕诺夫可以算到10步以后的情况,柯洁在某一局棋让对手掉到了自己30步前挖的坑。 对于任何的棋牌或者游戏,我们可以大致量化它们的复杂度(可以用一种叫博弈树的数据结构表达出来)。就拿最简单的井字棋来说,棋盘一共有9个位置,每个位置可以有X、O、或者空白三种状态。井字棋的状态量级在10^5。其博弈树的复杂度在人类可以掌握的范畴,因此有些井字棋高手可以保证永远不败。

drawing
井字棋(tic-tak-toe)

比井字棋复杂的五子棋也在2001年被人从理论上证明了先手黑棋必胜,只不过由于状态空间太过巨大(复杂度10^70),即使是高手也只能在某些固定棋局出现后使用套路取得胜利。

drawing
井字棋博弈树示意图(图片来源:互联网)

而对于复杂度10^123的国际象棋以及10^360的围棋,其最优解搜索空间对于人类大脑的计算能力来说和无限大没有区别。

1997年深蓝击败国际象棋大师卡斯帕诺夫,AlphaGo在2016/2017年连续击败李世石以及柯洁,以及之后的Alpha Zero对Alpha Go的百战百胜,让我们认识到了人类对于这些棋类游戏的探索还多么肤浅。 在Alpha Zero的降维打击面前,世界冠军柯洁和对围棋一窍不通的我没有本质区别。 无论复杂度多么巨大,棋类游戏在理论上还是一个确定性的游戏。如果我们有能力遍历整个决策树,那么一盘棋还没开始下结果就已经注定。

drawing

不确定的牌局

牌类游戏(比如麻将以及德州扑克)与棋类游戏不同,前者是一类非确定性非全局信息的游戏。

非确定性指的是参与者对游戏不完全可控。比如牌类游戏的开局是随机的,每一轮牌局大家手里拿的牌都不一样。运气好基本开局就赢了,运气差的也可以直接投降了。由于这种随机性,新手可以凭借“手气”在一局牌中赢下世界冠军。

非全局信息是指我们不光不知道当前这局游戏未来的信息(这是显而易见的),也并不完全知道过去的信息。对于棋类游戏,我们可以知道当前棋盘上有哪些棋,以及之前每一步的棋盘状态。而对于牌类,我们既不知道对手抽到的牌是怎样的,也不知道剩下的牌有哪些。

这两个因素使得我们无法判断当前牌局在决策树中的哪个位置,从而无法清楚的知道下一步应该怎么做。从掌握局部信息的参与者来看,棋局处于量子叠加态。

Life is Poker, Not Chess

人们常说人生就像一盘棋。但我更认同Annie的观点:人生更像牌局而不是棋局。相对于棋局,牌局更加复杂且充满不确定性。当然,人生比牌局更复杂。

在漫长的人生中我们需要在只掌握部分信息的情况下不断做出决策,有意识的或无意识的(比如非条件反射)。

现实世界中“手气”或者说运气也很重要,有的人由于运气好,即使决策很差也有好结果,而有的人正好相反。

我们通常根据结果的好坏来判断决策的好坏, 并用于提升将来的决策质量。这被称作决策复盘。

但是,作者在书中指出,我们不能完全根据结果来判断我们决策的质量。作者提到了“事后诸葛亮偏误”(hindsight bias),人们常常把结果的好坏归因于自己之前做的决策。如果结果是好的,那么肯定是因为我们的决策是好的。然而,一个好的结果并不一定因为我们做了好的决策,反之亦然。

决定结果的因素有很多,个人决策这种内部因素只是其中一小部分。比如时代趋势以及运气等外部因素都能在很大程度上影响人生。我想大家都听过这个段子:

三个人坐电梯从一楼到十楼,一个原地跑步,一个做俯卧撑,一个用头撞墙,他们都到了十楼。有人问他们如何到十楼的?他们分别答道:“跑上来的”,“俯卧撑“,“撞上来的”。

二十年前买房的人以及十年前进入互联网行业的人,不知有多少人把自己的“成功经验“总结分享给大家。

我们是通过“决策——观察”这样的方式来认知事物规律。如果决策和观察之间没有必然的因果关系,那岂不是观察结果对我们的提升决策质量没有任何帮助。

情况并不是那么令人绝望。决策和观察之前仍然存在“因果”关系,只不过不是我们以为的那么纯粹简单。作者在书中提出了几点方法。

  1. 改变认知。
  2. 建立认知正向反馈。
  3. 找到志同道合的人。

提升决策的第一步就是承认自己不可能完全了解这个世界,转而使用灰度认知而不是非黑即白的方式来对事物的因果关系进行描述。 当我们判断一个决策对结果的影响时,我们用概率而不是二元变量来衡量。比如,如果我采取方案A,那么事件X的成功概率为80%,如果采取方案B,那么成功概率为90%。

这世上没有绝对的必然。我们所知的必然都有时间作为限定条件。农场主每天给火鸡喂食物只是因为当年的感恩节还没到。直到2022年以前,00后的世界观是stonks always go up。我们认为地球每天24小时只是因为整个人类文明期间(假设10000年)地球自转只改变了1.5秒/年。

当我们用概率来描述事物关系时,我们就为必然中的偶然留了一个位置。

当接受新的认知方式后,我们就可以据此建立认知正向反馈了。我们首先根据自己由认知形成的信念(belief)做出决策(bet),然后收集结果样本(outcome)。我们通过大量的决策以及结果样本来减小由运气带来的不确定性。只有我们利用去芜存菁后的信息来改善我们的认知,并且优化我们的信念。

drawing
认知正反馈

建立认知正向反馈是一个困难而易错的过程。因此我们最好找到志同道合的人来一起提升自己。这样做有几个好处:

  1. 团体成员能够相互打气,帮助对方克服困难。此外,同侪压力也会提升个人意志力。
  2. 大家一起合作可以消除对方的主观判断。
  3. 集思广益可以产生更多的帮助建立正向反馈的方法。

概率思维的局限性

概率思维也是有局限性的。对于极端稀疏的事件,我们无法估计其概率,因此也无法做出合适的决策。对于极端稀疏事件的影响及防范,塔勒布在他的《黑天鹅》里面有详细的讨论。有兴趣的可以看看我关于那本书的读后感

Leave a comment