← 返回章节列表
思考,快与慢 · 第 8 课 / 共 12 课
回归均值——好年份之后为什么总会差一点
批评比表扬更有效?不,这只是统计学必然——任何极端结果后都会向平均值靠近 (原著第 17–19 章)
核心论点
回归均值是最被误解的统计现象之一:任何极端结果(极好或极差)之后,下一次的结果都会向长期平均值靠近——不是因为任何因果原因,而是因为统计必然。不理解这个,就会错误地把随机波动解读为因果。
上一课我们学了心理账户如何让我们对金钱产生非理性分类。这一课讲一个不同的认知陷阱:把统计规律误读为因果关系。卡尼曼说,这是他一生中最重要的智识发现之一——那个让他获得诺贝尔奖研究的起点,来自一次和以色列空军飞行教官的对话。
飞行教官的故事
卡尼曼在给以色列空军教官们讲课,他提到研究显示,表扬学员的飞行表现有助于提高后续成绩,而批评则会使成绩变差。一位资深教官当场反驳:
"胡说!我的经验完全相反。每次我表扬一个学员飞得好,他下一次一定飞得更差;而每次我批评他飞得差,他下一次往往飞得更好。批评有效,表扬没用——数据就是这么说的。"
——以色列空军飞行教官,引述于《思考,快与慢》第 17 章
这位教官说的在数据上是真实的:表扬之后成绩确实往往下滑,批评之后成绩确实往往提升。但他的因果解读完全错了。
正确的解释是:回归均值。学员某次飞得特别出色,除了技术进步,很大程度上是因为那天状态好、运气好——这是一个极端正向的结果。下一次,运气不会那么好,成绩自然回落到平均水平,与是否受到表扬无关。批评之后的提升,同理——飞得特别差的那次,有许多随机因素造成极端负向结果,下一次自然向平均值靠近。
这个故事是卡尼曼最常引用的例子之一。它说明了一个普遍的人类倾向:我们总在随机事件中寻找因果,并在找到"令人信服"的解释后停止追问。
回归均值的统计原理
回归均值最初由英国统计学家弗朗西斯·高尔顿(Francis Galton)在 19 世纪末发现,他研究父子身高时注意到:极高的父亲,儿子往往比父亲矮一些;极矮的父亲,儿子往往比父亲高一些。不是因为什么遗传机制,而是因为任何极端值都包含了大量随机成分,而随机成分会向均值回归。
用一个简单公式理解:
观测结果 = 真实能力 + 运气成分
当一次结果极端出色,通常是真实能力加上运气都很好。下一次,运气不可能再那么好(运气趋向于均值),所以结果会回落——即使真实能力完全没有变化。
相反,极端糟糕的结果,通常是真实能力加上运气都很差。下一次,即使能力不变,运气也会向均值回归,结果自然好转。
| 情境 | 统计解读 | 常见的错误解读 |
| 表扬后成绩下滑 |
上次结果 = 能力 + 超常好运;下次运气回归均值 |
表扬让人骄傲,导致成绩下滑 |
| 批评后成绩提升 |
上次结果 = 能力 + 超常坏运;下次运气回归均值 |
批评有激励效果 |
| 冠军基金来年平庸 |
上年业绩 = 能力 + 超常好运;下年运气回归 |
基金经理能力下降,或"规模效应" |
| 股票连涨后回调 |
极端结果后向均值靠近 |
获利了结,或"技术超买" |
肾癌发病率的例子
卡尼曼引用了一个让人意外的医学数据:美国肾癌发病率最低的县,大多数位于农村、人口稀少的中西部地区;而肾癌发病率最高的县,同样大多位于农村、人口稀少的中西部地区。
如果你只看前半句,可能会解释说"农村空气好、饮食天然,所以发病率低";看到后半句,又可能说"农村医疗条件差、饮食不健康,所以发病率高"——两种解释都言之有理,但实际上,真正的原因是小样本的统计波动。
在人口稀少的小县,如果某年只有 10 个人患肾癌,而正常期望是 8 个,发病率就会显得偏高;如果某年只有 3 个人,发病率就会显得极低。小样本产生极端结果的概率远高于大样本。农村小县的极低和极高发病率,都只是样本量小导致的统计噪音,不是真实的健康差异。
投资者最常犯的错误之一:把"小样本的极端结果"当成"真实能力的证明"。一个基金经理连续 3 年跑赢大盘,就被当作"选股高手"——但 3 年数据在统计上根本不足以区分"真正的能力"和"运气特别好"。
基金经理业绩的持续性
学界对基金业绩持续性做了大量研究,结论高度一致:上一年的冠军基金,下一年往往表现平庸。
卡尼曼引用了一项研究:分析大型金融公司顾问团队连续 8 年的投资业绩排名,计算相邻两年业绩排名的相关系数。结果是 0.01——统计上几乎为零,相当于随机排列。
"这家公司奖励了幸运,却把它误认为是技能。这件事在整个行业中普遍存在。"
——卡尼曼,《思考,快与慢》第 20 章
这意味着什么?今年最顶尖的基金经理,明年的业绩和今年最差的经理之间,在统计上几乎没有差异。这不是在说基金经理没有技能——但在巨大的市场随机性面前,短期业绩排名所包含的"运气"成分,远远超过"能力"成分。
约翰·博格尔(Vanguard 创始人,指数基金之父)对此的结论是:既然无法稳定地识别"真正有能力"的主动管理基金经理,不如买指数基金——让市场的平均回报属于你,而不是赌某位经理的运气会持续。
不要把回归均值解读为因果
回归均值最大的认知陷阱,是我们的大脑总是自动为它寻找因果解释。
一家公司某年利润大幅下滑,分析师的报告可能说"管理层决策失误";下一年利润部分回升,报告又说"新策略奏效,管理层改革成功"。但两件事都可能只是:去年运气特别差,今年运气回归均值。
当然,有时候因果解释是真实的。问题在于:你无法仅凭一两个数据点区分"真实的因果"和"回归均值"。需要更大的样本量,更长的时间窗口,才能识别出真正的能力信号。
| 现象 | 可能是回归均值 | 可能是真因果 |
| 基金今年排名第一,明年排名中等 |
去年运气好;今年运气回归 |
规模大了,难以超额;策略失效 |
| 公司连续 3 年高增长,第 4 年放缓 |
前几年好运叠加能力;向长期均值回归 |
竞争加剧、市场饱和、经营恶化 |
| 股票连续大涨后回调 |
极端结果后的统计必然 |
估值过高;基本面恶化 |
"手感好"的幻觉
1985 年,心理学家托马斯·吉洛维奇(Thomas Gilovich)和同事分析了 NBA 职业赛场的数百万次投篮记录,想验证球迷和运动员普遍相信的"手感"(Hot Hand)现象——连续命中几球后,下一球更可能命中。
结论令人震惊:职业赛场不存在"手感"效应。连续命中几球后,下一球的命中率与长期平均值没有统计意义上的差异。人们感受到的"手感",是大脑在随机序列中自动识别"模式"的结果——在任何足够长的随机序列里,都会出现几次"连续命中",大脑把这当成因果规律,实际上只是随机波动。
后续研究者使用更精细的方法,发现了某些条件下极小的手感效应,但远小于人们的主观感受。在股市中,这个启示是:一只股票或一个行业连续几年表现出色,很可能你在回顾一段好运气,而不是一个确定的未来趋势。
对你(新手投资者)意味着什么
追涨最近的明星基金,是在追逐已经过去的运气:每年基金年报排行榜出来,大量资金涌入当年冠军。但大量研究表明,上年冠军在来年的表现与随机选择没有统计差异。你追入的那笔资金,恰好赶上了那位基金经理的"运气回归均值"阶段。
一只股票连续大涨,不代表明年还涨:连续上涨是极端结果,包含大量运气成分。回归均值意味着极端结果之后,无论是继续极端还是向均值靠近,都不能从过去的涨幅中预测。过去的价格走势本身,不是未来走势的可靠预测指标。
公司连续高增长后业绩回落,不一定是经营恶化:每当分析师看到一家高增长公司增速放缓,报告就充满"竞争格局恶化"、"管理层懈怠"之类的叙事。这些解释有时是真实的,但首先要问:这是不是简单的回归均值?任何极高的增长率,都含有大量时代背景和运气成分,向长期可持续增长率回归是统计必然,不必然代表公司出了问题。
如何在投资中应用回归均值的认知:
- 加长观察窗口:评估基金经理或公司管理层时,需要至少 5-10 年的数据,而不是 1-2 年。样本量越小,随机性越大
- 不要追涨最近表现最好的基金/板块——极端好业绩之后,回归均值的概率比继续极端更高
- 对"连续好转"的故事保持怀疑:公司或基金连续几年超高回报,其中有多少是真实的系统性优势,有多少是随机好运?这个问题没有简单答案,但必须提出
- 不要把平庸年份视为警报信号:一个长期业绩良好的基金经理,某一年表现平平,大概率是均值回归,不是能力下滑
卡尼曼的洞察:回归均值是"统计学赠给人类的一个谦卑教训"。它告诉我们,极端结果往往比我们认为的含有更多运气,我们在随机中看到的因果,往往只是我们大脑的模式识别本能——而不是真实世界的规律。
课后检验
飞行教官故事的正确解释是什么?为什么不是"批评有效,表扬无效"?
正确解释是回归均值,而非批评的激励效果。学员飞得特别出色的那次,除了技术,也包含了超常的好运气。下一次,运气自然向均值回归,成绩下滑——与是否受到表扬无关。飞得特别差时同理,极端坏结果包含大量坏运气,下一次运气回归,成绩自然提升。教官把统计必然误读为批评的因果效果,正是回归均值被误解的典型案例。
什么是回归均值?用"观测结果 = 真实能力 + 运气"这个公式解释。
回归均值是指:在包含随机成分的系统中,极端结果之后往往跟随更接近平均值的结果。用公式理解:观测结果 = 真实能力 + 运气。当一次结果极端出色,通常是真实能力加上超常好运。下次,运气趋向均值(即接近零),所以结果回落——不是能力下降,是运气不再那么好。极端差的结果同理:下次运气向均值回归,结果提升,与是否采取了任何干预措施无关。
肾癌发病率例子说明了什么?为什么农村小县同时出现在最高和最低排名上?
这个例子说明小样本产生极端结果的概率远高于大样本。人口稀少的农村小县,每年患肾癌的人数基数极小(比如 10 人)。随机波动就能让某年发病率显得极低(3 例)或极高(15 例),而这个波动与任何地方性因素无关。大城市人口基数大,随机波动被平均掉,发病率更接近全国均值。因此农村小县同时出现在最高和最低发病率榜上,是统计必然,不是什么真实的健康悖论。
基金业绩的相邻年度相关性是多少?这意味着什么?
研究发现,大型金融机构顾问团队连续 8 年业绩排名的相邻年度相关系数约为
0.01——统计上接近零,相当于随机排列。这意味着:今年业绩排名第一的基金经理,明年的业绩排名与今年排名最差的经理之间,在统计上几乎没有差异。短期业绩排名不能作为预测未来业绩的可靠指标,因为大部分排名波动来自运气(随机性),而非稳定的能力差异。
"手感好"效应在职业篮球赛场是否存在?这对投资者有何启示?
吉洛维奇的研究分析了数百万次投篮数据,发现职业赛场不存在统计意义上显著的"手感"效应——连续命中几球后,下一球命中率与长期均值无显著差异。人们感受到的"手感",是大脑在随机序列中自动识别"模式"的幻觉。对投资者的启示:一只股票或行业连续几年表现出色,很可能是随机好运的积累,而非可以持续的系统性优势。追入"手感好"的股票或基金,实际上是在追逐已经过去的运气。