用iPhone、听电台司令的人智商更高？你可能犯下遗漏变数、被数据误导的错误-赢咖4注册

aihot 2017-12-19 11:22:44 云计算 | 查看评论

许多研究和媒体报导指出，拥有戴眼镜、使用iPhone、听电台司令乐团、熬夜、左撇子、喝比较多酒等特质的人比较聪明。这是怎么一回事？我们疯了吗？

对很多家长来说，要确保自己的孩子比同侪更聪明，是压力很大的一件事。所以我们会带孩子做天赋评估，从很小就开始接受训练，并替他们报名各式各样想像得到的课程。

但到头来，实情是，我们根本大可省下大把的钞票（与时间）。我们做了研究，现在，我们要告诉大家，如何让你的小孩更聪明。

根据最近的数据显示，聪明的人具备以下这些特点：

戴眼镜（数据来源：AOL）
使用iPhone（数据来源：CNN）
共和党员（数据来源：皮尤研究中心）
听电台司令乐团（数据来源：《华尔街日报》）
熬夜（数据来源：《君子》杂志 ﹝Esquire﹞）
左撇子（数据来源：《纽约客》杂志 ﹝The NewYorke﹞）
喝比较多酒（数据来源：《今日心理学》杂志 ﹝Psychology Today﹞）

上述每一个因素，都被指称是和智力有关的特质。如果你十分渴望在自家休旅车保险杆上贴上「孩子晋身荣誉榜的骄傲家长」贴纸，显然你要做的就是替孩子配一副眼镜，教他们使用iPhone，听几场雷根总统的演说，和电台司令一起玩乐团，午夜之前别让他们上床，把他们的惯用手改成左手，并开始训练他们的酒量（当然，要等他们到了法定喝酒年龄）。

我们疯了吗？

没有。我们只是读了几篇看来是从统计分析中得出错误结论的研究和媒体报导。具体来说，是一些把「相关性」和「因果关系」混为一谈报告与文章，无意间误导了读者重点所在。

我们应该要注意到这里有两个问题：有时候，原创性的科学研究也可能误把相关性当成因果关系；然而，在日常生活中，你更可能遭遇到的，是媒体以错误的方式报导科学研究的发现。我们已经看过很多范例，媒体把科学发现报导成一种因果关系，但原始的研究仅表明其中有相关性而已。

从统计的观点来看，我们可以在任两个因素之间找到很多明显的关连，比方说，戴眼镜和高智商。这类关连──指数据之间有某种关系──称为「相关性」。但就像本章接下来要探索的，两个因素之间存在着统计关系，并不代表两者之间存在着有意义的连结。

使用智能型手机就会有智能？

就从iPhone的研究谈起吧，这项研究探索每一州的iPhone使用情况，与各州拥有学士学位者在人口中的占比（以及其他因素）之间的关系，发现「iPhone的使用率和教育水准呈正相关。」但这仅表示iPhone使用者占比最高的州，同时也是拥有学士学位者占比最高的州而已。这不必然代表如果你用iPhone就会变得比较聪明。

相关性只是一种「双变项关系」──这是一种花俏的说法，用来说明两个变数之间有关系。双变项关系并不代表一件事是引发另一件事的原因。请这样想：你可以观察到两件事在统计上显然有关系，但这样的关系却无法针对你真正在乎的问题提供任何答案──为什么会出现这样的关系，这份关系对于身为数据使用者的我们又有什么意义？

前述这些观察到的关系，彼此之间并非因果关系，可能的原因很多。比方说，如果你检视「戴眼镜的人比较聪明」这个说法，会发现原始研究实际上说的是上学的年限和近视之间有关系。让我们暂且假设，上学越多年，代表你能成为更聪明的人（这是很强烈的假设，而且议题和原始文章不同）。这份研究从来没说比较聪明的人都会戴眼镜，而是指出，在学校多读几年书和你的视力之间有关系。两者天差地远，而且这里讲的是一种相关性。新闻为了要引起你注意，特意说视力和智力之间有关系，但研究的结论比较慎重，而且意义可能大不相同。比方说，实际上的关系可能反因为果：上学校的年限越长，眼睛承受的压力越大，因此引发近视，戴眼镜是为了矫正视力。

那么，熬夜的人比较聪明，这个说法又是怎么一回事？嗯，原始研究指出，研究当中智商最低的群组平均在晚间11点41分上床，而智商最高的群组则在午夜12点29分上床睡觉。这篇研究进行几种统计分析，发现即便计入种族、年龄、性别、婚姻状况、育儿状况、教育水准、所得、宗教，以及工作时数的差异，智商比较高的人确实比较晚睡。在这样的脉络之下，统计分析显然控制的不只是一组简单的双变项关系而已。但即便如此，统计学家仍不会将此视为因果关系的证据，不过是比较周密的相关性罢了。即便有这样的分析，仍无法证明熬夜能提高智商。同样的，因果关系可能是相反的，换言之，因为聪明，这些人必须熬夜做很多事。如果说，高智商的人比较可能熬夜把功课做完并多读点书，这样说有道理吗？你可能看到同样的统计关系，但因与果刚好相反。

所以，如果你希望孩子聪明，不用替他们配眼镜，或买iPhone了。

看看少了什么

人不只是想变得更聪明一点，还希望能更快乐、更健康、更富裕。正因为如此，你才会读到以下这类新闻标题：

〈通勤时间超过四十五分钟，你可能会离婚〉，《商业内幕》（Business Insider）
〈裸睡做大梦，美满人生的秘诀就如此简单〉，EliteDaily.com
〈住家附近有星巴克，房价可能上涨〉，《时人》杂志（People）

我们乐于住在星巴克附近，但不是因为可以提高房价，文章中也没有证明这一点。我们不争论数据，数据宣称，离星巴克最近的房子在五年间增值超过20%，距离稍远一点的房子则增值不到17%。但我们要质疑以下这种主张：「星巴克带动了房价上涨」。

有可能，星巴克把店面开在市中心，这些地点房价本来就涨得比较快。星巴克的创意长兼全球开发长﹙过去是房地产总监﹚亚瑟．鲁宾菲尔﹙Arthur Rubinfeld﹚还写了一本书，详论一般的加盟业者可以从星巴克的店址选择中学到什么，他的秘诀包括注意停车场的油污（这是代表附近交通流量大的信号）。

星巴克选择的地点或许有人行道，而一般人乐于住在有人行道的地方。也或许，每开一家新的星巴克，隔壁就会来一家苹果专卖店，而后者才是带动房价上涨的理由。

我们不知道。这是重点。

遗漏变数

前述所有因素，包括市中心、人行道、苹果专卖店等等，都可能是「遗漏变数」。遗漏变数的存在，是相关性不等于因果关系的主要原因之一。

请记住，当我们在谈双变项关系时，真的是这两个变项之间的关系吗？问题就在于，相关变数通常不只两个。你找到两个变数之间有关系（也称为「相依」），但实际上还有第三个变数也很重要，这就是遗漏变数（而且，没错，你可能会有多个遗漏变数）。

星巴克有可能真的让你的房屋增值，但星巴克也有可能是任何其他因素的「代理变数」，比方说人行道等等。就本例来说，代理变数是你认为和另一个因素密切相关的因素，但两者其实并不相等。比方说，智商就是一个人天生能力的代理变数。智商测验无法衡量你实际的能力，只是能知道在一个应该可以测出智力高低的测验中，你的表现有多好。

在星巴克的范例中，我们知道两个变数之间有关系，但我们不知道是否有其他遗漏变数。如果有任何遗漏变数存在，你就不知道你是否有区隔出其他有意义的关系。你必须确定你已经控制了其他会影响结果的因素，许多实证经济学家与统计学家在他们整个职业生涯中，都在担心遗漏变数的问题。

最后，当你在研究相关性时，请记住变数可能是正相关，也可能是负相关。就把这简单想成两个因素是同方向或是反方向变动即可。正相关性：星巴克的出现让房价上涨，一方水涨，另一方跟着船高。负相关性的运作方式则相反：院子里杂草丛生，让你的房价下跌。在这个范例里，当一个因素增加，另一个就会减少。在多数统计关系里，我们在乎的是变动方向。如果我们发现你家附近出现一家星巴克反而拉低房价，就无法在星巴克和房价之间得出相同的结论。

另一种我们一开始用来测试相关性的方法，是看看这是否符合我们的经济直觉。比方说，如果我们看到一份研究说毒贩数目和房价之间有正相关性──换句话说，毒贩越多，房价越高──我们马上就会起疑（怀疑数据，同时也怀疑毒贩）。尝试找出相关性的类型，或许能帮助你判断是否真的是因果关系，以及可能有哪些遗漏变数。

你永远都无法确定是不是考虑到了每一个因素，但你通常可以删去显然很荒谬的因素。统计不会永远完美，但能给我们一个框架，让我们用科学的方法评估数据。

关于本站

加入我们

网站合作

标签（推荐）