亨利·庞加莱(JulesHenriPoincaré)是法国数学家、天体力学家、数学物理学家、科学哲学家,1854年4月29日生于法国南锡,1912年7月17日卒于巴黎。庞加莱的研究涉及数论、代数学、几何学、拓扑学、天体力学、数学物理、多复变函数论、科学哲学等许多领域。
提到庞加莱,可能人们最先想到的是著名的“庞加莱猜想”,不过这一小节我们聊聊庞加莱一段真实又有趣的故事,这个故事对于理解数理统计中假设检验这个模块很有帮助。
我们买一些食品时,食品的重量多少会有些浮动,例如面包包装袋的重量标识可以这样写:
表示面包的重量应该是1000g,但由于种种原因可能会有50g的误差。庞加莱是个每天都会吃面包的人,他也遇到了同样的事,一个面包师声称卖给庞加莱的面包平均重量是1000g,上下浮动50g。这位面包师每天都会卖个庞加莱一个面包,面对这位忠实的顾客,他没有丝毫的防备,按照自己的买卖方式每天卖个这位数学天才1个面包,不过这位面包师的噩梦也从此开始。
在庞加莱眼中,面包应有重量1000g,上下浮动50g,用数学语言来表达就是:面包的重量服从期望为1000g,标准差为50g的正态分布。作为一个严谨的数学家,庞加莱每天都会将买来的面包称重,前9天的记录数据(单位g)如下:98197296699210101008954952969
这组数据的期望(平均数)为x=,尽管期望小于1000g,但也有50g的浮动,从感觉上尽管有些不爽但也难说有问题,不过对于身为数学家的庞加莱有8成的把握认定面包师在制作过程中偷工减料。但此时证据难说确凿,庞加莱决定按兵不动,继续记录了16天,累计25个数据如下:
,略有增加,但此时庞加莱有95%的把握认定面包师在制作过程中偷工减料。
庞加莱果断举报给质检部门,当质检员到来时,面包师百般抵赖,声称自己做的面包就是以1000g为基准做的,最多有上下50g的误差,从庞加莱提供的数据中,全部符合他描述的规律,一时间质检工作人员也无可奈何。但这位面包师可能还不认识他的对手,一位精通假设检验的数学家,下面是庞加莱的证词:
,则每个面包的质量X服从以1000g为期望,50g为方差的正态分布
这点倒是没什么问题,好像25个面包的每一个都服从这个规律。但是25个面包的平均值也服从正态分布,这就是重要的第二点。
,期望依然是1000,不过方差却改变了,计算公式如下:
也就是说25个面包的平均重量服从以下正态分布:
面包师和质检人员表示没听懂,这能说明什么?庞加莱给出了通俗的解释:一个面包的重量波动的会大一点,多个面包的平均重量的波动范围就会小很多。就想你投掷骰子,投掷1次可能的点数是1到6中的任意一个,但是如果你投掷100次骰子,,不信您可以试试。面包师和质检员基本理解了这个道理,继续听庞加莱的第三点说明。
,方差为10g的正态分布,我们先看看正态分布数据的分布特点,如图:
从上图中可以看出,,2倍方差为浮动(即20g)的范围里,即[980,1020]。换句话说,如果面包师严格按照1000g为基准,50g为浮动制作面包,那么25个面包质量的平均值,[980,1020]这个范围里,相反低于980g或者高于1020g的概率还不到5%,所以面包师一定故意偷工减料了。
听过了庞加莱对假设检验的科普,质检员对面包师做了处罚,面包师也承认自己确实是以980g为基准做的面包,并同意做出改正。