讀書心得統計，改變了世界

Posted by : Chih-Hao Chang 2014年7月22日星期二

非常令人驚艷的書，也介紹了很多統計名人，不過也是十幾年前出的...

老師如何評估學生的學習成效？
考試考幾次？只考一次夠嗎？小考範圍要包含多久之前的？該每天考還是一週一次？

向平均數迴歸：
非常高的父母所生的孩子，往往比父母矮，非常矮的雙親所生的孩子往往比父母高。因如果沒有這種現象，經過幾代後就會出現一些非常高和非常矮的人

皮爾生的觀念革命：
科學就是量測，所有的實驗就某種意義來說都是草率的。所以可以把實驗結果看成許多散布的數字。科學的主體並不是那些可觀測的事物，而是描述與觀測有關機率的數學分布函數。

戈斯特先生：
啤酒廠在麥芽漿預備發酵的時候，要仔細測量酵母菌的量，但是酵母菌是活的會不斷的倍增，傳統方法是用顯微鏡計算酵母菌的數目，但酵母菌會複製，所以數量是變動的。戈斯特認為酵母菌的數目可以用卜瓦松分布來描述。

戈斯特想到期刊發表自己的成果，但吉尼斯公司不准員工對外發表文章，所以戈斯特以「學生」的名義在期刊上發表。戈斯特發現有平均數與標準差估計值的比值，就已經有一個可製表顯示的機率分布。這就是學生的t檢定！

費雪的作物收成變化研究：
目前很少有人敢聲稱自己明白天氣對農作物收成的影響。儘管這個問題對一個國家的經濟這麼重要，至今卻仍然搞不清楚，這可能一部分要歸啟於問題本身的太過複雜…而且缺乏定量數據，不管是學術界聝產業界，都沒有相關的實驗數據。

費雪提出了幾項準則，來評判哪些是好的統計的量
一致性(consistency)、不偏性(unbiasedness)、有效性(efficiency)

Fisher’s exact test
費雪利用顯著性檢定，產生了一個他稱為P值的數字。假定五年後服用安慰劑的婦女有一半乳癌復發，但服用新藥的完全沒有人復發，這樣能證明新藥有效嗎？

致命的劑量：
布利斯發明了一種他稱為機率單位分析(probit analysis)的方法，模型可以找出殺蟲劑的劑量與使用該劑量時一隻蟲子會死掉的機率兩者之間的關係。(LD-50)

假設檢定是一種正式的統計程序，是在「待檢驗的假設為真」的假設下，去計算觀測到的結果的機率。假設檢定是一種否定某個假設的工具。假設檢定的目的不是讓我們肯定某個假設，就算與該假設有關的機率非常大也不行。

為了檢定原始假設，必須有一組定義明確的對立假設。

尼曼的解：
尼曼在附錄中提出一種方法可求出區間估計值，並判斷所得的估計值有多準確。尼曼稱這個方法為信賴區間。而不用機率這兩個字。

對尼曼而言，與信賴區間有關的機率，並不是答對的機率，而是統計學家使用某種方法經過長時間後做出正確陳述的頻率。
Statistical formulae for calculating some 95% confidence intervals
如上公式可計算95%CI
95% CI = observed proportion ± 1.96 × SE
SE = sqrt [ p(1-p)/n]

柯莫格洛夫思考了機率計算的本質，最後終於發現找出一個事件的機率，就像找出一個不規則形狀的面積。在柯募格洛夫的機率理論公理化過程中，我們假設有這麼一個抽象空間。

假定統計分析顯示，新舊療法之間有明顯差異，那麼是否表示可以保證新治療法能治癒下一個病人。

p.169
南丁格爾也是自修成功的統計學家，發現英軍死亡的主要原因是在戰場外感染疾病、以及受傷後沒有得到好的照料而死，真正死在戰場上的人數並不多。她也使用圓形圖(pie chart)

無母數方法：
威爾考克森發現極端而不尋常的離群值(outlier)，對計算結果的影響很大。怎麼知道哪個數字真的是離群值？要剔除多少個離群值才恰當？真的剔除了能不能繼續使用機率表？

曼恩與惠特尼得到一種檢定統計量，與威爾考克森的計算方式相同。在無母數程序發展出來後，產生兩個問題，如果數據本身有一個已知的參數分如常態分布，那麼用無母數的方法來分析情況會有多糟？什麼適合用無母數的統計方法來分析？

p.185
皮特曼發現只要數據偏離參數模型一點點，無母數檢定就遠遠比有參數的檢定更來得適合。