Archive for 1月 2015
流感快篩的敏感度
快篩的敏感性差異很大 (50%-70%),不過是特異性高。
(50%的話就和丟銅板一樣…)
Symptomatic Predictors for 2009 Influenza A Virus (H1N1) Infection with an Emphasis for Patients with a Negative Rapid Diagnostic Test
還有文章針對H1N1來分析,以RT-PCR或virus culture做為標準。
成人快篩敏感性 38% ,小孩快篩的敏感性57%,這......
所以應用上就像隨機騙局提到的,要配合其他條件的機率。
如果是在流感流行的季節,加上有流感的症狀,快篩陰性也可能是偽陰性。而快篩結果陽性且患者真正陽性的機率自然是很高。
如果不是流感流行的季節,快篩陽性就有可能是偽陽性。
這樣子來解釋為何流行季節不需要快篩陽性才算流感了…
Logistic regression 迴歸整理
ln (p/ (1-p) ) = b0+b1X
p= e ^ (b0+b1X) / (1+ (e^(b0+b1X)))
書裡寫到在logistic regression可以 report 的data 有
beta value, standard error, P value, R square (Hosmer & Lemeshow) and goodness-of-fit statistics. odd ratio, confidence interval. constant.
Omnibus tests of models coefficient table
看chi-square是否適合,若p 小於0.05表示這個model可以。但是比較多個不同的model,找出 most parsimonious model.
odds= P(cure) / (1-P(cure))
odds ratio (exponential of B, exp (B)) = (odds after a unit changes in the predictor) / (original odds)
R square = ( (-2LL(baseline)) - (-2LL (new) ) ) / (-2LL (baseline))
最好每一個cell 都有variables
complete separation:如果可以用一個predictor來預測outcome就不適用
一個predictor需要10個case (? or 50?)
Method of regression
Enter: 每一個項目都放到model裡
forward, backward就是照他字面上的意思,把變數加入或把變數剔除。
logistic regression 和 discriminant analysis 的差異
discriminant analysis:需normally distributed 的 independent variable
logistic regression :需要足夠的 sample
multivariate analysis: 2個 dependent variables
multivariable analysis: 多個 independent variables
常見的迴歸錯誤(來自聰明學統計一書):
分析非線性關係、相關性不等於因果關係、顛倒的因果、遺漏變數偏誤、高度相關的解釋變數、超出資料範圍的推測、資料地雷(太多變數)
參考資料:
Discovering Statistics using IBM SPSS Statistics (4版)
Exploratory regression analysis: A tool for selecting models and determining predictor importance
What is the difference between Logistic Regression and Discriminant Analysis?
Multivariate or Multivariable Regression?
2015-8-10 update:
為何增加一個變數後原先的變數會變成沒有意義
p= e ^ (b0+b1X) / (1+ (e^(b0+b1X)))
書裡寫到在logistic regression可以 report 的data 有
beta value, standard error, P value, R square (Hosmer & Lemeshow) and goodness-of-fit statistics. odd ratio, confidence interval. constant.
Omnibus tests of models coefficient table
看chi-square是否適合,若p 小於0.05表示這個model可以。但是比較多個不同的model,找出 most parsimonious model.
odds= P(cure) / (1-P(cure))
odds ratio (exponential of B, exp (B)) = (odds after a unit changes in the predictor) / (original odds)
R square = ( (-2LL(baseline)) - (-2LL (new) ) ) / (-2LL (baseline))
最好每一個cell 都有variables
complete separation:如果可以用一個predictor來預測outcome就不適用
一個predictor需要10個case (? or 50?)
Method of regression
Enter: 每一個項目都放到model裡
forward, backward就是照他字面上的意思,把變數加入或把變數剔除。
logistic regression 和 discriminant analysis 的差異
discriminant analysis:需normally distributed 的 independent variable
logistic regression :需要足夠的 sample
multivariate analysis: 2個 dependent variables
multivariable analysis: 多個 independent variables
常見的迴歸錯誤(來自聰明學統計一書):
分析非線性關係、相關性不等於因果關係、顛倒的因果、遺漏變數偏誤、高度相關的解釋變數、超出資料範圍的推測、資料地雷(太多變數)
參考資料:
Discovering Statistics using IBM SPSS Statistics (4版)
Exploratory regression analysis: A tool for selecting models and determining predictor importance
What is the difference between Logistic Regression and Discriminant Analysis?
Multivariate or Multivariable Regression?
2015-8-10 update:
為何增加一個變數後原先的變數會變成沒有意義
讀書心得 隨機騙局
書的介紹說隨機騙局,黑天鵝,反脆弱是三部曲
不過要了解作者的思考,並且應用在生活或交易上的話,更應該看
隨機騙局 Fooled by Randomness、影響力 influence、快思慢想 thinking fast and slow 這三部曲。
例如人們不喜歡為了抽象的事物而投保,但會買只限於恐怖分子攻擊而死亡的保險。大家也都相信自己相當不同,等到診斷出 某種疾病時才說為什麼是我?抽菸的人也很少不知道罹患肺癌的機率。
隨機騙局這本書的概念就像俄羅斯輪盤,六發中有一發是子彈。但現實生活可能有幾千發,其中有一發是黑天鵝,但人們試射幾十次沒事後,就會忘記裡面還有一顆子彈。
消防隊效應:消防隊員彼此聊得太多,很多事情的看法就會相同,但局外人會覺得那些看法荒唐可笑。
被隨機性常數愚弄的傻蛋:他們沒想過用經濟變數去操作行得通或許只是一時巧合而已。沒有事先訂定明確的作戰計畫以因應發生虧損的可能性。沒有認賠停損修正原來的作法,欠缺批判性的思考。
索羅斯就不受路衡相依的束縛 (克服了承諾和一致性)
書中舉了一些誤用統計的例子。用過去的資料否定假說,而不是證實假說,會比較保險。 例如"我對布希總統的一生進行完整的統計檢視。58年來接近二萬一千次的觀察值,發現他不曾有一次死掉。所以我可以宣稱他將萬壽無疆,而且統計顯著性很高。"
存活者偏誤 (survivorship bias),就像
“Positive” Results Increase Down the Hierarchy of the Sciences
書中舉了一些誤用統計的例子。用過去的資料否定假說,而不是證實假說,會比較保險。 例如"我對布希總統的一生進行完整的統計檢視。58年來接近二萬一千次的觀察值,發現他不曾有一次死掉。所以我可以宣稱他將萬壽無疆,而且統計顯著性很高。"
存活者偏誤 (survivorship bias),就像
“Positive” Results Increase Down the Hierarchy of the Sciences
Publication bias in the social sciences: Unlocking the file drawer
只有結果有意義的文章被發表出來。而negative result就被放在抽屜裡,沒有現身了……
裡面寫了一個機率偏讓的例子:
如果一個疾病的發生率是千分之一,檢驗方法的正確率是95%。假設沒有偽陰性。
如果隨機抽一人檢驗結果是陽性的話,那他真正有病的機率是多少?
就如同low dose CT 還是要在high risk的病患來作。而不能拿來大規模篩檢
這也讓我想到有人說要用尿液篩檢來預防吸毒的無知。
全面尿液篩檢的統計陷阱(劉玉皙、佘健源)
書中還有一個例子。以辛普森妻子遇害的資訊為條件,探究辛普森殺害她的機率,而不是看辛普森殺害她的無條件機率。證據有複利效果。我們往往在聯合機率的概念上犯錯。舉的例子是有呼吸道癌的機率乘上同一年被凱迪拉克撞死的機率,高達一百億分之一。
我在319後就聽過這種詭辯,說他覺得兩顆子彈發生機率只有xxxxxxx分之一,所以一定是自導自演……
只有結果有意義的文章被發表出來。而negative result就被放在抽屜裡,沒有現身了……
裡面寫了一個機率偏讓的例子:
如果一個疾病的發生率是千分之一,檢驗方法的正確率是95%。假設沒有偽陰性。
如果隨機抽一人檢驗結果是陽性的話,那他真正有病的機率是多少?
就如同low dose CT 還是要在high risk的病患來作。而不能拿來大規模篩檢
這也讓我想到有人說要用尿液篩檢來預防吸毒的無知。
全面尿液篩檢的統計陷阱(劉玉皙、佘健源)
書中還有一個例子。以辛普森妻子遇害的資訊為條件,探究辛普森殺害她的機率,而不是看辛普森殺害她的無條件機率。證據有複利效果。我們往往在聯合機率的概念上犯錯。舉的例子是有呼吸道癌的機率乘上同一年被凱迪拉克撞死的機率,高達一百億分之一。
我在319後就聽過這種詭辯,說他覺得兩顆子彈發生機率只有xxxxxxx分之一,所以一定是自導自演……
VPN and smart DNS 試用心得
花了年費加入 amazon prime,因為有免費的線上串流影片,所以試用一些VPN
大多數都有free trial,而且很多是不需要信用卡就可以試用的,有些是要先購買,
看說明,smartyDNS或是Smart DNS Proxy 不能使用手機的3g或4g上網,但是unblock us可以
其他像overplay, hidemyass, expressVPN, 也都蠻多人推薦的,不過要信用卡我就沒試用了。
我想最後會買smart DNS proxy吧,兩年只要50美金。
大多數都有free trial,而且很多是不需要信用卡就可以試用的,有些是要先購買,
如果不滿意有幾天的退貨期限。
先試用的是hotspot shield,這家可以免費的使用,但是試用期過了會有廣告。
連線速度尚可,所以過了試用期我就把他移除了。
第二個試用的是unblock us,這個看影片的速度快很多,有人說是因為DNS的關係。感覺很不錯,如果再便宜一點就買了。
先試用的是hotspot shield,這家可以免費的使用,但是試用期過了會有廣告。
連線速度尚可,所以過了試用期我就把他移除了。
第二個試用的是unblock us,這個看影片的速度快很多,有人說是因為DNS的關係。感覺很不錯,如果再便宜一點就買了。
其他像overplay, hidemyass, expressVPN, 也都蠻多人推薦的,不過要信用卡我就沒試用了。
我想最後會買smart DNS proxy吧,兩年只要50美金。
讀書心得 思維的疆域
這本書是分析 東方人與西方人的思考方式為何不同?作者是心理學家 Richard E. Nisbett。作者一開始說為有十億人被貼上「東亞人」的標籤道歉。
與希臘個人意志相提並論的中國傳統思想是和諧(harmony)。
中國人並不會認為自己是社會上位者或家庭成員中無助的奴隸,消失在集體中而沒有個我。
中國人科技的進展所顯露的是他 們在實用上的才能,而非對科學理論探索的興致。哲學家馮友蘭所觀察的中國人很難會提出「為什麼」這樣的問題。
方向盤不要打到底這種想法也是中庸之道
第二章
東方人較關注環境,西方人較注意個體,而且東方人比西方人更容易察覺事件間的關係。
東方人看見物質,西方人看見物體。
西方人較東方人更相信可控制性。 (但西方人較無法調整自己適應環境)
西方人看見穩定,東方人看見運動變化。 (塞翁失馬、焉知非福)
西人人專注個體,東方人擴及大環境。
西方人偏好歸類,東方人強調相互關連
第三章 西方人對人的看法
每個個體都有自己一套的獨特性。人們追求在重要特性上與眾不同。
人們往往是偏向個人的理想和成就的目標,他們覺得人際關係和團體行動有時候反而阻礙他們通往個人的理想和成就。
人們會努力地讓自己感到滿意自己,個人成就和肯定自己的正面價值對幸福感是重要的。
I 這個字表示跨界、不受限制、包含所有自己的特質、能力、理想目標和偏好的意思。
美國嬰兒和他們的父母分床或分房睡是很普偏的,在東西地區嬰兒都緊跟著父母。
日本媽媽會說如果你不把媽媽煮的東西吃完,農夫會感到難過。玩具在哭,因為你把它亂扔。
東方人比西方人較注意場景,對背景物體的改變和物體間關係的改變較敏銳。
美國人偏好相同範疇的成員作為分組的基礎,如雞和牛都是動物。
中國人利用關係,如猴子吃香蕉,牛吃草。
道德經「禍兮福之所倚,福兮禍之所伏...」儒家中庸之道,凡事不極端,過猶不及。
美國人傾向認為趨勢將朝同一方向,並以同一速度繼續。
中國人常預測變化會平緩下來,更常預期變化方向的逆轉。
所以均值回歸,微笑曲線,定期定額這麼受歡迎是這個原因嗎?
人氣最旺的世礦
Cliffs Natural Resources Inc. (CLF)
第六章
小孩子學名詞比動詞快,但有人發現東亞小孩學動詰幾乎和名詞一樣快。
例如談到鴨子時可以說 a duck, the duck, the ducks, ducks.
上次在NPR也聽到有人說語言對儲蓄的影響。英文有過去式,現在式,未來式,所以在想到未來要用錢的感覺離現在還很遠。因為中文沒有時態,所以想到未來要用錢現在就會開始存錢。
2015-8-1 update:
因內科主治醫師值班已經是常態,總會有人說,低點到了再撐一下就會變好了。這就是思維的疆域。(跌深反彈,均值回歸,否極泰來,塞翁失馬,焉知非福)
時序性並非因果關係
統派獨派的結論或出發點或許都一致,對台灣(中華民國)的下沉感到憂心,預測台灣會往下走,若可以的話追求離開海外。
同樣的趨勢不可避免,但一邊認為是kmt造成的(國民黨不倒台灣不會好),另一邊是認為不夠親中,綠營在亂造成的。畢竟要推論是因果關係是很難的。或許是瞎子摸象,或許是時序性所造成的影響。
2016-1-11:
不要整碗捧去也是一種中庸之道
所以均值回歸,微笑曲線,定期定額這麼受歡迎是這個原因嗎?
人氣最旺的世礦
Cliffs Natural Resources Inc. (CLF)
第六章
小孩子學名詞比動詞快,但有人發現東亞小孩學動詰幾乎和名詞一樣快。
例如談到鴨子時可以說 a duck, the duck, the ducks, ducks.
上次在NPR也聽到有人說語言對儲蓄的影響。英文有過去式,現在式,未來式,所以在想到未來要用錢的感覺離現在還很遠。因為中文沒有時態,所以想到未來要用錢現在就會開始存錢。
2015-8-1 update:
因內科主治醫師值班已經是常態,總會有人說,低點到了再撐一下就會變好了。這就是思維的疆域。(跌深反彈,均值回歸,否極泰來,塞翁失馬,焉知非福)
時序性並非因果關係
統派獨派的結論或出發點或許都一致,對台灣(中華民國)的下沉感到憂心,預測台灣會往下走,若可以的話追求離開海外。
同樣的趨勢不可避免,但一邊認為是kmt造成的(國民黨不倒台灣不會好),另一邊是認為不夠親中,綠營在亂造成的。畢竟要推論是因果關係是很難的。或許是瞎子摸象,或許是時序性所造成的影響。
2016-1-11:
不要整碗捧去也是一種中庸之道