http://4rdp.blogspot.com/2025/06/signal-and-noise.html
精準預測:如何在巨量雜訊中,看出重要的訊號,(The Signal and the Noise: Why So Many Predictions Fail - but Some Don't),奈特‧席佛 Nate Silver 著,蘇仔堯 譯,三采文化出版,ISBN 9789862299609。
能夠精準預測未來,自古以來是眾人一直在追求的能力,不過想預測就必須要有情資為基礎才能為之,很像一個可控制系統,餵養資料之後,依據系統方程式計算然後特定輸出,很多人就是這樣來預測未來,書中分 13 章有許多故事,讓我們看一下大綱:
1. 慘烈的預測失誤 ─ 談論金融評等機構對經濟的預測失準問題,以美國次級房貸為例,演變過程為投資人認為房價會持續上升,但是歷史顯示是下降的,評等機構基於錯誤預估模型而有錯誤信心,再加上高度槓桿操作,產生危機後引發長久而深遠的衰退。注意正確與精確是不同的東西,可以不正確但是精確,也可以正確卻不精準。
2. 你比電視名嘴還聰明嗎? ─ 政治預測,想要有好的預測應該跨學科、適應力強,會自我批評,包容差異與不確定性 (複雜狀況),小心謹慎,依賴觀察而非理論,像一隻狐狸。另一類人,以專科知識處理事情,態度堅定不移、毫不退讓,有自信地尋找規律,有特定意識形態,像一隻刺蝟。作者建議用機率思考事情,只預測當下最可能發生的事,做出新的預測不代表舊預測就消失了,而是應該記錄,以便未來檢討,最後的預測原則是尋求共識,就是多家分析並綜合結論,而非挑選其一。
3. 我在乎的只有輸贏 ─ 美國棒球很早建立統計預測系統,包含球員統計數字,分辨球技與運氣,了解球員隨年紀增長演變。球探使用混和方法來判別球員價值,有摻入人為偏見,而統計系統只記錄可以量化的數據。道奇隊球探約翰‧桑德斯認為有五種不同智能和心理能力有助於預測球員的表現:準備程度和工作倫理、專注程度、競爭力與自信、壓力管理和謙遜態度、適應力與學習力。
4. 多年來你一直告訴我們雨是綠的 ─ 自古以來人們有氣象預報的需求,最低需求可以知道出門要不要帶傘,更實用的需要像是防颱準備。目前氣象預報採取三維空間計算,如果想要尺度空間縮小一半,電腦計算需要增加八倍,第四維時間縮短一半,那計算量就又倍增。氣象系統是非線性動態的,因此有蝴蝶效應,也就是
混沌問題要解決,另外計算結果還要能夠視覺化。氣象預報追求更長期的未來預測,還有準確如實的預測,切莫把政治、個人榮耀等因素放入導致偏頗。
5. 拚命找訊號 ─ 地震也是需要預測的項目之一,人們想知道它會發生在何時、何地、規模多大。地震頻度和規模大小呈冪次律分布,地震學家有興趣研究時間間隔關聯性,地震測量有雜訊統計過度配適的問題,它的難度比氣象更高
6. 要怎麼淹死在一公尺深的水裡 ─ 洪水預報河水高度,堤防必須再加誤差高度才不會溢堤。經濟預測有多項挑戰:單獨從經濟統計數字非常難決定因果關係,經濟不斷在改變,未來的景氣循環不一定適用,以及所記錄的經濟資料也很糟糕。統計上有相關不代表是因果關係。經濟有測不準狀況,因為經濟政策會改變經濟預測。想找經濟預測,最好找平均或集體的預測而不是單一的預測。
7. 模型的角色 ─ 外推法當模型不正確將有偏差,傳染病 R₀ = 3 表示它會傳染給三個人,預測投票行為、社會流行都會有自我實現的效應,而交通壅擠預測則會自我取消。流感疫苗 SIR 預測,Susceptible 易受感染 -> Infected 已受感染 -> Recovered 已康復(或過逝),打疫苗後將跳過 Infected 階段。
8. 錯誤越來、越來越少 ─ 運動賭博,審慎作法是兩面下注。考慮條件下的貝氏機率,已經發生恐怖攻擊,再次發生的機率幾乎百分之百,還有要
小心假陽性,
9. 對機器大發脾氣 ─ 電腦西洋棋是可預測的,在實際能力沒辦法用決定性的解決方法處理問題的時候,運用經驗法則,人們偏好直觀推論,但會有偏見與盲點。棋手經常在廣度與深度之間兩難。
10. 撲克泡沫 ─ 撲克是非常數學的比賽,倚靠不確定中做出
牌張組合機率性的判斷,會用到貝氏定律,也需要預測對手的牌,充分發揮八二法則 (帕雷多原理) 就可以用最少努力獲取最大的預測準確性,當看不清楚狀況時我們會亂打牌,談到預測我們會以結果為導向。
11. 要是你贏不了他們 ─ 普通股的平均持有時間越來越短,團體的預測一般比個人預測好,每個人應先獨立預測然後平均,建議使用專業的預測。過去的表現無法代表未來的結果,股市極度不可預測,過度交易的成本很高,股市因為人類集體行為,當你發現某種模式時,其他投資人也會發現,然後模式就會改變。非理性繁榮造成股價持續上漲,股價本益比 (P/E, price-to-earning ratio) = 股票市價 / 公司年營收。我們期待買入後市場上漲、賣出後上場下跌,但是經常押錯,因為在預測時,我們經常過度自信。有人說股市應該有兩部分合併,一是趨勢,另一是動量交易。效率市場假說有三種型式:
一、弱式效率 (weak form),股市無法靠分析過去統計模式來預測,也就是說圖表分析注定失敗。
二、半強式效率 (semistrong form),基本面分析會失敗,也就是看公司財報、商業模式、宏觀經濟等公開資訊,無法穩定擊敗市場。
三、強式效率 (strong form),知道內幕會賺到錢。
12. 有著健康懷疑態度的氣氛 ─ 全球暖化來自溫室效應,主要是水蒸氣、二氧化碳、甲烷、臭氧。有三種氣候的懷疑態度:商業利益、唱反調、科學的懷疑,共識 (consensus) 和一致同意 (unanimity) 並不是同義字,共識是經過商議大體上意見一致,不過部分氣候科學家對電腦模型仍有懷疑。難題在氣象預測明天天氣就不能 100% 正確,何況數十年後的氣候。目前有兩類預測方法:一是統計整體性預測,另一是建立系統模型可較精確預測,不過常常模型越複雜預測就越差,而單純統計回歸估計簡單又準確。氣象預測的不確定性有三類:初始條件、預設狀況、模型結構,把這三個加總,誤差最小落在大約二十年後,估計不確定性可以獲得較適切的機率。氣候測量標準有四個主要機構:太空總署、國家海洋暨大氣總署、英國和日本氣象局。政治會讓我們離共識越來越遠,也會遠離真理。
13. 你不知道的東西可能會傷害你結論 ─ 恐怖攻擊,我們會蒐集到很多情報,但是重要的訊號只有幾個,我們需要分離雜訊,有些是想都沒有想過。恐怖攻擊次數與死亡人數像地震呈現冪次律分布,911 攻擊像規模八的地震,以色列對付恐攻是為日常生活,發生後盡可能恢復正常生活。
結論,預測哈雷彗星是人類的一大進步,建議我們用機率思考,鼓勵試錯找答案。