壽險精算業的祖師爺

在 "Against the Gods" 一書的第五章, 主要是介紹統計. 幾位 "無名英雄" 和意想不到的 "名人" 同台登場.

首先出場的是, 以鈕扣商人的身分加入英國皇家學會的葛朗特 (John Graunt). 他的主要事蹟是在業餘的時候寫了一本書 "根據死亡率所做的自然與政治觀察", 裡面研究了 1603~1661 (?) 年倫敦的出生率與死亡率. 他採用倫敦市政府從  1603 年開始記錄的每週數據, 再加上教會保管的出生與死亡資料, 以抽樣的方法來估計人口. 因為數字來自於政府 (state), 所以統計學後來就叫做 statistic.

葛朗特認為這些數據可以讓商業與政府更穩定. "擁有這樣的知識,…., 就知道這些人消費的數量,  不至於做出乖離事實的預估. " 這個前瞻性的想法, 使得葛朗特也被尊為市場研究之父.  牽涉到經濟與政治之後, 原本枯燥乏味的統計書就變成治國經商的藍圖了.

這本書出版的時間點, 正好是英國由農業社會轉型為發展私有財產與海外貿易的關鍵期. 原本的地主只需要依土地的面積和收成來納稅, 人口多少根本無關緊要. 但是進入需要役男的時代後, 到底有多少人口就至為重要了! 本書大賣 5 版, 使得葛朗特的大名引起廣泛的注意.

現代經濟學之父的佩蒂 (看起來很像女生, 但是他是男的, 著有 "政治算術" 一書) 在巴黎的 "知識期刊" 上發表這本書的書評,  進一步啟發了法國人也做類似的研究. 英王查理二世還特別欽點葛朗特加入皇家學會, 並且對於那些不滿小商人變成 "中研院院士" 的其他學會成員下令: "如果還能找到其他類似的小生意人, 都要讓他們入會, 不許囉嗦!" 看來這位英王相當地有趣, 難怪人稱快樂王 (Merry Monarchy). 當然, 查理二世也做過一些不得人心的事, 比方說強制關閉咖啡館, 避免大家議論國事. 但 16 天後礙於民意又取消了.

葛朗特統計的年代, 歐洲正在流行瘟疫. 以 1603 年為例, 就有 82% 的人死因是瘟疫. 另外 36% 的小孩會在 6 歲前夭折, 我想這是後來流行辦慶生派對的原因, 能活下來真的不容易. 葛朗特最大的貢獻不是在與整理已經知道的事情, 而是推估與建議. 他認為: 急性流行病可能因氣候, 食物引起, 應由政府設法管制. 餓死的人很少, 但是市區內乞丐氾濫成災, 這些乞丐看起來大多健康強壯, 所以他建議政府要加以干預, 把這些乞丐依個人的條件和能力加以訓練, 讓他們自食其力.

葛朗特也知道自己的數據不完整, 所以他做了一些假設. 在倫敦市每年出生 12,000 人的前提下, 假設每戶有 8 個人 (包括僕役), 每兩戶有一個婦女達到可生育的年齡, 因此算出倫敦市應該有 384,000 人 (12,000 x 2 x 8). 另外, 他也用倫敦地圖和每人生存面積來推估出倫敦市應該有 47,520 戶人家來印證第一個方法沒有太偏差. 而當時大家普遍相信倫敦有 200 萬人, 所以就算葛朗特的數據不夠準, 也已經大幅修正了大家 "認為" 的人口數. 

另一方面, 葛朗特依照 36% 的小孩活不過 6 歲, 一般人都活不過 75 歲的資訊, 編列了一個 6~76 歲的餘命表, 而初生嬰兒的壽命期望值是 16 歲. "古人" 真是可憐啊! 這也凸顯出中國的戶部尚書不愛數學. 為何中國就沒有統計數字可以流傳到後世, 難道…因為那是國家機密的關係嗎?

講完了英法, 再講德國. 研究德國人口的是一個英國人 – 哈雷 (Edmund Halley), 沒錯, 就是命名哈雷彗星的天文學家哈雷. 當時德國有一個叫做努曼 (Casper Naumann) 的神職人員, 他的教區有一種迷信, 認為月亮週期和健康有週期性的關係. 為了破除這種不符合教義的說法, 努曼找數學家萊布尼茲幫他的忙. 萊布尼茲把報告轉給倫敦皇家學家, 因此引起頂尖天文學家, 35 歲的哈雷的注意 (大概是牽扯到天體運動吧?)

哈雷是個神童, 還沒念完牛津, 就帶著他的 24 吋望遠鏡去南半球研究天空, 不到 20 歲就名滿全國. 22 歲的時候, 哈雷就加入皇家學會. 1721 年國王下令頒給他學位, 不過他在 1703 年就在牛津當教授了.

哈雷研究了德國小鎮的人口, 同樣做了一張餘命表, 並且算出該服役的人口數為 1/34. 比葛朗特更進一步的是, 他計算出同一個年齡層的一群人,  在一年內死亡的機率. 比方說 25 歲的有 567 人, 但是 26 歲的人只有 560 人, 因此 25 歲的人有 7/567 活不到明年生日. 哈雷順便幫保險公司計算了保費對照表, 完成了社會期待已久的傑作.

早在西元 225 年羅馬人就有年金保險的記錄了, 而保險的歷史更可以追溯到西元前 1800 年的 "漢摩拉比法典" (Code of Hammurabi), 當中有 282 則條文與船舶的保險有關. 但是保費應該怎麼收呢? 一千多年來, 唯一的依據似乎就是羅馬法律學者烏爾比安 (Ulpian) 的壽命預測表. 葛朗特和哈雷的研究啟發了當代的保險業者, 使得保險業在那個年代蓬勃發展.

17 世紀後半期, 正是英國與荷蘭爭霸於海上的時期. 兩國為了籌措軍費, 相繼地以年金保險的形式向全民舉債. 英國政府繼 1504 年賣過 7 年還本的年金保險之後, 又在 1693 年推出 14 年還本的一百萬英鎊的年金保險. 雖然他們這次已經運用了平均壽命有 14 歲這項資訊. 但是英國政府對於買保單的人, 不論被保險人幾歲都是統一定價. 因此這些保單不但沒有充實國庫, 反變成政府驚人的龐大債務. "依據被保險人的年齡來為保單定價" 這個觀念, 據說到了 1789 年才反映到英國政府的新保險年金之中.

民間的保險業者似乎比政府更加地積極, 自1637 年英國的卡諾皮亞斯 (Canopius) 喝了第一口咖啡之後, 各地迅速開起了許多咖啡館. 這些咖啡館除了提供, 在 "創世紀" (Ultima) 遊戲中, 供勇者打聽情報的功能之外, 就是給保險經紀人賣保險了. 1720 年, 兩家保險公司甚至送給英王喬治一世 30 萬英鎊的賄款, 使他們變成具有獨佔權的保險公司.

1771 年, 獨佔權大概是失效了. 經常聚集在勞埃咖啡館 (Lloyd’s) 的保險經紀人, 自己聚資成立有點像是會員制的保險公司 – 勞埃協會 (Society of Lloyd’s), 以個人的身家來為客戶擔保. 後來勞埃也發展成史上最著名的保險公司之一, 由此可見咖啡館和保險業真的極有淵源.

最近景氣變差之後, 保險經紀人除了轉戰不用錢的大賣場或是公司 lobby 談合約之外, 做生意的手法並沒有太大的變化. 依然是拿大部分人的保險費, 去付給自己, 以及少數真正被理賠的人. 古今的差異, 應該在於業者有了充分的數據做為後盾, 再也不可能像英國政府一樣做賠本生意了. 買彩券的期望值是負的, 買保險也是; 前者在活的時候還用得到, 後者要死了以後才能 "用到" 喔! 

哈雷的研究, 啟發了後來的棣美弗 (Abraham de Moivre). 他在 1725 年出版了一本 "人壽保險", 討論一個被伯努利 (Bernoulli) 分析過的問題. 既然哈雷可以用一個小鎮的樣本, 來說明 346 個 50 歲的人, 其中只有 152 個人活到 70 歲 (41%), 那麼世界上所有的城鎮, 都可以用 41% 來推算嗎? 如果實際上的值是 50%, 那麼因為樣本數過少, 而導致獲得 41% 這個結論的機率有多高?

基於伯努利一族的研究, 棣美弗發現了常態曲線. 也就是估計很偏差的機會不是沒有, 但是機率小得很多. 這個模型就像是一個鐘形,  在標準差之內的狀況經常被重現 (68%), 而 95% 的觀察會落在兩個標準差之內. 這個發現使得棣美弗感到 "開悟", 因此稱之為 "神的計畫". 棣美弗的重要著作還包括: "抽籤計算法", 後來改名為"機會論".

在研讀棣美弗的論文之後, 皇家學會的一名會士普萊斯 (Richard Price) 也寫了兩篇論文, 後來的一篇據說使得他的頭髮一夜間變白. 1771 年, 普萊斯的著作正式發表, 書名是 "保險金償付論". 這部著作使他贏得精算學(actuarial science) 始祖的頭銜. 至於只研究機率, 卻沒和保險業扯上關係的數學家當然還是大有人在. 比方說我們唸模式識別  (pattern recognition) 一定要讀的貝氏理論 (Bayes’ Theorem) 的貝氏就把遺產捐贈給和他一樣研究統計, 聲譽甚佳的普萊斯.

貝氏的研究主題是: 一個事件發生的機率有多少? 假設抽樣 10 萬根針,  發現了 12 根有瑕疵,  而平均的瑕疵率是萬分之一,  有多少機率這 12 根的出錯是 "正常的" 呢? 貝氏也皇家學會的成員, 但是世人對他了解不多. 我只知道他留下了很多的公式…

在 "Against the Gods" 的第七章, 舉了一個貝氏計算的例子. 根據我修過但不是太優的 pattern recognition 基礎, 我覺得作者的舉例是錯的. 需要使用的公式並不神秘, 就是 P(A|B) x P(B) = P(B|A) x P(A), 兩家工廠的事後機率似乎不可能被扳回那麼多成. 有興趣的人可以幫我驗證一下, 謝謝!

 

  1. [1] P(old)=0.4 and P(new)=0.6
    [2] P(bad|old) = 2*P(bad|new)
    and P(bad) = P(bad|old)*P(old) + P(bad|new)*P(new) = 1/10000
    ==> P(bad|old) = 1/7000 and P(bad|new) = 1/14000
    [3] P(old|bad) = P(bad|old)*P(old)/P(bad) = 4/7 ~= 0.571428
    P(new|bad) = P(bad|new)*P(new)/P(bad) = 3/7 ~= 0.485271

  2. 打錯…”3/7 = 0.428571″…Orz

  3. 哈哈! 書上的例子是正確的耶! 感謝 isometry 幫我算出詳細的數字.

    關鍵在於 p(bad) = 1/10000 在原來的題目中並不存在, 而是放在前後文裡面, 我的摘要也剛好把這個資訊放在題目之前. 書裡面到處舉了類似的例子, 例如一百根針有十根瑕疵之類的, 所以 p(bad) 對我來說變成未知數. 沒想到答案就在影片中, p(bad) = 1/10000 就是答案. Orz…

Leave a Comment


NOTE - You can use these HTML tags and attributes:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>