Tag Archives:

我讀 «投資最重要的事»

這本書吸引我注意的地方, 就是華倫巴菲特說他讀了兩次. 而它的作者霍華馬克思 (Howard Marks) 是橡樹資本管理公司的共同創辦人, 也是個著名投資奇才. 所以特別買來一讀.

本書的英文名稱是 “The Most Important Thing Illuminated”, 副標題是 “Uncommon Sense for the Thoughtful Investor”. 作者以備忘錄的形式記錄了 20 條最重要的事, 特別是第二層思考的法則. 不意外地, 本書有 21 章, 最後一章回顧前面重要的事, 並寫下 28 個要點.

畫了這麼多重點, 到底哪裡會考呢? 第一章 <學習第二層思考> 告訴我們要有第二層思考, 和大家不一樣, 這樣才能打敗大盤. 第二層思考是反向思考嗎? 也不完全是. 市場上漲的時候, 當然要跟大家有共識. 第 11 章 <反向思考> 提醒大家思考 “好的不像真的”, “糟的不像真的” 發生時, 如何不變成追隨者? 當然, 書上不會有量化的指標, 只是教大家要有此心理建設. 對於極端的狀況, 我們要反向思考. 整體而言, 要比市場共識更為正確, 才能成為少數的贏家.

讓我們火速跳到第 19 章 <增加價值>, 了解要如何打敗大盤? 馬克斯說 “有投資技巧的人” , 不論在進攻或是防守, 表現都比大盤好. 至於如何在進攻與防守間分配比重, 那是一種藝術. 總之, 只能跟著大盤連動的投資人不是有技巧的投資人. 想要長期打敗大盤, 要能夠判斷市場在上漲還是下跌. 請注意是判斷現況, 而不是預測未來.

  進攻 防守
沒有技巧 上漲: 賺很多

下跌: 虧很多

上漲: 賺不多

下跌:虧不多

有技巧 上漲: 賺很多

下跌: 普通虧

上漲:普通賺

下跌:虧不多

第 15 章 <察覺所在的景氣位置>, page 212 有一張表格, 用來評估市場的熱度. 如同前面說到的, 作者並不是要大家反向操作. 如果一昧反向, 就不可能在上漲的時候搭上順風車. 重要的是, 何時準備下車, 轉為防禦型的操作.

第 14 章講到 <認清預測的局限>, 主要說明很少有人能猜中市場走勢、更少有人能猜中兩次. 好比 2008 年金融海嘯很少人能預測到, 就算預測到會全球大崩盤, 也能接著預測何時會經濟復甦嗎? 當我們承認自己無知, 作法就應該像是 “我不知道” 學派、而不是 “我知道” 學派. 承認自己所知有限, 所以才需要防守. 若什麼都預測得到, 永遠 show hands 就好了.

當我們感受到要轉為防守, 買什麼標的才有防禦性呢? 作者說到買的便宜是重點. “買得好 , 就等於成功賣出一半.” (p.65) 換言之, 作者並沒有說什麼樣的東西不能買, 也不需要持久的護城河, 但是要能夠確認它夠便宜, 不會一路下跌. 只要確認便宜, 甚至於掉下來的刀子都可以撿 (P.167~168).

即使對於便宜資產的態度如此積極, 作者並沒有提示我們 “高報酬、高風險”. 反之, 第五章 <理解風險> 就特別說明, 高風險是指報酬的不確定性大, 或許有可能高報酬, 同時也可能有高的負報酬. 若願意冒險就保證有高報酬, 那麼根本是無風險.

整個市場的風險溢酬都基於無風險報酬 . 假設貨幣市場的報酬率是 4%, 我們期望 5 年期國庫券報酬率是 5% , 10 年期是 6%, 高評等債券利率是 7%, S&P 股票殖利率是 10%, 高收益債是 12%, 小型股是 13%…等等. 如果大環境導致貨幣市場利率降到 1%, 也就是現在的定存利率, 那麼我對每一種投資的期望值都跟著減 3%, 這就反映了當下各種投資相對的風險. 

如果我們看到一間小公司頗值得投資, 那麼它可能要提供 10% (13-3) 的收益率. 收益若更低就會有風險. 我們要控制甚至承擔風險, 而不是逃避風險. 風險怎麼承擔呢?我們要產生某種投資組合, 使得在同樣風險下, 能夠獲得一般人以上的附加價值. 同理, 我們可以在相同的報酬底下, 依據投資策略, 使得投資組合的風險降低.

舉例來說, 兩家公司的屬性差不多, 每年 EPS 差不多. 挑選其中一家更有競爭力的公司, 這就是在相同收益下降低風險. 便宜的標的 (如股票) 怎麼產生的呢?包括:很少人知道或不被完全了解、表面上有基本面疑慮、有爭議、不合時宜或讓人恐慌、被視為不適合納入正規的投資組合、不受重視、不受歡迎、而且不被喜愛、過去可追溯到的報酬不好、或是最近成為減碼標的、而不是加碼標的 (p. 175~176).

如果我們專門買這些便宜貨, 會不會便宜沒好貨呢? 書上要我們 <準確估計實質價值> (書上第三章, 簡寫成 CH 3, 後同)、<找出價格與價值的關係> (CH 4)、 <找出便宜標的> (CH 12)、然後 <耐心等待時機> (CH 13). 便宜的不一定是好貨, 甚至買了也不漲 (p.282 說: “超越時代與失敗是很難區分的”); 但貴的一定不值得投資! 作者的心法大致就是這樣.

最後, 書上一直提到風險調整報酬 [1], 我找到一個定義是這樣: RAROC (Risk-Adjusted Return on Capital) = 風險調整資本報酬率或是經濟資本報酬率.  或許我理解不正確, 但在本書中的定性意義很明確, 雖然冒著更大的風險賺到一樣的報酬, 但冒險者的風險調整報酬還是比較低.

RAROC = 風險調整淨利/ 經濟資本 [1]

[REF]

 

我讀 «大數據»

本書 – 大數據 (Big Data) 的作者是麥爾荀伯格 (Viktor Mayer-SchÖnberger) 和庫基耶 (Kenneth Cukier) 兩位, 它的副標題是 A Revolution that Will Transform How We Live, Work, and Think, 由天下文化出版.

Big Data 這個名詞近來很紅, 顧名思義, 會讓人聯想到我們有很多資料可以用, 所以我們可以…. 不過對於它的內涵, 一般人還是不甚了了, 這也就是為什麼大年初二我會在 7-11 買它的原因. 我想大家可能都聽過 Google 可以用關鍵字搜尋來預測流感發生的區域, 這是相當著名的一個資料探勘 (data mining) 應用. 不過 big data 和更早之前講到的 data mining 究竟有甚麼不同呢?

根據本書的說法, big data 代表 "樣本 = 母體", 也就是完全沒有抽樣, 這是 big data 的第一大特徵. Farecast 公司專門預測飛機的票價, 創辦人伊茲奧尼 (Oren Etzioni) 所使用的資料庫是某個旅遊網站的一萬兩千筆票價資料. 他用這個資料庫建立一個模型, 告訴想買機票的人, 現在的報價將會上漲或是下跌. 當他創業成功後, 他所使用的資料庫也愈來愈大, 據說現在有兩千億筆的票價紀錄. (呃, 能夠順便告訴我世界先進接下來會漲還是會跌嗎?) 總而言之, 使用 big data 的人不需要有特別考量專業背景 (know why), 只要讓資料說話 (know what).

這使我想起當初在做文字識別的時候, 我們最重視的是主觀的特徵 (feature), 比方說有人會用字的外緣軌跡 (contour)的梯度 (gradient) 來當作特徵, 這樣就會比取字形的投影量 (histogram) 厲害.我們先有想法, 然後才去實驗它是否可行? 這一點到了 big data 的時代看起來還是沒變, 我們還是需要測試, 只不過我們用的資料庫變大了. Know Why 的比重降低, Know What 的比重提高. 我們不太需要大師想出震古鑠今的 "特徵",什麼高招低招都可以一併拿出來用, 只要資料庫夠大, 我們可以靠實驗為所有的特徵分配比重.不再需要單一的辨識之神, know what > know why 可以說是 big data 的第二個特徵.

對於 "樣本 = 母體" 這部分, 我仍然可以用模式識別 (pattern recognition) 來說明. 19 年前, 我們去加拿大向孫靖夷教授求教, 他說訓練辨識用資料庫裡面要乾淨,把一些奇怪的字 (這裡指的是手寫數字) 剔除, 此時訓練出來的資料庫才不會有太大的變異 (variance), 進而影響辨識的效果.不過在 big date 裡面, 其實並不分訓練用的資料庫和實際應用的資料庫, 它們就是同一個, 所以怪怪的資料並不會被剔除. 就算要剔除這些資料, 也要專家說了才算吧! – 而這恰好違背了 know what > know why 的原則, 因此沒有人會去整理資料庫,雖然 garbage in garbage out, 但它們自然會被淹沒在大多數都是正確的資料海當中 (p23).

怪怪的資料也包括缺損的類型, 舉例來說, 傳統的資料庫軟體都有許多欄位要填, 但是我們所蒐集的部分資料可能就是少了那麼幾欄, 在這種情況之下仍然要能資料化 (記錄整理)、數位化 (能讓電腦讀取)將這筆數據放進資料庫 (data base), 就成了新式資料庫軟體的挑戰. 書上有個不錯的例子是有關於亞馬遜書店的書評. 最初亞馬遜雇用了一群專家來寫書評, 他們會為我們買的書推薦相關讀物作為延伸閱讀, 以便進一步刺激銷量.

不過實際上,讀者不一定想當領域的專家. 如果我已經買了 <Big Data>, 它又推薦我買 data mining, 我應該會瘋掉.結果亞馬遜在做完實驗後, 解僱了這些專業書評, 改採統計式推薦. 當初買這本書的人又買了什麼? 它就會直接推薦給我們, 亞馬遜也不知道為什麼? 但它比專家還有效, 亞馬遜的業績有 1/3 來意推薦名單. 而 Netflix 租片訂單有 3/4 來自電腦推薦系統. Why? 沒有那麼重要. 如果真的花大筆資金和人力, 找出人類潛意識的規則, 能夠把 Netflix 的推薦名單效用再倍增嗎? 也許不能. 乾脆就這樣不求甚解下去好了.我們只要知道相關性 (correlation), 不用知道因果.

相關性也是一個有趣的東西, 我們想知道銷售量和哪些東西相關, 當然就希望 "哪些" 不只是一些些, 而是所有的可能的資料. 基於這個原因, 原先沒有被發掘的特徵也都數據化了, 例如地理位置.當然, 對方要是能夠知道我們的種族、血型、星座、收入…, 也絕對不會放棄這個機會. 這也就是大公司喜歡收集我們訊息的理由. 微軟、谷歌都會要求我們參與他們的改進計畫, 以便蒐集更多的用戶軟硬體配備資訊. 甚至還有人讓我們當免費的廉價勞工.

馮安 (Luis Von Ahn) 第一個想到用圖形上的文字來測試輸入者是人類還是電腦程式 – Completely Automated Public Turing Test to Tell Computers and Humans Aprt (Captcha). 他的發明真的擋掉了許多想測試密碼的機器人, 不過也害得我們有時根本看不清哪張圖上面的字是什麼鬼, 而進不了自己的帳號. 因為馮安在推出第二代 Captcha – ReCaptcha 的時候, 順便把 Google 文字識別也認不出來的字參雜在其中. 如果有五個人的答案都一樣, Google 就可以把它加入資料庫. 也就是說, Google 每天可以省下 400 萬美元的工讀生認字費用去認那兩億個字. 而我們還以為它知道答案呢!

由此可以見, 資料庫不但可以拿來使用, 還能請君入甕. 上面這個例子是 Google 把資料庫借給 Captcha, 而 Captcha 又回饋給 Google 的例子. 於是我們可以看到資料庫的釋出可以帶來雙贏的好處. 釋放資料庫的附加價值有三個: 重複使用資料、合併資料庫、找到買一送一的情況 (p147).

所謂重複使用資料就是把資料活化, 把原本用途 A 的資料放在用途 B 來用. 合併資料庫的例子是把戶政, 疾病, 年收入三個資料庫做相關性比對. 買一送一的例子是 Google 的街景車一面搜集街景資料, 一面記錄 WIFI 訊號, 以便日後可以靠 WIFI 基地台的位置加強定位的精准度. 顯然, 某些資料會有保存期限, 比方說 WIFI  SSID 換了, 就要重新再搜集.

誰可以從 big data 獲利呢?包括資料持有人, 資料專家, 和有巨量資料思維者 (p182). 擁有大量資料的臉書, 谷歌, 微軟, 雅馬遜無疑是大贏家, 所以大公司絕對有利. 而小公司只要有想法, 能夠找出應用, 他們大可以去買別人的資料庫來用, 甚至可以用免費的 [1]. 因此最不具競爭力的就是中型公司. 

最後本書講到道德問題. 我們有了巨量資料, 搭配上某個演算法, 似乎就可以輕易地破壞隱私權,  或是事先預防犯罪. 但是就如同人肉搜索有其不道德的一面之外, 就算我們根據統計資料計算出某個罪犯不應該被假釋, 我們也不應該違反無罪推定, 先入人於罪. 書上說到, 使用 big data 需要三條管控策略來規範.

1. 將資料保護由個人同意制, 改為使用者責任制. 我們在很多時候都會簽署同意對方使用個資的條文, 例如辦信用卡, 求職等等. 但我們當下的同意, 並不表示銀行可以一直打電話來叫我們貸款或是買保險. 這就是責任制比同意制好的地方. 我們的同意必須有時空的限制.

2. 運用 big data, 要尊重每個人的能動性. 這個意思是說, 不能用它作為有責任或義務的推論. 比方說保險公司不能夠因為某人是 50 歲的獨居失業男子, 就不准他買保險. 在這個狀況下, 保險公司反而有義務公佈他們的資料庫, 演算法, 讓專業的第三方認證, 且當事人可以反駁精算師的預測.

3. 培養演算專家這種審計師來稽核 big data 的使用.

綜觀全書, 它給了我們關於 big data 的宏觀描述, 也提到它的效用與道德風險. 不過就如一開始所說到的, big data 只能告訴我們大多數的情況下是怎麼發生的, 並不能解釋其原因, 也不能涵蓋所有的個案. 我在讀的另外一本書 <黑天鵝效應> 剛好就在講例外的那一部分甚至比常態的那部分更重要. 這兩本書算是互補.

[ref]

1. 免費-google Cloud SQL 雲端資料庫服務

 

兩秒對半秒

最近在看一本書 <半X直X>, 半澤直樹? 不是, 是 <半秒直覺>. 這本書出版於 2009 年, 原文書 <Gut Feeling> 是在 2007 年.相較於 <決斷兩秒間 (blink)> 的中文版發行於 2005 年, 顯然後者成書較早.乍看之下, 好像兩本書在講一樣的事情, 晚出書的好像還有跟風之嫌. 不過本書的作者 Gred Gigerenzer 是德國的學者, 而寫 blink 的麥爾坎.格拉威爾是一位記者. 前者講的東西也是原創, 其中包括他做的許多研究成果. 讀起來不免有點囉嗦, 專有名詞也很多. 而後者則是平易近人的暢銷書!

 <半秒直覺> 這本書的結構, 分為第一部 "無意識的智慧",  以及第二部的 "直觀感受".  所謂無意識的智慧, 就是指直覺. 雖然 "無意識" 這個詞聽起來很像是 "失去意識", 不過英文確實是這樣講. 比方說, NBA 播報時可能會說: "Lebron James went unconscious and hit everything he put up." 之類的. "直覺" 這東西聽起來有違智力或邏輯的判斷, 不過我們的確得承認人類有時候不知道為何自己知道. 以接高飛球來說, 如果真的去計算球的軌跡, 等到計算完成球都已經落地了, 其實只要憑感覺就可以接到.

此外, 知道比較多的人, 表現不見得比較好.  股市專家理論上應該賺錢, 不過績效並不好於射飛鏢的結果. 當我們為顧客準備更多的試吃樣品, 他們停下來試吃的比例增加, 購買的比例卻降低. 反倒是5只準備少數幾種選擇可以試吃時, 客人比較容易下定決定購買. 作者舉出許多例子, 證明並不是知道愈多、準備愈久、選擇愈多, 就會得到更好的結果. 有時候 – 其實作者認為幾乎所有的情況下, 少就是多. 因此我們只要靠直覺、簡單的法則就可以應付許多狀況 – 當然也有不適合的時候.

作者認為這種無意識的直覺是心理反射 (不知道原因)、經驗法則、演化結果、以及環境結構的綜合. 何謂”經驗法則”呢? 就好像我們看到陰影在下方, 就會認為它是突出的物體. 反之就會認為是凹的. 把圖顛倒過來看, 凹的就變凸, 凸的就變凹. 這種 "錯覺" 有助於我們在假設太陽從上方往下照的前提下, 迅速地做出應變. 當然, 這搞得不好就會變成飛蛾撲火了. 至於演化結果是指嬰兒就有追蹤移動物體的能力, 可見得這不是學習而來的. 而環境結構是指我們會以我們有限的知識做判斷 – 此時可能 "少就是多".

舉例來說, 歐洲人對美國不熟. 假如我們問他們兩個城市哪個人口數比較多? 大部分的人都會猜聽過的那一個, 因為很可能就是因為這個城市人口比較多, 他們才會曾經耳聞. 不過對於熟知美國所有城市名稱的美國人來說, 這或許反而是一個傷腦筋的問題. 最後大腦也會捏造事實. 假如我們把左腦和右腦之間的連結 – 胼胝體切斷 – 過去用治療癲癇的一種手術, 那麼左眼看到好笑的東西時, 負責非語言功能的右腦雖然接收了這個訊息, 但是負責語言的左腦卻要為剛剛的發笑找一個其實不正確的理由向別人解釋. 作者認為既然我們是這麼不完美的生物, 其實不用那麼傷腦筋去深思熟慮.

作者提到, 某家長想要幫小孩挑一所好學校時, 他會把所有的因素都考慮進去, 寫一個程式去算加權平均分數嗎? 其實家長看升學率就可以了. 咳咳…書上說的是出席率, 出席率相似的話, 就看作文成績. 今天收音機廣播說到, 英國學校推行遲到以曠課論, 並且會罰家長錢. 所以我相信至少英國人的確滿重視出席率的. 不過在台灣大概就是看升學率. 升學率差不多, 就比哪個學校名氣大之類的. 對於複雜的問題, 很少人考慮所有因素, 而是先從重要的特徵開始比較, 一項項篩選之後就可以得到結論.

比升學更重要的是婚姻. 擇偶的時候, 我們也不可能把對方所有的條件都加權平均拿來比較. 雖然每個人採取的標準不同, 但是通常都是使用簡單規則. 動物們其實也是這樣, 性擇這件事也很有趣. 公的天堂鳥會排成一列讓母的天堂鳥選擇, 不過專家說母的天堂鳥其實只注意哪隻公鳥的尾巴最長! 或許是尾巴長的公鳥飛行技術可能會更好一點, 但是無數個世代下來, 這也造成失穩的過程 (runaway process). 母鳥若是選了短尾的公鳥, 很有可能會生出短尾的公鳥, 而短尾的公鳥又可能不易找到伴侶, 而使得自己的基因無法傳遞下去. 因此, 物競天擇的結果, 長頸鹿的脖子和天堂鳥的尾巴都要夠長!

單一指標往往可以解決很多問題, 第一條規則無法判斷, 才進入第二條. 後面依此類推, 但估計不會超過 5~9 條. 人類的本領大概也就是記住 7 項左右的東西. 基於這個前提, 我們可以說只要半秒就知道對方是否合乎心目中的標準. 有趣的是, 如果一開始還沒有建立規則, 人們可能就是依據直覺來處理. 等到讓他們走幾次標準程序, 就算日後把書面規範收回來, 人們也不會受到影響, 因為有效的做法很快就會內化. 作者舉的例子是急診室的醫生.

密西根州某家醫院的醫生慣常將 90% 胸口劇痛的病人送進加護病房, 但其實很多人並不需要進加護病房, 醫生只不過是為了自我保護, 寧可病人多受點罪, 也不要讓自己有機會成為延誤病情的被告. 但這麼一來也造成了醫療資源的浪費. 後來這家醫院編了一套複雜的表格, 用來計算需要送進加護病房的機率. 表格大概分為三大塊: 主訴胸痛、主訴非胸痛、根本無胸痛. 每一種底下再根據病患有沒有心肌梗塞 (MI) 或是做過硝化甘油心肌斷層顯像 (NTG) 的病史來劃分 3 個狀況, 兩者都有、兩者有一者、兩者都無, 後面再附上一些我看不懂也 Google 不到的更細分類. 最後就是一個機率值. 可能院方有規定幾分才可以送病人進加護病房吧!? 後來醫院即使不提供這個表格, 醫生也都已經很熟練地運用此專家系統, 迅速地做出更正確的分類和判斷.

本書到了第二部的最後, 作者開始討論道德這個主題. 為何提到道德呢? 因為道德某種程度來說也是一種直覺. 我們根據道德, 很快地就可以崇敬或是排斥其他人, 甚至沒有原因. 比方說, 中國古代, 大家認為寡婦應該繼續守寡才叫做好, 如果她又喜歡了誰, 大概得去浸豬籠. 這就是道德直覺作祟. 因此作者說: "人們往往無法意識到其道德行為的背後原由." 需要守寡這件事在宗族為主的社會, 當然是不能見容於大眾. 輕易搞亂了一姓和另外一姓的關係, 到時候小孩都不知道要光耀哪一家的門楣了.

第二種道德直覺原則是: "可以在道德或不道德的行為背後, 發現同樣的經驗法則." 這段我看不太懂. 以我的認知, 大概是這樣. 在前述的道德直覺中, 人們需要預設一個立場. 但是同樣的立場, 可以做出道德與不道德的行為. 比方說, 我們的預設立場是合群, 那麼我們可以因為合群而捨己為人, 也可以因為合群而殺人 – 例如幫派, 光頭黨, 納粹黨.

第三個道德直覺原則是: "我們可以預防或是減少道德災難發生的機率." 比方說, 因為大家都喜歡從眾, 所以我們可以把想達成的事情定義為預設值. 例如, 在法國, 沒放棄器官捐贈的都要算是同意捐贈, 在美國, 同意捐贈器官的人才能摘除其器官. 這導致了美國願意捐應器官的比例是 28%, 而法國是 99.9%.

除了道德, 作者也討論了本能. 我覺得本能的部分也講得很好. 他說人們主要的兩大本能是家族本能和部族 (社群) 本能. 家族本能連動物都有, 但是部族本能是人類獨有的. 所謂的部族就是某個團體. 人類希望自己屬於某個團體, 這樣在物競天擇之下會比較有利! 因此人們往往偏袒某個團隊的成員, 而低估團隊以外的人. 台灣人也是一個團體, 只要和台灣沾上邊的好事,社會上普遍都把它當作是台灣之光. 即使林書豪在火箭隊只是六哥, 甚至是戰力外; 報紙也會說他率領球隊打敗 XXX 隊, 無視於其他人更好的表現. 更不用說根本不關心其他和台灣沒有淵源的球隊怎麼樣了 – 我承認我就是. 這些都是我們人性的一部分.

最後一個主題是模仿. 模仿又關直覺什麼事呢? 模仿是一種速決, 因此也和直覺、捷思類似. 我們會模仿多數人、也會模仿成功人士. 但模仿能夠成立的條件在於: 

1. 相對穩定的環境結構.

2. 貧乏稀少的資訊回饋.

3. 錯誤決策的嚴重後果.

教養小孩是個很好的例子. 大部分的人都只有幾個小孩, 而且教養得對不對? 好不好? 可能得要過幾十年才能驗證. 因此我們會模仿別人的做法. 別人的小孩都補習, 家長也會覺得該補習, 不然小孩要是真的輸在起跑點怎麼辦? 宗教也是一個例子. 人生自古誰無死, 這是穩定的環境結構. 沒有死去的人回來告訴我們該怎麼做,頂多有些人有瀕死的經驗, 這屬於資訊貧乏. 據說不信神佛要下地獄, 這叫做後果嚴重. 符合這三個條件, 我們就會模仿那些有信仰、宣傳天堂地獄與死後世界的人.

綜觀這整本書, 內容真的很多, 也很發人深省. 但是結構上還是比較鬆散一點. 作者身為學者, 在書上不免提到一大堆專有名詞, 註釋也足足寫了 33 頁. 我忽然想起我也看過康德, 也聯想到牟宗三先生. 以前讀過什麼, 現在已經不復記憶! 除了 "如來藏自性清淨心" , 當初因為特別拗口所以多唸了幾遍之外, 真的全都忘了. 嗯,希望該懂的部分都內化了. 哈!