PTT推薦

[心得] 《雜訊》決策判斷的隱形缺陷和解決方法

看板book標題[心得] 《雜訊》決策判斷的隱形缺陷和解決方法作者
wackynoteis
(Waki瓦基)
時間推噓 1 推:1 噓:0 →:2

《雜訊》讀後心得:決策判斷的隱形缺陷和解決方法
諾貝爾獎得主《快思慢想》作者丹尼爾康納曼,醞釀十年的精采之作

圖文好讀 https://readingoutpost.com/noise/

人類做出判斷時的「缺陷」會造成很多不公平的對待。像是不同法官對同一個案件有截然不同的判決,不同醫師對同一個病人的診斷有很大的差異,不同面試官對同一個求職者的意見也可能南轅北轍。這些做出判斷的缺陷是怎麼來的?我們可以避免這些缺陷嗎?

這本書在說什麼?

《雜訊》的共同作者是三位知名學者,分別是諾貝爾經濟學獎得主和暢銷書《快思慢想》的作者丹尼爾.康納曼(Daniel Kahneman)、巴黎商學院的商業政策教授奧利維.席波尼(Olivier Sibony)、律師暨暢銷書《推出你的影響力》的作者凱斯.桑思汀(Cass
R. Sunstein)。在這本書裡面他們探討一個鮮為人知的現象:「人類只要做出判斷,就會有雜訊。這些雜訊比我們以為的還多」。

舉凡任何人類做出的決策和判斷,跟正確的答案之間都一定有「誤差」,也就是所謂判斷的缺陷。誤差則是由偏誤和雜訊兩者的總合。「偏誤」比較廣為人知,例如損失趨避、錨定效應和從眾效應…等;「雜訊」則不容易被人察覺,像是不同的專家對同一件事情意見分歧的程度,遠超過人們常理的預測程度。但是,雜訊卻無處不在,影響也不比偏誤小,只有使用統計學來觀察的時候能讓它現形。

這本書就是一本探討「雜訊」的專書。作者們分析造成雜訊背後的原因,以及雜訊的組成成份。我們認識雜訊之後,可以採取一些降低雜訊的方法,作者們稱這套方法叫「決策保健」,用來進一步提升我們做決策判斷時的「準確度」。這些方法將可以帶來更公平的判決、更精準的預算評估、更有效的人才招募,降低雜訊,就能夠提高我們做決策的品質。

偏誤與雜訊

書中舉了一個很簡單的例子來說明誤差、偏誤、和雜訊這三件事情的關係。你可以想像,一群人要做出判斷的時候,就像是在「打靶」,他們總是希望打中靶心。而他們真正擊中的彈痕跟靶心之間的距離,就是「誤差」。這個誤差,代表了他們的做出判斷時的缺陷。

如果把這群人分成四個隊伍,每個隊伍有五個人,同隊的人共用一支步槍,每人射出一發,最後得到下圖的四種結果。

雜訊和偏誤:https://imgur.com/D1W4KFH
圖片來源:遠見雜誌文章〈康納曼團隊破解決策盲點,「雜訊」才是防疫最大破口?〉

A隊伍,準確。射擊非常準確,全部打在靶心上。這時候,這個隊伍幾乎「沒有誤差」。

B隊伍,有偏誤。五發全部沒有射中靶心,但是五個人的落點都集中在靶紙的左下角。這時候,表示整個隊伍都有「偏誤」,一起偏向了左下方。

C隊伍,有雜訊。五發的落點都很分散,但是落點平均地分散在靶心的周圍。這時候,表示這個隊伍充滿了「雜訊」,彼此的方向非常分歧。

D隊伍,有偏誤又有雜訊。五發落點全部偏在左下角,而且非常散亂,這個時候隊伍裡面既有「偏誤」,又有「雜訊」。

在這本《雜訊》書中重於「雜訊」的討論,也就是隊伍C和D的情形。雖然雜訊和偏誤彼此是獨立的因素,但是若我們能降低雜訊,就能提升準確度。如果你對於如何降低「偏誤」有興趣,可以參考作者之一的丹尼爾.康納曼在前一本心理學大作《快思慢想》曾探討過人類「思考偏誤」的相關問題。

決策判斷的缺陷

總體誤差

這本書以統計學的方式,來描述人類的決策和判斷。舉凡我們做出的判斷有兩種。第一種是「預測性判斷」,例如一個藥品的藥效、一個選舉的結果,是有標準答案可循的判斷。第二種是「評估性判斷」,例如歌唱比賽的名次、對罪犯判刑的程度,是沒有標準答案可循的判斷。

但是,無論是哪一種判斷,我們都會希望不同的人所做出的判斷,其分歧的範圍在一定的程度之內。如果人們做出的判斷,跟實際的答案或者期望中的答案有差距的時候,這個差距就被稱為總體誤差(total error)。而造成「總體誤差」的因素就是「偏誤」和「雜訊」。

人類決策判斷的缺陷 https://imgur.com/ozlnKsm
圖片來源:閱讀前哨站

作者們以統計學的均方差(MSE: mean square error)概念來解釋誤差、偏誤和雜訊三者之間的關係。他們特別畫直角三角形來示意,是為了解釋一個非常重要的觀念:「誤差之間不會彼此抵消」。就像是一個保險業承保項目的估價,估價太高,客戶會跑掉;估價太低,公司會虧錢。因此誤差不論是正、是負,取平方之後就造成了更大的誤差。這些誤差就是我們最不樂見的。

偏誤:明顯的缺陷

「偏誤」(bias)指的是人們「偏向同一個方向的平均誤差」,也是心理學上面最廣為人知的研究領域。例如「規劃謬誤」偏誤,就是指人們總是低估完成一件事情所需要的時間,像是經理人總是低估專案完成的時間。「從眾效應」偏誤,就是指人們傾向相信很多人相信的事,像是董事會討論一個併購案的時候,董事們會被比較多數人相信的事影響了最後的決定。從事後諸葛的角度,偏誤很明顯可以用因果的方式來解釋。

雜訊:隱形的缺陷

「雜訊」(noise)指的是人們「彼此判斷的方向不同、意見分歧的程度」,但只有從統計學的角度才看得到雜訊。像是一般的專業人士,例如經驗資深的保險核保人員,往往對自己的判斷很有信心,也不會去質疑同事的判斷跟自己有很大的差異。但是一旦把統計的資料攤在桌上,才會發現這些判斷的差異不但很大,甚至常常有不同的專業人士對同一件事情有完全相反的判斷。

|在因果關係裡,雜訊不見蹤跡;在統計世界裡,雜訊無所不在。

水準雜訊

雜訊的第一個組成是「水準雜訊」(level),指的是「不同個體平均判斷的差異」,像是有些法官比較嚴厲,判刑平均都會判比較重;有些法官比較寬容,判刑平均就比較輕。或者有些股票分析師就是傾向看壞市場,有些分析師則傾向看好市場。

穩定型態雜訊

雜訊的第二個組成是「穩定型態雜訊」(pattern),指的是「判斷者個人的獨特性」,像是某一位法官對竊案的判刑都很嚴厲,但是他對交通違規的判刑就很寬容。這種穩定型態不會隨時間改變,代表了同一個判斷者他本身的獨特性,在面對不同類型的案例時,他所表現出來的差異。

場合雜訊
雜訊的第三個組成是「場合雜訊」(occasion),指的是「跟案例不相干的暫時成分」,就像是一位醫師在不同日子(天氣、心情)對於同一個診療案件的診斷不同。或者是某一位法官他支持的球隊昨天獲勝了,所以今天的判刑變得比較寬容。這種雜訊會隨著時間和場合改變。

|人們認為自己在做判斷時,展現出思考的複雜性,並增添細微的考量。但這種複雜性和|微妙性只會弄巧成拙,不會提高簡單模型的準確性。

降低雜訊的方法

作者們說:「以總體誤差而言,雜訊和偏誤是互相獨立的。不管偏誤有多少,減少雜訊的好處都是一樣的。」所以在書中,他們提出了一套叫做「決策保健」的六個步驟,讓我們可以降低雜訊。這個方法就像洗手一樣,你雖然不容易察覺你避免了什麼細菌(雜訊),但是等到你被細菌感染之後(造成誤差)才求醫治療就已經太遲。降低雜訊的方法就跟衛生保健一樣,預防勝於治療。

判斷的目標是準確,而非個人特質的表現。為了避免穩定型態雜訊,讓不同的專業人士對同一件事情有相近的判斷,我們可以把要判斷的程度先定義清楚,而不是給一張空白畫布讓人隨意發揮。最激進的做法是利用電腦演算法,以規則來代替判斷,但這個做法的接受度普遍還不高。

要有統計思維,用外部觀點來看待案件。把我們要判斷的事情,當成是一群類似案件裡面的其中一個案件,而非每次都把案件當作全新的事件。當我們引入外部的數值,例如評估一個執行長的留任期間長短,就要先看業界平均期間是多少,再對目前的判斷做出調整。

將判斷結構化,拆解成幾個部分。因為當不同的人看到不同的條件,都會在心裡編織起自己的故事。就像是不同的面試官可能會給同一個面試者截然不同的評價。這個方式可以打破人們過度追求連貫性的心理機制,在過程中針對各個獨立的特質進行評分,而不是等到一連串的評估結束後才一口氣評分做判斷。

抗拒太早出現的直覺。如果我們在第一時間就用直覺來判斷事情,那麼後續我們找的資料跟佐證,很可能都只是為了證明我們自己的觀點,落入了對自己過度自信的幻覺。好的做法是延續上一步,把各自獨立的評估都進行完成之後,然後才使用直覺進行最終判斷。

從多位判斷者取得獨立判斷,然後考慮將這些判斷總合起來。作者們透過許多實驗說明,將獨立的判斷加以平均,可以保證系統雜訊減少。因為不同的判斷者各自的技能和觀點會互補,增加資料的樣本數可以提高準確性,例如 Google 在招募人才就會參考四位面試者的判斷。

偏向相對判斷與相對尺度。人類在絕對值上面的判斷,都有各自截然不同的解讀。例如我們要替一個團隊打績效,不同的主管給每個員工的絕對分數,差異一定很大。但如果改成用排序的方式,不同的主管給出的排序反而都非常相近。採取案例量表來做判斷,會比給絕對分數來得好。

綜觀這些方法,我發現跟職場當中一個非常實用的工具「基準比較」(benchmark)有很強烈的呼應。具體的用法我會在這本書的 Podcast 說書節目的尾聲跟大家詳細分享。

後記:降低影響公平的雜訊

《雜訊》是一本帶給我很多新穎觀念的書,最有趣的就是凸顯了我們常常難以察覺、看似隱形的雜訊。這本書除了用統計學去說明這個理論之外,也提供了很多法學界、醫界、教育界、法醫鑑識、職場招募方面的案例,並且提供了一套我們可以應用的方法,來讓我們降低雜訊,提高做決策的品質。

值得一提的是,這本書打破了我認為只要看「平均值」就好的舊觀念,當雜訊會對判斷的結果造成極端的影響,就代表了某個人被「不公平對待」了。而這種不公平對待,該檢討的不是個人,而是個人所身處的「系統」。

如同作者們對於偏誤和雜訊的解讀,兩者之間的差異在於:「偏誤是一個人對件事常有的各種偏見,犯錯是在個人;而雜訊卻是錯在系統,系統沒有調控機制,導致一群專家,會針對同一件事,做出截然不同的判斷。」我們只有正視雜訊的存在,致力於改善系統,才能朝向一個決策更正確、更公平、更健康的社會。

--
書評部落格「閱讀前哨站」 https://readingoutpost.com/|一個愛書人的閱讀筆記
Podcast「下一本讀什麼?」 https://readingoutpost.com/podcast/|我的說書頻道

--

※ PTT留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 114.34.226.252 (臺灣)
PTT 網址

Doralice11/09 10:13去年的「打開演算法黑箱」對於人類缺陷與如何用演應用

Doralice11/09 10:13算法協作的優缺點描述更為全面,採用的例證也比本書更廣

Doralice11/09 10:13泛有趣。 goodreads的低分相當合理