預測分析時代:讓數據告訴你,誰會買、誰說謊、誰會離職、誰會死!
cover
目錄

推薦序 大多數天鵝是白的

作者序 預測分析究竟在做什麼?

前言 預測效應

預測人類行為,如何讓我們對付風險、強化健保制度、提高打擊犯罪的效益,並讓銷售額激增?為什麼企業要做好預測,就要肯學?差勁的預測怎麼會變得寶貴無比?組織為什麼要預測你什麼時候會死?

Chapter 1 起而行吧!要預測就要採取行動

要將預測模型實際應用需要多少膽識?這樣做有什麼好處?推動預測分析,表示要依據預測採取行動,把從資料中學到和發現的事情實際應用。許多組織都如此大膽躍進——畢竟,不做,就永遠不可能成功。

Chapter 2 權力越強,責任越大──惠普科技、塔吉特百貨和警方如何推斷你的祕密

我們如何在不侵犯隱私的情況下善用預測機器,預先得知誰會辭職、誰會懷孕和誰會犯罪?公民自由出現危機了嗎?為什麼某家知名壽險公司要預測保戶的壽命?利用電腦偵測詐騙,機器智能如何在它的腦袋裡解讀「詐騙」這個詞的意思? 

Chapter 3 資料效應──資料多不見得有用

我們忙著處理多到數不清的資料,但是這麼多原始資料能告訴我們多少寶貴資訊?我們真的能利用這些原始資料做預測嗎?現有資料可以揭露平民百姓的集體情緒嗎?如果可以,我們在網路上發洩情緒的聊天話題,跟景氣好壞有什麼關係?

Chapter 4 有學習能力的機器──大通銀行如何預測房貸風險

哪種風險型態最不容易被察覺到?預測如何將風險轉變成機會?為何各行各業都必須向保險公司學習?我們如何放心信任機器的預測?為什麼預測無法避免全球金融危機?

Chapter 5 集成效應──奈飛公司、群眾外包和速效預測

把預測分析委由群眾外包──外包給一般大眾──企業把本身的策略、資料和研究發現公諸於世。這種做法怎麼可能協助企業跟同業競爭?預測分析的哪項創新關鍵是透過群眾外包的協助而開發出來的?集成模型預測的精準度一定會複雜到讓人難以招架嗎?或是有巧妙的解決方法可循?非人類群體也有智慧可言嗎?

Chapter 6 IBM電腦華生挑戰益智問答節目

挑戰益智問答節目《危險邊緣》的IBM超級電腦華生,究竟是怎樣運作的?為什麼這部超級電腦需要預測模型才能回答問題?讓這部超級電腦有如此超高績效的祕訣是什麼?拿iPhone的Siri跟其相比如何?為什麼對電腦來說,人類語言是如此艱鉅的挑戰?人工智慧有發展的可能嗎?

Chapter 7 數字最具說服力──歐巴馬選戰如何精心設計,創造影響力

為什麼有些行銷活動讓顧客反感至極?美國總統大選證明數字最具說服力,所有企業該從總統選戰中學到什麼?投票率預測如何在2012年總統大選幫助歐巴馬連任?怎樣能減少醫療事故,讓醫生不會不小心害死病患?謎語:有些狀況經常發生在你身上,但你無法察覺到,甚至事後都不確定它們是否發生過,想想看那些狀況可以事先預測嗎?

後記

預測2020年第一個上班日,這十件事情已然成真……

附錄

A. 預測的五大效應

B. 預測分析的二十一個應用

C. 預測人物群像

謝辭

預測分析147個實例

試閱內容

前言 預測效應——千金難買早知道

預測人類行為,如何增進我們對付風險、強化健保制度、提高打擊犯罪的能耐,並讓銷售額激增?差勁的預測怎麼會變得珍稀無比?組織為什麼要預測你什麼時候會死?

我跟大家一樣,做事有時成功、有時失敗,運氣也時好時壞。我們心裡總會納悶,要是當初早知道,結果或許就會不一樣。我就拿自己發生的六個不幸遭遇當成開場白:

1. 2009年時,我在猶他州滑雪時不小心弄傷右膝蓋,我在做跳躍動作時沒問題,但是著地時出了狀況。要進行膝蓋手術,我必須先挑選移植物,重建我受傷的前十字韌帶。但是,這真是一個棘手選擇,可能對我日後生活產生極大的影響,畢竟人要靠腳走路,膝蓋好不好很重要。後來我決定用腿後肌腱群自體移植的方式。現在回想起來,我不禁好奇:以我這種情況來說,當初醫院可以幫我選擇更好的醫療方式嗎?

2. 儘管我要承受身體的疼痛,但是花大錢的卻是我的醫療保險公司,膝蓋手術費用昂貴。當初保險公司是否能更準確預測保戶可能滑雪受傷,並且一開始就依此調高保費?

3. 早在1995年時,我碰過一次衰事,只是那次損失沒那麼重。我遭人盜用身分,害我花了幾十個小時處理繁文縟節,挽救我受損的信用評等。當初債權人是否能在別人一開始冒用我的身分、動用我的帳戶時就察覺出來,進而避免這種失誤?

4. 隨著信用評等恢復,我最近申請房貸買了一間公寓。這樣做是明智之舉嗎?或者我的理財顧問應該提醒我,房價可能很快就會跌破貸款金額?

5. 我的職業生涯也受到影響。我的事業發展得很好,但是公司面臨景氣變動和競爭日趨激烈的風險。我們是否能預測哪些行銷活動和其他投資可以賺錢、哪些會虧本,來保護企業純益?

6. 每個人每天都會因為生活上的小小變化受到影響,我也不例外。所以,如果能準確過濾廣告郵件,對每小時的工作就能產生有利的效益。現在,我們在工作、健康(例如:想知道膝蓋手術的選項)、居家修繕和其他大小事情,都相當仰賴有效的網路搜尋。我們相信Pandora音樂電台和奈飛公司(Netflix)會針對我們個人喜好,做出專屬的音樂及影片推薦。經過這麼多年,我開始懷疑垃圾郵件的數量為什麼大幅減少,那些跟我不太熟的公司為什麼沒再寄那麼多垃圾郵件給我(很多樹木也因此得以倖存)。

這些問題都很重要,它們可能影響到你的日常生活好幾年或甚至一輩子。但是,這些問題有什麼共同點呢?

我們在生活中遇到的這些問題跟許多類似的挑戰,其實都能利用預測得到最妥善的處理。病患能從手術得到滿意的結果嗎?信用申請人會不會是騙子?屋主會面臨房價暴跌,沒錢繳房貸的財務困境嗎?郵寄商品目錄,顧客會有回應嗎?藉由預測這些事,就可以強化醫療保健、降低風險、減少廣告郵件、嚴格打擊犯罪、還能節省成本。

大企業的預測技術——預知個人資產的命運與價值

我們還可以從另一個觀點看待預測。預測除了讓身為消費者的我們受惠,也為組織效力,讓組織具備一項嶄新的競爭利器。現在,聰明的企業都緊抓著這項利器不放,希望透過預測提高獲利。

1990年代中期,史坦伯格(Dan Steinberg)這位具有企業家精神的科學家,就大膽向當時美國第一大銀行大通銀行(Chase)建言,要大通銀行利用他開發的預測技術管理幾百萬件房貸。這家大企業相信史坦伯格,於是運用他的技術處理龐大房貸投資組合的交易決定。這傢伙究竟有什麼來歷,讓美國第一大銀行信服?答案就是:他是預測專家。

預測就是力量。大企業藉由預測個人資產未來的命運和價值,掌握一項殺手級的競爭優勢。以這個例子來說,預測屋主日後的付款行為,依此作為房貸核可決定的依據,就讓大通銀行降低風險並提高獲利,一年內就賺進九位數的可觀獲利。

有超凡洞察力的電腦登場

後來,預測技術就逐漸壯大並成為主流,預測技術成為大家司空見慣的事,也影響我們每個人的日常生活。預測技術以你無法察覺的方式,影響你的日常體驗,當你在開車、購物、念書、投票、看病、溝通、看電視、賺錢或借錢時,預測技術都牽涉其中,就連你會不會偷東西,也是預測技術想要了解的事情之一。

這本書講的是電腦預測最有影響力也最有價值的成就,電腦預測能如此成功的兩大原因是:靠預測專家的智慧,加上預測仰賴的迷人科學。

進行這類預測要面臨相當艱鉅的挑戰,每項預測都會受到許多因素所影響,包括:每位病患、屋主和每封廣告郵件的特質都不一樣。那麼進行每項預測時,我們該如何利用資料拼湊出全貌、著手解決錯綜複雜的問題呢?

構想很簡單,但做起來卻不容易。幸好,這項挑戰可以藉由一種系統化的科學方式來解決,我們發展預測並持續改善預測,也就是學習怎麼預測。

解決方案就是機器學習(machine learning)——只要把現代社會最重要也最有影響力的非自然資源——「資料」,當成食物那樣餵飽電腦,讓電腦自動開發出新的知識和能力。

(中略)

預測的限制與潛力

經濟學家是明日才知道自己昨日預測的事為何沒發生的專家。

——艾爾.威爾森(Earl Wilson)

美國專欄作家

為什麼我們從沒看過「靈媒中樂透」這種頭條新聞?

——傑.雷諾(Jay Leno)

美國脫口秀名嘴

先前介紹的每一項佳績都是利用預測達成的,也都是機器學習的產物。這種能力跟科幻小說的驚人差異就是:這些能力都不是虛構的,全都千真萬確。現在,我預測你聽到接下來這句話並不會感到訝異:這些例子只是預測實例的一小部分。你可以大膽預測,預測的力量將被廣為接受。

但是,這樣講會太大膽嗎?如同丹麥物理學家波爾(Niels Bohr)所說:「預測很難,預測未來更是難上加難。」預測究竟有沒有可能?未來不可知,我們唯一能確定的是,未來充滿不確定性。

讓我說清楚一點,預測本來就模糊不清,準確地預測通常是不可能發生的事。就拿氣象預測來說,準確率也只有50%,至於預測人類行為,不管預測對象是病人、顧客或罪犯,都不可能比預測氣象要來得容易。

幸好,預測不必很準確就能產生重大價值。舉例來說,預測技術在商業上的直接應用之一就是,協助企業決定寄發郵購目錄的目標顧客群。如果機器從學習過程中,小心找出對郵購目錄的好感比一般顧客高出3倍的特定顧客群,那麼企業就可以把那些對郵購目錄興趣缺缺的顧客先排除在郵寄名單外。這樣就足以讓企業獲利,也讓對郵購沒興趣的顧客因此受惠,可以少收到一些垃圾郵件、少一點麻煩。

用這種做法,企業早就在進行大眾行銷時玩起某種數字遊戲,小心翼翼並精打細算,希望收支平衡還能提高獲利,而且不需要準確度很高的預測就能做到這點。事實上,預測的效用之大,就算準確率很差也沒關係。如果整體行銷活動獲得的顧客反應是1%,其中熱門商品獲得的顧客反應是3%。那麼,以這個例子來說,我們無法打包票哪些個別顧客會有反應。不過,預測的真正價值在於,找出一群人的集體特定行為傾向。

我用「預測效應」來概括說明這種情況。就算預測不準確,但是預測總比臆測來得好,也真正有價值可言。當我們隱約可以看到未來會發生的事,總比眼前一片黑暗,不知前景如何要好得多。

預測效應:小預測,大妙用。

我在這本書裡會介紹預測的五大效應,你或許聽過蝴蝶效應(Butterfly Effect)、都卜勒效應(Doppler Effect)和安慰劑效應(Placebo Effect),這些效應都包含科學與技術的有趣部分:原本人們認為違反常理的現象,卻揭發出事物真正運作的方式和原因。

(中略)

組織學習

在網路時代呼風喚雨的組織包括Google和亞馬遜網站。這些公司的經營模式都仰賴以機器學習為主的預測模型。

——凡桑特.達爾(Vasant Dhar)

紐約大學史登商學院教授

組織是由個人組成,組織可說是「個人的超大版本」,個人要學習,組織不就該「大量學習」?不管是企業、政府、醫院、大學或慈善機構,人們為了團體成員的共同利益而聚在一起,就形成組織。組織因為分工、互補技能和大量生產的效率而受益,充分發揮團結就是力量的精神。

組織為了進一步利用團隊的力量,接下來就該採取這項明智之舉:集體學習。就像業務員長期跟著業務主管學習怎樣跟顧客互動,從主管的交易成敗中學到經驗,預測分析則是組織從本身成員和電腦系統集體的經驗中學習的一種過程。事實上,不懂得以這種方式利用資料的組織,就像有過目不忘能力的人卻懶得思考,白白浪費本身的寶貴資源。

我們發現組織採用預測分析,反而比個人受惠更多,而且例外情況少之又少。組織要針對運作做出許多決定,有很多機會可以進行改善。組織本質上就沒有效率也浪費資源,行銷活動花大錢四處撒網,垃圾信件花大錢又不環保,砍那麼多樹印沒人看的商品型錄。電子郵件也一樣,據估計有80%的電子郵件是廣告信。銀行做的可笑事則是,讓付不出錢的債務人取得過高的信用額度。政府呢?把申請政府津貼的案件堆積如山,處理進度一延再延。事實上,組織握有資料可以進行預測,這些作業都能加以改善。

企業凡事講究獲利,你可以想像企業提供各種誘因,讓日常作業變得更有效率,行銷活動更精準地打動目標顧客群,逮到更多詐騙情事,避免更多壞帳,吸引更多網路顧客。預測分析就能在這方面派上用場,協助企業將原本的運作方式升級,擴大規模經濟,將運作最適化以發揮最大的影響力。

商品簡介

Amazon 商業分類 No.1

在數據為王的時代裡,

每個人從出生到死亡的一舉一動,

都受到預測。

過去,資料的分析探勘運用,頂多是讓你可以回首來時路,告訴你去過哪裡;

現在,透過預測分析則是前瞻的,告訴你該往哪裡走,這是一個美麗新世界、新創企業的寶藏。──富比士雜誌

預測分析已然展開......現在你一定要知道,為何廣告商與雇主對你瞭若指掌。──CNN財經

在預測分析時代,利用蒐羅的資訊,可以有效提昇決策品質,達到「共好」……

但也可能觸發全民公敵的疑慮。──英國金融時報

原來如此,廠商是這樣得知我們的秘密。──紐約時報

我們在網路上發洩情緒的聊天話題,跟景氣好壞有什麼關係?

行銷活動讓顧客反感至極,該怎麼處理?

科技公司為何要預測員工是否會離職?

歐巴馬競選團隊如何利用預測分析,拉攏搖擺選民?

真正權力來自於掌握未來,企業正運用預測技術掌握未來、影響你的日常體驗。包括賣場給的折扣、臉書的朋友推薦、交友網站的智慧配對、服飾的流行款式、信用卡遲繳、是否懷孕、是否會離職……這些全部都能預測。但企業組織如何得知你的祕密?又如何運用這些資料?

艾瑞克.席格曾任教於哥倫比亞大學,亦是預測分析世界大會創辦人。他囊括各種領域經驗來說明預測分析的概念,提供多項案例,從企業預測的動機、如何收集民間資料、運作到結果應用逐一剖析。同時也探討企業在個資管理及運用所面臨的道德問題與挑戰。

席格點出,預測分析的目的是讓預測結果改變決策品質。小預測會有大妙用,許多企業組織靠著小預測,成功改善服務品質、增加成效,同時省下成本:

精準預測?其實,你只需比對手快一步、準一點──

直銷業者藉由預測顧客反應,寄送目錄。一百萬份的顧客名單中,他們找出回應率比一般高

3%的顧客,針對他們寄送目錄,雖然行銷對象少了四分之一,卻節省了四分之三的成本。

你是不是覺得網路上的廣告,越來越對味兒了──

透過收集消費者在網上點擊、搜尋的關鍵字資料,網路業者再精心搭配所需的廣告,讓瀏覽者點擊廣告訊息的機會大增。

讓風險變機會,銀行獲利增加US$6億的祕密──

借款人提早還清房貸,會讓銀行利息收益減少;延遲繳款更對銀行不利。兩種情況對銀行來說都是風險。因此大通銀行透過預測分析,正確找出74%這類房貸個案,及早因應是否將房貸案件轉賣給其他銀行。因為這項專案成功,大通銀行身價爆增。

顧客折價卷用得多,賣場就賺得多──

你在商店結帳櫃台會拿到什麼折價券,都經過業者精算。全球第三大零售業者特易購,從消費紀錄預測顧客會使用哪些折價券,藉此決定分店1億多張折價券的內容,使折價券兌換率增加3.6%。

超越搖擺選民,贏得選戰──

歐巴馬競選團隊透過預測分析,找出哪些選民比較容易說服、哪些選民對競選活動反感。他們集中分析幾百萬名搖擺選民,找出誰適合接洽、拜票。事實證明這種做法比傳統搶攻特定族群的效果更好,成功說服更多選民支持歐巴馬。

別胡亂攪動一池春水,好客戶可能因此跑了──

電信業者通知顧客續約,可能造成反效果,變成提醒顧客可以換別家業者。挪威電信因此預測顧客的反應,找出有怨言的顧客並小心避開,以免一接到通知就解約。或是向有機會說服的顧客提供優惠宣傳,讓顧客流失率降低36%、宣傳活動投資報酬率增加11倍、宣傳活動成本減少40%。

時間永遠不夠?轉向目標學習,提高學習成效──

學校來說,透過分析考試結果,調整教學時間配置與方式;學生也可透過分析預測策略調整複習、作業練習的時間。

預防重於治療──

利用預測分析技術,及早警告潛在病患罹患糖尿病、心血管疾病、氣喘等慢性病的機率,有效降低公共醫療開支。

現在起,勝負的關鍵就在於預測分析的能力。預測分析就是商業智慧發展的方向。遊戲規則早已改變,而你身在其中。閱讀本書,可以讓我們了解世界進步到哪,還會往哪個方向邁進。

作者簡介

艾瑞克.席格 博士Eric Siegel

曾任哥倫比亞大學教授,為預測分析世界大會(Predictive Analytics World)及文本分析世界大會(Text Analytics World)創辦人,亦為《預測分析時報》(Predictive Analytics Times)執行編輯。席格讓預測分析變得容易理解也令人著迷,他擔任教授時,就以寓教於樂的方式授課。現為知名演說家、教育家及預測分析領域的翹楚。

譯者簡介

陳琇玲 Joyce Chen

美國密蘇里大學工管碩士,曾任嶺東科技大學講師、行政院國科會助理研究員、Alcatel Telecom主任稽核師。榮獲100年全國模範勞工,現專事翻譯,重要譯作包括:《歐巴馬勇往直前》、《2010大崩壞》、《富爸爸財務IQ》、《全球經濟12大指標》、《贏家:教你摸透詭譎市場的投資心理學》、《逆危機:A咖不會做的蠢事,破除企業8大潛藏障礙的12項法則》。

作者自序

預測分析究竟在做什麼?

昨日已逝,明日是謎,珍惜當下,盡力而為。

每當我跟別人說我做哪一行時,對方總會用奇怪的表情看著我。這就是從事預測這一行會遭遇的職業傷害。

資訊時代因為一項明顯疏漏而蒙受其害。這樣講可能會讓許多人跌破眼鏡,我們現在主動地記錄世上發生的每件事,那還會有什麼事被我們漏掉?以前人們撰寫史書記載重要事件,現在科技進步,利用電腦系統就能保存個人的每次點擊項目、付款記錄、通話清單、破產資料、犯罪記錄和病歷。有了這些資料,你認為熱愛數據者就算沒被寵壞,也應該感到滿足。

但是在這浩瀚無垠的資訊裡,卻沒有包括一項最寶貴的資訊,那就是:還沒有發生的事。

大家都渴望獲得預見未來的能力,我們都對預測相當著迷。我們膜拜號稱有預測能力的女神,我們花大錢去算命,我們注意星座運勢也喜歡占星學,就連吃飯時也不忘來片幸運餅乾,看看籤詩的運勢預測。

但是,許多熱中靈媒和算命的人卻唾棄科學。講到科學,他們的本能反應就是:「討厭!」科學不是太難懂,就是太無趣。許多人甚至相信,就本質來說,如果沒有超自然能力的支援,根本不可能做任何預測。

我喜歡的喜劇影集《靈異妙探》就是以此為主題,主角是觀察力過人的偵探——堪稱是當代講究數據的福爾摩斯。他觀察入微,甚至讓警方誤以為他能如此準確地推論,是因為他涉案。這位英雄為了讓自己脫困,不得不順應常理:他告訴警方,他是靈媒,警方才放過他,請他繼續協助打擊犯罪。劇情就這樣發展下去。

我自己也有過類似的經歷,有時朋友問我是什麼星座,我沒有假裝自己相信占星術,而是幽默地回答:「我是天蠍座,天蠍座的人不相信占星術。」

在朋友聚會時,我常被人問起是從事哪一行。這時我會兩眼呆滯、鼓起勇氣,小心地說:「預測分析。」大多數人都很幸運,能用簡短一句話描述自己的工作,比方說:醫生、律師、服務生、會計師或演員。但是對我來說,每次要描述這個大多數人都不知道的領域,實在太煞風景。我越想簡短回答,對話就變得越平淡無趣:

「我是技術類企管顧問。」人們還是繼續追問:「哪種技術?」

「我讓電腦預測人們會做什麼。」大家聽了滿臉困惑,根本不相信我說的話,還面露難色。

「我讓電腦從資料中學習,以便預測人類的行為。」大家聽了一頭霧水,沒人會想在聚會中聊數據資料。

「我分析資料找出模式。」大家聽了眼神更加呆滯,開始心不在焉,我這樣回答讓大家都很難接上話,也讓場面變得很尷尬。

「我協助行銷人員找出會購買或取消訂單的顧客。」大家似乎有點明白我的意思,但是這樣講根本是矮化和局限預測分析這個領域。

「我預測顧客行為,就像塔吉特百貨(Target)預測顧客是否懷孕那樣。」接著,大家就開始挪動腳步,沒人想搭理我。

所以,我寫這本書告訴大家,預測分析究竟在做什麼,這種預測方法為何符合直覺,不但效力強大還讓人歎為觀止。

我要跟大家報告這個好消息:小預測可以做大妙用。我把這種現象稱為預測效應,這也是從頭至尾貫穿本書的一項主題。預測的效力相當顯著,畢竟預測比臆測來得準確。這種效應讓預測分析變得可信,我們不必做一些不可能做到的事,也不必具有超凡的洞察力。這本書的內容既令人興奮又值得信賴:預測未來,讓原本像薄霧籠罩的模糊未來,開始變得清晰些,這樣做確實有利可圖。預測分析就是用這種方式,對抗金融風險,強化健保制度,減少垃圾郵件,提高打擊犯罪的效益,並協助企業讓銷售額激增。

你有科學家或企業家的精神嗎?讓你興奮的是預測這個構想,或是預測能為世界堅守的價值?

了解不可知的未來這個概念吸引著我。預測似乎蔑視這項自然法則:你無法預見未來,因為未來還沒發生。但是我們找到一個應變對策,我們設計能從經驗中學習的機器。這種嚴格控制的學科是利用我們確實知道的事(以資料形式顯示),更準確地預測接下來會發生的事。我們將最頂尖的數學方法和技術結合在一起,有系統地調整修正,直到我們設計出一套讓自己滿意的系統,看透以往擋在現在與未來之間、讓人捉摸不透的層層阻礙。

預測專家每天討論著,要大膽邁向「未來」這個沒人到過的地方!

人各有所長,有些人做業務,有些人從政,我鑽研預測分析,這工作實在棒極了。

名人推薦

這是關於商業、政府機構及醫療照護的《魔球》。

──吉姆.史戴(Jim Sterne),

數碼分析協會主席

此書深入探討預測分析技術在商業上的各個領域,具批判性的眼光又兼顧實用性,閱讀起來充滿樂趣。

──傑弗里.摩爾(Geoffrey Moore),

矽谷教父、高科技策略大師

能增廣見聞、充滿娛樂性且細緻入微。席格跳脫媒體炒作,讓科學變得更有意思。

──雷依德.加尼(Rayid Ghani),

2012美國總統歐巴馬競選團隊首席數據分析師

《精準預測》作者席佛在撲克牌及政治上的運用之外,《預測分析時代》囊括其他所有方面。這是一本全面談論預測分析的好書,非科技宅也能輕鬆閱讀。

──大衛.林韋柏(David Leinweber),

《華爾街狂人》(Nerds on Wallstreet: Math, Machines and Wired Markets)作者

這是一本21世紀生活的使用說明書,指出預測分析幾乎是所有事物的核心,無論是在科學界、商業界、運動界,或者政治界。艾瑞克.席格是非常理想的嚮導。

──史蒂芬.貝克(Stephen Baker),

美國《商業週刊》作家、《當我們變成一堆數字》作者

大多數天鵝是白的

這本書探討以量化資料預測人類行為,在各方面得到的應用成果。其實,早在二次大戰時,美軍就率先利用這種預測分析。1940年時,「模控學」(cybernetics)之父維納(Norbert Wiener)開始嘗試預測德國軍機的行蹤,目標是擊落德國軍機。他的方法是利用先前觀察取得的軍機移動資料,預測軍機可能的飛行路徑,考慮飛行員最可能採取的閃避方式,預測軍機接下來可能移動的位置,這樣就能把軍機擊落。可惜,維納只能預測軍機下一秒的動作,但是要擊落軍機,卻需要預測二十秒內的飛行路徑。

不過,在席格這本書裡,你會知道許多預測工作其實相當成功。畢竟,從維納那個時代以來,電腦的處理速度突飛猛進,我們能收集的資料也越來越多。因此,銀行、零售業者、選戰活動、醫生和醫院、以及許多組織最近在預測特定人群行為時,全都獲得豐碩的成果。他們對預測分析投入心力,協助自己贏得顧客青睞、打贏選戰並戰勝疾病。

依我所見(我想席格也這麼認為),整體來說,預測分析對人類是有利的。從健保、犯罪和恐怖主義這些方面來說,預測分析可以拯救性命;對廣告業來說,利用預測既能提高效率,也能落實環保(減少寄送直銷郵件和型錄的數量),同時不會浪費收件者的寶貴時間和關注心力。而對政界來說,重視這種科學方法的候選人,似乎都能在選戰中成為贏家(或許有些人不認同這種說法,但我認為預測分析確實對打贏選戰有幫助)。

不過,就像席格在這本書裡開宗明義地指出,這些方法也可能用在一些不好的地方。席格對此坦率直言,讓我十分欽佩,他引述電影《蜘蛛人》中的一句台詞:「權力越強,責任越大。」換言之,身為社會的一分子,我們在使用預測模型時必須審慎小心,在應用方面有些禁忌要列入考量,不能為了一己之私就犧牲他人的權益。跟其他強效技術或破壞性創新一樣,預測分析基本上跟道德無關,能用來為善,也能用來作惡。不過,為了避免預測分析被拿來做壞事,了解這個方法究竟能做什麼,當然再重要不過。如果繼續看下去,你就會知道預測分析的效力有多強大。

這本書的探討重點就是預測分析,預測分析不但是一種分析類型,也是最有趣、最重要的分析類型。我不認為我們需要更多只講敘述性分析(descriptive analytics)的書籍,因為那種分析只描述過去,沒有針對事件起因提出任何見解。我常把自己的論述比喻成第三種分析,也就是規範分析(prescriptive analytics),這種分析告訴使用者,透過控制實驗或最適化要做什麼。不過,這類量化方法不像預測分析這樣廣受採用。

這本書及其所依據的構想跟塔雷伯(Nassim Nicholas Taleb)的研究,剛好形成很好的對比。塔雷伯在《黑天鵝效應》和其他著作中提出的論點是,由於隨機性和複雜事件本身的不可預測性,讓人們為預測所做的努力注定徒勞無功。塔雷伯說得沒錯,有些事件是無法預測的黑天鵝;但事實上,大多數人類行為都有跡可尋,既固定又可以預測。席格在這本書裡提出許多成功預測的實例,都提醒我們這項事實——大多數天鵝是白的。

席格也抗拒目前對「大數據」風潮的推崇,雖然他在書中提及的一些實例確實屬於這一類,也就是資料龐大又缺乏結構,很難用傳統那種關係資料庫加以管理。但是,預測分析的重點不是資料數量大小或控制難易程度,重點是拿資料來做什麼用途。我自己就發現「大數據通常用途少」,許多實際拿大數據做分析的人,只是拿數據設計一些引人注目的視覺分析,這樣做他們就很滿意了。相較之下,這樣做當然不像設計預測模型那樣有價值。

席格這本書以深入淺出的方式,敘述預測分析的重要,讓一般讀者都能看懂這項複雜高深的技術。書中不但穿插有趣的故事和圖解,還以生動的文筆,讓一般讀者能輕鬆閱讀。就算數學讓你很傷腦筋,你也該看看這本好書,因為在這個數據為王的時代裡,每個人(包括你在內)從出生到死亡的一舉一動,都受到預測。而且很可能的情況是,大多數人在職場上會更加需要考慮預測模型,或用預測模型進行評估,並依據預測模型的結果採取行動。

簡單講,我們生活在凡事講究預測的社會裡,要在這種社會出人頭地的上策就是,了解預測模型的目標、技術和限制。而且,要做到這一點的速效方式很簡單,那就是趕快把這本書好好看完。

湯瑪斯.戴文波特(Thomas H. Davenport)

哈佛大學商學院訪問教授

國際分析學院(International Institute for Analytics)共同創辦人

預測分析時代:讓數據告訴你,誰會買、誰說謊、誰會離職、誰會死!
作者:艾瑞克.席格(Eric Siegel)
譯者:陳琇玲
出版社:大牌出版
出版日期:2014-04-02
ISBN:9789865797157
定價:480元
特價:88折  422
其他版本:二手書 22 折, 106 元起