
閑談世界杯預(yù)測
人類一思考,,上帝就發(fā)笑,;世界杯一來到,上帝笑得血壓也升高,。倒不是足球踢得多歡樂,,而是世界杯預(yù)測太惡搞。
我略微總結(jié)了下,,剔除掉貝利這種聲名卓著的反向指標(biāo),,煞有其事的世界杯預(yù)測大致可以分為五類:
一是實力決定論,以高盛和德銀等投行為代表,,將FIFA排名,、過往戰(zhàn)績、近期表現(xiàn),、球員身價,、賭球賠率、國家經(jīng)濟等一系列數(shù)據(jù)綜合反映出的球隊實力作為預(yù)測依據(jù),,用計量模型計算出看上去精確至極的概率,,只不過,計算結(jié)果有較大差異,,比如,,高盛預(yù)測巴西奪冠,德銀則更看好英格蘭。
二是條件決定論,,以霍金教授為代表,,將各種客觀條件對某一球隊的表現(xiàn)影響揉到一個獲勝公式里,這些條件包括球場選擇,、裁判國籍,、球衣選擇、陣型選擇和交通工具選擇等,,只不過,,這種公式的預(yù)測有效時段很短,所以在決賽還離得遠的現(xiàn)在,,公式還預(yù)測不出最后的冠軍歸屬,。
三是流言決定論,以雅虎和微軟[微博]Bing為代表,,將以億為單位的網(wǎng)絡(luò)噪音轉(zhuǎn)化為清晰的結(jié)果信號,。雖然這種互聯(lián)網(wǎng)魔術(shù)看上去既科學(xué)又玄妙,甚至可以從經(jīng)濟學(xué)的“預(yù)期自我實現(xiàn)”理論得以解釋,,但總讓人聯(lián)想到古時候無論中國還是西方,,帝王對童謠和吟游詩人作品的格外關(guān)注。
四是宿命歸屬論,,以一則關(guān)于1966和2014年的時空重疊熱帖為代表,,1966年,歐冠冠軍是皇家馬德里,,西甲冠軍是馬德里競技,,西乙冠軍是拉科魯尼亞,意甲冠軍是尤文圖斯,,皇家貝蒂斯降級西乙,,2014年無一例外都是如此。“yesterdayonce more”就剩世界杯了,,1966年是英格蘭奪冠,,按照宿命歸屬,2014年英格蘭也將問鼎,。
五是動物先知論,,以章魚保羅為代表,2008年保羅預(yù)測歐洲杯6場5勝,,2010年保羅預(yù)測南非世界杯8場全勝,,只不過,保羅沒能活到2014年巴西世界杯揭幕,,于是,,烏龜,、大象、熊貓等動物先知又登上了預(yù)測舞臺,,只不過,,保羅的輝煌再難復(fù)制。
當(dāng)然,,所有這些世界杯預(yù)測或多或少都有惡搞的成分,,當(dāng)不得真。但稍微嚴(yán)肅一下,,細致分析這五種方法論,,除了最后一種,剩下四種都用到了大數(shù)據(jù),,這恰是時下大數(shù)據(jù)熱的一種表現(xiàn),。從世界杯預(yù)測看大數(shù)據(jù)熱,三個誤區(qū)值得警醒,。
首先,大數(shù)據(jù)并不能解決所有問題,。大數(shù)據(jù)是很有用的,,幾乎每一個環(huán)節(jié),包括產(chǎn)品設(shè)計,、市場定位,、目標(biāo)選擇、銷售策略和模式修正,,都能靠大數(shù)據(jù)來解決問題,,甚至連各種和商業(yè)無關(guān)的問題,也都能從大數(shù)據(jù)這里得到幫助,。
但大數(shù)據(jù)并不是萬能的,,大數(shù)據(jù)能解決的都是客觀問題,而不是主觀問題,。就拿世界杯預(yù)測來說,,誰能奪冠取決于多種因素,各種預(yù)測方法論本質(zhì)上并無區(qū)別,,只不過它們對不同決定要素賦予的權(quán)重不盡相同,。也就是說,決定奪冠的要素是什么,,這是一個主觀問題,,大數(shù)據(jù)只能說明客觀的狀態(tài),無法對夾雜重要主觀判斷的問題直接給出解答,。
其次,,數(shù)據(jù)并不是越大越好,。數(shù)據(jù)分析早就存在,大數(shù)據(jù)火爆卻是最近的事情,,其中的區(qū)別就在一個“大”字,。從道理上講,數(shù)據(jù)種類越多,、序列越長,,包含的信息就越豐富。但值得強調(diào)的是,,信息越豐富未必就越好,,當(dāng)下是一個信息大爆炸的時代,信息越多有的時候越不利于獲知,。
而且更重要的是,,像世界杯預(yù)測,,明顯是一個核心信息不突出的事情,所以信息之間反而容易形成無邏輯的沖突,這恰是預(yù)測方法論眾多,,誰都不靠譜的原因。此外,,數(shù)據(jù)越大,,數(shù)據(jù)處理過程中的選擇就越多,而選擇總是難以回避道德風(fēng)險問題,,每一個大數(shù)據(jù)分析者,,都得面對為特定目標(biāo)而選擇的誘惑,“有選擇的選擇”往往是大數(shù)據(jù)反而模糊了真相的潛在原因,。
最后,,大數(shù)據(jù)搞不定薛定諤的貓。在盒子打開前,,薛定諤的貓既是活的,,又是死的,只有打開盒子這一行為,,才能導(dǎo)致狀態(tài)疊加的坍塌,,不確定性才會消失。也就是說,,在世界杯真正開始前,,32支球隊都是冠軍,又都不是冠軍,,只有踢起來才能見真章,。
大數(shù)據(jù)分析都是基于既成事實的,它更擅長于告訴我們,,世界是怎樣,,而不是世界應(yīng)是怎樣和將會怎樣,。在不確定性面前,大數(shù)據(jù)是無力的,,所以究其根本,,大數(shù)據(jù)不是用來預(yù)測的。大數(shù)據(jù)能帶給我們的,,是知識,,是獲知,而不是判斷,,更不是武斷,,而尊重不確定性,才是正確使用知識的一部分,。
網(wǎng)上有個段子:“互聯(lián)網(wǎng)思維就是:化緣的改叫眾籌了,,算命的改叫分析師了,八卦小報改叫自媒體了,,放高利貸改叫資本運作了,,借錢給朋友改叫天使投資了,統(tǒng)計改叫大數(shù)據(jù)分析了”,。從世界杯預(yù)測看大數(shù)據(jù),,誤區(qū)是存在的,而這些誤區(qū)的形成,,和概念熱炒不無關(guān)聯(lián)。數(shù)據(jù)分析一直都是非常有用的,,但濫用大數(shù)據(jù)作為噱頭,,就沒意思了。所以,,看世界杯遠比預(yù)測世界杯要更有趣,,不是嗎?