
閑談世界杯預(yù)測(cè)
人類(lèi)一思考,上帝就發(fā)笑,;世界杯一來(lái)到,,上帝笑得血壓也升高。倒不是足球踢得多歡樂(lè),,而是世界杯預(yù)測(cè)太惡搞,。
我略微總結(jié)了下,剔除掉貝利這種聲名卓著的反向指標(biāo),,煞有其事的世界杯預(yù)測(cè)大致可以分為五類(lèi):
一是實(shí)力決定論,,以高盛和德銀等投行為代表,將FIFA排名,、過(guò)往戰(zhàn)績(jī),、近期表現(xiàn)、球員身價(jià),、賭球賠率,、國(guó)家經(jīng)濟(jì)等一系列數(shù)據(jù)綜合反映出的球隊(duì)實(shí)力作為預(yù)測(cè)依據(jù),用計(jì)量模型計(jì)算出看上去精確至極的概率,,只不過(guò),計(jì)算結(jié)果有較大差異,,比如,,高盛預(yù)測(cè)巴西奪冠,,德銀則更看好英格蘭,。
二是條件決定論,以霍金教授為代表,,將各種客觀條件對(duì)某一球隊(duì)的表現(xiàn)影響揉到一個(gè)獲勝公式里,,這些條件包括球場(chǎng)選擇、裁判國(guó)籍,、球衣選擇,、陣型選擇和交通工具選擇等,只不過(guò),,這種公式的預(yù)測(cè)有效時(shí)段很短,,所以在決賽還離得遠(yuǎn)的現(xiàn)在,公式還預(yù)測(cè)不出最后的冠軍歸屬,。
三是流言決定論,,以雅虎和微軟[微博]Bing為代表,將以?xún)|為單位的網(wǎng)絡(luò)噪音轉(zhuǎn)化為清晰的結(jié)果信號(hào),。雖然這種互聯(lián)網(wǎng)魔術(shù)看上去既科學(xué)又玄妙,,甚至可以從經(jīng)濟(jì)學(xué)的“預(yù)期自我實(shí)現(xiàn)”理論得以解釋?zhuān)傋屓寺?lián)想到古時(shí)候無(wú)論中國(guó)還是西方,帝王對(duì)童謠和吟游詩(shī)人作品的格外關(guān)注。
四是宿命歸屬論,,以一則關(guān)于1966和2014年的時(shí)空重疊熱帖為代表,,1966年,歐冠冠軍是皇家馬德里,,西甲冠軍是馬德里競(jìng)技,,西乙冠軍是拉科魯尼亞,意甲冠軍是尤文圖斯,,皇家貝蒂斯降級(jí)西乙,,2014年無(wú)一例外都是如此。“yesterdayonce more”就剩世界杯了,,1966年是英格蘭奪冠,,按照宿命歸屬,2014年英格蘭也將問(wèn)鼎,。
五是動(dòng)物先知論,,以章魚(yú)保羅為代表,,2008年保羅預(yù)測(cè)歐洲杯6場(chǎng)5勝,2010年保羅預(yù)測(cè)南非世界杯8場(chǎng)全勝,,只不過(guò),,保羅沒(méi)能活到2014年巴西世界杯揭幕,,于是,,烏龜、大象,、熊貓等動(dòng)物先知又登上了預(yù)測(cè)舞臺(tái),,只不過(guò),保羅的輝煌再難復(fù)制,。
當(dāng)然,,所有這些世界杯預(yù)測(cè)或多或少都有惡搞的成分,當(dāng)不得真,。但稍微嚴(yán)肅一下,,細(xì)致分析這五種方法論,除了最后一種,,剩下四種都用到了大數(shù)據(jù),,這恰是時(shí)下大數(shù)據(jù)熱的一種表現(xiàn)。從世界杯預(yù)測(cè)看大數(shù)據(jù)熱,,三個(gè)誤區(qū)值得警醒,。
首先,,大數(shù)據(jù)并不能解決所有問(wèn)題。大數(shù)據(jù)是很有用的,,幾乎每一個(gè)環(huán)節(jié),,包括產(chǎn)品設(shè)計(jì)、市場(chǎng)定位,、目標(biāo)選擇,、銷(xiāo)售策略和模式修正,都能靠大數(shù)據(jù)來(lái)解決問(wèn)題,,甚至連各種和商業(yè)無(wú)關(guān)的問(wèn)題,,也都能從大數(shù)據(jù)這里得到幫助。
但大數(shù)據(jù)并不是萬(wàn)能的,,大數(shù)據(jù)能解決的都是客觀問(wèn)題,,而不是主觀問(wèn)題。就拿世界杯預(yù)測(cè)來(lái)說(shuō),,誰(shuí)能奪冠取決于多種因素,,各種預(yù)測(cè)方法論本質(zhì)上并無(wú)區(qū)別,只不過(guò)它們對(duì)不同決定要素賦予的權(quán)重不盡相同,。也就是說(shuō),,決定奪冠的要素是什么,這是一個(gè)主觀問(wèn)題,,大數(shù)據(jù)只能說(shuō)明客觀的狀態(tài),,無(wú)法對(duì)夾雜重要主觀判斷的問(wèn)題直接給出解答。
其次,,數(shù)據(jù)并不是越大越好。數(shù)據(jù)分析早就存在,,大數(shù)據(jù)火爆卻是最近的事情,,其中的區(qū)別就在一個(gè)“大”字。從道理上講,,數(shù)據(jù)種類(lèi)越多,、序列越長(zhǎng),包含的信息就越豐富,。但值得強(qiáng)調(diào)的是,,信息越豐富未必就越好,當(dāng)下是一個(gè)信息大爆炸的時(shí)代,,信息越多有的時(shí)候越不利于獲知,。
而且更重要的是,像世界杯預(yù)測(cè),,明顯是一個(gè)核心信息不突出的事情,,所以信息之間反而容易形成無(wú)邏輯的沖突,,這恰是預(yù)測(cè)方法論眾多,誰(shuí)都不靠譜的原因,。此外,,數(shù)據(jù)越大,數(shù)據(jù)處理過(guò)程中的選擇就越多,,而選擇總是難以回避道德風(fēng)險(xiǎn)問(wèn)題,,每一個(gè)大數(shù)據(jù)分析者,都得面對(duì)為特定目標(biāo)而選擇的誘惑,,“有選擇的選擇”往往是大數(shù)據(jù)反而模糊了真相的潛在原因,。
最后,大數(shù)據(jù)搞不定薛定諤的貓,。在盒子打開(kāi)前,,薛定諤的貓既是活的,又是死的,,只有打開(kāi)盒子這一行為,,才能導(dǎo)致?tīng)顟B(tài)疊加的坍塌,不確定性才會(huì)消失,。也就是說(shuō),,在世界杯真正開(kāi)始前,32支球隊(duì)都是冠軍,,又都不是冠軍,,只有踢起來(lái)才能見(jiàn)真章。
大數(shù)據(jù)分析都是基于既成事實(shí)的,,它更擅長(zhǎng)于告訴我們,,世界是怎樣,而不是世界應(yīng)是怎樣和將會(huì)怎樣,。在不確定性面前,,大數(shù)據(jù)是無(wú)力的,所以究其根本,,大數(shù)據(jù)不是用來(lái)預(yù)測(cè)的,。大數(shù)據(jù)能帶給我們的,是知識(shí),,是獲知,,而不是判斷,更不是武斷,,而尊重不確定性,,才是正確使用知識(shí)的一部分。
網(wǎng)上有個(gè)段子:“互聯(lián)網(wǎng)思維就是:化緣的改叫眾籌了,,算命的改叫分析師了,,八卦小報(bào)改叫自媒體了,,放高利貸改叫資本運(yùn)作了,借錢(qián)給朋友改叫天使投資了,,統(tǒng)計(jì)改叫大數(shù)據(jù)分析了”,。從世界杯預(yù)測(cè)看大數(shù)據(jù),誤區(qū)是存在的,,而這些誤區(qū)的形成,,和概念熱炒不無(wú)關(guān)聯(lián)。數(shù)據(jù)分析一直都是非常有用的,,但濫用大數(shù)據(jù)作為噱頭,,就沒(méi)意思了。所以,,看世界杯遠(yuǎn)比預(yù)測(cè)世界杯要更有趣,,不是嗎?