作為一個生活平淡的人,你是否設想過在完成了某一天的無聊工作后,會在自家的廚房里聽到警察的敲門聲,然后被告知你可能跟一周后即將發生的一起兇殺案件相關?
在湯姆·克魯斯主演的電影《少數派報告》(MinorityReport)中,神秘的“先知”計算機系統能夠預知犯罪活動,甚至可以精確到時間、地點及卷入其中的人物,讓警方能夠提前行動加以阻止。
而在現實中,這并非小說家的憑空想象。美國洛杉磯因警員比例過低,一直是全美犯罪率最高的地區之一。2012年,該警察局開始進行了一項嘗試,由加州大學人類學與數學系聯合組成的一個實驗室,為該局提供了一套類似“先知”的計算器系統。這套系統把洛杉磯市發案最高的福德希爾地區劃分為幾個區域,通過分析過去的1300多萬起案件,找到了發案與日期、天氣、交通狀況以及其他相關事件之間的某種關系,進而能夠預測出哪個區域在未來數小時內可能發生案件。
現在,洛杉磯警察局有一組專門的警員每天會駕駛著警車按照計算器發出的巡邏指令前往不同的區域。盡管這些熟練的經驗豐富的警員仍然不適應被一堆二進制的代碼所指揮,但是在不增加警員的前提下,“先知”已經使該地區財產犯罪下降了12%,盜竊案件下降了26%。
美國的另外一所大學——麻省理工學院正在進行另外一項研究,他們與當地一家婦女醫院合作,把該醫院所有心臟病患者的病例和心電圖錄入計算機,從而創建了一個計算器程序。當有病人來這里看病時,這個程序可利用心臟病患者的心電圖,預測在未來一年內患者心臟病發作的機率。美國咨詢界的翹楚麥肯錫咨詢公司將這些現象總結為一個概念——大數據(BigData),并預言這項技術將成為人類未來生產力的指向標。隨后,英國牛津大學教授維克托·邁爾-舍恩伯(ViktorMayer-Schonberger)的著作《大數據時代》在全球暢銷,讓大數據這個概念開始深入人心。
“很難準確地描述什么是大數據。”維克托教授說:“它應該是一種思維方式,這也是一個新的改變,從因果性到相關性的轉變,也就是不問原因,而是直接由數據得出結果。”
他說,在過去我們問的更多的是“為什么”,對人類來說,這其實是一個很大的挑戰。比如心臟病發作這項研究,盡管醫學界已經研究了幾十年,但是仍然很難找出發病的具體因果關系,但是現在,只需要建立一個足夠大的心電圖數據庫,并且找到數據與心臟病發作的對應關系,就可以作出準確的預測。
“搜集和分析數據,從表面上看,這就是大數據的開發者們正在做的工作,這并不是什么新的技術。”北京締元信公司CEO秦雯說:“但是互聯網的發展使我們在過去的數年內制造的數據超過了人類歷史上的數據總量,更重要的是,隨著全息攝影技術、傳感技術以及谷歌眼鏡這樣的新技術的誕生,我們收集數據的能力變得前所未有地強大,數據的爆炸性增長為更全面和精確的分析工作提供了可能性,這正是這個時代的價值。”
整合無序的資源
6300多年以前,古埃及人通過太陽升起和下落之間的時間規律制做了太陽歷,預測太陽在某一天何時會升起,將單向前進的時間劃分為365天為一個周期。2200多年以前,中國人通過觀察候鳥遷徙和植物發芽制作了二十四節氣,大致預測了一年之中的天氣變化情況,讓農業的播種和收割時間變得有規律可循。
北京締元信數據公司CEO秦雯認為,從廣義上看,這些都是根據過去的數據進行的預測,但是與現在大數據的含義相比,這些預測顯得過于廣泛,而且規律更容易掌握。現在的大數據更多的是分析由人類行為所構成的現象,比如華爾街的股票走勢、洛杉磯的犯罪發生情況、淘寶網上即將熱銷的商品,而在過去這些都是不可預測的。