2013年10月6日星期日

男子憑借自己的數學模型準確預測美國大選

數學補習,補習社,dse數學,數學最強,太子補習社-男子憑借自己的數學模型準確預測美國大選

數學補習,補習社,dse數學,數學最強,太子補習社-男子憑借自己的數學模型準確預測美國大選


 

 被譽為“算法之神”的內特·希爾沃
  
  借助數學模型,希爾沃推斷奧巴馬會贏得2012年美國大選


  
  他在2008年美國大選中曾準確預測瞭49個州的選舉結果,而2012年的美國大選,他則準確預測瞭全部50個州的選舉結果。34歲的內特·希爾沃憑著自己的數學模型打敗瞭所有時政記者、政黨媒體顧問和政治評論員。美國公眾沸騰瞭,媒體稱他為超級極客、“算法之神”,並認為其成功讓所有書呆子揚眉吐氣。
  
  準確預測美大選結果
  
  內特·希爾沃可以說是超級政治明星,他知道自己在說什麼。在美國人看來,權威專傢一直是擁有合適的發型、潔白的牙齒或者符合保守派觀點的人。希爾沃完全不符合這些條件,他有的隻是數據,許許多多的數據,而美國總統大選之夜證實瞭這些數據的準確性。
  
  投票前,許多評論傢都認為無法預計哪方會獲勝。他們預計本次選舉兩名候選人的得票率將不相上下。但事實並非如此。結果證明奧巴馬和羅姆尼完全不是旗鼓相當,正如希爾沃幾個月來的預測。在大選日當天,他預測奧巴馬將有90.9%的可能獲得大半選舉人票,如果按州計算,他準確預測瞭所有州的選舉結果。
  
  “你們知道誰是今晚(選舉開票夜)的贏傢嗎?”美國微軟全國廣播公司節目新聞主播自問自答,“是內特·希爾沃。”
  
  “算法之神”受到狂熱追捧
  
  推特瞬間沸騰瞭,各大博客網站也為希爾沃沸騰瞭。希爾沃的處女作——《信號和噪音:預測學的藝術與科學》的銷量一夜間增長800%,排到瞭暢銷榜第二位。媒體一致認為本次大選預測的成功並不隻是希爾沃個人的勝利,它還使所有書呆子都揚眉吐氣。希爾沃憑他的數學模型打敗瞭所有時政記者、政黨媒體顧問和政治評論員。
  
  希爾沃一點也不像電視新星,也不像《華盛頓郵報》所說的言論界新寵,現年34歲的他反倒更像美劇《超人前傳》中克拉克·肯特變身前的形象。他謙遜而不招搖,當他低著頭拖著步子走進屋裡,他似乎對自己被采訪而感到尷尬。
  
  “整個事情變得有點瘋狂,”他說,但他並不認為這種狂熱與他有關,“我仿佛具有這種象征性力量,然而人們對我所做事情的推崇遠超瞭我所應得的。我必須首先說明大傢應該知道兼聽則明,而不是把某個人的意見當成神諭。”
  
  然而,這忠告似乎來得有點晚瞭。大選後的第二天當他出現在《每日秀》脫口秀節目時,節目主持人喬恩·斯圖爾特稱他為“算法之神”,但他的成功故事同時也是個“屌絲逆襲”的故事。
  
  選舉前的數周,他的批評者們(大多數是不滿他預測奧巴馬將獲勝的保守派們)不僅攻擊瞭他的預測方法,還對他進行瞭人身攻擊。UnSkewedPolls.com的迪安·錢伯斯召集人們抵制希爾沃的“巫術數據”,宣稱他神志不清並嘲諷他是個矮小瘦弱的娘娘腔。
  
  不過從某些角度來說,人們的奉承似乎更難以應付。“奉承的話讓我感到緊張,因為我確定我們將會出錯。”這裡的“我們”指的是他在2007年設立的提供以數據為主的時政分析的博客“FiveThirtyEight”(因538張選舉人票總數得名)。2010年,他把博客轉移到瞭《紐約時報》的網站上。
  
  希爾沃那界面簡陋的博客在大選前為《紐約時報》網站帶來瞭20%的瀏覽量。如果說希爾沃不是“大數據”超人,那麼他肯定是超級極客,也是極客界的偶像級人物。
  
  用數學模型分析棒球
  
  希爾沃一直是數據的愛好者。“我一直都被人稱作書呆子。”他出生於在密歇根州,傢鄉的棒球隊底特律猛虎在他6歲的時候贏得瞭美國職業棒球全國錦標賽的冠軍,而他也是在那個時候接觸瞭各種統計數據並愛上瞭數據。
  
  從芝加哥大學獲得經濟學學位後,他在專門提供審計、稅務和咨詢等服務的畢馬威公司當瞭4年顧問,接著,他開始迷上瞭網絡撲克。那時候許多玩網絡撲克的人對撲克並沒有很多瞭解,而他卻能從他們手中贏錢,這些錢足夠讓他辭掉工作靠玩撲克養活自己。
  
  撲克就像希爾沃生命中的天然磁石,不僅教會瞭他抓住機遇,還使他明白機遇在人生中扮演怎樣的角色。“玩撲克對我而言是最好的訓練,我從中學會瞭怎樣衡量新信息的作用,怎樣辨別信息的重要性。我們的直覺在分析信息方面並不是十分在行,我們總是傾向於高估新信息的重要性。”
  
  希爾沃說:“技巧和運氣間存在著微妙而又模糊的關聯。贏錢的時候是因為牌技好還是運氣好?你永遠也不知道。”希爾沃估算他自己當時從網絡賭博中贏瞭有大概40萬美元,這些錢足夠他去追求他另一項愛好——棒球。棒球這項體育運動正在不斷地改變中,而希爾沃是最早發現這項運動有數據導向潛在可能性的少數人之一。他後來建立瞭Pecota網站,該網站建模分析預測美國職業棒球大聯盟運動員的職業前景,後來他又把該網站賣給瞭《棒球簡介》。
  
  棒球預測就像一場保守的情報員與善於分析數據的新成員之間的鬥爭,這場鬥爭後來被邁克爾·路易斯在暢銷書《點球成金》中記錄瞭下來,後來佈拉德·皮特主演瞭同名電影。2007年,希爾沃開始尋找新的契機。
  
  擔心會在未來影響選情
  
  “我當時在尋找像棒球分析那樣的,有龐大的數據庫而且鮮有競爭者的新領域,就在那個時候我找到瞭政治這個領域。”起初,他使用筆名“Poblano”。幾個月後,他開始使用真名。
  
  希爾沃覺得自己當時將已有的數據套用貝葉斯理論,如此一來他將“小有優勢”。美國政治領域原本就充斥著許多數據,而他所使用的貝葉斯理論也不是什麼尖端科技。英國神父貝葉斯於18世紀初發現瞭計算有條件的事件發生可能性的貝葉斯理論。
  
  希爾沃後來表示同意批評者的觀點。他甚至不是唯一一個使用貝葉斯理論分析選情的人,其他分析師也同樣有不錯的準確度。就其屬性來說,政治分析不過是平平無奇的數據分析,希爾沃不過是綜合已有的民調結果。然而,希爾沃建模分析的關鍵卻在於如何衡量某一數據的重要性。這些數據在歷史上有何作用,又有怎樣的偏向性,還有什麼別的信息可以借鑒?
  
  然而,在美國政治評論圈裡,希爾沃的選情分析卻是前所未有地準確。
  
  希爾沃不會見說客、黨派媒體顧問、競選經理及新聞發言人之類的人。簡而言之,他不是“體制內”的人。美英兩國的政治報道就像一個類似壟斷集團的體制。在英國,政治圈裡彌漫的這種狼狽為奸的氛圍是在議員報銷醜聞後才受到質疑,而這醜聞則是政治圈外的記者最早曝光的。在美國,希爾沃將政治形容成“交易”。
  
  “如果你表現良好,偶爾會得到獨傢消息,但這不過是許多既得利益間的遊戲。我盡量回避和兩邊的競選團隊打交道,因為他們所給的信息大都是幹擾性的噪音。”
  
  有意思的是,競選團隊(尤其是奧巴馬的團隊)本身也清楚數據的重要性。據奧巴馬團隊的競選經理吉姆·梅西納稱,他們請瞭一位“首席專傢”,目的是“量化一切”。數據告知他們應當關註哪些選民及如何吸引他們。由此看來,希爾沃的技能對競選活動至關重要。
  
  希爾沃認為“書呆子”才是他的“秘密武器”。“我總覺得自己是個局外人。我身邊總有朋友,可是我總是有跟他們不一樣的觀點。我覺得這點很重要。”希爾沃漸漸開始擔心:他的能力是否意味著將來他不僅能預測選舉結果,還將影響選情。此外,他還擔心失去旁觀者的優勢。“我獲得各種機遇,不過我不希望自己墮落或者淹沒在體制內。”
  
  進軍經濟新聞預測領域
  
  希爾沃正在尋找下一個目標——一個擁有許多數據卻沒有太多競爭對手的領域。他認為經濟新聞是一個不錯的選擇,而地方政府選舉則是“難以預測”。幾年前他曾經對紐約的社區進行過分析——你可以通過自己所關註的因素(例如綠化空間和好學校)結合從市長辦公室獲得的數據得到個性化的居住社區選擇分析。
  
  希爾沃在成功預測瞭2008年美國大選結果(準確預測瞭50個州中49個州的選舉結果)後簽下瞭一份價值70萬美元的出版合約,他在書的序言裡坦言,與出版社簽約的原因是希望他能寫出一本“書呆子的勝利”之類的書。但當時沒有人能料到他會有多大的成就。不過,當時就連希爾沃自己也不知道這本書會有什麼樣的反響。
  
  “我當時以為這本書會像是介紹婚介網站那樣運作之類的書籍。這本書裡的確也提到瞭這些內容,但是更多的是介紹這當中的哲學原理。這本書是關於客觀性和現實的主觀性的交集。面對一堆數據時,我們經常處理得很糟糕。擁有更多信息並不意味著我們能更好地預測。”(來源:現代快報)


没有评论:

发表评论