什麼是基於真實數據的欺騙?

什麼是基於真實數據的欺騙?
作者:@programthink。



一、選擇性披露

所謂的「選擇性披露」就是——有些事實告訴你,但有些不告訴你。

比如說:《新聞聯播》裡面通常只報導國內的正面新聞,也通常只報導國外的負面新聞——就屬於這種手法。

比如2012年12月的同一天,美國康涅狄格州和中國的河南省,都發生了校園慘案。但是中國官方媒體大肆報導美國校園槍擊案,卻很少提及河南幼兒園的屠殺案。同是校園慘案,國內所發生的,必然要比國外所發生的更與觀眾有關,但是「厚彼薄此」,就會完全改變節目的傳播效果。


孔慶東曾在新浪微博說:

「根據《歷史的審判》中最高人民檢察院的材料,文革中‘被迫害致死’者3萬4千多人。假設這一數字是可靠的,那麼平均每年是3千多人。對比一下美國,僅僅因為槍支泛濫,每年致死人數超過3萬,等於10個文革。再按照兩國人口比例換算,則等於40個文革。」

這段話的謬誤在哪兒?

這段話有好幾個坑。

開頭部分引用的數據(3萬4千多人),很可能就是偽造的(人為縮水的)。連孔慶東自己也底氣不足,所以他特地註明了「假設這一數字是可靠的」。因為本文不討論「造假」,所以這個數字是否偽造,今天暫且不談。

本章節先談談這段話的後半段——美國死於槍支的人數。

在這裡,孔慶東使用的,就是「選擇性披露」的手法。他只提到美國每年死於槍支的人數超過3萬。但是實際上,這3萬人裡面,超過2萬是死於開槍自殺,實際上,即使沒有槍支,有心自殺的人也可以通過各種方式來完成自己的決定。孔慶東有意避談他殺與自殺的比例,就是為了誇大槍支泛濫對於社會傷害的影響,而其高明之處就在於——用的確實是真實數據。

(孔慶東這段話裡面,還有另外的謬誤,後面的章節會提到)



二、只談表面現象,不談深層原因

這種手法,建立在受眾對某個領域不夠充分了解。於是欺騙者就可以拿表面現象來掩蓋深層原因。

比如在中國有很多專家熱衷於宣揚「房價長期走高」、「房價只漲不跌」。在這些人的論據裡面,其中一個論據是:「大規模城鎮化」會引入大量新的「城市住房需求」。

問題出在哪兒呢?

引用英國《金融時報》的一篇報導,是這麼來說的:

許多人用城鎮人口的增加和需要更新改善的房屋數量來估算住房的「剛需」大數。我們認為,用新增城鎮人口來估算城鎮化帶來的新增住房需求會高估「剛需」。這是因為在新增城鎮人口之中,只有一小部分來自城鎮戶籍人口的自然增長,而百分之四十以上來自於城鎮行政區域擴大或變更帶來的農村人口劃轉。這種「行政」性的城鎮化意味著新增人口原來就有住宅,而並不是全部都會拆除重建。另外40%多來自於常住非戶籍人口的增加,但是這部分人由於購買力低下,絕大部分都無法參與到城鎮住房市場(我們假設其中10%的人能買房),而且因為戶籍問題也不能享受社會保障房。

事實上,根據多個商業網站——它們通常比政府機構要更接近真實市場——的數字,中國多個城市的房價下跌已經持續了超過一年。





三、基於不同的統計術語

大部分人都是「統計學」的門外漢,對統計學術語缺乏基礎的認識。於是,這就給了某些報告生產機構一次又一次的欺詐機會。

我們可以先來看條笑話。

比爾·蓋茨長期霸占「世界首富」的寶座之後,IT界出現一個調侃:當比爾·蓋茨走進某個普通的酒吧,一瞬間,酒裡面的所有人都變成億萬富翁(平均數意義上的)。

如果你看不懂這個調侃,我可以解釋一下:蓋茨的資產是幾百億美金。假設這個酒裡面不到100人,那麼當蓋茨進入酒吧後,裡面的人均財產至少是數以億計的美金。

這個笑話說明了什麼?那就是「平均數」在某些情況下具有很強的誤導性(尤其是當某個領域的數據出現嚴重的分布不均時)。

在統計學上,除了「平均數」這個術語,還有「中位數」和「眾數」。當數據的分布極度不均勻時,看「平均數」不如看「中位數」和「眾數」。

比如在中國這樣一個財富分配嚴重兩極分化的國家,官方發布的一些統計數據——比如人均薪水、人均存款——時,更喜歡用「平均數」而不是「中位數」或「眾數」。這樣就能給出一些「看上去很美」的統計結果。

為了讓各位有一個直觀的認識,下面有一個虛構的例子:

假設有一家工廠,裡面有5個股東,25個經理,70個工頭,200個高級技工,250個普通技工,300個實習生。

其中:

股東年收入1000萬;
經理年收入50萬;
工頭年收入10萬;
高級技工年收入8萬;
普通技工年收入4萬;
實習生年收入2萬;

對上述人群的收入,平均數是11.94萬,中位數是4萬,眾數是2萬,結果相差好幾倍。

假設某個地方政府需要上報該工廠的收入情況,那麼上報「平均數」就顯得非常和諧。而上報「眾數」就很不和諧。

更簡單的說,「村裡有個楊百萬,其他個個窮光蛋,要是算起平均數,人人都是萬元戶」。




四、不恰當的對比——基於不同的前提

對比兩個事物的時候,如果前提不同,那麼對比就沒有意義。但是很多欺騙的手法,恰恰是利用了不同前提的對比。而且在對比的過程中,刻意隱瞞前提的差異性。

上面舉了孔慶東的謬論作為反面教材,指出了其中一處謬誤。現在來指出另一處謬誤。

孔慶東拿「美國死於槍支的人數」來跟「文革造成的非正常死亡人數」作對比。這樣的對比是沒有意義的。「文革造成的非正常死亡人數」,其性質是「錯誤政治造成的人道災難」;而「美國死於槍支的人數」,其中大部分是自殺(和政治無關),少部分是搶劫或衝突等槍殺案(屬於治安犯罪,不屬於政治後果)。

另一個案例,是李世默為專制政治體系的辯護。

李世默在TED的演講上稱:根據國際清廉質數(以下簡稱「TII」),中國比許多民主國家更清廉。

看到這裡,可能有很多讀者要啞然失笑了。但是知其然還要知其所以然,除了嘲笑之外,我們仍然需要弄明白的是,為什麼中國的TII指標會比某些成熟民主國家更好?貓膩在哪兒?

在這個問題上,不妨直接引用經濟學家黃亞生對李世默的反駁,原文摘錄如下:

我一直認為用清廉指數來為一個不透明的政治體系辯護是很諷刺的。

下面要講的是一個基本的觀點:在民主國家中的腐敗要遠遠多於我們知道的在那些集權國家中的腐敗,因為民主國家按照定義就更透明,並且有更透明的數據。我更相信在民主國家中比較腐敗程度,而不是機械的套用在中國與其他民主國家的比較中,這就像李世默所不斷重復做的,但從根本上說是有缺陷的。

他的方法混淆了兩種效果:一個國家透明程度如何以及一個國家腐敗程度如何。我不是說民主國家就一定比中國乾淨,我說的是李用的數據不能作為得出上述任何一個方向的結論的基本依據。在這個問題上想要得出結論的正確方法是:在給定同樣的透明度下(以及同樣水平的許多其他指標,比如收入)中國有/沒有比民主國家腐敗。

一個簡單的例子就會闡明這種觀點。在2010年,兩個印度企業家成立了一個網站叫「我行賄」。這個網站讓帖子以匿名的方式張貼印度公民不得不行賄的例子。截止到2012年8月,這個網站記錄了20,000起腐敗的報告。部分中國網站試著做同樣的事情,比如有人創造了「I Made a Bribe」和「522phone.com」,但是這些網站很快就被強行關閉了。正確的結論並不是像李的邏輯所說的——中國比印度更乾淨,因為他有著零紀錄的腐敗案例,而印度政府有著20,000起腐敗案件。

因此,李世默在刻意忽略「透明指數」的前提下,大談「腐敗指數」的對比,是沒有任何意義的。







五、用「縱向對比」替代「橫向對比」

前面提到了「橫向對比」。這種對比方式的重要前提是「同一時期」。如果少掉這個前提,對比的意義會大打折扣。

比如關於香港公民希望爭取普選投票權的事件,香港金融發展局主席查史美倫以美國黑奴為例,說:

「1861年美國解放黑奴,大約100年後,1968年黑人才可獲投票權。」

為什麼這種對比有失妥當?

因為英國、美國是民主化的先驅,他們沒有前人可以借鑒,處於摸索階段,自然要花比較長的時間。英國從「自由大憲章」到「光榮革命」勝利,當中花了超過400年的時間。

而今,民主化浪潮已經席卷全球,有很多前車之鑒可以供參考,當然不用再花那麼長的時間。比如日本二戰戰敗之後,用很短的時間就建立了「君主立憲」的政體。設想一下:如果某個日本官員說「英國搞出君主立憲花了400年,日本也需要花400年」——那豈不是笑話?




六、通過「追加定語」來提升排名

所謂「追加定語」是一種修辭方面的語言技巧。這種技巧如果運用得當,也可以很好地進行忽悠。

比如,2013年嫦娥三號實施登月計劃之後,中國主流官方媒體反復強調:中國成為繼美國和前蘇聯之後,第3個做到‘月面軟著陸’的國家」。

這個說法本身沒有錯,但是會給人(尤其是不太了解宇航技術的人)一種強烈的誤解,以為中國是第3個登上月球的國家。

其實,以「月面著陸」來計算,中國排在第5位——前面4個分別是:美國、蘇聯、日本(1990)、印度(2008)。但改為「月面軟著陸」這個定語,一下子就擠進前三名啦。

補充說明:歐洲空間局「月面著陸」的時間也早於中國,但是「歐洲」不能算單獨的國家。

為了說明「定語」的效果,請你品味如下幾句話——體會一下唬人的程度,有何差異。

嫦娥三號成功登月,中國是第3個做到「月面軟著陸」的國家。
嫦娥三號成功登月,中國是第5個做到「月面著陸」的國家。
嫦娥三號成功登月,它是第31個在月球軟著陸的探測器。
嫦娥三號成功登月,它是第115個月球探測器。

詳細的「月球探測器清單」請看維基百科詞條,裡面的清單包含了所有跟月球相關的探測器(包括「繞月的」和「著陸的」)。

順便可以科普一些宇航方面的歷史,以如今的宇航技術,「月球探測」的難度其實遠遠小於其它幾項(比如:火星探測、彗星探測、小行星探測)。

截止到2014年,成功進行火星任務的機構(按時間順序)是:俄羅斯的 RSA(俄羅斯空間局)、美國的 NASA(美國NASA)、歐洲的 ESA(歐洲空間局)、印度的 ISRO(印度空間研究組織)。如果以國家排名(歐洲不算「國家」),印度排第三(不愧是印度阿三)。值得一提的是:到目前為止,嘗試過火星任務的機構,除了印度的 ISRO,其它機構第一次嘗試都失敗了。

蘇聯第一次嘗試(火星1A號,1960),失敗
美國第一次嘗試(水手3號,1964),失敗
日本第一次嘗試(希望號,1998),失敗
英國第一次嘗試(小獵犬2號,2003),失敗
中國第一次嘗試(螢火一號,2011),失敗

蘇聯和美國的失敗,還情有可原——因為上世紀60年代的宇航技術還很粗糙。但是中國和印度的火星任務,時間上很接近(相差2年),有可比性。

為什麼要特別強調印度?因為它的空間技術實力,絕對不可小看。比如說:印度的火星計劃,技術都是自己研發,而且成本是全球最低(7400萬美元,相當於NASA同時期類似計劃的1/10成本)。

如果僅從中國的媒體接受資訊,很難有人能夠意識到這一點。
我知道什么?
文字游戏,糊弄受众,受众不信,糊弄自己。
文字游戏,糊弄受众,受众不信,糊弄自己。
本帖最后由 ironland 于 2015-4-6 02:06 编辑

这套很有效。现成的例子不就摆那里么。
我知道什么?