真實的數據也會騙人

統計學是一門和數字打交道的學問,但它往往不像基礎數學那樣,答案非黑即白,逼近真理。在別有用心的人眼裡,統計學就是數字的魔術,「我保證我說的每個字都是真實的,但結果卻和真實世界大大背離」。

 

最近因為網易的一篇文章,大家關於中國的電費到底貴不貴這個問題,在網上吵得不可開交。

 

網易新聞的編輯用每月人均用電1000度的價格,除以了2011年每月人均可支配收入,得到了各國人民的用電負擔,然後得出結論是「中國居民電費負擔全球最高」。

 

 

這其實是一個比較雞賊的觀點,因為大部分讀者都是用電的人,而非電力部門的職工,誰不希望電價能更便宜些呢?

 

只要中國的電費不是零,大家都會希望電價能降低。可是,空喊降低電費好像有點單薄,如果有數據支撐,通過客觀比較,說明我國的電價比其他國家貴,那就好了。

 

網易的編輯就是迎合了這種想法,而且理直氣壯,畢竟數據來源是國際能源署和OECD(經濟合作與發展組織),都是這麼權威的機構,誰敢質疑數據呢?

 

但問題是,真實的數據可以選擇性處理,就像真實的事件可以選擇性報道,截取出部分的事實,可以得到完全扭曲的結論。

 

針對網易這個結論,我們可以提出幾個問題:

 

1.中國人均電費佔可支配收入的28%的結論聽起來就很多了,但是每月人均用電1000度是怎麼算出來的?如果按居民用電計算,中國人均每月用電在60度左右,和1000度差了16倍,憑什麼按1000度計算電費負擔呢?

 

唯一可能的解釋就是,如果按真實的人均用電量計算,2011年我國的人均電費佔可支配收入才不到1.7%,想得出中國人電費負擔太大了的結論,這怎麼也說不過去。

 

2.為什麼2019年的統計分析,要採用2011年的數據?各國用電、發電量都是按季度公布數據的,再怎麼也不至於拿不到2018年的數據吧?

 

這個問題上的處理,網易的編輯就顯得更雞賊了,我國從2012年開始實施階梯式電價,也就是用電越少,電費越低,這是為了給低用電量的家庭一些補貼,也間接提醒大家節約用電。

 

所以,從2012年起,我國人均用電負擔是明顯下降的,而網易卻選擇了2011年的數據來計算,可見是「為了黑而黑」的典範呀。

 

 

其他國家的數據沒受到年份影響,是因為自從上個世紀70年代的石油危機之後,日本、韓國、美國等國家,就已經採用了階梯式定價計算電費。

 

3.最後,這份「中國居民電費負擔全球最高」的圖表,真的是中國和全球各國的數據對比嗎?

 

其實不是,圖上顯示了二十多個發達國家,卻對印度、寮國、越南這些國家避而不談,完全是誤導性的陳述。如果把全球所有國家拿出來對比,別說是中國排第一了,可能我們連這張二十個國家的排行榜都上不了。

 

網易的數據研究變成「謠言」已經不是第一次了,在前段時間的文章中,網易還提出過另一個更令人震驚的結論,「80%的新增財富落入了全球1%的最富裕人口的口袋中」。

 

這個說法一出來,仇富的人更加仇富了,原本不仇富的人也會在心裡焦慮一下,原來社會的新增財富都原本就有錢的人賺走了,那不是代表階級固化更嚴重了,我哪裡還有機會成功呀?

 

無數販賣焦慮的文章也引用了網易的這個結論,大談普通人的賺錢危機。但是,你可能光顧著焦慮去了,沒有想過這個結論背後的蹊蹺。

 

什麼叫社會新增財富呢?

 

我們用一個富人代表最富人階級,假設他在經濟下行時虧掉了20元,又在經濟復甦時賺到了90元。

 

再用10名普通人代表一般階級,假設他們每個人在經濟下行時虧了5元,又在經濟復甦時賺了10元。

 

那麼社會的新增財富,就是:-20+90-5x10+10x10=120元。

 

那麼富人階級賺的錢占社會新增財富的多少呢?答案是90/120=75%。

 

這個比例很高了,那一般階級呢?答案是100/120=83.3%。

 

算到這裡你可能覺得很搞笑了,怎麼這兩個比例加起來超過了100%?而且一般階級的佔比居然比富人階級還要高?

 

原因就是,這個演算法根本沒有意義。賺的錢≠凈利潤,因為人可以賺錢也可以虧錢,而新增財富也是,只要不註明是凈新增財富,那麼新增財富里就有負數也有正數。

 

雖然每個數據都是真的,但是這個除號上下的數字可能根本沒有比較的意義,結論也就令人啼笑皆非了。

 

雖然數據和計算結果都是正確的,但卻會產生嚴重的誤導性,我們可以稱這種為「誤導性事實」。

什麼叫誤導性事實呢,比如說,我們之前看到水滴籌上一些人貼出自己重病的資料,看起來楚楚可憐,讓人忍不住想要伸出援手。但是,很快他們又被曝光家裡有房有車,可能比你資產還多,很明顯,我們這時候可以認定這些人是騙子。

 

但他們貼出的病歷不是真的嗎?他們描述自己可憐的情況不也是真的嗎?

 

在「選擇性報道」的剪輯之下,我們得出的結論可能是顛倒黑白的,只陳述一部分事實,就能讓衣食無憂的有錢人,變成需要社會援助的可憐人。

 

我們再看下面這幅壁畫,如果我們只截取紅圈的部分,很容易就會以為是前面的人想要刺殺後面的人,可是如果看到完整的圖畫,卻變成了後面的人在追殺前面的人,因為視角的轉換,兩人的關係竟然完全顛倒了。

 

 

在面對社會新聞類的誤導性事實時,我們一般還能看出來端倪,但是在面對數據時,我們往往會被偷換概念的分析人員所迷惑,甚至會被耍得團團轉。

 

統計學的魔法並不難破除,想要看清楚誰在騙你,多多了解統計原理就能自己判斷,再結合我們的真實生活經驗,那些販賣恐慌和焦慮的謊言,就會不攻自破。

 

數字之間算來算去只是統計,搞清楚計算的意義,才是科學。

 

今天玩統計學魔術的人,和過去玩文字遊戲、選擇性報道的人沒有區別,也許一時之間他們能吸引眼球,獲得流量,但是長遠來看,損害的是自己的公信力,浪費的是社會公眾的時間和感情。

 

真實的數據也會騙人,說到底還是無良媒體在製造麻煩,如今看個新聞也有智力篩選,真是不保持學習都不行了呢。有自己的判斷能力,遠離誤導性報道的媒體,我們才能更清晰地看到這個世界,更明白自己的定位和方向,這也是持續學習的一種意義吧。

歡迎使用PayPal打賞,有您的支持,我們將持續不斷更新。所有捐助均用於提升用戶訪問體驗(升級伺服器及帶寬)!

發表評論

必填項已用*標註