您的位置: 首頁 >> 人物 >> 專家學(xué)者 >> 王小魯
王小魯:收入分配不能躺在虛假數(shù)據(jù)上分析
2010-09-06   作者:  來源:第一財經(jīng)日報
 
    ——答王有捐、施發(fā)啟對灰色收入研究的商榷
  近日,國家統(tǒng)計局網(wǎng)站上連續(xù)登出了王有捐、施發(fā)啟兩位統(tǒng)計官員對我的灰色收入研究報告的商榷(注:下稱“研究報告”。該報告題為《灰色收入與國民收入分配》,全文載于中信出版社《比較》第48輯;為中國經(jīng)濟體制改革研究會課題)。隨后,他們兩位又共同署名,在統(tǒng)計局網(wǎng)站上發(fā)表了另一篇文章,表示愿意繼續(xù)就此問題進行研究,并表示國家統(tǒng)計局準備采取措施來改善居民收入統(tǒng)計中的少報、漏報問題。
  他們對我的研究報告進行公開討論,以及關(guān)于改善居民收入統(tǒng)計的表態(tài),是一種積極的態(tài)度,我非常歡迎。但這方面的討論,并不僅限于統(tǒng)計數(shù)據(jù)的真實性問題,而是進一步關(guān)系到如何認識我國當(dāng)前的收入分配狀況、如何應(yīng)對當(dāng)前突出的社會矛盾、如何推進改革來解決這些矛盾。我在這方面的研究,也是基于這個出發(fā)點而進行的。但搞清真實情況、獲得可信數(shù)據(jù),是必要的前提。
  因此,有必要把雙方爭議的一些問題搞清楚。本文對他們的商榷做一個回答,意在促使有關(guān)收入分配狀況的研究更加深入,為解決這些問題提供條件。
  1 現(xiàn)行居民收入統(tǒng)計是否真實反映收入分配現(xiàn)狀
  王有捐、施發(fā)啟的文章都同意目前的居民收入統(tǒng)計調(diào)查“存在漏報和少報的問題”,“高收入群體也較少進入調(diào)查樣本”;因此居民收入統(tǒng)計“可能存在低估的情況”。兩位也認為筆者的研究報告“在估算我國居民實際收入方面進行了有益的探索,尤其在獲取基礎(chǔ)數(shù)據(jù)和推算宏觀數(shù)據(jù)方面值得參考和借鑒”!捌洳捎镁用窦矣闷、商品住宅、出境旅游、銀行存款等外部相關(guān)數(shù)據(jù)對我國常規(guī)住戶調(diào)查居民收支數(shù)據(jù)進行驗證的方法為我們提供了不同的思路和模式,值得借鑒”。在這些方面,我們有一定的共同認識。
  但施、王前兩文的重點,是批評我們的調(diào)查樣本比國家統(tǒng)計局的調(diào)查樣本量“明顯偏小”、沒有采取統(tǒng)計局所采用的隨機抽樣方法,因此“結(jié)果是不可靠的”,“估算結(jié)果明顯偏高”。
  如果結(jié)果“不可靠”,會有偏高和偏低兩種可能。為什么是偏高而不是偏低?怎樣算出來“明顯偏高”?高多少?兩位商榷者并沒有做出解釋,看來還是根據(jù)現(xiàn)有統(tǒng)計數(shù)據(jù)來判斷的,就是說,似乎現(xiàn)有的收入統(tǒng)計仍然是可靠的,即便有偏差也不大。而筆者對高收入居民收入的估算“明顯偏高”,也是相對于統(tǒng)計數(shù)據(jù)而言。這不僅與兩位關(guān)于統(tǒng)計數(shù)據(jù)“可能存在低估”的說法有矛盾,而且涉及到一個關(guān)鍵問題:現(xiàn)行統(tǒng)計究竟是否反映了高收入群體的真實收入狀況?這是需要搞清楚的。
  長期以來,我國收入分配差距持續(xù)擴大,特別是灰色收入大量存在,嚴重影響了收入分配狀況。但這些問題并沒有從統(tǒng)計上如實反映出來,特別是對高收入居民的收入統(tǒng)計嚴重脫離實際,不僅低估了收入差距擴大的嚴重性,也造成不同統(tǒng)計數(shù)據(jù)間的嚴重沖突。下面是幾個例子。
  其一,據(jù)國家統(tǒng)計局公布的城鄉(xiāng)居民人均收入和城鄉(xiāng)人口數(shù)推算,2008年全國居民可支配收入總額不足13萬億元,而同樣來自國家統(tǒng)計局的資金流量表數(shù)據(jù),卻顯示住戶可支配收入總額為18.2萬億元。后者是根據(jù)經(jīng)濟普查得出的,應(yīng)該比較全面。但這就證明居民住戶收入統(tǒng)計至少遺漏了5.3萬億元,漏掉了居民收入的近30%。類似情況已存在多年。如此嚴重的遺漏,還能認為是基本可靠嗎?這一問題,《第一財經(jīng)日報》在8月30日發(fā)表的《居民收入統(tǒng)計局兩套數(shù)據(jù)打架 5.3萬億元差距待解》一文中已有論述。
  其二,與其他宏觀統(tǒng)計數(shù)據(jù)比較,會發(fā)現(xiàn)遺漏遠不止5.3萬億元。以2008年數(shù)據(jù)算,全國居民儲蓄總額(收入減去消費)在2008年為3.5萬億元,而當(dāng)年僅城鄉(xiāng)居民在金融機構(gòu)的儲蓄存款就增加了4.5萬億元,加上居民當(dāng)年購買商品住宅支出(扣除銀行貸款),在股市、債市和實體經(jīng)濟的投資,手持現(xiàn)金等,實際的居民儲蓄應(yīng)該在11萬億元~11.5萬億元之間(未計算居民在國外的存款和投資),是按居民收入統(tǒng)計數(shù)據(jù)計算的3.5萬億元儲蓄的3倍以上。上述計算依據(jù)的都是國家統(tǒng)計局公布的數(shù)據(jù),這類數(shù)據(jù)沖突近些年來一直存在。
  其三,按人均可支配收入水平算,根據(jù)統(tǒng)計,2008年城鎮(zhèn)居民人均收入只有1.57萬元;其中10%的最高收入家庭,人均也只有4.36萬元。這樣的人均收入是如何支撐當(dāng)年2萬多億元商品住宅銷售的?是怎樣把房價炒上天的?就算只有10%的最高收入家庭能夠買得起房,這部分人的當(dāng)年收入合計只有2.3萬億元,在買了2.1萬億元的商品住宅之后,他們吃什么?喝什么?拿什么錢買汽車?拿什么錢出國旅游?新存入銀行的4.5萬億元私人存款又是哪來的?
  2008年,中國私人小汽車增加了560萬輛,保有量超過2800萬輛,而城鎮(zhèn)10%的最高收入家庭總共不過2000萬戶。據(jù)悉,價值數(shù)百萬的世界頂級豪華轎車勞斯萊斯,在中國的銷量已占全球第三,僅次于美、英。
  2008年,中國居民因私出國出境4013萬人次,超過了同年美國出國人數(shù)(4002萬人次)。據(jù)日本官方統(tǒng)計,2009年僅訪日的中國游客有110萬人次,在日本境內(nèi)人均花費11.7萬日元,而美國游客在日本人均花費僅2.5萬日元(2010年8月24日《參考消息》)。根據(jù)統(tǒng)計,中國城鎮(zhèn)居民的人均收入只相當(dāng)于美國人均收入的1/15,10%最富城鎮(zhèn)家庭的人均收入也不到美國人均收入的1/5,怎么可能支撐這樣的高消費,統(tǒng)計上解釋得通嗎?
  據(jù)悉,2008年內(nèi)地流入澳門的賭資就高達數(shù)百億元。如果將其分攤給2000萬個最高收入家庭,每戶也有幾千元。這些錢又來自何處?
  僅此幾例,足以說明關(guān)于高收入居民收入狀況的統(tǒng)計數(shù)據(jù)已嚴重脫離實際。這種情況不改變,會掩蓋實情,誤導(dǎo)決策,帶來嚴重后果。所以統(tǒng)計部門和經(jīng)濟學(xué)者的共同責(zé)任,是面對現(xiàn)實,搞清情況,不能繼續(xù)滿足于統(tǒng)計調(diào)查“樣本量大”、“方法科學(xué)”等表面文章,回避這些尖銳的問題。
  2 怎樣評價抽樣調(diào)查的可靠性?
  施、王兩文質(zhì)疑研究報告的兩個最主要理由,就是統(tǒng)計局住戶調(diào)查樣本量大,所采用的分層隨機抽樣方法“有著較嚴密的科學(xué)依據(jù)”;而我們的調(diào)查樣本小得多,沒有采取與統(tǒng)計局相同的抽樣方法,對樣本的選擇“存在主觀性”,因此缺乏可信度。但這些評論回避了兩個最重要的問題。
  第一,樣本量大小,并不決定樣本是否無偏。只有當(dāng)不存在系統(tǒng)性偏差時,大樣本才在精確度上更占優(yōu)勢。與2億城鎮(zhèn)居民家庭相比,統(tǒng)計局6.5萬個住戶樣本也只占萬分之三。但這個樣本目前的問題,并不在于樣本量大小,而在于大量遺漏高收入戶。首先,由于在抽樣過程中頻繁遇到高收入居民拒訪,而替換的樣本不可能保證同樣的收入水平。這就必然導(dǎo)致樣本覆蓋面的系統(tǒng)性偏差。在這種缺陷未被糾正的情況下,樣本量再大,也不能提高其可信性。
  第二,抽樣方法的“科學(xué)性”,不能彌補數(shù)據(jù)失真導(dǎo)致的非抽樣誤差。目前統(tǒng)計局樣本的收入數(shù)據(jù),根據(jù)的是樣本戶的填報。而我們在調(diào)查中發(fā)現(xiàn),如果沒有有效措施,70%的高收入戶有低報收入的傾向,而且報出的收入與他們的真實收入平均相差幾倍。但在此之前,我們未曾聽說統(tǒng)計局針對低報收入采取過措施。
  王有捐先生在文章中說:“65000戶樣本量對全國和分省(區(qū)、市)有較高的代表性,在置信度為95%時,主要收支指標的抽樣誤差(不含漏報、少報等產(chǎn)生的非抽樣誤差)在5%以內(nèi)!钡F(xiàn)在的主要問題恰恰出在“漏報、少報等產(chǎn)生的非抽樣誤差”。避開這個主要問題,抽樣誤差再小也沒有意義。就像醫(yī)生給病人開錯了藥,藥品質(zhì)量再好也不解決問題。對于抽樣調(diào)查的評價,首先應(yīng)該是結(jié)果的真實性,而不能滿足于理論上的“科學(xué)性”。
  我們的研究項目在抽樣和推算方法上所做的探索,正是針對高收入樣本容易遺漏和收入數(shù)據(jù)不真實這兩個關(guān)鍵問題。我們?nèi)绻扇∨c統(tǒng)計局同樣的隨機抽樣方法,也難免同樣的系統(tǒng)性偏差。因此我們針對不同收入?yún)^(qū)間設(shè)立了樣本配額,以確保不遺漏高收入樣本;同時借鑒了社會學(xué)的調(diào)查方法,通過各地的專業(yè)調(diào)查人員直接以他們熟悉的人群(親屬、朋友、同事、鄰里)為調(diào)查對象來收集各項收入支出信息。由于調(diào)查人員基本了解調(diào)查對象的家庭經(jīng)濟狀況,并存在一定的信任關(guān)系,使嚴重低報收入的情況大大減少。
提到社會學(xué)調(diào)查方法,不能不提到我國老一輩社會學(xué)家費孝通和他的著作《江村經(jīng)濟》。這本書是他對自己姐姐居住村莊的鄉(xiāng)親鄰里進行調(diào)查的成果,成為一部解剖中國鄉(xiāng)村經(jīng)濟有代表性、影響深遠的著作。沒有聽說誰批評他的調(diào)查“樣本太小”,“沒有采用隨機抽樣方法”,因此“不科學(xué)”。這首先是因為信息的真實性和所反映問題的代表性。而這些并不是所有的大樣本隨機抽樣調(diào)查都能做到的。國際抽樣調(diào)查權(quán)威Kish在他的著作中,也沒有不適當(dāng)?shù)貜娬{(diào)抽樣方法的“科學(xué)性”,反而把它看做“‘自己創(chuàng)造的藝術(shù)’和它的科學(xué)性的結(jié)合”(Kish:《抽樣調(diào)查》,中文版1997)。
  在我們的調(diào)查中,為進一步降低敏感度,我們采取了匿名調(diào)查的方式,提供了信息保密和僅用于研究目的的承諾;在問卷設(shè)計上采取了先問消費、后問收入,先問分項、后問合計,不追問收入具體來源等調(diào)查方法。調(diào)查前,對各地調(diào)查人員進行了培訓(xùn)。調(diào)查后,對收到的問卷進行了嚴格的質(zhì)量和邏輯檢驗,剔除了相當(dāng)數(shù)量不合格問卷。所有這些措施,都是為了保證數(shù)據(jù)的真實性。這使我們得到的調(diào)查數(shù)據(jù)避免了嚴重的系統(tǒng)性偏差。
  由于在特定條件下采取了這種非常規(guī)調(diào)查方法,我們深知雖然得到的數(shù)據(jù)比較可信,但樣本分布并不代表城鎮(zhèn)居民的總體分布,不能用來做總體推斷。我們所采用的恩格爾系數(shù)法,就是在這種情況下所找到的一個解決問題的方法。由于基礎(chǔ)數(shù)據(jù)的可信性和樣本在不同地區(qū)、不同收入層次、不同職業(yè)身份的居民群體間分布的廣泛性,我們能夠用它獲取收入水平與恩格爾系數(shù)以及其他參數(shù)間的真實關(guān)系,并基于這種關(guān)系來對一定居民群體的收入水平進行推算。
  這一方法得到的結(jié)果,并不是一個總體推斷,而是在統(tǒng)計局分組樣本的基礎(chǔ)上,利用統(tǒng)計局數(shù)據(jù)中可信度較高的變量(一個主要變量是恩格爾系數(shù))來推算其真實收入水平,以校正其原來失真的數(shù)據(jù)。這一方法和總體推斷方法得到的結(jié)果非常不同。這在報告中有詳細的數(shù)據(jù)比較和說明。而施、王兩位一直強調(diào)我們是在做“總體推斷”,說“不是直接推斷也是間接推斷”,是很不客觀的。他們所批評的“沒有采用隨機抽樣方法”,也并不構(gòu)成我們這項研究的缺點,反而是在有限條件下能找到的一個驗證統(tǒng)計數(shù)據(jù)失真的有效解決方法。
  當(dāng)然也要說明,這項研究的目的,是對統(tǒng)計數(shù)據(jù)的偏差進行檢驗并作出近似推算,而不是要代替常規(guī)統(tǒng)計。作為一個民間研究機構(gòu),我們不可能擁有像國家統(tǒng)計局那樣龐大的統(tǒng)計機構(gòu)和遍布全國的調(diào)查隊伍,不可能進行能與之相比的大規(guī)模調(diào)查。但我們充分相信,所得到的高收入群體收入水平的推算結(jié)果,遠比現(xiàn)有的統(tǒng)計數(shù)據(jù)更真實,也能夠為改善統(tǒng)計數(shù)據(jù)提供一個參考。
  3 關(guān)于對研究報告的誤讀和錯誤解釋
  施、王兩文,除了對我們的調(diào)查樣本量和抽樣方法進行批評外,還提出了另外幾個理由說明研究報告的推算結(jié)果不可靠。但這幾個理由都有商榷的必要。
  1.王有捐文章說,我們的調(diào)查方法是通過“親戚再找親戚,朋友再找朋友”的“滾雪球”方法,不適合用來“推斷總體”。
  前面已經(jīng)說得很清楚,我們并沒有用自己的樣本來“推斷總體”。同時,我們的調(diào)查也根本不是王有捐先生所說的“滾雪球”方法。所有的調(diào)查都是由經(jīng)過培訓(xùn)的各地調(diào)查員直接訪問其熟悉的人群所產(chǎn)生,并沒有經(jīng)過任何中轉(zhuǎn)。如果認真讀過報告全文,應(yīng)該不會產(chǎn)生這樣武斷的誤解。
  2.王有捐先生質(zhì)疑我們的調(diào)查方法:“試想,這些不愿意向統(tǒng)計局調(diào)查員透露自己實際收入的高收入人群會僅因為調(diào)查員是熟人就如實相告?”顯然是在暗示我們的調(diào)查方法可能也低估了高收入人群的收入水平。然而他卻以此為理由證明我們的“估算結(jié)果有過高之嫌”,這顯然是自相矛盾的。
  王有捐文章還說,我們在問卷中詢問住戶是否愿意透露真實收入信息,是具有“明顯的傾向性”、“誘導(dǎo)性”,卻沒有說出傾向何在。而且問卷中這個問題只作為參考信息,并不改變?nèi)魏卧际杖霐?shù)據(jù)和推算數(shù)據(jù)。以此來說明我們的推算過高,是說不通的。
  3.王有捐說,研究報告在使用外部數(shù)據(jù)時“不嚴謹”,把居民儲蓄算高了。
  其一,是說報告沒有區(qū)分居民存款和公款私存。實際上從實行存款實名制后,公款私存的情況少多了。仍然存在的公款私存,一般無非是化“大公”為“小公”,把公款變成某些單位人員小團體的消費資金,實際上就是灰色收入的一個來源。那么這還能算是“公款”嗎?
  其二,是說報告沒有區(qū)分居民購房和單位購房。研究報告中計算的僅限于房地產(chǎn)開發(fā)商的住宅銷售部分。即便是單位出錢為個人購買住宅,難道不應(yīng)計入個人收入嗎?
  其三,是說報告沒有區(qū)分股市的居民投資、企業(yè)投資和國外投資。這更不客觀。研究報告中并沒有把股市、債市投資全部算成居民個人投資,而是保守地假定只有1/3來自居民儲蓄。這個估計也許不準確,但至少有高估和低估兩種可能,而斷定“高估”不知根據(jù)何在?
  其四,說“房價收入比在中國的合理界限為3年的提法也有待于進一步探討”。但報告中根本沒有這樣的提法,而是說“根據(jù)國外經(jīng)驗,通常商品住宅價格是居民家庭年收入的3~5倍,是可承受的價格”。上述說法不知來自何處?
  4.施、王兩文都說恩格爾系數(shù)與收入密切相關(guān),但也受其他因素影響,因此用恩格爾系數(shù)法推算收入水平“存在明顯問題”。事實上我們的研究通過模型分析法控制了影響恩格爾系數(shù)的多種因素,包括地區(qū)、城市規(guī)模(間接反映物價水平)、家庭平均教育水平、家庭規(guī)模、就業(yè)面等差異,在計算收入水平與恩格爾系數(shù)關(guān)系時已經(jīng)排除了其他這些因素的影響。這再次說明兩位商榷者或者沒有認真讀過報告全文,或者有選擇地忽略掉了報告的某些部分。
  5.施發(fā)啟提出:“如果采用報告中的計算結(jié)果,2008年居民可支配收入占GDP的比重將達到73.9%”,太高了,因此證明計算結(jié)果不合理。但施發(fā)啟文章的計算實際上是將居民收入上調(diào),但假定GDP不變,才會得到上述比例。這個假定本身就不合理。報告中已作了說明,如果居民收入有大量遺漏,GDP核算不可能沒有遺漏。例如,有的企業(yè)將內(nèi)部人員的灰色收入或?qū)ν獠康男匈V等支出,以虛假發(fā)票報銷等方式計入成本,低報了企業(yè)的實際增值,這些遺漏當(dāng)然也不可能進入GDP核算。
  6.施發(fā)啟文章還批評說,我們的調(diào)查數(shù)據(jù)是來自受訪者記憶,“沒有統(tǒng)計臺賬”,“調(diào)查方法不規(guī)范”。但就是在調(diào)查規(guī)范、有統(tǒng)計臺賬的情況下,統(tǒng)計局的高收入居民收入數(shù)據(jù)發(fā)生了嚴重的系統(tǒng)性偏差。我們的調(diào)查把最主要的工作放在保證數(shù)據(jù)的真實性方面。雖然舍棄了統(tǒng)計臺賬的方法,憑記憶容易產(chǎn)生數(shù)據(jù)誤差,但這種誤差是隨機的、雙向的,既可能偏低,也可能偏高。在平均的意義上,它們會在很大程度上互相抵消。而系統(tǒng)性偏差是同方向的,不可能互相抵消。因此可以有把握地說,這種隨機誤差會遠小于現(xiàn)行收入統(tǒng)計數(shù)據(jù)的系統(tǒng)性誤差。
  綜上述,兩位商榷者提出的論據(jù),有的是對研究報告的誤讀或錯誤解釋,有的是論據(jù)與結(jié)論南轅北轍。給人的感覺似乎是下結(jié)論在先,找根據(jù)在后,失去了學(xué)術(shù)上應(yīng)有的客觀性。
  還有一點需要討論,兩位在共同署名的第三篇文章中聲明,他們同筆者討論的是居民收入數(shù)據(jù)問題,而不是灰色收入問題。而在我看來,這兩者是難以分開的。雖然在統(tǒng)計上搞清灰色收入是很困難的事情,但鑒于目前灰色收入泛濫的情況,收入統(tǒng)計避開灰色收入就很難不失實。更重要的是,不澄清這些事實,躺在虛假數(shù)據(jù)上作分析,就無法合理應(yīng)對收入分配狀況惡化的挑戰(zhàn)。
  兩位的商榷文章當(dāng)然也提出了一些有價值的意見。例如,施發(fā)啟指出,使用年平均人數(shù)計算比用年末人數(shù)計算更合理(盡管對結(jié)果沒有重大影響),也指出研究報告中雖然模型的解釋變量系數(shù)通過了顯著性檢驗,但模型擬合度偏低。王有捐認為,研究報告中用外部相關(guān)數(shù)據(jù)對收入數(shù)據(jù)進行檢驗的方法值得借鑒。這些意見是合理的,有益于這些問題的進一步研究。兩位對于改善統(tǒng)計數(shù)據(jù)的表態(tài),也使人感到我們之間存在共同的基礎(chǔ),希望保持交流,把收入分配狀況搞清楚。
  (作者系中國經(jīng)濟體制改革基金會國民經(jīng)濟研究所副所長)
  凡標注來源為“經(jīng)濟參考報”或“經(jīng)濟參考網(wǎng)”的所有文字、圖片、音視頻稿件,及電子雜志等數(shù)字媒體產(chǎn)品,版權(quán)均屬新華社經(jīng)濟參考報社,未經(jīng)書面授權(quán),不得以任何形式發(fā)表使用。
 
相關(guān)新聞:
· 統(tǒng)計局官員澄清:和王小魯討論的非灰色收入的統(tǒng)計問題 2010-08-30
· 王小魯回應(yīng)統(tǒng)計局:房價是最好例證 2010-08-26
· 施發(fā)啟:也評王小魯博士的《灰色收入與國民收入分配》 2010-08-25
· “灰色收入”論戰(zhàn)升溫 王小魯回應(yīng) 2010-08-25
· 灰色收入論戰(zhàn) 統(tǒng)計局刊文質(zhì)疑王小魯 2010-08-25
 
頻道精選:
·[財智頻道]天價奇石開價過億元 誰是價格推手?·[財智頻道]存款返現(xiàn)赤裸裸 銀行攬存大戰(zhàn)白熱化
·[思想頻道]左曉蕾:信貸此時放松調(diào)控將前功盡棄·[思想頻道]謝和平:發(fā)展和掌握低碳核心技術(shù)
·[讀書頻道]《五常學(xué)經(jīng)濟》·[讀書頻道]投資盡可逆向思維 做人恪守道德底線