經(jīng)濟參考網(wǎng)

王小魯：收入分配不能躺在虛假數(shù)據(jù)上分析

2010-09-06 　　作者：　　來源：第一財經(jīng)日報

——答王有捐、施發(fā)啟對灰色收入研究的商榷
　　近日，國家統(tǒng)計局網(wǎng)站上連續(xù)登出了王有捐、施發(fā)啟兩位統(tǒng)計官員對我的灰色收入研究報告的商榷(注：下稱“研究報告”。該報告題為《灰色收入與國民收入分配》，全文載于中信出版社《比較》第48輯；為中國經(jīng)濟體制改革研究會課題)。隨后，他們兩位又共同署名，在統(tǒng)計局網(wǎng)站上發(fā)表了另一篇文章，表示愿意繼續(xù)就此問題進行研究，并表示國家統(tǒng)計局準備采取措施來改善居民收入統(tǒng)計中的少報、漏報問題。
　　他們對我的研究報告進行公開討論，以及關(guān)于改善居民收入統(tǒng)計的表態(tài)，是一種積極的態(tài)度，我非常歡迎。但這方面的討論，并不僅限于統(tǒng)計數(shù)據(jù)的真實性問題，而是進一步關(guān)系到如何認識我國當(dāng)前的收入分配狀況、如何應(yīng)對當(dāng)前突出的社會矛盾、如何推進改革來解決這些矛盾。我在這方面的研究，也是基于這個出發(fā)點而進行的。但搞清真實情況、獲得可信數(shù)據(jù)，是必要的前提。
　　因此，有必要把雙方爭議的一些問題搞清楚。本文對他們的商榷做一個回答，意在促使有關(guān)收入分配狀況的研究更加深入，為解決這些問題提供條件。
　　1 現(xiàn)行居民收入統(tǒng)計是否真實反映收入分配現(xiàn)狀
　　王有捐、施發(fā)啟的文章都同意目前的居民收入統(tǒng)計調(diào)查“存在漏報和少報的問題”，“高收入群體也較少進入調(diào)查樣本”；因此居民收入統(tǒng)計“可能存在低估的情況”。兩位也認為筆者的研究報告“在估算我國居民實際收入方面進行了有益的探索，尤其在獲取基礎(chǔ)數(shù)據(jù)和推算宏觀數(shù)據(jù)方面值得參考和借鑒”�！捌洳捎镁用窦矣闷�、商品住宅、出境旅游、銀行存款等外部相關(guān)數(shù)據(jù)對我國常規(guī)住戶調(diào)查居民收支數(shù)據(jù)進行驗證的方法為我們提供了不同的思路和模式，值得借鑒”。在這些方面，我們有一定的共同認識。
　　但施、王前兩文的重點，是批評我們的調(diào)查樣本比國家統(tǒng)計局的調(diào)查樣本量“明顯偏小”、沒有采取統(tǒng)計局所采用的隨機抽樣方法，因此“結(jié)果是不可靠的”，“估算結(jié)果明顯偏高”。
　　如果結(jié)果“不可靠”，會有偏高和偏低兩種可能。為什么是偏高而不是偏低？怎樣算出來“明顯偏高”？高多少？兩位商榷者并沒有做出解釋，看來還是根據(jù)現(xiàn)有統(tǒng)計數(shù)據(jù)來判斷的，就是說，似乎現(xiàn)有的收入統(tǒng)計仍然是可靠的，即便有偏差也不大。而筆者對高收入居民收入的估算“明顯偏高”，也是相對于統(tǒng)計數(shù)據(jù)而言。這不僅與兩位關(guān)于統(tǒng)計數(shù)據(jù)“可能存在低估”的說法有矛盾，而且涉及到一個關(guān)鍵問題：現(xiàn)行統(tǒng)計究竟是否反映了高收入群體的真實收入狀況？這是需要搞清楚的。
　　長期以來，我國收入分配差距持續(xù)擴大，特別是灰色收入大量存在，嚴重影響了收入分配狀況。但這些問題并沒有從統(tǒng)計上如實反映出來，特別是對高收入居民的收入統(tǒng)計嚴重脫離實際，不僅低估了收入差距擴大的嚴重性，也造成不同統(tǒng)計數(shù)據(jù)間的嚴重沖突。下面是幾個例子。
　　其一，據(jù)國家統(tǒng)計局公布的城鄉(xiāng)居民人均收入和城鄉(xiāng)人口數(shù)推算，2008年全國居民可支配收入總額不足13萬億元，而同樣來自國家統(tǒng)計局的資金流量表數(shù)據(jù)，卻顯示住戶可支配收入總額為18.2萬億元。后者是根據(jù)經(jīng)濟普查得出的，應(yīng)該比較全面。但這就證明居民住戶收入統(tǒng)計至少遺漏了5.3萬億元，漏掉了居民收入的近30%。類似情況已存在多年。如此嚴重的遺漏，還能認為是基本可靠嗎？這一問題，《第一財經(jīng)日報》在8月30日發(fā)表的《居民收入統(tǒng)計局兩套數(shù)據(jù)打架 5.3萬億元差距待解》一文中已有論述。
　　其二，與其他宏觀統(tǒng)計數(shù)據(jù)比較，會發(fā)現(xiàn)遺漏遠不止5.3萬億元。以2008年數(shù)據(jù)算，全國居民儲蓄總額(收入減去消費)在2008年為3.5萬億元，而當(dāng)年僅城鄉(xiāng)居民在金融機構(gòu)的儲蓄存款就增加了4.5萬億元，加上居民當(dāng)年購買商品住宅支出(扣除銀行貸款)，在股市、債市和實體經(jīng)濟的投資，手持現(xiàn)金等，實際的居民儲蓄應(yīng)該在11萬億元~11.5萬億元之間(未計算居民在國外的存款和投資)，是按居民收入統(tǒng)計數(shù)據(jù)計算的3.5萬億元儲蓄的3倍以上。上述計算依據(jù)的都是國家統(tǒng)計局公布的數(shù)據(jù)，這類數(shù)據(jù)沖突近些年來一直存在。
　　其三，按人均可支配收入水平算，根據(jù)統(tǒng)計，2008年城鎮(zhèn)居民人均收入只有1.57萬元；其中10%的最高收入家庭，人均也只有4.36萬元。這樣的人均收入是如何支撐當(dāng)年2萬多億元商品住宅銷售的？是怎樣把房價炒上天的？就算只有10%的最高收入家庭能夠買得起房，這部分人的當(dāng)年收入合計只有2.3萬億元，在買了2.1萬億元的商品住宅之后，他們吃什么？喝什么？拿什么錢買汽車？拿什么錢出國旅游？新存入銀行的4.5萬億元私人存款又是哪來的？
　　2008年，中國私人小汽車增加了560萬輛，保有量超過2800萬輛，而城鎮(zhèn)10%的最高收入家庭總共不過2000萬戶。據(jù)悉，價值數(shù)百萬的世界頂級豪華轎車勞斯萊斯，在中國的銷量已占全球第三，僅次于美、英。
　　2008年，中國居民因私出國出境4013萬人次，超過了同年美國出國人數(shù)(4002萬人次)。據(jù)日本官方統(tǒng)計，2009年僅訪日的中國游客有110萬人次，在日本境內(nèi)人均花費11.7萬日元，而美國游客在日本人均花費僅2.5萬日元(2010年8月24日《參考消息》)。根據(jù)統(tǒng)計，中國城鎮(zhèn)居民的人均收入只相當(dāng)于美國人均收入的1/15，10%最富城鎮(zhèn)家庭的人均收入也不到美國人均收入的1/5，怎么可能支撐這樣的高消費，統(tǒng)計上解釋得通嗎？
　　據(jù)悉，2008年內(nèi)地流入澳門的賭資就高達數(shù)百億元。如果將其分攤給2000萬個最高收入家庭，每戶也有幾千元。這些錢又來自何處？
　　僅此幾例，足以說明關(guān)于高收入居民收入狀況的統(tǒng)計數(shù)據(jù)已嚴重脫離實際。這種情況不改變，會掩蓋實情，誤導(dǎo)決策，帶來嚴重后果。所以統(tǒng)計部門和經(jīng)濟學(xué)者的共同責(zé)任，是面對現(xiàn)實，搞清情況，不能繼續(xù)滿足于統(tǒng)計調(diào)查“樣本量大”、“方法科學(xué)”等表面文章，回避這些尖銳的問題。
　　2 怎樣評價抽樣調(diào)查的可靠性？
　　施、王兩文質(zhì)疑研究報告的兩個最主要理由，就是統(tǒng)計局住戶調(diào)查樣本量大，所采用的分層隨機抽樣方法“有著較嚴密的科學(xué)依據(jù)”；而我們的調(diào)查樣本小得多，沒有采取與統(tǒng)計局相同的抽樣方法，對樣本的選擇“存在主觀性”，因此缺乏可信度。但這些評論回避了兩個最重要的問題。
　　第一，樣本量大小，并不決定樣本是否無偏。只有當(dāng)不存在系統(tǒng)性偏差時，大樣本才在精確度上更占優(yōu)勢。與2億城鎮(zhèn)居民家庭相比，統(tǒng)計局6.5萬個住戶樣本也只占萬分之三。但這個樣本目前的問題，并不在于樣本量大小，而在于大量遺漏高收入戶。首先，由于在抽樣過程中頻繁遇到高收入居民拒訪，而替換的樣本不可能保證同樣的收入水平。這就必然導(dǎo)致樣本覆蓋面的系統(tǒng)性偏差。在這種缺陷未被糾正的情況下，樣本量再大，也不能提高其可信性。
　　第二，抽樣方法的“科學(xué)性”，不能彌補數(shù)據(jù)失真導(dǎo)致的非抽樣誤差。目前統(tǒng)計局樣本的收入數(shù)據(jù)，根據(jù)的是樣本戶的填報。而我們在調(diào)查中發(fā)現(xiàn)，如果沒有有效措施，70%的高收入戶有低報收入的傾向，而且報出的收入與他們的真實收入平均相差幾倍。但在此之前，我們未曾聽說統(tǒng)計局針對低報收入采取過措施。
　　王有捐先生在文章中說：“65000戶樣本量對全國和分省(區(qū)、市)有較高的代表性，在置信度為95%時，主要收支指標的抽樣誤差(不含漏報、少報等產(chǎn)生的非抽樣誤差)在5%以內(nèi)�！钡F(xiàn)在的主要問題恰恰出在“漏報、少報等產(chǎn)生的非抽樣誤差”。避開這個主要問題，抽樣誤差再小也沒有意義。就像醫(yī)生給病人開錯了藥，藥品質(zhì)量再好也不解決問題。對于抽樣調(diào)查的評價，首先應(yīng)該是結(jié)果的真實性，而不能滿足于理論上的“科學(xué)性”。
　　我們的研究項目在抽樣和推算方法上所做的探索，正是針對高收入樣本容易遺漏和收入數(shù)據(jù)不真實這兩個關(guān)鍵問題。我們?nèi)绻扇∨c統(tǒng)計局同樣的隨機抽樣方法，也難免同樣的系統(tǒng)性偏差。因此我們針對不同收入?yún)^(qū)間設(shè)立了樣本配額，以確保不遺漏高收入樣本；同時借鑒了社會學(xué)的調(diào)查方法，通過各地的專業(yè)調(diào)查人員直接以他們熟悉的人群(親屬、朋友、同事、鄰里)為調(diào)查對象來收集各項收入支出信息。由于調(diào)查人員基本了解調(diào)查對象的家庭經(jīng)濟狀況，并存在一定的信任關(guān)系，使嚴重低報收入的情況大大減少。
提到社會學(xué)調(diào)查方法，不能不提到我國老一輩社會學(xué)家費孝通和他的著作《江村經(jīng)濟》。這本書是他對自己姐姐居住村莊的鄉(xiāng)親鄰里進行調(diào)查的成果，成為一部解剖中國鄉(xiāng)村經(jīng)濟有代表性、影響深遠的著作。沒有聽說誰批評他的調(diào)查“樣本太小”，“沒有采用隨機抽樣方法”，因此“不科學(xué)”。這首先是因為信息的真實性和所反映問題的代表性。而這些并不是所有的大樣本隨機抽樣調(diào)查都能做到的。國際抽樣調(diào)查權(quán)威Kish在他的著作中，也沒有不適當(dāng)?shù)貜娬{(diào)抽樣方法的“科學(xué)性”，反而把它看做“‘自己創(chuàng)造的藝術(shù)’和它的科學(xué)性的結(jié)合”(Kish：《抽樣調(diào)查》，中文版1997)。
　　在我們的調(diào)查中，為進一步降低敏感度，我們采取了匿名調(diào)查的方式，提供了信息保密和僅用于研究目的的承諾；在問卷設(shè)計上采取了先問消費、后問收入，先問分項、后問合計，不追問收入具體來源等調(diào)查方法。調(diào)查前，對各地調(diào)查人員進行了培訓(xùn)。調(diào)查后，對收到的問卷進行了嚴格的質(zhì)量和邏輯檢驗，剔除了相當(dāng)數(shù)量不合格問卷。所有這些措施，都是為了保證數(shù)據(jù)的真實性。這使我們得到的調(diào)查數(shù)據(jù)避免了嚴重的系統(tǒng)性偏差。
　　由于在特定條件下采取了這種非常規(guī)調(diào)查方法，我們深知雖然得到的數(shù)據(jù)比較可信，但樣本分布并不代表城鎮(zhèn)居民的總體分布，不能用來做總體推斷。我們所采用的恩格爾系數(shù)法，就是在這種情況下所找到的一個解決問題的方法。由于基礎(chǔ)數(shù)據(jù)的可信性和樣本在不同地區(qū)、不同收入層次、不同職業(yè)身份的居民群體間分布的廣泛性，我們能夠用它獲取收入水平與恩格爾系數(shù)以及其他參數(shù)間的真實關(guān)系，并基于這種關(guān)系來對一定居民群體的收入水平進行推算。
　　這一方法得到的結(jié)果，并不是一個總體推斷，而是在統(tǒng)計局分組樣本的基礎(chǔ)上，利用統(tǒng)計局數(shù)據(jù)中可信度較高的變量(一個主要變量是恩格爾系數(shù))來推算其真實收入水平，以校正其原來失真的數(shù)據(jù)。這一方法和總體推斷方法得到的結(jié)果非常不同。這在報告中有詳細的數(shù)據(jù)比較和說明。而施、王兩位一直強調(diào)我們是在做“總體推斷”，說“不是直接推斷也是間接推斷”，是很不客觀的。他們所批評的“沒有采用隨機抽樣方法”，也并不構(gòu)成我們這項研究的缺點，反而是在有限條件下能找到的一個驗證統(tǒng)計數(shù)據(jù)失真的有效解決方法。
　　當(dāng)然也要說明，這項研究的目的，是對統(tǒng)計數(shù)據(jù)的偏差進行檢驗并作出近似推算，而不是要代替常規(guī)統(tǒng)計。作為一個民間研究機構(gòu)，我們不可能擁有像國家統(tǒng)計局那樣龐大的統(tǒng)計機構(gòu)和遍布全國的調(diào)查隊伍，不可能進行能與之相比的大規(guī)模調(diào)查。但我們充分相信，所得到的高收入群體收入水平的推算結(jié)果，遠比現(xiàn)有的統(tǒng)計數(shù)據(jù)更真實，也能夠為改善統(tǒng)計數(shù)據(jù)提供一個參考。
　　3 關(guān)于對研究報告的誤讀和錯誤解釋
　　施、王兩文，除了對我們的調(diào)查樣本量和抽樣方法進行批評外，還提出了另外幾個理由說明研究報告的推算結(jié)果不可靠。但這幾個理由都有商榷的必要。
　　1.王有捐文章說，我們的調(diào)查方法是通過“親戚再找親戚，朋友再找朋友”的“滾雪球”方法，不適合用來“推斷總體”。
　　前面已經(jīng)說得很清楚，我們并沒有用自己的樣本來“推斷總體”。同時，我們的調(diào)查也根本不是王有捐先生所說的“滾雪球”方法。所有的調(diào)查都是由經(jīng)過培訓(xùn)的各地調(diào)查員直接訪問其熟悉的人群所產(chǎn)生，并沒有經(jīng)過任何中轉(zhuǎn)。如果認真讀過報告全文，應(yīng)該不會產(chǎn)生這樣武斷的誤解。
　　2.王有捐先生質(zhì)疑我們的調(diào)查方法：“試想，這些不愿意向統(tǒng)計局調(diào)查員透露自己實際收入的高收入人群會僅因為調(diào)查員是熟人就如實相告？”顯然是在暗示我們的調(diào)查方法可能也低估了高收入人群的收入水平。然而他卻以此為理由證明我們的“估算結(jié)果有過高之嫌”，這顯然是自相矛盾的。
　　王有捐文章還說，我們在問卷中詢問住戶是否愿意透露真實收入信息，是具有“明顯的傾向性”、“誘導(dǎo)性”，卻沒有說出傾向何在。而且問卷中這個問題只作為參考信息，并不改變?nèi)魏卧际杖霐?shù)據(jù)和推算數(shù)據(jù)。以此來說明我們的推算過高，是說不通的。
　　3.王有捐說，研究報告在使用外部數(shù)據(jù)時“不嚴謹”，把居民儲蓄算高了。
　　其一，是說報告沒有區(qū)分居民存款和公款私存。實際上從實行存款實名制后，公款私存的情況少多了。仍然存在的公款私存，一般無非是化“大公”為“小公”，把公款變成某些單位人員小團體的消費資金，實際上就是灰色收入的一個來源。那么這還能算是“公款”嗎？
　　其二，是說報告沒有區(qū)分居民購房和單位購房。研究報告中計算的僅限于房地產(chǎn)開發(fā)商的住宅銷售部分。即便是單位出錢為個人購買住宅，難道不應(yīng)計入個人收入嗎？
　　其三，是說報告沒有區(qū)分股市的居民投資、企業(yè)投資和國外投資。這更不客觀。研究報告中并沒有把股市、債市投資全部算成居民個人投資，而是保守地假定只有1/3來自居民儲蓄。這個估計也許不準確，但至少有高估和低估兩種可能，而斷定“高估”不知根據(jù)何在？
　　其四，說“房價收入比在中國的合理界限為3年的提法也有待于進一步探討”。但報告中根本沒有這樣的提法，而是說“根據(jù)國外經(jīng)驗，通常商品住宅價格是居民家庭年收入的3~5倍，是可承受的價格”。上述說法不知來自何處？
　　4.施、王兩文都說恩格爾系數(shù)與收入密切相關(guān)，但也受其他因素影響，因此用恩格爾系數(shù)法推算收入水平“存在明顯問題”。事實上我們的研究通過模型分析法控制了影響恩格爾系數(shù)的多種因素，包括地區(qū)、城市規(guī)模(間接反映物價水平)、家庭平均教育水平、家庭規(guī)模、就業(yè)面等差異，在計算收入水平與恩格爾系數(shù)關(guān)系時已經(jīng)排除了其他這些因素的影響。這再次說明兩位商榷者或者沒有認真讀過報告全文，或者有選擇地忽略掉了報告的某些部分。
　　5.施發(fā)啟提出：“如果采用報告中的計算結(jié)果，2008年居民可支配收入占GDP的比重將達到73.9%”，太高了，因此證明計算結(jié)果不合理。但施發(fā)啟文章的計算實際上是將居民收入上調(diào)，但假定GDP不變，才會得到上述比例。這個假定本身就不合理。報告中已作了說明，如果居民收入有大量遺漏，GDP核算不可能沒有遺漏。例如，有的企業(yè)將內(nèi)部人員的灰色收入或?qū)ν獠康男匈V等支出，以虛假發(fā)票報銷等方式計入成本，低報了企業(yè)的實際增值，這些遺漏當(dāng)然也不可能進入GDP核算。
　　6.施發(fā)啟文章還批評說，我們的調(diào)查數(shù)據(jù)是來自受訪者記憶，“沒有統(tǒng)計臺賬”，“調(diào)查方法不規(guī)范”。但就是在調(diào)查規(guī)范、有統(tǒng)計臺賬的情況下，統(tǒng)計局的高收入居民收入數(shù)據(jù)發(fā)生了嚴重的系統(tǒng)性偏差。我們的調(diào)查把最主要的工作放在保證數(shù)據(jù)的真實性方面。雖然舍棄了統(tǒng)計臺賬的方法，憑記憶容易產(chǎn)生數(shù)據(jù)誤差，但這種誤差是隨機的、雙向的，既可能偏低，也可能偏高。在平均的意義上，它們會在很大程度上互相抵消。而系統(tǒng)性偏差是同方向的，不可能互相抵消。因此可以有把握地說，這種隨機誤差會遠小于現(xiàn)行收入統(tǒng)計數(shù)據(jù)的系統(tǒng)性誤差。
　　綜上述，兩位商榷者提出的論據(jù)，有的是對研究報告的誤讀或錯誤解釋，有的是論據(jù)與結(jié)論南轅北轍。給人的感覺似乎是下結(jié)論在先，找根據(jù)在后，失去了學(xué)術(shù)上應(yīng)有的客觀性。
　　還有一點需要討論，兩位在共同署名的第三篇文章中聲明，他們同筆者討論的是居民收入數(shù)據(jù)問題，而不是灰色收入問題。而在我看來，這兩者是難以分開的。雖然在統(tǒng)計上搞清灰色收入是很困難的事情，但鑒于目前灰色收入泛濫的情況，收入統(tǒng)計避開灰色收入就很難不失實。更重要的是，不澄清這些事實，躺在虛假數(shù)據(jù)上作分析，就無法合理應(yīng)對收入分配狀況惡化的挑戰(zhàn)。
　　兩位的商榷文章當(dāng)然也提出了一些有價值的意見。例如，施發(fā)啟指出，使用年平均人數(shù)計算比用年末人數(shù)計算更合理(盡管對結(jié)果沒有重大影響)，也指出研究報告中雖然模型的解釋變量系數(shù)通過了顯著性檢驗，但模型擬合度偏低。王有捐認為，研究報告中用外部相關(guān)數(shù)據(jù)對收入數(shù)據(jù)進行檢驗的方法值得借鑒。這些意見是合理的，有益于這些問題的進一步研究。兩位對于改善統(tǒng)計數(shù)據(jù)的表態(tài)，也使人感到我們之間存在共同的基礎(chǔ)，希望保持交流，把收入分配狀況搞清楚。
　　(作者系中國經(jīng)濟體制改革基金會國民經(jīng)濟研究所副所長)

　　凡標注來源為“經(jīng)濟參考報”或“經(jīng)濟參考網(wǎng)”的所有文字、圖片、音視頻稿件，及電子雜志等數(shù)字媒體產(chǎn)品，版權(quán)均屬新華社經(jīng)濟參考報社，未經(jīng)書面授權(quán)，不得以任何形式發(fā)表使用。

相關(guān)新聞：

·	統(tǒng)計局官員澄清:和王小魯討論的非灰色收入的統(tǒng)計問題 2010-08-30

·	王小魯回應(yīng)統(tǒng)計局:房價是最好例證 2010-08-26

·	施發(fā)啟：也評王小魯博士的《灰色收入與國民收入分配》 2010-08-25

·	“灰色收入”論戰(zhàn)升溫王小魯回應(yīng) 2010-08-25

·	灰色收入論戰(zhàn) 統(tǒng)計局刊文質(zhì)疑王小魯 2010-08-25

頻道精選：

[財智頻道]天價奇石開價過億元誰是價格推手？

[財智頻道]存款返現(xiàn)赤裸裸銀行攬存大戰(zhàn)白熱化

[思想頻道]左曉蕾：信貸此時放松調(diào)控將前功盡棄

[思想頻道]謝和平：發(fā)展和掌握低碳核心技術(shù)

[讀書頻道]《五常學(xué)經(jīng)濟》

[讀書頻道]投資盡可逆向思維做人恪守道德底線