注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

梁中堂的博客

 
 
 

日志

 
 

我国人口统计瞒报漏报体制和机制问题研究(一)  

2007-05-31 18:00:16|  分类: 默认分类 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
 

我国人口统计瞒报漏报体制和机制问题研究 

(本文是作者《关于20世纪末中国大陆人口总量和

妇女生育率水平的研究》一文的第三、四、五部分,该文全文载《生产力研究》2003年3期)

梁中堂

一、   2000年普查凸显了统计体制的矛盾

1、  普查公报带来的疑惑

第五次全国人口普查公报发布以后,围绕人口总数和普查质量,人们产生许多疑问。第一,2000年普查发布的人口总量和过去几次不同,过去的普查登记到“人”,公布到“人”。而第五次人口普查虽然仍旧登记到“人”,但不同的是公布到“万人”。比如第一次人口普查公告“一九五三年六月三十日二十三时的全国人口总数为六亿零一百九十三万八千零三十五人”,第二次全国人口普查结果为“1964年6月30日24时的全国人口总数为723 070 269人”,第三次普查公报报告“全国人口为1 031 882 511”,第四次普查公报报告“全国人口为1 160 017 381人”。第二,按照惯例,普查后的质量抽查有一系列检验指标,但这次只有一个1.81%的漏登率,没有重登率,也没有年龄、性别和出生、死亡登记误差。人口普查的质量检验不应该没有这些内容。第三,根据2002年8月出版的《中国2000年人口普查资料》,普查实际登记的全国总人口为1 242 612 226人,和公报公布数126 583万相差23 217 774人。这个漏报数是直接登记人口的1.86%(如果不含解放军为1.87%),是公告总人口的1.83%。1.81%是怎样产生的?如果是某个漏登率和重登率之差,那为什么不这样公告?第四,按照通常情况,如果漏报比例较大,应该发布实际登记人数和计算漏登后的总人口数,但这次只公布一个人口总数。

2、  普查后的质量抽查同样不可靠根据统计原理,普查和包括抽样调查在内的其他各种调查统计比较,普查属于最全面、最权威性的统计。在一般情况下,当人口普查和其他类型的调查发生矛盾时,应当以普查纠正、覆盖其他类型的调查,而不是相反。普查实际登记人口1 242 612 226人(未含250万解放军现役军人)竟比1999年度、1998年度公告的年底人口都少,用1.81%的漏登率校正总人口,实际上是用历年人口变动抽样调查纠正普查登记结果。其实,如果说普查登记发生较大规模的误差,那么,普查后的质量抽查也不一定能比普查更准确。因为,即使按照这样的漏登率调整的人口总数,也仅仅比1999年底增加674万。这就是说,2000年普查前的10个月全国仅净增人口674万,同样不符合多年来的人口统计实践。

说普查后的质量抽查不一定可靠,是由其抽查方法自身决定的。我们知道,普查后的质量抽查是采取抽样调查的方法进行的。抽样调查是以概率论为基础,按随机原则从总体中抽取部分单位进行调查,然后根据对抽取部分调查结果进一步估计和推断总体特征的一种非全面统计调查方法。这种调查方法是以部分估计和评价总体。这就决定了,第一,因为用部分所具有的一些属性反映总体的特征,可能出现部分具有的某些特性而总体却不具有这种性质。这在统计学上被称之为“抽样偏差”。抽样偏差是一般抽样调查都难以完全避免的。这就是说,第二,部分就是部分,在总体的许多特征方面,部分永远难以全面反映和概括总体。部分要比较准确地反映和概括全部,部分如果无法尽可能地扩张和放大,以致较为接近甚至达到总体,那么,这个部分至少也应该达到一定的比例,而不是任何一个小的比例都可以称之为抽样调查。在总体的许多属性方面,没有一定量的部分,就难以充分反映总体。还有很重要的一点是,第三,因为部分是属于总体的部分,所以,总体的某些暂时令人还无法认识的属性或者人们在全部调查时暂时还无法得到的情况,在部分调查中也同样无法认识或无法通过调查对其做全面的了解。

根据这样的认识,第一,“五普”后的质量抽查至少因为抽样的样本太少,不能确切反映出普查过程中的质量问题。普查后的质量抽查是现代人口普查的惯例。1954年我国第一次人口普查后抽查5295万以上的人口,占直接调查登记人口的9%。1964年第二次全国人口普查后的质量抽查人口3688.5万,占普查登记人口的5.3%。从1982年人口普查起,用抽样调查的方法来评价人口普查登记质量。(武洁,2002)这次抽取187 362人,占普查登记人口的0.18‰。1990年普查后的质量抽样调查抽取了173 409人,占普查登记0.15‰。2000年抽查了162 940人,抽样比0.13‰。我们可以看出,质量抽查的比例愈来愈低,万分之一点三的比例恐怕不能反映普查的整体质量情况。

第二,质量抽查时间的启动过于晚。因为本次普查摸底和平时掌握的情况反差太大,用了20多天时间复查补漏,抽查工作选择的时间是2000年11月25日,距离普查时点落后25天。1990年普查后的质量抽查是一个月后进行的,我们没有必要评论上次普查后的抽查的质量问题。但是,和上次情况不同的是,上次普查较本次普查更依赖于户口登记。2000年的普查修改了常住户的定义,有许多人口可以是常住户,但却不一定在其户口所在地登记。这样一来,相当多的人口实际登记地就脱离了他(她)的户籍所在地。25天后检查登记地与户籍地一致的人口登记还可以,但要检查半年前离开户籍地的人口和暂住人口的登记情况,可能就有较大误差。

第三,普查后的质量抽查和人口普查有所区别,这是从调查方法方面讲的。在我国,这两种调查对于调查对象和调查样本来说,却没有任何区别。对于被抽查的602个调查小区、45952户家庭户和162 940人来说,只是在25天以后重新登记一次(当然登记的项目减少了许多)。这只可能查出个别普查员工作上的疏漏和误差,如果存在统计机制方面的障碍,或者登记对象有意逃避或者家庭户有意隐匿,甚至实施人口普查登记工作的有关方面存在漏报的主观意识,质量抽查则是无能为力的。在这种情况下,普查登记时遗漏的,质量抽查时可能同样会出现遗漏。

本节所持观点不是要否定本次普查的质量抽查。但是,如果连普查都需要证明质量问题的话,质量抽查作为一种抽样调查是一种比普查等级要低的调查方法,其本身的质量当然是需要证明才能说明的问题。因为,在过去的两次普查中,我们曾经拥有比2000年要小得多的误差率,但后来发现这些误差率并没有反映出真实的情况。何况,这次普查长表、短表的不同情况,使得普查后的质量抽查工作更为复杂,要证明其质量就更为困难。

3、 2000年普查出现的问题在历次人口调查中都不同程度地存在过

第五次人口普查的普查时点是2000年11月1日零时。11月5日,各地登记摸底的数字汇总后比预料的数字相差相当大。经过近20天复查补漏,才有了现在按照实际直接登记汇总的1242 612 226人的总人口数。即使加上解放军250万,2000年普查登记数不仅比1999年年底125 909万少1648万,而且比1998年年底124 810万还少349万。上个世纪80年代以来,每次人口调查都有较大遗漏,并且遗漏现象越来越严重。不同的是,这次普查登记遗漏更为严重,以致无法和历年人口变动监测报告的数据弥合,凸显了我国人口统计体制方面存在的问题。

二、  从历次调查看我国人口统计体制和机制方面存在的问题

1、  三次普查的部分数据比较

1982年和1990年的人口普查都被认为是质量相当高的两次普查。根据1982年普查后的质量抽查,重报人口占0.71‰,漏报人口占0.56‰,重漏相抵,净差人口0.15‰;性别误差率0.03‰;年龄误差率6.16‰;1981年出生漏报率1.83‰,  1981年死亡漏报率4.40‰。1990年被认为是继1982年普查后的又一次质量较高的人口普查。根据普查后的质量抽查,人口重登率0.1‰, 漏登率0.7‰, 重漏相抵,净差率0.6‰;性别误差率0.14‰;年龄误差率3.07‰;出生人口误差率1.03‰,死亡误差率4.9‰。这些数据表明每次普查都有很高的质量。但是,如果比较前后两次普查的个别年龄人口,发现情况又不是这样。请看表2。

 

表1  1982年、1990年两次普查的几组年龄人口比较

                                                              (单位  万人)

1982年普查①    出生年份     1990年普查②       相   差

  年 龄    登记数                     年 龄     登记数

   0      2081        1982        8       2204         123

   1      1737        1981        9       1812         75

   2      1827        1980        10      1926         99

   3      1962        1979        11      1937         -25

   4      1863        1978        12      1891         28

   5      940 (女)    1977        13      941(女)    1

   6      2042        1976        14      2050         8

  

   14③   1190(女)  1970        22      1196(女)   6

   15     2274        1969        23      2285         11

   16     2566        1968        24      2522         -44

   17     2443        1967        25      2455         12

   18     2511        1966        26      2530         19

   19     1365(男)    1965        27      1396(男)   31

   20     1560        1964        28      1591         31

   21     1067        1963        29      1150         83

   22     1430        1962        30      1442         12

   23     1429        1961        31      1437         8

                                                                  

资料来源和注释

①按《中国1982年人口普查10%抽样资料》计算;②按《中国1990年人口普查10%抽样资料》计算;③关于1982年14-23岁组、1990年22-31岁组的登记误差可能不同于再低一些年龄组的情况。因为这部分人口在1982年漏登虽然不属于计划生育问题,但明显漏报也属于普查后质量抽查外的因素,这和低年龄漏报却没有本质区别,所以,我还是摘录于此。[3]

 在此之前,已经有不少学者指出1982年和1990年普查存在的遗漏和瞒报问题。(张为民崔红艳,1993;乔晓春李建新,1995;崔红艳张为民,2002;周皓,2003)表2表明,1982年普查登记的同一年龄人口在经过8年后,不仅没有因死亡而减少,反而增加了几万到100多万不等。从逻辑上说,不是1982年普查少登记了,就是1990年同年龄的人口重复登记了;或者,两次普查在这几个年龄组上都出了问题。而这几个年龄组的差错显然又不包括在普查登记后的质量抽查的差错率里面。因为,如果这几个年龄组的差错计算在1982年或1990年的普查质量里面,无论1982年的漏报或者1990年的重登,其差错率都要比公告的数据高很多。同样的情况,在1990年和2000年两次普查更为明显。(见表3)

表2  1990年、2000年两次普查的几组实际登记年龄人口的比较

                                                                (单位  万人)

1990年普查 ①    出生年份      2000年普查 ①      相   差②

   年 龄    实际登记                    年 龄     实际登记

    0      2322        1990        10       2621         299

    1      2333        1989        11       2514         181

    2      2418        1988        12       2458         40

    3      2429        1987        13       2628         199

    4      2141        1986        14       2319         178

5      1998        1985        15       2043         45

6      1906        1984        16       2031         126

7      2020        1983        17       2007         -13

8      2202        1982        18       2310         108

9      1809        1981        19       1912         103

  资料来源和注释

 ①数据来自1990年和2000年人口普查;②两次普查时点差别主要对1990年普查时的0岁组即2000年的10岁组有影响,本表未做调整。

 从表2表3可以看出,第一,这一类的差错都是发生在前一次普查时的低年龄段。第二,发生在低年龄段是因为这些年龄的人口和当时的计划生育工作联系得很密切。最早出现这一类差错的年龄人口是表2中1982年普查时6岁组和1990年普查时14岁组,该年龄人口属于1976年出生的人口。这个时期计划生育已经被中央政府多次提起,有些地方政府开始创造出给生育对象下达指标等控制人口过快增长的办法。这些模拟计划经济下达指令性计划的管理办法,在之后的几年很快在全国得到推广。特别是1978年提出“一对夫妇只生一个孩子”后,人口生育瞒报漏报的现象越来越普遍了。第三,没有考虑死亡因素的两次普查登记对比说明,这一类的差错率并没有包含在普查登记后的质量抽查之中。所以,如果说每次普查登记的质量都相对可靠的话,那只能是说除去固定地一块漏登人口之外。在每次人口调查中,低年龄组的较大一块,都要游离于统计之外。这种情况至少从上个世纪70年代后期就开始了,到1990年人口普查后越来越为严重。为了证明这一点,我们不妨将1982年以来几乎所有大型人口调查的一些资料系统分析比较一下。

2、  不同次人口调查的生育率比较

本节使用的文献资料基本限于第2节所列国家统计局(国务院人口普查办公室)和国家计划生育委员会自1982年以来所做的大型人口和生育调查。为了便于比较,我只是把不同机构的调查按照实施调查的年度顺序分别排列在一起。请先看表4。

表3  国家计划生育委员会几次调查中有关我国妇女总和生育率的比较

年份    1982年①     1988年②       1992年③     1997年④      2001年⑤

     

1980     2.24          2.38            2.39

1981     2.63          2.62            2.56

1982                   2.86            2.79

1983                   2.42            2.41

1984                   2.37            2.31

1985                   2.18            2.28

1986                   2.34            2.46        2.59

1987                   2.52            2.57        2.66

1988                                   2.28        2.41

1989                                   2.24        2.40

1990                                   2.04        2.29           2.29

1991                                   1.66        1.75           1.77

1992                                   1.47        1.57           1.59

1993                                               1.51           1.52

1994                                               1.32           1.41

1995                                               1.33           1.45

1996                                               1.35           1.36

1997                                                              1.27

1998                                                              1.34

1999                                                              1.29

2000                                                              1.45

                                                                  

资料来源

①国家计划生育委员会1982年1‰人口生育率抽样调查,《中国人口年鉴》(1985);②国家计划生育委员会1988年2‰人口生育节育抽样调查,根据格里菲斯•费尼 袁建华(1996)③国家计划生育委员会1992年中国生育率抽样调查,于景元 袁建华(1996)④国家计划生育委员会1997年全国人口与生殖健康抽样调查,郭志刚(2000);⑤国家计划生育委员会2001年全国计划生育/生殖健康调查,丁俊峰(2003)。

 按照一般调查规律说,大凡回顾性调查,调查时与调查期相互间隔的时间越是久远,因为遗忘而使相关统计数据越小。但是,从表4各次调查的重叠数据比较,可以发现一个奇怪的现象,即除个别年份外,后次的调查总是比前次调查的

表4  我国人口普查和国家统计局几次调查中有关妇女总和生育率的比较

                                                           

年份  1982年①  1987年②     1990年③     1995年④            2000年⑤

     

1980           2.55             2.65       

1981  2.64     2.41             2.42           

1982           2.83             2.85           

1983           2.53             2.57           

1984           2.35             2.38           

1985           2.21             2.39           

1986           2.33             2.38                       

1987           2.46             2.57                       

1988                            2.39                        

1989                            2.24                       

1990                            2.14                       

1991                                                              1.92

1992                                                              1.79

1993                                                              1.71

1994                                                              1.57

1995                                        1.46                  1.62

1996                                                              1.45

1997                                                              1.38

1998                                                              1.33

1999                                                              1.09

2000                                                              1.30

                                                                   

资料来源

①1982年人口普查,根据查瑞传(1984);②1987年1%人口抽样调查, 根据格里菲斯•·费尼袁建华(1996);③1990年人口普查,根据格里菲斯·费尼袁建华(1996);④1995年中国1%人口抽样调查,根据张为民于弘文崔红艳(1997);⑤2000年人口普查,根据崔红艳张为民(2002)。

 数据要高一些,特别是前一次调查的当年及其相近的年份就更是如此。这种情况同样发生在全国人口普查和国家统计局的几次“小普查”中。(见表5)

其实,1992年以后,这种现象基本上已经不在乎是否是全国人口普查、国家统计局拟或国家计划生育委员会,只要是后来的人口调查,往往总比前次调查数据高一些。所以,为了方便读者自己相互比较,我在表4表5中都将列举的资料尽可能地延伸下去。

 

  评论这张
 
阅读(1048)| 评论(1)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017