【原文责编】朱犁
【项目】本文为国家自然科学基金重大项目课题“健康老龄化——老年人口健康影响因素及有效干预的基础科学问题研究”(编号:71490732)的阶段性成果。
目前生命表技术不仅被广泛用于研究婚姻、生育、就业、迁移、教育等多种人口与社会现象,而且在生物学、医学等其他学科领域得到应用,成为重要的分析工具。生命表是反映某一时期某一人口死亡和生存水平的,通常是一个国家或地区使用人口普查或抽样调查数据,从假定队列的视角、利用时期的数据,以人口年龄别死亡率为基础而编制的,年龄别死亡数据是编制生命表最基础的信息。任何调查数据都有可能存在质量问题,而死亡数据质量直接决定生命表编制的准确性,因此在生命表编制之前必须对死亡数据质量进行评估和必要的调整。虽然中国已进行过多次人口普查,但由于死亡数据质量存在问题,直接运用普查的原始死亡数据编制生命表计算的预期寿命并不能准确地反映人口的真实情况。目前,已有很多学者对中国历年人口普查数据质量进行了评估,并通过对死亡数据较差的婴幼儿死亡概率和高龄老年人口死亡概率的调整和分析,得到了许多有价值的研究成果。然而,同时对婴幼儿和高龄人口死亡数据调整之后的生命表编制并不多见。此外,不少研究在编制生命表时虽然考虑了性别差异,但较少关注城乡差异,而事实上中国是典型的城乡二元结构,这种结构所附带的巨大资源差异直接会影响城乡人口的死亡模式。本文将采用中外模型生命表和Logistic、Kannisto模型分别对婴幼儿死亡概率和高龄死亡概率进行调整,探讨更加合理、稳定的方法,进而编制计算出全国分城乡分性别生命表结果,为分析和比较死亡模式、死亡漏报的城乡和性别差异提供基础数据,也为后续编制全国31个省份分城乡、分性别生命表提供方法参考。
中国“六普”婴幼儿和高龄人口死亡数据质量存在问题已是共识,对其修正的方法成为研究重点。以往对婴幼儿死亡水平调整的方法主要有两种。一是利用死亡率外部关系进行评估,普遍的方法是寻找婴幼儿死亡率与社会经济发展水平、教育等之间的关系,对中国普查人口死亡数据质量进行评估,然后再进行调整。二是利用死亡率内部关系进行评估,如利用死亡模式规律、留存法、以1982年为基础数据的布拉斯罗吉特生命表法、贝叶斯B样条偏差减少模型方法、DCMD模型生命表系统方法等对中国婴儿死亡率进行调整。在对高龄人口的死亡率调整方面,国外一些学者对高龄老年人口的死亡模式进行深入分析,试图用合适的模型来拟合,其中运用较多的是Gompertz模型、Weibull模型、Heligman模型、Pollard模型、Logistic模型和Kannisto模型。Zeng和Vaupel研究发现 Kannisto模型对中国“四普”数据高龄老人死亡率的拟合效果较好。在此基础上,有学者尝试各种参数模型来对“六普”数据的高龄老年人口死亡率进行拟合,最终结果表明Kannisto模型和Logistic模型对我国分省、分城乡分性别高龄老年人口死亡率的估计调整均可使用。
事实上,现存的婴幼儿和高龄人口死亡率估计的方法仍需要进一步探讨和发展。首先,社会经济发展水平指标与婴幼儿死亡率之间的外部关系稳定性较差。例如,人均GDP等指标的统计口径差异影响估计结果的准确性,而利用内部关系的布拉斯罗吉特生命表法难以反映2010年中国人口的死亡模式等,但如果仅利用国际上的模型生命表(联合国模型生命表、寇尔德曼模型生命表等)来重建中国“六普”时期的生命表,可能会脱离中国的原始数据,不能运用中国实际上较为准确的死亡数据,从而造成更大的误差。其次,对婴儿死亡率的调整结果出现了女婴高于男婴的异常现象,如黄荣清、曾宪新对“六普”数据的男婴和女婴的死亡率估计分别为16.85‰、17.69‰。再次,仅修正一端所计算的平均预期寿命可能会存在问题,而对所有年龄段的死亡率都进行调整会进一步增大误差,可能会使估计结果更加脱离真实值。第四,以往研究倾向于探索中国人口的死亡模式性别差异,对城乡差异关注较少。
鉴于此,本文在以往学者对死亡率估计方法的基础上,利用国际和国内两种不同来源的模型生命表,根据人口死亡率内部稳定关系对婴幼儿死亡概率进行估计,然后采用Logistic模型和Kannisto模型对高龄人口死亡概率进行修正,最后编制分城乡分性别生命表,探讨中国城乡婴幼儿和高龄人口的死亡模式差异。与以往研究不同,本研究从人口死亡率内部关系的规律出发,利用国际国内不同模型生命表对中国的婴幼儿死亡率进行调整,这种模型生命表的调整结果更加合理,并且具有较好的稳定性和可比性,进而增强了调整结果的可信性。此外,仅对婴幼儿或同时对婴幼儿和高龄这两端的人口死亡概率进行调整对比,不仅能够最大限度地利用中国“六普”的原始数据,而且能够避免完全重建所带来的二次误差,而比较婴幼儿死亡率和高龄人口死亡概率对平均预期寿命影响的差异,也使最终编制的生命表更加精确。最后,本研究方法能够很好地避免全国与分城镇和农村生命表的断裂,编制过程及最终结果都能够保持总体与部分之和的一致性。
本文采用各类模型生命表对婴儿死亡率调整结果都是男性高于女性,符合婴儿死亡率的性别差异规律。通过比较模型生命表对婴幼儿死亡率调整的差异,发现包含了中国大部分地区的华中—华东类和华北类模型生命表对城乡婴幼儿死亡概率调整的结果更加合理,CD对婴儿死亡率调整的结果和以往研究最为接近。在对高龄老年人口死亡概率调整方面,本文同时采用Kannisto模型和Logistic模型,比较二者对高龄老年人口拟合的城乡差异、性别差异,并利用二者调整后的高龄老年人口死亡概率编制出生命表。研究结果发现,这两个模型调整后的平均预期寿命相差极小,而且对平均预期寿命变化影响很小。通过同时以调整修正后的婴幼儿死亡概率和高龄老年人口死亡概率代替原始值,编制计算出全国分城乡分性别生命表结果,发现采用CD、华中—华东类和华北类模型生命表调整之后的平均预期寿命结果相近,而且具有较好的稳定性,与其他学者采用DCMD模型生命表方法调整的结果基本一致。
本文对死亡数据调整方法的探讨为婴幼儿和高龄死亡率调整方法增加更多的选择性,也为后续编制中国各省分城乡分性别生命表奠定很好的基础。本研究对中国城乡生命表编制方法的探析还存在一些不足之处,如“六普”中的青年组死亡数据质量可能也存在问题,但本文并未对其进行修正调整,这可能会对生命表编制结果产生一定的偏差。此外,本文对婴幼儿死亡率调整方法受到数据的限制,如果该方法运用到省一级,可能会因数据质量高低参差不齐造成城乡调整结果差距过大。因此,本研究方法是对中国城乡生命表编制的初步尝试,进一步分析青年组死亡数据质量较差产生的原因、探究对其进行调整的方法及发现全国各省人口分城乡分性别的死亡轨迹,优化生命表的编制,这是未来需要深入研究的方向。