孙奕/贾翠平/覃世龙
【内容提要】
目的拟合适合儿童伤害住院费用时间序列资料的预测模型。方法采用ARIMA模型对住院费用进行模型拟合。结果模型拟合得到的最优模型为
【关 键 词】儿童伤害/住院费用ARIMA模型/预测
近十几年中国和世界其他国家一样,经历着医疗费快速上涨的压力,有专题研究报告指出1990~1996年平均每个病人的门诊医疗费和住院医疗费均以每年超过20%的速度上涨,高于城乡居民家庭人均收入的增长,在一定程度上加重了居民就医的经济负担[1]。住院费构成的时间序列是医疗费用变化的历史记录,是多种因素作用下最终发生的住院费用,分析其发展变化规律,并对其未来发展情况进行预测,可以帮助我们认识住院医疗费用增长情况。d阶齐次非平稳时序的自回归滑动平均模型ARIMA(p,d,g)模型不仅有一套明确的准则来处理各种复杂的时序模式,同时还将模型与过去值拟合产生的误差也作为重要因素纳入模型,较好的解决了医学卫生现象都不平稳的问题。目前作为一种理论较完善、分析效果较好、短期须测精度较高的统计工具,已得到广泛的接受[2~4]。本研究试图通过对1995~2004年伤害住院治疗儿童的住院费用时间序列进行ARIMA模型拟合,反映住院医疗费用的变化趋势。
一、资料来源与研究方法
(一)资料来源
本研究以1995年~2004年在某医院因意外伤害而住院治疗的所有儿童为研究对象(ICD-9编码800~959、ICD-10编码SOO~T31),以出院时第一诊断作为本次调查的主要诊断依据。资料来自于医院信息系统中病案首页数据库中的记录,以月平均住院费构成时间序列。
(二)研究方法
二、结果与分析
(一)1993~2004年儿童伤害住院病例住院费变化情况
儿童伤害住院治疗的费用逐年增长,伤害平均住院费由1995年的1305元,上涨到2660元,年平均增长率为10.5%。1993年到2004年月平均住院费时间序列见图1,图中圆点代表月平均住院费。
图1月平均住院费时间序列
(二)建立ARIMA模型
(1)模型的识别
对伤害住院患者的月平均住院费的原始时间序列用自相关分析、偏相关分析等方法进行分析,结果表明,序列呈现出有上升趋势的,每隔12个时间单位为一个周期的季节性。根据以上特点,采用先进行一次一阶差分,然后进行一次季节差分的方法分别消除趋势和季节的影响。对得到的一组平稳的随机数据,初步选定用乘积ARIMA季节模型
表1不同模型拟合优度统计量比较
注:AIC-Akaike信息准则,AIC值较小的模型相对较好
SBC-Schwarz贝叶斯准则,比AIC多考虑了残差个数的影响,SBC较小的模型较好
用以上建立的模型绘图,图2绘出了1999年1月到2004年6年住院费预测值和预测值95%的可信区间,从图中可以看出模型预测值的动态趋势与实际情况基本一致,除了少数月份的实际住院费超出预测值95%的可信区间外,其他月份住院费均落在预测值的可信区间范围内,说明模型对未来的情况进行了很好的跟踪和预测。
图2住院费预测值及95%可信区间
三、结论
20世界中期以来,多种因素导致全球范围内的卫生经费急剧上升,尤其是医疗机构的诊疗费用[6]。作为一个卫生资源相对贫乏的发展中国家,我国同样面临着医疗费用日益增长的问题[7]。2004年卫生部《中国卫生总费用研究报告》的数据表明,1979~2002年,我国卫生总费用年平均增长12%,超过国内生产总值9.4%的年平均增长速度。因此明确医疗费用的变化规律及其发展趋势,对加强医院管理能力建设,提供医疗质量,控制医疗费用的过快增长有重要意义。
本研究采用ARIMA模型对伤害儿童住院费用进行模型拟合,经过反复尝试,根据参数估计和拟合优度的结果,最终确定模型为
对于时间序列资料,应该采用时间序列分析方法,有研究对ARIMA法与其他预测方法做了比较。张蔚等[5]认为ARIMA乘积模型的预测效果优于指数平滑法。该模型在短期内预测比较准确,随着预测期的延长,预测误差会逐渐增大。这是ARIMA模型的一个缺陷。但与其它的预测方法相比,其预测的准确度还是比较高的,尤其在短期预测方面。ARIMA法不同于回归分析预测。回归预测注重分析影响预测对象的各因素所造成的影响,而时间序列预测则是一种考虑预测对象本身的历史数据随时间发展变化规律并用该变量以往的统计资料建立数学模型作外推的预测方法。有研究实证回归模型预测方法的效果并不优于时间序列预测效果[8]。由于时间序列预测法所需要的只是序列本身的历史数据,因此,这一类方法在资料收集上的成本很低,有着宽广的应用前景。
【作者简介】孙奕贾翠平覃世龙华中科技大学同济医学院公共卫生学院社会医学系,湖北武汉430030