出院病人人均医药费用的 AR(n)岭估计模型及预测应用

【摘要】针对中国 2007~2011 年出院病人人均医药费用逐年增长的趋势,通过添加阻尼因子,使经典的时间序列 AR(n)模型的最小二乘模型变为 AR(n)岭估计模型,利用 AR(n)岭估计模型,可以较好的改善经典时间序列分析模型中矩阵的病态程度。依据不同阻尼因子取值,预测了 2013 年全国综合医院出院病人人均医药费用。
【关键词】统计分析 出院病人人均医药费用 AR(n)模型 岭估计
一、引言
近几年来,医院出院病人的人均医药费用在逐年递增。根据《中国卫生统计年鉴 2012》[1]一书披露的数据,2011 年,全国综合医院出院病人人均医药费用为 7027.7 元(人民币),较 2007 年的 4973.8 元,增幅达到了 41.29%。根据社会经济发展规律、医疗条件等因素可以认为,出院病人人均医药费用是一种随时间而变化的统计数据。时间序列 AR(n)模型在考虑统计数据在时间序列上的依存性的同时,又考虑了随机波动的干扰性,是广泛应用的方法之一[2-5]。故可考虑采用 AR(n)模型来预测未来的全国综合医院出院病人人均医药费用。
直接采用经典 AR(n)模型,模型的病态性会影响分析和预测的结果。如何有效避免 AR(n)模型的病态性,是需要解决的问题。基于此,本文结合解决矩阵病态问题的经典岭估计方法,建立起 AR(n)的岭估计模型,并以时间序列 AR(3)模型为例,对中国 2007~2011 年出院病人人均医药费用进行了分析,预测了 2013 年全国综合医院出院病人人均医药的大概费用。
二、AR(n)的岭估计模型
时间序列分析的特点在于[6-7]:逐次的统计数据通常是不独立的,必须考虑到统计资料的时间顺序,当逐次统计值相关时,未来数值可以由过去统计资料来预测,可以利用统计数据之间的自相关性建立相应的数学模型来描述客观现象的动态特征。
对于 AR(n)模型,有[1]:
xt=b1xt-1+b2xt-2+…+bnxt-n+at (1)
若共有 x1,x2,…xN 等个统计数据,则有:
Y=Xb+a (2)
式中:
X=■,b=■,Y=■,
a=■ (3)
则 b 的最小二乘解为:
b=(XTX)-1XTY (4)
一般地,矩阵 XTX 中的元素是由数值较接近的数据组成,数值彼此很接近,X 的列存在复共线性,式(4)易成为病态方程组,导致 b 的数值解不稳定。
式(4)中,XTX 的求逆运算是导致 AR(n)模型产生病态的原因。一般可采用岭估计方法来消除矩阵的病态,通过在 XTX 矩阵中增加一个阻尼因子 α 来改善矩阵的病态程度。
对 XTX 添加一个阻尼因子 α,使其变为 XTX+αI,这样,(4)式变为:
b=(XTX+αI)-1XTY (5)
(5)式即为时间序列 AR(n)的岭估计模型。显然,当阻尼因子 α=0 时,式(4)与式(5)等价。
三、全国综合医院出院病人人均医药费用分析
《中国卫生统计年鉴 2012》在表 4-5-4 中,公布了全国综合医院出院病人人均医药费用统计数据,医院合计的部分数据见表 1,现采用一般 AR(3)模型进行统计数据的时间序列分析。
表 1 综合医院出院病人人均医药费用(摘自《中国卫生统计年鉴 2012》表 4-5-4)
从 2007 年至 2011 年,出院病人人均医药费这一项,2008 较 2007 的增幅为 9.85%;2009 较 2008 的增幅为 8.93%;2010 较 2009 的增幅为 9.64%;2011 较 2010 的增幅为 7.69%。取 2008 至 2011 年的平均年增幅为(9.85%+8.93%+9.64%+7.69%)/4=9.0275%,则根据 2008 至 2011 年的平均年增幅 9.0275%,计算得 2012 年医院合计级别的出院病人人均医药费为 7662.1 元。
现采用经典 AR(3)模型,对出院病人人均医药费统计数据进行分析。由第二节式(3):
X=■,Y=■,则:
X■X=■,X■X 的行列式值为 520860476017855,为非奇异矩阵。X■X 的条件数为 761172.94,根据条件数大小判别矩阵是否病态的一般条件,当矩阵条件数大于 1000 时为严重病态,可知矩阵 X■X 严重病态。根据式(4)求出的 b=[-2.8909,2.4954,1.2215],根据式(1)求得 x1=6525.7,x2=7027.8,x3=7662.2。
现采用 AR(3)岭估计模型即式(5)对综合医院出院病人人均医药费用进行分析。
表 2 AR(3)岭估计模型计算结果
由表 2 知,阻尼因子的增加,极大程度的改善了矩阵 X■X 的病态程度。其计算结果与没有改善之前的结果也较接近。不同的是,没有改善的病态矩阵的求逆运算会不稳定,导致式(4)的求解结果也不稳定。改善后根据式(5)求解 b 的值变得更稳健。
现根据假定的 2012 年医院合计级别的出院病人人均医药费为 7662.1 元,按照本文所介绍方法,依据不同阻尼因子取值,预测 2013 年医院合计级别的出院病人人均医药费见表 3。
表 3 2013 年医院合计级别的出院病人人均医药费预测值(元)
四、结论
出院病人人均医药费用是一种随时间而变化的统计数据。时间序列分析方法是一种动态数据处理方法,文章通过添加阻尼因子来改善矩阵病态程度,一定程度上改善了 AR(n)模型矩阵的病态程度,所得计算结果互相之间也比较接近。根据假定的 2012 年医院合计级别的出院病人人均医药费,依据不同阻尼因子的取值,预测得出,2013 年医院合计级别的出院病人人均医药费大致在 8027.5~8328.6 元左右。
参考文献
[1]中华人民共和国卫生部.中国卫生统计年鉴 2012[M].中国协和医科大学出版社,2012:84-107.
[2]邓丹,王润华,周燕荣.时间序列分析及其在卫生事业中的应用[J].数理医药学杂志.2002(05):56-58.
[3]纪莉.时序资料在医院统计中的应用[J].统计与咨询,2013(01):61.
[4]叶孟良,李智涛,欧荣.ARIMA 模型在预测重庆市医院日住院量中的应用[J].重庆医学,2012(13):1260-1261.
[5]何问陶,赵建群.AR(q)模型的应用研究[J].云南财经大学学报,2008,3:86-94.
[6]高铁梅.计量经济分析方法与建模[M].北京:清华大学出版社, 2006.
[7]王振龙等.应用时间序列分析[M].北京:科学出版社,2007.
作者简介:唐丽珠(1975-),女,汉族,广西桂林人,中级会计师。主要从事医院管理会计研究。
作者 唐丽珠