基于 ARIMA 模型的西安市国内生产总值预测分析















摘要:国内生产总值(GDP)是衡量一个国家经济状况的重要指标,对促进经济增长和协助相关部门做出经济决策具有重要意义。本文以陕西省西安市为例,选取西安市 1983 年至 2019 年 GDP 指标数据作为样本,实证分析找到拟合 GDP 最优模型 ARIMA(1,1,1)模型,对西安市 GDP 数据进行预估、检验。结果表明模型的 GDP 预测值与实际值误差在 5% 以内。并运用模型预测西安市未来 5 年 GDP 数据。本文对 GDP 的指标分析具有一定现实意义,希望能为西安市的经济决策提供参考。
关键词:时间序列 ARIMA 模型 西安市 GDP
一、引言
GDP 是衡量一个国家、一个地区经济发展情况的重要指标依据。它是在一定时期内,一个国家或地区的经济中所生产出的全部最终产品和劳务的价值,反映一国的国力与财富。西安市是国务院批复确定的中国西部地区重要的中心城市,是我国四大古都之一,也是联合国科教文组织确定的「世界历史名城」,具有悠久的古韵文化,但其经济总量不高。2019 年公布 GDP 数据虽同比增长 7.0%,位居陕西省 10 市之首,但仍未破万亿元。为使西安市更加符合中心城市的要求,对其 GDP 数据的研究及相关经济政策的提出,对衡量当地地区经济状况具有一定意义。
二、国内外研究现状
目前,国内外许多学者对 GDP 的模型预测,大部分集中采用时间序列计量模型与灰色预测模型。时间序列计量模型适用于短期分析,灰色预测适用于通过少量的、不完整的信息,建立数学模型并进行预测。李守丽(2013)运用 ARIMA(1,2,3)模型对郑州市 2011 年到 2015 年 GDP 进行预测,模型误差较小。杨探(2018)运用 ARIMA(1,1,1)模型,使用 1996-2012 年的数据对我国城镇居民人均可支配收入进行分析和预测,模型拟合效果较好。王爽、汪海飞(2010)选取 1978-2019 年海南省 GDP 数据为研究样本,采用 ARIMA(1,1,2)模型对海南省国内生产总值在平均误差 5% 内对其做出短期预测。戴琳琳(2019)选取青岛市 1990 年至 2014 年 GDP 指标数据建立 ARIMA(1,1,2)模型,对青岛市 GDP 进行预测检验,模型的预测值与实际 GDP 值误差较小。对于西安市 GDP 预测模型研究较少,仅孙爱民(2020)选取西安市 2010-2018 年的 GDP 数据建立灰色 GM(1,1)模型,对 2019-2023 年的 GDP 数据小误差概率检验进行预测。
三、ARIMA(p,d,q)模型
ARIMA 模型全称为自回归求和移动平均模型(Autoregressive Integrated Moving Average Model,简记 ARIMA),是由博克思-詹金斯(Box-Jenkins)提出的一种用于进行时间序列预测的模型。称为 box-jenkins 模型或者博克思-詹金斯法。ARIMA(p,d,q)称为差分自回归移动平均模型,AR 是自回归,p 为预测模型中采用的时序数据本身的滞后数(lags),MA 为移动平均,q 为预测模型中采用的预测误差的滞后数(lags),d 为时间序列成为平稳序列所做的差分次数。常用自相关函数(ACF)与偏自相关函数(PACF)判断(p,q)。AR 自回归模型,MA 移动平均模型,ARMA 模型都是特殊的 ARIMA 自回归积分滑动平均模型。
若序列{}通过 d 阶差分转化为平稳时间序列,即是一个平稳时间序列,且可以拟合成一个平稳可逆 ARMA(p,q)模型,序列{}拟合成如下样式:,称为求和自回归移动平均模型 ARIMA(p,d,q)
d 阶差分运算表示为:
差分后的序列是原序列的若干序列值的加权和,可拟合成一个自回归移动平均模型。当时,ARIMA(p,d,q)即为 ARMA(p,q)模型
其中{}为白噪声。给定{}与{}条件下,使用条件 MLE 估计 ARMA(p,q),首先根据 ACF(自相关系数)与偏自相关系数(PACF)判断是否存在或情况,若则判断模型为 MA(q)
若,则,产生的扰动项与产生的扰动项无交集,即 ACF 在时等于 0,出现截尾。PACF 函数拖尾,不包含自回归部分。
如果,则判断模型为 AR(p)
PACF 函数在时都等于 0,出现截尾。ACF 函数逐渐衰减,拖尾,不包含移动平均部分。
若以上两情况都不符合,ACF 与 PACF 函数都拖尾。考虑 ARMA(p,q)模型。
四、实证分析
(一)数据的处理
本文选取西安市 1983-2019 年的 GDP 数据作为研究对象,所有数据均来源于《陕西统计年鉴》,如表 1 所示。在其目前现有数据基础上,根据 ARIMA 模型对西安市 GDP 进行预测,样本数据区间为 1983-2019 年,将样本外 2015—2019 年的实际数据与预测数据进行对比,判断模型的拟合效果误差值,进而再预测 2020—2024 年西安市 GDP 的发展情况。
1.平稳性检验。将 1983—2019 年西安市 GDP 数据做折线图,如图 1 所示,随着时间的推移,直观看出西安市 GDP 呈现指数增长趋势,初步判断为非平稳的时间序列。为了消除异方差以及指数趋势,对其进行对数化处理,记为 lnGDP。
图 1 西安市 GDP 的时间趋势图
对 lnGDP 采用 ADF 单位根检验,检验结果如下表
表 2 lnGDP 的 ADF 检验结果
t-Statistic Protb.*
ADF 统计量 -1.371277 0.8496
检验标准 1% 临界值 -4.28458
5% 临界值 -3.562882
10% 临界值 -3.215267
注:临界值为 MacKinnon(1996)one-sided p-values。
由检验结果得知 ADF 统计量为-1.3713,该值明显大于不同显着性水平下的临界值,对应 P 值大于显着性水平,说明此时间序列存在单位根,lnGDP 序列是非平稳的。建立模型必须是平稳序列,对 LNGDP 进行一阶差分,一阶差分序列记为 DlNGDP,并进行单位根检验。如表 3 所示,ADF 检验的统计量为 -3.6865,该值小于 5% 显着性水平下的临界值 -3.574,即单位根是不存在的,DlNGDP 在 5% 显着性水平下是平稳的时间序列。由此可知,DlNGDP 序列是一阶单整过程,存在一个单位根。DlNGDP~I(1),可对平稳的 DlNGDP 构建 ARIMA(p,q)模型。
2.ARIMA 模型的建立和求解。运用博克思-詹金斯法,选择合适的 p,d 和 q 值,对西安市 lnGDP 的一阶差分变量做自相关分析,图 2 给出西安市 lnGDP 的自相关( ACF)系数和偏自相关( PACF)系数图。
从图 2 根据表 4 判断标准可以看出,自相关系数( AC)与偏相关系数 ( PAC )都是拖尾的。但无法确定具体的 p 与 q,大致确定 p=1,q=1,但因为信服力不够,本文对其它模型 AR(1),MA(1),AR(2),MA(2),ARIMA(1,1,2),ARIMA(1,1,1)进行建模,根据 AIC 准则、SC 准则、R2,DW 值确定最佳适合精准度最高的模型。结果如下表所示
根据表 5 可知,由 DW 自相关检验可知 MA 模型存在一阶正自相关,从其余模型根据 AIC 准则,SC 准则越小越好,判断其最优模型,发现 ARIMA(1,1,1)模型优于其他模型,p 值为 1,q 值为 1,拟合效果较好。图 3 是其模型运算结果。
可对 lnGDP 初步建立 ARIMA(1,1,1)模型。利用 1983- 2019 年样本数据建立 ARIMA 模型,结果见下表:取 p=1,q=1,建立 ARIMA(1,1,1)模型:
模型的 R2= 0.99,D.W= 2.17
从表 6 看出模型的 LM 检验统计量 0.7655 水平上不拒绝原假设,即模型的残差不存在序列相关,亦可从图 4 中 Q-Stat 及其 p 值显示认为残差序列属于白噪声序列,即模型显着有效。
由表 7 可得在 0.7 水平上不拒绝原假设 H0:无异方差存在,即所建模型无异方差。
根据 ARIMA(1,1,1)模型对 2015—2019 年西安市 GDP 进行预测,绘制预测值与实际值误差比较,算出 5 年的平均误差为 3.1252% 在 5% 以内,误差较小,预测准确度较好。
根据西安市 1983-2019 历史数据,预测 2020-2024 年 GDP 数据值分别为 10208.46097 亿元、11442.64143 亿元、14304.41624 亿元、15953.99652 亿元,画出拟合图。
从预测中发现,西安市 GDP 随着时间的推移呈现快速上升趋势,有望于 2020 年突破万亿元大关,2024 年突破 1.5 万亿元。呈现良好的发展趋势,有助于西安市经济繁荣发展。
五、结束语
通过求和自回归移动平均模型建立的 ARIMA(1,1,1)模型较好地对西安市 1983—2019 年 GDP 非平稳时间序列数据进行了拟合,预测出 2020 年到 2024 年西安市 GDP 数据,计算其平均误差百分比为 3.1252%,控制在 5% 范围内。为西安市政府制定一系列的经济政策提供一定的决策依据。从预测数据中看出,西安市 GDP 数据有望在 2020 年突破万亿元大关。本文对 GDP 分析预测仅考虑其数值,但影响 GDP 数据的因素有很多,影响机制复杂,日后在考虑其它影响因素方面有待加强改进。
参考文献:
[1]郑少智,杨卫欣.基于 ARIMA 模型的我国国内生产总值的分析与预测[J].中国市场,2010,000(048):24-25,28.
[2]李守丽.时间序列模型在地级市 GDP 预测中的应用[D].郑州大学,2013.
[3]杨探.基于 ARIMA 模型的我国城镇居民人均可支配收入的分析与预测[J].时代金融,2018(26):54-55.
[4]王爽,汪海飞.基于 ARIMA 模型的海南省国内生产总值预测[J].对外经贸,2020(04):44-46.
[5]戴琳琳.基于 ARIMA 模型的青岛市 GDP 预测分析[J].河北能源职业技术学院学报,2019,19(03):60-62.
[6]孙爱民.基于改进 GM(1,1)模型的西安市 GDP 预测[J].价值工程,2020,39(09):88-92.
[7]王燕.应用时间序列分析 - 第 2 版[M].中国人民大学出版社,2008.
作者系西安工业大学经济管理学院经济学硕士研究生
作者 胡美