多元统计方法在分析各地区综合经济水平中的应用

【摘要】用因子分析法对 2011 年各地区的多个经济指标进行分析,计算出各地区的综合因子得分,然后用聚类分析法将综合因子进行聚类,得出各地区经济排名和分类,可以为区域经济规划提供依据。
【关键词】因子分析 聚类分析 分层排列
自从 1978 年中国改革开放以来,中国的经济发生了巨大变化,同时区域间的发展差距过大的问题也慢慢的显现出来了,但是如何评价各地区的经济实力,找出各地区经济发展的差异是急切需要解决的问题,本文采用 SPSS 软件对 2011 年的多项经济指标进行因子分析,然后根据综合因子得分对各地区综合实力进行评估分析,找出差异。
一、样本和指标的选取
在选取指标时,主要考虑这些指标能从不同侧面反映地区经济特性,统计数据可靠,相关性较小,为了排除人口规模的影响,我们选择人均指标,分别是人均第一产业产值 X1(万元),人均第二产业产值 X2(万元),人均第三产业产值 X3(万元),人均交通运输、仓储和邮政业 X4(万元),人均国内生产总值 X5(万元),人均固定资产投资 X6(万元),人均最终消费 X7(万元),居民人均消费水平 X8(万元),人均资本形成总额 X9(万元),三大产业就业人数与总人数比 X10,然后分析它们的相关性,进行因子分析。
二、各地区经济指标的因子分析
由于各指标单位不同,可能存在数量级差异,因此标准化得到:X1、X2、X3、X4、X5、X6、X7、X8、X9、X10,由于 KMO 值为 0.674,根据统计学家 Kaiser 给出的标准,KMO 取值大于 0.6,适合做因子分析。并且 Bartlett 球形检验给出的相伴概率值为 0.000,小于显着性水平 0.05,因此拒绝 Bartlett 球形检验的零假设,认为适合于因子分析。得旋转后的特征值和贡献率。
由上表 1 可知,前三个公因子的累计贡献率已达到 86.255%,因此可以选取前三个因子记为:F1、F2、F3 作为所选的 10 个指标的代表,它们包括了 10 个指标的 86.255% 的信息,由方差最大旋转法得旋转因子载荷矩阵,由此得出 3 个主因子及相关性较强的指标如表 2。
由表 2 可知,第一个因子基本上反应了工业,服务业投资和产值的情况,第二个因子基本上反应了人均收入因子,第三个指标主要反应了农业相关的产业情况。
由因子得分矩阵得各地区因子得分,以各因子对应的特征值的贡献率为权数,得各地区的综合因子得分并进行排名。
采用 SPSS 分层聚类法,将各地区各因子得分依据组间聚类,聚类结果:
北京、天津、上海、宁夏、青海属于第一类。
河北、内蒙古、辽宁、吉林、黑龙江、江苏、福建、山东、湖北、海南、陕西、新疆属于第二类。
山西、浙江、江西、安徽、河南、湖南、广东、广西、重庆、四川、贵州、云南、甘肃属于第三类。
三、结果分析
单纯从排名来看,各个省的综合排名大体上跟我们实际经济中的一致,但是西藏的排名很靠前,说明单单考软件分析出来的结果有一定的误导性,可能还有一些因素在我所建的模型中并没有反映出来或是未考虑到,以至于高估了西藏的综合排名。
再者这样的分析结果还是有实际意义的,比如把各个省按照聚类分析分成了三类,这样在每一类中的各个省份可能具有相同的特点,比如经济结构,产业结构等等,这种分析方法可以为我们制定经济政策或区域政策提供一些线索。
作者 李彦俊