多元统计方法在分析各地区综合经济水平中的应用

【摘要】用因子分析法对 2011 年各地区的多个经济指标进行分析，计算出各地区的综合因子得分，然后用聚类分析法将综合因子进行聚类，得出各地区经济排名和分类，可以为区域经济规划提供依据。

【关键词】因子分析聚类分析分层排列

自从 1978 年中国改革开放以来，中国的经济发生了巨大变化，同时区域间的发展差距过大的问题也慢慢的显现出来了，但是如何评价各地区的经济实力，找出各地区经济发展的差异是急切需要解决的问题，本文采用 SPSS 软件对 2011 年的多项经济指标进行因子分析，然后根据综合因子得分对各地区综合实力进行评估分析，找出差异。

一、样本和指标的选取

在选取指标时，主要考虑这些指标能从不同侧面反映地区经济特性，统计数据可靠，相关性较小，为了排除人口规模的影响，我们选择人均指标，分别是人均第一产业产值 X1（万元），人均第二产业产值 X2（万元），人均第三产业产值 X3（万元），人均交通运输、仓储和邮政业 X4（万元），人均国内生产总值 X5（万元），人均固定资产投资 X6（万元），人均最终消费 X7（万元），居民人均消费水平 X8（万元），人均资本形成总额 X9（万元），三大产业就业人数与总人数比 X10，然后分析它们的相关性，进行因子分析。

二、各地区经济指标的因子分析

由于各指标单位不同，可能存在数量级差异，因此标准化得到：X1、X2、X3、X4、X5、X6、X7、X8、X9、X10，由于 KMO 值为 0.674，根据统计学家 Kaiser 给出的标准，KMO 取值大于 0.6，适合做因子分析。并且 Bartlett 球形检验给出的相伴概率值为 0.000，小于显着性水平 0.05，因此拒绝 Bartlett 球形检验的零假设，认为适合于因子分析。得旋转后的特征值和贡献率。

由上表 1 可知，前三个公因子的累计贡献率已达到 86.255%，因此可以选取前三个因子记为：F1、F2、F3 作为所选的 10 个指标的代表，它们包括了 10 个指标的 86.255% 的信息，由方差最大旋转法得旋转因子载荷矩阵，由此得出 3 个主因子及相关性较强的指标如表 2。

由表 2 可知，第一个因子基本上反应了工业，服务业投资和产值的情况，第二个因子基本上反应了人均收入因子，第三个指标主要反应了农业相关的产业情况。

由因子得分矩阵得各地区因子得分，以各因子对应的特征值的贡献率为权数，得各地区的综合因子得分并进行排名。

采用 SPSS 分层聚类法，将各地区各因子得分依据组间聚类，聚类结果：

北京、天津、上海、宁夏、青海属于第一类。

河北、内蒙古、辽宁、吉林、黑龙江、江苏、福建、山东、湖北、海南、陕西、新疆属于第二类。

山西、浙江、江西、安徽、河南、湖南、广东、广西、重庆、四川、贵州、云南、甘肃属于第三类。

三、结果分析

单纯从排名来看，各个省的综合排名大体上跟我们实际经济中的一致，但是西藏的排名很靠前，说明单单考软件分析出来的结果有一定的误导性，可能还有一些因素在我所建的模型中并没有反映出来或是未考虑到，以至于高估了西藏的综合排名。

再者这样的分析结果还是有实际意义的，比如把各个省按照聚类分析分成了三类，这样在每一类中的各个省份可能具有相同的特点，比如经济结构，产业结构等等，这种分析方法可以为我们制定经济政策或区域政策提供一些线索。

作者李彦俊