多元统计分析课程.docx
?应用多元统计分析?期末论文农村居民生活消费分析2014年我国农村居民消费分析目录摘要错误!未定义书签。一、引言2二、因子分析法22.1统计思想22.2因子确实定32. 3分析过程42. 3.1基本分析43. 3.2因子载荷矩阵54. 3.3因子得分6三、聚类分析法94.1 系统聚类法的思想93. 2系统聚类9四、影响农村居民消费因素104. 1收入影响105. 2消费环境影响106. 3消费观念影响11五、参考文献11六、附录:11农村居民生活消费分析2014年我国农村居民消费分析摘要:本文综合了因子分析与聚类分析,先进展因子分析,再用因子分析的结果进展聚类分析。在2014年农村居民消费构造的数据根基上,本文较多运用了31个省份的因子得分,计算出单因子情况下31个省份的得分和31个省份在八项消费产生的3个因子上的综合得分,再把该得分作为31个省份的属性,采用离差平方和(Ward)方法进展聚类,最后将城市分为三层,对整体进展综合评价和说明。关键词:因子分析;聚类分析;综合评价2014年我国农村居民消费分析一、引言由于我国国土辽阔,自然条件差异很大,经济开展极不平衡,一些地区、一些乡村、一些居民群体的生活目前与小康指标仍有差距,有的甚至还没有解决温饱问题。我国现有65%的人口在农村,农村居民的生活问题是全面建设小康社会的主要问题。因此,笔者就我国农村居民生活消费构造进展因子分析和聚类分析,以期对农村居民生活消费的问题作一研究,并以此寻求合理的解决思路。二、因子分析法2. 1统计思想因子分析的基本思想是通过对变量相关系数矩阵内部构造的研究,找出能控制所以变量的少数几个随机变量去描述多个变量之间的相关关系,并依据相关性的大小将变量分组,使得同组内的变量之间相关性较高,不同组的变量相关性较低。每组代表一个基本构造,这个基本构造成为公共因子。对于所研究的问题试图用最小个数的不可观测的所谓公共因子的线性函数与特殊因子之和来描述原来可观测的每一个变量。2.2、 因子确实定利用2014年各地区农村居民家庭平均每人生活消费支出资料。摘自?中国统计年鉴(2015)?做因子相关性分析得:表一、相关矩阵表相关矩阵.食品衣着居住家庭设备及服务交通和通讯文娱用品及服务医疗保健其他商品和服务相关食品1.000.669.831.789.759.356.462.818衣着.6691.000.760.729.871.499.722.755居住.831.7601.000.872.814.547.645.767家庭设备及服务.789.729.8721.000.764.466.516,694交通和通讯.759.871.814.7641.000.580.698.763文娱用品及服务.356.499.547.466.5801.000.691.505医疗保健.462.722.645.516.698.6911.000.613其他商品和服务.818.755.767,694.763.505.6131.000Sig(单侧)食品.000.000.000.000.027.005.000衣着.000.000.000.000.003.000.000居住.000.000.000.000.001.000.000家庭设备及服务.000.000.000.000.005.002.000交通和通讯.000.000.000.000.000.000.000文娱用品及服务.027.003.001.005.000.000.002医疗保健.005.000.000,002.000.000.000其他商品和服务.000.000.000.000.000.002.000a.行列式=.OOO因子相关相关矩阵反映我国农村居民消费构造的各指标之间存在较高的相关性,而变量间存在较为明显的相关关系是应用因子分析提取主因子,并以此为依据构造评价体系的根基。因此存在可以采用因子分析进展分析的可能。2. 3分析过程2.1. 1、基本分析共同度描述的是变量Xi(i=l,2,m)对m个因子的依赖程度,也就是用m个因子描述变量的有效性。本文用因子分析法,选取特征值r>l的变量作为主因子并计算其共同度。表二、公因子方差表公因子方差初始提取食品1.000.939衣着1.000.961居住1.000.941家庭设备及服务1.000.948交通和通讯1.000.929文娱用品及服务1.000.997医疗保健1.000.992其他商品和服务1.000.958提取方法:主成份分析。由表二可以看出,主因子对每个变量指标有很强的解释力。表三、解释的总方差表解释的总方差成份初始特征值提取平方和载入旋转平方和载入合计方差的%累积%合计方差的%累积%合计方差的%累积%15.69371.16171.1615.69371.16171.1613.49143.63543.6352.93011.62782.789.93011.62782.7892.07525.93469.5693.4795.99188.780.4795.99188.7801.53719.21188.7804.3394.23593.0155.2242.79695.8106.1561.95297.7637.0981.22498.9868.0811.014100.000提取方法:主成份分析。从衡量每个公因子Fj(i=l2.n)对In个变量解释能力的方差奉献率指标来看,累计方差奉献率到达88.78%,说明主因子对变量能够起到较好的概括作用,其中第一主因子起到了尤其重要的作用,其旋转后的方差奉献率到达43.635%o2.3. 2、因子载荷矩阵因子载荷矩阵的元素ai代表了变量Xi与因子Fi线性联系的严密程度,而第j列的因子载荷量al、a2ai,那么说明了第j个因子K与各变量的联系程度,在实际中,常常根据该列载荷中绝对值较大的载荷所对应的变量来说明这个因子的意义。表四、旋转成分矩阵表旋转成份矩阵.成份123食品.910,261.078衣着.539.774.173居住.820.344.331家庭设备及服务.861.239.252交通和通讯.641.621.284文娱用品及服务.232.243.925医疗保健.215.738.552其他商品和服务.714.483.213提取方法:主成份。旋转法:具有Kaiser标准化的正交旋转法。a.旋转在5次迭代后收敛。由表四可知:第一主因子在食品、居住、家庭设备及服务、交通和通讯以及其他商品和服务等5个指标上的系数比较大,其主要反响的是生活消费水平的提高;第二主因子在衣着、医疗保健2个指标上的系数比较大,其主要反映的是日常生活中最基本的消费情况;第三主因子在文教娱乐用品及服务指标上的系数比较大,其主要反映的是生活消费水平进一步提高的情况。3个主因子从不同的侧面反映了居民的生活质量,从整体来看,那么反映了农村居民从存在型消费、数量型消费向开展型消费、质量型消费的开展方向。第一主因子可以解释原始数据全部方差的71.161%,第二主因子可以解释原始数据全部方差的11.627%,第三主因子可以解释原始数据全部方差的5.991%o由此看出,我国现阶段农村居民消费的刚性支出是维护基本生活的吃、必要的的交通、通讯和商品及服务。2.4. 3、因子得分因子得分是利用因子分析法对原始数据进展评价的依据。以2014年各地区农村居民家庭平均每人生活消费支出资料为依据,我们得到因子得分系数矩阵和因子得分。表五、成分得分系数矩阵表成份得分系数矩阵成份123食品.461258141衣着160.762375居住.326249.140家庭设备及服务.432390.Ill交通和通讯.012.360-119文娱用品及服务054-4521.041医疗保健385.644.176其他商品和服务.162.138115提取方法:主成份。旋转法:具有Kaiser标准化的正交旋转法。表六、因子得分表地区因子一因子二因子三北京1.816651.018110.38765天津1.780041.54079-0.28405河北-0.278620.57007-0.42938山西-1.001260.063440.49417内蒙古-0.812530.981611.79005辽宁-1.360310.65161.02536吉林-0.992190.384621.10577黑龙江-L358330.830790.75777上海2.070751.62143-0.69032江苏1.202230.232120.8953浙江1.459680.892561.28764安徽-0.1047-0.23246-0.30475福建1.5009-0.921930.13763江西0.08184-1.02688-0.43173山东-0.410110.21327-0.1464河南-0.710540.51714-0.46178湖北0.00538-0.506570.96649湖南0.25145-1.115831.24554广东1.45502-1.851750.49371广西-0.14494-1.50262-0.16197海南0.28848-1.91973-0.08903重庆0.15731-0.64588-0.2399四川0.294040.03987-1.19174贵州-0.47928-1.25891-0.3303云南-0.67826-0.91445-0.43083XX-0.08193-0.29863-3.4481陕西-0.87977-0.140830.64863甘肃