PCA的基本原理PCA的计算步骤PCA应用实例主成分分析(PCA)具体例子秦楠npnnppxxxxxxxxxX212222111211(1)降维处理!!!当p较大时,在p维空间中考察问题比较麻烦。降维是用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。定义:记x1,x2,…,xP为原变量指标,z1,z2,…,zm(m≤p)为新变量指标pmpmmmppppxlxlxlzxllxlxzlxlxlxz22112222121212121111(2)从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2,…,p)在诸主成分zi(i=1,2,…,m)上的载荷lij(i=1,2,…,m;j=1,2,…,p)。从数学上可以证明,载荷lij分别是相关矩阵的m个较大的特征值所对应的特征向量。pppppprrrrrrrrrR212222111211(3)nknkjkjikinkjkjikiijxxxxxxxxr11221)()())(((4)(二)计算特征值与特征向量:①解特征方程,求出特征值,并使其按大小顺序排列;IR00,21p②分别求出对应于特征值的特征向量,要求=1,即,其中表示向量的第j个分量。i),,2,1(pliiil112pjijlijlil③计算主成分贡献率及累计贡献率▲贡献率:),,12,(1pipkki▲累计贡献率:),,12,(11pipkkikk一般取累计贡献率达85—95%的特征值所对应的第一、第二、…、第m(m≤p)个主成分。m,,,21pnpnnppxxxlllllllllZ.21212222111211(6)④各主成分的得分样本序号x1:人口密度(人/km2)x2:人均耕地面积(ha)x3:森林覆盖率(%)x4:农民人均纯收入(元/人)x5:人均粮食产量(kg/人)x6:经济作物占农作物播面比例(%)x7:耕地占土地面积比率(%)x8:果园与林地面积之比x9:灌溉田占耕地面积之比(%)1363.910.35216.101192.11295.3426.72418.4922.23126.2622141.51.68424.3011752.35452.2632.31414.4641.45527.0663100.71.06765.6011181.54270.1218.2660.1627.47412.4894143.741.33633.2051436.12354.2617.48611.8051.89217.5345131.411.62316.6071405.09586.5940.68314.4010.30322.932表1某农业生态经济系统各区域单元的有关数据668.3372.03276.2041540.29216.398.128...