您的位置:主页 > 成功案例 > 斯伦贝谢软件使用技巧 > Techlog操作技巧 >

成功案例

Techlog操作技巧>>

10.PCA和LDA数据统计方法

数据统计是缺失曲线重构模块K.Mod或者岩性智能判别器IPSOM的基础,它能够帮助用户选择合适的输入曲线。 在进行数据统计是有两种常用的方法,一种叫主成分分析Principal Components Analysis(PCA),另外一种方式为线性判别分析Linear Discriminant Analysis(LDA)。 PCA是一种非督导的算法,它主要通过分析找到能够代表此数据的曲线,其目的是找到线性无关的变量组合,在哪个方向上数据集的变化最明显,即主成分;如果曲线选择过多,会造成信息的重复利用和权重的不同,对最后结果造成一定偏差。PCA分析是对K.Mod和IPSOMIPSOM的Unsupervised方法输入曲线的分析手段。

1. 打开Utility-TechStat-PCA,选择对应的曲线:

.

并选择相应的数据集

2. 点击Launch,在其结果中可以对数据进行分析,如下图所示,在Projection投影图上,可以看到Main1和Main2,两个成分比重较大的图,越靠近圆圈的边界,表示每个曲线对主成分的贡献量越大,两个曲线越靠近,例如中子和声波两条曲线,几乎重叠在一块,表示两条曲线提供信息相似,两条曲线比较接近;同时可以通过下图的右下角相关系数表格可以验证此结论,中子和声波具有0.781的相关系数,属于两两最大的;左下角的特征值和特征向量里,不同特征值包含的信息量从大到小排列,最后一行可以看到三个特征值包含的信息量在96.7%左右,第四个特征值只包含很少的3.3%左右的信息。因此,可以选择3个特征值,即选择三个变量来代表此四个变量的数据,由于中子和声波曲线相似度很高,可以从两者直接只选择一条即可:

LDA是一种督导的方式,找到在督导曲线对应方向上能够提供类别之间区别的方向, 及此方向贡献最大的曲线类别 。LDA的分析结果是为了应用IPSOM的Supervised方法,分析找到和目标曲线相关性较大的曲线,作为IPSOM的输入。

1. 打开Utility-TechStat-LDA,选择上需要的曲线,其中Group为作为IPSOM方法Supervised的变量。

2. 选择对应的数据集和对应的曲线,点击Launch运行。

3. 其结果如下图所示

上图显示了沿着Classification Group变量方向每个曲线与其相关系数值(上图最后表格),Gamma Ray具有最高的35% ,为最大的相关性,Bul Density次之 ,声波和中子最后 ,从特征值和特征向量表其累计信息量看,3个特征值包含98.7%的信息量,因此,选择 Gamma Ray, Bulk Density, Neutron作为IPSOM模块Supervised输入曲线。

地址:北京市朝阳区酒仙桥路14号兆维华灯大厦

邮编:100015 传真:010-64309502

Copyright © 2002-2015 斯伦贝谢科技服务(北京)有限公司  京ICP备 06043577 号

技术支持:北京天润飞华科技有限公司