太阳城集团

  • / 26
  • 下载费用:30 金币  

基于局部流形嵌入的高光谱图像分类方法.pdf

摘要
申请专利号:

CN201611219213.9

申请日:

2016.12.26

公开号:

CN106778885A

公开日:

2017.05.31

当前法律状态:

实审

有效性:

审中

法律详情: 实质审查的生效IPC(主分类):G06K 9/62申请日:20161226|||公开
IPC分类号: G06K9/62 主分类号: G06K9/62
申请人: 重庆大学
发明人: 黄鸿; 罗甫林; 段宇乐; 石光耀
地址: 400044 重庆市沙坪坝区沙正街174号
优先权:
专利代理机构: 重庆博凯知识产权代理有限公司 50212 代理人: 李海华
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

太阳城集团CN201611219213.9

授权太阳城集团号:

|||

法律状态太阳城集团日:

太阳城集团2017.06.23|||2017.05.31

法律状态类型:

实质审查的生效|||公开

摘要

太阳城集团本发明公开了一种基于局部流形嵌入的高光谱图像分类方法,1)对训练样本各数据点利用同类近邻点进行重构;2)利用各数据点的邻域以及各邻域点对应的重构点来构建类内图、类内重构图、类间图和类间重构图;3)在低维嵌入空间中,保持类内图和类内重构图的结构不变,抑制类间图和类间重构图的结构关系,得到从高维空间到低维空间的投射矩阵;4)通过投影矩阵,得到训练样本的低维嵌入特征;5)通过投影矩阵,将测试样本高维数据降维,得到测试样本低维嵌入;6)通过分类器即可对测试样本的低维嵌入进行分类,得到高光谱图像分类结果。本发明能更好地表征高光谱图像的内蕴属性,能够更有效地提取出鉴别特征,改善数据可分性。

权利要求书

1.基于局部流形嵌入的高光谱图像分类方法,其特征在于,包括如下步骤:
1)选择类别标签已确定的训练样本X=[x1,x2,…,xN],li为xi的类别标签,对训练样本
各数据点利用同类近邻点进行重构;
2)利用各数据点的邻域以及各邻域点对应的重构点来构建类内图、类内重构图、类间
图和类间重构图;
3)在低维嵌入空间中,保持类内图和类内重构图的结构不变,抑制类间图和类间重构
图的结构关系,得到从高维空间到低维空间的投射矩阵;
4)通过步骤3)得到的投影矩阵,将训练样本的高维数据降维,得到训练样本的低维嵌
入特征;
5)通过步骤3)得到的投影矩阵,将待分类的高光谱图像作为测试样本并将测试样本的
高维数据降维,得到测试样本低维嵌入;
6)根据步骤4)得到的训练样本的低维嵌入特征并结合选取的分类器,即可对测试样本
的低维嵌入进行分类,得到高光谱图像分类结果。
2.根据权利要求1所述的基于局部流形嵌入的高光谱图像分类方法,其特征在于:步骤
1)对训练样本各数据点利用同类近邻点进行重构的方法为,
对训练样本每个数据点xi,从来自同类的数据中选取k1个近邻点来重构xi,重构点为

式中,sij为数据点xi与xj之间的重构权值,且si=[si1,si2,…,siN]T;
若xi与xj为同类近邻,sij≠0,否则sij=0,其定义为:

式中,归一化值
3.根据权利要求1所述的基于局部流形嵌入的高光谱图像分类方法,其特征在于:步骤
2)中类内图、类内重构图、类间图和类间重构图的构建如下,
构建类内图Gw={X,Ww},X为图的顶点,若图中两顶点xi和xj属于来自同类数据的k1近
邻,则在xi和xj之间构建一条连接边,否则,xi和xj之间无边,边的权值为表示xi和xj间
的相似关系,定义为:

式中,参数
构建类内重构图为图的顶点,若xi和xj属于来自同类数据的k1近邻,则
在对应的和之间构建一条连接边,否则,和之间无边,边的权值为表示和间
的相似关系,定义为:

式中,参数
构建类间图Gb={X,Wb},X为图的顶点,若图中两顶点xi和xj属于非同类数据的k2近邻,
则在xi和xj之间构建一条连接边,否则,xi和xj不连接,边的权值为表示xi和xj间的近似
程度,定义为:

式中,参数
构建类间重构图为图的顶点,若xi和xj属于非同类数据的k2近邻,则在
对应的和之间构建一条连接边,否则,和不连接,边的权值为表示和间的近
似程度,定义为:

式中,参数
4.根据权利要求1所述的基于局部流形嵌入的高光谱图像分类方法,其特征在于:步骤
3)中投影矩阵按如下方法确定,
对于类内数据,在低维空间中不改变类内图和类内重构图的相似关系,使同类数据及
其重构数据尽可能聚集在一起,进而减小同类数据间的差异,目标函数表示为:

式中,和
为对角矩阵,且S=[s1,s2,…,sN],
si=[si1,si2,…,siN]T;
对于类间数据,在低维空间中抑制类间图和类间重构图中数据间的相似性,分离开非
同类数据,进而增大非同类数据间的差异,目标函数表示为:

式中,和
为对角矩阵,且
将式(16)和(17)的优化问题转化为:
<mrow> <mi>m</mi> <mi>a</mi> <mi>x</mi> <mfrac> <mrow> <msup> <mi>V</mi> <mi>T</mi> </msup> <msup> <mi>XM</mi> <mi>b</mi> </msup> <msup> <mi>X</mi> <mi>T</mi> </msup> <mi>V</mi> </mrow> <mrow> <msup> <mi>V</mi> <mi>T</mi> </msup> <msup> <mi>XM</mi> <mi>w</mi> </msup> <msup> <mi>X</mi> <mi>T</mi> </msup> <mi>V</mi> </mrow> </mfrac> <mo>-</mo> <mo>-</mo> <mo>-</mo> <mrow> <mo>(</mo> <mn>18</mn> <mo>)</mo> </mrow> </mrow>
由拉格朗日乘子法,得到:
XMbXTV=λXMwXTV (19)
通过求取式(19)的特征值,并由大到小排列,取前d个特征值对应的特征向量组成投影
矩阵V=[v1,v2,…,vd]。
5.根据权利要求3所述的基于局部流形嵌入的高光谱图像分类方法,其特征在于:在构
建图时,把非同类近邻设置为同类近邻的整数倍,即k2为k1的整数倍。

说明书

基于局部流形嵌入的高光谱图像分类方法

技术领域

本发明涉及高光谱图像分类,具体涉及一种基于局部流形嵌入的高光谱图像分类
方法,属于高光谱图像分类技术领域。

背景技术

科学研究者们于20世纪80年代初在多光谱遥感的基础上提出了高光谱遥感。高光
谱遥感影像的光谱分辨率高达10-2λ数量级(属于纳米级),波段范围从可见光到短波红外,
光谱波段数多达数十个甚至数百个以上,高光谱分辨率高的特点使高光谱图像数据相邻波
段间的间隔较窄,存在波段重叠区域,光谱通道不再离散而呈现出连续,因此高光谱遥感通
常又被称为成像光谱遥感。高光谱遥感不仅可以解决地物大类的识别问题,而且可以进行
类内细分或精细光谱特征提取。高光谱遥感影像分类首先需要对待测数据进行特征提取,
实现维数约简,然后再对提取出来的特征进行分类。

高光谱遥感影像是由成像光谱仪获取的,含有丰富的太阳城集团,给地物研究带来了新
的机遇。但由于高光谱遥感影像数据量大、数据间相关性强、冗余度大、维数高、太阳城集团隐含,
传统分类方法很易导致Hughes现象,即“维数灾难”。因此,如何从高维数据中有效地提取出
隐含特征,降低数据维数成为高光谱遥感影像在数据处理方面研究的重点。

1、流形学习方法

以统计学原理为基础提出的特征提取方法主要是利用数据的统计特征,忽略了数
据的几何分布。为揭示数据的内在结构,研究者提出了“流形(Manifold)”的概念,它属于欧
氏空间的一个推广概念,流形上的每个点在欧氏空间中都具有与其同胚的点,也就是流形
可以通过大量的欧氏空间块粘结在一起。流形包含了拓扑学、数学分析、微分几何、代数学
等学科,已是现代科学研究的基础工具。

流形在数学上可定义为:Hausdorff空间中的任意点x于x的开邻域U在欧氏
空间中的一个开子集属于同胚,被称为d维拓扑流形,即d维流形。Hausdorff空间是指
任意集合中的两个数据点,都有各自的开邻域,两个开邻域之间不存在交集。Whitney表明
任何流形在维度足够大的欧氏空间都能被嵌入。

流形学习(Manifold Learning)是在流形的基础上提出的数据处理方法,目的是
从高维数据中寻找可嵌入的低维流形。流形学习的概念最初是由Bregler和Omohundro于
1994年在语音识别和图像插值的研究中提出;2000年,在Science发表的两篇太阳城集团流形学习
算法的论文,使流形学习的研究与应用进入巅峰。流形学习的前提是高维数据中存在一个
潜在的流形,通过某种方式对高维数据进行学习,得到一个映射关系,实现数据从高维空间
到低维空间的投影,在低维空间中不改变数据原高维空间的固有特征或几何结构,从而发
现数据的内在属性。

流形学习的数学描述为:一组维度为D的高维数据X=[x1,x2,…,xN],假设数据位
于本征维度为d(一般d<<D)的低维流形上,流形学习的目的是找到每个高维数据点
的低维嵌入即求解一个高维空间到低维空间的
映射关系g,使yi=g(xi),同时得到重构映射g-1,使xi=g-1(yi),映射g应在约束条件下不改
变原高维数据的固有特性或几何结构关系。

随着流形学习的广泛应用,学者们提出大量的流形学习方法,经典算法主要有
ISOMAP、LLE、LE。

ISOMAP算法是在2000年由Tenenbaum等提出,基本理论是利用测地距离来度量高
维数据的几何结构关系,在低维嵌入空间中保持近邻数据在高维空间的几何结构不变,即:
在映射时,不改变近邻数据在高维空间中的测地距离,从而揭示出高维数据中的低维流形。

LLE是在2000年Roweis和Saul提出,基本原则是非线性数据的局部呈现线性分布,
在低维嵌入空间中不改变数据在高维空间中由邻域线性组合表示的局部线性结构,进而揭
示出高维数据的内在流形。

LE算法是由Belkin和Niyogi在2003年提出,在高维空间中由数据的局部相似性,
构建一个相似图,通过拉普拉斯算子对图进行处理,在低维嵌入空间中,保留数据的局部信
息不变,得到低维嵌入特征。LE算法的原则是使高维空间中距离相隔越远(或近)的数据,在
低维空间中也离的越远(或近)。

2、图嵌入方法

图嵌入是一个描述特征提取算法的统一框架,不仅能统一大部分经典的特征提取
算法,而且能发展新的特征提取算法,这些算法的主要区别在于相似矩阵和约束矩阵的构
建方式不同。

2.1图嵌入

图嵌入(Graph Embedding,GE)是利用图谱理论来表达数据的某种统计或者几何
特性,通过拉普拉斯算子对构建的图进行操作,在低维嵌入时,保留图中有利太阳城集团,抑制图
中无用太阳城集团,实现特征提取。在实际应用中通过构建一个本征图来表示同类数据的统计或
几何特征和一个惩罚图用于描述非同类数据间的统计或几何特性,本征图G={X,W}和惩罚
图GP={X,WP}都属于无向图,其中X表示图的顶点,和分别为图G和GP的权
值矩阵。W的第i行j列为wij表示图G中顶点xi和xj之间的边权值,反映了同类数据xi和xj之间
相似性,在低维嵌入时需保留图G中的相似关系。WP的第i行j列为表示图GP中顶点xi和xj
之间的边权值,表明了非同类数据xi和xj之间的近似性,在低维嵌入时需抑制图GP中的近似
关系。

根据图嵌入原理,目标函数可定义为:


式中,h为常数,H为约束矩阵,为消除退化解,通常把H设置为单位矩阵,对数据进
行归一化处理,H也可以设置为惩罚图的拉普拉斯矩阵,LP=DP-WP,
为对角矩阵,且L=D-W为本征图的拉普拉斯矩阵,D
=diag([d11,d22,…,dNN])为对角矩阵,且

目函数可变换为:


在线性情况下,Y=VTX,则图嵌入的目标函数可以表示为:


2.2边界Fisher分析

在图嵌入框架下,Yan等提出了MFA算法,通过构建类内图和类间图,使同类数据尽
可能的聚集,非同类数据尽可能的远离。类内图用于揭示同类数据间的相似关系,可促进类
内数据的聚集性;类间图属于惩罚图,用于抑制非同类数据间的相似性,可增强类间数据的
分离性。

图1为MFA算法的原理,表示了类内图和类间图的结构关系。类内图中,连接每个数
据点(比如:点x1和x2)与其来自同类的近邻点,目的是在低维嵌入时增加同类数据的聚集
性。类间图中,在每个数据点(比如:点x3)与其来自不同类别的近邻点之间构建边,可在低
维嵌入时增强非同类数据间的可分性。

在类内图中,只在同类近邻数据间有边,并通过设置各边的权值来表示数据间的
相似性,xi与xj的边权值w′ij可定义为:


式中,li与lj分别为xi与xj的类别标签。

在类间图中,只在非同类近邻数据间才有连接边,可反映非同类数据间的近似程
度,数据点xi与xj间的权值为:


在低维嵌入空间中,保持同类近邻数据间的相似性不变,并尽可能地聚集同类数
据,可得到目标函数。


式中,L'=D'-W',D=diag([d′11,d'22,…,d'NN])且

另外,在低维嵌入空间中应抑制非同类近邻数据间的相似关系,并使非同类数据
间尽可能的远离,则有:


式中,LP'=DP'-WP',且

根据式(6)和(7),优化目标可以转换为:


由拉格朗日乘子法,式(8)的优化解可表示为:

XL'XTV=λXLP'XTV (9)

升序排列式(9)的广义特征值,取前d个特征值对应的特征向量组成映射矩阵V=
[v1,v2,…,vd]。

虽然MFA通过构建类内图和类间图来增强同类数据的聚集和非同类数据的分离,
但在构建两个图时,仅考虑了数据的邻域结构,对存在大量同质区域的高光谱图像来说,不
能有效地表征数据的内在流形,进而达不到理想的分类结果。

发明内容

针对MFA不能有效地表征数据的内在流形的不足,本发明的目的是提供一种能更
好地表征高光谱图像的内蕴属性,能够更有效地提取出鉴别特征,改善数据可分性的基于
局部流形嵌入的高光谱图像分类方法。

为了实现上述目的,本发明采用的技术方案如下:

基于局部流形嵌入的高光谱图像分类方法,其特征在于,包括如下步骤:

1)选择类别标签已确定的训练样本X=[x1,x2,…,xN],li为xi的类别标签,对训练
样本各数据点利用同类近邻点进行重构;

2)利用各数据点的邻域以及各邻域点对应的重构点来构建类内图、类内重构图、
类间图和类间重构图;

3)在低维嵌入空间中,保持类内图和类内重构图的结构不变,抑制类间图和类间
重构图的结构关系,得到从高维空间到低维空间的投射矩阵;

4)通过步骤3)得到的投影矩阵,将训练样本的高维数据降维,得到训练样本的低
维嵌入特征;

5)通过步骤3)得到的投影矩阵,将待分类的高光谱图像作为测试样本并将测试样
本的高维数据降维,得到测试样本低维嵌入;

6)根据步骤4)得到的训练样本的低维嵌入特征并结合选取的分类器,即可对测试
样本的低维嵌入进行分类,得到高光谱图像分类结果。

步骤1)对训练样本各数据点利用同类近邻点进行重构的方法为,

对训练样本每个数据点xi,从来自同类的数据中选取k1个近邻点来重构xi,重构点


式中,sij为数据点xi与xj之间的重构权值,且si=[si1,si2,…,siN
]T;若xi与xj为同类近邻,sij≠0,否则sij=0,其定义为:


式中,归一化值

步骤2)中类内图、类内重构图、类间图和类间重构图的构建如下,

构建类内图Gw={X,Ww},X为图的顶点,若图中两顶点xi和xj属于来自同类数据的k1
近邻,则在xi和xj之间构建一条连接边,否则,xi和xj之间无边,边的权值为表示xi和xj间
的相似关系,定义为:


式中,参数

构建类内重构图为图的顶点,若xi和xj属于来自同类数据的k1近
邻,则在对应的和之间构建一条连接边,否则,和之间无边,边的权值为表示
和间的相似关系,定义为:


式中,参数

构建类间图Gb={X,Wb},X为图的顶点,若图中两顶点xi和xj属于非同类数据的k2近
邻,则在xi和xj之间构建一条连接边,否则,xi和xj不连接,边的权值为表示xi和xj间的近
似程度,定义为:


式中,参数

构建类间重构图为图的顶点,若xi和xj属于非同类数据的k2近邻,
则在对应的和之间构建一条连接边,否则,和不连接,边的权值为表示和间
的近似程度,定义为:


式中,参数

步骤3)中投影矩阵按如下方法确定,

对于类内数据,在低维空间中不改变类内图和类内重构图的相似关系,使同类数
据及其重构数据尽可能聚集在一起,进而减小同类数据间的差异,目标函数表示为:


式中,和
为对角矩阵,且S=[s1,s2,…,sN],
si=[si1,si2,…,siN]T;

对于类间数据,在低维空间中抑制类间图和类间重构图中数据间的相似性,分离
开非同类数据,进而增大非同类数据间的差异,目标函数表示为:



式中,和
为对角矩阵,且

将式(16)和(17)的优化问题转化为:


由拉格朗日乘子法,得到:

XMbXTV=λXMwXTV (19)

通过求取式(19)的特征值,并由大到小排列,取前d个特征值对应的特征向量组成
投影矩阵V=[v1,v2,…,vd]。

本发明利用数据的邻域和各邻域的类内重构点来表征高光谱数据的内在结构,即
在构建类内图和类间图时,不仅考虑了数据的邻域关系,而且考虑了数据近邻点的邻域结
构,能从高光谱数据中得到更多的隐含太阳城集团,由此增强了类内数据的聚集性和类间数据的
分离性,进而突出了非同类数据间的差异性,能更好地表征高光谱数据的内在流形结构,从
而提取出鉴别特征,改善分类精度。

因此,本发明提出的高光谱图像分类方法,能够更有效地提取出鉴别特征,且分类
结果更准确,对高光谱图像的地物分类效果更好。对比实验结果也表明,本方法较其它现有
各种方法都有明显优势。

附图说明

图1-MFA算法原理图。

图2-本发明分类流程示意图。

图3-本发明构图过程示意图。

图4-不同参数k和β在Salinas数据集上的总体分类精度示意图。

图5-各算法对SVMCK在Salinas数据集上的分类图。其中,(a)GT,(b)Baseline
(95.8%),(c)PCA(94.8%),(d)NPE(96.4%),(e)LPP(96.0%),(f)LDA(94.6%),(g)LFDA
(96.3%),(h)MMC(94.7%),(i)MFA(95.5%),(j)LME(99.2%)。

图6-不同参数k和β在Indian Pines数据集上的分类精度示意图。

图7-各算法对SVMCK在Indian Pines数据集上的分类图。其中,(a)GT,(b)
Baseline(93.9%),(c)PCA(91.8%),(d)NPE(92.0%),(e)LPP(91.0%),(f)LDA(95.0%),
(g)LFDA(90.9%),(h)MMC(89.9%),(i)MFA(93.5%),(j)LME(98.1%)。

图8-IndianPines数据集中五类地物的二维嵌入结果图。其中,(a)Spectral
curve,(b)PCA,(c)NPE,(d)LPP,(e)LDA,(f)LFDA,(g)MMC,(h)MFA,(i)LME。

具体实施方式

根据MFA算法的过程可知,其在构图时只考虑了数据的邻域结构,对于存在大量同
质区域的高光谱图像来说,MFA不能有效地表征数据的内在流形。为改善MFA算法在高光谱
图像特征提取中的效果,本发明提出了一种新的流形学习方法,称为局部流形嵌入(LME)。

本发明利用数据的邻域和各邻域点的邻域来表征高光谱图像的内在结构。首先,
对各数据点利用同类近邻点进行重构,然后,利用各数据点的邻域以及各邻域点对应的重
构点来构建类内图、类内重构图、类间图和类间重构图,最后,在低维嵌入空间中,保持类内
图的结构不变,抑制类间图的结构关系,得到从高维空间到低维空间的投影矩阵,从而提取
出鉴别特征。图2为本发明的分类流程示意图。

对训练样本每个数据点xi,从来自同类的数据中选取k1个近邻点来重构xi,重构点


式中,sij为数据点xi与xj之间的重构权值,且si=[si1,si2,…,siN
]T;若xi与xj为同类近邻,sij≠0,否则sij=0,其定义为:


式中,归一化值

构建类内图Gw={X,Ww},X为图的顶点,若图中两顶点xi和xj属于来自同类数据的k1
近邻,则在xi和xj之间构建一条连接边,否则,xi和xj之间无边,边的权值为表示xi和xj间
的相似关系,定义为:


式中,参数

构建类内重构图为图的顶点,若xi和xj属于来自同类数据的k1近
邻,则在对应的和之间构建一条连接边,否则,和之间无边,边的权值为表示和
间的相似关系,定义为:


式中,参数

构建类间图Gb={X,Wb},X为图的顶点,若图中两顶点xi和xj属于非同类数据的k2近
邻,则在xi和xj之间构建一条连接边,否则,xi和xj不连接,边的权值为表示xi和xj间的近
似程度,定义为:


式中,参数

构建类间重构图为图的顶点,若xi和xj属于非同类数据的k2近邻,
则在对应的和之间构建一条连接边,否则,和不连接,边的权值为表示和间
的近似程度,定义为:


式中,参数

图3为LME算法的图构建示意图。在构建类内图时,对于数据点x1,不仅考虑了它的
邻域点(如x2),而且考虑了各邻域点的类内重构点(如x1的类内邻域重构点x7,x2的类内邻
域重构点x3),即在x1与x2之间构建一边,也在x3和x7之间连一条边,边权值都根据式(12)和
(13)进行设置。在构建类间图时,考虑了各数据点(如x4)与其非同类邻域(如x5)和各邻域点
的类内重构点(如x4的类内邻域重构点x8,x5的类内邻域重构点x6)之间的关系,即连接x4与
x5,同时也连接x6与x8,边权值都由式(14)和(15)进行设置。

对于类内数据,在低维空间中不改变类内图和类内重构图的相似关系,使同类数
据及其重构数据尽可能聚集在一起,进而减小同类数据间的差异,目标函数表示为:


式中,和
为对角矩阵,且S=[s1,s2,…,sN],
si=[si1,si2,…,siN]T;

对于类间数据,在低维空间中抑制类间图和类间重构图中数据间的相似性,分离
开非同类数据,进而增大非同类数据间的差异,目标函数表示为:



式中,和
为对角矩阵,且

将式(16)和(17)的优化问题转化为:


由拉格朗日乘子法,得到:

XMbXTV=λXMwXTV (19)

通过求取式(19)的特征值,并由大到小排列,取前d个特征值对应的特征向量组成
投影矩阵V=[v1,v2,…,vd]。

通过得到的投影矩阵,即可将训练样本的高维数据降维,得到训练样本的低维嵌
入特征;同时将需要分类的高光谱图像作为测试样本,将测试样本的高维数据降维,得到测
试样本低维嵌入;再结合选取的分类器,即可对测试样本的低维嵌入进行分类,得到高光谱
图像的分类结果。

本发明通过数据的邻域点和各邻域的同类近邻重构点来构建类内图和类间图,能
更好地表征高光谱图像的内蕴属性,改善数据的可分性,进而提升分类精度。为减少同类近
邻k1和非同类近邻k2设置的困难,把非同类近邻设置为同类近邻的整数倍,因为非同类数据
通常比同类数据多,且非同近邻的小范围变化对分类结果的影响较小。

为分析本发明的可行性,选取了Salinas和Indian Pines高光谱数据集进行实验,
并与现有的相关算法进行了对比。

实验中,数据集被随机分为训练集和测试集,通过特征提取算法对训练集进行学
习,得到一个低维嵌入空间;然后,把所有的测试样本映射到这个低维空间中,得到各样本
的低维特征;最后,利用最近邻(NN)分类器、光谱角制图(SAM)和复合核支持向量机(SVM
based on Composite Kernels,SVMCK)对测试样本进行分类。为评价各方法的分类结果,采
用了平均分类精度(AA)、总体分类精度(OA)和Kappa系数(KC)作为评价指标。为增强实验结
果的鲁棒性,每种情况下进行了10次重复实验,并计算了各精度的平均值和标准差。

实验中,选择了Baseline(BL)、PCA、LDA、LFDA、MMC和MFA算法与本发明算法进行对
比,其中Baseline表示直接利用分类器对测试样本进行分类。为使各算法得到最优分类结
果,利用交叉验证法来得到各算法的参数,对于LPP、NPE和LFDA的近邻数设置为9。由于类间
近邻数大范围的变化对MFA和LME的分类结果影响较小,因而,可设置类内近邻k1=k,类间
近邻k2=βk,其中β为正整数;实验中,MFA和LME的k和β值分别设置为9和20。对于SVMCK分类
器,采用基于RBF核函数组成的加权核,由于该核比其他核具有更好的分类结果,空间太阳城集团
是由空间邻域内的平均像素值来表示;实验中,惩罚参数C和RBF的核参数δ通过在{10-10,
10-9,…,1010}范围内的网格寻优得到,空间邻域窗口大小设置为9×9。LDA算法的低维嵌入
维度设置为c-1,其中c为类别数,其他算法的低维嵌入维度设置为30。

在Salinas数据集上的实验

为分析不同类内近邻数和类间近邻数对分类精度的影响,实验中,从Salinas数据
集的每类地物中随机选取60个数据作为训练样本,余下数据作为测试样本,经过特征提取
后,利用NN对测试样本进行分类。实验中,参数k和β的范围分别设置为{3,5,7,…,25}和{5,
15,20,…,60},每种条件下进行了10次重复实验,图4为本发明算法对参数k和β的平均总体
分类精度。

由图4可知,随着k值的增加,分类精度先增加后减小,这是因为过小或过大的k值
都不能有效地表达高光谱图像的内在结构。在k值小于15时,随着β的增加,分类精度不断增
加,最终达到一稳定值;当k值超过15时,若β值大于20,分类精度将迅速下降,由于过大的k
和β值将使类间边界出现过学习现象。总体上看,k和β值的变化对Salinas数据集分类精度
的影响不大;实验中,k和β的最佳值设置为9和20。

表1不同算法对不同分类器在Salinas数据集上的分类精度(OA±std(%)(KC))


为分析各算法对于不同分类器在不同数量训练样本下的分类性能,从每类地物中
随机选取ni个数据作为训练样本,剩余数据作为测试样本。通过特征提取算法对训练样本
进行学习,得到各样本的低维特征后,利用NN、SAM和SVMCK对测试样本进行分类,并且每种
情况下都进行了10次重复实验。表1为10次实验的平均总体分类精度、标准差和平均Kappa
系数。

根据表1可知,各算法的总体分类精度和Kappa系数都随着训练样本数据的增加而
不断增加,因为训练样本数越多,可利用的先验太阳城集团也越多,对高光谱图像的内在特性表达
更准确。在不同分类器下,各算法对于SVMCK的分类结果都比对其他分类器的好,因为SVMCK
同时利用了数据的光谱太阳城集团和空间太阳城集团来增强高光谱图像的分类性能。在各条件下,本发
明算法比MFA算法的分类结果都更好,因为本算法利用了数据的邻域和各邻域点的类内重
构点来表征高光谱数据的内在流形结构,增强了类内数据的聚集性和类间数据的分离性,
得到更好的鉴别特征,进而改善地物分类精度。

为分析本算法在平衡训练样本数下的分类精度,从每类中选取2%的数据作为训
练样本,余下数据作为测试样本来评价各算法的生产者精度。得到各样本的嵌入特征后,利
用SVMCK对测试样本进行分类,表2给出了各算法的分类精度,图5为相应的分类结果图。

由表2可知,LME算法在大部分地物中都具有最好的分类结果,而且拥有最高的总
体分类精度、平均分类精度和Kappa系数,表明LME算法能更有效地揭示高光谱图像的内在
流形结构,提取出更好的鉴别特征,进而提升分类精度。

表2各算法对SVMCK在Salinas数据集上的分类结果



在图5中,LME算法比其他算法产生了更多的同质区域,与真实地物更吻合,尤其是
在“Grapes”、“Corn,Lettuce 4wk”、“Lettuce 7wk”、“Vinyard untrained”地物区域内。

为比较各算法的分类性能,表3展示了各算法之间的McNemar检验值。从表中可以
看出,LME算法比其他算法具有更显著的统计差异性,说明该算法能更好地提取出地物的鉴
别特征,改善分类精度。

表3各算法在Salinas数据集上的McNemar检验


在Indian Pines数据集上的实验

为分析LME算法对不同地物场景的分类性能,另外选用了Indian Pines数据集进
行实验。在实验中,从每类地物中随机选择ni个数据作为训练样本,其余数据作为测试样
本,对于样本数较少的地物,如果ni≥Ni/2,则ni=Ni/2,其中Ni为第i类地物的样本数,比如:
“Alfalfa”、“Grass/Pasture-mowed”、“Oats”。

为探索参数k和β对分类结果的影响,从每类地物中随机选取60个数据作为训练样
本,其余数据作为测试样本。各算法对训练样本进行学习后,得到各样本的低维特征,并利
用NN对测试样本的低维特征进行分类。图6给出了不同参数k和β下的分类精度。

由图6可知,随着k值的增加,分类精度先上升后下降,导致这种现象的原因是:较
小的k值不能获取足够的太阳城集团去表征高光谱图像的内在结构,而过大的k值在表征高光谱数
据的内在特性时会出现过拟合现象。随着β值的不断增加,分类精度也随之不断增加,并达
到一稳定的峰值。实验中,为得到最佳分类结果,k和β分别设置为9和20。

为分析各算法对不同分类器的分类结果,从每类地物中随机选取了20、40、60和80
个数据作为训练样本,其余数据作为测试样本。每种情况下进行了10次重复实验,表4给出
了各方法的平均总体分类精度、标准差和平均Kappa系数。

由表4可以看出,各算法的分类精度随着训练样本数的增加不断提升。各算法对于
NN和SAM的分类结果都不理想,因为NN和SAM对Indian Pines中各地物的鉴别能力较差,使
分类精度受到限制。但是,LME对NN和SAM的分类结果仍然比其他方法好,由于LME算法能有
效地揭示出高光谱数据的内在流形结构,得到更好的鉴别特征,提升分类精度。另外,各算
法对SVMCK的分类精度都比对NN和SAM的好,而且LME对SVMCK在所有条件下都具有最好的分
类精度,因为SVMCK同时利用了高光谱图像的光谱太阳城集团和空间太阳城集团来分类。

表4各算法对不同分类器在Indian Pines数据集上的分类精度(OA±std(%)
(KC))



为分析各类地物的分类精度,每类地物中随机选取10%的数据作为训练样本,对
于样本数较少的地物,每类随机选取10个数据作为训练样本,剩余数据作为测试样本。在得
到低维特征后,利用SVMCK分类器对测试样本进行分类,表5给出了各算法的分类结果。

表5各算法对SVMCK在Indian Pines数据集上的分类结果



根据表5的分类结果可知,LME算法在大多数地物中比其他算法得到了更好的分类
精度,并且具有最好的平均分类精度、总体分类精度和Kappa系数,由于LME算法能有效地揭
示出高光谱数据中的隐藏太阳城集团。图7为各算法对应的分类图,LME算法比其他算法产生了更
光滑的分类结果,整体效果与真实地物场景更接近。

为比较各算法之间的分类性能,对各算法分类结果间进行统计差异性检验,表6给
出了各算法之间的McNemar检验结果。从表中可以看出,各算法对LME算法的McNemar检验值
都为负,说明LME算法具有更显著的统计差异性,能更好地提取出高光谱数据的内在特征,
提升地物分类精度。

表6各算法在Indian Pines数据集上的McNemar检验


二维嵌入分析

为分析各算法的低维嵌入特征,从Indian Pines数据集中选取“Corn-mintill”、
“Grass-trees”、“Hay-windrowed”、“Wheat”和“Woods”五类地物进行二维嵌入,并从这几类
地物中每类随机选取100个数据作为训练样本,其余样本作为测试样。通过各算法对训练样
本进行学习,进而可以得到测试样本的二维嵌入,并在二维空间中绘制出各数据点的分布
情况。图8给出了各算法二维嵌入的分布结果,图中分别用1、2、3、4、5表示五类地物。

由图8可知,PCA、NPE和LPP的二维嵌入结果可看出,同类地物分布十分散乱,且非
同类地物间产生了重叠现象,由于它们都属于非监督算法,不能有效地表征数据的内在特
性。监督的LDA和MMC改善了同类数据的聚集性,但非同类数据间仍存在重叠情况,因为它们
都起源于统计理论,忽略了数据的内在结构。MFA可揭示出数据的内在流形,但不能有效地
表达高光谱数据的流形结构,导致图8(h)中非同类数据产生重叠分布的现象。LME算法的二
维嵌入比其他算法都好,因为LME利用了数据的邻域结构和各邻域的类内重构点来表征高
光谱数据的内在结构,增强了类内数据的聚集性和类间数据的分离性。

通过LME算法在Salinas和Indian Pines两个高光谱数据集上的分类实验,可得到
以下结论:

①LME在各种情况下都比Baseline、PCA、NPE、LPP、LDA、LFDA、MMC和MFA的分类效果
好,因为LME利用数据的邻域和各邻域的类内重构点来表征高光谱数据的内在结构,增强了
类内数据的聚集性和类间数据的分离性。表明LME能从高光谱数据中得到更多的隐含太阳城集团。

②在不同分类器下,LME比其他算法具有更好的分类精度,由于LME能得到更有效
的鉴别特征,且适应性更强,进而能同时改善NN、SAM和SVMCK的分类精度。

③在Salinas和Indian Pines数据集上的分类结果可知,SVMCK在各种情况下的分
类精度都比NN和SAM更好,因为SVMCK同时利用了高光谱图像的光谱太阳城集团和空间太阳城集团来分
类,而NN和SAM只利用了光谱太阳城集团进行分类。

④由LME算法的太阳城集团复杂度分析可知,运行太阳城集团主要取决于数据的维度、近邻数和
训练样本数。根据运行太阳城集团可知,相同条件下LME在特征提取过程中比其他算法更耗时,这
是由于LME在构建类内图和类间图时需要耗费更多太阳城集团。但LME能减少直接用分类器分类的
太阳城集团,且能提升分类精度。

⑤在数据的二维嵌入实验中,LME比其他算法得到了更好的分布,表明LME算法改
善了类内数据的聚集性和类间数据的分离性,进而突出了非同类数据间的差异性。

针对MFA算法不能有效地表征高光谱图像内在结构的问题,本发明提出了LME算
法,本算法利用数据的邻域点和各邻域的类内重构点来揭示高光谱数据的流形结构,并构
建了类内图和类间图,在低维嵌入空间中保持图的结构不变,增强类内数据的聚集性和类
间数据的分离性,得到鉴别特征,实现高光谱图像的分类。在Salinas和Indian Pines数据
集上的实验结果表明,本算法比其他特征提取算法能得到更好的鉴别特征,进而改善高光
谱图像的地物分类精度。

最后需要说明的是,本发明的上述实例仅仅是为说明本发明所作的举例,而并非
是对本发明的实施方式的限定。尽管申请人参照较佳实施例对本发明进行了详细说明,对
于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其他不同形式的变化和
变动。这里无法对所有的实施方式予以穷举。凡是属于本发明的技术方案所引申出的显而
易见的变化或变动仍处于本发明的保护范围之列。

关 键 词:
基于 局部 流形 嵌入 光谱 图像 分类 方法
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
太阳城集团本文
本文标题:基于局部流形嵌入的高光谱图像分类方法.pdf
链接地址:http://zh228.com/p-6019696.html
太阳城集团我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
葡京赌场|welcome document.write ('');