太阳城集团

  • / 18
  • 下载费用:30 金币  

一种基于多核融合的多示例多标签场景分类方法.pdf

摘要
申请专利号:

CN201510344990.5

申请日:

2015.06.19

公开号:

CN105046269A

公开日:

2015.11.11

当前法律状态:

授权

有效性:

有权

法律详情: 授权|||实质审查的生效IPC(主分类):G06K 9/62申请日:20150619|||公开
IPC分类号: G06K9/62; G06F17/30 主分类号: G06K9/62
申请人: 鲁东大学
发明人: 邹海林; 陈彤彤; 丁昕苗; 柳婵娟; 刘影; 申倩
地址: 264025山东省烟台市芝罘区红旗中路186号
优先权:
专利代理机构: 北京轻创知识产权代理有限公司11212 代理人: 王澎
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201510344990.5

授权太阳城集团号:

||||||

法律状态太阳城集团日:

2019.02.22|||2015.12.09|||2015.11.11

法律状态类型:

授权|||实质审查的生效|||公开

摘要

太阳城集团本发明涉及一种基于多核融合的多示例多标签场景分类方法,包括:输入一个多示例多标签数据集,拆分成多示例数据集和一个多标签数据集;使用不同的阈值分别对多示例数据集中的每个包建立相关性矩阵;根据得到的相关性矩阵求同一阈值下每两个多示例数据包之间的基本核函数,基本核函数值组成基本核矩阵;将不同阈值下的基本核矩阵中相同位置的元素值进行凸组合,得到一个多核矩阵;利用多标签数据集训练,得到多个多核SVM分类器。多核SVM分类器用于对未知的多示例数据包的标签集进行预测从而实现场景分类。本发明的一种基于多核融合的多示例多标签场景分类方法,提高场景分类准确性。本发明还涉及一种基于多核融合的多示例多标签场景分类系统。

权利要求书

1.一种基于多核融合的多示例多标签场景分类方法,其特征在于,包括
以下步骤:
步骤1,输入一个多示例多标签数据集,记为
并将所述多示例多标签数据集拆分成一个多示例数据集X={Xi|i=1,2,...,m}和
一个多标签数据集Y={Yi|i=1,2,...,m};
其中,i为多示例多标签数据集中多示例数据包的编号,m为包的总个
数,m取正整数;Xi指多示例数据集X中编号为i的多示例数据包,记为
xi1表示多示例数据包Xi中编号为1的示例,xi2表示多示例
数据包Xi中编号为2的示例,表示多示例数据包Xi中编号为ni的示例,ni
指编号为i的包中包含的示例个数,ni取值为正整数;yi1表
示标签数据集Yi中编号为1的标签,yi2表示标签数据集Yi中编号为2的标签,
表示标签数据集Yi中编号为li的标签,li为标签数据集Yi中包含的标签个
数,li取值为正整数;
步骤2,使用多个阈值中的每一个阈值分别对每个多示例数据包Xi建立
相关性矩阵,则在同一阈值下,每一个多示例数据包都会建立一个相关性矩
阵所述阈值ts∈(t1,t2,...,tS),其中,S为阈值的总个数,s表示阈值的编号;
步骤3,根据步骤2中得到的相关性矩阵求同一阈值下每两个多示例数
据包之间的基本核函数,所述多个基本核函数值组成基本核矩阵,所述基本
核矩阵中的元素值为同一阈值下每两个多示例数据包之间的基本核函数值,
所述基本核矩阵中元素值的行号和列号分别对应两个多示例数据包的编号;
针对不同的阈值,则会得到不同阈值下的基本核矩阵Kgs,g为基本核矩阵标
识,s为基本核矩阵的编号,与所述阈值的编号一一对应;
步骤4,将步骤3中得到的不同阈值下的基本核矩阵Kgs中相同位置的元
素进行组合,得到一个多核函数K(Xi,Xj),所述多个多核函数值组成多核矩
阵,即所述多核矩阵K中的元素值对应每两个多示例数据包之间的多核函数
值;
步骤5,利用多标签数据集Yi和步骤4中得到的多核函数进行学习,得
到多个多核SVM分类器,所述分类器的数量与所述多标签数据集中的标签
类数量相同,所述分类器用于对未知多示例数据包的标签集进行预测从而实
现场景分类。
2.根据权利要求1所述的一种基于多核融合的多示例多标签场景分类方
法,其特征在于,所述步骤2中使用一个阈值对一个包Xi建立相关性矩阵的
过程具体为:
步骤2.1,定义一个ni×ni的矩阵W,所述矩阵中的行号和列号分别对应
多示例数据包Xi中两个示例的编号;
步骤2.2,判断示例xia和示例xiu之间的高斯距离是否小于阈值t,若示例
xia和示例xiu之间的高斯距离小于阈值ts,则将矩阵W的第a行第u列的元素
赋值为1;否则赋值为0;a,u均为示例编号,均取值为[1,ni]之间的整数;
直至将矩阵W中的每一个元素都赋值完,得到多示例数据包Xi的相关性矩阵
其中,的上标s表示阈值的编号,的下标i表示多示例数据包的编
号。
3.根据权利要求2所述的一种基于多核融合的多示例多标签场景分类方
法,其特征在于,所述步骤2.2中的阈值ts取值为[0,4],所述阈值的个数为
[10,15]。
4.根据权利要求1所述的一种基于多核融合的多示例多标签场景分类方
法,其特征在于,所述步骤3按照以下公式求同一个阈值下每两个多示例数
据包之间的基本核函数:
K g s ( X i , X j ) = Σ a = 1 n i Σ b = 1 n j W i a s W j b s k s ( x i a , x j b ) Σ a = 1 n i W i a s Σ b = 1 n j W j b s ]]>
其中,Xi,Xj分别表示编号为i和编号为j的多示例数据包,Kgs(Xi,Xj)为
多示例数据包Xi和多示例数据包Xj之间的基本核函数,g为基本核矩阵标
识,s为基本核矩阵的编号,与所述阈值的编号一一对应;
为多示例数据包Xi对应的阈值为ts的相关性矩阵中第a行所有元素之
和的倒数,其中,i为多示例数据包的编号,s为基本核矩阵的编号,与所述
阈值的编号一一对应,a为所述多示例数据包Xi对应的阈值为ts的相关性矩
阵中的行号;表示多示例数据包Xi对应的阈值为ts的相关
性矩阵中第a行第u列的元素值,ni为多示例数据包Xi对应的阈值为ts的相
关性矩阵的总行数或总列数,与多示例数据包Xi中的示例个数相等;
为多示例数据包Xj对应的阈值为ts的相关性矩阵中第b行所有元素之
和的倒数,其中,j为多示例数据包的编号;表示多示例
数据包Xj对应的阈值为ts的相关性矩阵中第b行第v列的元素值;nj为多
示例数据包Xj对应的相关性矩阵的总行数或总列数,与多示例数据包Xj中
的示例个数相等;
ks(xia,xjb)为一般核函数,由径向基核函数求得,具体为:
ks(xia,xjb)=exp(-γ||xia-xjb||2);其中,s为阈值的编号;xia为多示例数据包Xi中
编号为a的示例,i为多示例数据包的编号,a为示例的编号;xjb为多示例数
据包Xj中编号为b的示例,j为多示例数据包的编号,b为示例的编号;
exp(-γ||xia-xjb||2)为以e为底数的指数函数,
e=2.71828,幂为-γ||xia-xjb||2,||xia-xjb||为xia-xjb的范数,γ为核系数,取任
意值,针对不同的基本核矩阵,核系数γ取不同值。
5.根据权利要求1至4中任意一项所述的一种基于多核融合的多示例多
标签场景分类方法,其特征在于,所述步骤4中采用凸组合对不同阈值下的
基本核矩阵Kgs中相同位置的元素进行组合,所述经过凸组合得到的多核函
数为:
K ( X i , X j ) = Σ s = 1 S d s K g s ( X i , X j ) , d s 0 , Σ s = 1 S d s = 1 ; ]]>
式中,K(Xi,Xj)为多示例数据包Xi和多示例数据包Xj之间的多核函数,
也是多核矩阵中第i行第j列的元素;ds为权系数;s为阈值的编号,取值为
正整数;S为基本核矩阵的总个数,Kgs(Xi,Xj)为多示例数据包Xi和多示例数
据包Xj之间的基本核函数,也是基本核矩阵Kgs中第i行第j列的元素。
6.一种基于多核融合的多示例多标签场景分类系统,其特征在于,包括:
输入模块,用于输入一个多示例多标签数据
集,记为并将所述多示例多标签数据集拆分成一个多示例数据集
X={Xi|i=1,2,...,m}和一个多标签数据集Y={Yi|i=1,2,...,m};
其中,i为多示例多标签数据集中多示例数据包的编号,m为包的总个
数,m取正整数;Xi指多示例数据集X中编号为i的多示例数据包,记为
xi1表示多示例数据包Xi中编号为1的示例,xi2表示多示例
数据包Xi中编号为2的示例,表示多示例数据包Xi中编号为ni的示例,ni
指编号为i的包中包含的示例个数,ni取值为正整数;yi1表
示标签数据集Yi中编号为1的标签,yi2表示标签数据集Yi中编号为2的标签,
表示标签数据集Yi中编号为li的标签,li为标签数据集Yi中包含的标签个
数,li取值为正整数;
相关性矩阵建立模块,用于使用多个阈值中的每一个阈值分别对每个多
示例数据包Xi建立相关性矩阵,则在同一阈值下,每一个多示例数据包都会
建立一个相关性矩阵所述阈值ts∈(t1,t2,...,tS),其中,S为阈值的总个数,
s表示阈值的编号;
基本核矩阵模块,用于根据相关性矩阵建立模块中得到的相关性矩阵求
同一阈值下每两个多示例数据包之间的基本核函数,所述多个基本核函数值
组成基本核矩阵,所述基本核矩阵中的元素值为同一阈值下每两个多示例数
据包之间的基本核函数值,所述基本核矩阵中元素值的行号和列号分别对应
两个多示例数据包的编号;针对不同的阈值,则会得到不同阈值下的基本核
矩阵Kgs,g为基本核矩阵标识,s为基本核矩阵的编号,与所述阈值的编号
一一对应;
组合模块,用于将基本核矩阵模块中得到的不同阈值下的基本核矩阵
Kgs中相同位置的元素进行组合,得到一个多核函数K(Xi,Xj),所述多个多
核函数值组成多核矩阵,即所述多核矩阵K中的元素值对应每两个多示例数
据包之间的多核函数值;
学习模块,用于利用多标签数据集Yi和组合模块中得到的多核函数进行
学习,得到多个多核SVM分类器,所述分类器的数量与所述多标签数据集
中的标签类数量相同,所述分类器用于对未知多示例数据包的标签集进行预
测从而实现场景分类。
7.根据权利要求6所述的一种基于多核融合的多示例多标签场景分类系
统,其特征在于,所述相关性矩阵建立模块中使用一个阈值对一个包Xi建立
相关性矩阵的过程具体为:
步骤2.1,定义一个ni×ni的矩阵W,所述矩阵中的行号和列号分别对应
多示例数据包Xi中两个示例的编号;
步骤2.2,判断示例xia和示例xiu之间的高斯距离是否小于阈值t,若示例
xia和示例xiu之间的高斯距离小于阈值ts,则将矩阵W的第a行第u列的元素赋
值为1;否则赋值为0;a,u均为示例编号,均取值为[1,ni]之间的整数;直
至将矩阵W中的每一个元素都赋值完,得到多示例数据包Xi的相关性矩阵
其中,的上标s表示阈值的编号,的下标i表示多示例数据包的编
号。
8.根据权利要求7所述的一种基于多核融合的多示例多标签场景分类系
统,其特征在于,所述步骤2.2中的阈值t取值为[0,4],所述阈值的个数为
[10,15]。
9.根据权利要求8所述的一种基于多核融合的多示例多标签场景分类方
法,其特征在于,所述基本核矩阵模块按照以下公式求每两个多示例数据包
之间的基本核函数:
K g s ( X i , X j ) = Σ a = 1 n i Σ b = 1 n j W ia s W j b s k s ( x i a , x j b ) Σ a = 1 n i W ia s Σ b = 1 n j W j b s ; ]]>
其中,Xi,Xj分别表示编号为i和编号为j的多示例数据包,Kgs(Xi,Xj)为
多示例数据包Xi和多示例数据包Xj之间的基本核函数,g为基本核矩阵标
识,s为基本核矩阵的编号,与所述阈值的编号一一对应;
为多示例数据包Xi对应的阈值为ts的相关性矩阵中第a行所有元素之
和的倒数,其中,i为多示例数据包的编号,s为基本核矩阵的编号,与所述
阈值的编号一一对应,a为所述多示例数据包Xi对应的阈值为ts的相关性矩
阵中的行号;表示多示例数据包Xi对应的阈值为ts的相关
性矩阵中第a行第u列的元素值,ni为多示例数据包Xi对应的阈值为ts的相
关性矩阵的总行数或总列数,与多示例数据包Xi中的示例个数相等;
为多示例数据包Xj对应的阈值为ts的相关性矩阵中第b行所有元素之
和的倒数,其中,j为多示例数据包的编号;表示多示例
数据包Xj对应的阈值为ts的相关性矩阵中第b行第v列的元素值;nj为多
示例数据包Xj对应的相关性矩阵的总行数或总列数,与多示例数据包Xj中
的示例个数相等;
ks(xia,xjb)为一般核函数,由径向基核函数求得,具体为:
ks(xia,xjb)=exp(-γ||xia-xjb||2);其中,s为阈值的编号;xia为多示例数据包Xi中
编号为a的示例,i为多示例数据包的编号,a为示例的编号;xjb为多示例数
据包Xj中编号为b的示例,j为多示例数据包的编号,b为示例的编号;
exp(-γ||xia-xjb||2)为以e为底数的指数函数,
e=2.71828,幂为-γ||xia-xjb||2,||xia-xjb||为xia-xjb的范数,γ为核系数,取任
意值,针对不同的基本核矩阵,核系数γ取不同值。
10.根据权利要求6-9中任意一项所述的一种基于多核融合的多示例多
标签场景分类方法,其特征在于,所述组合模块采用凸组合对不同阈值下的
基本核矩阵Kgs中相同位置的元素进行组合,所述经过凸组合得到的多核函
数为:
K ( X i , X j ) = Σ s = 1 S d s K g s ( X i , X j ) , d s 0 , Σ s = 1 S d s = 1 ; ]]>
式中,K(Xi,Xj)为多示例数据包Xi和多示例数据包Xj之间的多核函数,
也是多核矩阵中第i行第j列的元素;ds为权系数;s为阈值的编号,取值为
正整数;S为基本核矩阵的总个数,Kgs(Xi,Xj)为多示例数据包Xi和多示例数
据包Xj之间的基本核函数,也是基本核矩阵Kgs中第i行第j列的元素。

说明书

一种基于多核融合的多示例多标签场景分类方法

技术领域

本发明涉及机器学习技术领域,具体涉及一种基于多核融合的多示例多
标签场景分类方法。

背景技术

多示例学习是由监督型学习演变出来的一种学习方法,首次是在20世
纪90年代人们研究药物活性时提出,其是将每个制药分子看做一个包,分
子的每个异构体看做包中的一个示例,如果该分子有一种异构体适于制药,
则将该分子对应的包标记为正包,否则标记为负包,通过该方法最终构建出
一个学习系统,进而对已知适于或不适于制药的分子进行学习,来正确地预
测其他新的分子是否适合制药。自此,多示例学习一直成为研究的热点,并
被广泛应用于文本、图像和视频的分类检索中,随后又将多示例学习引入到
多标签分类问题中,提出了多示例多标签学习框架。

目前,针对多示例多标签学习问题的解决办法,都是通过转化为多示例
单标签问题或单示例多标签问题,进而转化为传统的监督学习问题加以解
决,其代表算法有MIML_BOOST方法和MIML_SVM方法的学习框架,其
中,MIML_BOOST算法是先将多示例多标签问题转化为多示例单标签问题,
再利用MIBOOSTING算法解决多示例问题,但这种方法在利用
MIBOOSTING算法解决多示例问题过程中,由于正包中不一定都是正示例,
给包的所有示例加上该包标签的做法会造成较大的误差;MIML_SVM算法
则是先将多示例多标签问题转化为单示例多标签问题,再利用MLSVM算法
解决多标签问题,但MIMLSVM算法是用两个包内示例与示例之间的最小
Hausdorff距离来表示包与包之间的距离,当一个正包的负示例与负包的示例
很相似时,该距离的表示方法会导致正包和负包的判别性下降,影响分类效
果。此外,还有KISAR算法,该算法通过找到每个包中与某一类标签最相
关的示例实现多示例多标签问题的分类与预测。还有人提出带有软标签的多
示例多标签学习算法MIMLwel(Multi-InstanceMulti-LabelLearningwith
WeakLabel)。为了高效的实现大数据集的多标签预测,又有人提出了
MIMLfast算法,该算法首先构建一个所有标签共用的低维子空间,然后利
用随机梯度下降法训练标签特定的线性模型,从而优化排序损失。

以上算法尽管在解决多示例多标签问题上取得了较好的效果,但均未考
虑包内示例的相关性。而在很多实际应用中,尤其是场景分类问题,示例的
独立性假设是很难保证的,这样就会导致分类效果不理想。

发明内容

本发明所要解决的技术问题是提供一种基于多核融合的多示例多标签
场景分类方法,提高场景分类准确性。

本发明解决上述技术问题的技术方案如下:一种基于多核融合的多示例
多标签场景分类方法,包括以下步骤:

步骤1,输入一个多示例多标签数据集,记为
并将所述多示例多标签数据集拆分成一个多示例数据集X={Xi|i=1,2,...,m}和
一个多标签数据集Y={Yi|i=1,2,...,m};

其中,i为多示例多标签数据集中多示例数据包的编号,m为包的总个
数,m取正整数;Xi指多示例数据集X中编号为i的多示例数据包,记为
xi1表示多示例数据包Xi中编号为1的示例,xi2表示多示例
数据包Xi中编号为2的示例,表示多示例数据包Xi中编号为ni的示例,ni
指编号为i的包中包含的示例个数,ni取值为正整数;yi1表
示标签数据集Yi中编号为1的标签,yi2表示标签数据集Yi中编号为2的标签,
表示标签数据集Yi中编号为li的标签,li为标签数据集Yi中包含的标签个
数,li取值为正整数;

步骤2,使用多个阈值中的每一个阈值分别对每个多示例数据包Xi建立
相关性矩阵,则在同一阈值下,每一个多示例数据包都会建立一个相关性矩
阵Wis;所述阈值ts∈(t1,t2,...,tS),其中,S为阈值的总个数,s表示阈值的编号;

步骤3,根据步骤2中得到的相关性矩阵求同一阈值下每两个多示例数
据包之间的基本核函数,所述多个基本核函数值组成基本核矩阵,所述基本
核矩阵中的元素值为同一阈值下每两个多示例数据包之间的基本核函数值,
所述基本核矩阵中元素值的行号和列号分别对应两个多示例数据包的编号;
针对不同的阈值,则会得到不同阈值下的基本核矩阵Kgs,g为基本核矩阵标
识,s为基本核矩阵的编号,与所述阈值的编号一一对应;

步骤4,将步骤3中得到的不同阈值下的基本核矩阵Kgs中相同位置的元
素进行组合,得到一个多核函数K(Xi,Xj),所述多个多核函数值组成多核矩
阵,即所述多核矩阵K中的元素值对应每两个多示例数据包之间的多核函数
值;

步骤5,利用多标签数据集Yi和步骤4中得到的多核函数进行学习,得
到多个多核SVM分类器,所述分类器的数量与所述多标签数据集中的标签
类数量相同,所述分类器用于对未知多示例数据包的标签集进行预测从而实
现场景分类。

本发明的有益效果是:通过使用不同的阈值分别对每一个多示例数据包
建立相关性矩阵,则可以将多示例数据包内示例之间的相关性表达出来,然
后将建立的相关性矩阵进行处理得到每一个阈值下的基本核矩阵,进而将每
一个基本核矩阵中相同位置元素组合得到多核矩阵,采用多核融合的方式得
到多核函数,可以针对数据集中的多标签进行学习,从而得到多个多核SVM
分类器,适用于多标签分类问题,同时也能适用于样本集数据异构等复杂情
况。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步,所述步骤2中使用一个阈值对一个包Xi建立相关性矩阵的过程
具体为:

步骤2.1,定义一个ni×ni的矩阵W,所述矩阵中的行号和列号分别对应
多示例数据包Xi中两个示例的编号;

步骤2.2,判断示例xia和示例xiu之间的高斯距离是否小于阈值t,若示例
xia和示例xiu之间的高斯距离小于阈值ts,则将矩阵W的第a行第u列的元素赋
值为1;否则赋值为0;a,u均为示例编号,均取值为[1,ni]之间的整数;直
至将矩阵W中的每一个元素都赋值完,得到多示例数据包Xi的相关性矩阵
Wis,其中,Wis的上标s表示阈值的编号,Wis的下标i表示多示例数据包的编
号。

采用上述进一步方案的有益效果是:用一个相关性矩阵将多示例数据包
内示例间的相关关系表示出来,使多示例数据包由多个示例表示转化为由一
个相关性矩阵表示,而由于不同类别标签的预测对应的相关性矩阵的阈值有
所不同,所以不同阈值下的相关性矩阵的建立能够更好地解决多标签分类问
题。

进一步,所述步骤2.2中的阈值ts取值为[0,4],所述阈值的个数为[10,15]。

采用上述进一步方案的有益效果是通过对阈值个数限定在一个范围内,
避免了由于阈值个数太多而增加方法的复杂度。

进一步,所述步骤3按照以下公式求同一个阈值下每两个多示例数据包
之间的基本核函数:

K g s ( X i , X j ) = Σ a = 1 n i Σ b = 1 n j W i a s W j b s k s ( x i a , x j b ) Σ a = 1 n i W i a s Σ b = 1 n j W j b s ]]>

其中,Xi,Xj分别表示编号为i和编号为j的多示例数据包,Kgs(Xi,Xj)为
多示例数据包Xi和多示例数据包Xj之间的基本核函数,g为基本核矩阵标
识,s为基本核矩阵的编号,与所述阈值的编号一一对应;

为多示例数据包Xi对应的阈值为ts的相关性矩阵中第a行所有元素之
和的倒数,其中,i为多示例数据包的编号,s为基本核矩阵的编号,与所述
阈值的编号一一对应,a为所述多示例数据包Xi对应的阈值为ts的相关性矩
阵中的行号;表示多示例数据包Xi对应的阈值为ts的相关
性矩阵Wis中第a行第u列的元素值,ni为多示例数据包Xi对应的阈值为ts的相
关性矩阵的总行数或总列数,与多示例数据包Xi中的示例个数相等;

为多示例数据包Xj对应的阈值为ts的相关性矩阵中第b行所有元素之
和的倒数,其中,j为多示例数据包的编号;表示多示例
数据包Xj对应的阈值为ts的相关性矩阵中第b行第v列的元素值;nj为多
示例数据包Xj对应的相关性矩阵的总行数或总列数,与多示例数据包Xj中
的示例个数相等;

ks(xia,xjb)为一般核函数,由径向基核函数求得,具体为:
ks(xia,xjb)=exp(-γ||xia-xjb||2);其中,s为阈值的编号;xia为多示例数据包Xi中
编号为a的示例,i为多示例数据包的编号,a为示例的编号;xjb为多示例数
据包Xj中编号为b的示例,j为多示例数据包的编号,b为示例的编号;
exp(-γ||xia-xjb||2)为以e为底数的指数函数,
e=2.71828,幂为-γ||xia-xjb||2,||xia-xjb||为xia-xjb的范数,γ为核系数,取任
意值,针对不同的基本核矩阵,核系数γ取不同值。

采用上述进一步方案的有益效果是通过使用一般核函数及相关性矩阵
来表达两个多示例数据包之间的基本核函数,充分考虑了多示例数据包内示
例之间的相关性特征,同时将特征从低维空间映射到高维空间,实现分类。

进一步,所述步骤4中采用凸组合对不同阈值下的基本核矩阵Kgs中相
同位置的元素进行组合,所述经过凸组合得到的多核函数为:

K ( X i , X j ) = Σ s = 1 S d s K g s ( X i , X j ) , d s 0 , Σ s = 1 S d s = 1 ; ]]>

式中,K(Xi,Xj)为多示例数据包Xi和多示例数据包Xj之间的多核函数,
也是多核矩阵中第i行第j列的元素;ds为权系数;s为阈值的编号,取值为
正整数;S为基本核矩阵的总个数,Kgs(Xi,Xj)为多示例数据包Xi和多示例数
据包Xj之间的基本核函数,也是基本核矩阵Kgs中第i行第j列的元素。

采用上述进一步方案的有益效果是采用凸组合将多个基本核函数进行
组合,从而达到组合多个特征空间的目的,使得原数据集映射到多个不同的
特征空间,经过凸组合使得方法的灵活性和准确性更高,能够适用于标签分
类问题,同时也能够较好地解决样本集数据异构等复杂情况。

本发明一种基于多核融合的多示例多标签场景分类系统,包括:

输入模块,用于输入一个多示例多标签数据
集,记为并将所述多示例多标签数据集拆分成一个多示例数据集
X={Xi|i=1,2,...,m}和一个多标签数据集Y={Yi|i=1,2,...,m};

其中,i为多示例多标签数据集中多示例数据包的编号,m为包的总个
数,m取正整数;Xi指多示例数据集X中编号为i的多示例数据包,记为
xi1表示多示例数据包Xi中编号为1的示例,xi2表示多示例
数据包Xi中编号为2的示例,表示多示例数据包Xi中编号为ni的示例,ni
指编号为i的包中包含的示例个数,ni取值为正整数;yi1表
示标签数据集Yi中编号为1的标签,yi2表示标签数据集Yi中编号为2的标签,
表示标签数据集Yi中编号为li的标签,li为标签数据集Yi中包含的标签个
数,li取值为正整数;

相关性矩阵建立模块,用于使用多个阈值中的每一个阈值分别对每个多
示例数据包Xi建立相关性矩阵,则在同一阈值下,每一个多示例数据包都会
建立一个相关性矩阵Wis;所述阈值ts∈(t1,t2,...,tS),其中,S为阈值的总个数,
s表示阈值的编号;

基本核矩阵模块,用于根据相关性矩阵建立模块中得到的相关性矩阵求
同一阈值下每两个多示例数据包之间的基本核函数,所述多个基本核函数值
组成基本核矩阵,所述基本核矩阵中的元素值为同一阈值下每两个多示例数
据包之间的基本核函数值,所述基本核矩阵中元素值的行号和列号分别对应
两个多示例数据包的编号;针对不同的阈值,则会得到不同阈值下的基本核
矩阵Kgs,g为基本核矩阵标识,s为基本核矩阵的编号,与所述阈值的编号
一一对应;

组合模块,用于将基本核矩阵模块中得到的不同阈值下的基本核矩阵
Kgs中相同位置的元素进行组合,得到一个多核函数K(Xi,Xj),所述多个多
核函数值组成多核矩阵,即所述多核矩阵K中的元素值对应每两个多示例数
据包之间的多核函数值;

学习模块,用于利用多标签数据集Yi和组合模块中得到的多核函数进行
学习,得到多个多核SVM分类器,所述分类器的数量与所述多标签数据集
中的标签类数量相同,所述分类器用于对未知多示例数据包的标签集进行预
测从而实现场景分类。

采用上述技术方案的有益效果是:通过使用不同的阈值分别对每一个多
示例数据包建立相关性矩阵,则可以将多示例数据包内示例之间的相关性表
达出来,然后将建立的相关性矩阵进行处理得到每一个阈值下的基本核矩
阵,进而将每一个基本核矩阵中相同位置元素组合得到多核矩阵,采用多核
融合的方式得到多核函数,可以针对数据集中的多标签进行学习,从而得到
多个多核SVM分类器,适用于多标签分类问题,同时也能适用于样本集数
据异构等复杂情况。

进一步,所采用的技术方案是:

所述相关性矩阵建立模块中使用一个阈值对一个包Xi建立相关性矩阵
的过程具体为:

步骤2.1,定义一个ni×ni的矩阵W,所述矩阵中的行号和列号分别对应
多示例数据包Xi中两个示例的编号;

步骤2.2,判断示例xia和示例xiu之间的高斯距离是否小于阈值t,若示例
xia和示例xiu之间的高斯距离小于阈值ts,则将矩阵W的第a行第u列的元素赋
值为1;否则赋值为0;a,u均为示例编号,均取值为[1,ni]之间的整数;直
至将矩阵W中的每一个元素都赋值完,得到多示例数据包Xi的相关性矩阵
Wis,其中,Wis的上标s表示阈值的编号,Wis的下标i表示多示例数据包的编
号。

采用上述进一步技术方案的有益效果是:用一个相关性矩阵将多示例数
据包内示例间的相关关系表示出来,使多示例数据包由多个示例表示转化为
由一个相关性矩阵表示,而由于不同类别标签的预测对应的相关性矩阵的阈
值有所不同,所以不同阈值下的相关性矩阵的建立能够更好地解决多标签分
类问题。

进一步,所采用的技术方案是:所述步骤2.2中的阈值t取值为[0,4],
所述阈值的个数为[10,15]。

采用上述进一步方案的有益效果是通过对阈值个数限定在一个范围内,
避免了由于阈值个数太多而增加方法的复杂度。

进一步,所采用的技术方案是:所述基本核矩阵模块按照以下公式求每
两个多示例数据包之间的基本核函数:

K g s ( X i , X j ) = Σ a = 1 n i Σ b = 1 n j W i a s W j b s k s ( x i a , x j b ) Σ a = 1 n i W i a s Σ b = 1 n j W j b s ; ]]>

其中,Xi,Xj分别表示编号为i和编号为j的多示例数据包,Kgs(Xi,Xj)为
多示例数据包Xi和多示例数据包Xj之间的基本核函数,g为基本核矩阵标
识,s为基本核矩阵的编号,与所述阈值的编号一一对应;

为多示例数据包Xi对应的阈值为ts的相关性矩阵中第a行所有元素之
和的倒数,其中,i为多示例数据包的编号,s为基本核矩阵的编号,与所述
阈值的编号一一对应,a为所述多示例数据包Xi对应的阈值为ts的相关性矩
阵中的行号;表示多示例数据包Xi对应的阈值为ts的相关
性矩阵Wis中第a行第u列的元素值,ni为多示例数据包Xi对应的阈值为ts的相
关性矩阵的总行数或总列数,与多示例数据包Xi中的示例个数相等;

为多示例数据包Xj对应的阈值为ts的相关性矩阵中第b行所有元素之
和的倒数,其中,j为多示例数据包的编号;表示多示例
数据包Xj对应的阈值为ts的相关性矩阵中第b行第v列的元素值;nj为多
示例数据包Xj对应的相关性矩阵的总行数或总列数,与多示例数据包Xj中
的示例个数相等;

ks(xia,xjb)为一般核函数,由径向基核函数求得,具体为:
ks(xia,xjb)=exp(-γ||xia-xjb||2);其中,s为阈值的编号;xia为多示例数据包Xi中
编号为a的示例,i为多示例数据包的编号,a为示例的编号;xjb为多示例数
据包Xj中编号为b的示例,j为多示例数据包的编号,b为示例的编号;
exp(-γ||xia-xjb||2)为以e为底数的指数函数,
e=2.71828,幂为-γ||xia-xjb||2,||xia-xjb||为xia-xjb的范数,γ为核系数,取任
意值,针对不同的基本核矩阵,核系数γ取不同值。

采用上述技术方案的有益效果是通过使用一般核函数及相关性矩阵来
表达两个多示例数据包之间的基本核函数,充分考虑了多示例数据包内示例
之间的相关性特征,同时将特征从低维空间映射到高维空间,实现分类。

进一步,所采用的技术方案是:所述组合模块采用凸组合对不同阈值下
的基本核矩阵Kgs中相同位置的元素进行组合,所述经过凸组合得到的多核
函数为:

K ( X i , X j ) = Σ s = 1 S d s K g s ( X i , X j ) , d s 0 , Σ s = 1 S d s = 1 ; ]]>

式中,K(Xi,Xj)为多示例数据包Xi和多示例数据包Xj之间的多核函数,
也是多核矩阵中第i行第j列的元素;ds为权系数;s为阈值的编号,取值为
正整数;S为基本核矩阵的总个数,Kgs(Xi,Xj)为多示例数据包Xi和多示例数
据包Xj之间的基本核函数,也是基本核矩阵Kgs中第i行第j列的元素。

采用上述进一步方案的有益效果是采用凸组合将多个基本核函数进行
组合,从而达到组合多个特征空间的目的,使得原数据集映射到多个不同的
特征空间,经过凸组合使得方法的灵活性和准确性更高,能够适用于标签分
类问题,同时也能够较好地解决样本集数据异构等复杂情况。

附图说明

图1为本发明一种基于多核融合的多示例多标签场景分类方法的流程示
意图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本
发明,并非用于限定本发明的范围。

如图1所示,本发明一种基于多核融合的多示例多标签场景分类方法,
包括以下步骤:

步骤1,输入一个多示例多标签数据集,记为
并将所述多示例多标签数据集拆分成一个多示例数据集X={Xi|i=1,2,...,m}和
一个多标签数据集Y={Yi|i=1,2,...,m};

其中,i为多示例多标签数据集中多示例数据包的编号,m为包的总个
数,m取正整数;Xi指多示例数据集X中编号为i的多示例数据包,记为
xi1表示多示例数据包Xi中编号为1的示例,xi2表示多示例
数据包Xi中编号为2的示例,表示多示例数据包Xi中编号为ni的示例,ni
指编号为i的包中包含的示例个数,ni取值为正整数;yi1表
示标签数据集Yi中编号为1的标签,yi2表示标签数据集Yi中编号为2的标签,
表示标签数据集Yi中编号为li的标签,li为标签数据集Yi中包含的标签个
数,li取值为正整数;

步骤2,使用多个阈值中的每一个阈值分别对每个多示例数据包Xi建立
相关性矩阵,则在同一阈值下,每一个多示例数据包都会建立一个相关性矩
阵Wis;所述阈值ts∈(t1,t2,...,tS),其中,S为阈值的总个数,s表示阈值的编号;

步骤2中使用一个阈值对一个包Xi建立相关性矩阵的过程具体为:

步骤2.1,定义一个ni×ni的矩阵W,所述矩阵中的行号和列号分别对应
多示例数据包Xi中两个示例的编号;

步骤2.2,判断示例xia和示例xiu之间的高斯距离是否小于阈值t,若示例
xia和示例xiu之间的高斯距离小于阈值ts,则将矩阵W的第a行第u列的元素
赋值为1;否则赋值为0;a,u均为示例编号,均取值为[1,ni]之间的整数;
直至将矩阵W中的每一个元素都赋值完,得到多示例数据包Xi的相关性矩阵
Wis,其中,Wis的上标s表示阈值的编号,Wis的下标i表示多示例数据包的编
号;阈值ts取值为[0,4],所述阈值的个数为[10,15]。

例如:设有3幅图像,即3个包,编号分别为1,2,3;每一个包中分
别包含2个,6个,7个示例,选取3个阈值为:t1,t2,t3;

首先,使用阈值t1分别对这3个包建立相关性矩阵,具体为:

对于第一个包,定义一个2×2的矩阵,判断包1中示例1和示例1之间
的高斯距离是否小于t1,若小于,则将该矩阵的第1行第1列的元素赋值为
1;否则赋值为0;然后依次判断示例1和示例2,示例2和示例1,示例2
和示例2之间的高斯距离是否小于阈值t1,若小于,则将该矩阵第1行第2
列,第2行第1列,第2行第2列的元素赋值为1;否则赋值为0;得到阈
值为t1时的相关性矩阵W11;

对于第二个包,定义一个6×6的矩阵,判断包2中每两个示例之间的高
斯距离是否小于t1,若小于,则将该矩阵对应位置的元素赋值为1,否则赋
值为0;得到阈值为t1时的相关性矩阵W12;

对于第三个包,同理得到阈值为t1的相关性矩阵W13;

同理,使用阈值t2分别对这3个包建立相关性矩阵,分别为

同理,使用阈值t3分别对这3个包建立相关性矩阵,分别为

步骤3,根据步骤2中得到的相关性矩阵求同一阈值下每两个多示例数
据包之间的基本核函数,所述多个基本核函数值组成基本核矩阵,所述基本
核矩阵中的元素值为同一阈值下每两个多示例数据包之间的基本核函数值,
所述基本核矩阵中元素值的行号和列号分别对应两个多示例数据包的编号;
针对不同的阈值,则会得到不同阈值下的基本核矩阵Kgs,g为基本核矩阵标
识,s为基本核矩阵的编号,与所述阈值的编号一一对应;

步骤3按照以下公式求同一个阈值下每两个多示例数据包之间的基本核
函数:

K g s ( X i , X j ) = Σ a = 1 n i Σ b = 1 n j W i a s W j b s k s ( x i a , x j b ) Σ a = 1 n i W i a s Σ b = 1 n j W j b s ]]>

其中,Xi,Xj分别表示编号为i和编号为j的多示例数据包,Kgs(Xi,Xj)为
多示例数据包Xi和多示例数据包Xj之间的基本核函数,g为基本核矩阵标
识,s为基本核矩阵的编号,与所述阈值的编号一一对应;

为多示例数据包Xi对应的阈值为ts的相关性矩阵中第a行所有元素之
和的倒数,其中,i为多示例数据包的编号,s为基本核矩阵的编号,与所述
阈值的编号一一对应,a为所述多示例数据包Xi对应的阈值为ts的相关性矩
阵中的行号;表示多示例数据包Xi对应的阈值为ts的相关
性矩阵Wis中第a行第u列的元素值,ni为多示例数据包Xi对应的阈值为ts的相
关性矩阵的总行数或总列数,与多示例数据包Xi中的示例个数相等;

为多示例数据包Xj对应的阈值为ts的相关性矩阵中第b行所有元素之
和的倒数,其中,j为多示例数据包的编号;表示多示例
数据包Xj对应的阈值为ts的相关性矩阵中第b行第v列的元素值;nj为多
示例数据包Xj对应的相关性矩阵的总行数或总列数,与多示例数据包Xj中
的示例个数相等;

ks(xia,xjb)为一般核函数,由径向基核函数求得,具体为:
ks(xia,xjb)=exp(-γ||xia-xjb||2);其中,s为阈值的编号;xia为多示例数据包Xi中
编号为a的示例,i为多示例数据包的编号,a为示例的编号;xjb为多示例数
据包Xj中编号为b的示例,j为多示例数据包的编号,b为示例的编号;
exp(-γ||xia-xjb||2)为以e为底数的指数函数,
e=2.71828,幂为-γ||xia-xjb||2,||xia-xjb||为xia-xjb的范数,γ为核系数,取任
意值,针对不同的基本核矩阵,核系数γ取不同值。

步骤4,将步骤3中得到的不同阈值下的基本核矩阵Kgs中相同位置的元
素进行组合,得到一个多核函数K(Xi,Xj),所述多个多核函数值组成多核矩
阵,即所述多核矩阵K中的元素值对应每两个多示例数据包之间的多核函数
值;

步骤4中采用凸组合对不同阈值下的基本核矩阵Kgs中相同位置的元素
进行组合,所述经过凸组合得到的多核函数为:

K ( X i , X j ) = Σ s = 1 S d s K g s ( X i , X j ) , d s 0 , Σ s = 1 S d s = 1 ]]>

式中,K(Xi,Xj)为多示例数据包Xi和多示例数据包Xj之间的多核函数,
也是多核矩阵中第i行第j列的元素;ds为权系数;s为阈值的编号,取值为
正整数;S为基本核矩阵的总个数,Kgs(Xi,Xj)为多示例数据包Xi和多示例数
据包Xj之间的基本核函数,也是基本核矩阵Kgs中第i行第j列的元素。

例如:分别将阈值t1,t2,t3下得到的基本核矩阵中相同位置的元素值进行
凸组合,得到多核矩阵中相同位置的元素值,同理,依次类推,则可以得到
多核矩阵。

步骤5,利用多标签数据集Yi对步骤4中得到的多核函数学习,即得到
多个分类器,所述分类器的数量与所述多标签数据集中的标签数量相同,所
述分类器用于对未知多示例数据包的标签集进行预测从而实现场景分类,具
体为采用SimpleMKL方法对多核函数学习。

本发明一种基于多核融合的多示例多标签场景分类系统,包括:

输入模块,用于输入一个多示例多标签数据
集,记为并将所述多示例多标签数据集拆分成一个多示例数据集
X={Xi|i=1,2,...,m}和一个多标签数据集Y={Yi|i=1,2,...,m};

其中,i为多示例多标签数据集中多示例数据包的编号,m为包的总个
数,m取正整数;Xi指多示例数据集X中编号为i的多示例数据包,记为
xi1表示多示例数据包Xi中编号为1的示例,xi2表示多示例
数据包Xi中编号为2的示例,表示多示例数据包Xi中编号为ni的示例,ni
指编号为i的包中包含的示例个数,ni取值为正整数;yi1表
示标签数据集Yi中编号为1的标签,yi2表示标签数据集Yi中编号为2的标签,
表示标签数据集Yi中编号为li的标签,li为标签数据集Yi中包含的标签个
数,li取值为正整数;

相关性矩阵建立模块,用于使用多个阈值中的每一个阈值分别对每个多
示例数据包Xi建立相关性矩阵,则在同一阈值下,每一个多示例数据包都会
建立一个相关性矩阵Wis;所述阈值ts∈(t1,t2,...,tS),其中,S为阈值的总个数,
s表示阈值的编号;相关性矩阵建立模块中使用一个阈值对一个包Xi建立相
关性矩阵的过程具体为:

步骤2.1,定义一个ni×ni的矩阵W,所述矩阵中的行号和列号分别对应
多示例数据包Xi中两个示例的编号;

步骤2.2,判断示例xia和示例xiu之间的高斯距离是否小于阈值t,若示例
xia和示例xiu之间的高斯距离小于阈值ts,则将矩阵W的第a行第u列的元素
赋值为1;否则赋值为0;a,u均为示例编号,均取值为[1,ni]之间的整数;
直至将矩阵W中的每一个元素都赋值完,得到多示例数据包Xi的相关性矩阵
Wis,其中,Wis的上标s表示阈值的编号,Wis的下标i表示多示例数据包的编
号;步骤2.2中的阈值t取值为[0,4],所述阈值的个数为[10,15]。

基本核矩阵模块,用于根据相关性矩阵建立模块中得到的相关性矩阵求
同一阈值下每两个多示例数据包之间的基本核函数,所述多个基本核函数值
组成基本核矩阵,所述基本核矩阵中的元素值为同一阈值下每两个多示例数
据包之间的基本核函数值,所述基本核矩阵中元素值的行号和列号分别对应
两个多示例数据包的编号;针对不同的阈值,则会得到不同阈值下的基本核
矩阵Kgs,g为基本核矩阵标识,s为基本核矩阵的编号,与所述阈值的编号
一一对应;基本核矩阵模块按照以下公式求每两个多示例数据包之间的基本
核函数:

K g s ( X i , X j ) = Σ a = 1 n i Σ b = 1 n j W i a s W j b s k s ( x i a , x j b ) Σ a = 1 n i W i a s Σ b = 1 n j W j b s ; ]]>

其中,Xi,Xj分别表示编号为i和编号为j的多示例数据包,Kgs(Xi,Xj)为
多示例数据包Xi和多示例数据包Xj之间的基本核函数,g为基本核矩阵标
识,s为基本核矩阵的编号,与所述阈值的编号一一对应;

为多示例数据包Xi对应的阈值为ts的相关性矩阵中第a行所有元素之
和的倒数,其中,i为多示例数据包的编号,s为基本核矩阵的编号,与所述
阈值的编号一一对应,a为所述多示例数据包Xi对应的阈值为ts的相关性矩
阵中的行号;表示多示例数据包Xi对应的阈值为ts的相关
性矩阵Wis中第a行第u列的元素值,ni为多示例数据包Xi对应的阈值为ts的相
关性矩阵的总行数或总列数,与多示例数据包Xi中的示例个数相等;

为多示例数据包Xj对应的阈值为ts的相关性矩阵中第b行所有元素之
和的倒数,其中,j为多示例数据包的编号;表示多示例
数据包Xj对应的阈值为ts的相关性矩阵中第b行第v列的元素值;nj为多
示例数据包Xj对应的相关性矩阵的总行数或总列数,与多示例数据包Xj中
的示例个数相等;

ks(xia,xjb)为一般核函数,由径向基核函数求得,具体为:
ks(xia,xjb)=exp(-γ||xia-xjb||2);其中,s为阈值的编号;xia为多示例数据包Xi中
编号为a的示例,i为多示例数据包的编号,a为示例的编号;xjb为多示例数
据包Xj中编号为b的示例,j为多示例数据包的编号,b为示例的编号;
exp(-γ||xia-xjb||2)为以e为底数的指数函数,
e=2.71828,幂为-γ||xia-xjb||2,||xia-xjb||为xia-xjb的范数,γ为核系数,取任
意值,针对不同的基本核矩阵,核系数γ取不同值。

组合模块,用于将基本核矩阵模块中得到的不同阈值下的基本核矩阵
Kgs中相同位置的元素进行组合,得到一个多核函数K(Xi,Xj),所述多个多
核函数值组成多核矩阵,即所述多核矩阵K中的元素值对应每两个多示例数
据包之间的多核函数值;组合模块采用凸组合对不同阈值下的基本核矩阵
Kgs中相同位置的元素进行组合,所述经过凸组合得到的多核函数为:

K ( X i , X j ) = Σ s = 1 S d s K g s ( X i , X j ) , d s 0 , Σ s = 1 S d s = 1 ; ]]>

式中,K(Xi,Xj)为多示例数据包Xi和多示例数据包Xj之间的多核函数,
也是多核矩阵中第i行第j列的元素;ds为权系数;s为阈值的编号,取值为
正整数;S为基本核矩阵的总个数,Kgs(Xi,Xj)为多示例数据包Xi和多示例数
据包Xj之间的基本核函数,也是基本核矩阵Kgs中第i行第j列的元素。

学习模块,用于利用多标签数据集Yi和组合模块中得到的多核函数进行
学习,得到多个多核SVM分类器,所述分类器的数量与所述多标签数据集
中的标签类数量相同,所述分类器用于对未知多示例数据包的标签集进行预
测从而实现场景分类。

下面通过实验对本发明的效果进行说明:

为验证本发明方法的性能,在MSRCv2和Scene图像数据集上进行了
实验。MSRCv2数据集包含591张图片,共属于23类,其中有很多图像同
时属于多类。通过分割,每张图片用包含多个对应不同区域的特征向量组成。
场景分类图像数据集由2000张自然场景图片组成,这些图片属于沙漠、山
脉等5类,其中有超过20%的图片同时属于多个类别。每幅图像利用SBN
算法分割成9个区域,每个区域由一个15维的特征向量表示,每幅图像的9
个区域作为示例组成了该幅图像对应的包。

在传统的监督学习中,每个对象只有一个标签,通常只用accuracy来评
价性能就可以了,但对于多标签学习问题,需要对一个对象预测多类标签,
仅用accuracy已经不具有说服力了,因此通常用5个指标来评价多标签学习
性能,分别是hammingloss、one-error、coverage、rankingloss、average
precision。其中前4个指标的值越小,性能越好,averageprecision的值越大,
性能越好。此外还有两个新的多标签评价指标,分别为averagerecall、average
F1。averagerecall计算了被预测出的合适标签的平均分数,averageF1描述
了平均精度与平均召回率之间的权衡,两种评价指标越大,表示该算法的性
能越好。本发明实验中综合采用这7种评价指标(hammingloss、one-error、
coverage、rankingloss、averageprecision、averagerecall、averageF1)来评
价方法的性能,通过对比7种指标来对本发明的效果进行验证说明。

MSRCv2图像数据集上的实验随机选取2/3的样本作为训练集,剩余
的样本用作测试。Scene图像数据集上的实验随机选取1500个样本作为训练
集,剩余500个作为测试集。实验重复30次,最后求得算法分类性能指标
的平均值及标准偏差。

对于MSRCv2,构图阈值threshold=[0.2,0.4,0.6,0.8,1,1.2,1.4,1.6,1.8,2],不同
尺度对应的不同RBF核函数的参数gam=[0.2,0.4,0.6,0.8,1,1.2,1.4,1.6,1.8,2];

对于Scene图像数据集,gam=[0.2,0.8,1.6,200,3.2,5.6,500,7,9,100],
threshold=[0.2,0.4,0.6,0.8,1,1.2,1.4,1.6,1.8,2]

实验中将本发明方法与现有的多种多示例多标签算法的分类性能指标
进行了比较,现有方法包括:MIMLBOOST、MIMLSVM、MIMLSVMmi、
MIMLNN、MIMLfast,以及KISAR。其中,MIMLSVMmi算法是在
MIMLBOOST算法的基础上利用MI-SVM方法代替MIBOOSTING方法做出
的改进,MIMLNN算法是在MIMLSVM算法的基础上利用两层神经网络代
替MLSVM方法做出的改进。另外,还与多标签算法ML-kNN进行了对比。
MIMLfast算法的步长γt=γ0/(1+ηγ0t),γ0=0.005,η=10-5,范数的上界设为1。
MIMLBOOST中boosting轮数设为50。MIMLSVM的参数k设为训练集的
20%。ML_kNN中最近邻数设为10。

表1和表2分别给出了在两个实验数据集上的实验对比结果,最优结果
用粗体表示。由表1看出,本发明方法在hammingloss、coverage、rankingloss、
averageprecision、averagerecall和averageF1上优于其他7种算法。MIMLNN
算法的性能和MK_MIML的性能相差不多。同时,通过比较整体性能的标
准偏差,我们看出MIMLNN的最小,MK_MIML次之,可见本发明方法的
稳定性高于现有的几种方法。因此,本发明的方法提高了图像场景分类的准
确性。

本文算法之所以能够取得最好的分类效果,一是示例间的相关性特征能
够更全面地表征包,使得分类准确性提高;二是多核融合的引入使得算法的
灵活性提高,更适用于多标签的预测。同时,算法还存在一定的不足:一方
面,算法利用构图来表示示例间的相关性,每个包对应一个图,提高了算法
的复杂度;另一方面,多核融合的引入意味着要构造多个基本核函数,同时
针对每类标签都要学得一个多核分类器,又提高了算法的复杂度。因此,如
何降低算法的复杂度还有待解决。

表1MSRCv2数据集上的实验结果


表2Scene图像数据集上的实验结果


以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明
的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发
明的保护范围之内。

关 键 词:
一种 基于 多核 融合 示例 标签 场景 分类 方法
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
太阳城集团本文
本文标题:一种基于多核融合的多示例多标签场景分类方法.pdf
链接地址:http://zh228.com/p-6401626.html
太阳城集团我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
葡京赌场|welcome document.write ('');