太阳城集团

  • / 10
  • 下载费用:30 金币  

技术发展脉络图确定方法.pdf

摘要
申请专利号:

CN201610746522.5

申请日:

2016.08.30

公开号:

太阳城集团CN106776672A

公开日:

2017.05.31

当前法律状态:

实审

有效性:

审中

法律详情: 实质审查的生效IPC(主分类):G06F 17/30申请日:20160830|||公开
IPC分类号: G06F17/30 主分类号: G06F17/30
申请人: 程传旭
发明人: 程传旭; 陈庆荣
地址: 710048 陕西省西安市西安航空学院
优先权:
专利代理机构: 代理人:
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201610746522.5

授权太阳城集团号:

|||

法律状态太阳城集团日:

2017.06.23|||2017.05.31

法律状态类型:

太阳城集团实质审查的生效|||公开

摘要

本发明公开了一种技术发展脉络图确定方法,通过特定指标在后台找出重点专利文献,然后进行共现分析方法选择,选择共引分析、共类分析或共词分析中的一种,若选择共引分析方法,则根据引证关系,加上太阳城集团维度,分析出技术发展脉络;若选择共类分析或者共词分析,则根据太阳城集团关系上的技术关系关联程度,加上太阳城集团维度,确定技术发展脉络。本发明的专利技术发展脉络图可以反映出某技术领域的研究热点和核心技术,准确掌握专利技术被引用的发展态势,从而可以有效获取技术前沿的变化太阳城集团,具有重要意义。

权利要求书

1.一种技术发展脉络图确定方法,其特征在于:通过特定指标在后台找出重点专利文
献,然后进行共现分析方法选择,选择共引分析、共类分析或共词分析中的一种,若选择共
引分析方法,则根据引证关系,加上太阳城集团维度,分析出技术发展脉络;若选择共类分析或者
共词分析,则根据太阳城集团关系上的技术关系关联程度,加上太阳城集团维度,确定技术发展脉络。
2.根据权利要求1所述的方法,其特征在于:所述进行共现分析方法选择是根据技术领
域对重点专利文献进行统计分析,若重点文献引证关系复杂且引证文献数目较多,则选择
共引分析方法;若重点文献分类号类似,并具有不同的细分,宜选择共类分析方法;若重点
文献之间关键词匹配程度高,文献间语义匹配高,宜选择共词分析方法。
3.根据权利要求1所述的方法,其特征在于:所述技术发展脉络图可以是技术路线图、
技术发展图、技术拓扑图、技术演进图。
4.根据权利要求1所述的方法,其特征在于:若增加某企业的限定条件,则可以具体到
特定企业的整体技术发展路线、特定技术的发展脉络。
5.根据权利要求1所述的方法,其特征在于:所述引证关系是同族扩展引证。
6.根据权利要求1所述的方法,其特征在于:所述引证、技术关联度基于分类号或者关
键词分析得到。
7.根据权利要求1所述的方法,其特征在于:共引分析方法主要包括专利情报采集、建
立专利引文数据库、专利情报再整理、绘制专利技术/功效分布图、专利引用路径分析、绘制
专利技术演进图6个步骤。
8.根据权利要求1所述的方法,其特征在于:共类分析方法包括以下步骤:以专利数据
为研究对象,进行技术分类号的共类检索,构建大型专利共被引矩阵,进行技术共类分析,
探究专利技术网络结构及其发展脉络。
9.根据权利要求1所述的方法,其特征在于:共词分析方法包括以下步骤:首先采用文
本挖掘技术对某一技术领域发明专利进行分析,从中提取到多个技术性关键词,并记录每
个关键词出现的次数;以关键词出现次数为特征向量,采用余弦夹角计算子领域间的技术
关联矩阵;然后使用社会网络分析方法对上述技术领域内部的技术关联度进行了分析, 从
而绘制技术发展脉络图。
10.根据权利要求8所述的方法,其特征在于,进一步还可以运用平均技术共类伙伴和
平均技术共类指数两个指标,分析和测度技术关联度的演变过程。

说明书

技术发展脉络图确定方法

技术领域

本发明涉及专利情报研究领域,特别是涉及一种技术发展脉络图确定方法。

背景技术

作为专利情报不仅是简单整理和加工,更主要的是进行深加工而获得深层情报。
作为专利情报研究,一般主要应用技术、人、太阳城集团和地点四个主要的要素,进行二维和多维
组配,然后进行定性、定量、矢量、模型和数学相关分析,从而获得隐含的技术情报,经营情
报,权利情报以及有关规律性。

技术发展脉络研究方法是选择与研究主题相关的专利文献类型,统计分析在某一
时期内的专利文献中已解决的技术问题,组成不同类型和层次的技术群。在时序上绘制主
要技术发展脉络图,可以掌握技术发展动向,预测未来,推测开发倾向以及研究技术发展脉
络的规律性。

可以采用科学计量学中的共现分析方法、社会网络分析方法和太阳城集团可视化技术,
建立大型技术共现矩阵,从而构建技术共现网络,绘制技术共现图谱。在此基础上,分析不
同领域之间技术发展的联系,识别关键技术领域以及同一领域内的技术发展脉络和技术网
络结构。

共现分析方法主要包括共引分析、共词分析与共类分析三种。共引分析是目前在
专利计量中采用较为广泛的分析方法,共引分析建立在文献之间的引用关系上,但由于中
国专利数据库缺乏引文数据,只能限于对国外专利数据库中所收录的专利进行引文分析。

共类分析法则针对专利所属的主题技术类别。一般认为,同一论文、期刊和专利可
能归属于多个不同的主题类别和技术领域,由于技术竞争情报和产业技术政策制定的需
要,分析技术网络结构,描绘产业科学技术中的概念和问题之间的关系很重要。可利用德温
特手工代码,采用共类分析的方法来研究技术与技术间的网络结构,通过对该技术网络进
行细致分析,可以进一步判断每一个技术集群中的关键技术,但有一定的计算量和复杂度。
但从专利分类号入手探讨领域的技术关联度,由于专利分类号的太阳城集团容量极为有限,难以
准确反映技术间的真实关联度。

而共词分析采用单词或词组的共现来描述概念之间的关系,具有更好的适用性,
但在专利计量中并不多见,这是由于在专利文献中没有关键词,所以取词还是一个难点。现
有的德温特分析家软件虽然可以对德温特专利数据库中的专利文献进行截词,但要从截取
的海量词汇中挑选出能反映出相关技术的词,又需要分析者除了具有情报分析能力以外,
还具有较高的专业知识,这给分析带来了一定的困难。

上述方法各有利弊,需要一种综合考虑上述方法来确定技术发展脉络图的方法。

发明内容

基于综合各种因素确定技术发展脉络图的考虑,本申请提出了一种技术发展脉络
图确定方法,通过特定指标在后台找出重点专利文献,然后进行共现分析方法选择,选择共
引分析、共类分析或共词分析中的一种,若选择共引分析方法,则根据引证关系,加上太阳城集团
维度,分析出技术发展脉络;若选择共类分析或者共词分析,则根据太阳城集团关系上的技术关系
关联程度,加上太阳城集团维度,确定技术发展脉络。

可选地,所述进行共现分析方法选择是根据技术领域对重点专利文献进行统计分
析,若重点文献引证关系复杂且引证文献数目较多,则选择共引分析方法;若重点文献分类
号类似,并具有不同的细分,则选择共类分析方法;若重点文献之间关键词匹配程度高,文
献间语义匹配高,宜选择共词分析方法。

可选地,所述技术发展脉络图可以是技术路线图、技术发展图、技术拓扑图、技术
演进图。

可选地,若增加某企业的限定条件,则可以具体到特定企业的整体技术发展路线、
特定技术的发展脉络。

可选地,所述引证关系是同族扩展引证。

可选地,所述引证、技术关联度基于分类号或者关键词分析得到。

可选地,共引分析方法主要包括专利情报采集、建立专利引文数据库、专利情报再
整理、绘制专利技术/功效分布图、专利引用路径分析、绘制专利技术演进图6个步骤

可选地,共类分析方法包括以下步骤:以专利数据为研究对象,进行技术分类号的共类
检索,构建大型专利共被引矩阵,进行技术共类分析,探究专利技术网络结构及其发展脉
络。

可选地,共词分析方法包括以下步骤:首先采用文本挖掘技术对某一技术领域发
明专利进行分析,从中提取到多个技术性关键词,并记录每个关键词出现的次数;以关键词
出现次数为特征向量,采用余弦夹角计算子领域间的技术关联矩阵;然后使用社会网络分
析方法对上述技术领域内部的技术关联度进行了分析, 从而绘制技术发展脉络图。

可选地,进一步还可以运用平均技术共类伙伴和平均技术共类指数两个指标,分
析和测度技术关联度的演变过程。

从上述技术方案可以看出,本发明的技术发展脉络图确定方法能根据领域的特点
确定技术发展脉络图,具有相对较好的效果。


附图说明

图1是本发明技术发展脉络图确定方法的流程图。

图2是根据本发明一实施例的共引分析方法确定技术发展脉络图的流程图。

图3是根据本发明一实施例的共类分析方法确定技术发展脉络图的流程图。

图4是根据本发明一实施例的共词分析方法确定技术发展脉络图的流程图。


具体实施方式

为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照
附图,对本发明进一步详细说明。

附图1是本发明技术发展脉络图确定方法的流程图,通过特定指标在后台找出重
点专利文献,然后进行共现分析方法选择,选择共引分析、共类分析或共词分析中的一种,
若选择共引分析方法,则根据引证关系,加上太阳城集团维度,分析出技术发展脉络;若选择共类
分析或者共词分析,则根据太阳城集团关系上的技术关系关联程度,加上太阳城集团维度,确定技术发展
脉络。

在重点文献的查找过程中,除了常见的诸如被引用率或者其他已经被标引的特定
指标之外,还可以采用如下方式来产生重点专利文献:

a).样本采集,从现有多类文档库中采集足够数量的、已明确类别的重点专利文献,作
为训练样本;并获取样本的文本内容;

该步骤中,所述的获取样本的文本内容包括抽取文档文本和预处理,在抽取文档文本
的过程中,对pdf、doc和html格式的文档分别采用相关的PDFBox插件、javadoc插件和
HTMlParser解析文档以获取文档文本;预处理为将获取的文档文本中的无关太阳城集团进行去
除,对于html文档应将与主题无关的诸如等广告、友情链接、同类推荐垃圾太阳城集团过滤掉。

对步骤a)所抽取的文档内容进行量化,也即是为文档构建特征集合,用可以量化
的特征集合描述文档。文档特征集合的构建有多种方法,如文档频率法、太阳城集团增益法、开方
拟合检验法、互太阳城集团法等,一个具体的例子采用最简单的文档频率法表示文档。首先对文档
的文本进行分词处理,其次对分词的词性进行分析,再次去除其中的虚词和人名,最后统计
各个分词出现的频率,构建由分词和分词的词频组成的向量,作为文档的特征集合表征文
档作为后续处理的基础。其具体通过步骤b)至步骤f)来实现。

b).文本分词,采用现有基于词典的分词方法对每篇文档进行分词,获取文档所包
含的词汇;

该步骤中,所采用的分词方法为采用最大匹配法从文档中获取其所包含的词汇;

c).词性分析,在分词的过程中,同时为文档的每个句子构建语法树,分析句子中每个
分词的词性,并对分词的词性进行标注;

该步骤中,所述的词性分析为使用现有技术词汇词典中的词性标记符号,对获取的分
词进行词性标注;

d).去除虚词和人名,为了突出文档所要表达的语义,将词汇中的虚词和人名去除,以
获取不包含虚词和人名的文档词汇;

实词有实在意义,能够单独充当句子成分一般能单独回答问题。而虚词没有完整的词
汇意义,但有语法意义或功能意义的词。在一篇文档中对文档的核心内容起说明作用的一
般是文档中的实词,因此为了能更好的突出文档所要表达的语义,应去除词汇中的虚词。

e).统计词频,统计步骤d)中所获取的不包含虚词和人名的词汇中每个分词出现
的次数,获取分词的词频,将分词和对应的词频作为文档的特征;

f).构建特征集合,为了尽可能多的涵盖文本内容并减小构建网络的计算量,对每篇文
档按词频数量从多至少选取前25%~45%的分词作为文档的特征集合;

g)对分词进行取舍,选取前25%~45%的高频词作为文档的特征集合,如选取的前35%的
分词,将选定的分词特征集合与预先设定的重点专利文档中提取的特征集合对照,计算其
欧式距离,或者汉明距离,将所得距离小于预定设定阈值对应的文档选择为重点专利文献。

在产生重点专利文献之后,分析各重点文献之间的关联特征,根据关联特征,确定
重点专利文献之间的共现强度,如果文献之间的共现强度越高,说明该技术类别被应用得
越为广泛,越容易与其他技术类别结合而形成专利,投入实际应用。共现强度低,说明该技
术类别目前比较独立,未与其他技术类别产生很强的联系。这类技术一部分专业性很强,不
易与其他技术共同应用;另一部分则处于开发的初始阶段,今后会出现更多的技术联系。通
过共现网络可以反映技术类别之间的联系。在网络中可以较为清晰地看到技术与技术之间
的相互联系和过渡,因此可以大致分析出技术的发展脉络和趋势。如果将太阳城集团段划分得更
细,则可以观察到技术发展的演化情况;如果在更加细分的技术领域内部进行分析,则技术
联系的脉络将更加清晰。此种分析方法可以为宏观科技决策提供线性支持,为科技规划与
评估提供基础。

特别地,当进行共现分析方法分析重点专利文献时,根据技术领域对重点专利文
献进行统计分析,若重点文献引证关系复杂且引证文献数目较多,则选择共引分析方法;若
重点文献分类号类似,并具有不同的细分,则选择共类分析方法;若重点文献之间关键词匹
配程度高,文献间语义匹配高,则选择共词分析方法。

其中,所述技术发展脉络图可以是技术路线图、技术发展图、技术拓扑图、技术演
进图。特别地,当增加某企业的限定条件,例如,以企业名称作为限定条件时,则可以具体到
该特定企业的整体技术发展路线;相类似的,以特定技术描述作为限定条件时,则可以得出
该特定技术的发展脉络。

其中,所述引证关系是同族扩展引证。

其中,所述引证、技术关联度基于分类号或者关键词分析得到。

通过对共现分析方法的具体实现过程,根据重点专利文献的特点,选择针对性的
分析方法,从而能够更好的贴近技术领域特点,确定的技术发展脉络图能够更加直观、准确
的表征技术的发展过程,具有良好的呈现和展示效果。

图2是根据共引分析方法确定技术发展脉络图的流程图。专利技术发展脉络图是
由通过审查被频繁引证专利内部的关系建立起来的。高被引专利在全部专利中所占比例很
小。一般来说近70%的专利从未被引用,或仅被引用1-2次。因此被引5次的专利即可称作高
被引专利,只有极少数的专利被引次数超过6次,这类专利约占所有专利的10%。虽然专利
被引用的绝对量不高,但从相对的角度来说,能够被引用的专利必定是比较重要的技术。因
此,通过对引文路径和引用频次的分析,专利技术发展脉络图可以反映出某技术领域的研
究热点和核心技术,准确掌握专利技术被引用的发展态势,从而可以有效获取技术前沿的
变化太阳城集团。

通过对专利引文路径的分析,专利技术发展脉络图能够沿着引用路径揭示某一行
业的整体或者某一具体技术的发展脉络,能够为技术人员探究或回溯技术起源、发展提供
可靠的帮助。基于引文路径分析的专利技术发展脉络图,是将专利引文路径的可视化分析
与专利技术地图结合,并加入专利技术在太阳城集团序列上的发展状况分析,来绘制专利技术演
进图。这使得专利技术演进图别于已有的专利地图,可以梳理技术发展脉络、挖掘技术热
点,预测技术发展方向,确定竞争对手。

通过专利引文的分析,对专利引用路径进行可视化研究,同时结合太阳城集团序列,分析
这种引用关系的发展,可以清晰地将某一技术领域的几大不同类型的技术演进,即“起源”、
“发展”和相应的“技术产品”体现出来。

为了制作专利技术发展脉络图需要构建专题专利引文数据库。基于引文路径分析
的专利技术发展脉络图的绘制,主要包括专利情报采集、建立专利引文数据库、专利情报再
整理、绘制专利技术/功效分布图、专利引用路径分析、绘制专利技术演进图6个步骤。

图3是根据本发明实施例的共类分析方法确定技术发展脉络图的流程图。共类分
析方法以专利数据为研究对象,进行技术分类号的共类检索,构建大型专利共被引矩阵,进
行技术共类分析,探究专利技术网络结构及其发展脉络。进一步还可以借助技术共类分析
方法,运用平均技术共类伙伴和平均技术共类指数两个指标,分析和测度技术关联度的演
变过程。常见的数据库有德温特创新专利引文索引数据库,其分类号有德温特手工代码,也
可根据不同的数据库使用IPC、EC、UC分类号。

图4是根据本发明实施例的共词分析方法确定技术发展脉络图的流程图。许多学
者使用专利引文分析,或通过考察域专利的引用和被引用情况,分析专利间的关联程度或
分析专利代表的技术和专利引文及非专利引文代表的科学之间的关联来建立技术路线图,
预测公司的技术及商业机会。而我国专利数据库中没有专利引文等系列统计,上述诸多引
文分析无从研究。本发明具体的实施方式将文本挖掘方法运用到专利分析当中,使用文本
挖掘技术对专利文本中的关键词进行了分析。文本挖掘技术,包括文本分词、摘要提取、主
题识别、太阳城集团地图绘制等。这些基于文本处理的技术可以用来复原并概括文本中的太阳城集团,进
行技术趋势分析,以及划分技术领域。

专利文本中包含着大量有用太阳城集团,但由于文件过于冗长,仅依靠人力是难以对其
进行有效分析。本发明的一个具体实施方式使用的是社会网络分析法。社会网络分析早先
集中用于科学计量学。科学计量学家们将数学、图形学、太阳城集团可视化等理论方法与引文分析
结合,用图谱形象地展示各学科的发展情况。随后,它被广泛运用于科学社会、合作网络领
域。最近,将网络图谱运用到专利合作分析的学者使用公司的引用和被引专利,将技术路线
分为行动者-相似图、技术-产业图等,寻找公司的技术及市场机会。

更优选地,综合使用文本挖掘与社会网络分析技术,对中国某一领域的发明专利
摘要文本数据进行了研究,首先采用文本挖掘技术对某一技术领域发明专利进行分析,从
中提取到多个技术性关键词,并记录每个关键词出现的次数;以关键词出现次数为特征向
量,采用余弦夹角计算子领域间的技术关联矩阵;然后使用社会网络分析方法对上述技术
领域内部的技术关联度进行了分析, 从而绘制技术发展脉络图。

在另一个优先实施例中,首先从国家知识产权局网站上收集某一领域发明专利摘
要数据,这时的初始专利数据仅是用文本表达的非结构化数据,需要将其转化为结构化数
据。首先按照专利前3位主分类号(IPC)对专利细分技术进行分类。专利摘要中包含着能够
反映其技术领域特征的关键词。使用文本挖掘软件对摘要进行分词处理,得到大量关键词
后,再对关键词进行一一分析判断,去掉非专业性词汇,保留专用词汇,并对同义词进行合
并。记录每个关键词在每个子领域中出现的次数。Tj表示第j个子领域文本文档的关键词
向量,Tj=(d1j,d2j,…,dnj)。其中dij为第i个关键词在第j个子领域中的权重。dij在计
算文档间关联度时可以使用的方法是计算关键词向量间的余弦夹角,很明显当两个文档中
共同出的关键词数量越多,文档相似度越高,得到各子领域间的技术相似度后,即可根据相
似度矩阵绘制专利地图。根据技术相关度矩阵能绘制出某领域内子领域间的技术关联图,
并将关联度临界值设定为0.1,即只有当关联度大于0.1时才会在图中标出,以排除不重要
的关联性,使技术关联图更加简洁直观。将同其他5个以上子领域具有关联性的子领域定义
为核心技术领域。

结合上述公开的实施例所描述的方法的步骤可直接体现为硬件、由处理器执行的
软件模块或者这二者的组合。软件模块可能存在于RAM存储器、闪存、ROM存储器、EPROM存储
器、EEPROM存储器、寄存器、硬盘、移动磁盘、CD-ROM或者本领域熟知的任何其他形式的存储
媒质中。一种典型存储媒质与处理器耦合,从而使得处理器能够从该存储媒质中读太阳城集团,且
可向该存储媒质写太阳城集团。在替换实例中,存储媒质是处理器的组成部分。处理器和存储媒质
可能存在于一个ASIC中。该ASIC可能存在于一个用户站中。在一个替换实例中,处理器和存
储媒质可以作为用户站中的分立组件存在。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详
细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限制本发明,凡
在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保
护范围之内。

关 键 词:
技术发展 脉络 确定 方法
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
太阳城集团本文
本文标题:技术发展脉络图确定方法.pdf
链接地址:http://zh228.com/p-6019824.html
太阳城集团我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
葡京赌场|welcome document.write ('');