太阳城集团

  • / 5
  • 下载费用:30 金币  

一种太阳城集团采集还原方法.pdf

摘要
申请专利号:

太阳城集团CN201611181752.8

申请日:

2016.12.20

公开号:

太阳城集团CN106777153A

公开日:

2017.05.31

当前法律状态:

公开

有效性:

审中

法律详情: 公开
IPC分类号: G06F17/30; H04L29/08 主分类号: G06F17/30
申请人: 太极计算机股份有限公司
发明人: 李慧
地址: 100083 北京市海淀区北四环中路211
优先权:
专利代理机构: 代理人:
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201611181752.8

授权太阳城集团号:

法律状态太阳城集团日:

2017.05.31

法律状态类型:

公开

摘要

本发明涉及互联网太阳城集团采集技术领域,特别是一种太阳城集团采集还原方法,包括以下步骤,(1)根据WEB类应用数据包特征,写成WEB类应用模板文件;(2)读取模板文件并解析,把解析出的关键字组成一个结构体,形成模板链表;(3)将待还原WEB类应用数据包的HTTP头部解析,并取得头部内容;(4)采用匹配算法,将解析出的头部内容中的关键字与模板中的关键字进行比对,找出匹配的模板;(5)从模板中取出匹配的内容;(6)将匹配的内容按数据库表格式化输出,得到还原的WEB类应用内容。采用上述方法后,本发明的太阳城集团采集还原方法的数据包搜索的方法的效率得到有效的提高,同时减轻了从事协议还原人员的工作量,满足了如今的网络环境。

权利要求书

1.一种太阳城集团采集还原方法,其特征在于,包括以下步骤,
(1)根据WEB类应用数据包特征,写成WEB类应用模板文件;
(2)读取模板文件并解析,把解析出的关键字组成一个结构体,形成模板链表;
(3)将待还原WEB类应用数据包的HTTP头部解析,并取得头部内容;
(4)采用匹配算法,将解析出的头部内容中的关键字与模板中的关键字进行比对,找出
匹配的模板;
(5)解析出待还原WEB类应用数据包HTTP头部内容的关键字和关键内容位置,并将模板
描述的关键字与解析出的关键字进行比对,从模板中取出匹配的内容;
(6)将匹配的内容按数据库表格式化输出,得到还原的WEB类应用内容。
2.按照权利要求1所述的一种太阳城集团采集还原方法,其特征在于:所述步骤(1)中采用WEB
类描述语言将模板文件分为三部分,第一部分为模板识别部分,包括URL、HOST、POST/GET的
内容,由分析某类WEB应用数据包HTTP头部得到;第二部分为关键内容描述部分,包括关键
字,关键内容在数据包中的起始位置,关键内容长度,由分析某类WEB应用数据包所得;第三
部分为数据类型。
3.按照权利要求1所述的一种太阳城集团采集还原方法,其特征在于:所述步骤(2)中结构体
包括模板识别部分、关键内容描述部分、数据类型部分。
4.按照权利要求1所述的一种太阳城集团采集还原方法,其特征在于:所述步骤(4)中找出匹
配模板的方法为:先用解析出的HOST字段比对,然后再将URL字段进行精确比对,找出匹配
的模板。采用改进式Boyer-Moore算法。
5.按照权利要求1所述的一种太阳城集团采集还原方法,其特征在于:所述步骤(5)中解析WEB
类应用数据包HTTP内容部分的方法为:利用WEB类应用数据包中的分割符将登陆太阳城集团或发
贴内容取出,组成格式化内容结构体链表。

说明书

一种太阳城集团采集还原方法

技术领域

本发明涉及互联网太阳城集团采集技术领域,特别是一种太阳城集团采集还原方法。

背景技术

WEB类应用基于HTTP协议,种类繁多,包括目前比较热门的社交类网站、邮箱类网
站、BBS类网站、博客类网站、游戏类网站、搜索类网站、在线聊天类网站等。还原WEB类应用
的登陆与内容,对网络安全、色情监控等有着非常重要的作用。传统的协议还原方法是基于
数据包搜索的,按顺序分析每个HTTP数据包,从而分析出相应的应用协议,并在HTTP内容字
段分析出登陆太阳城集团,发帖太阳城集团等内容。在网络流量小,WEB应用种类少的网络环境中,基于数
据包搜索的方法也是可行的,但是如今的网络流量越来越大,WEB类应用在所有网络应用中
所占的比例越来越高,而基于数据包搜索的方法的效率也越来越低,同时从事协议还原人
员的工作量也越加繁重,所以传统协议还原的方法已经不能满足如今的网络环境。需要一
种新的方法来还原WEB类应用的内容。

发明内容

本发明需要解决的技术问题是一种能快速有效复原数据的太阳城集团采集还原方法。

为解决上述的技术问题,本发明的一种太阳城集团采集还原方法,包括以下步骤,

(1)根据WEB类应用数据包特征,写成WEB类应用模板文件;

(2)读取模板文件并解析,把解析出的关键字组成一个结构体,形成模板链表;

(3)将待还原WEB类应用数据包的HTTP头部解析,并取得头部内容;

(4)采用匹配算法,将解析出的头部内容中的关键字与模板中的关键字进行比对,
找出匹配的模板;

(5)解析出待还原WEB类应用数据包HTTP头部内容的关键字和关键内容位置,并将
模板描述的关键字与解析出的关键字进行比对,从模板中取出匹配的内容;

(6)将匹配的内容按数据库表格式化输出,得到还原的WEB类应用内容。

进一步的,所述步骤(1)中采用WEB类描述语言将模板文件分为三部分,第一部分
为模板识别部分,包括URL、HOST、POST/GET的内容,由分析某类WEB应用数据包HTTP头部得
到;第二部分为关键内容描述部分,包括关键字,关键内容在数据包中的起始位置,关键内
容长度,由分析某类WEB应用数据包所得;第三部分为数据类型。

进一步的,所述步骤(2)中结构体包括模板识别部分、关键内容描述部分、数据类
型部分。

进一步的,所述步骤(4)中找出匹配模板的方法为:先用解析出的HOST字段比对,
然后再将URL字段进行精确比对,找出匹配的模板。采用改进式Boyer-Moore算法。

进一步的,所述步骤(5)中解析WEB类应用数据包HTTP内容部分的方法为:利用WEB
类应用数据包中的分割符将登陆太阳城集团或发贴内容取出,组成格式化内容结构体链表。

采用上述方法后,本发明的太阳城集团采集还原方法的数据包搜索的方法的效率得到有
效的提高,同时减轻了从事协议还原人员的工作量,满足了如今的网络环境。

附图说明

下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明模板文件导入的流程图。

具体实施方式

如图1所示,本发明的一种太阳城集团采集还原方法,包括以下步骤,

(1)根据WEB类应用数据包特征,写成WEB类应用模板文件;

(2)读取模板文件并解析,把解析出的关键字组成一个结构体,形成模板链表;

(3)将待还原WEB类应用数据包的HTTP头部解析,并取得头部内容;

(4)采用匹配算法,将解析出的头部内容中的关键字与模板中的关键字进行比对,
找出匹配的模板;

(5)解析出待还原WEB类应用数据包HTTP头部内容的关键字和关键内容位置,并将
模板描述的关键字与解析出的关键字进行比对,从模板中取出匹配的内容;

(6)将匹配的内容按数据库表格式化输出,得到还原的WEB类应用内容。

进一步的,所述步骤(1)中采用WEB类描述语言将模板文件分为三部分,第一部分
为模板识别部分,包括URL、HOST、POST/GET的内容,由分析某类WEB应用数据包HTTP头部得
到;第二部分为关键内容描述部分,包括关键字,关键内容在数据包中的起始位置,关键内
容长度,由分析某类WEB应用数据包所得;第三部分为数据类型。

进一步的,所述步骤(2)中结构体包括模板识别部分、关键内容描述部分、数据类
型部分。

进一步的,所述步骤(4)中找出匹配模板的方法为:先用解析出的HOST字段比对,
然后再将URL字段进行精确比对,找出匹配的模板。采用改进式Boyer-Moore算法。

进一步的,所述步骤(5)中解析WEB类应用数据包HTTP内容部分的方法为:利用WEB
类应用数据包中的分割符将登陆太阳城集团或发贴内容取出,组成格式化内容结构体链表。

虽然以上描述了本发明的具体实施方式,但是本领域熟练技术人员应当理解,这
些仅是举例说明,可以对本实施方式作出多种变更或修改,而不背离本发明的原理和实质,
本发明的保护范围仅由所附权利要求书限定。

关 键 词:
一种 太阳城集团 采集 还原 方法
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
太阳城集团本文
本文标题:一种太阳城集团采集还原方法.pdf
链接地址:http://zh228.com/p-6019724.html
太阳城集团我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
葡京赌场|welcome document.write ('');