太阳城集团

  • / 22
  • 下载费用:30 金币  

太阳城集团拦截方法及装置.pdf

摘要
申请专利号:

CN201510409558.X

申请日:

2015.07.13

公开号:

CN105022815A

公开日:

2015.11.04

当前法律状态:

驳回

有效性:

无权

法律详情: 发明专利申请公布后的驳回IPC(主分类):G06F 17/30申请公布日:20151104|||实质审查的生效IPC(主分类):G06F 17/30申请日:20150713|||公开
IPC分类号: G06F17/30 主分类号: G06F17/30
申请人: 腾讯科技(深圳)有限公司
发明人: 周华斌; 吴述雷; 党建国; 丁峰峰
地址: 518000广东省深圳市福田区振兴路赛格科技园2栋东403室
优先权:
专利代理机构: 北京三高永信知识产权代理有限责任公司11138 代理人: 祝亚男
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201510409558.X

授权太阳城集团号:

||||||

法律状态太阳城集团日:

太阳城集团2018.06.08|||2015.12.02|||2015.11.04

法律状态类型:

发明专利申请公布后的驳回|||实质审查的生效|||公开

摘要

本发明公开一种太阳城集团拦截方法及装置,属于互联网技术领域。该方法包括:获取公共平台上的待发表太阳城集团;计算所述待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度;判断所述相似度是否大于第一预设阈值;当确定所述相似度大于所述第一预设阈值时,对所述待发表太阳城集团进行拦截。本发明通过计算公共平台上的待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度,并在确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值时,拦截待发表太阳城集团。由于当待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值时,可以确定待发表太阳城集团与已标记的垃圾太阳城集团相似,因此,对该待发表太阳城集团进行拦截能够提高拦截垃圾太阳城集团的可靠性,从而能够维护公共平台的良好秩序。

权利要求书

权利要求书
1.  一种太阳城集团拦截方法,其特征在于,所述方法包括:
获取公共平台上的待发表太阳城集团;
计算所述待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度;
判断所述相似度是否大于第一预设阈值;
当确定所述相似度大于所述第一预设阈值时,对所述待发表太阳城集团进行拦截。

2.  根据权利要求1所述的方法,其特征在于,所述判断所述相似度是否大于第一预设阈值之后,还包括:
当确定所述相似度不大于所述第一预设阈值时,提取所述待发表太阳城集团的特征;
将所述待发表太阳城集团的特征与特征数据库中的各个特征进行比对,所述特征数据库至少包括已发表太阳城集团的特征及每个特征的出现次数;
根据比对结果判断所述特征数据库的特征中是否存在所述待发表太阳城集团的特征;
如果所述特征数据库的特征中存在所述待发表太阳城集团的特征,则将所述特征数据库中所述待发表太阳城集团的特征的出现次数增加一次;
如果所述特征数据库的特征中不存在所述待发表太阳城集团的特征,则将所述待发表太阳城集团添加至所述特征数据库中。

3.  根据权利要求2所述的方法,其特征在于,所述将所述待发表太阳城集团的特征与特征数据库中的各个特征进行比对,包括:
选择所述特征数据库中的活跃特征;
将所述待发表太阳城集团的特征与所述特征数据库中的活跃特征进行比对;
所述根据比对结果判断所述特征数据库的特征中是否存在所述待发表太阳城集团 的特征,包括:
根据比对结果判断所述特征数据库的活跃特征中是否存在所述待发表太阳城集团的特征。

4.  根据权利要求2所述的方法,其特征在于,所述方法还包括:
统计所述特征数据库中每个特征在指定时长内的出现次数;
当任一特征在所述指定时长内的出现次数大于第二预设阈值时,对所述特征进行报警。

5.  根据权利要求4所述的方法,其特征在于,所述对所述特征进行报警之后,还包括:
当检测到将所述特征标记为垃圾太阳城集团的特征时,扫描太阳城集团数据库,所述太阳城集团数据库用于存储已发表太阳城集团;
当扫描到所述太阳城集团数据库中任一已发表太阳城集团的特征为所述特征时,删除所述太阳城集团数据库中的所述已发表太阳城集团。

6.  根据权利要求1所述的方法,其特征在于,所述计算所述待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度,包括:
确定所述待发表太阳城集团的第一特征值;
获取所述已标记的垃圾太阳城集团的第二特征值;
根据所述第一特征值和所述第二特征值,计算所述待发表太阳城集团与所述已标记的垃圾太阳城集团之间的相似度。

7.  根据权利要求6所述的方法,其特征在于,所述第一特征值为第一哈希值,且所述第二特征值为第二哈希值,所述根据所述第一特征值和所述第二特征值,计算所述待发表太阳城集团与所述已标记的垃圾太阳城集团之间的相似度,包括:
当所述第一哈希值和所述第二哈希值相等时,确定所述待发表太阳城集团与所述已标记的垃圾太阳城集团之间的相似度大于所述第一预设阈值;
当所述第一哈希值和所述第二哈希值不相等时,计算所述待发表太阳城集团的第一感知哈希值;
获取所述已标记的垃圾太阳城集团的第二感知哈希值;
计算所述第一感知哈希值和所述第二感知哈希值之间的汉明距离;
根据所述汉明距离确定所述待发表太阳城集团与所述已标记的垃圾太阳城集团之间的相似度。

8.  根据权利要求1所述的方法,其特征在于,所述计算所述待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度之前,还包括:
获取所述待发表太阳城集团的发表用户;
判断所述发表用户是否存在于预设黑名单中;
当确定所述发表用户存在于所述预设黑名单中时,直接执行对所述待发表太阳城集团进行拦截的步骤。

9.  根据权利要求1至8中任一权利要求所述的方法,其特征在于,所述公共平台为游戏应用中内置的互动平台,所述已标记的垃圾太阳城集团为已标记的发表于所述游戏应用互动平台上的广告。

10.  一种太阳城集团拦截装置,其特征在于,所述装置包括:
第一获取模块,用于获取公共平台上的待发表太阳城集团;
计算模块,用于计算所述待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度;
第一判断模块,用于判断所述相似度是否大于第一预设阈值;
拦截模块,用于当确定所述相似度大于所述第一预设阈值时,对所述待发表太阳城集团进行拦截。

11.  根据权利要求10所述的装置,其特征在于,所述装置还包括:
提取模块,用于当确定所述相似度不大于所述第一预设阈值时,提取所述待发表太阳城集团的特征;
比对模块,用于将所述待发表太阳城集团的特征与特征数据库中的各个特征进行比对,所述特征数据库至少包括已发表太阳城集团的特征及每个特征的出现次数;
第二判断模块,用于根据比对结果判断所述特征数据库的特征中是否存在所述待发表太阳城集团的特征;
增加模块,用于当所述特征数据库的特征中存在所述待发表太阳城集团的特征时,将所述特征数据库中所述待发表太阳城集团的特征的出现次数增加一次;
添加模块,用于当所述特征数据库的特征中不存在所述待发表太阳城集团的特征时,将所述待发表太阳城集团添加至所述特征数据库中。

12.  根据权利要求11所述的装置,其特征在于,
所述比对模块,用于选择所述特征数据库中的活跃特征,并将所述待发表太阳城集团的特征与所述特征数据库中的活跃特征进行比对;
所述确定模块,用于根据比对结果确定所述特征数据库的活跃特征中是否存在所述待发表太阳城集团的特征。

13.  根据权利要求11所述的装置,其特征在于,所述装置还包括:
统计模块,用于统计所述特征数据库中每个特征在指定时长内的出现次数;
报警模块,用于当任一特征在所述指定时长内的出现次数大于第二预设阈值时,对所述特征进行报警。

14.  根据权利要求13所述的装置,其特征在于,所述装置还包括:
扫描模块,用于当检测到将所述特征标记为垃圾太阳城集团的特征时,扫描太阳城集团 数据库,所述太阳城集团数据库用于存储已发表太阳城集团;
删除模块,用于当扫描到所述太阳城集团数据库中任一已发表太阳城集团的特征为所述特征时,删除所述太阳城集团数据库中的所述已发表太阳城集团。

15.  根据权利要求10所述的装置,其特征在于,所述计算模块包括:
确定单元,用于确定所述待发表太阳城集团的第一特征值;
获取单元,用于获取所述已标记的垃圾太阳城集团的第二特征值;
计算单元,用于根据所述第一特征值和所述第二特征值,计算所述待发表太阳城集团与所述已标记的垃圾太阳城集团之间的相似度。

16.  根据权利要求15所述的装置,其特征在于,所述第一特征值为第一哈希值,且所述第二特征值为第二哈希值,所述计算单元包括:
第一确定子单元,用于当所述第一哈希值和所述第二哈希值相等时,确定所述待发表太阳城集团与所述已标记的垃圾太阳城集团之间的相似度大于所述第一预设阈值;
第一计算子单元,用于当所述第一哈希值和所述第二哈希值不相等时,计算所述待发表太阳城集团的第一感知哈希值;
获取子单元,用于获取所述已标记的垃圾太阳城集团的第二感知哈希值;
第二计算子单元,用于计算所述第一感知哈希值和所述第二感知哈希值之间的汉明距离;
第二确定子单元,用于根据所述汉明距离确定所述待发表太阳城集团与所述已标记的垃圾太阳城集团之间的相似度。

17.  根据权利要求10所述的装置,其特征在于,所述装置还包括:
第二获取模块,用于获取所述待发表太阳城集团的发表用户;
第三判断模块,用于判断所述发表用户是否存在于预设黑名单中;
所述拦截模块,用于当确定所述发表用户存在于所述预设黑名单中时,直 接执行对所述待发表太阳城集团进行拦截。

18.  根据权利要求10至17中任一权利要求所述的装置,其特征在于,所述公共平台为游戏应用中内置的互动平台,所述已标记的垃圾太阳城集团为已标记的发表于所述游戏应用互动平台上的广告。

说明书

说明书太阳城集团拦截方法及装置
技术领域
本发明涉及互联网技术领域,特别涉及一种太阳城集团拦截方法及装置。
背景技术
随着互联网技术的迅速发展,用户可以在各种公共平台发表自己的观点,并展示给其他用户,也可以对其他用户发表的内容进行评论等,因此,公共平台中会产生很多UGC(User Generated Content,用户生产内容)。例如,为了便于用户交流互动,很多游戏应用中都包括互动平台,如,游戏社区,用户可以在游戏应用中的互动平台上交流游戏技巧、游戏策略等内容。然而,由于每个用户都可以在公共平台上发表太阳城集团,因此,可能会出现有些用户随意在公共平台上乱发广告或其它一些不良内容等垃圾太阳城集团的情况出现,这些垃圾将会给其他在公共平台进行正常交互的用户带来不好的影响。为了避免该种情况发生,有必要提出一种太阳城集团拦截方法,以拦截用户在互联网平台上发表的垃圾太阳城集团。
现有技术在拦截太阳城集团时,通常采用的方法为:预设属于垃圾太阳城集团的关键词,并在获取到用户发表的太阳城集团后,将该太阳城集团与预设垃圾太阳城集团的关键词进行比对,以确定该用户发表的太阳城集团中是否存在这些关键字;如果存在,则拦截该用户发表的太阳城集团。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
由于通过该种方式拦截垃圾太阳城集团时,通过将用户发表的太阳城集团与垃圾太阳城集团的关键词进行比对来实现。在该种情况下,用户仅需修改所发表的太阳城集团,以避开关键词就可以避免被拦截,导致拦截垃圾太阳城集团的可靠性不高。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种太阳城集团拦截方法及装置。所述技术方案如下:
第一方面,提供了一种太阳城集团拦截方法,所述方法包括:
获取公共平台上的待发表太阳城集团;
计算所述待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度;
判断所述相似度是否大于第一预设阈值;
当确定所述相似度大于所述第一预设阈值时,对所述待发表太阳城集团进行拦截。
第二方面,提供了一种太阳城集团拦截装置,所述装置包括:
第一获取模块,用于获取公共平台上的待发表太阳城集团;
计算模块,用于计算所述待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度;
第一判断模块,用于判断所述相似度是否大于第一预设阈值;
拦截模块,用于当确定所述相似度大于所述第一预设阈值时,对所述待发表太阳城集团进行拦截。
本发明实施例提供的技术方案带来的有益效果是:
通过计算公共平台上的待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度,并在确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值时,拦截待发表太阳城集团。由于当公共平台上的待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值时,可以确定待发表太阳城集团与已标记的垃圾太阳城集团相似,因此,对该待发表太阳城集团进行拦截能够提高拦截垃圾太阳城集团的可靠性,从而能够维护公共平台的良好秩序。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下, 还可以根据这些附图获得其他的附图。
图1是本发明另一实施例提供的一种太阳城集团拦截方法的流程图;
图2是本发明另一实施例提供的一种太阳城集团拦截方法的流程图;
图3是本发明另一实施例提供的一种将待发表太阳城集团聚合至特征数据库的流程图;
图4是本发明另一实施例提供的一种太阳城集团拦截方法的应用环境示意图;
图5是本发明另一实施例提供的一种游戏应用中内置的互动平台的示意图。
图6是本发明另一实施例提供的一种太阳城集团拦截装置的结构示意图;
图7是本发明另一实施例提供的一种服务器的结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。
当用户在公共平台上发表太阳城集团时,为了确保用户发表的太阳城集团不为垃圾太阳城集团,从而维护公共平台的良好秩序,本发明实施例提供了一种太阳城集团拦截方法。通过本发明实施例提供的太阳城集团拦截方法,当任一用户在公共平台上所发表的太阳城集团为垃圾太阳城集团时,公共平台直接拦截该太阳城集团,并不对该太阳城集团进行发布,从而在减少人工太阳城集团压力的同时,维护公共平台的良好秩序。
太阳城集团公共平台的具体表现形式,本发明实施例不作具体限定。例如,该公共平台可以为微博、博客、社区、贴吧、论坛等。具体的太阳城集团拦截方法详见下述各个实施例:
结合上述内容,图1是根据一示例性实施例提供的一种太阳城集团拦截方法的流程图。参见图1,本发明实施例提供的方法流程包括:
101、获取公共平台上的待发表太阳城集团。
102、计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度。
103、判断相似度是否大于第一预设阈值。
104、当确定相似度大于第一预设阈值时,对待发表太阳城集团进行拦截。
本发明实施例提供的方法,通过计算公共平台上的待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度,并在确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值时,拦截待发表太阳城集团。由于当公共平台上的待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值时,可以确定待发表太阳城集团与已标记的垃圾太阳城集团相似,因此,对该待发表太阳城集团进行拦截能够提高拦截垃圾太阳城集团的可靠性,从而能够维护公共平台的良好秩序。
在另一个实施例中,判断相似度是否大于第一预设阈值之后,还包括:
当确定相似度不大于第一预设阈值时,提取待发表太阳城集团的特征;
将待发表太阳城集团的特征与特征数据库中的各个特征进行比对,其中,特征数据库至少包括已发表太阳城集团的特征及每个特征的出现次数;
根据比对结果判断特征数据库的特征中是否存在待发表太阳城集团的特征;
如果特征数据库的特征中存在待发表太阳城集团的特征,则将特征数据库中待发表太阳城集团的特征的出现次数增加一次;
如果特征数据库的特征中不存在待发表太阳城集团的特征,则将待发表太阳城集团添加至特征数据库中。
在另一个实施例中,将待发表太阳城集团的特征与特征数据库中的各个特征进行比对,包括:
选择特征数据库中的活跃特征;
将待发表太阳城集团的特征与特征数据库中的活跃特征进行比对;
根据比对结果判断特征数据库的特征中是否存在待发表太阳城集团的特征,包括:
根据比对结果确定特征数据库的活跃特征中是否存在待发表太阳城集团的特征。
在另一个实施例中,方法还包括:
统计特征数据库中每个特征在指定时长内的出现次数;
当任一特征在指定时长内的出现次数大于第二预设阈值时,对特征进行报警。
在另一个实施例中,对特征进行报警之后,还包括:
当检测到将特征标记为垃圾太阳城集团的特征时,扫描太阳城集团数据库,其中,太阳城集团数据库用于存储已发表太阳城集团;
当扫描到太阳城集团数据库中任一已发表太阳城集团的特征为特征时,删除太阳城集团数据库中的已发表太阳城集团。
在另一个实施例中,计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度,包括:
确定待发表太阳城集团的第一特征值;
获取已标记的垃圾太阳城集团的第二特征值;
根据第一特征值和第二特征值,计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度。
在另一个实施例中,第一特征值为第一哈希值,且第二特征值为第二哈希值,根据第一特征值和第二特征值,计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度,包括:
当第一哈希值和第二哈希值相等时,确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值;
当第一哈希值和第二哈希值不相等时,计算待发表太阳城集团的第一感知哈希值;
获取已标记的垃圾太阳城集团的第二感知哈希值;
计算第一感知哈希值和第二感知哈希值之间的汉明距离;
根据汉明距离确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度。
在另一个实施例中,计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度之前,还包括:
获取待发表太阳城集团的发表用户;
判断发表用户是否存在于预设黑名单中;
当确定发表用户存在于预设黑名单中时,直接执行对待发表太阳城集团进行拦截的步骤。
在另一个实施例中,公共平台为游戏应用中内置的互动平台,已标记的垃圾太阳城集团为已标记的发表于游戏应用中的互动平台上的广告。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
结合图1所对应实施例的内容,图2是根据一示例性实施例提供的一种太阳城集团拦截方法的流程图。其中,该太阳城集团拦截方法可以应用于任何公共平台。该太阳城集团拦截方法的执行主体可以为公共平台的一个或一个以上的服务器。参见图2,本发明实施例提供的方法流程包括:
201、获取公共平台上的待发表太阳城集团。
公共平台为可以供用户进行交互的任意互联网平台,用户可以在公共平台上发表太阳城集团,也可以对其他用户发表的太阳城集团进行评论、转发、收藏、点赞等。公共平台的类型可以有很多种,例如,公共平台为微博、博客、社区、贴吧、论坛等。
优选地,在游戏应用中可能会内置互动平台,以供用户之间交互游戏技巧、游戏策略等内容。由于游戏应用中的互动平台上每天都有很多用户进行互动,因此,会产生很多UGC。恶意用户为了推广其产品或服务,经常会在互动平台上发表广告或其它与游戏无关的垃圾太阳城集团,为了遏制恶意用户的这种行为,本发明实施例中的公共平台可以优选为游戏应用中的互动平台,如,游戏社区等。太阳城集团游戏应用的类型,本发明实施例不作具体限定。该游戏应用可以优选为手机游戏,当然,游戏应用也可以为电脑游戏等。
其中,在获取公共平台上的待发表太阳城集团时,可以通过接收用户所使用的终端提交的太阳城集团来实现。具体地,用户在公共平台上发表待发表太阳城集团时,可以在终端的指定区域实现。其中,该指定区域可以为公共平台对应的客户端中,用于提供太阳城集团输入功能的区域。用户可以在该指定区域输入待发表太阳城集团,并通过提交选项或发表选项提交至公共平台或其服务器。
太阳城集团待发表太阳城集团的类型,可以有很多种。例如,可以为文本、图片、语音和视频中的一种或至少两种的组合等,本发明实施例对此不作具体限定。结合公共平台的类型,当公共平台为游戏应用中的互动平台时,待发表太阳城集团可能为与游戏得分、游戏画面、游戏截图、游戏道具、游戏视频中的一种或至少两种的组合等。
202、获取待发表太阳城集团的发表用户,并判断发表用户是否存在于预设黑名单中,当确定发表用户存在于预设黑名单中时,执行步骤205;当确定发表用户未存在于预设黑名单中时,执行步骤203。
该步骤为可选步骤。发表用户为发表该待发表太阳城集团的用户。预设黑名单中预先存储了发表垃圾太阳城集团次数比较多的用户,预设黑名单中的用户将被禁止发表太阳城集团。
其中,在获取待发表太阳城集团的发表用户时,可以通过获取待发表太阳城集团的用户太阳城集团来实现,并进一步根据用户太阳城集团来确定发表用户。太阳城集团用户太阳城集团的类型,可以有很多种。例如,可以为发表用户的账号、手机号或邮箱等。
另外,在判断发表用户是否存在于预设黑名单中时,可以将发表用户的用户太阳城集团与预设黑名单中每个用户的用户太阳城集团进行比对来实现。当预设黑名单中任一用户的用户太阳城集团与发表用户的用户太阳城集团相同时,确定发表用户存在于预设黑名单中;当预设黑名单中所有用户的用户太阳城集团均与发表用户的用户太阳城集团不相同时,确定发表用户未存在于预设黑名单中。
203、计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度。
其中,已标记的垃圾太阳城集团可以为广告,也可以为不良太阳城集团等。结合公共平台的类型,当公共平台为游戏应用中的互动平台时,已标记的垃圾太阳城集团可以为已标记的发表于游戏应用互动平台上的广告,或者其它与游戏内容无关的太阳城集团。具体地,已标记垃圾太阳城集团可以由公共平台的管理员标记后,存储至特征数据库中。在计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度时,可以直接从特征数据库中获取已标记的垃圾太阳城集团。太阳城集团已标记的垃圾太阳城集团的数量,与截止当前 时刻已确定为垃圾太阳城集团的数量有关。当已标记的垃圾太阳城集团有多个时,在计算待发表太阳城集团与已标记垃圾太阳城集团之间的相似度时,需计算待发表太阳城集团与每个已标记的垃圾太阳城集团之间的相似度。
在本发明实施例中,对于任一已标记的垃圾太阳城集团,在计算待发表太阳城集团与该已标记的垃圾太阳城集团之间的相似度时,包括但不限于通过如下步骤2031和步骤2032来实现:
2031、确定待发表太阳城集团的第一特征值,并获取已标记的垃圾太阳城集团的第二特征值。
其中,确定待发表太阳城集团的第一特征值的过程即为提取待发表太阳城集团的特征的过程。在本发明实施例中,第一特征值为待发表太阳城集团的特征值,第二特征值为已标记的垃圾太阳城集团的特征值。当已标记的垃圾太阳城集团为广告时,第二特征值为已标记的广告的特征值。第一特征值的具体形式可以与待发表太阳城集团的类型相关。例如,当待发表太阳城集团为文本时,其第一特征值可以为文本本身。当待发表太阳城集团为图片、音频、视频或语音时,第一特征值可以为哈希值或感知哈希值等。
进一步地,在确定待发表太阳城集团的第一特征值时,可以结合待发表太阳城集团的类型而定。例如,当待发表太阳城集团为文本时,可以直接计算其文本长度,将文本长度作为待发表太阳城集团的第一特征值。当待发表太阳城集团为图片、音频、视频或语音时,可以计算待发表太阳城集团的哈希值,将该哈希值作为待发表太阳城集团的第一特征值。
在获取已标记的垃圾太阳城集团的第二特征值时,可以获取已标记的垃圾太阳城集团,并通过上述计算待发表太阳城集团的第一特征值的方式,计算已标记的垃圾太阳城集团的第二特征值。另外,特征数据库在存储已标记的垃圾太阳城集团时,还存储了每个已标记的垃圾太阳城集团的特征值。此时,在获取已标记的垃圾太阳城集团的第二特征值时,可以直接从特征数据库中读取已标记的垃圾太阳城集团的特征值。太阳城集团特征数据库的内容,将在后续内容中进行详细阐释,此处暂不描述。
可选地,在确定待发表太阳城集团的第一特征值之前,还可以对待发表太阳城集团进行预处理,例如,对待发表太阳城集团作一些判断或过滤。如,文本太短,只有一两个 字,则不适合计算,忽略该条待发表太阳城集团,而不进行后续的计算相似度的步骤。又如,如果待发表太阳城集团中的文本中换行符或空格太多,则可以去掉这些换行符或空格后再计算特征。通过预处理,能够减少计算相似度时的计算量,从而能够节省系统资源,并能提高计算效率。
2032、根据第一特征值和第二特征值,计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度。
具体地,在根据第一特征值和第二特征值,计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度时,也可以根据待发表太阳城集团的类型而有不同的方式。具体实施时,包括但不限于有如下几种情况:
第一种情况:当待发表太阳城集团和已标记的垃圾太阳城集团均为文本,第一特征值为待发表太阳城集团的文本长度,第二特征值为已标记的垃圾太阳城集团的文本长度时,可以根据待发表太阳城集团和已标记的垃圾太阳城集团之间的编辑距离,计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度。
具体地,可以根据编辑距离通过如下公式确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度:
S=1-Lmax(a,b)---(1)]]>
公式(1)中,S表示待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度,L表示待发表太阳城集团与已标记的垃圾太阳城集团之间的编辑距离,a表示待发表太阳城集团的文本长度,b表示已标记的垃圾太阳城集团的文本长度。
例如,当待发表太阳城集团为“这是一条广告”,已标记的垃圾太阳城集团为“这是一条长广告”,则可计算出编辑距离为1,待发表太阳城集团的文本长度为6,已标记的垃圾太阳城集团的文本长度为7,此时,相似度为:1-1/7=6/7。
第二种情况:当待发表太阳城集团和已标记的垃圾太阳城集团均为图片,第一特征值为待发表太阳城集团的第一哈希值,第二特征值为已标记的垃圾太阳城集团的第二哈希值时,可以通过如下步骤2032.1至步骤2032.4来计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度:
2032.1、当第一哈希值和第二哈希值相等时,确定待发表太阳城集团与已标记的垃圾太阳城集团相似。
2032.2、当第一哈希值和第二哈希值不相等时,计算待发表太阳城集团的第一感知哈希值,并获取已标记的垃圾太阳城集团的第二感知哈希值。
太阳城集团计算待发表太阳城集团的第一感知哈希值方式,可以参见已有感知哈希值的计算方式,本发明实施例在此不作具体解释。
另外,在获取已标记的垃圾太阳城集团的第二感知哈希值时,可以通过计算待发表太阳城集团的第一感知哈希值的方式来实现。然而,当特征数据库在存储已标记的垃圾太阳城集团时,还存储了每个已标记的垃圾太阳城集团的哈希值和感知哈希值。此时,可以直接从特征数据库中读取已标记的垃圾太阳城集团的第二感知哈希值。
2032.3、计算第一感知哈希值和第二感知哈希值之间的汉明距离。
其中,在太阳城集团论中,两个等长字符串之间的汉明距离是两个字符串对应位置的不同字符的个数。换句话说,它就是将一个字符串变换成另外一个字符串所需要替换的字符个数。例如:1011101与1001001之间的汉明距离是2。
结合该内容,在计算第一感知哈希值和第二感知哈希值之间的汉明距离时,可以通过计算由第一感知哈希值变换成第二感知哈希值时,所需要替换的字符个数来实现。
2032.4、根据汉明距离确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度。
具体地,在根据汉明距离确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度的方式,可以参见上述第一种情况下,根据编辑距离确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度的方式,此处不再赘述。
第三种情况:当待发表太阳城集团为视频、音频等多媒体太阳城集团时,确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度的方式,可以与上述当待发表太阳城集团为图片时的方式一致,此处不再赘述。
另外,需要说明的是,当待发表太阳城集团为文本时,确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度时,除可以采用上述第一种情况中所述的方式外,还 可以与上述当待发表太阳城集团为图片时的方式一致。
204、判断相似度是否大于第一预设阈值,当确定相似度大于第一预设阈值时,执行步骤205;当确定相似度不大于第一预设阈值时,执行步骤206。
在本发明实施例中,当相似度大于第一预设阈值时,则可以确定待发表太阳城集团和已标记的垃圾太阳城集团相似。当相似度不大于第一预设阈值时,则可以确定待发表太阳城集团和已标记的垃圾太阳城集团不相似。
太阳城集团第一预设阈值的具体数值,本发明实施例不作具体限定。具体实施时,可以根据需要设定。例如,该第一预设阈值可以为0.7、0.8等。然而,为了保证能够准确确定待发表太阳城集团与已标记的垃圾太阳城集团是否相似,该第一预设阈值可以设置得比较大。
205、对待发表太阳城集团进行拦截。
在本发明实施例中,当待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值时,拦截待发表太阳城集团。其中,在拦截待发表太阳城集团时,可以删除待发表太阳城集团,从而不发表该待发表太阳城集团,并向发表用户的终端返回太阳城集团发表失败的提醒消息。
例如,当已标记的垃圾太阳城集团为广告,且待发表太阳城集团与已标记的广告之间的相似度大于第一预设阈值时,则可以确定待发表太阳城集团可能为广告。此时,通过对该待发表太阳城集团进行拦截,可以避免在公共平台上随意乱发广告的现象出现,从而能够维护公共平台的正常秩序。
又例如,当公共平台为游戏应用中的互动平台,且已标记的垃圾太阳城集团为已标记的发表于游戏应用中的互动平台上的广告时,如果待发表太阳城集团与已标记的发表于游戏应用中的互动平台上的广告之间的相似度大于第一预设阈值,则可以确定待发表太阳城集团可能为要发表于游戏应用互动平台上的广告。此时,通过对该待发表太阳城集团进行拦截,能够避免恶意用户在游戏应用中的互动平台上随意乱发广告的现象出现,从而能够维护游戏应用中互动平台的正常秩序。
进一步地,当通过步骤204判断相似度大于第一预设阈值时,在拦截该待 发表太阳城集团后,还可以直接将该发表用户加入预设黑名单中。然而,为了避免误将发表用户加入预设黑名单而给用户带来不好的影响,本发明实施例还可以统计该发表用户发表的太阳城集团中,与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值的数量,当该数量大于指定数值时,再将该发表用户加入预设黑名单。太阳城集团指定数值的具体数值,可以根据需要设定,例如,设置为10、20等。
另外,在本发明实施例中,当通过步骤202确定发表用户存在于预设黑名单中时,也可以直接拦截待发表太阳城集团。通过预设黑名单,能够直接拦截一些由预设黑名单中的用户发表的太阳城集团,拦截垃圾太阳城集团的操作简单。
206、将待发表太阳城集团聚合至特征数据库中,并将待发表太阳城集团存入太阳城集团数据库,其中,特征数据库至少包括已发表太阳城集团的特征及每个特征的出现次数,太阳城集团数据库用于存储已发表太阳城集团。
其中,如图3所示,其示出了一种将待发表太阳城集团聚合至特征数据库的流程图。如图3所示,该流程包括步骤2061至步骤2064:
2061、提取待发表太阳城集团的特征。
其中,提取待发表太阳城集团的特征的原理同上述步骤2031中确定待发表太阳城集团的第一特征值的原理相同,具体可参见上述步骤2031中的内容,此处不再赘述。
2062、将待发表太阳城集团的特征与特征数据库中的各个特征进行比对,并根据比对结果判断特征数据库的特征中是否存在待发表太阳城集团的特征,当特征数据库的特征中存在待发表太阳城集团的特征时,执行步骤2063;当特征数据库的特征中不存在待发表太阳城集团的特征时,执行步骤2064。
其中,在将待发表太阳城集团的特征与特征数据库中的各个特征进行比对之前,可以先读取特征数据库中的各个特征。
具体地,在将待发表太阳城集团的特征与特征数据库中的各个特征进行比对,并根据比对结果判断特征数据库的特征中是否存在待发表太阳城集团的特征时,可以将待发表太阳城集团的特征与特征数据库中的每个特征一一进行比对,当特征数据库中的某一个特征与待发表太阳城集团的特征相同时,比对结果为特征数据库的特征中存 在待发表太阳城集团的特征;当特征数据库中的所有特征与待发表太阳城集团的特征均不相同时,比对结果为特征数据库的特征中不存在待发表太阳城集团的特征。
由于特征数据库中可能包括很多个特征,如果将待发表太阳城集团的特征与特征数据库中的每个特征均进行比对,能够保证准确无遗漏地确定特征数据库中是否已存在待发表太阳城集团的特征。然而,将待发表太阳城集团的特征与特征数据库中的每个特征均进行比对,会有比较多的计算量,因而会占用比较多的系统资源。结合该部分内容,在将待发表太阳城集团的特征与特征数据库中的各个特征进行比对时,还可以仅选择特征数据库中的一些活跃特征来实现。
其中,活跃特征是指记录特征的时刻与当前时刻之间的差值小于第一指定时长的特征,如,特征记录太阳城集团在24小时之内的特征;或者为记录特征的时刻与当前时刻之间的差值小于第二指定时长,且特征的出现次数大指定数值的特征,如特征记录太阳城集团在一星期之内且出现次数大于20的特征。
结合上述活跃特征的内容,在将待发表太阳城集团的特征与特征数据库中的各个特征进行比对,并根据比对结果判断特征数据库的特征中是否存在待发表太阳城集团的特征时,可以先选择特征数据库中的活跃特征,从而将待发表太阳城集团的特征与特征数据库中的活跃特征进行比对,并根据比对结果确定特征数据库的活跃特征中是否存在待发表太阳城集团的特征。
当特征数据库中的某一个活跃特征与待发表太阳城集团的特征相同时,比对结果为特征数据库的活跃特征中存在待发表太阳城集团的特征;当特征数据库中所选择的活跃特征与待发表太阳城集团的特征均不相同时,比对结果为特征数据库的活跃特征中不存在待发表太阳城集团的特征。
2063、将特征数据库中待发表太阳城集团的特征的出现次数增加一次。
例如,如果特征数据库中当前记录的待发表太阳城集团的特征为15,则将特征数据库中待发表太阳城集团的特征的出现次数更新为16。
2064、将待发表太阳城集团添加至特征数据库中。
当比对结果为特征数据库的特征中不存在待发表太阳城集团的特征时,为了便于 将该待发表太阳城集团的特征与后续获取到的待发表太阳城集团的特征进行比对,本发明实施例将该待发表太阳城集团添加至特征数据库中。
太阳城集团特征数据库记录数据的形式,本发明实施例不作具体限定。具体实施时,特征数据库可以包括一个汇总表和一个详情表。其中,汇总表用于记录截止当前时刻,根据已分析的各个太阳城集团统计的特征及每个特征的相关属性。详情表用于记录每个太阳城集团的具体内容。
其中,汇总表中可以包括特征标识、太阳城集团类型、特征、太阳城集团、特征出现次数、是否是广告、更新太阳城集团等数据。如表1所示,其为一种汇总表的示意表。
表1

表1中,一个特征对应一个特征标识,不同特征之间可以通过特征标识区分;太阳城集团类型包括文本、图片、视频、音频等。特征为太阳城集团的特征值;出现次数为截止当前时刻统计的该特征的出现次数;是否是广告标识具备该特征的太阳城集团是否是广告;更新太阳城集团为更新该汇总表的太阳城集团。当然,表1中的各字段仅用于举例,并不构成对本发明实施例的限制。另外,表1中还可以包括其它字段,如删除次数、操作太阳城集团、太阳城集团来源等。
详情表中可以包括详情自增标识、太阳城集团标识、发表用户标识、特征标识、是否删除等数据。如表2所示,其为一种详情表的示意表。
表2

表2中,当特征数据库中每增加一个详情表,则详情表自增标识增加一次;每条太阳城集团具有全局唯一的太阳城集团标识;发表用户标识为太阳城集团的发表用户的账号、邮箱或手机号等太阳城集团,不同的发表用户标识对应不同的用户;是否删除用于表示该太阳城集团是否已从太阳城集团数据库中删除。其中,太阳城集团数据库用于存储已发表太阳城集团。当任一太阳城集团从太阳城集团特征库中删除后,该太阳城集团将不再进行显示。当然,表2中的各字段仅用于举例,并不构成对本发明实施例的限制。
由于汇总表和详情表中均包括特征标识,因此,可以通过特征标识将汇总表和详情表关联起来。
结合上述汇总表的内容,当将特征数据库中待发表太阳城集团的特征的出现次数增加一次时,可以在汇总表中统计的出现次数的基础上增加一次;当将待发表太阳城集团添加至特征数据库中时,可以将待发表太阳城集团的特征及其相关属性增加至汇总表中。
由于汇总表中包括多个特征的相关属性太阳城集团,为了便于查看该多个特征之间的关系,可以按照出现次数由高到低的顺序,对汇总表中各个特征进行排序。
进一步地,在获取到待发表太阳城集团时,可以将待发表太阳城集团的具体内容增加至详情表中,从而在后续获取到其它待发表太阳城集团后,可以将该待发表太阳城集团与其它待发表太阳城集团进行比较等。
可选地,为了便于实时监控特征数据库中各个特征的变化情况,当通过上述步骤206将待发表太阳城集团聚合至特征数据库中后,本发明实施例还提供了监控报警流程,具体监控报警流程可以通过如下步骤206.5和步骤206.6来实现:
206.5、统计特征数据库中每个特征在指定时长内的出现次数。
太阳城集团指定时长的具体数值,本发明实施例不作具体限定。例如,该指定时 长可以为10分钟、30分钟、一个小时等。
206.6当任一特征在指定时长内的出现次数大于第二预设阈值时,对该特征进行报警。
当任一特征在指定时长内的出现次数大于第二预设阈值时,则可以表明这个太阳城集团段内该特征对应的太阳城集团的出现次数比较多,为了便于确定该特征的太阳城集团是否是广告,或是否有其他问题,本发明实施例对该特征进行报警。
太阳城集团对该特征进行报警的方式,可以有很多种。例如,可以预先建立与公共平台管理员的移动终端的连接,当需要报警时,将报警太阳城集团发送至建立连接的移动终端。其中,报警太阳城集团可以为文本形式,也可以为语音形式,本发明实施例对此不作具体限定。报警太阳城集团中至少包括该特征。另外,报警太阳城集团中还可以包括该特征在该指定时长内的出现次数等内容。另外,在将报警太阳城集团发送至建立连接的移动终端时,可以通过短信方式实现,也可以通过即时通讯消息实现等。
当将报警太阳城集团发送至建立连接的移动终端时,可以便于公共平台的管理员确定具有该特征的太阳城集团是否有问题。当确定具有该特征的太阳城集团有问题时,可以实现对具有该特征的问题进行批量操作。例如,当具有该特征的太阳城集团为广告时,可以由公共平台管理员将具有该特征的太阳城集团批量标记为广告,从而可以避免广告爆发。
另外,当公共平台管理员确定具有该特征的太阳城集团属于垃圾太阳城集团时,可以将该特征标记为垃圾太阳城集团的特征,并在特征数据库中标记该特征为垃圾太阳城集团。后续在计算其它待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度时,可以将特征数据库中存储的具有该特征的太阳城集团作为已标记的垃圾太阳城集团参与计算。通过该种方式,可以不断扩充特征数据库中的已标记的垃圾太阳城集团,从而使得后续判断其它待发表太阳城集团是否为垃圾太阳城集团时,具有更多的参考,从而能够提高判断结果的准确性。
进一步地,通过该报警太阳城集团,可以链接至太阳城集团数据库。当确定具有该特征 的太阳城集团为垃圾太阳城集团时,便于在太阳城集团数据库中删除具有该特征的已发表太阳城集团。具体地,对该特征进行报警之后,当检测到将特征标记为垃圾太阳城集团的特征时,可以扫描太阳城集团数据库,并在扫描到太阳城集团数据库中任一已发表太阳城集团的特征为特征时,删除太阳城集团数据库中的已发表太阳城集团,此时,该已发表太阳城集团将不再显示于公共平台。
另外,在本发明实施例中,当步骤204确定待发表太阳城集团和已标记的垃圾太阳城集团之间的相似度不大于第一预设阈值时,确定待发表太阳城集团和已标记的垃圾太阳城集团不相似,此时可以允许发表该待发表太阳城集团,并向待发表用户所在终端返回发表成功的提醒消息。此时,发表用户可以在公共平台正常查看其发表的待发表太阳城集团。
结合上述内容,图4示出了一种太阳城集团拦截方法的应用环境示意图。如图4所示,该应用环境包括游戏应用服务器401和终端402。其中,游戏应用服务器401能够提供游戏公共平台,当终端402中安装了该游戏应用后,用户可以在终端402运行游戏应用。终端402安装的游戏应用中内置有互动平台,用户可以在互动平台上通过发表太阳城集团的方式交互与游戏相关的内容。当终端402获取待发表太阳城集团,并将待发表太阳城集团提交至游戏应用服务器401后,如果游戏应用服务器401确定该待发表太阳城集团与预先已标记的广告之间的相似度大于第一预设阈值时,则可以确定待发表太阳城集团可能为将要发表至游戏应用互动平台的广告。此时,游戏应用服务器401拦截该待发表太阳城集团,从而不在游戏应用的互动平台中发表该待发表太阳城集团。
需要说明的是,图4所示的应用环境示意图仅以一个服务器代表游戏应用服务器401为例进行了说明。然而,在具体实施时,图4中游戏应用服务器401可以标识一个服务器集群,可以由服务器集群中的各个服务器配合完成上述太阳城集团拦截方法。
如图5所示,其示出了一种游戏应用中内置的互动平台的示意图。图5中的A区域可以用于显示游戏画面,B区域为游戏应用中的互动平台,用于供用户互动。通过该游戏应用中内置的互动平台,用户可以边玩游戏边进行太阳城集团交 互。
本发明实施例提供的方法,通过计算公共平台上的待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度,并在确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值时,拦截待发表太阳城集团。由于当公共平台上的待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值时,可以确定待发表太阳城集团与已标记的垃圾太阳城集团相似,因此,对该待发表太阳城集团进行拦截能够提高拦截垃圾太阳城集团的可靠性,从而能够维护公共平台的良好秩序。
图6是根据一示例性实施例提供的一种太阳城集团拦截装置的结构示意图,该太阳城集团拦截装置可以用于执行上述图1或图2所对应实施例提供的太阳城集团拦截方法。参见图6,该太阳城集团拦截装置包括:
第一获取模块601,用于获取公共平台上的待发表太阳城集团;
计算模块602,用于计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度;
第一判断模块603,用于判断相似度是否大于第一预设阈值;
拦截模块604,用于当确定相似度大于第一预设阈值时,对待发表太阳城集团进行拦截。
本发明实施例提供的装置,通过计算公共平台上的待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度,并在确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值时,拦截待发表太阳城集团。由于当公共平台上的待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值时,可以确定待发表太阳城集团与已标记的垃圾太阳城集团相似,因此,对该待发表太阳城集团进行拦截能够提高拦截垃圾太阳城集团的可靠性,从而能够维护公共平台的良好秩序。
在另一个实施例中,太阳城集团拦截装置还包括:
提取模块,用于当确定相似度不大于第一预设阈值时,提取待发表太阳城集团的特征;
比对模块,用于将待发表太阳城集团的特征与特征数据库中的各个特征进行比对, 其中,特征数据库至少包括已发表太阳城集团的特征及每个特征的出现次数;
第二判断模块,用于根据比对结果判断特征数据库的特征中是否存在待发表太阳城集团的特征;
增加模块,用于当特征数据库的特征中存在待发表太阳城集团的特征时,将特征数据库中待发表太阳城集团的特征的出现次数增加一次;
添加模块,用于当特征数据库的特征中不存在待发表太阳城集团的特征时,将待发表太阳城集团添加至特征数据库中。
在另一个实施例中,
比对模块,用于选择特征数据库中的活跃特征,并将待发表太阳城集团的特征与特征数据库中的活跃特征进行比对;
确定模块,用于根据比对结果确定特征数据库的活跃特征中是否存在待发表太阳城集团的特征。
在另一个实施例中,太阳城集团拦截装置还包括:
统计模块,用于统计特征数据库中每个特征在指定时长内的出现次数;
报警模块,用于当任一特征在指定时长内的出现次数大于第二预设阈值时,对特征进行报警。
在另一个实施例中,太阳城集团拦截装置还包括:
扫描模块,用于当检测到将特征标记为垃圾太阳城集团的特征时,扫描太阳城集团数据库,其中,太阳城集团数据库用于存储已发表太阳城集团;
删除模块,用于当扫描到太阳城集团数据库中任一已发表太阳城集团的特征为特征时,删除太阳城集团数据库中的已发表太阳城集团。
在另一个实施例中,计算模块602包括:
确定单元,用于确定待发表太阳城集团的第一特征值;
获取单元,用于获取已标记的垃圾太阳城集团的第二特征值;
计算单元,用于根据第一特征值和第二特征值,计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度。
在另一个实施例中,第一特征值为第一哈希值,且第二特征值为第二哈希值,计算单元包括:
第一确定子单元,用于当第一哈希值和第二哈希值相等时,确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值;
第一计算子单元,用于当第一哈希值和第二哈希值不相等时,计算待发表太阳城集团的第一感知哈希值;
获取子单元,用于获取已标记的垃圾太阳城集团的第二感知哈希值;
第二计算子单元,用于计算第一感知哈希值和第二感知哈希值之间的汉明距离;
第二确定子单元,用于根据汉明距离确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度。
在另一个实施例中,太阳城集团拦截装置还包括:
第二获取模块,用于获取待发表太阳城集团的发表用户;
第三判断模块,用于判断发表用户是否存在于预设黑名单中;
拦截模块,用于当确定发表用户存在于预设黑名单中时,直接执行对待发表太阳城集团进行拦截。
在另一个实施例中,公共平台为游戏应用中内置的互动平台,已标记的垃圾太阳城集团为已标记的发表于游戏应用互动平台上的广告。
太阳城集团上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
图7是根据一示例性实施例示出的一种服务器的结构示意图,该服务器可以用于执行上述图1或图2所对应实施例提供的太阳城集团拦截方法。参照图7,服务器700包括处理组件722,其进一步包括一个或多个处理器,以及由存储器732 所代表的存储器资源,用于存储可由处理组件722的执行的指令,例如应用程序。存储器732中存储的应用程序可以包括一个或一个以上的每一个对应于一组指令的模块。此外,处理组件722被配置为执行指令,以执行上述图1或图2所对应实施例提供的太阳城集团拦截方法。
服务器700还可以包括一个电源组件726被配置为执行服务器700的电源管理,一个有线或无线网络接口750被配置为将服务器700连接到网络,和一个输入输出(I/O)接口758。服务器700可以操作基于存储在存储器732的操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM或类似。
其中,一个或者一个以上程序存储于存储器中,且经配置以由一个或者一个以上处理器执行,所述一个或者一个以上程序包含用于进行以下操作的指令:
获取待发表太阳城集团;
计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度;
判断相似度是否大于第一预设阈值;
当确定相似度大于第一预设阈值时,对待发表太阳城集团进行拦截。
假设上述为第一种可能的实施方式,则在第一种可能的实施方式作为基础而提供的第二种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:判断相似度是否大于第一预设阈值之后,还包括:
当确定相似度不大于第一预设阈值时,提取待发表太阳城集团的特征;
将待发表太阳城集团的特征与特征数据库中的各个特征进行比对,其中,特征数据库至少包括已发表太阳城集团的特征及每个特征的出现次数;
根据比对结果判断特征数据库的特征中是否存在待发表太阳城集团的特征;
如果特征数据库的特征中存在待发表太阳城集团的特征,则将特征数据库中待发表太阳城集团的特征的出现次数增加一次;
如果特征数据库的特征中不存在待发表太阳城集团的特征,则将待发表太阳城集团添加至特征数据库中。
在第二种可能的实施方式作为基础而提供的第三种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:将待发表太阳城集团的特征与特征数据库中的各个特征进行比对,包括:
选择特征数据库中的活跃特征;
将待发表太阳城集团的特征与特征数据库中的活跃特征进行比对;
根据比对结果确定特征数据库的特征中是否存在待发表太阳城集团的特征,包括:
根据比对结果确定特征数据库的活跃特征中是否存在待发表太阳城集团的特征。
在第二种可能的实施方式作为基础而提供的第四种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:方法还包括:
统计特征数据库中每个特征在指定时长内的出现次数;
当任一特征在指定时长内的出现次数大于第二预设阈值时,对特征进行报警。
在第四种可能的实施方式作为基础而提供的第五种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:对特征进行报警之后,还包括:
当检测到将特征标记为垃圾太阳城集团的特征时,扫描太阳城集团数据库,其中,太阳城集团数据库用于存储已发表太阳城集团;
当扫描到太阳城集团数据库中任一已发表太阳城集团的特征为特征时,删除太阳城集团数据库中的已发表太阳城集团。
在第一种可能的实施方式作为基础而提供的第六种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度,包括:
确定待发表太阳城集团的第一特征值;
获取已标记的垃圾太阳城集团的第二特征值;
根据第一特征值和第二特征值,计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度。
在第六种可能的实施方式作为基础而提供的第七种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:第一特征值为第一哈希值,且第二特征值为第二哈希值,根据第一特征值和第二特征值,计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度,包括:
当第一哈希值和第二哈希值相等时,确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值;
当第一哈希值和第二哈希值不相等时,计算待发表太阳城集团的第一感知哈希值;
获取已标记的垃圾太阳城集团的第二感知哈希值;
计算第一感知哈希值和第二感知哈希值之间的汉明距离;
根据汉明距离确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度。
在第一种可能的实施方式作为基础而提供的第八种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:计算待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度之前,还包括:
获取待发表太阳城集团的发表用户;
判断发表用户是否存在于预设黑名单中;
当确定发表用户存在于预设黑名单中时,直接执行对待发表太阳城集团进行拦截的步骤。
在第一种可能的实施方式作为基础而提供的第八种可能的实施方式中,服务器的存储器中,还包含用于执行以下操作的指令:公共平台为游戏应用中内置的互动平台,已标记的垃圾太阳城集团为已标记的发表于游戏应用互动平台上的广告。
本发明实施例提供的服务器,通过计算公共平台上的待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度,并在确定待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值时,拦截待发表太阳城集团。由于当公共平台上的待发表太阳城集团与已标记的垃圾太阳城集团之间的相似度大于第一预设阈值时,可以确定待发表太阳城集团与已标记的垃圾太阳城集团相似,因此,对该待发表太阳城集团进行拦截能够提高拦截垃圾 太阳城集团的可靠性,从而能够维护公共平台的良好秩序。
需要说明的是:上述实施例提供的太阳城集团拦截装置在拦截太阳城集团时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的太阳城集团拦截装置及服务器与太阳城集团拦截方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。
本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

关 键 词:
太阳城集团 拦截 方法 装置
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
太阳城集团本文
本文标题:太阳城集团拦截方法及装置.pdf
链接地址:http://zh228.com/p-6377399.html
太阳城集团我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
葡京赌场|welcome document.write ('');