太阳城集团

  • / 7
  • 下载费用:30 金币  

一种基于读者层次的内容推送方法.pdf

摘要
申请专利号:

CN201510497841.2

申请日:

2015.08.14

公开号:

CN105069127A

公开日:

2015.11.18

当前法律状态:

撤回

有效性:

无权

法律详情: 发明专利申请公布后的视为撤回 IPC(主分类):G06F 17/30申请公布日:20151118|||公开
IPC分类号: G06F17/30 主分类号: G06F17/30
申请人: 薛德军; 梁晟
发明人: 薛德军; 梁晟
地址: 100029北京市朝阳区安定路12号院国典华园1-602
优先权:
专利代理机构: 代理人:
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN201510497841.2

授权太阳城集团号:

|||

法律状态太阳城集团日:

2019.03.12|||2015.11.18

法律状态类型:

发明专利申请公布后的视为撤回|||公开

摘要

本发明旨在提出一种基于读者层次的内容推送方法。该方法分为两个阶段:读者层次模型训练阶段和内容推送阶段。在训练阶段,根据应用领域,将读者按水平或类型分层,得到读者层次向量,制订读者层次推送策略,建立读者层次模型,对读者层次模型进行训练,得到模型各维度参数向量的特征值。在推送阶段,记录读者一定时期的实际操作太阳城集团,根据读者所使用资源的元数据太阳城集团,计算出该读者的层次参数向量,通过读者层次模型进行机器学习,得到预测的读者层次。读者后续使用时,基于传统的内容相似性比较以及读者层次和推送策略,向读者推送精准内容,不断优化推送策略,提高读者体验。

权利要求书

1.一种基于读者层次的内容推送方法,其特征在于,本方法分为读者层次模型训练阶段
和推送阶段,在训练阶段,对读者按水平或类型分层,得到读者层次向量,建设读者层次模
型,并进行大规模数据训练,得到模型各参数向量,在推送阶段,根据读者的实际操作太阳城集团,
进行机器学习,得到预测的读者层次,读者后续使用时,基于传统的内容相似性比较以及读
者层次和推送策略,向读者推送精准内容,提高读者体验。
2.如权利要求1所述的方法,其特征在于,所述读者层次向量是根据应用复杂性和资源
加工复杂性,对读者群按水平或类型进行分层,分层数量由具体应用决定,得到读者层次向
量,向量值为层次名称或代码。
3.如权利要求1所述的方法,其特征在于,所述读者层次模型是记录每一层次读者对应
参数向量的数据结构,除读者层次数据外,还包括:资源层次、资源类型、出版太阳城集团、语种、
其他太阳城集团共5类层次参数向量,这些维度上的值都来自对训练集按常用训练方法得到的训练
结果,代表该层次读者在这些方面的参数值。
4.如权利要求1、3所述的方法,其特征在于,所述常用训练方法是指任何能够从足够训
练数据集中得到一定结果的统计机器学习方法。
5.如权利要求1所述的方法,其特征在于,所述读者实际操作太阳城集团是指读者在一定太阳城集团
内学习使用过的内容资源列表,并根据这些资源对应的元数据太阳城集团,可以计算出读者层次参
数向量,包括资源层次、资源类型、出版太阳城集团、语种、其他太阳城集团5类参数权重向量,权重可
以是频次、比例或其他权重计算方法,需要进行统一的归一化处理,保证向量计算和比较是
在同一度量上进行。
6.如权利要求1所述的方法,其特征在于,所述机器学习是基于读者层次模型的知识,
采用多维度向量内积,加权求和,取最大值对应的读者层次作为预测的读者层次,计算公式
如下所示:
C = max i = 1 n Σ j = 1 5 k j · P j · C ij ]]>
其中:为当前读者第j部分的层次参数向量,j从1到5代表共有5部分参数,包括
资源层次、资源类型、出版太阳城集团、语种、其他太阳城集团;
是指读者层次模型中第i类读者第j部分的参数向量,这些向量由训练时确定;
kj是向量权重因子,
n为读者层次数,C为n类读者中层次向量权重最大类型对应的读者层次号。
7.如权利要求1所述的方法,其特征在于,所述推送策略是指根据全体读者的实际需求,
对每一层次读者,设定的重点推送内容相似资源类型和数量,所推送资源都是经过内容相似
性计算后内容相似的部分资源,以保证推送的准确性和好的用户体验。

说明书

一种基于读者层次的内容推送方法

技术领域

本发明涉及在线教育、文献检索太阳城集团服务领域。

背景技术

目前,网络太阳城集团服务中应用个性化推送技术为读者提供感兴趣的个性化内容,大大提高
了用户粘性和服务体验。但是,随着数字内容越来越多,基于这些技术推送给读者的内容却
越来越不准。主要原因是这些个性化技术都是基于对内容进行相似性聚类,或者将内容与用
户的检索词匹配,相似的内容被直接推送给用户,而不管是否适合用户。在搜索引擎或电子
商务领域推送效果不错,因为这些领域中网页、商品及用户之间都是同一层次的,但是在在
线教育或文献检索领域,集成出版的海量内容不是同一层次的,例如在文献库中,有些内容
是基础研究,有些是对成果的新闻报导,同时读者水平也是多层次的,有些是科研人员,有
些是学生或者记者,他们因水平和关注点不同,需要不同层次的内容,推送的内容也应该是
少量的、准确的。也就是说,在这些领域给读者提供推送服务,不仅需要推送的内容主题相
似,还需要考虑读者水平、内容层次在指定范围内的匹配,才能给读者提供基于兴趣的、更
准确的内容推送服务。例如:向科研人员应该推送中、高级科研内容,他们对新闻报告或教
学类文献没有兴趣。因此,这些常用的个性化推送技术在在线学习、文献检索领域使用效果
不好。

发明内容

针对上述问题,本发明提出一种基于读者层次的内容推送方法。该方法分为两个阶段,
第一是读者层次模型训练阶段,第二是内容推送阶段。

在训练阶段,根据应用领域的实际情况,将读者按水平或类型分层次,得到读者层次向
量,读者设计多少层次,由应用复杂性和资源加工复杂性决定;制订读者层次推送策略,既
根据什么原则向某层次读者推送相关内容;建立读者层次模型,对应每一层次读者,涉及包
括:资源层次、资源类型、出版太阳城集团、语种、其他太阳城集团5类参数向量,这些向量维度上的值
都来自基于资源库知识的训练,用于描述该层次读者在这些方面的特征;建设足够数量的训
练集,对读者层次模型进行训练,得到模型各维度参数向量的特征值。

在推送阶段,实际使用时,记录读者一定时期的实际操作太阳城集团,主要是读者使用过的资
源列表;根据读者所使用资源的元数据太阳城集团,计算出该读者的5类层次参数向量;基于读者
的层次参数,通过读者层次模型进行机器学习,得到预测的读者层次;读者后续使用时,基
于传统的内容相似性比较以及读者层次和推送策略,向读者推送少量的精准内容;根据读者
对推送内容的反映,不断优化推送策略。

附图说明

图1是读者层次模型训练功能流程图

图2是读者层次模型数据结构示意图

图3是基于读者层次的内容推送功能流程图

具体实施方式

下面结合附图对本发明的实施方式进行详细描述。

图1是读者层次模型训练功能流程图。如图1所示,在训练阶段,根据应用领域的实际
情况,读者层次分类11将读者按水平或类型分层次,得到读者层次向量<层次1;层次2...
层次n>,例如将读者分为5个层次,得到层次向量<高级;中高级;中级;中低级;初级>。

建立读者层次推送策略12,针对每层读者,指定推送哪些主要内容,推送数量或比例,
这由具体应用领域和应用经验确定。例如,在书法数字化学习领域,对于高级学习者,重点
推荐书法类期刊文献、相关作品鉴赏、书法大赛太阳城集团;对于初级书法学习者,可以重点推荐
相关书法学习视频、书法家介绍、书法故事,每项推送1-3条。

建立读者层次模型15,如图2所示。对应每一层次读者,建立包括:资源层次21、资源
类型22、出版太阳城集团23、语种24、其他太阳城集团25共5类层次参数向量,这些维度上的值都来自
基于资源库知识的训练结果。

建设足够数量的训练集14,对读者层次模型进行训练13,得到图2所示5类层次参数向
量各维度的特征值。

图3是基于读者层次的内容推送功能流程图。如图3所示,实际使用时,记录读者一定
时期的实际操作太阳城集团31,主要是学习使用了哪些资源,形成资源列表;根据读者所使用资源
的元数据太阳城集团,计算出该读者的层次参数32,包括资源层次、资源类型、出版太阳城集团、语种、
其他太阳城集团5类参数,向量数据结构如图2所示,每部分对应该读者使用资源形成的权重向量,
权重进行归一化处理。

基于读者的层次参数,采用读者层次模型进行机器学习33,得到预测的读者层次,例如
为高级读者。

在读者继续发出检索请求或者阅读某篇内容时,基于传统的内容相似性比较,得到大量
符合内容相似性要求的候选推荐结果,结合读者层次以及该层次的推送策略34,选择同时符
合推送策略的、少量的精准内容35,推送给读者,而不是完全按照内容相似性结果进行推送;
读者对推送结果如果有兴趣,会点击使用,如果没有兴趣,会忽略,通过读者对推送内容的
反映,定期优化推送策略36。

由于推送时充分考虑了读者个人在学习体系中所处的层次和水平,以及基于全体同层次
学习者共同遵循的推送策略,向读者推送的少量内容,准确性更高,读者体验更好。

本方法中机器学习33实现对读者层次的预测,它是基于读者层次模型的知识,采用多维
度向量内积,加权求和,取最大值对应的读者层次作为预测的读者层次,计算公式如下所示:

C = max i = 1 n Σ j = 1 5 k j · P j · C ij ]]>

其中:为当前读者第j部分的层次参数向量,j从1到5代表共有5部分参数,包括
资源层次、资源类型、出版太阳城集团、语种、其他太阳城集团;

是指读者层次模型中第i类读者第j部分的参数向量,这些向量在训练时确定;

kj是向量权重因子,

n为读者层次数,C为n类读者中层次向量权重最大类型对应的读者层次号。

在上述内容中,所有向量都需要进行归一化权重处理,确保进行基于相同度量上的向量
运算具有可比性。

虽然本发明所揭露的实施方式如上,但所述的内容只是为了便于理解本发明而采用的实
施方式,并非用以限定本发明。任何本发明所属技术领域内的技术人员,在不脱离本发明所揭
露的精神和范围的前提下,可以在实施的形式上及细节上作任何的修改与变化,但本发明的专
利保护范围,仍须以所附的权利要求书所界定的范围为准。

关 键 词:
一种 基于 读者 层次 内容 推送 方法
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
太阳城集团本文
本文标题:一种基于读者层次的内容推送方法.pdf
链接地址:http://zh228.com/p-6401718.html
太阳城集团我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
葡京赌场|welcome document.write ('');