著录项信息
专利名称 | 关联知识的推送方法和装置 |
申请号 | CN201310031404.2 | 申请日期 | 2013-01-28 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2014-08-06 | 公开/公告号 | CN103970753A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 北大方正集团有限公司;方正信息产业控股有限公司;北京北大方正电子有限公司 | 申请人地址 | 北京市海淀区成府路298号方正大厦5层
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 北大方正集团有限公司,方正信息产业控股有限公司,北京北大方正电子有限公司 | 当前权利人 | 北大方正集团有限公司,方正信息产业控股有限公司,北京北大方正电子有限公司 |
发明人 | 陈长刚;百华睿 |
代理机构 | 北京英赛嘉华知识产权代理有限责任公司 | 代理人 | 王达佐 |
摘要
本发明提供了一种关联知识的推送方法,包括:当用户访问资源时,确定用户的身份信息;在资源中检索具有与用户的身份信息一致的身份信息的知识;将检索到的知识中的具有最高权重的知识推送给用户。本发明还提供了一种关联知识的推送装置,包括:身份模块,用于当用户访问资源时,确定用户的身份信息;检索模块,用于在资源中检索具有与用户的身份信息一致的身份信息的知识;推送模块,用于将检索到的知识中的具有最高权重的知识推送给用户。本发明提高了用户体验。
1.一种关联知识的推送方法,其特征在于,包括:
当用户访问资源时,确定所述用户的身份信息;
在所述资源中检索具有与所述用户的身份信息一致的身份信息的知识;
将检索到的知识中的具有最高权重的知识推送给所述用户;
当所述资源中的知识被访问时,记录关于访问的身份信息和行为信息;
对于各个所述知识,根据其记录的所述身份信息和所述行为信息设置其权重Wj=f(a,t),其中,以所述知识的ID遍历各个所述知识,j是指当前遍历的知识根据其用户的ID所关联属性信息所属的类别,Wj是指当前遍历的知识对于j的权重,a是指当前遍历的知识的行为类别的权值,各种行为类别具有相应的权值,t是设置的时间段,f(a,t)对于a是求和,对于t是发生时间越新,则使a的权重越大。
2.根据权利要求1所述的方法,其特征在于,记录关于访问的身份信息和行为信息包括:
记录访问所述知识的用户的ID,所述ID关联到预先登记的所述用户的属性信息,所述属性信息包括以下至少一项:职业、所属机构和教育程度;
记录所述访问的行为类型,所述类型包括以下至少一种:浏览、收藏、下载和购买;
记录所述访问的发生时间;
记录所访问知识的ID。
3.根据权利要求1所述的方法,其特征在于,设置:
f(a,t)=a浏览*l+a收藏*n+a下载*x+a购买*y;
l、n、x、y分别代表在设置时间t内的浏览、收藏、下载、购买的次数;
或者
li、ni、xi、yi分别代表在设置时间t被分割的时间段i内的浏览、收藏、下载、购买的次数,i是时间段的序号,m为设置时间t被分割的时间段的序号的最大值,时间越远,i越小,时间最远的时间段的i的值为1,p是设置的时间衰减参数,取值为小于1大于0的小数;
a浏览表示浏览行为的权重、a收藏表示收藏行为的权重、a下载表示下载行为的权重、a购买表示购买行为的权重。
4.根据权利要求3所述的方法,其特征在于,设置a浏览≤a收藏≤a下载≤a购买。
5.根据权利要求4所述的方法,其特征在于,设置a浏览:a收藏:a下载:a购买=1:2:2:5;设置p=
0.9。
6.根据权利要求1、3-5任一项所述的方法,其特征在于,在所述资源中检索具有与所述用户的身份信息一致的身份信息的知识包括:
获取所述用户的ID关联的属性信息;
根据所述属性信息确定j的值为q;
在所述资源中检索Wq不为0或空值的知识。
7.根据权利要求6所述的方法,其特征在于,将检索到的知识中的具有最高权重的知识推送给所述用户,包括:
将Wq排序;
将Wq最大的前N个知识推荐给所述用户,其中,N是设置的数量。
8.一种关联知识的推送装置,其特征在于,包括:
身份模块,用于当用户访问资源时,确定所述用户的身份信息;
检索模块,用于在所述资源中检索具有与所述用户的身份信息一致的身份信息的知识;
推送模块,用于将检索到的知识中的具有最高权重的知识推送给所述用户;
记录模块,用于当所述资源中的知识被访问时,记录关于访问的身份信息和行为信息;
权重模块,用于对于各个所述知识,根据其记录的所述身份信息和所述行为信息设置其权重Wj=f(a,t),其中,以所述知识的ID遍历各个所述知识,j是指当前遍历的知识根据其用户的ID所关联属性信息所属的类别,Wj是指当前遍历的知识对于j的权重,a是指当前遍历的知识的行为类别的权值,各种行为类别具有相应的权值,t是设置的时间段,f(a,t)对于a是求和,对于t是发生时间越新,则使a的权重越大。
关联知识的推送方法和装置\n技术领域\n[0001] 本发明涉及信息处理技术领域,具体而言,涉及一种关联知识的推送方法和装置。\n背景技术\n[0002] 为了帮助用户尽快找到所关心的知识,现有的图书系统和互联网网站等采用知识推送的方式主动推送相关的知识给用户。为了实现知识推送,应当预先做好只是关联。目前知识关联主要是基于内容本身的一些元数据属性进行关联,需要前期投入大量的数据加工,投入成本比较高。在进行数据加工时,需要聘请大量专家制定加工规范,制定完毕后还需要请加工人员按照标准进行加工,如:建立期刊文献数据库时,不仅需要对期刊的元数据属性进行加工,同时需要对内容进行深度结构化,例如参考文献,加工一篇文献的工作量都比较大。\n[0003] 除了元数据关联方式外,现在也有部分服务通过分词技术对文献进行分词,通过分词结果构建知识之间的关联,这种方式从一定程度上可以解决部分关联问题,但是关联结果不够准确。\n发明内容\n[0004] 本发明旨在提供关联知识的推送方法和装置,以解决上述的问题。\n[0005] 在本发明的实施例中,提供了一种关联知识的推送方法,包括:当用户访问资源时,确定用户的身份信息;在资源中检索具有与用户的身份信息一致的身份信息的知识;将检索到的知识中的具有最高权重的知识推送给用户。\n[0006] 在本发明的实施例中,提供了一种关联知识的推送装置,包括:身份模块,用于当用户访问资源时,确定用户的身份信息;检索模块,用于在资源中检索具有与用户的身份信息一致的身份信息的知识;推送模块,用于将检索到的知识中的具有最高权重的知识推送给用户。\n[0007] 本发明上述实施例的关联知识的推送方法和装置因为针对用户身份来推送知识,所以克服了现有技术关联不够准确的问题,提高了用户体验。\n附图说明\n[0008] 此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:\n[0009] 图1示出了根据本发明实施例的关联知识的推送方法的流程图;\n[0010] 图2示出了根据本发明实施例的关联知识的推送装置的示意图。\n具体实施方式\n[0011] 下面将参考附图并结合实施例,来详细说明本发明。\n[0012] 图1示出了根据本发明实施例的关联知识的推送方法的流程图,包括:\n[0013] 步骤S10,当用户访问资源时,确定用户的身份信息;\n[0014] 步骤S20,在资源中检索具有与用户的身份信息一致的身份信息的知识;\n[0015] 步骤S30,将检索到的知识中的具有最高权重的知识推送给用户。\n[0016] 现有技术在分析关联知识时没有考虑用户身份,而本方法则根据用户身份信息来推送知识,这可以加强知识与用户的关联,提高用户期望的命中率,提高了用户体验。\n[0017] 优选地,本方法还包括:当资源中的知识被访问时,记录关于访问的身份信息和行为信息;对于各个知识,根据其记录的身份信息和行为信息设置其权重。本优选实施例预先收集了身份信息和行为信息,从而能实现知识与用户的关联,并且能反映不同类型用户的不同行为类型。\n[0018] 优选地,记录关于访问的身份信息和行为信息包括:记录访问知识的用户的ID,ID关联到预先登记的用户的属性信息,属性信息包括以下至少一项:职业、所属机构和教育程度;记录访问的行为类型,类型包括以下至少一种:浏览、收藏、下载和购买;记录访问的发生时间;记录所访问知识的ID。发明人通过大量实验,发现职业、所属机构和教育程度最能反映用户的知识兴趣方向,而浏览、收藏、下载和购买最能反映用户对当前知识感兴趣的程度。本优选实施例以职业、所属机构和教育程度作为身份信息,以浏览、收藏、下载和购买作为行为信息,因此知识的关联效果比较好。\n[0019] 下表是根据本发明优选实施例的一个记录表格:\n[0020]\n字段 字段类型 字段描述\nOP_ID number 主键\nOP_TYPE varchar 行为类型\nOP_DATE date 发生时间\nOP_USERID number 用户ID\nOP_RESOURCEID number 知识ID\n[0021] 可以利用数据库来管理以上记录,其中OP_ID是该记录在数据库中的主键。\n[0022] 优选地,对于各个知识,根据其记录的身份信息和行为信息设置其权重包括:设置Wj=f(a,t),其中,以知识的ID遍历各个知识,j是指当前遍历的知识根据其用户的ID所关联属性信息所属的类别,Wj是指当前遍历的知识对于j的权重,a是指当前遍历的知识的行为类别的权值,各种行为类别具有相应的权值,t是设置的时间段,f(a,t)对于a是求和,对于t是发生时间越新,则使a的权重越大。\n[0023] 可以采用下表记录根据记录的身份信息和行为信息设置的权重:\n[0024]\n字段 字段类型 字段描述\nOP_RESOURCEID NUMBER 知识ID\nWEIGHT NUMBER 知识的权重值Wj\nTYPE VARCHAR J\n[0025] 优选地,f(a,t)=a浏览*l+a收藏*n+a下载*x+a购买*y,其中,l、n、x、y分别代表在设置时间t内的浏览、收藏、下载、购买的次数。a浏览表示浏览行为的权重、a收藏表示收藏行为的权重、a下载表示下载行为的权重、a购买表示购买行为的权重。该表达式比较简单,很容易通过计算机编程来实现。\n[0026] 优选地, 其中,li、\nni、xi、yi分别代表在设置时间t被分割的时间段i内的浏览、收藏、下载、购买的次数,i是时间段的序号,m为设置时间t被分割的时间段的序号的最大值,时间越远,i越小,时间最远的时间段的i的值为1,p是设置的时间衰减参数,取值为小于1大于0的小数。a浏览表示浏览行为的权重、a收藏表示收藏行为的权重、a下载表示下载行为的权重、a购买表示购买行为的权重。该表达式比较简单,很容易通过计算机编程来实现。本优选实施例还考虑了时间衰减的因素。例如设置时间t为1年,时间单位为1个月,则m=12,因为p是小于1大于0的小数,则距今10个月的访问造成的权值将乘以p10的系数,而当月的访问造成的权值将乘以1的系数,即没有衰减。\n[0027] 也可以时间t范围为当前时间到两年前,时间段单位设置为一星期,这两个值都可以进行调整。\n[0028] 优选地,设置a浏览≤a收藏≤a下载≤a购买。发明人根据大量实验发现,浏览、收藏、下载、购买所表示的兴趣是:购买兴趣最大,收藏和下载次之,而浏览兴趣最低,因此设置a浏览≤a收藏≤a下载≤a购买能较好地命中用户感兴趣的知识。\n[0029] 优选地,设置a浏览:a收藏:a下载:a购买=1:2:2:5;设置p=0.9。本优选实施例的数值是发明人经过大量实践后取得的最优数值。\n[0030] 优选地,步骤S20包括:获取用户的ID关联的属性信息;根据属性信息确定j的值为q;在资源中检索Wq不为0或空值的知识。\n[0031] 优选地,将检索到的知识中的具有最高权重的知识推送给用户。包括:将Wq排序;\n将Wq最大的前N个知识推荐给用户,其中,N是设置的数量。\n[0032] 例如将职业为医生,在医院工作,教育程度为硕士以上定义为第1类,即j=1,将职业为学生,在医院工作,教育程度为学士以上定义为第2类,即j=2。有第1类和第2类的用户都访问过知识ID=10000的知识,则对该知识分别设置W1和W2。在当前有用户访问该知识ID=10000的知识时,则先确定当前用户的类别,例如属于第1类,然后检索到W1不为0或空值的知识,并将W1最大的前N条知识,例如N=5条知识推送该用户。\n[0033] 如果检索到的知识的条数大于N,可以从检索到的知识中随机抽取N条,例如推荐系统默认显示最大为10条,那么默认会从权重最高的50条中随机选择10条推荐。\n[0034] 推荐的内容可以采用XML方式进行显示,终端可以根据需要套用相应样式模板显示为最终页面。\n[0035] 图2示出了根据本发明实施例的关联知识的推送装置的示意图,包括:\n[0036] 身份模块10,用于当用户访问资源时,确定用户的身份信息;\n[0037] 检索模块20,用于在资源中检索具有与用户的身份信息一致的身份信息的知识;\n[0038] 推送模块30,用于将检索到的知识中的具有最高权重的知识推送给用户。\n[0039] 本装置提高了用户体验。\n[0040] 优选地,本装置还包括:记录模块,用于当资源中的知识被访问时,记录关于访问的身份信息和行为信息;权重模块,用于对于各个知识,根据其记录的身份信息和行为信息设置其权重。\n[0041] 本发明实施例提供了一种实现知识动态关联的方法及装置,通过该方法及装置可以自动建立知识动态关联,降低人工维护的成本,能够为用户推荐其最可能需要的知识,可以减少用户寻找知识的难度。\n[0042] 显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。\n[0043] 以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
法律信息
- 2020-01-17
未缴年费专利权终止
IPC(主分类): G06F 17/30
专利号: ZL 201310031404.2
申请日: 2013.01.28
授权公告日: 2017.06.20
- 2017-06-20
- 2014-09-03
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201310031404.2
申请日: 2013.01.28
- 2014-08-06
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2012-06-20
|
2011-09-26
| | |
2
| |
2013-01-02
|
2012-08-07
| | |
3
| |
2012-11-28
|
2012-07-11
| | |
4
| |
2012-10-24
|
2012-06-01
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |