著录项信息
专利名称 | 信息推送的方法和装置 |
申请号 | CN201210427789.X | 申请日期 | 2012-10-31 |
法律状态 | 授权 | 申报国家 | 暂无 |
公开/公告日 | 2014-05-14 | 公开/公告号 | CN103793419A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 深圳市世纪光速信息技术有限公司 | 申请人地址 | 广东省深圳市南山区粤海街道科技中一路腾讯大厦16层
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 深圳市世纪光速信息技术有限公司 | 当前权利人 | 深圳市世纪光速信息技术有限公司 |
发明人 | 程刚;李鹤;潘璇;庄子明 |
代理机构 | 北京三高永信知识产权代理有限责任公司 | 代理人 | 罗振安 |
摘要
本发明公开了一种信息推送的方法和装置,属于互联网技术领域。所述方法包括:获取用户对当前书籍的历史行为数据,其中,所述历史行为数据包括:所述用户购买书籍的数据、所述用户搜索书籍的数据和所述用户在线阅读书籍的数据;根据所述用户的历史行为数据分别计算所述当前书籍的流行度分数和所述用户对预设标签的喜好度;根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍。本发明通过对用户历史行为数据的分析进行个性化推荐,其中不需要人工编辑,提高了门户网站的推荐效率。
1.一种信息推荐的方法,其特征在于,所述方法包括:
获取用户对当前书籍的历史行为数据,其中,所述历史行为数据包括:所述用户购买书籍的数据、所述用户搜索书籍的数据和所述用户在线阅读书籍的数据;
根据所述用户的历史行为数据分别计算所述当前书籍的流行度分数和所述用户对预设标签的喜好度,其中,所述预设标签是指所述用户在历史上感兴趣的书籍对应的标签中的每一类标签;
根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍;
根据所述用户的历史行为数据计算所述用户对预设标签的喜好度,包括:
根据所述用户的历史行为数据得到所述用户在历史上感兴趣的书籍的标签和所述用户在历史上不感兴趣的书籍的标签;
分别统计所述用户在历史上感兴趣的书籍的标签中预设标签出现的次数和所述用户在历史上不感兴趣的书籍的标签中所述预设标签出现的次数;
根据所述用户在历史上感兴趣的书籍的标签中预设标签出现的次数和所述用户在历史上不感兴趣的书籍的标签中所述预设标签出现的次数,分别得到所述用户在历史上感兴趣的书籍中带有所述预设标签的概率和所述用户在历史上不感兴趣的书籍中带有所述预设标签的概率;
根据贝叶斯公式对所述用户在历史上感兴趣的书籍中带有所述预设标签的概率和所述用户在历史上不感兴趣的书籍中带有所述预设标签的概率进行计算,得到所述用户对所述预设标签的喜好度。
2.根据权利要求1所述的方法,其特征在于,所述根据所述用户的历史行为数据计算所述当前书籍的流行度分数,包括:
根据所述用户购买书籍的数据,分别计算所述用户的购买密度和所述用户的购买热度;
根据所述用户搜索书籍的数据,分别计算所述用户的搜索密度和所述用户的搜索热度;
根据所述用户在线阅读书籍的数据,分别计算所述用户的阅读密度和所述用户的阅读热度;
根据所述用户的购买密度和所述用户的购买热度、所述用户的搜索密度和所述用户的搜索热度及所述用户的阅读密度和所述用户的阅读热度,计算得到所述书籍的流行度分数。
3.根据权利要求1所述的方法,其特征在于,所述根据所述用户的历史行为数据计算所述当前书籍的流行度分数之后,还包括:
按照所述当前书籍的流行度分数的大小对所述当前书籍进行排序,得到所述当前书籍的热门榜单。
4.根据权利要求1所述的方法,其特征在于,所述根据所述用户的历史行为数据计算所述用户对预设标签的喜好度,包括:
根据所述用户的历史行为数据统计所述用户在历史上感兴趣的书籍的名称;
根据所述用户在历史上感兴趣的书籍的名称,得到所述用户在历史上感兴趣的书籍的标签;
分别统计所述用户在历史上感兴趣的书籍的总的标签数量和所标签中预设标签出现的次数;
根据所述预设标签出现的次数和所述总的标签数量,计算所述用户对所述预设标签的喜好度。
5.根据权利要求4所述的方法,其特征在于,所述根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍,包括:
将所述当前书籍的标签与所述预设标签进行匹配,在所述用户对所述预设标签的喜好度中,找到所有包括所述用户对带有所述当前书籍的标签的喜好度;
根据所述当前书籍的流行度分数和所述所有包括所述用户对带有所述当前书籍的标签的喜好度,得到对所述当前书籍的推荐分数;
根据所述当前书籍的推荐分数,得到推荐给所述用户的书籍。
6.根据权利要求1所述的方法,其特征在于,所述根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍,包括:
将所述当前书籍的标签与所述预设标签进行匹配,在所述用户对所述预设标签的喜好度中,找到所有包括所述用户对带有所述当前书籍的标签的喜好度;
根据所述所有包括所述用户对带有所述当前书籍的标签的喜好度,得到所述用户对所述当前书籍的喜欢概率;
根据所述当前书籍的流行度分数和所述用户对所述当前书籍的喜欢概率,得到对所述当前书籍的推荐分数;
根据所述当前书籍的推荐分数,得到推荐给所述用户的书籍。
7.一种信息推荐的装置,其特征在于,所述装置包括:
获取模块,用于获取用户对当前书籍的历史行为数据,其中,所述历史行为数据包括:
所述用户购买书籍的数据、所述用户搜索书籍的数据和所述用户在线阅读书籍的数据;
计算模块,用于根据所述用户的历史行为数据分别计算所述当前书籍的流行度分数和所述用户对预设标签的喜好度,其中,所述预设标签是指所述用户在历史上感兴趣的书籍对应的标签中的每一类标签;
所述计算模块包括第四统计单元、第五统计单元、第六计算单元和第七计算单元;
所述第四统计单元,用于根据所述用户的历史行为数据得到所述用户在历史上感兴趣的书籍的标签和所述用户在历史上不感兴趣的书籍的标签;
所述第五统计单元,用于分别统计所述用户在历史上感兴趣的书籍的标签中预设标签出现的次数和所述用户在历史上不感兴趣的书籍的标签中所述预设标签出现的次数;
所述第六计算单元,用于根据所述用户在历史上感兴趣的书籍的标签中预设标签出现的次数和所述用户在历史上不感兴趣的书籍的标签中所述预设标签出现的次数,分别得到所述用户在历史上感兴趣的书籍中带有所述预设标签的概率和所述用户在历史上不感兴趣的书籍中带有所述预设标签的概率;
所述第七计算单元,用于根据贝叶斯公式对所述用户在历史上感兴趣的书籍中带有所述预设标签的概率和所述用户在历史上不感兴趣的书籍中带有所述预设标签的概率进行计算,得到所述用户对所述预设标签的喜好度;
推荐模块,用于根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍。
8.根据权利要求7所述的装置,其特征在于,所述计算模块,包括:
第一计算单元,用于根据所述用户购买书籍的数据,分别计算所述用户的购买密度和所述用户的购买热度;
第二计算单元,用于根据所述用户搜索书籍的数据,分别计算所述用户的搜索密度和所述用户的搜索热度;
第三计算单元,用于根据所述用户在线阅读书籍的数据,分别计算所述用户的阅读密度和所述用户的阅读热度;
第四计算单元,用于根据所述用户的购买密度和所述用户的购买热度、所述用户的搜索密度和所述用户的搜索热度及所述用户的阅读密度和所述用户的阅读热度,计算得到所述书籍的流行度分数。
9.根据权利要求7所述的装置,其特征在于,所述装置还包括:
排序模块,用于在所述计算模块根据所述用户的历史行为数据计算所述当前书籍的流行度分数之后,按照所述当前书籍的流行度分数的大小对所述当前书籍进行排序,得到所述当前书籍的热门榜单。
10.根据权利要求7所述的装置,其特征在于,所述计算模块,包括:
第一统计单元,用于根据所述用户的历史行为数据统计所述用户在历史上感兴趣的书籍的名称;
第二统计单元,用于根据所述用户在历史上感兴趣的书籍的名称,得到对应所述用户在历史上感兴趣的书籍的标签;
第三统计单元,用于分别统计对应所述用户在历史上感兴趣的书籍的总的标签数量和所标签中预设标签出现的次数;
第五计算单元,用于根据所述预设标签出现的次数和所述总的标签数量,计算所述用户对所述预设标签的喜好度。
11.根据权利要求10所述的装置,其特征在于,所述推荐模块,包括:
第一获取模块,用于将所述当前书籍的标签与所述预设标签进行匹配,在所述用户对所述预设标签的喜好度中,找到所有包括所述用户对带有所述当前书籍的标签的喜好度;
第一计算单元,用于根据所述当前书籍的流行度分数和所述所有包括所述用户对带有所述当前书籍的标签的喜好度,得到对所述当前书籍的推荐分数;
第一推荐单元,用于根据所述当前书籍的推荐分数,得到推荐给所述用户的书籍。
12.根据权利要求7所述的装置,其特征在于,所述推荐模块,包括:
第二获取单元,用于将所述当前书籍的标签与所述预设标签进行匹配,在所述用户对所述预设标签的喜好度中,找到所有包括所述用户对带有所述当前书籍的标签的喜好度;
第二计算单元,用于根据所述所有包括所述用户对带有所述当前书籍的标签的喜好度,得到所述用户对所述当前书籍的喜欢概率;
第三计算单元,用于根据所述当前书籍的流行度分数和所述用户对所述当前书籍的喜欢概率,得到对所述当前书籍的推荐分数;
第二推荐单元,用于根据所述当前书籍的推荐分数,得到推荐给所述用户的书籍。
信息推送的方法和装置\n技术领域\n[0001] 本发明涉及互联网领域,特别涉及一种信息推送的方法和装置。\n背景技术\n[0002] 随着互联网的发展,出现了越来越多的图书门户网站,阅读爱好者不需要花费时间和精力去图书馆购买书籍,在网上就能够方便阅读。由于网上阅读的方便性,选择在网上阅读书籍的用户越来越多。但是怎样获得符合用户兴趣爱好的书籍,以便将用户感兴趣的书籍推荐给用户,是所有图书门户网站需要解决的问题。\n[0003] 现有技术中,多数门户网站靠人工统计不同用户的兴趣爱好,从而通过人工编辑推荐给用户可能喜欢的书籍。\n[0004] 但是现有技术中通过人工编辑的做法耗费人力资源较大,并且在热门书籍发现的准确性和及时性上较差,导致为用户推荐书籍的效率比较低。\n发明内容\n[0005] 为了提高门户网站推荐的效率,本发明实施例提供了一种信息推送的方法和装置。所述技术方案如下:\n[0006] 一方面,提供了一种信息推荐的方法,所述方法包括:\n[0007] 获取用户对当前书籍的历史行为数据,其中,所述历史行为数据包括:所述用户购买书籍的数据、所述用户搜索书籍的数据和所述用户在线阅读书籍的数据;\n[0008] 根据所述用户的历史行为数据分别计算所述当前书籍的流行度分数和所述用户对预设标签的喜好度,其中,所述预设标签是指所述用户在历史上感兴趣的书籍对应的标签中的每一类标签;\n[0009] 根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍。\n[0010] 另一方面,提供了一种信息推荐的装置,所述装置包括:\n[0011] 获取模块,用于获取用户对当前书籍的历史行为数据,其中,所述历史行为数据包括:所述用户购买书籍的数据、所述用户搜索书籍的数据和所述用户在线阅读书籍的数据;\n[0012] 计算模块,用于根据所述用户的历史行为数据分别计算所述当前书籍的流行度分数和所述用户对预设标签的喜好度,其中,所述预设标签是指所述用户在历史上感兴趣的书籍对应的标签中的每一类标签;\n[0013] 推荐模块,用于根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍。\n[0014] 本发明实施例提供的技术方案带来的有益效果是:获取用户对当前书籍的历史行为数据,其中,所述历史行为数据包括:所述用户购买书籍的数据、所述用户搜索书籍的数据和所述用户在线阅读书籍的数据;根据所述用户的历史行为数据分别计算所述当前书籍的流行度分数和所述用户对预设标签的喜好度;根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍。从而通过对用户历史行为数据的分析进行个性化推荐,其中不需要人工编辑,提高了门户网站的推荐效率。\n附图说明\n[0015] 为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。\n[0016] 图1是本发明实施例一中提供的一种信息推荐的方法流程图;\n[0017] 图2是本发明实施例二中提供的一种信息推荐的方法流程图;\n[0018] 图3是本发明实施例三中提供的一种信息推荐的装置结构示意图;\n[0019] 图4是本发明实施例三中提供的另一种信息推荐的装置结构示意图。\n具体实施方式\n[0020] 为使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明实施方式作进一步地详细描述。\n[0021] 实施例一\n[0022] 参见图1,本实施例中提供了一种信息推荐的方法,包括:\n[0023] 101、获取用户对当前书籍的历史行为数据,其中,所述历史行为数据包括:所述用户购买书籍的数据、所述用户搜索书籍的数据和所述用户在线阅读书籍的数据;\n[0024] 102、根据所述用户的历史行为数据分别计算所述当前书籍的流行度分数和所述用户对预设标签的喜好度,其中,所述预设标签是指所述用户在历史上感兴趣的书籍对应的标签中的每一类标签;\n[0025] 103、根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍。\n[0026] 其中,所述根据所述用户的历史行为数据计算所述当前书籍的流行度分数,包括:\n[0027] 根据所述用户购买书籍的数据,分别计算所述用户的购买密度和所述用户的购买热度;\n[0028] 根据所述用户搜索书籍的数据,分别计算所述用户的搜索密度和所述用户的搜索热度;\n[0029] 根据所述用户在线阅读书籍的数据,分别计算所述用户的阅读密度和所述用户的阅读热度;\n[0030] 根据所述用户的购买密度和所述用户的购买热度、所述用户的搜索密度和所述用户的搜索热度及所述用户的阅读密度和所述用户的阅读热度,计算得到所述书籍的流行度分数。\n[0031] 可选地,所述根据所述用户的历史行为数据计算所述当前书籍的流行度分数之后,还包括:\n[0032] 按照所述当前书籍的流行度分数的大小对所述当前书籍进行排序,得到所述当前书籍的热门榜单。\n[0033] 可选地,所述根据所述用户的历史行为数据计算所述用户对预设标签的喜好度,包括:\n[0034] 根据所述用户的历史行为数据统计所述用户在历史上感兴趣的书籍的名称;\n[0035] 根据所述用户在历史上感兴趣的书籍的名称,得到对应所述用户在历史上感兴趣的书籍的标签;\n[0036] 分别统计对应所述用户在历史上感兴趣的书籍的总的标签数量和所标签中预设标签出现的次数;\n[0037] 根据所述预设标签出现的次数和所述总的标签数量,计算所述用户对所述预设标签的喜好度。\n[0038] 相应地,所述根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍,包括:\n[0039] 将所述当前书籍的标签与所述预设标签进行匹配,在所述用户对所述预设标签的喜好度中,找到所有包括所述用户对带有所述当前书籍的标签的喜好度ai;\n[0040] 根据所述当前书籍的流行度分数和所述所有包括所述用户对带有所述当前书籍的标签的喜好度;\n[0041] 根据所述当前书籍的推荐分数,得到推荐给所述用户的书籍。\n[0042] 可选地,所述根据所述用户的历史行为数据计算所述用户对预设标签的喜好度,包括:\n[0043] 根据所述用户的历史行为数据得到所述用户在历史上感兴趣的书籍的标签和所述用户在历史上不感兴趣的书籍的标签;\n[0044] 分别统计所述用户在历史上感兴趣的书籍的标签中预设标签出现的次数和所述用户在历史上不感兴趣的书籍的标签中所述预设标签出现的次数;\n[0045] 根据所述用户在历史上感兴趣的书籍的标签中预设标签出现的次数和所述用户在历史上不感兴趣的书籍的标签中所述预设标签出现的次数,分别得到所述用户在历史上感兴趣的书籍中带有所述预设标签的概率和所述用户在历史上不感兴趣的书籍中带有所述预设标签的概率;\n[0046] 根据贝叶斯公式对所述用户在历史上感兴趣的书籍中带有所述预设标签的概率和所述用户在历史上不感兴趣的书籍中带有所述预设标签的概率进行计算,得到所述用户对所述预设标签的喜好度。\n[0047] 相应地,所述根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍,包括:\n[0048] 将所述当前书籍的标签与所述预设标签进行匹配,在所述用户对所述预设标签的喜好度中,找到所有包括所述用户对带有所述当前书籍的标签的喜好度;\n[0049] 根据所述所有包括所述用户对带有所述当前书籍的标签的喜好度,得到所述用户对所述当前书籍的喜欢概率;\n[0050] 根据所述当前书籍的流行度分数和所述用户对所述当前书籍的喜欢概率,得到对所述当前书籍的推荐分数;\n[0051] 根据所述当前书籍的推荐分数,得到推荐给所述用户的书籍。\n[0052] 本实施例的有益效果是:获取用户对当前书籍的历史行为数据,其中,所述历史行为数据包括:所述用户购买书籍的数据、所述用户搜索书籍的数据和所述用户在线阅读书籍的数据;根据所述用户的历史行为数据分别计算所述当前书籍的流行度分数和所述用户对预设标签的喜好度;根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍。从而通过对用户历史行为数据的分析进行个性化推荐,其中不需要人工编辑,提高了门户网站的推荐效率。\n[0053] 实施例二\n[0054] 本发明实施例提供了一种信息推荐的方法,参见图2,方法流程包括:\n[0055] 201、获取用户对当前书籍的历史行为数据。\n[0056] 本实施例中,当前书籍指当前门户网站上提供的书籍。其中,用户是指门户网站上的任一用户,对此本实施例不做具体限定。用户对当前书籍的历史行为数据包括但不限于:\n用户购买书籍的数据、用户搜索书籍的数据和用户在线阅读书籍的数据等。\n[0057] 此步骤中,对于用户的历史行为数据进行统计,以获取历史行为数据。其中具体的获取的历史行为数据包括但不限于:用户购买、搜索、阅读的时间、书籍的名称以及书籍的数量等。\n[0058] 202、根据用户的历史行为数据计算当前书籍的流行度分数。\n[0059] 本实施例中,热门小说的榜单通过用户的购买、搜索以及在线阅读的数据等进行计算,其中具体的根据用户的历史行为数据计算当前书籍的流行度分数,包括:\n[0060] 1)根据所述用户购买书籍的数据,分别计算所述用户的购买密度By_Intensity(t1)和所述用户的购买热度By_Recency(t1),其中\n其中t1为计算所述购买密度的总的时间量,byi为所述当前书\n籍第i天的购买量,by'为所述当前书籍当日的购买量,τ1为第一预设的折旧因子;\n[0061] 2)根据所述用户搜索书籍的数据,分别计算所述用户的搜索密度QV_Intensity(t2)和所述用户的搜索热度QV_Recency(t2),其中\n其中t2为计算所述阅读密度的总的时间量,qvi为所述当前书\n籍第i天的搜索量,qv'为所述当前书籍当日的搜索量,τ2为第二预设的折旧因子;\n[0062] 3)根据所述用户在线阅读书籍的数据,分别计算所述用户的阅读密度Rd_\nIntensity(t3)和所述用户的阅读热度Rd_Recency(t3),其中\n其中t3为计算所述阅读密度的总的时间量,rdi为所述当前书\n籍第i天的阅读量,r d'为所述当前书籍当日的购买量,τ3为第三预设的折旧因子;\n[0063] 4)根据所述用户的购买密度和所述用户的购买热度、所述用户的搜索密度和所述用户的搜索热度及所述用户的阅读密度和所述用户的阅读热度,计算得到所述书籍的流行度分数Score,其中,Score=W1*By_Recency(t1)α*By_Recency(t1)β+W2*QV_Intensity(t2)α*QV_Recency(t2)β+W3*Rd_Intensity(t3)α*Rd_Recency(t3)β,其中W1、W2、W3为预设的权重参数,均为大于或等于0且小于等于1数,且W1+W2+W3=1;α、β为预设的指数参数,为大于0的数。\n[0064] 本步骤中,综合考虑用户的购买、搜索和在线阅读等数据,并从密度和热度两个方面对不同的数据进行综合评估,从而得到当前书籍的流行度分数,提高了流行度分数的准确性。且可以根据经验值或是根据当前需要调整购买、搜索和在线阅读等数据的权重参数,以保证得到更加可信的流行度分数。其中t1、t2和t3可以是相同的值也可以是不同的值,即统计时间可以是相同的时间也可以是不同的时间段,且τ1、τ2、τ3可以是相同的值也可以是不同的值,对此本实施例不做具体限定。\n[0065] 当然本实施例中上述给出的购买、搜索、阅读的热度和密度的计算公式只是一个示例,并不限定其它计算密度和热度的算法。\n[0066] 本实施例中进一步地,在得到当前书籍的流行度分数之后,还可以进一步地按照所述当前书籍的流行度分数的大小对所述当前书籍进行排序,得到所述当前书籍的热门榜单。\n[0067] 203、根据用户的历史行为数据计算用户对预设标签的喜好度。\n[0068] 本实施例中提供了两种计算用户对预设标签的喜好度的方法,其中一种方法包括:\n[0069] 根据所述用户的历史行为数据统计所述用户在历史上感兴趣的书籍的名称;\n[0070] 根据所述用户在历史上感兴趣的书籍的名称,得到对应所述用户在历史上感兴趣的书籍的标签;\n[0071] 分别统计对应所述用户在历史上感兴趣的书籍的总的标签数量和所述标签中预设标签出现的次数;\n[0072] 根据所述预设标签出现的次数和所述总的标签数量,计算所述用户对所述预设标签的喜好度。\n[0073] 其中用户在历史上感兴趣的书籍包括但不限于:用户购买过的书籍、搜索过的书籍和用户在线阅读过的书籍等。本实施例中,根据用户购买书籍的记录、搜索书籍的记录和在线阅读书籍的记录,获得用户在历史上感兴趣的书籍。\n[0074] 本实施例中书籍对应的标签包括:书籍的分类和书籍的作者等信息,其中一本书籍对应的标签可以有多个。预设标签指用户在历史上感兴趣的书籍对应的标签中的每一类标签。本实施例中如果用户在历史上感兴趣的书籍对应的标签有多个,则需要计算用户对历史上感兴趣的书籍的每类标签的喜好度。\n[0075] 上述算法中按照标签出现的次数进行打分,用某类预设标签出现的次数除以总的标签数量得到用户对带有所述预设标签的书籍的喜好度。如表1所示,用户A在历史上感兴趣的书籍:\n[0076] 表1\n[0077]\n 书籍 标签1 标签2 标签3\n[0078]\n 斗破苍穹 玄幻 \n 锦衣夜行 穿越 历史军事 月关\n 宫 穿越 \n 步步生莲 穿越 历史军事 月关\n 狼神 神话 月关\n[0079] 如表1可知,用户A感兴趣的书对应的标签集合为{玄幻、穿越、历史军事、月关、穿越、穿越、历史军事、月关、神话、月关},在这个集合中,共有10个成员,共包括5类标签,分别为“玄幻”、“穿越”、“神话”、“历史军事”和“月关”。其中3个成员为“月关”,则用户A对“月关”这个标签的喜爱度:3/10=0.3。其它标签类似,计算可得:对带有“玄幻”标签的喜好度:1/10=0.1;对带有“穿越”标签的喜好度:3/10=0.3;对带有“历史军事”标签的喜好度:2/10=0.2;\n对带有“神话”标签的喜好度:1/10=0.1。\n[0080] 可选地,本实施例中提供的另一种计算用户对预设标签的喜好度的方法包括:\n[0081] 根据所述用户的历史行为数据得到所述用户在历史上感兴趣的书籍的标签和所述用户在历史上不感兴趣的书籍的标签;\n[0082] 分别统计所述用户在历史上感兴趣的书籍的标签中预设标签出现的次数和所述用户在历史上不感兴趣的书籍的标签中所述预设标签出现的次数;\n[0083] 根据所述用户在历史上感兴趣的书籍的标签中预设标签出现的次数和所述用户在历史上不感兴趣的书籍的标签中所述预设标签出现的次数,分别得到所述用户在历史上感兴趣的书籍中带有所述预设标签的概率和所述用户在历史上不感兴趣的书籍中带有所述预设标签的概率;\n[0084] 根据贝叶斯公式对所述用户在历史上感兴趣的书籍中带有所述预设标签的概率和所述用户在历史上不感兴趣的书籍中带有所述预设标签的概率进行计算,得到所述用户对所述预设标签的喜好度。\n[0085] 其中,根据所述用户的历史行为数据得到所述用户在历史上感兴趣的书籍的标签和所述用户在历史上不感兴趣的书籍的标签,包括:\n[0086] 根据所述用户的历史行为数据分别统计所述用户在历史上感兴趣的书籍的名称和数量及所述用户不感兴趣的书籍的名称和数量;\n[0087] 根据所述用户在历史上感兴趣的书籍的名称和所述用户不感兴趣的书籍的名称,分别得到所述用户在历史上感兴趣的书籍的标签和所述用户在历史上不感兴趣的书籍的标签。\n[0088] 相应地,根据所述用户在历史上感兴趣的书籍的标签中预设标签出现的次数和所述用户在历史上不感兴趣的书籍的标签中所述预设标签出现的次数,分别得到所述用户在历史上感兴趣的书籍中带有所述预设标签的概率和所述用户在历史上不感兴趣的书籍中带有所述预设标签的概率,包括:\n[0089] 根据所述对应所述用户在历史上感兴趣的书籍的预设标签出现的次数和所述用户在历史上感兴趣的书籍的数量,得到所述用户在历史上感兴趣的书籍中带有所述预设标签的概率;\n[0090] 根据所述对应所述用户在历史上不感兴趣的书籍的预设标签出现的次数和所述用户在历史上不感兴趣的书籍的数量,得到所述用户在历史上不感兴趣的书籍中带有所述预设标签的概率。\n[0091] 第二种计算方法中假设给用户A推荐一本书时,不考虑其它任何因素,那么该书被用户喜欢和不喜欢的概率均为50%。例如,假设推荐给用户A15本书,其中用户A喜欢的数据共有5本,如表1所示,其中带有“穿越”标签的书是3本,带有“历史军事”标签的书是2本,带有“玄幻”标签的书是1本,则:\n[0092] 被用户A喜欢的书中带有“穿越”标签的概率是P(穿越/喜欢)=3/5=0.6;\n[0093] 被用户A喜欢的书中带有“历史军事”标签的概率是P(历史军事/喜欢)=2/5=0.4;\n[0094] 被用户A喜欢的书中带有“玄幻”标签的概率是P(玄幻/喜欢)=1/5=0.2。\n[0095] 假设不被用户A喜欢的书有10本,其中有2本带有“穿越”标签,其中3本带有“历史军事”标签,其中3本带有“玄幻”标签,则:\n[0096] 用户不喜欢的书中带有“穿越”标签的概率是P(穿越/不喜欢)=2/10=0.2;\n[0097] 用户不喜欢的书中带有“历史军事”标签的概率是P(穿越/不喜欢)=3/10=0.3;\n[0098] 用户不喜欢的书中带有“玄幻”标签的概率是P(玄幻/不喜欢)=3/10=0.3。\n[0099] 则根据贝叶斯公式可得:\n[0100] P(喜欢/穿越)=P(穿越/喜欢)/(P(穿越/喜欢)+P(穿越/不喜欢))=0.6/(0.6+0.2)=0.75;\n[0101] P(喜欢/历史军事)=P(历史军事/喜欢)/(P(历史军事/喜欢)+P(历史军事/不喜欢))=0.4/(0.4+0.2)=0.67;\n[0102] P(喜欢/玄幻)=P(玄幻/喜欢)/(P(玄幻/喜欢)+P(玄幻/不喜欢))=0.2/(0.2+0.3)=0.4。从而得到用户A对预设标签的喜欢概率。\n[0103] 204、根据当前书籍的标签、当前数据的流行度分数和用户对预设标签的喜好度,得到推荐给用户的书籍。\n[0104] 本实施例中,分别计算每本书籍的推荐分数,根据每本书籍的推荐分数高低决定是否向用户推荐该书。具体的,对应步骤203中的两种算法,计算推荐分数的方法也有所不同。其中,对应第一种计算方法根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍,包括:\n[0105] 将所述当前书籍的标签与所述预设标签进行匹配,在所述用户对所述预设标签的喜好度中,找到所有包括所述用户对带有所述当前书籍的标签的喜好度ai;\n[0106] 根据公式 得到对所述当前书籍的推荐分数,其中score为所述当前\n书籍的流行度分数;\n[0107] 根据所述当前书籍的推荐分数,得到推荐给所述用户的书籍。\n[0108] 为使本领域技术人员能够更清楚的理解第一种推荐分数的算法,现做如下说明:\n[0109] 例如,热门榜单上有两本书,一本《中华再起》,标签:穿越、历史军事、中华杨,其流行度分数score=1000;一本《佛本是道》,标签:玄幻、梦入神机,其score=2000。\n[0110] 则根据步骤203中第一种方法计算得到的用户对预设标签的喜好度为:用户A的喜好度:a穿越=0.3,a历史军事=0.2,a玄幻=0.1,将上述值代入 中,得到此两本书的推荐分数分别为:\n[0111] L_score(《中华再起》)=1000*(0.3+0.2)=500;\n[0112] L_score(《佛本是道》)=2000*0.1=200。\n[0113] 有上述分数可知对用户A进行推荐时,由于《中华再起》的标签和用户A的标签更相符,被喜爱分数L_score更高,因此《中华再起》优先于《佛本是道》被推荐。\n[0114] 其中,对应步骤203中的第二种计算方法,根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍,包括:\n[0115] 将所述当前书籍的标签与所述预设标签进行匹配,在所述用户对所述预设标签的喜好度中,找到所有包括所述用户对带有所述当前书籍的标签的喜好度;\n[0116] 根据所述所有包括所述用户对带有所述当前书籍的标签的喜好度,得到所述用户对所述当前书籍的喜欢概率P(s);\n[0117] 根据公式score*P(S),得到对所述当前书籍的推荐分数,其中score为所述当前书籍的流行度分数;\n[0118] 根据所述当前书籍的推荐分数,得到推荐给所述用户的书籍。\n[0119] 为使本领域技术人员能够更清楚的理解第二种推荐分数的算法,现做如下说明:\n[0120] 如上所述热门榜单上的两本书,《中华再起》,标签:穿越、历史军事、中华杨,其流行度分数score=1000;《佛本是道》,标签:玄幻、梦入神机,其score=2000。根据《中华再起》和《佛本是道》两本书的标签,找到步骤203的第二种计算中得到的包括穿越、历史军事和玄幻的喜好度,则得到用户A的喜好度:\n[0121] p穿越=0.75,p历史军事=0.67,p玄幻=0.40;\n[0122] 则进一步计算用户A对带有上述两本书的标签的喜欢概率和不喜欢概率为:\n[0123] P(喜欢|穿越,历史军事)=P(喜欢|穿越)*P(喜欢/历史军事)*P(喜欢)=0.75*\n0.67*0.5=0.25;\n[0124] P(喜欢|玄幻)=P(喜欢|玄幻)*P(喜欢)=0.2;\n[0125] P(不喜欢|穿越,历史军事)=(1-P(喜欢|穿越))*(1-P(喜欢/历史军事))*P(不喜欢)=0.25*0.33*0.5=0.04;\n[0126] P(不喜欢|玄幻)=(1-P(喜欢|玄幻))*P(不喜欢)=0.6*0.5=0.3。\n[0127] 通过上述计算可知,对任意一本书籍,如果带有“穿越”,“历史军事”标签则被用户A喜爱概率为:\n[0128] P(s1)=P(喜欢|穿越,历史军事)/(P(喜欢|穿越,历史军事)+P(不喜欢|穿越,历史军事))=0.25/(0.25+0.04)=0.86;\n[0129] 对任意一本书籍,如果带有“玄幻”标签则被用户A喜爱概率为:\n[0130] P(s2)=P(喜欢|玄幻)/(P(喜欢|玄幻)+P(不喜欢|玄幻))=0.2/(0.2+0.3)=0.4;\n[0131] 则根据用户对带有“玄幻”和“穿越”,“历史军事”的喜欢概率,进行计算得到:\n[0132] L_score(《中华再起》)=1000*0.86=860;\n[0133] L_score(《佛本是道》)=2000*0.4=800。\n[0134] 则对用户A进行推荐时,由于860(《中华再起》的被喜爱分数)>800(《佛本是道》的被喜爱分数),因此《中华再起》优先于《佛本是道》被推荐。\n[0135] 由上述两种计算方法可知,虽然最后得到的推荐分数不同,但是最后的推荐结果是一样的,所以在具体执行过程中,选择上述哪两种算法进行计算都可以,对此本实施例不做具体限定。\n[0136] 本实施例的有益效果是:获取用户对当前书籍的历史行为数据,其中,所述历史行为数据包括:所述用户购买书籍的数据、所述用户搜索书籍的数据和所述用户在线阅读书籍的数据;根据所述用户的历史行为数据分别计算所述当前书籍的流行度分数和所述用户对预设标签的喜好度;根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍。从而通过对用户历史行为数据的分析进行个性化推荐,其中不需要人工编辑,提高了门户网站的推荐效率。且通过流行度分数的高低,能够快速挖掘出热门书籍,进一步提高了门户网站的推荐效率。\n[0137] 实施例三\n[0138] 参见图3,本发明实施例提供了一种信息推荐的装置,所述装置包括:获取模块\n301,计算模块302和推荐模块303。\n[0139] 获取模块301,用于获取用户对当前书籍的历史行为数据,其中,所述历史行为数据包括:所述用户购买书籍的数据、所述用户搜索书籍的数据和所述用户在线阅读书籍的数据;\n[0140] 计算模块302,用于根据所述用户的历史行为数据分别计算所述当前书籍的流行度分数和所述用户对预设标签的喜好度,其中所述预设标签是指所述用户在历史上感兴趣的书籍对应的标签中的每一类标签;\n[0141] 推荐模块303,用于根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍。\n[0142] 其中,参见图4,所述计算模块302,包括:\n[0143] 第一计算单元302a,用于根据所述用户购买书籍的数据,分别计算所述用户的购买密度和所述用户的购买热度;\n[0144] 第二计算单元302b,用于根据所述用户搜索书籍的数据,分别计算所述用户的搜索密度和所述用户的搜索热度;\n[0145] 第三计算单元302c,用于根据所述用户在线阅读书籍的数据,分别计算所述用户的阅读密度和所述用户的阅读热度;\n[0146] 第四计算单元302d,用于根据所述用户的购买密度和所述用户的购买热度、所述用户的搜索密度和所述用户的搜索热度及所述用户的阅读密度和所述用户的阅读热度,计算得到所述书籍的流行度分数。\n[0147] 可选地,参见图4,所述装置还包括:\n[0148] 排序模块304,用于在所述计算模块根据所述用户的历史行为数据计算所述当前书籍的流行度分数之后,按照所述当前书籍的流行度分数的大小对所述当前书籍进行排序,得到所述当前书籍的热门榜单。\n[0149] 可选地,参见图4,所述计算模块302,包括:\n[0150] 第一统计单元302e,用于根据所述用户的历史行为数据统计所述用户在历史上感兴趣的书籍的名称;\n[0151] 第二统计单元302f,用于根据所述用户在历史上感兴趣的书籍的名称,得到对应所述用户在历史上感兴趣的书籍的标签;\n[0152] 第三统计单元302g,用于分别统计对应所述用户在历史上感兴趣的书籍的总的标签数量和所标签中预设标签出现的次数;\n[0153] 第五计算单元302h,用于根据所述预设标签出现的次数和所述总的标签数量,计算所述用户对所述预设标签的喜好度。\n[0154] 对应上述计算模块,参见图4,所述推荐模块303,包括:\n[0155] 第一获取模块303a,用于将所述当前书籍的标签与所述预设标签进行匹配,在所述用户对所述预设标签的喜好度中,找到所有包括所述用户对带有所述当前书籍的标签的喜好度;\n[0156] 第一计算单元303b,用于根据所述当前书籍的流行度分数和所述所有包括所述用户对带有所述当前书籍的标签的喜好度,得到对所述当前书籍的推荐分数;\n[0157] 第一推荐单元303c,用于根据所述当前书籍的推荐分数,得到推荐给所述用户的书籍。\n[0158] 可选地,参见图4,所述计算模块302,包括:\n[0159] 第四统计单元302e',用于根据所述用户的历史行为数据得到所述用户在历史上感兴趣的书籍的标签和所述用户在历史上不感兴趣的书籍的标签;\n[0160] 第五统计单元302f′,用于分别统计所述用户在历史上感兴趣的书籍的标签中预设标签出现的次数和所述用户在历史上不感兴趣的书籍的标签中所述预设标签出现的次数;\n[0161] 第六计算单元302g',用于根据所述用户在历史上感兴趣的书籍的标签中预设标签出现的次数和所述用户在历史上不感兴趣的书籍的标签中所述预设标签出现的次数,分别得到所述用户在历史上感兴趣的书籍中带有所述预设标签的概率和所述用户在历史上不感兴趣的书籍中带有所述预设标签的概率;\n[0162] 第七计算单元302h',用于根据贝叶斯公式对所述用户在历史上感兴趣的书籍中带有所述预设标签的概率和所述用户在历史上不感兴趣的书籍中带有所述预设标签的概率进行计算,得到所述用户对所述预设标签的喜好度。\n[0163] 对应上述计算模块,参见图4,所述推荐模块303,包括:\n[0164] 第二获取单元303a',用于将所述当前书籍的标签与所述预设标签进行匹配,在所述用户对所述预设标签的喜好度中,找到所有包括所述用户对带有所述当前书籍的标签的喜好度;\n[0165] 第二计算单元303b',用于根据所述所有包括所述用户对带有所述当前书籍的标签的喜好度,得到所述用户对所述当前书籍的喜欢概率;\n[0166] 第三计算单元303c',用于根据所述当前书籍的流行度分数和所述用户对所述当前书籍的喜欢概率,得到对所述当前书籍的推荐分数;\n[0167] 第二推荐单元303d',用于根据所述当前书籍的推荐分数,得到推荐给所述用户的书籍。\n[0168] 本实施例的有益效果是:获取用户对当前书籍的历史行为数据,其中,所述历史行为数据包括:所述用户购买书籍的数据、所述用户搜索书籍的数据和所述用户在线阅读书籍的数据;根据所述用户的历史行为数据分别计算所述当前书籍的流行度分数和所述用户对预设标签的喜好度;根据所述当前书籍的标签、所述当前书籍的流行度分数和所述用户对所述预设标签的喜好度,得到推荐给所述用户的书籍。从而通过对用户历史行为数据的分析进行个性化推荐,其中不需要人工编辑,提高了门户网站的推荐效率。\n[0169] 需要说明的是:上述实施例中提供的信息推送的装置,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将装置的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。\n[0170] 另外,上述实施例中提供的信息推送的装置与信息推送的方法实施例属于同一构思,其具体实现过程详见方法实施例,这里不再赘述。\n[0171] 上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。\n[0172] 本领域普通技术人员可以理解实现上述实施例的全部或部分步骤可以通过硬件来完成,也可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,上述提到的存储介质可以是只读存储器,磁盘或光盘等。\n[0173] 以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
法律信息
- 2018-05-22
- 2015-10-07
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201210427789.X
申请日: 2012.10.31
- 2014-05-14
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2012-04-11
|
2010-09-21
| | |
2
| |
2012-08-15
|
2011-02-14
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |