著录项信息
专利名称 | 推荐方法及系统 |
申请号 | CN201110213618.2 | 申请日期 | 2011-07-28 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2013-01-30 | 公开/公告号 | CN102902691A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0;;;G;0;6;Q;3;0;/;0;2查看分类表>
|
申请人 | 上海拉手信息技术有限公司 | 申请人地址 | 上海市遵义路100号虹桥上海城A栋1501室
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 上海拉手信息技术有限公司 | 当前权利人 | 上海拉手信息技术有限公司 |
发明人 | 靳简明;沈志勇;熊宇红 |
代理机构 | 北京鼎佳达知识产权代理事务所(普通合伙) | 代理人 | 王伟锋;姚铁 |
摘要
本发明公开了一种推荐方法及系统,其中推荐方法,包括如下步骤:1)计算目标用户对待推荐商品的各属性的喜好度;2)综合目标用户在该商品的各个属性的喜好度得到目标用户对该商品的整体喜好度;3)根据目标用户对待推荐商品的喜好度向所述目标用户推荐相应的商品。为了给新用户以及购买量较小的用户提供更准确的推荐,我们利用贝叶斯分析综合了全体用户的整体倾向和单个用户的个性化倾向。针对新用户和小购买量用户的推荐的优化,有利于提服务质量,节省用户搜索时间。
1.推荐方法,其特征在于,包括如下步骤:
1)计算目标用户对待推荐商品的各属性的喜好度;
2)综合目标用户在该商品的各个属性的喜好度得到目标用户对该商品的整体喜好度;
3)根据目标用户对待推荐商品的喜好度向所述目标用户推荐相应的商品;
其中步骤1)包括:
1-1)根据商品的各个属性的取值特点分别设定各个属性的概率分布;
1-2)根据历史数据确定各个属性的概率分布的参数;
1-3)将待推荐商品的某个属性相对于目标客户在上述概率分布上的概率值作为目标用户对该待推荐商品的该属性的喜好度;
步骤2)是通过线性加权和的方式综合目标用户在待推荐商品的各个属性上的喜好度来得到目标用户在该商品上的整体喜好度,通过公式表示如下:
其中,A1、
A2……Ad表示商品的一组属性值, score(g.Ak,u)表示用户u在商品g的第k个属性上的喜好度得分,wk表示该属性的权重。
2.根据权利要求1所述的推荐方法,其特征在于,所述各个属性的概率分布为正态分布或多项式分布。
3.根据权利要求1所述的推荐方法,其特征在于,所述各个属性的概率分布的参数通过目标用户的历史数据或所有用户的历史数据来确定。
4.根据权利要求1所述的推荐方法,其特征在于,所述各个属性的权重通过经验设置,或者根据历史数据进行优化,或者全部设置成1,表示均衡的权重。
5.根据权利要求1所述的推荐方法,其特征在于,所述商品的属性包括商品描述信息、商品在线销售起止时间、商品价格、商品折扣率、商品配送信息或商家地址信息、商品类别。
6.推荐系统,包括:
(1)用户识别模块:识别登录的用户,以便调用相应的用户信息;
(2)用户信息数据库模块:存储用户信息;
(3)商品信息数据库模块:存储商品信息,包括商品属性信息;
(4)商品喜好度生成模块:根据用户识别模块对用户的识别结果,从用户信息数据库和商品信息库调取相应的信息,计算目标用户对待推荐商品的各属性的喜好度;然后综合目标用户在该商品的各个属性的喜好度得到目标用户在该商品上的整体喜好度;其中计算目标用户对待推荐商品的各属性的喜好度包括如下步骤:
1-1)根据商品的各个属性的取值特点分别设定各个属性的概率分布;
1-2)根据历史数据确定各个属性的概率分布的参数;
1-3)将待推荐商品的某个属性相对于目标客户在上述概率分布上的概率值作为目标用户对该待推荐商品的该属性的喜好度;
通过线性加权和的方式综合目标用户在待推荐商品的各个属性上的喜好度来得到目标用户在该商品上的整体喜好度,通过公式表示如下:
其中,A1、
A2……Ad表示商品的一组属性值, score(g.Ak,u)表示用户u在商品g的第k个属性上的喜好度得分,wk表示该属性的权重;
(5)商品推荐模块:根据目标用户对商品的喜好度进行排序,按排序结果向目标用户推荐相应的商品,将排序结果发送给目标用户。
推荐方法及系统\n技术领域\n[0001] 本发明涉及网络信息检索技术领域,具体地说是一种推荐方法及系统。\n背景技术\n[0002] 随着互联网的普及和电子商务的发展,推荐系统被广泛的应用,成为网络信息检索技术的重要内容。好的推荐系统的应用为用户节省了大量的时间,因为其可以根据推荐系统为其推荐的内容迅速找到自己所需的,而不需要在海量商品或数据中进行大量的搜索而浪费时间。\n[0003] 个性化推荐系统是建立在海量数据挖掘基础上的一种高级商务智能平台,以帮助电子商务网站为其顾客购物提供完全个性化的决策支持和信息服务。购物网站的推荐系统为客户推荐商品,自动完成个性化选择商品的过程,满足客户的个性化需求。\n[0004] 目前的推荐系统使用的方法主要有如下几种:\n[0005] (1)基于关联规则的推荐方法(Association Rule-based Recommendation),是比较传统的方法。基于商品在用户购物车中的共现率进行推荐。由于有的团购商品上线时间较短,因此导致共现信息很少或根本不存在,所以该方法不能适用于团购商品的推荐。\n[0006] (2)基于内容的推荐方法(Content-based Recommendation),内容过滤主要采用自然语言处理、人工智能、概率统计和机器学习等技术进行过滤。\n[0007] 通过相关特征的属性来定义项目或对象,系统基于用户评价对象的特征学习用户的兴趣,依据用户资料与待预测项目的匹配程度进行推荐,努力向客户推荐与其以前喜欢的产品相似的产品。但相似度在计算时缺乏个性化的考虑。\n[0008] (3)协同过滤推荐方法(Collaborative Filtering Recommendation),协同过滤是在信息过滤和信息系统中正迅速成为一项很受欢迎的技术。与传统的基于内容过滤直接分析内容进行推荐不同,协同过滤分析用户兴趣,在用户群中找到指定用户的相似(兴趣)用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户对此信息的喜好程度预测。其缺点是:\n[0009] 1)用户对商品的评价非常稀疏,这样基于用户的评价所得到的用户间的相似性可能不准确(即稀疏性问题);\n[0010] 2)随着用户和商品的增多,系统的性能会越来越低(即可扩展性问题);\n[0011] 3)如果从来没有用户对某一商品加以评价,则这个商品就不可能被推荐(即最初评价问题)。\n[0012] 由此可见,上述现有的推荐系统和方法存在的缺陷最终会影响推荐结果,导致不能完成推荐或推荐不准确。有鉴于上述的推荐系统及方法存在的缺陷,本发明人基于多年丰富的实务经验及专业知识,经过不断的研究、设计,最终创设出一种完善的推荐系统及方法。\n发明内容\n[0013] 为了解决现有技术中存在的上述问题,本发明提供了一种推荐方法。本发明的推荐方法不仅对购买量大的老用户有效,同样也适用于对新用户和购买量较小的用户推荐,具有推荐的准确性高的特点。\n[0014] 为了解决上述技术问题,本发明采用了如下技术方案:\n[0015] 推荐方法,包括:\n[0016] 1)计算目标用户对待推荐商品的各属性的喜好度;\n[0017] 2)综合目标用户在该商品的各个属性的喜好度得到目标用户对该商品的整体喜好度;\n[0018] 3)根据目标用户对待推荐商品的喜好度向所述目标用户推荐相应的商品。\n[0019] 进一步,其中步骤1)包括:\n[0020] 1-1)根据商品的各个属性的取值特点分别设定各个属性的概率分布;\n[0021] 1-2)根据历史数据确定各个属性的概率分布的参数;\n[0022] 1-3)将待推荐商品的某个属性相对于目标客户在上述概率分布上的概率值作为目标用户对该待推荐商品的该属性的喜好度。\n[0023] 进一步,所述各个属性的概率分布为正态分布或多项式分布。\n[0024] 进一步,所述各个属性的概率分布的参数通过目标用户的历史数据或所有用户的历史数据来确定。\n[0025] 进一步,所述步骤2)通过线性加权和的方式综合目标用户在待推荐商品的各个属性上的喜好度来得到目标用户在该商品上的整体喜好度。\n[0026] 进一步,所述各个属性的权重通过经验设置,或者根据历史数据进行优化,或者全部设置成1,表示均衡的权重。\n[0027] 进一步,所述商品的属性包括商品描述信息、商品在线销售起止时间、商品价格、商品折扣率、商品配送信息或商家地址信息、商品类别。\n[0028] 本发明还提供了一种推荐系统,其技术方案如下:\n[0029] 推荐系统,包括:\n[0030] (1)用户识别模块:识别登录的用户,以便调用相应的用户信息;\n[0031] (2)用户信息数据库模块:存储用户信息;\n[0032] (3)商品信息数据库模块:存储商品信息,包括商品属性信息;\n[0033] (4)商品喜好度生成模块:根据用户识别模块对用户的识别结果,从用户信息数据库和商品信息库调取相应的信息,计算目标用户对待推荐商品的各属性的喜好度;然后综合目标用户在该商品的各个属性的喜好度得到目标用户在该商品上的整体喜好度;\n[0034] (5)商品推荐模块:根据目标用户对商品的喜好度进行排序,按排序结果向目标用户推荐相应的商品,将排序结果发送给目标用户。\n[0035] 与现有技术相比,本发明的有益效果在于:\n[0036] (1)本发明的推荐方法和系统能解决商品在线时间短,历史经验少的问题。\n[0037] (2)本发明的推荐方法和系统可以根据用户的要求进行有针对性的推荐。\n[0038] (3)本发明的推荐方法和系统适合给新用户以及购买量较小的用户进行推荐。\n[0039] (4)本发明的推荐方法和系统推荐的准确率高,针对性强,节约了用户的搜索及浏览时间。\n附图说明\n[0040] 图1为本发明的推荐系统的结构示意框图;\n[0041] 图2为本发明的推荐方法的流程图。\n具体实施方式\n[0042] 下面结合附图和具体实施例对本发明作进一步详细描述,但不作为对本发明的限定。\n[0043] 实施例1:\n[0044] 本实施例为本发明的推荐方法的较佳实施例。\n[0045] 推荐方法,包括:\n[0046] 1)计算目标用户对待推荐商品的各属性的喜好度;\n[0047] 2)综合目标用户在该商品的各个属性的喜好度得到目标用户对该商品的整体喜好度;\n[0048] 3)根据目标用户对待推荐商品的喜好度向所述目标用户推荐相应的商品。\n[0049] 进一步,其中步骤1)包括:\n[0050] 1-1)根据商品的各个属性的取值特点分别设定各个属性的概率分布;\n[0051] 1-2)根据历史数据确定各个属性的概率分布的参数;\n[0052] 1-3)将待推荐商品的某个属性相对于目标客户在上述概率分布上的概率值作为目标用户对该待推荐商品的该属性的喜好度。\n[0053] 作为本实施例的一个优选,所述各个属性的概率分布为正态分布或多项式分布。\n[0054] 作为本实施例的一个优选,所述各个属性的概率分布的参数通过目标用户的历史数据或所有用户的历史数据来确定。\n[0055] 作为本实施例的一个优选,步骤2)是通过线性加权和的方式综合目标用户在待推荐商品的各个属性上的喜好度来得到目标用户在该商品上的整体喜好度,通过公式表示如下:\n[0056] Pr ef(u,g)=w1.score(g.A1,u)+w2.score(g.A2,u),…,wd.score(g.Ad,u)其中,A1、A2……Ad表示商品的一组属性值,score(g.Ak,u)表示用户在商品g的第k个属性上的喜好度得分,wk表示该属性的权重,该权重可以通过经验设置,也可以根据既往数据进行优化,或者最简单的,全部设置成1,表示均衡的权重。其中各个属性的权重通过经验设定,或者通过历史数据优化。通过历史数据优化可以采用机器学习的方法根据用户的购买历史以及浏览历史进行优化。经过优化的权重相对于简单设置的权重会得到更精确全面的结果。\n[0057] 商品的属性包括商品描述信息、商品在线销售起止时间、商品价格、商品折扣率、商品配送信息或商品所述商家地址信息、商品类别等等。此处用到的特征不局限于上述特征,比如使用到的还有商品点击购买率,商品销量等。每个待推荐商品采用的属性越多,那么综合出来的目标用户在该待推荐商品上的喜好度也越准确。\n[0058] 作为一个前提,本发明中每个用户已经购买的以及将会购买的商品,在第k个商品的属性上的取值符合某种分布。比如对于那些连续变量的属性值,例如,商品的价格,所属商家的地址坐标以及折扣率等等,我们假设这些属性值符合正态分布;对于那些离散变量的属性值,例如,商品的类别,我们假设这些离散变量的属性值符合多项式分布。\n[0059] 假设用户u在商品第k个属性Ak上的分布为fuk(·),那么对于商品g,我们假设g.Ak=ak,k=1,…,d那么,score(g.Ak,u)=fuk(ak,u),即\n[0060] Pr ef(u,g)=w1.fu1(a1,u)+w2.fu2(a2,u),…,wd.fud(ad,u)[0061] 对于那些新用户以及购买量较少的老用户,为了得到更稳健的得分值,我们采用贝叶斯分析的方法,即假设各个分布函数的参数符合某种先验分布。假设第k个属性上的先验分布的参数为θk,那么\n[0062] Pr ef(u,g)=w1.fu1(a1,u|θ1)+w2.fu2(a2,u|θ2),…,wd.fud(ad,u|θd)[0063] 连续变量的属性分为一维数值属性和二维数值属性,相应的喜好度的计算如下:\n[0064] 一维数值属性包括价格、折扣率等,其一维正态分布为\n[0065]\n[0066] 那么对于一个待推荐商品的该属性x*在上述分布上的概率值p(x*|·)为[0067] 将上述概率归一化后得到该待推荐商品的该属性的喜好度得分:\n[0068]\n[0069] 二维数值属性以地址的坐标为例,设定地址x的坐标服从二维正态分布,如下式:\n[0070]\n[0071] 其中, |∑|=σ11*σ22-σ12*σ21,\n[0072] 那么对于一个待推荐商品的所属商家的地址x*在上述分布中出\n现的概率值p(x*|·)可以通过下式计算,\n[0073] 其中μN,∑H是基于目标用户既往访\n问过的商品的所属商家的地址得到的均值和协方差阵参数的后验估计。\n[0074] 将上述的概率归一化得到该地址的得分值,即目标用户在该待推荐商品的地址属性上的喜好度score(x*)。\n[0075]\n[0076] 对于离散变量的属性的相应的喜好度的计算以商品类别为例,其服从多项式分布。假设共有C个属性取值,xi∈{1,…,c,…,C}。目标用户历史数据中取值的出现次数为(n1,n2,…,nc),显然, 对于一个作为待推荐商品的新商品,在该属性上的取值为c,即x*=c,通过下式计算该取值出现的后验概率,即目标用户在该属性上的喜好度score(x*)。\n[0077] 其中(α1,α2,…,αc)是先验参数,我们可以采用\n均衡设置,即α1,α2,…,αc=α,得到下式\n[0078]\n[0079] 实施例2\n[0080] 本实施例为本发明的推荐系统的较佳实施例。图1为本发明的推荐系统的结构框图。如图1所示,推荐系统包括:(1)用户识别模块:识别登录的用户,以便调用相应的用户信息;根据用户ID等识别登录的用户,然后根据该用户的信息,为该用户提供有效的推荐。推荐方式可以根据用户的要求有针对性地进行,如最优推荐,周边推荐(在用户指定的距离范围内进行推荐)等。(2)用户信息数据库模块:存储用户信息;包括用户浏览历史、购买历史、年龄、性别以及登录信息等。根据这些信息盘对用户对商品的倾向性,从而为用户提供较为准确的推荐。(3)商品信息数据库模块:存储商品信息,包括商品属性信息;商品属性信息包括商品名称、商品描述信息、商品在线销售起止时间、商品价格、商品折扣、商品配送信息或商家地址信息、商品类别等。(4)商品喜好度生成模块:根据用户识别模块对用户的识别结果,从用户信息数据库和商品信息库调取相应的信息,计算目标用户对待推荐商品的各属性的喜好度;然后综合目标用户在该商品的各个属性的喜好度得到目标用户在该商品上的整体喜好度。(5)商品推荐模块:根据目标用户对商品的喜好度进行排序,按排序结果向目标用户推荐相应的商品,将排序结果发送给目标用户。\n[0081] 例如,某用户John登录当前系统之后,用户识别模块会识别出此用户,调用相应的用户信息,得到以下信息:\n[0082] 1、该用户正在北京市海淀区中关村附近;\n[0083] 2、该用户浏览过餐饮类商家推出的产品;\n[0084] 3、该用户购买过奢侈品。\n[0085] 这里,假设有三个属性:地点、餐饮、价格。根据此用户的信息,商品喜好度生成模块可以得到该用户在这三个属性上的概率分布,如下:\n[0086] 1、地点:该用户在地点上的概率分布是一个以海淀区中关村为中心的二维高斯分布(经纬度);\n[0087] 2、餐饮:该用户在在餐饮上的概率分布是一个bernoulli分布。由于他购买过餐饮类产品,所以此概率分布趋向于喜欢餐饮;\n[0088] 3、价格:该用户在地点上的概率分布是一个一维高斯分布。由于大部分用户消费的价格比较低,但是该用户购买过价格贵的商品,所以此高斯分布的方差很大,中心点的值也比较大。\n[0089] 确定了用户对于各属性的喜好地概率分布后,从商品信息数据库中调用相关的商品属性信息,计算目标用户对待推荐商品的各属性的喜好度。这里,具有以下特性的商品服务会得分较高:离中关村比较近的价格中上的餐饮类商品服务。\n[0090] 最后,商品推荐模块会将“离中关村比较近的价格中上的餐饮类商品服务”发送给目标用户。\n[0091] 以上实施例仅为本发明的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本发明的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。
法律信息
- 2019-07-19
未缴年费专利权终止
IPC(主分类): G06F 17/30
专利号: ZL 201110213618.2
申请日: 2011.07.28
授权公告日: 2016.09.07
- 2016-09-07
- 2013-03-13
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201110213618.2
申请日: 2011.07.28
- 2013-01-30
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2007-10-03
|
2007-02-28
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |