著录项信息
专利名称 | 一种基于协同过滤的推荐方法和系统 |
申请号 | CN200810216517.9 | 申请日期 | 2008-09-27 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2010-03-31 | 公开/公告号 | CN101685458 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G06F17/30;G06Q30/00查看分类表>
|
申请人 | 华为技术有限公司 | 申请人地址 | 广东省深圳市龙岗区坂田华为总部***
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 华为技术有限公司 | 当前权利人 | 华为技术有限公司 |
发明人 | 杜家春;汪芳山;方琦;谭卫国;钟杰萍 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
一种基于协同过滤的推荐方法,包括获取目标用户标识;查找该目标用户标识对应的用户群标识;获取根据所述用户群标识对应的用户-项目评分矩阵确定的项目间相似度;根据该项目间相似度,向目标用户推荐项目。采用本发明提供的推荐方法能提高项目推荐的准确度,提高用户体验。本发明同时提供一种基于协同过滤的推荐系统。
1.一种基于协同过滤的推荐方法,其特征在于,包括:
获取目标用户标识;查找所述目标用户标识对应的用户群标识;获取根据所述用户群标识对应的用户-项目评分矩阵确定的项目间相似度;根据所述项目间相似度,向目标用户推荐项目,其中,所述根据所述项目间相似度,向目标用户推荐项目,包括:
判断目标用户在所述用户群对应的用户-项目评分矩阵中是否有评分记录,若有,通过所述项目间相似度,确定与所述评分记录对应项目相似的项目作为待推荐集。
2.如权利要求1所述的方法,其特征在于,所述方法还包括:
根据用户对项目的评分,建立用户-项目评分矩阵;根据用户-项目评分矩阵进行用户间相似度计算,将用户进行分群;其中,每一用户群对应一用户群标识。
3.如权利要求2所述的方法,其特征在于,所述根据用户-项目评分矩阵进行用户间相似度计算采用k均值聚类算法(K-means算法),包括:随机选取k个用户作为初始群组中心;对每个用户,计算所述用户与各初始群组中心的距离,将所述用户分到与其距离最近的初始群组中心所在的群组中。
4.如权利要求3所述的方法,其特征在于,当所有用户分群完毕后,计算每个群组的新群组中心,所述新群组中心是对应群组中所有用户评分向量的单位向量的均值。
5.如权利要求2所述的方法,其特征在于,所述根据用户-项目评分矩阵进行用户间相似度计算,将用户进行分群采用人工分群、机器分群或人机结合分群。
6.如权利要求1所述的方法,其特征在于,所述获取根据所述用户群标识对应的用户-项目评分矩阵确定的项目间相似度,包括:获取用户群标识;根据所述用户群标识获取对应用户群中所有用户对应的用户-项目评分矩阵;计算所述用户-项目评分矩阵中项目间相似度。
7.如权利要求6所述的方法,其特征在于,所述计算所述用户-项目评分矩阵中项目间相似度采用余弦相似度、皮尔森(Pea r s on)相关系数或修正的余弦相似度计算。
8.如权利要求1所述的方法,其特征在于,若根据所述目标用户标识未查找到对应的用户群标识,包括:获取所述目标用户标识对应目标用户的基本属性;分类器根据所述目标用户基本属性将所述目标用户分到对应用户群,并获得所述用户群对应的用户标识。
9.如权利要求8所述的方法,其特征在于,所述分类器的建立方法包括:在所述每个用户群中随机选出占所述用户群用户总数a%的用户标识;获取所述a%的用户的基本属性;
根据所述a%的用户基本属性特征构建分类器,其中0<a<100。
10.如权利要求1所述的方法,其特征在于,所述根据所述项目间相似度,向目标用户推荐项目,包括:
判断目标用户在所述用户群对应的用户-项目评分矩阵中是否有评分记录,若没有,通过计算所述用户-项目评分矩阵中热点项目的评分预测,将热点项目作为待推荐集,其中,热点项目为被评分最多的前M个项目。
11.如权利要求10所述的方法,其特征在于,对所述用户-项目评分矩阵中热点项目计算基于热点项目的评分预测,包括:获取用户群标识;根据所述用户群标识获取对应用户群中所有用户对应的用户-项目评分矩阵;计算所述用户群对应用户-项目评分矩阵中热点项目热点度,热点项目热点度为所述项目所得评分的平均值,所述热点项目的热点度即为所述热点项目的评分预测。
12.如权利要求1所述的方法,其特征在于,所述方法进一步包括:判断所述待推荐集中项目数目是否不小于N,若小于,则在距离目标用户最近的其它用户群中获取待推荐集,与已确定的待推荐集取并集,直到推荐项目数大于或等于N,或者直到所有用户群遍历完毕为止。
13.如权利要求12所述的方法,其特征在于,所述方法进一步包括:判断所述推荐集中项目数目是否不小于N,若大于或等于,则计算所述推荐集中各项目的评分预测,将评分预测最高的前N个项目作为推荐项目向用户推荐。
14.如权利要求13所述的方法,其特征在于,计算所述推荐集中各项目的评分预测采用基于相似项目评分预测。
15.一种基于协同过滤的推荐系统,其特征在于,包括:
推荐控制模块,用于获取目标用户标识,调用确定待推荐集模块和生成模块向所述目标用户标识对应的目标用户推荐项目;
确定待推荐集模块,用于查找所述目标用户标识对应的用户群组标识,获取根据所述用户群标识对应的用户-项目评分矩阵确定的项目间相似度,根据所述项目间相似度确定待推荐集,或者获取根据所述用户群标识对应的用户-项目评分矩阵确定的热点项目集,将所述热点项目集作为待推荐集;
生成推荐模块,用于向用户推荐推荐集中的项目。
16.如权利要求15所述的系统,其特征在于,包括:数据库,所述数据库中进一步包括:
用户-项目评分矩阵,用于存储每一用户对各个项目的用户-项目评分矩阵。
17.如权利要求16所述的系统,其特征在于,包括:用户分群模块用于根据所述数据库中所述用户-项目评分矩阵库中存储的用户-项目评分矩阵对用户进行用户分群,每个用户群对应一用户群标识和群组中心,用户分群结果存储于所述数据库中的用户群库中。
18.如权利要求16所述的系统,其特征在于,所述数据库中进一步包括:用户基本信息库,用于存储每一用户的基本信息。
19.如权利要求18所述的系统,其特征在于,包括:分类器生成模块用于根据所述用户分群结果,将每一用户群中对应用户的基本信息作为分类特征,构建一个分类器。
20.如权利要求17所述的系统,其特征在于,包括:热点项目热点度计算模块,用于根据所述用户分群结果和与所述用户群对应的用户-项目评分矩阵,在每一个用户群中独立找出评分最多的若干项目作为热点项目,计算所述热点项目的评分均值得到热点项目的热点度。
21.如权利要求20所述的系统,其特征在于,所述数据库中进一步包括:用户群项目热点度库,用于存储所述用户群组对应的热点项目的热点度。
22.如权利要求20所述的系统,其特征在于,包括:项目相似度计算模块,用于根据所述用户分群结果和与所述用户群组对应的用户-项目评分矩阵,在每一个用户群组中独立计算项目间相似度。
23.如权利要求22所述的系统,其特征在于,所述数据库中进一步包括:用户群组项目相似度库,用于存储所述用户群组对应的所述项目间相似度。
24.如权利要求23所述的系统,其特征在于,所述确定待推荐集模块包括:
用户所属群组确定模块,用于在用户群库中根据所述目标用户标识确定对应的用户群标识;
待推荐项目集确定模块,用于根据所述用户群标识在用户项目相似度库中获取项目间相似度,根据所述项目间相似度确定待推荐集,或者获取根据所述用户群标识对应的用户-项目评分矩阵确定的热点项目集,将所述热点项目集作为待推荐集。
25.如权利要求15所述的系统,其特征在于,包括:评分预测模块,用于对所述待推荐集中各项目进行基于相似项目评分的预测或基于热点项目评分的预测,得出目标用户对于待推荐集中各项目的预测评分,将评分最高的N个项目向用户推荐。
26.如权利要求25所述的系统,其特征在于,所述评分预测模块包括:相似项目评分预测模块,用于对所述待推荐集中各项目进行基于相似项目评分的预测;或者,热点项目评分预测模块,用于对所述待推荐集中各项目进行基于热点项目评分的预测。
法律信息
- 2012-09-19
- 2011-03-16
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 200810216517.9
申请日: 2008.09.27
- 2010-03-31
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2008-10-15
|
2008-05-16
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |