著录项信息
专利名称 | 一种基于情境融合感知的推荐方法 |
申请号 | CN201410115414.9 | 申请日期 | 2014-03-25 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2014-07-30 | 公开/公告号 | CN103955464A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 南京邮电大学 | 申请人地址 | 江苏省南京市栖霞区亚东新城区文苑路9号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 南京邮电大学 | 当前权利人 | 南京邮电大学 |
发明人 | 徐小龙;曹嘉伦;王慧健;刘建侠;苏展;李玲娟;陈丹伟 |
代理机构 | 南京知识律师事务所 | 代理人 | 汪旭东 |
摘要
本发明公开了一种基于情境融合感知的推荐方法,包括如下步骤:步骤1:根据情境的定义和需求将情境分为物理情境和用户偏好情境;步骤2:通过参数学习和结构学习构建贝叶斯网络,推理计算某一环境中的物理情境匹配程度;步骤3:考虑到用户兴趣爱好随时间变化的动态性,将时间函数融入基于内容的推荐算法中,计算用户偏好情境的匹配程度;步骤4:综合考虑情境匹配度,对所有候选信息资源进行评分,并将排名前Top‑N的信息推荐给目标用户。与现有技术相比,本发明考虑的推荐因素更全面,更能适应多变的环境,提高了推荐准确度,并且考虑用户兴趣随时间变化而变化的情况,将时间函数和基于资源内容的推荐结合,提高了用户满意度。
1.一种基于情境融合感知的推荐方法,包括如下步骤:
步骤1:根据情境的定义和需求将情境分为物理情境和用户偏好情境;
步骤2:通过参数学习和结构学习构建贝叶斯网络,推理计算某一环境中的物理情境匹配程度;
步骤3:考虑到用户兴趣爱好随时间变化的动态性,将时间函数融入基于内容的推荐算法中,计算用户偏好情境的匹配程度;基于资源内容的用户偏好情境匹配的方法如下:
步骤(1):分析用户浏览行为获取用户偏好信息;
步骤(2):采用基于经典的向量空间模型对用户偏好信息和信息资源进行建模,构建语义向量,并使用TF-IDF方法计算各特征词的权重值,最后计算目标资源Dj与目标用户综合偏好情境P之间的语义匹配程度:
sim(Dj,P)代表目标资源Dj与目标用户综合偏好情境P之间相似程度,dij代表特征词相应的权重值,k代表特征词数量,pi表示某时间段内用户的偏好情境,当i=0时为当前偏好情境,当i≥1时为历史偏好情境,目标用户的综合偏好情境P则可以通过下式进行计算,即综合偏好情境设置用logistic时间函数来构建:
其中,f(ti)为时间函数,ti表示距离当前时间的某一时间段,
步骤4:综合考虑情境匹配度,对所有候选信息资源进行评分,并将排名前Top-N的信息推荐给目标用户。
2.根据权利要求1所述的一种基于情境融合感知的推荐方法,其特征在于步骤2基于贝叶斯网络的物理情境匹配模型为:设当前物理情境为C(单一类型情境或多种类型情境的组合),目标信息资源为Dj(1≤j≤N),则在物理情境C给定条件下,用户选择访问信息资源Dj的概率为:
其中,N代表资源集D中的资源数量;P(C|Dj)为先验条件概率,代表用户过去在访问资源Dj条件下物理情境C所出现的概率,P(Dj)代表用户过去访问资源Dj的概率。
3.根据权利要求1所述的一种基于情境融合感知的推荐方法,其特征在于步骤4中的评分方法计算公式为:
Recomescorej=λ×sim(Dj,P)+(1-λ)×P(Dj|C);
Recomescorej代表推荐评分,λ为调节参数,sim(Dj,P)代表目标资源Dj与目标用户综合偏好情境P之间相似程度,P(Dj|C)代表在物理情境C下用户选择访问信息资源Dj的概率;公式中,λ∈[0,1]为调节参数,表示用户偏好情境或物理情境在推荐服务模型中的重要性;当λ=1时,推荐算法仅考虑用户的偏好情境,实现用户偏好情境的智能感知;当λ=0时,推荐算法仅考虑物理情境,实现基于贝叶斯网络的物理情境感知;算法对所有的候选信息资源进行评分,并将排名前Top-N的资源推荐给目标用户。
一种基于情境融合感知的推荐方法\n技术领域\n[0001] 本发明涉及网络信息技术领域,尤其涉及一种基于情境融合感知的推荐方法。\n背景技术\n[0002] 互联网的飞速发展和不断增长的信息资源使得信息指数激增,信息服务领域面临着“信息资源丰富,但获取有利用价值的信息困难”的问题,给人们带来很大的信息负担。一方面,网络上出现大量数据资源导致了“信息过载”现象(information overload);另一方面,用户无法获取自己需要的信息资源。推荐系统(recommendation systems)作为一种以“信息推送”模式服务的重要方法,是解决信息过载问题的主要手段,它能够以用户为中心在分析预测用户需求的基础上主动给用户推送其可能需要但又难以获取的信息,通过根据用户的不同环境场合下的行为特征为用户推荐更具有利用价值的信息资源。\n[0003] 同时,随着3G等无线网络技术的飞速发展,面向泛在环境下的个性化信息推荐服务将成为新的研究热点。智能移动设备的日新月异使得“3W”(whoever、whenever、wherever)梦想逐渐成为现实。智能设备成为人们获取信息的主要平台之一(如使用手机或平板电脑搜索信息、浏览新闻、阅读书籍、听音乐、看视频、收发微博等)。移动互联网给用户带来了方便,但也为个性化推荐系统提供了丰富的情境信息。用户的个性化情境信息具有敏感性,在不同的情况下相同的用户也会偏好不同的信息资源,并且在搜索过程中选择的策略也不同。因此,个性化推荐系统应考虑相关情境信息,将情境信息整合到推荐过程中以获得推荐的准确性和用户满意的服务。情境感知推荐系统具有“普适计算”和“个性化”的双重优势,有重要的研究意义和实用价值。\n[0004] 本发明针对用户个性化信息需求具有情境敏感性,将情境信息融入到信息推荐过程中,即将传统二维的“用户-项目”推荐服务模型扩展为包含情境信息的信息推荐模型,使得信息推荐系统在复杂的环境下,能够感知、洞察各种情境信息,并根据特定的情境自适应的调整推送给目标用户的信息。\n[0005] 目前,个性化推荐系统最典型的应用是在电子商务领域,但是这些推荐系统和相应算法仅仅关注用户和信息之间的二维关联关系,较少的考虑用户所处的环境(如时间、地理位置、周围的人、情绪、行为、网络条件等)而导致低精度的推荐。\n发明内容\n[0006] 为解决上述技术问题,本发明所采用的技术方案如下:\n[0007] 一种基于情境融合感知的推荐方法,包括如下步骤:\n[0008] 步骤1:根据情境的定义和需求将情境分为物理情境和用户偏好情境;\n[0009] 步骤2:通过参数学习和结构学习构建贝叶斯网络,推理计算某一环境中的物理情境匹配程度;\n[0010] 步骤3:考虑到用户兴趣爱好随时间变化的动态性,将时间函数融入基于内容的推荐算法中,计算用户偏好情境的匹配程度;\n[0011] 步骤4:综合考虑情境匹配度,对所有候选信息资源进行评分,并将排名前Top-N的信息推荐给目标用户。\n[0012] 基于贝叶斯网络的物理情境匹配模型为:设当前物理情境为C(单一类型情境或多种类型情境的组合),目标信息资源为Dj(1≤j≤N),则在物理情境C给定条件下,用户选择访问信息资源Dj的概率为:\n[0013]\n[0014] 其中,N代表资源集D中的资源数量;P(C|Dj)为先验条件概率,代表用户过去在访问资源Dj条件下物理情境C所出现的概率,P(Dj)代表用户过去访问资源Dj的概率。\n[0015] 基于资源内容的用户偏好情境匹配的方法如下:\n[0016] 步骤1:分析用户浏览行为获取用户偏好信息;\n[0017] 步骤2:采用基于经典的向量空间模型对用户偏好信息和信息资源进行建模,构建语义向量,并使用TF-IDF方法计算各特征词的权重值,最后计算目标资源Dj与目标用户综合偏好情境P之间的语义匹配程度:\n[0018]\n[0019] sim(Dj,P)代表目标资源Dj与目标用户综合偏好情境P之间相似程度,dij代表特征词相应的权重值,k代表特征词数量,pi表示某时间段内用户的偏好情境。\n[0020] pi表示在时间段为ti时用户的偏好情境,当i=0时为当前偏好情境,当i≥1时为历史偏好情境,目标用户的综合偏好情境P则可以通过下式进行计算,即\n[0021]\n[0022] 综合偏好情境设置用logistic时间函数来构建:\n[0023]\n[0024] 其中,f(ti)为时间函数,ti表示距离当前时间的某一时间段。\n[0025] 步骤四中的评分方法计算公式为:\n[0026] Recomescorej=λ×sim(Dj,P)+(1-λ)×P(Dj|C);\n[0027] Recomescorej代表推荐评分,λ为调节参数,sim(Dj,P)代表目标资源Dj与目标用户综合偏好情境P之间相似程度,P(Dj|C)代表在物理情境C下用户选择访问信息资源Dj的概率;公式中,λ∈[0,1]为调节参数,表示用户偏好情境或物理情境在推荐服务模型中的重要性。当λ=1时,推荐算法仅考虑用户的偏好情境,实现用户偏好情境的智能感知;当λ=0时,推荐算法仅考虑物理情境,实现基于贝叶斯网络的物理情境感知。算法对所有的候选信息资源进行评分,并将排名前Top-N的资源推荐给目标用户。\n[0028] 本发明提出的基于情境融合感知的推荐方法,可达到以下的有益效果:\n[0029] (1)考虑的推荐因素更全面,更能适应多变的环境,提高了推荐准确度。解决了较少考虑用户所处的环境(如时间、地理位置、周围的人、情绪、行为、网络条件等)而导致低精度的推荐问题。\n[0030] (2)考虑用户兴趣随时间变化而变化的情况,将时间函数和基于资源内容的推荐结合,提高了用户满意度。\n附图说明\n[0031] 图1基于情境融合感知的推荐方法流程图。\n具体实施方式\n[0032] 本发明提出一种基于情境融合感知的推荐方法。情境(context),也称上下文,最早由哥伦比亚大学的Shilit等人提出,他们将情境信息分为计算情境、用户情境、物理情境三类。其中计算情境表示网络的负载能力和可用的输入输出资源等;用户情境表示用户的偏好以及社会关系等;物理情境表示所处的周围环境。本方法主要考虑了物理情境和用户偏好情境。\n[0033] 如图1所示通过情境感知模块从相应的终端设备、GPS系统、用户行为等渠道获取情境信息保存在情境知识库中;采集用户、项目、评分、浏览记录等相关数据形成信息资源知识库。将情境分为物理情境和用户偏好情境。通过参数学习和结构学习构建贝叶斯网络,推理计算目标资源与当前物理情境匹配程度。考虑到用户兴趣爱好随时间变化的动态性,使用时间函数计算用户综合偏好情境;并在基于内容的推荐算法中,构建信息资源的语义空间向量,并采用词频-反文档频率(TF-IDF)方法计算信息资源权重。再计算目标资源与用户偏好情境的匹配程度。综合考虑两种情境匹配度,对所有候选信息资源进行评分,并将排名前Top-N的信息推荐给目标用户。\n[0034] 首先,根据情境的定义和需求将情境分为物理情境和用户偏好情境;其次,通过参数学习和结构学习构建贝叶斯网络,推理计算某一环境中的物理情境匹配程度;再次,考虑到用户兴趣爱好随时间变化的动态性,将时间函数融入基于内容的推荐算法中,计算用户偏好情境的匹配程度;最后,综合考虑情境匹配度,对所有候选信息资源进行评分,并将排名前Top-N的信息推荐给目标用户。\n[0035] 1.基于贝叶斯网络的物理情境匹配\n[0036] 基于贝叶斯网络的物理情境匹配模型为:设当前物理情境为C(单一类型情境或多种类型情境的组合),目标信息资源为Dj(1≤j≤N),则在物理情境C给定条件下,用户选择访问信息资源Dj的概率为:\n[0037]\n[0038] 其中,N代表资源集D中的资源数量;P(C|Dj)为先验条件概率,代表用户过去在访问资源Dj条件下物理情境C所出现的概率,P(Dj)代表用户过去访问资源Dj的概率,这两个概率值都可以通过对用户访问资源的历史记录进行计算。由于贝叶斯网络具有自适应学习能力,随着目标用户使用和访问信息资源的次数增多,贝叶斯网络对物理情境的感知能力也将越来越强。在给定的物理情境条件下,能够较精准地计算目标资源与当前物理情境之间的匹配度,并将匹配度较高的目标资源推荐给目标用户。\n[0039] 2.基于资源内容的用户偏好情境匹配\n[0040] 该过程是采用基于资源内容的方法计算信息资源与用户偏好情境的相似度,并考虑到用户偏好随时间变化的特点,将时间函数引入到模型中,更精准地实现目标资源与偏好情境的相似度匹配。基于内容的推荐采用标识用户偏好的特征词来表示资源内容的特征,以此预测目标用户对该资源的喜好程度。\n[0041] 通过分析用户浏览行为获取到的用户偏好信息,还需要进行相应的处理,将其加工成可以利用的用户偏好情境,并且使用信息检索中的特征词分析技术构建用户的偏好情境模型。我们使用经典的向量空间模型(vector-space model,VSM)对用户偏好情境进行建模,并考虑对偏好情境进行细分,用不同的特征词来表示偏好要素,各要素之间在概念上不能交叉。因此,基于本体建模,构建用户当前偏好情境P语义向量为P={p1,p2,…,pk},其中的权重pk∈[0,1]表示相应的特征词对用户偏好情境的重要程度。权重pk越高,表明该用户对包含该特征词的内容越感兴趣。基于领域本体,用户偏好情境在语义上可以准确的表示,减少或消除由传统特征词所带来的语义“模糊性”问题。\n[0042] 考虑到用户偏好有一定的动态性,其可能随时间的推移发生变化,而当前偏好情境只是局部反应了用户短时间内的偏好。因此,为了更有效的实现情境感知的信息推荐服务,需要考虑到用户随时间推移不断累计的历史偏好情境,以便更精准地反映用户的行为偏好。在推荐模型中,我们通过设置时间函数来构建综合偏好情境,时间函数体现了用户偏好随时间变化的差异,距离当前时间越长的偏好特征词,用户对其感兴趣的程度越小,权重也越小。指数时间广泛应用于实践中,它反应了用户过去偏好的渐进变化趋势,故采用指数定义时间函数为logistic函数:\n[0043]\n[0044] 其中,ti表示距离当前时间的某一时间段,时间段阈值可根据用户偏好的情况设定。因此,将当前时间段中的用户偏好与过去时间段中的历史偏好进行集成,可以更为精准的反映用户真实的偏好情境。设pi表示在时间段为ti时用户的偏好情境,当i=0时为当前偏好情境,当i≥1时为历史偏好情境,目标用户的综合偏好情境P则可以通过下式进行计算,即\n[0045]\n[0046] P代表目标用户的综合偏好情境,pi代表在时间段为ti时用户的偏好情境,当i=0时为当前偏好情境,当i≥1时为历史偏好情境,f(ti)为时间函数。\n[0047] 同样,我们对资源文档Dj(1≤j≤N)采用相同方法进行特征词语义标记,并构建信息资源的语义空间向量。目前使用最广泛的是词频-反文档频率(term frequency/inverse document frequency,TF-IDF)方法,可以计算出每个特征词的权重,一般来说,词频较大的特征词在文档资源中具有较高的权重,特征词在文档资源中分布越集中说明其在区分文档内容属性方面的能力越强。因此,资源文档的内容可以构建成由TF-IDF方法计算出的特征词权重所组成的语义空间向量为Dj={d1,d2,…,dk},其中权重值dk∈[0,1]代表特征词对信息资源的重要程度。在信息资源Dj的语义向量空间模型中,特征词被分配为相应的权重值dij(1≤i≤k,1≤j≤N),基于TF-IDF方法进行如下的计算,即\n[0048]\n[0049] dij代表特征词相应的权重值,freqij是特征词在文档资源Dj中出现的频率次数;\nmaxifreqij是在文档资源Dj中出现频率最高的特征词的频率;m代表系统中文档资源的数量;ni为文档集D中出现特征词的文档资源数量,可以计算出文档集D中每个文档资源的权值,TF-IDF代表词频-反文档频率。\n[0050] 当用户的综合偏好情境语义向量和信息资源语义向量产生后,我们使用余弦向量法计算目标资源Dj与目标用户综合偏好情境P之间的语义匹配,计算公式为[0051]\n[0052] sim(Dj,P)代表目标资源Dj与目标用户综合偏好情境P之间相似程度,dij代表特征词相应的权重值,k代表特征词数量,pi表示某时间段内用户的偏好情境。\n[0053] 3.基于情境融合感知的推荐算法\n[0054] 如上所述,物理情境匹配方法是用来计算目标资源与当前物理情境的匹配度;用户偏好情境匹配方法是用来计算目标资源与目标用户综合偏好情境之间的匹配度。在基于情境融合感知的信息推荐系统中,我们集成这两类情境的匹配方法,从而产生对目标资源的推荐评分,其计算公式为\n[0055] Recomescorej=λ×sim(Dj,P)+(1-λ)×P(Dj|C);\n[0056] Recomescorej代表推荐评分,λ为调节参数,sim(Dj,P)代表目标资源Dj与目标用户综合偏好情境P之间相似程度,P(Dj|C)代表在物理情境C下用户选择访问信息资源Dj的概率。\n[0057] 式中,λ∈[0,1]为调节参数,表示用户偏好情境或物理情境在推荐服务模型中的重要性。当λ=1时,推荐算法仅考虑用户的偏好情境,实现用户偏好情境的智能感知;当λ=\n0时,推荐算法仅考虑物理情境,实现基于贝叶斯网络的物理情境感知。算法对所有的候选信息资源进行评分,并将排名前Top-N的资源推荐给目标用户。\n[0058] 算法实现步骤:\n[0059] 步骤1:进行结构学习(比如K2算法)和参数学习(比如MLE)构建贝叶斯网络;\n[0060] 步骤2:获取目标用户的类别信息(性别、年龄、职业等)作为物理情境集合;\n[0061] 步骤3:计算目标资源与当前物理情境的匹配度;\n[0062] 步骤4:设计时间函数,计算目标用户的综合偏好情境;\n[0063] 步骤5:考虑信息资源的特征概念,计算权重值;\n[0064] 步骤6:计算目标资源与目标用户综合偏好情境之间的匹配度;\n[0065] 步骤7:计算基于情境融合感知推荐算法的预测评分;\n[0066] 步骤8:产生推荐列表,将Top-N的资源推荐给目标用户。
法律信息
- 2020-11-13
专利实施许可合同备案的生效
IPC(主分类): G06F 17/30
合同备案号: X2020980007071
专利申请号: 201410115414.9
申请日: 2014.03.25
让与人: 南京邮电大学
受让人: 南京邮电大学盐城大数据研究院有限公司
发明名称: 一种基于情境融合感知的推荐方法
申请公布日: 2014.07.30
授权公告日: 2017.10.03
许可种类: 普通许可
备案日期: 2020.10.26
- 2017-10-03
- 2014-08-27
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201410115414.9
申请日: 2014.03.25
- 2014-07-30
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2013-07-10
|
2013-04-01
| | |
2
| |
2014-02-26
|
2013-11-15
| | |
3
| |
2013-04-10
|
2010-07-01
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |