著录项信息
专利名称 | 基于决策树的信息推荐装置及方法 |
申请号 | CN201210569218.X | 申请日期 | 2012-12-25 |
法律状态 | 授权 | 申报国家 | 暂无 |
公开/公告日 | 2014-07-02 | 公开/公告号 | CN103902538A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0;;;G;0;6;Q;3;0;/;0;2查看分类表>
|
申请人 | 中国银联股份有限公司 | 申请人地址 | 上海市浦东新区含笑路36号银联大厦
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 中国银联股份有限公司 | 当前权利人 | 中国银联股份有限公司 |
发明人 | 袁奇华 |
代理机构 | 中国专利代理(香港)有限公司 | 代理人 | 方世栋;刘春元 |
摘要
本发明提出了基于决策树的信息推荐装置及方法。其中,所述装置包括用户接口、决策树生成模块、加权模块和推荐模块,所述决策树生成模块能够基于接收到的信息浏览记录序列生成决策树,其中,所述决策树中的每个节点代表所述与浏览目标相关联的属性中的不同层级的属性的分类,并且所述决策树的根节点代表最上层的第一级分类,所述加权模块在所述决策树生成后基于所述信息浏览记录序列中的每个信息浏览记录中的浏览时间为与该信息浏览记录相关联的节点赋以权重值。本发明所公开的基于决策树的信息推荐装置及方法能够提高信息搜索的效率和准确度。
基于决策树的信息推荐装置及方法\n技术领域\n[0001] 本发明涉及信息推荐装置,更具体地,涉及基于决策树的信息推荐装置及方法。\n背景技术\n[0002] 目前,随着网络应用的日益广泛以及不同领域的业务种类的日益丰富,用户通过网络进行特定信息的搜索和浏览(例如搜索和浏览意向购买的商品)变得越来越普遍。\n[0003] 然而,现有的信息搜索和浏览系统和方法存在如下问题:由于信息的种类和数量快速增长,用户需要花费大量的时间和精力在海量信息数据中查找感兴趣的信息,故信息搜索的效率和准确度较低。\n[0004] 因此,存在如下需求:提供能够根据用户的信息浏览数据提供相匹配的推荐信息的基于决策树的信息推荐装置及方法。\n发明内容\n[0005] 为了解决上述现有技术方案所存在的问题,本发明提出了能够根据用户的信息浏览数据提供相匹配的推荐信息的基于决策树的信息推荐装置及方法。\n[0006] 本发明的目的是通过以下技术方案实现的:\n[0007] 一种基于决策树的信息推荐装置,所述基于决策树的信息推荐装置包括:\n[0008] 用户接口,所述用户接口基于用户的行为获取用户的信息浏览记录序列,并将所述信息浏览记录序列传送到决策树生成模块,其中,所述信息浏览记录序列中的每个信息浏览记录包括下列各项:与浏览目标相关联的属性以及浏览时间;\n[0009] 决策树生成模块,所述决策树生成模块基于接收到的所述信息浏览记录序列生成决策树,其中,所述决策树中的每个节点代表所述与浏览目标相关联的属性中的不同层级的属性的分类,并且所述决策树的根节点代表最上层的第一级分类;\n[0010] 加权模块,所述加权模块在所述决策树生成后基于所述信息浏览记录序列中的每个信息浏览记录中的浏览时间为与该信息浏览记录相关联的节点赋以权重值;\n[0011] 推荐模块,所述推荐模块基于加权后的决策树确定推荐目标。\n[0012] 在上面所公开的方案中,优选地,所述决策树生成模块以如下方式生成所述决策树:(1)获取所述信息浏览记录序列中的第一信息浏览记录并将其作为当前信息浏览记录;\n(2)基于所述第一信息浏览记录生成具有三层的决策树,并基于所述第一信息浏览记录中的与浏览目标相关联的属性的分类设置所述决策树中的每个节点的值,其中所述决策树的第一层是代表第一级属性分类的根节点,所述决策树的第二层是代表第二级属性分类的节点,所述决策树的第二层是代表第三级属性分类的节点;(3)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束决策树生成过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(4)将当前信息浏览记录中的与浏览目标相关联的属性按属性分类层级规则依次与所述决策树的节点进行比较,如果在与所述决策树的一个节点的比较中发现与该节点已包含的属性分类不同的属性分类,则在该节点处生成新的分支树,并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支树中的每个节点的值,随后返回步骤(3),其中,该不同的属性分类是该新的分支树的根节点的值。\n[0013] 在上面所公开的方案中,优选地,所述决策树的第三层中的每个节点是具有至少一层的子节点树,并且所述步骤(2)进一步包括:基于所述第一信息浏览记录中的与浏览目标相关联的属性中的对应的属性信息的分类设置所述子节点树中的每个子节点的值,以及所述步骤(4)进一步包括:将当前信息浏览记录中的与浏览目标相关联的属性中的对应的属性按属性分类层级规则依次与相关的第三层中的节点的子节点树中的子节点进行比较,如果在与该子节点树的一个子节点的比较中发现与该子节点已包含的属性分类不同的属性分类,则在该子节点处生成新的分支子节点树,并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支子节点树中的每个子节点的值。\n[0014] 在上面所公开的方案中,优选地,所述加权模块以如下方式对所述决策树中的每个节点赋以权重值:(a)获取所述信息浏览记录序列中第一信息浏览记录,并将其作为当前信息浏览记录;(b)将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值;(c)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束加权过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(d) 将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值,随后返回步骤(c)。\n[0015] 在上面所公开的方案中,优选地,所述步骤(b)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值,并且所述步骤(d)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值。\n[0016] 在上面所公开的方案中,优选地,所述推荐模块以如下方式确定推荐目标的属性信息:将由所述决策树的每个层级中权重值最高的属性分类构成的属性分类集合确定为推荐目标的属性信息,并根据所确定的属性信息从数据库中获取推荐目标。\n[0017] 在上面所公开的方案中,优选地,所述推荐模块在从数据库中获取推荐目标后将所获取的推荐目标呈现给用户。\n[0018] 本发明的目的也可以通过以下技术方案实现:\n[0019] 一种基于决策树的信息推荐方法,所述基于决策树的信息推荐方法包括下列步骤:\n[0020] (A1)基于用户的行为获取用户的信息浏览记录序列,其中,所述信息浏览记录序列中的每个信息浏览记录包括下列各项:与浏览目标相关联的属性以及浏览时间;\n[0021] (A2)基于接收到的所述信息浏览记录序列生成决策树,其中,所述决策树中的每个节点代表所述与浏览目标相关联的属性中的不同层级的属性的分类,并且所述决策树的根节点代表最上层的第一级分类;\n[0022] (A3)在所述决策树生成后基于所述信息浏览记录序列中的每个信息浏览记录中的浏览时间为与该信息浏览记录相关联的节点赋以权重值;\n[0023] (A4)基于加权后的决策树确定推荐目标。\n[0024] 本发明所公开的基于决策树的信息推荐装置及方法具有以下优点:能够根据用户的信息浏览数据提供相匹配的推荐信息,从而提高了信息搜索的效率和准确度。\n附图说明\n[0025] 结合附图,本发明的技术特征以及优点将会被本领域技术人员更好地理解,其中:\n[0026] 图1是根据本发明的实施例的基于决策树的信息推荐装置的示意性结构图;\n[0027] 图2是根据本发明的实施例的基于决策树的信息推荐方法的流程图;\n[0028] 图3是根据本发明的实施例而构建的决策树的示意图。\n具体实施方式\n[0029] 图1是根据本发明的实施例的基于决策树的信息推荐装置的示意性结构图。如图1所示,本发明所公开的基于决策树的信息推荐装置包括用户接口1、决策树生成模块2、加权模块3和推荐模块4。其中,所述用户接口1基于用户的行为获取用户的信息浏览记录序列,并将所述信息浏览记录序列传送到决策树生成模块2,其中,所述信息浏览记录序列中的每个信息浏览记录包括下列各项:与浏览目标相关联的属性以及浏览时间。所述决策树生成模块2基于接收到的所述信息浏览记录序列生成决策树,其中,所述决策树中的每个节点代表所述与浏览目标相关联的属性中的不同层级的属性的分类,并且所述决策树的根节点代表最上层的第一级分类(即浏览目标的最宽泛的分类)。所述加权模块3在所述决策树生成后基于所述信息浏览记录序列中的每个信息浏览记录中的浏览时间为与该信息浏览记录相关联的节点赋以权重值。所述推荐模块4基于加权后的决策树确定推荐目标。\n[0030] 优选地,在本发明所公开的基于决策树的信息推荐装置中,所述决策树生成模块2以如下方式生成所述决策树:(1)获取所述信息浏览记录序列中的第一信息浏览记录并将其作为当前信息浏览记录;(2)基于所述第一信息浏览记录生成具有三层的决策树,并基于所述第一信息浏览记录中的与浏览目标相关联的属性的分类设置所述决策树中的每个节点的值,其中所述决策树的第一层是代表第一级属性分类的根节点,所述决策树的第二层是代表第二级属性分类的节点,所述决策树的第二层是代表第三级属性分类(即信息的最本质的(一个或多个)属性)的节点;(3)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束决策树生成过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(4)将当前信息浏览记录中的与浏览目标相关联的属性按属性分类层级规则依次与所述决策树的节点进行比较,如果在与所述决策树的一个节点的比较中发现与该节点已包含的属性分类不同的属性分类,则在该节点处生成新的分支树(即该不同的属性分类以新的分支的方式被包含在该节点中),并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支树中的每个节点的值(即从该分支树的根节点开始按层级为该分支树的每个节点赋值),随后返回步骤(3),其中,该不同的属性分类是该新的分支树的根节点的值。\n[0031] 优选地,在本发明所公开的基于决策树的信息推荐装置中,所述决策树的第三层中的每个节点是具有至少一层的子节点树(示例性地,子节点树具有11层,即第三级属性分类具有11个分类层级),并且所述步骤(2)进一步包括:基于所述第一信息浏览记录中的与浏览目标相关联的属性中的对应的属性信息的分类设置所述子节点树中的每个子节点的值,以及所述步骤(4)进一步包括:将当前信息浏览记录中的与浏览目标相关联的属性中的对应的属性按属性分类层级规则依次与相关的第三层中的节点的子节点树中的子节点进行比较,如果在与该子节点树的一个子节点的比较中发现与该子节点已包含的属性分类不同的属性分类,则在该子节点处生成新的分支子节点树(即该不同的属性分类以新的分支的方式被包含在该子节点中),并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支子节点树中的每个子节点的值。\n[0032] 优选地,在本发明所公开的基于决策树的信息推荐装置中,所述加权模块3以如下方式对所述决策树中的每个节点赋以权重值:(a)获取所述信息浏览记录序列中第一信息浏览记录,并将其作为当前信息浏览记录;(b)将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值;(c)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束加权过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(d) 将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值,随后返回步骤(c)。\n[0033] 优选地,在本发明所公开的基于决策树的信息推荐装置中,所述步骤(b)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值,并且所述步骤(d)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值。\n[0034] 优选地,在本发明所公开的基于决策树的信息推荐装置中,所述推荐模块4以如下方式确定推荐目标的属性信息:将由所述决策树的每个层级中权重值最高的属性分类构成的属性分类集合确定为推荐目标的属性信息,并根据所确定的属性信息从数据库中获取推荐目标(例如将符合所确定的属性分类集合中的每个属性分类的商品作为推荐商品)。\n[0035] 可选地,在本发明所公开的基于决策树的信息推荐装置中,所述推荐模块4在确定推荐目标的属性信息后将所述属性信息传送到相关的数据处理服务器(例如电子商务领域中的用于推荐商品的推理操作服务器)以进行后续的处理。\n[0036] 优选地,在本发明所公开的基于决策树的信息推荐装置中,所述推荐模块4在从数据库中获取推荐目标后将所获取的推荐目标呈现给用户。\n[0037] 由上可见,本发明所公开的基于决策树的信息推荐装置具有下列优点:能够根据用户的信息浏览数据提供相匹配的推荐信息,从而提高了信息搜索的效率和准确度。\n[0038] 图3是根据本发明的实施例而构建的决策树的示意图。如图3所示,在电子商务领域中,根据本发明所公开的工作原理的决策树的构建过程如下:设商品属性集A分别由 ,, 组成,即A={ , ,}。其中: 为一级属性,即对商品最宽泛的分类(例如通过,可以区分生活用品与建筑材料); 是二级属性(例如,通过 可以区分用户浏览的商品是冰箱还是洗衣机; 是商品最本质的属性(例如,通过 ,可以区分商品是红色还是白色,是塑料材质还是钢铁材质),其中, 可以进一步被细化为 ={ , ,…, }(例如,可以将 定义为:=名称,=内容描述, =品牌, =价格, =颜色, =形状,=尺寸,=原料,=材质, =产地, =销售地),此外,设用户在时间T内共浏览了n个商品 , ,…, ,则 为浏览者对商品P的访问时间,而Σ = + +… +为用户对网络站点的总的浏览时长,在以上假设的基础上,以如下方式构建决策树:(1)用户浏览商品 后,为其产生一棵决策树 ,示例性地,初始的 自动地生成X,Y,Z三个检验节点,其中Z节点又包括了 , ,…, 共11个检验节点,依次对其后浏览商品的属性值进行检验;(2)用户浏览 后,从X检验节点开始将 与 进行比对,检验节点可以将相同的属性值归为同类,如果发现了新的值,则形成一个新的分支,以此类推,直到所有节点都为单一属性值即形成叶子节点,如图3所示,检验节点Z节点包括了 , ,…, 共11个小检验节点,由此,当一件商品的所有属性值都被分离出来后就形成一个叶子节点,一棵决策树可以有多个叶子节点,此外,因为商品越吸引用户,用户的停留时间越长,所以用户对商品的浏览时间 是用户对商品感兴趣程度的直观表述,因此,将 值作为商品P的各项属性值的基础权重,用户每浏览一次商品,就增加权重值 ,如图3所示,示例性地,当用户浏览了商品, , 后,由于 , 都属于“生活用品”,所以 , 的加权属性值 = + ,从而最终得出每项属性权重值最高的商品属性集合 ={ , ,( , ,…,\n)},此时,推荐装置对用户的属性进行判断,如果用户是注册用户,则继续使用其他推理技术进行进一步推理分析;如果用户为未注册用户,则直接向用户推荐与计算结果最为匹配的商品,即最后向未注册用户推荐的商品为P=( ∪叶子节点子组),即各项属性值最高且形成了叶子节点的那个商品。\n[0039] 图2是根据本发明的实施例的基于决策树的信息推荐方法的流程图。如图2所示,本发明所公开的基于决策树的信息推荐方法包括下列步骤:(A1)基于用户的行为获取用户的信息浏览记录序列,其中,所述信息浏览记录序列中的每个信息浏览记录包括下列各项:\n与浏览目标相关联的属性以及浏览时间;(A2)基于接收到的所述信息浏览记录序列生成决策树,其中,所述决策树中的每个节点代表所述与浏览目标相关联的属性中的不同层级的属性的分类,并且所述决策树的根节点代表最上层的第一级分类(即浏览目标的最宽泛的分类);(A3)在所述决策树生成后基于所述信息浏览记录序列中的每个信息浏览记录中的浏览时间为与该信息浏览记录相关联的节点赋以权重值;(A4)基于加权后的决策树确定推荐目标。\n[0040] 优选地,在本发明所公开的基于决策树的信息推荐方法中,所述步骤(A2)包括:\n(1)获取所述信息浏览记录序列中的第一信息浏览记录并将其作为当前信息浏览记录;(2)基于所述第一信息浏览记录生成具有三层的决策树,并基于所述第一信息浏览记录中的与浏览目标相关联的属性的分类设置所述决策树中的每个节点的值,其中所述决策树的第一层是代表第一级属性分类的根节点,所述决策树的第二层是代表第二级属性分类的节点,所述决策树的第二层是代表第三级属性分类(即信息的最本质的(一个或多个)属性)的节点;(3)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束决策树生成过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(4)将当前信息浏览记录中的与浏览目标相关联的属性按属性分类层级规则依次与所述决策树的节点进行比较,如果在与所述决策树的一个节点的比较中发现与该节点已包含的属性分类不同的属性分类,则在该节点处生成新的分支树(即该不同的属性分类以新的分支的方式被包含在该节点中),并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支树中的每个节点的值(即从该分支树的根节点开始按层级为该分支树的每个节点赋值),随后返回步骤(3),其中,该不同的属性分类是该新的分支树的根节点的值。\n[0041] 优选地,在本发明所公开的基于决策树的信息推荐方法中,所述决策树的第三层中的每个节点是具有至少一层的子节点树(示例性地,子节点树具有11层,即第三级属性分类具有11个分类层级),并且所述步骤(2)进一步包括:基于所述第一信息浏览记录中的与浏览目标相关联的属性中的对应的属性信息的分类设置所述子节点树中的每个子节点的值,以及所述步骤(4)进一步包括:将当前信息浏览记录中的与浏览目标相关联的属性中的对应的属性按属性分类层级规则依次与相关的第三层中的节点的子节点树中的子节点进行比较,如果在与该子节点树的一个子节点的比较中发现与该子节点已包含的属性分类不同的属性分类,则在该子节点处生成新的分支子节点树(即该不同的属性分类以新的分支的方式被包含在该子节点中),并且基于当前信息浏览记录中的对应的与浏览目标相关联的属性的分类设置所述新的分支子节点树中的每个子节点的值。\n[0042] 优选地,在本发明所公开的基于决策树的信息推荐方法中,所述步骤(A3)包括:\n(a)获取所述信息浏览记录序列中第一信息浏览记录,并将其作为当前信息浏览记录;(b)将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值;(c)如果当前信息浏览记录是所述信息浏览记录序列中的最后一个信息浏览记录,则结束加权过程,而如果当前信息浏览记录不是所述信息浏览记录序列中的最后一个信息浏览记录,则获取所述信息浏览记录序列中的下一个信息浏览记录并将其作为当前信息浏览记录;(d) 将所述决策树的一个或多个节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值,随后返回步骤(c)。\n[0043] 优选地,在本发明所公开的基于决策树的信息推荐方法中,所述步骤(b)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值设置为当前信息浏览记录中的浏览时间的值,并且所述步骤(d)进一步包括:将对应的子节点树的一个或多个子节点中包含的与当前信息浏览记录相关联的每个属性分类的权重的值加上当前信息浏览记录中的浏览时间的值作为每个属性分类的新的权重的值。\n[0044] 优选地,在本发明所公开的基于决策树的信息推荐方法中,所述步骤(A4)包括:将由所述决策树的每个层级中权重值最高的属性分类构成的属性分类集合确定为推荐目标的属性信息,并根据所确定的属性信息从数据库中获取推荐目标(例如将符合所确定的属性分类集合中的每个属性分类的商品作为推荐商品)。\n[0045] 可选地,在本发明所公开的基于决策树的信息推荐方法中,所述步骤(A4)包括:在确定推荐目标的属性信息后将所述属性信息传送到相关的数据处理服务器(例如电子商务领域中的用于推荐商品的推理操作服务器)以进行后续的处理。\n[0046] 优选地,在本发明所公开的基于决策树的信息推荐方法中,所述步骤(A4)进一步包括:在从数据库中获取推荐目标后将所获取的推荐目标呈现给用户。\n[0047] 由上可见,本发明所公开的基于决策树的信息推荐方法具有下列优点:能够根据用户的信息浏览数据提供相匹配的推荐信息,从而提高了信息搜索的效率和准确度。\n[0048] 尽管本发明是通过上述的优选实施方式进行描述的,但是其实现形式并不局限于上述的实施方式。应该认识到:在不脱离本发明主旨和范围的情况下,本领域技术人员可以对本发明做出不同的变化和修改。
法律信息
- 2017-03-15
- 2014-07-30
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201210569218.X
申请日: 2012.12.25
- 2014-07-02
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2002-05-01
|
2000-12-05
| | |
2
| |
2012-07-11
|
2010-12-24
| | |
3
| |
2010-10-20
|
2009-04-17
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |