著录项信息
专利名称 | 基于属性多层关联的服务资源组合智能推荐方法和系统 |
申请号 | CN201310128654.8 | 申请日期 | 2013-04-15 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2013-07-17 | 公开/公告号 | CN103207912A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G06F17/30查看分类表>
|
申请人 | 武汉理工大学 | 申请人地址 | 湖北省武汉市洪山区珞狮路1***
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 武汉理工大学 | 当前权利人 | 武汉理工大学 |
发明人 | 聂规划;刘平峰;陈冬林;曹洪江;傅魁;游怀杰;刘李利;陈玲 |
代理机构 | 武汉开元知识产权代理有限公司 | 代理人 | 潘杰;胡红林 |
摘要
本发明涉及一种基于属性多层关联的服务资源组合智能推荐方法,包括:从用户交易库和服务资源库中分别提取用户消费记录和服务资源名称及其属性;生成基于服务属性的关联规则;生成基于服务属性泛化的多层关联规则;解析用户需求,生成基于属性描述的关联服务资源;将所述基于属性描述的关联服务资源进行多属性匹配,映射成具体的服务资源,并按流程各环节所需服务资源进行组合,最后将结果返回给用户。本发明基于服务属性的关联规则挖掘,不同于以往单纯基于服务资源实例交易与否来建立关联规则,本发明将服务属性纳入挖掘范畴,形成基于属性描述的服务资源关联规则,为用户推荐更精准的服务资源组合。
1.一种基于属性多层关联的服务资源组合智能推荐方法,其特征在于,包括:
从用户交易库和服务资源库中分别提取用户消费记录、服务资源名称及其属性;
生成基于服务资源属性的关联规则;所述生成基于服务属性的关联规则包括:将服务资源属性作为挖掘的对象,对不同服务资源间的属性进行关联挖掘;所述关联挖掘包括:首先对服务资源属性值进行频繁项集挖掘,再对频繁项建立基于属性的流程内服务资源的候选规则,进行支持度检验,若满足则进入置信度检验,同样满足则表示该规则为有价值的规则,写入规则库;
生成基于服务资源属性泛化的多层关联规则;
解析用户需求,生成基于属性描述的关联服务资源;
将所述基于属性描述的关联服务资源进行多属性匹配,映射成具体的服务资源,并按流程各环节所需服务资源进行组合,最后将结果返回给用户。
2.根据权利要求1所述基于属性多层关联的服务资源组合智能推荐方法,其特征在于:
若规则支持度小于最小支持度阈值,但大于执行属性泛化挖掘的基准阈值,则执行泛化挖掘。
3.根据权利要求2所述基于属性多层关联的服务资源组合智能推荐方法,其特征在于:
所述泛化挖掘是分别计算规则前后项的频次,对频次低项进行向上泛化,所述泛化为分别对数值型属性和对象型属性的泛化,其中
对数值型属性值进行区间泛化,根据所有交易记录中该服务资源属性值的分布特点,进行数值范围区间扩大,并决定扩大的幅度;
对对象型属性值进行概念泛化,通过中文语义词典中对相应属性定义的概念树进行向上泛化;
计算泛化后所得规则的支持度,进行支持度和置信度检验,若都满足则写入规则库。
4.根据权利要求1所述基于属性多层关联的服务资源组合智能推荐方法,其特征在于根据用户需求是否包含约束条件,选择不同的处理方案:
若用户需求不含约束条件,则只针对用户目前所处状态和目标状态,从规则库进行匹配,提取支持度和置信度综合数值最高的Top-N关联规则,形成基于属性描述的关联服务资源;
若用户需求包含约束,则先从用户需求的表述中提取属性指标,再通过中文语义词典寻找与属性指标相对应的资源属性,经过匹配、计算与组合,提取Top-N关联规则,形成基于属性描述的关联服务资源。
5.一种基于属性多层关联的服务资源组合智能推荐系统,其特征在于,包括:
数据准备模块,用于从用户交易库和服务资源库中分别提取用户消费记录和服务资源名称及其属性;
基于服务属性的关联规则生成模块,用于生成基于服务属性的关联规则;所述生成基于服务属性的关联规则包括:将服务资源属性作为挖掘的对象,对不同服务资源间的属性进行关联挖掘;所述关联挖掘包括:首先对服务资源属性值进行频繁项集挖掘,再对频繁项建立基于属性的流程内服务资源的候选规则,进行支持度检验,若满足则进入置信度检验,同样满足则表示该规则为有价值的规则,写入规则库;
基于服务属性泛化的多层关联规则生成模块,用于生成基于服务属性泛化的多层关联规则;
用户需求解析与规则匹配模块,用于解析用户需求,生成基于属性描述的关联服务资源;
推荐生成模块,用于将所述基于属性描述的关联服务资源进行多属性匹配,映射成具体的服务资源,并按流程各环节所需服务资源进行组合,最后将结果返回给用户。
基于属性多层关联的服务资源组合智能推荐方法和系统
技术领域
[0001] 本发明涉及服务资源组合推荐技术,具体地指一种基于属性多层关联的服务资源组合智能推荐方法和系统。
背景技术
[0002] 随着服务资源种类和数量的不断增多,个性化的不断增强,提供给用户的选择变得越来越多样。但服务多样化也存在弊端,用户需要从大量服务中找到自己所需的,或是潜在感兴趣的服务变得愈发困难。只有通过数据挖掘手段,进行知识发现,实现服务资源聚合,减少用户信息搜索成本,将用户从繁重的搜索作业中解脱出来才能提高用户体验,使运营商真正实现以用户为中心,从而立于不败之地。
[0003] 在现有的推荐技术中,关联规则是一种被普遍应用的共性推荐技术。但目前的关联规则挖掘大多是利用传统的购物篮分析方法对商品领域的交易记录进行规则挖掘。大部分关联推荐的对象仅限于实例层面,即基于具体服务资源的频繁项来挖掘关联规则,继而提供推荐,却忽略了用户所消费的不同服务资源之间可能存在属性层面的关联特征,而往往这些共性特征更能表达用户的切实诉求。另外,多层关联规则挖掘可以发现多粒度的服务资源的关联规则,它主要是通过对服务资源描述的概念层次树进行挖掘。进行概念泛化挖掘的多层关联规则算法以Apriori算法拓展而来的Cumulate和ML-T2L1最为著名。前者虽能完成多层及跨层次频繁规则的挖掘,但却只是将源数据置于同一层级上进行考虑;后者采用top-down方式进行逐层挖掘,但不支持跨层次的挖掘。
发明内容
[0004] 本发明的目的在于克服上述现有技术的不足而提供一种基于属性多层关联的服务资源组合智能推荐方法和系统,执行本发明而形成的基于服务属性的关联规则,可以很好地找到用户所关注的服务资源属性,并放大该属性的重要性。
[0005] 实现本发明目的采用的技术方案是:一种基于属性多层关联的服务资源组合智能推荐方法,包括:
[0006] 从用户交易库和服务资源库中分别提取用户消费记录、服务资源名称及其属性;
[0007] 生成基于服务资源属性的关联规则;
[0008] 生成基于服务资源属性泛化的多层关联规则;
[0009] 解析用户需求,生成基于属性描述的关联服务资源;
[0010] 将所述基于属性描述的关联服务资源进行多属性匹配,映射成具体的服务资源,并按流程各环节所需服务资源进行组合,最后将结果返回给用户。
[0011] 此外,本发明还提供一种基于属性多层关联的服务资源组合智能推荐系统,包括:
[0012] 数据准备模块,用于从用户交易库和服务资源库中分别提取用户消费记录、服务资源名称及其属性;
[0013] 基于服务属性的关联规则生成模块,用于生成基于服务属性的关联规则;
[0014] 基于服务属性泛化的多层关联规则生成模块,用于生成基于服务属性泛化的多层关联规则;
[0015] 用户需求解析与规则匹配模块,用于解析用户需求,生成基于属性描述的关联服务资源;
[0016] 推荐生成模块,用于将所述基于属性描述的关联服务资源进行多属性匹配,映射成具体的服务资源,并按流程各环节所需服务资源进行组合,最后将结果返回给用户。
附图说明
[0017] 图1为本发明服务资源组合智能推荐方法的流程示意图;
[0018] 图2为本发明服务资源组合智能推荐系统的结构框图。
具体实施方式
[0019] 下面结合附图和具体实施例对本发明作进一步的详细说明。
[0020] 本发明基于属性多层关联的服务资源组合智能推荐系统包括:数据准备模块101、基于服务属性的关联规则生成模块102、基于服务属性泛化的多层关联规则生成模块103、用户需求解析与规则匹配模块104和推荐生成模块105。
[0021] 下面详细说明本系统是如何实现推荐方法的,具体步骤如下:
[0022] 步骤S101、数据准备模块101从用户交易库和服务资源库中分别提取用户消费记录、服务资源名称及其属性。
[0023] 将上述提取的用户消费记录、服务资源名称及其属性经过数据预处理后形成形如表1所示的准备数据。
[0024]
唯一标识符 项集
001 A(α1,α2,α3,…)、B(β1,β2,β3,…)…
[0025] 表1
[0026] 表1中001为每条消费记录的唯一标识符,A和B为该记录中包含的服务资源,而括号内分别为A和B的主要属性值。并针对属性的不同类型进行预处理,对于数值型属性值进行区间划归(如旅游景点的门票价格为¥80,则可归入¥50-100中);对于对象型属性值则直接表示(如酒店的档次为“经济型”)。
[0027] 步骤S102、基于服务资源属性关联规则的挖掘,具体包括:
[0028] 将服务资源属性作为挖掘的对象,即将服务资源属性放在与以往关联规则挖掘中的实例同等地位,对同一服务资源所包含的属性值不进行关联挖掘,而对不同服务资源间的属性进行关联挖掘。
[0029] 其中关联挖掘包括:首先对服务资源属性值进行频繁项集挖掘,再对频繁项建立基于属性的流程间服务资源的规则,进行支持度检验,若满足则进入置信度检验,同样满足则表示该规则为有价值的规则,写入规则库。否则执行基于服务属性泛化的多层关联规则生成模块。
[0030] 步骤S103、基于服务属性泛化多层关联规则的挖掘,具体包括:
[0031] 若规则支持度大于执行属性泛化挖掘的基准阈值,则执行泛化挖掘。所述泛化挖掘是分别计算规则前后项的频次,对频次较低项进行向上泛化,所述泛化为分别对数值型属性和对象型属性的泛化。
[0032] 其中,对数值型属性值进行区间泛化,根据所有交易记录中该服务资源属性值的分布特点,进行数值范围区间扩大,并决定扩大的幅度;对对象型属性值进行概念泛化,通过中文语义词典中对相应属性定义的概念树进行向上泛化;
[0033] 计算泛化后所得规则的支持度,进行支持度和置信度检验,若都满足则写入规则库。
[0034] 步骤S104、解析用户需求,生成基于属性描述的关联服务资源。其根据用户需求是否包含约束条件,选择不同的处理方案:
[0035] 若用户需求不含约束条件,则只针对用户目前所处状态和目标状态,从规则库进行匹配,提取支持度和置信度综合数值最高的Top-N关联规则,形成基于属性描述的关联服务资源;
[0036] 若用户需求包含约束,则先从用户需求的表述中提取属性指标,再通过中文语义词典寻找与属性指标相对应的资源属性,经过匹配、计算与组合,提取Top-N关联规则,形成基于属性描述的关联服务资源。
[0037] 步骤S105、将所述基于属性描述的关联服务资源进行多属性匹配,映射成具体的服务资源,并按流程各环节所需服务资源进行组合,最后将结果返回给用户。
[0038] 下面以旅游领域中应用基于服务属性多层关联规则的服务资源组合智能推荐为实施例来说明本发明技术方案。
[0039] 假定旅游的业务流程为“交通工具——酒店——景点”,每一环节都包含多种服务资源,例如“交通工具”中可能会有K523次火车,CT3117次航班等,而基于属性的服务资源描述则为“交通工具(类型,价格,出发地,目的地…)”;“酒店(档次,位置,星级,价格,房间类型,住宿时间,是否包餐…)”;“景点(类型,价格,位置,年代…)”。
[0040] (1)数据准备模块从用户交易库和服务资源库中分别提取用户消费记录和服务资源名称及其属性,如001[K523(火车,¥189,硬卧,福州-武汉,…);七天酒店(经济型,一环,三星级,¥240…);黄鹤楼(人文,¥60,市区…)]。进行数据预处理时,将价格等数值型属性值划归到区间,如七天酒店的¥240可以划归到事先定义的区间¥200-250。故可得到如下表2所示的用于关联规则挖掘准备数据:
[0041]
[0042] 表2
[0043] 而以往用于关联规则挖掘的准备数据如下表3所示:
[0044]
唯一标识符 项集
001 K523,七天酒店,黄鹤楼
002 D2032,金泰,长城
003 Z38,安华,欢乐谷
004 MU2668,鹭江宾馆,鼓浪屿
[0045] 表3
[0046] (2)本发明通过基于服务属性的关联规则生成模块将各服务资源的属性纳入挖掘范畴,以服务资源出现的情况表征属性出现的情况,从而利用已有的Apriori及其改进算法进行关联规则挖掘。通过计算各属性值的频繁项,建立规则并进行支持度与置信度计算。同一环节的服务资源的属性不进行关联挖掘,而是对跨环节的每个服务资源的属性进行挖掘。本实施例在设定最小支持度阈值为0.3,最小置信度阈值为0.6的情况下可以得到如下的有效关联规则:“硬卧→经济型(酒店)”等。
[0047] (3)在上一步的挖掘中会发现规则“经济型(酒店)→¥100-120(景点价格)”的支持度只有0.25,不满足最小支持度阈值,不能成为一个强关联规则。但根据泛化策略,通过基于服务属性泛化的多层关联规则生成模块对频次较低的规则后项进行泛化,对于此规则后项而言,数值型属性值进行区间泛化,根据原数据的价格分布特点,将区间扩大至(80-
120),这样就顺利将记录002纳入规则范围,从而使规则变为“经济型(酒店)→80-120(景点价格)”,其支持度和置信度都符合要求,是有效关联规则。
[0048] (4)用户需求分为两种,其一为无约束条件,如用户提出“我要从武汉去北京旅游”,对于这样的用户需求,系统在关联规则库中进行搜寻,取得支持度与置信度综合数值最高的Top-N条关联规则,如“硬卧→经济型(酒店)”、“直达→三星级(酒店)”、“经济型(酒店)→人文”、“经济型(酒店)→80-120(景点价格)”等。用户需求解析与规则匹配模块及推荐生成模块将各规则进行结合得到“直达硬卧→三星级经济型酒店→¥80-120的人文景观”,然后对服务资源库进行映射,将符合规则的Top-N组最流行的服务资源组合推荐给用户,如“Z38硬卧→如家→世界公园”等。若用户提出约束条件“我要从武汉去北京旅游,预算在¥4000以内,住市区”,用户需求解析与规则匹配模块及推荐生成模块需要对用户需求的约束条件进行解析,提取的属性指标为价格与位置。在进行规则匹配时要计算规则内各服务资源的价格总和,确保用户不超支,并排除所有位置在郊区的酒店和景点。经过计算、匹配和组合等,为用户推荐满足其个性需求的旅游服务资源。
[0049] 本发明具有以下的优点:
[0050] 1、基于服务属性的关联规则挖掘,不同于现有的单纯基于服务资源实例交易与否来建立关联规则,本发明将服务属性纳入挖掘范畴,生成基于属性描述的服务资源关联规则,为用户推荐更精准的服务资源组合;
[0051] 2、针对在挖掘过程中可能遇到的底层属性关联规则的支持度或置信度不足的问题,进行基于属性的泛化挖掘,并提出数值型和对象型属性的泛化策略,以挖掘出更具广泛性的规则;
[0052] 3、根据用户需求是否包含约束条件,分别进行解析,并进行规则匹配,为用户推荐满足其不同需求的关联服务资源组合。
法律信息
- 2016-04-27
- 2013-08-14
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201310128654.8
申请日: 2013.04.15
- 2013-07-17
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2013-01-30
|
2012-09-12
| | |
2
| |
2010-04-21
|
2009-10-22
| | |
3
| |
2008-06-25
|
2007-12-25
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |