著录项信息
专利名称 | 一种基于产品间关联度提供搭配产品的方法及装置 |
申请号 | CN201110343441.8 | 申请日期 | 2011-11-03 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2013-05-08 | 公开/公告号 | CN103093369A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | 暂无 | IPC分类号 | 暂无查看分类表>
|
申请人 | 阿里巴巴集团控股有限公司 | 申请人地址 | 英属开曼群岛大开曼岛资本大厦一座四层847号邮箱
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 阿里巴巴集团控股有限公司 | 当前权利人 | 阿里巴巴集团控股有限公司 |
发明人 | 张伟 |
代理机构 | 北京同达信恒知识产权代理有限公司 | 代理人 | 郭润湘 |
摘要
本发明涉及电子商务领域,公开了一种基于产品间关联度提供搭配产品的方法及装置,用以在用户选中某一产品时,提高向其推荐的搭配产品的精确度,具体为:在确定用户选定的目标产品的搭配产品时,基于设定时长确定事务集合,这样,一方面保证事务形成的有效性,另一方面也保证了事务内部包含的产品间的关联性;以及,在计算产品单项集和产品N项集的绝对支持度时,引入了相关性测度弥补绝对支持度的统计性质缺陷,从而在基于产品关联度来确定产品间的最佳搭配关系时,可以有效地提高所确定的搭配产品的准确度,这样,在向用户呈现目标产品的搭配产品时,电子商务网站可以基于用户需求及时地向其推荐更为精确的搭配产品,进而有效地保证了电子商务服务质量。
1.一种基于产品间关联度提供搭配产品的方法,其特征在于,包括:
接收用户的选择请求,确定该选择请求对应的目标产品;
根据产品间的搭配关系确定所述目标产品的搭配产品;
向用户返回所述目标产品以及相应的搭配产品;
其中,所述产品间的搭配关系是通过以下步骤获得的:
获取用户的历史交易记录,并根据该历史交易记录确定设定时长内形成的事务集合,其中,任意一事务表征用户在上述设定时长内购买的所有产品的集合;
形成各产品的产品单项集,每一个产品单项集表示一种产品,并计算每一个产品单项集的绝对支持度,其中,任意一个单项产品集合的绝对支持度为包含该任意一个产品的事务的数目;
形成各产品的产品N项集,N>1,每一个产品N项集表示一个N种产品的组合,并计算每一个产品N项集的绝对支持度,其中,任意一个产品N项集的绝对支持度为包含该任意一个产品N项集的事务的数目;
根据获得的各产品单项集的绝对支持度和各产品N项集的绝对支持度,分别计算每一个产品N项集表示的产品组合的产品关联度,所述产品关联度用于表征产品组合间的关联程度;
根据各产品N项集对应的产品关联度,针对各产品分别筛选出相应的符合预设条件的产品组合方式,并按照最终确定的产品组合方式,确定各产品的搭配产品。
2.如权利要求1所述的方法,其特征在于,形成各产品的产品N项集,N>1,每一个产品N项集表示一个N种产品的组合,并计算每一个产品N项集合的绝对支持度,其中,任意一个产品N项集的绝对支持度为包含该任意一个产品N项集的事务的数目,包括:
形成各产品的产品二项集,每一个产品二项集表示一个两种产品的组合,并计算每一个产品二项集的绝对支持度,其中,任意一个产品二项集的绝对支持度为包含该任意一个产品二项集的事务的数目;
形成各产品的产品三项集,每一个产品三项集表示一个三种产品的组合,并计算每一个产品三项集的绝对支持度,其中,任意一个产品三项集的绝对支持度为包含该任意一个产品三项集的事务的数目。
3.如权利要求1所述的方法,其特征在于,在获得各产品单项集对应的绝对支持度,以及各产品N项集对应的绝对支持度后,进一步包括:
将绝对支持度不符合预设条件的产品单项集进行删除;以及,
将绝对支持度未达到预设的绝对支持度阈值的产品N项集进行删除。
4.如权利要求2所述的方法,其特征在于,根据获得的各产品单项集的绝对支持度和各产品N项集的绝对支持度,分别计算任意一个产品N项集表示的产品组合的产品关联度,包括:
若所述任意一个产品N项集为产品二项集,则根据该产品二项集对应的绝对支持度,以及该产品二项集包含的每一个产品单项集分别对应的绝对支持度,计算获得所述产品二项集表示的产品组合的关联度;
若所述任意一个产品N项集为产品三项集,则根据该产品三项集对应的绝对支持度,指定产品表征的产品单项集的绝对支持度,以及所述产品三项集中除去所述指定产品后表征的产品两项集对应绝对支持度,计算获得所述产品三项集与所述指定产品之间的关联度。
5.如权利要求4所述的方法,其特征在于,在确定各产品N项集表示的产品组合的产品关联度后,进一步包括:
将产品关联度未达到预设的关联度阈值的产品N项集进行删除。
6.根据权利要求2-5任一项所述的方法,其特征在于,根据各产品N项集对应的产品关联度,筛选出任意一产品对应的符合预设条件的产品组合方式,包括:
根据包含所述任意一产品的各产品二项集对应的产品关联度,筛选出产品关联度达到设定门限值的产品二项集,并确定选中的产品二项集所表示的二项产品组合方式集合;
根据包含所述任意一产品的各产品三项集与所述任意一产品之间的产品关联度,筛选出产品关联度达到设定门限值的产品三项集,并确定选中的产品三项集所表示的三项产品组合方式集合。
7.如权利要求6所述的方法,其特征在于,按照最终确定的产品组合方式,确定任意一产品的搭配产品,包括:
判断所述任意一产品对应的三项产品组合方式集合表示的与所述任意一产品之间的产品关联度,是否大于等于所述任意一产品对应的二项产品组合方式集合表示的产品关联度;
若是,则按照预设方式在所述三项产品组合方式集合中选择一种三项产品组合方式以确定所述任意一产品的搭配产品;
否则,进一步判断在二项产品组合方式集合和三项产品组合方式集合中,是否存在某一种二项产品组合方式为某一种三项产品组合方式集合的子集,若是,按照所述某一种三项产品组合方式确定所述任意一产品的搭配产品;否则,按照预设方式在所述二项产品组合方式集合中选择一种二项产品组合方式,确定所述任意一产品的搭配产品。
8.如权利要求2-5任一项所述的方法,其特征在于,所述获得产品间的搭配关系的步骤,在接收用户的选择请求之前执行,或者,在接收用户的选择请求之后,在确定所述目标产品的搭配产品的过程中执行。
9.一种基于产品间关联度提供搭配产品的装置,其特征在于,包括:
接收单元,用于接收用户的选择请求,确定该选择请求对应的目标产品;
发送单元,用于根据产品间的搭配关系确定所述目标产品的搭配产品,并向用户返回所述目标产品以及相应的搭配产品;
其中,所述产品间的搭配关系是通过以下功能单元获得的:
获取单元,用于获取用户的历史交易记录,并根据该历史交易记录确定设定时长内形成的事务集合,其中,任意一事务表征用户在上述设定时长内购买的所有产品的集合;
第一处理单元,用于形成各产品的产品单项集,每一个产品单项集表示一种产品,并计算每一个产品单项集的绝对支持度,其中,任意一个单项产品集合的绝对支持度为包含该任意一个产品的事务的数目;以及用于形成各产品的产品N项集,N>1,每一个产品N项集表示一个N种产品的组合,并计算每一个产品N项集的绝对支持度,其中,任意一个产品N项集的绝对支持度为包含该任意一个产品N项集的事务的数目;
第二处理单元,用于根据获得的各产品单项集的绝对支持度和各产品N项集的绝对支持度,分别计算每一个产品N项集表示的产品组合的产品关联度,所述产品关联度用于表征产品组合间的关联程度;
确定单元,用于根据各产品N项集对应的产品关联度,针对各产品分别筛选出相应的符合预设条件的产品组合方式,并按照最终确定的产品组合方式,确定各产品的搭配产品。
10.如权利要求9所述的装置,其特征在于,先通过所述获取单元、第一处理单元、第二处理单元和确定单元获得产品间的搭配关系,再通过所述接收单元接收用户的选择请求,或者,在所述接收单元接收用户的选择请求之后,在所述发送单元确定所述目标产品的搭配产品的过程中,通过所述获取单元、第一处理单元、第二处理单元和确定单元获得产品间的搭配关系。
一种基于产品间关联度提供搭配产品的方法及装置\n技术领域\n[0001] 本发明涉及电子商务领域,特别涉及一种基于产品间关联度提供搭配产品的方法及装置。\n背景技术\n[0002] 随着电子商务应用的日益普及,相关的电子商务网站也得到了空前的发展。现有技术下,当用户在电子商务网站的网页中选中(如,浏览、购买或收藏)一个产品时,电子商务网站会向其推荐网站内与选中产品具有最佳关联度的搭配产品(也称最佳搭配产品),从而方便用户一次性发现和购买意向相关的产品,进而减少用户的操作时间,提高电子商务网站的交易处理效率,提升电子商务网站的服务质量。\n[0003] 显然,最佳搭配产品的推荐已经是电子商务网站必备的技术手段之一。那么,如何根据历史交易记录显示的用户意图选取出最佳搭配产品,便是各电子商务网站需要首先优化的技术项目之一,这将成为衡量电子商务网站服务水平的重要指标之一。\n[0004] 目前,当用户在电子商务网站的网页中选中一个产品时,为了避免盲目和繁琐的搜索与浏览过程,电子商务网站会基于历史交易记录中记载的各用户的一次购物过程,快捷地发现与上述选中产品最配套或最相关的产品,作为最佳搭配产品提示给用户,以加速用户购物决策的有效性过程,从而提升用户体验与忠诚度;另一方面,也可以拓展用户的购物兴趣,激发购物量,提升网站的点击率与点击转化率。在这一过程中,各产品之间的最佳搭配关系(即关联程度),通常是通过计算各产品在同一订单内被同时购买的次数来确定:\n任意产品A的最佳搭配产品是与A在同一订单内被同时购买次数最多的产品组合。\n[0005] 这一方法的理念认为具有最佳搭配关系的产品组合是且仅是历史上最频繁被购买的产品组合。基于这一理念,现有的确定产品间搭配关系(即关联程度)的方法如下:\n[0006] 1)形成事务集合。具体为:将每个用户在一个订单内购买的产品集合设定为一个事务。\n[0007] 2)将网站内被购买过的产品进行任意两两组合,并计算每一个两项产品组合的绝对支持度;其中,任意两项产品组合的绝对支持度即为同时包含这两个产品的事务数目。\n[0008] 3)将网站内被购买过的产品进行任意三三组合,并计算每一个三项产品组合的绝对支持度,其中,任意三项产品组合的绝对支持度即为同时包含这三个产品的事务数目。\n[0009] 4)对于任意产品A,根据步骤2)所得结果,得到包含A的所有两项产品组合集合(A2),以及这些集合的绝对支持度。\n[0010] 5)对于任意产品A,对步骤4)所得A2进行筛选,删除绝对支持度小于一个设定阈值u2的两项产品组合,得到筛选结果B2。\n[0011] 6)对于任意产品A,在步骤5)所得B2中,选择绝对支持度达到预设门限值(例如,绝对支持度最大)的两项产品组合,形成A的两项产品组合的最佳搭配产品集合C2。\n[0012] 7)对于任意产品A,根据步骤3)所得结果,得到包含A的所有三项产品组合集合(A3),以及这些集合的绝对支持度。\n[0013] 8)对于任意产品A,对步骤7)所得A3进行筛选,删除绝对支持度小于一个设定阈值u3的三项组合得到。过滤结果B3。\n[0014] 9)对于任意产品A,在步骤8)所得B3中,选择绝对支持度达到预设门限值(例如,绝对支持度最大)的三项产品组合,形成A的三项产品组合的最佳搭配产品集合C3。\n[0015] 10)对于任意产品A,如果由步骤9)所得C3不为空,则选择C3中任意一个三项产品组合作为A的最佳搭配关系组合PA1,即PA1中包含的除产品A之外的其他两项产品与产品A的关联程度最高,当用户选中产品A时,电子商务网站将按照PA1中三项产品组合表征的关联关系向用户推荐其他两项产品;如果由步骤9)所得C3为空且由选择步骤6)所得C2不为空,则选择C2中任意一个两项产品组合作为A的最佳搭配关系组合PA2;即PA2中包含的除产品A之外的另一项产品与产品A的关联程度最高,当用户先中产品A时,电子商务网站将按照PA2中两项产品组合表征的关联关系向用户推荐另一项产品;如果C3与C2皆为空,则认为产品A无最佳搭配组合产品。\n[0016] 然而,现有技术下,电子商务网站在确定产品之间的关联关系时,将用户一次购买的产品集合作为一个事务,这种处理方式在实际应用中不具有理想的可操作性。这是因为,对于多商家并存并分别展开业务的综合性电子商务网站而言,如C2C(个人对个人)形式的电子商务网站,以及B2C(商家对个人)形式的电子商务网站,以及对于在单一商家每次下单只能购买一种产品的电子商务网站,“一次购买”概念过于狭隘。通常,这类电子商务网站是将一次下单作为“一次购买”来进行操作的,而用户所需的产品往往需要在不同的商家通过多次下单才能购买完毕,因此,将一次下单作为“一次购买”来进行事务集合的建立,会切断在不同商家购买的产品之间的关联性,从而影响最终推荐结果的准确性。\n[0017] 另一方面,大量热门产品由于具有购买普遍性,造成了包含这些产品的产品组合(两项产品组合、三项产品组合等等......)大量存在,并且其存在概率远大于其他类型的产品组合,从而使得这些产品组合被推荐的概率相应增大。而热门产品被推荐有两方面的无效性:一是热门产品因为口碑相传或排行榜等原因,已经在客户群中有较高的被认知率,用户无需通过推荐就可以便捷的对其作出是否购买的决策;二是绝对支持度表征的仅仅是产品被购买的次数,体现的是统计充分性征,并不能体现产品之间的关联性,因此会存在这样的情况:包含热门产品的产品组合的绝对支持度尽管很高,但产品组合内包含的热门产品与其他产品之间并不相关或者关联程度很低,进一步地说,最高支持度不代表最高关联度,因此,基于最高支持度来确定最佳搭配关系组合,其准确性有待商榷。\n[0018] 其次,在选择两项产品组合或三项产品组合作为最终的最佳搭配关系组合时,已有方案为:只要三项产品组合集全不为空就按照三项产品组合集合来确定PA,一般来说,选择三项产品组合集合的优势在于适当拓展了组成产品的数量,对用户具有有效的兴趣拓展,然而,当三项产品组合集合内产品之间的关联程度远低于两项产品组合集合内产品之间的关联程度,或者,三项产品组合集合内的部分组合中产品之间的关联程度较低时,简单选择三项产品组合集作为最终结果,其准确性同样有待商榷。\n发明内容\n[0019] 本发明实施例提供一种基于产品间的关联度确定产品搭配关系的方法及装置,用以在用户选中某一产品时,提高向其推荐的搭配产品的精确度。\n[0020] 本发明实施例提供的具体技术方案如下:\n[0021] 一种基于产品间关联度提供搭配产品的方法,包括:\n[0022] 接收用户的选择请求,确定该选择请求对应的目标产品;\n[0023] 根据产品间的搭配关系确定所述目标产品的搭配产品;\n[0024] 向用户返回所述目标产品以及相应的搭配产品;\n[0025] 其中,所述产品间的搭配关系是通过以下步骤获得的:\n[0026] 获取用户的历史交易记录,并根据该历史交易记录确定设定时长内形成的事务集合,其中,任意一事务表征用户在上述设定时长内购买的所有产品的集合;\n[0027] 形成各产品的产品单项集,每一个产品单项集表示一种产品,并计算每一个产品单项集的绝对支持度,其中,任意一个单项产品集合的绝对支持度为包含该任意一个产品的事务的数目;\n[0028] 形成各产品的产品N项集,N>1,每一个产品N项集表示一个N种产品的组合,并计算每一个产品N项集的绝对支持度,其中,任意一个产品N项集的绝对支持度为包含该任意一个产品N项集的事务的数目;\n[0029] 根据获得的各产品单项集的绝对支持度和各产品N项集的绝对支持度,分别计算每一个产品N项集表示的产品组合的产品关联度;\n[0030] 根据各产品N项集对应的产品关联度,针对各产品分别筛选出相应的符合预设条件的产品组合方式,并按照最终确定的产品组合方式,确定各产品的搭配产品。\n[0031] 一种基于产品间关联度提供搭配产品的装置,包括:\n[0032] 接收单元,用于接收用户的选择请求,确定该选择请求对应的目标产品;\n[0033] 发送单元,用于根据产品间的搭配关系确定所述目标产品的搭配产品,并向用户返回所述目标产品以及相应的搭配产品;\n[0034] 其中,所述产品间的搭配关系是通过以下功能单元获得的:\n[0035] 获取单元,用于获取用户的历史交易记录,并根据该历史交易记录确定设定时长内形成的事务集合,其中,任意一事务表征用户在上述设定时长内购买的所有产品的集合;\n[0036] 第一处理单元,用于形成各产品的产品单项集,每一个产品单项集表示一种产品,并计算每一个产品单项集的绝对支持度,其中,任意一个单项产品集合的绝对支持度为包含该任意一个产品的事务的数目;以及用于形成各产品的产品N项集,N>1,每一个产品N项集表示一个N种产品的组合,并计算每一个产品N项集的绝对支持度,其中,任意一个产品N项集的绝对支持度为包含该任意一个产品N项集的事务的数目;\n[0037] 第二处理单元,用于根据获得的各产品单项集的绝对支持度和各产品N项集的绝对支持度,分别计算每一个产品N项集表示的产品组合的产品关联度;\n[0038] 确定单元,用于根据各产品N项集对应的产品关联度,针对各产品分别筛选出相应的符合预设条件的产品组合方式,并按照最终确定的产品组合方式,确定各产品的搭配产品。\n[0039] 本发明实施例中,使用分布式硬件、操作系统与相应的并行程序开发语言,在电子商务网络中实现了以下应用功能:首先,基于设定时长确定事务集合,这样,一方面保证事务形成的有效性,另一方面也保证了事务内部包含的产品间的关联性;其次,在计算产品单项集和产品N项集的绝对支持度时,引入了相关性测度弥补绝对支持度的统计性质缺陷,从而在基于产品关联度来确定产品间的最佳搭配关系时,可以有效地提高所确定的搭配产品的准确度,这样,在用户选中某一产品时,电子商务网站可以基于用户需求及时地向其推荐更为精确的搭配产品,进而有效地保证了电子商务服务质量,优化了电子商务网站的性能。\n附图说明\n[0040] 图1为本发明实施例中网络架构示意图;\n[0041] 图2为本发明实施例中产品搭配关系计算平台功能结构示意图;\n[0042] 图3为本发明实施例中产品搭配关系计算平台基于各产品之间的关联度确定各产品对应的搭配产品流程图。\n具体实施方式\n[0043] 鉴于现有技术的缺陷,为了能够基于产品间的关联度,准确判定产品间的搭配关系,本发明实施例中,在确定产品间的搭配关系时,采用设定时长(如,一个季度、一个打折活动期间等等)内用户的消费行为来确定事务集合,这样,一方面有效解决了事务的形成,另一方面也提高了事务内部包含的产品之间存在关联性的潜在几率;其次,在绝对支持度的基础上,引入相关性测度(如,余弦测度),来表示产品间的关联性,较佳的,本实施例中,任意2个参量,如参量A与参量B的关联度(以余弦测度为例)定义为:\n[0044] (含参量A和参量B的事务集合数量)/((含参量A的事务集合数量)*含参量B的事务集合数量))1/2\n[0045] 下面结合附图对本发明优选的实施方式进行详细说明。\n[0046] 参阅图1所示,本发明实施例中,电子商务网络内包含有用户终端、Web服务器、交易数据库服务器、产品最佳搭配关系检索服务器和离线产品最佳搭配关系发现计算平台。\n其中,用户通过用户终端呈现的用户浏览器与电子商务网站交互,发送浏览、搜索、购买请求和相关信息,用户的请求由电子商务网站的Web服务器接收并进行相关处理,用户的购买信息经Web服务器发送到交易数据库服务存储,交易数据库服务器存储的用户购买信息经预处理转存入离线产品最佳搭配关系计算平台,该离线产品最佳搭配计算平台由分布式硬件集群、Hadoop分布式操作环境和文件系统以及基于MapReduce的Java语言程序组成。离线产品最佳搭配关系计算平台定期更新计算网站内产品最佳搭配关系,并产生每个线上产品的最佳搭配组合,计算完毕后将计算结果更新到产品最佳搭配关系检索服务器。当Web服务器接收到包含产品最佳搭配组合推荐功能的页面请求时,会向产品最佳搭配关系检索服务器发送相应检索请求,产品最佳搭配关系检索服务器接受该请求,检索服务器上的数据库,并将结果反馈给Web服务器,由其将结果嵌入到最终页面中反馈给用户终端,由用户终端通过用户浏览器呈现给相应用户。\n[0047] 本发明最终实现的线上功能通过上述系统完成,在实际应用中,离线产品最佳搭配关系计算平台和产品最佳搭配关系检索服务器可以是相互独立的功能实体,也可以是同一功能实体中不同的功能模块,具体设置方式根据实际应用环境的复杂程度确定,在此不再赘述。\n[0048] 参阅图2所示,本发明实施例中,离线产品最佳搭配关系计算平台包括接收单元\n200、发送单元201、获取单元20、第一处理单元21、第二处理单元22和确定单元23,其中,[0049] 接收单元200,用于接收用户的选择请求,确定该选择请求对应的目标产品;\n[0050] 发送单元201,用于根据产品间的搭配关系确定目标产品的搭配产品,并向用户返回目标产品以及相应的搭配产品;\n[0051] 其中,上述产品间的搭配关系是通过以下功能单元获得的:\n[0052] 获取单元20,用于获取用户的历史交易记录,并根据该历史交易记录确定设定时长内形成的事务集合,其中,任意一事务表征用户在上述设定时长内购买的所有产品的集合;\n[0053] 第一处理单元21,用于形成各产品的产品单项集,每一个产品单项集表示一种产品,并计算每一个产品单项集的绝对支持度,其中,任意一个单项产品集合的绝对支持度为包含该任意一个产品的事务的数目;以及用于形成各产品的产品N项集,N>1,每一个产品N项集表示一个N种产品的组合,并计算每一个产品N项集的绝对支持度,其中,任意一个产品N项集的绝对支持度为包含该任意一个产品N项集的事务的数目;\n[0054] 第二处理单元22,用于根据获得的各产品单项集的绝对支持度和各产品N项集的绝对支持度,分别计算每一个产品N项集表示的产品组合的产品关联度;\n[0055] 确定单元23,用于根据各产品N项集对应的产品关联度,针对各产品分别筛选出相应的符合预设条件的产品组合方式,并按照最终确定的产品组合方式,确定各产品的搭配产品。\n[0056] 在实际应用中,离线产品最佳搭配关系计算平台和产品最佳搭配关系检索服务器有可能是相互独立的装置,也有可能是集成一体的装置,若为后一种情况,则离线产品最佳搭配关系计算平台也可以代为完成产品最佳搭配关系检索服务器的功能,例如,参阅图2所示,离线产品最佳搭配关系计算平台在接收到Web服务器发送的包含产品最佳搭配组合推荐功能的页面请求时,检索服务器上的数据库,将Web服务器请求的任意产品对应的搭配产品反馈给Web服务器,由其将结果嵌入到最终页面中,并反馈给用户终端。\n[0057] 以下实施例中,为了便于描述,将离线产品最佳搭配关系计算平台简称为产品搭配关系计算平台,本实施例中,所谓的产品最佳搭配关系可以是关联度达到设定门限值的多种产品搭配组合,不一定仅仅有一种搭配方式。\n[0058] 实际应用中,产品搭配关系计算平台在接收用户的选择请求时,先确定该选择请求对应的目标产品,再根据产品间的搭配关系确定该目标产品的搭配产品,以及向用户返回该目标产品以及相应的搭配产品,其中,产品间的搭配关系是由产品搭配关系计算平台基于产品间关联度获得的,具体参阅图3所示,确定产品间搭配关系的详细流程如下:\n[0059] 步骤300:产品搭配关系计算平台在交易数据库服务器内检索用户的历史交易记录(如,一年内各用户的产品购买记录)。\n[0060] 本实施例中,产品搭配关系计算平台获得用户的历史交易记录后,需要从中抽取出可用于计算产品关联度的购买信息,并最终形成相应的数据表,其模式为<用户标识符,购买时间,产品标识符>,简称为RE表。\n[0061] 步骤301:产品搭配关系计算平台根据获得的历史交易记录确定设定时长内形成的事务集合,其中,任意一事务表征用户在上述设定时长内购买的所有产品的集合。\n[0062] 例如:基于步骤300中生成的RE表,以一个季度作为设定时长,将一个用户在一个季度中购买的产品集合形成一个事务,一个“事务标识”通过{用户标识,季度标识}表达,并最终形成相应的数据表,其模式为<用户标识符,季度标识,产品标识符>,简称为TP表。\n[0063] 步骤302:产品搭配关系计算平台形成各产品的产品单项集,每一个产品单项集表示一种产品,并计算每一个产品单项集的绝对支持度,其中,任意一个产品单项集的绝对支持度为包含该任意一个产品的事务的数目。\n[0064] 具体为:将用户购买过的每一件产品分别作为一个产品单项集,并分别计算每一个产品单项集的绝对支持度,如,在TP表中,将任一“产品标识符”的取值作为一个产品单项集,而包含该产品单项集的事务数目(不同{用户标识,季度标识}取值的数目)作为该产品单项集的绝对支持度。\n[0065] 计算结果存储的数据模式为<产品标识符,绝对支持度>,简称为OneIAS表。\n[0066] 步骤303:产品搭配关系计算平台形成各产品的产品N项集组合,N>1,每一个产品N项集表示一个N种产品的组合,并计算每一个N项产品集合的绝对支持度,其中,任意一个产品N项集的绝对支持度为包含该任意一个产品N项集的事务的数目。\n[0067] 实际应用中,根据用户的推荐需求,在生成各产品的产品N项集时,可以生成相应的产品二项集、产品三项集、产品四项集、产品五项集......,但鉴于需要将算法复杂度控制在一定程度内以保证系统运行性能,本实施例中,较佳的,仅以生成产品二项集和产品三项集的方式对步骤303的具体实施进行介绍(但并不局限于此):\n[0068] (1)首先,形成各产品的产品二项集,即凡是至少被一个事务包含的两个产品形成一个产品二项集。产品二项集的形成是基于TP表中记录的事务标识自连接计算得到的,其计算结果存储的数据模式为<产品标识符_1,产品标识符_2>,简称为TwoI表。需要指出的是,为了避免TwoI表中数据与集合语义的重复,较佳的,自连接结果需经过预设条件的筛选,以保证产品标识符_1的取值小于产品标识符_2的取值以及每行数据的区别。\n[0069] 接着,计算每一个产品二项集的绝对支持度,任意一个产品二项集的绝对支持度为包含该产品二项集的事务的数目,可以通过检索TwoI表中任一行对应的产品二项集,计算其绝对支持度。\n[0070] 其计算结果存储的数据模式为<产品标识符_1,产品标识符_2,绝对支持度>,简称为TwoIAS表。\n[0071] (3)其次,形成各产品的产品三项集,即凡是至少被一个事务包含的三个产品组合形成一个产品三项集。产品三项集的形成是基于TP表中记录的事务标识自连接计算得到的,其计算结果存储的数据模式为<产品标识符_1,产品标识符_2,产品标识符_3>,简称为ThreeI表。需要指出的是,避免ThreeI表中数据与集合语义的重复,较佳的,自连接结果需经过预设条件的筛选,以保证产品标识符_1的取值小于产品标识符_2的取值,产品标识符_\n2的取值小于产品标识符_3的取值以及每行数据的区别。\n[0072] 接着,计算每一个产品三项集的绝对支持度,任意一个产品三项集的绝对支持度为包含该产品三项集的事务的数目,可以通过检索ThreeI表中任一行对应的产品三项集,计算其绝对支持度。\n[0073] 其计算结果的存储的数据模式为<产品标识符_1,产品标识符_2,产品标识符_3,绝对支持度>,简称为ThreeIAS表。\n[0074] 基于上述步骤形成的产品单项集、产品二项集和产品三项集,实际应用中,为了优化计算结果,较佳的,在步骤302中,在获得OneIAS表后,还需要进一步对其记录的各产品单项集进行筛选,如,将任意一产品单项集对应的绝对支持度、包含该产品单项集的产品二项集的绝对支持度阈值(预先设置)和包含该产品单项集的产品三项集的绝对支持度阈值(预先设置)进行比较,若上述任意一产品单项集的绝对支持度的取值最小,则将该产品单项集从OneIAS表中删除;另一方面,还需要根据预设的产品二项集的绝对支持度阈值,将绝对支持度的取值小于该阈值的产品二项集从TwoIAS表中删除,以及,根据预设的产品三项集的绝对支持度阈值,将绝对支持度的取值小于该阈值的产品三项集从ThreeIAS表中删除。这样,便可以筛选出符合预设条件的产品单项集、产品二项集和产品三项集,从而方便后续的计算操作。\n[0075] 步骤304:产品搭配关系计算平台根据获得的各产品单项集的绝对支持度和各产品N项集的绝对支持度,分别计算每一个产品N项集表示的产品组合的产品关联度。\n[0076] 具体为:\n[0077] (1)计算每一个产品二项集表示的产品组合的产品关联度。\n[0078] 例如,根据OneIAS表和TwoIAS表中记录中记录的信息,对于TwoIAS表中任一行<产品标识符_1,产品标识符_2,绝对支持度>,通过以下公式计算出两种产品的关联度:\n[0079] (产品标识符1与产品标识符2集合的绝对支持度/((产品标识1的绝对支持度)*\n1/2\n(产品标识2的绝对支持度))\n[0080] 其中,产品标识符1的绝对支持度和产品标识符2的绝对支持度可以通过查询OneIAS表获得,产品标识符1和产品标识符2集合的绝对支持度可以通过查询TwoIAS获得。\n[0081] 其处理结果存储的数据模式为<产品标识符_1,产品标识符_2,关联度>,简称TwoIASR表。\n[0082] 较佳的,上述处理结果还需要作进一步筛选处理,筛选条件为预设的两项产品组合关联度阈值,小于该阈值的产品二项集将被从TwoIASR表中删除。\n[0083] (2)计算每一个产品三项集表示的产品组合的产品关联度。\n[0084] 例如,根据OneIAS表、TwoIAS表和ThreeIAS表中记录中记录的信息,对于任意一个产品A,根据ThreeIAS表,检索出包含A的所有产品三项集,对于其中任意一个产品三项集<产品标识符_1,产品标识符_2,产品标识符_3,绝对支持度>,通过以下公式计算该产品三项集与产品A的关联度:\n[0085] (产品标识符_1,产品标识符_2,产品标识符_3集合的绝对支持度/((产品A的绝对支持度)*产品标识符_1,产品标识符_2,产品标识符_3集合除去产品A后的二项产品组合的绝对支持度))1/2\n[0086] 其中,产品标识符_1,产品标识符_2,产品标识符_3集合的绝对支持度可以通过查询ThreeIAS表获得,产品A的绝对支持度可以通过查询OneIAS表获得,产品标识符_1,产品标识符_2,产品标识符_3集合除去A后的二项产品组合的绝对支持度可以通过查询TwoIAS表获得。\n[0087] 其处理结果存储的数据模式为<产品标识,3项搭配产品标识1,3项搭配产品标识\n2,关联度>,简称ThreeIASR表。\n[0088] 较佳的,上述处理结果还需要作进一步筛选处理,筛选条件为预设的三项产品组合关联度阈值,小于该阈值的产品三项集将被从ThreeIASR表中删除。\n[0089] 步骤305:产品搭配关系计算平台根据各产品N项集对应的产品关联度,针对各产品分别筛选出相应的符合预设条件的产品组合方式。\n[0090] 具体为:\n[0091] (1)根据形成的产品二项集,按照预设的二项产品筛选条件筛选出符合要求的产品二项集(可以为一个或多个),即将其作为二项产品组合的最佳搭配候选集。\n[0092] 例如,根据TwoIASR表,形成每个产品对应的二项产品组合表,其数据模式为<产品标识,2项搭配产品标识,关联度>,简称为TwoP表。\n[0093] 具体计算可通过具有类似如下SQL语句功能的方式实现:\n[0094] Select 产品标识符_1,产品标识符_2,关联度\n[0095] From TwoIASR\n[0096] Union all\n[0097] Select 产品标识符_2,产品标识符_1,关联度\n[0098] From TwoIASR\n[0099] 接着,根据TwoP表,分别确定每一个产品对应的二项产品组合表中的最大关联度(也可以是次大关联度、或者,最大关联度和次大关联度等等,此处仅为举例),并将每一个产品对应的最大关联度作为计算结果进行存储,其数据模式为<产品标识,最大关联度值>,简称为TwoMR表;具体计算可通过具有类似如下SQL语句功能的方式实现:\n[0100] Select 产品标识,Max(关联度)\n[0101] From TwoP\n[0102] Group by 产品标识\n[0103] 最后,根据TwoP表与TwoMR表,计算得到每个产品对应的具有最大应最大关联度的二项产品组合,并将计算结果作为二项最佳搭配候选集进行存储,其数据模式为<产品标识,2项最佳搭配候选产品标识>,简称为TwoPC表。由于关联度的取值有可能相同,因此,任意一产品对应的二项最佳搭配候选集中可以包含多种二项产品组合。\n[0104] (2)根据形成的产品三项集,按照预设的三项产品筛选条件筛选出符合要求的产品三项集(可以为一个或多个),即将其作为三项产品组合的最佳搭配候选集。\n[0105] 例如:根据ThreeIASR表,计算每个产品对应的三项产品组合中的最大关联度(也可以是次大关联度、或者,最大关联度和次大关联度等等,此处仅为举例),并将每一个产品对应的最大关联度作为计算结果进行存储,其数据模式<产品标识,最大关联度值>,简称ThreeMR表;具体计算可通过具有类似如下SQL语句功能的方式实现:\n[0106] Select 产品标识,Max(关联度)\n[0107] From ThreeIASR\n[0108] Group by 产品标识\n[0109] 接着,根据ThreeIASR表与ThreeMR表,计算得到每个产品对应的具有最大应最大关联度的三项产品组合,并将计算结果作为三项最佳搭配候选集进行存储,其数据模式为<产品标识,3项搭配产品标识1,3项搭配产品标识2>,简称ThreePC表,由于关联度的取值有可能相同,因此,任意一产品对应的三项最佳搭配候选集中可以包含多种三项产品组合。\n[0110] 步骤306:产品搭配关系计算平台按照最终确定的产品组合方式,确定各产品的搭配产品。\n[0111] 具体为:对于任意一产品A,在确定其理想的搭配产品时,通过检索TwoMR与ThreeMR,分别得到A的二项最佳搭配候选集与三项最佳搭配候选集对应的关联度;接着,进行以下判定:\n[0112] 如果三项最佳搭配候选集的关联度≥二项最佳搭配候选集的关联度,则选择ThreePC中产品A对应的三项产品组合集合(以下称为M3)中任意一组合作为产品A的最佳搭配关系,并根据此搭配关系确定产品A对应的搭配产品。\n[0113] 如果三项最佳搭配候选集的关联度<二项最佳搭配候选集的关联度,则进一步处理二项最佳搭配候选集TwoPC中产品A对应的二项产品组合集合(以下称为M2),具体为:\n[0114] 若M2中无组合是M3的子集,则选择M2中的某一个二项产品组合作为最佳搭配关系,以最终确定产品A的搭配产品,例如,可以从M2中随机选取一个二项产品组合,或者,进一步按照其他条件选取一个二项产品组合,作为最终选择。\n[0115] 如果M2中有组合是M3中某组合的子集,则选择M3中相应的某一个三项产品组合作为最佳搭配关系,以最终确定产品A的搭配产品。例如,假设M3中有多个组合的子集出现在M2中,则在这些组合中随机选取一个三项产品组合,或者,进一步按照其他条件选取一个二项产品组合,作为最终的选择。\n[0116] 当然,在本实施例中,为了节省计算量,在符合用户使用要求的前提下,还可以通过仅计算产品二项集或产品三项集的方式,来判定各产品的最佳搭配关系,本实施例中,仅以同时计算产品二项集和产品三项集的方式为例进行说明,在此不再赘述。\n[0117] 基于上述实施例,实际应用中,产品搭配关系计算平台可以在接收到用户发送的选择请求并确定相应的目标产品后,执行步骤300-步骤306来获得产品间的搭配关系,然后,再根据已获得的产品间的搭配关系确定目标产品的搭配产品,以及向用户返回目标产品以及相应的搭配产品;或者,产品搭配关系计算平台也可以预先执行步骤300-步骤306来获得产品间的搭配关系,并在接收到用户发送的选择请求后确定相应的目标产品,以及根据已获得的产品间的搭配关系确定目标产品的搭配产品,并向用户返回目标产品以及相应的搭配产品。即表示,产品间搭配关系的确定的时机可以根据实际应用需要而灵活设置,并不局限于一种实现模式,除上述两种执行方式外,还存在其他多种灵活的设置方式,在此不再赘述。\n[0118] 另一方面,在上述实施例中,产品间的关联度是基于余弦测试进行计算的,在实际应用中,还可以采用其他类型的统计测度计算关联度:\n[0119] 例如,可以采用覆盖度(coverage)作为统计测试来计算产品间的关联度,覆盖度的定义如下:\n[0120]\n[0121] 其中,集合Y与产品X的覆盖度表示为:X与Y形成的集合的绝对支持度除以Y的绝对支持度。\n[0122] 又例如,还可以采用提升度(lift)作为统计测度来计算产品间的关联度,提升度的定义如下:\n[0123]\n[0124] 其中,集合Y与产品X的提升度表示为:X与Y形成的集合的绝对支持度除以Y的绝对支持度与X的绝对支持度的乘积。\n[0125] 综上所述,本发明实施例中,使用分布式硬件、操作系统与相应的并行程序开发语言,在电子商务网络中实现了以下应用功能:首先,基于设定时长确定事务集合,这样,一方面保证事务形成的有效性,另一方面也保证了事务内部包含的产品间的关联性;其次,在计算产品单项集和产品N项集的绝对支持度时,引入了相关性测度弥补绝对支持度的统计性质缺陷,从而在基于产品关联度来确定产品间的最佳搭配关系时,可以有效地提高所确定的搭配产品的准确度,这样,在用户选中某一产品时,电子商务网站可以基于用户需求及时地向其推荐更为精确的搭配产品,进而有效地保证了电子商务服务质量,优化了电子商务网站的性能。\n[0126] 进一步地,本实施例中,是通过考量多种产品组合方式之间的集合包含关系来最终确定产品间的最佳搭配关系的,这样,便从全局候选空间与局部候选空间两个角度对最终最佳搭配关系的确定引入了更严格的遴选机制,从而进一步提升了最终确定的产品搭配关系的准确度。\n[0127] 显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
法律信息
- 2016-12-14
- 2013-06-12
实质审查的生效
IPC(主分类): G06Q 30/02
专利申请号: 201110343441.8
申请日: 2011.11.03
- 2013-05-08
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2011-05-25
|
2011-01-07
| | |
2
| |
2008-06-25
|
2007-12-25
| | |
3
| |
2008-12-17
|
2008-07-24
| | |
4
| |
2010-08-11
|
2009-02-06
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |