著录项信息
专利名称 | 查询结果排序方法及装置 |
申请号 | CN201010590355.2 | 申请日期 | 2010-12-07 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2012-07-04 | 公开/公告号 | CN102542474A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | 暂无 | IPC分类号 | 暂无查看分类表>
|
申请人 | 阿里巴巴集团控股有限公司 | 申请人地址 | 英属开曼群岛大开曼资本大厦一座四层847号邮箱
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 阿里巴巴集团控股有限公司 | 当前权利人 | 阿里巴巴集团控股有限公司 |
发明人 | 陈超;冯景华 |
代理机构 | 隆天知识产权代理有限公司 | 代理人 | 张浴月;刘文意 |
摘要
本申请提供一种查询结果排序方法及装置,其中方法包括:接收用户输入的查询词;搜索到与所述查询词对应的商品信息;提取与所述查询词对应的商品信息的类目与属性;根据所获取的所述商品信息的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数;根据提取出的类目的档位与权重最高的属性的个数,获取与所述查询词对应的商品信息的用户需求值;以及根据所获取的用户需求值对所述商品信息排序。本申请提供的方法及装置,能够提高网上交易系统的流量质量,提高点击率。
1.一种查询结果排序方法,用于网上交易系统,其特征在于,包括在线上执行的如下步骤:
接收用户输入的查询词;
搜索到与所述查询词对应的商品信息;
提取与所述查询词对应的商品信息的类目与属性;
根据所获取的所述商品信息的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数;
根据提取出的类目的档位与权重最高的属性的个数,获取与所述查询词对应的商品信息的用户需求值;以及
根据所获取的用户需求值对所述商品信息排序;
在接收用户输入的查询词之前,还包括在线下执行的如下步骤:根据网上交易系统中的所述商品信息的类目与属性,获取所述商品信息的类目的分档信息与属性的分档信息。
2.如权利要求1所述的方法,其特征在于,根据网上交易系统中的所述商品信息的类目与属性,获取所述商品信息的类目的分档信息与属性的分档信息,包括:
提取所述网上交易系统中的所有所述商品信息的类目与属性;
根据所述网上交易系统中的点击日志和曝光日志,计算所述查询词对应的商品信息的点击率;
将所述查询词对应的商品信息的点击率作为所述查询词对应的所述类目的点击率与属性的点击率,根据所述查询词对应的所述类目的点击率与属性的点击率,将所述类目与属性分档,获取所述类目的分档信息与属性的分档信息。
3.如权利要求2所述的方法,其特征在于,根据所述查询词对应的所述类目的点击率与属性的点击率,将所述类目与属性分档,包括:
根据所述查询词对应的所述类目的点击率和/或所述类目的流量,将所述类目分档;
以及,
根据所述查询词对应的所述属性的点击率和/或所述属性的流量,将所述属性分档。
4.如权利要求1-3中任一权利要求所述的方法,其特征在于,根据提取出的类目的档位与权重最高的属性的个数,获取与所述查询词对应的商品信息的用户需求值,包括:
将类目的档位和权重最高的属性的个数与用户偏好权重相结合,计算基于所述查询词的商品信息的用户需求值。
5.如权利要求4所述的方法,其特征在于,根据所获取的用户需求值对所述商品信息排序,包括:
将所述查询词对应的商品信息进行分档;
根据所获取的用户需求值调整所述商品信息在各个档位内的排序。
6.如权利要求2所述的方法,其特征在于,还包括:根据所述网上交易系统中的点击日志和曝光日志,识别并过滤不能体现用户需求的数据。
7.如权利要求1-3中任一权利要求所述的方法,其特征在于,还包括:在根据所获取的用户需求值对所述商品信息排序时,过滤掉用户需求值低于预设阈值的商品信息。
8.一种查询结果排序装置,用于网上交易系统,其特征在于,包括:
接收模块,用于接收用户输入的查询词;
搜索模块,用于搜索到与所述查询词对应的商品信息;
提取模块,用于提取与所述查询词对应的商品信息的类目与属性;
查找模块,用于根据所获取的所述商品信息的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数;
获取模块,用于根据提取出的类目的档位与权重最高的属性的个数,获取与所述查询词对应的商品信息的用户需求值;
排序模块,用于根据所获取的用户需求值对所述商品信息排序;
其中,还包括预处理模块,用于在线下执行如下步骤:根据网上交易系统中的所述商品信息的类目与属性,获取所述商品信息的类目的分档信息与属性的分档信息;
其中,所述接收模块、所述搜索模块、所述提取模块、所述查找模块、所述获取模块和所述排序模块执行的操作是线上操作。
9.如权利要求8所述的装置,其特征在于,所述预处理模块包括:
提取单元,用于提取所述网上交易系统中的所有所述商品信息的类目与属性;
计算单元,用于根据所述网上交易系统中的点击日志和曝光日志,计算所述查询词对应的商品信息的点击率;
分档单元,用于将所述查询词对应的商品信息的点击率作为所述查询词对应的所述类目的点击率与属性的点击率,根据所述查询词对应的所述类目的点击率与属性的点击率,将所述类目与属性分档,获取所述类目的分档信息与属性的分档信息。
10.如权利要求8-9中任一权利要求所述的装置,其特征在于,所述获取模块具体用于将类目的档位和权重最高的属性的个数与用户偏好权重相结合,计算基于所述查询词的商品信息的用户需求值。
11.如权利要求8-9中任一权利要求所述的装置,其特征在于,所述排序模块包括:
第一排序单元,用于将所述查询词对应的商品信息进行分档;
第二排序单元,用于根据所获取的用户需求值调整所述商品信息在各个档位内的排序。
12.如权利要求11所述的装置,其特征在于,所述第二排序单元还用于根据所获取的用户需求值调整所述商品信息在各个档位内的排序时,过滤掉用户需求值低于预设阈值的商品信息。
查询结果排序方法及装置\n技术领域\n[0001] 本申请涉及数据处理领域,尤其涉及一种查询结果排序方法及装置。\n背景技术\n[0002] 现有技术中提供一种用于网上交易系统中的排序方法基于相关性和市场机制,即通过信息的相关性以及商业因素来影响排序。例如可以通过信息质量、供应商因素等影响排序。\n[0003] 这种方法的核心是根据查询结果的相关性和商业因素来排序,它的缺点是:排序结果不能很好满足买家需求。因为这种排序方法产生的排序结果主要考虑相关性和其他商业因素,而不区分每条信息对于用户的需求满足情况,这会导致相关性好但是用户需求程度不高的信息展示过多,降低搜索结果的点击率,买家体验较差。\n[0004] 这种方法产生的排序结果导致卖家点击率偏低。卖家点击率等于总点击量除以总曝光量,当买家的需求类型和信息不匹配的时候,点击率会降低,从而使得网上交易系统的流量质量不高、点击率偏低。\n[0005] 此外这种方法不能对商品信息加以区分,导致服务器每次响应用户通过客户端发送的查询请求展现搜索结果时,会不加区分地将用户需求程度高和用户需求程度低的所有商品信息混杂在一起传输至用户客户端,导致网络中的数据传输量巨大,响应速度慢。并且当用户点击商品信息时,由于用户需求程度高和需求程度低的所有商品信息混杂在一起,导致用户会点击大量自己不需要的商品信息,从而使得用户通过客户端向服务器发出大量无用的商品信息的查询请求,增加了服务器的工作压力,进一步影响了服务器的响应速度。\n[0006] 而且,这种方法也不利于市场资源的有效配置。因为,采用这种方法,不同需求程度的商品信息具有大致相同的展现概率,这既让一部分具有高需求程度的卖家失去了展示信息的机会,又降低了需求程度较低的卖家的点击率,不利于市场效率的提升。\n发明内容\n[0007] 本申请提供一种查询结果排序方法与装置,以解决现有技术中流量质量不高、点击率偏低以及由于对商品信息不加区分地发送给客户端导致的服务器工作压力大的问题。\n[0008] 本申请提供了一种查询结果排序方法,包括:\n[0009] 接收用户输入的查询词;\n[0010] 搜索到与所述查询词对应的商品信息;\n[0011] 提取与所述查询词对应的商品信息的类目与属性;\n[0012] 根据所获取的所述商品信息的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数;\n[0013] 根据提取出的类目的档位与权重最高的属性的个数,获取与所述查询词对应的商品信息的用户需求值;以及\n[0014] 根据所获取的用户需求值对所述商品信息排序。\n[0015] 本申请还提供了一种查询结果排序装置,包括:\n[0016] 接收模块,用于接收用户输入的查询词;\n[0017] 搜索模块,用于搜索到与所述查询词对应的商品信息;\n[0018] 提取模块,用于提取与所述查询词对应的商品信息的类目与属性;\n[0019] 查找模块,用于根据所获取的所述商品信息的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数;\n[0020] 获取模块,用于根据提取出的类目的档位与权重最高的属性的个数,获取与所述查询词对应的商品信息的用户需求值;\n[0021] 排序模块,用于根据所获取的用户需求值对所述商品信息排序。\n[0022] 本申请提供的查询结果排序方法及装置,根据所获取的商品信息的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数;根据提取出的类目的档位与权重最高的属性的个数,获取与查询词对应的商品信息的用户需求值;根据所获取的用户需求值对商品信息排序。由于所获取的提取出的类目的档位与权重最高的属性的个数能够体现用户的需求程度,使得计算出的用户需求值可以反映用户的需求程度,这样,就可以将用户需求程度高的商品信息优先展示,能够提高网上交易系统的流量质量,提高点击率。\n[0023] 并且本申请提供的方法及装置中,根据用户需求值的高低对商品信息加以区分,使得服务器返回给客户端的商品信息中,用户需求值高的商品信息优先显示,避免用户点击大量自己不需要的商品信息,减少用户通过客户端向服务器发送商品信息的查询请求的数量,从而减轻服务器的工作压力,提高服务器的响应速度。\n[0024] 通过以下参照附图对优选实施例的说明,本申请的上述以及其它目的、特征和优点将更加明显。\n附图说明\n[0025] 图1示例性示出本申请涉及到的一个网上交易处理系统的结构示意图;\n[0026] 图2示例性示出本申请查询结果排序方法的流程图;\n[0027] 图3示例性示出本申请中网上交易系统中线下获取商品信息的类目的分档信息与属性的分档信息的流程示意图;\n[0028] 图4示例性示出本申请查询结果排序装置的结构示意图;\n[0029] 图5示例性示出图4中预处理模块的结构示意图;\n[0030] 图6示例性示出图4中排序模块的结构示意图。\n具体实施方式\n[0031] 下面将详细描述本申请的实施例。应当注意,这里描述的实施例只用于举例说明,并不用于限制本申请。\n[0032] 本申请首先提出一种用户需求值的获取方案,将用户的点击行为通过文本的结构化信息进行泛化,换言之,通过被点击过的商品信息的特征数据获取用户对未被点击过的商品信息的需求,进而获得与某一查询词对应的所有商品信息的用户需求值。使用本申请的用户需求值的获取方案对商品信息排序,可以有效提升用户需求值高的商品信息的排序位置,提升搜索的质量,还可以过滤掉用户需求值低的商品信息甚至垃圾信息,减少数据流量,提高服务器对用户的查询请求的响应速度。\n[0033] 本申请还提出一种查询结果排序方法,其在响应用户的查询请求时,使用上述用户需求值对与查询词对应的商品信息进行排序。\n[0034] 图1示例性示出本申请涉及到的一个网上交易处理系统的结构示意图,该系统包括客户端1和网上交易系统2,客户端1的数量可以是多个,各个客户端1均可以与网上交易系统2进行数据交互。网上交易系统2用于提供商品信息处理,卖家可以通过客户端1在网上交易系统2上展示商品,买家可以通过客户端1从网上交易系统2上购买商品。\n[0035] 图2示例性示出本申请查询结果排序方法的流程图,包括:\n[0036] 步骤101、接收用户输入的查询词。\n[0037] 步骤102、搜索到与查询词对应的商品信息。\n[0038] 步骤103、提取与查询词对应的商品信息的类目与属性。\n[0039] 步骤104、根据所获取的商品信息的类目的分档信息与属性数据的分档信息,查找提取出的类目的档位与权重最高的属性的个数。\n[0040] 步骤105、根据提取出的类目的档位与权重最高的属性的个数,获取与查询词对应的商品信息的用户需求值。\n[0041] 步骤106、根据所获取的用户需求值对商品信息排序。\n[0042] 本申请提供的查询结果排序方法,根据所获取的商品信息的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数;根据提取出的类目的档位与权重最高的属性的个数,获取与查询词对应的商品信息的用户需求值;根据所获取的用户需求值对商品信息排序。由于所获取的提取出的类目的档位与权重最高的属性的个数能够体现用户的需求程度,使得计算出的用户需求值可以反映用户的需求程度,这样,就可以将用户需求程度高的商品信息优先展示,能够提高网上交易系统的流量质量,提高点击率。\n[0043] 并且本申请提供的方法中,根据用户需求值的高低对商品信息加以区分,使得服务器返回给客户端的商品信息中,用户需求值高的商品信息优先显示,避免用户点击大量自己不需要的商品信息,减少用户通过客户端向服务器发送商品信息的查询请求的数量,从而减轻服务器的工作压力,提高服务器的响应速度。\n[0044] 上述步骤101-106可以由网上交易系统执行。\n[0045] 在步骤101之前还可以包括:根据网上交易系统中的商品信息的类目与属性,获取商品信息的类目的分档信息与属性的分档信息。\n[0046] 网上交易系统获取商品信息的类目的分档信息与属性的分档信息的步骤可以预先执行,即可以在线下进行,而无需在线上进行,即无需在商品交易时进行。这样,网上交易系统在接收到查询词以后,可以直接根据预先获取的商品信息的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数,这样就无需在商品交易过程中进行商品信息的类目的分档信息与属性的分档信息的获取的步骤,可以提高商品交易过程中数据处理速度,提升用户体验。\n[0047] 在本申请的实施例中,商品信息的特征数据可以包括类目、属性、产品词、卖家地域和产品价格中的任一个或任意组合。\n[0048] 根据一个实施例,可以提取类目和属性作为特征数据。类目用于描述商品信息的分类。每个商品信息都有相应的分类与之对应。比如:关于手机的商品信息放在手机类目下。属性用于描述商品信息的描述维度,每个商品信息都可以有若干商品信息的描述维度与之对应。比如:关于手机的商品信息,可包含品牌、制式、屏幕尺寸等描述维度。\n[0049] 在本申请的实施例中之所以选择类目和属性作为商品信息的特征数据,是由于,点击率的高低很大程度上取决于商品的分类和描述维度,用这两个特征数据更有利于区分点击数据,并且由于通常每一条商品信息都具有这两个特征数据,所以比较容易用这两个特征数据进行特征泛化。比如:用户搜索某一个查询词,可以统计出每个类目以及每个属性对应的点击率。由于每条商品信息都具有类目和属性字段,所以可以计算出每条商品信息的这两个字段上的点击率。\n[0050] 在使用类目和属性作为特征数据的情况下,根据网上交易系统中的所述商品信息的类目与属性,获取商品信息的类目的分档信息与属性的分档信息的步骤,具体可以包括:\n[0051] 步骤100a、提取网上交易系统中的所有商品信息的类目与属性。\n[0052] 步骤100b、根据网上交易系统中的点击日志和曝光日志,计算查询词对应的商品信息的点击率。\n[0053] 步骤100c、将查询词对应的商品信息的点击率作为查询词对应的类目的点击率与属性的点击率,根据查询词对应的类目的点击率与属性的点击率,将类目与属性分档,获取类目的分档信息与属性的分档信息。\n[0054] 在步骤100b中已经计算出每个商品信息的点击率,由于每条商品信息可以表示为类目和属性集合的形式,在步骤100c中,可以将查询词对应的商品信息的点击率作为查询词对应的类目的点击率与属性的点击率。例如,某条商品信息的类目是M,具有属性N1、N2……Nn,如果在某次搜索中用户点击了该商品信息,就认为该商品信息对应的类目M和属性N1、N2……Nn均获得到了点击,如果用户没点击该信息,就认为该商品信息对应类目和属性未获得点击。\n[0055] 在本申请的实施例中,上述步骤100a与步骤100b可以顺序执行,也可以由本领域普通技术人员根据实际情况决定,例如,可以同步执行,也可以先执行步骤100b,后执行步骤100a。\n[0056] 步骤100b中的查询词可以是指网上交易系统过去的一预设时段内接收的用户输入的查询词。该预设时间段可以根据实际情况确定,例如,可以是一周,也可以是几个月,等等。\n[0057] 根据一个实施例,步骤100b还可以包括:根据所述网上交易系统中的点击日志和曝光日志,识别并过滤不能体现用户需求的数据。其中,曝光日志记录有商品信息展示给用户的次数,点击日志记录有展示给用户的商品信息被点击的次数。比如:如果通过分析点击日志和曝光日志,发现某次搜索中,曝光的所有商品信息均被点击,则可以认为该次搜索行为不能反映出用户的需求,因此,将该次搜索行为设定为无效,点击日志和曝光日志中记录的与该次搜索行为相关的点击数据与曝光数据不用于计算查询词对应的商品信息的点击率。\n[0058] 步骤100c中,根据查询词对应的类目的点击率与属性的点击率,将类目与属性分档,可以包括:根据查询词对应的类目的点击率和/或类目的流量,将类目分档;以及,根据查询词对应的属性的点击率和/或属性的流量,将属性分档。\n[0059] 经过步骤100c后,就可以获取类目的分档信息和属性的分档信息。\n[0060] 类目的分档信息可以包括各个类目的档位以及各个档位对应的具体的类目。如表一所示为本申请的实施例中类目的分档信息。\n[0061] 表一、本申请实施例中类目的分档信息\n[0062] \n 类目档位 各个档位对应的具体的类目\n 1档 类目A1、类目A2、……\n 2档 类目B1、类目B2、……\n 3档 类目C1、类目C2、……\n[0063] 具体如何分档,可以参考表二。如表二所示为本申请中类目的档位的描述信息,该档位的描述信息用于描述满足该档位的标准是什么。\n[0064] 表二、本申请的实施例中类目的档位的描述信息\n[0065] \n[0066] 属性的分档信息可以包括各个属性的档位以及各个档位对应的具体的属性。如表三所示,表三所示为本申请的实施例中属性的分档信息。\n[0067] 表三、本申请的实施例中属性的分档信息\n[0068] \n 属性档位 各个档位对应的具体的属性\n 1档 属性D1、属性D2、……\n 0档 属性E1、属性E2、……\n[0069] 具体如何分档,可以参考表四。如表四所示为本申请中属性的档位的描述信息,该档位的描述信息用于描述满足该档位的标准是什么。\n[0070] 表四、本申请的实施例中属性的档位的描述信息\n[0071] \n[0072] 表二中,高PV类目是指在一设定的时间内,该类目的流量大于第一阈值。第一阈值可以设置为查询词对应所有类目的流量总和的阈值的10%,也可以设置为固定的次数,例如100次、200次等。设定时间可以是2周,也可以是其他的时间段,可以根据数据处理的实际情况来确定。\n[0073] 低PV类目是指在一设定的时间内,该类目的流量低于第二阈值。第二阈值可以设置为查询词对应所有类目的流量总和的1%,也可以设置为固定的次数,例如5次。\n[0074] 中PV类目是指在一设定的时间内,该类目的流量在第一阈值与第二阈值之间,即,既非高PV类目,也非低PV类目。\n[0075] 表一、表二、表三和表四仅为本申请提供的示例性的表格,本领域普通技术人员应可以根据实际情况进行各种改型或替换。例如,类目的档位的描述信息中可以只采用查询词平均类目的点击率作为确定档位的标准,而不采用类目的流量作为确定档位的标准,或者也可以单独采用类目的流量作为确定档位的标准。又例如,在采用查询词平均类目的点击率作为确定类目的档位的标准时,还可以采用能实现与查询词平均类目的点击率同样功能的其他数据作为确定类目的档位的标准。又例如,在采用查询词平均类目点击率作为确定类目的档位的标准时,还可以采用其他数值,而不限于表二中示出的100%、75%、90%等等。属性的档位的描述信息中可以只采用查询词平均属性的点击率作为确定档位的标准,而不采用属性的流量作为确定档位的标准;也可以只采用属性的流量作为确定档位的标准,而不采用查询词平均属性的点击率作为确定档位的标准;或者也可以采用属性的流量和查询词平均属性的点击率作为确定档位的标准。\n[0076] 表一中,1档是权重最高的档位,2档是权重次之的档位,3档权重最小;表三中,1档是权重最高的档位,0档是权重次之的档位,当然本申请实施例只是示例性的说明,在具体应用中所划分的档位可以根据实际情况做调整。如果预先获取的类目的分档信息和属性的分档信息包括更多个档位,可以根据实际情况设置各个档位的权重。\n[0077] 根据一个实施例,在步骤104中,可以根据所获取的商品信息的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数。例如,对于商品信息的各个类目,可以通过查找表一,确定各个类目的档位。对于一个商品信息的各个属性,可以通过查找表三,确定各个属性的档位,并且能够确定权重最高的属性的个数。\n[0078] 根据一个实施例,在步骤105中,可以将提取出的类目的档位和权重最高的属性的个数与用户偏好权重相结合,计算基于查询词的所述搜索结果中各商品信息的用户需求值。\n[0079] 例如,用户需求值用如下公式(1)表示:\n[0080] V=W*α/C1+W*β*N1/Nw (1)\n[0081] 上述公式(1)中,V表示用户需求值,W表示用户偏好权重,C1表示类目档位,N1表示权重最高的属性的个数,Nw表示属性的总数,α和β可以是预设值,可以取为小于1并且大于0的数,α和β的和可以等于1。例如,α的取值可以是0.8,β的取值可以是\n0.2。W以及α和β的取值可以根据实际情况确定,不限于上述公式中给出的各个数值。\nNw是步骤103中提取出的属性的总数。\n[0082] 根据公式(1)可以获取各个商品信息的用户需求值,从而可以根据用户需求值对各个商品信息进行排序。\n[0083] 用户需求值也可以通过机器学习的方法确定,即对每条商品信息,先人工进行样本标注,确定每条商品信息的需求程度,然后获取样本中商品信息的类目的档位和属性的档位,以此为依据训练一个用于确定用户需求值的模型。对于根据当前用户输入的查询词搜索到的商品信息,可以根据训练好的模型、该商品信息的类目的档位和属性的档位,预测该商品信息的用户需求值。\n[0084] 根据一个实施例,步骤106可以包括:将查询词对应的商品信息进行分档;根据所获取的用户需求值调整商品信息在各个档位内的排序。\n[0085] 具体地,可以根据文本相关性对商品信息进行分档,不同档位内的商品信息不跨档。然后,根据用户需求值调整各个商品信息在各个档位内的排序。也可以结合市场机制和用户需求值调整各个商品信息在各个档位内的排序。\n[0086] 在步骤106中,还可以包括过滤用户需求值低的商品信息,例如通过设置一个阈值,如果计算出的用户需求值低于该阈值,则过滤掉该用户需求值对应的商品信息。\n[0087] 通过过滤用户需求值低的商品信息,可以减少反馈给客户端的数据量,提高对用户的查询请求的响应速度。而且,可以避免向用户展示用户需求值低的商品信息,提高网上交易系统的流量质量。\n[0088] 经过步骤106之后,网上交易系统即可以将经过排序后的商品信息展示给用户。\n[0089] 下面详细描述本申请在网上交易系统的一种具体的使用方法。\n[0090] 图3示例性示出本申请中网上交易系统中线下获取商品信息的类目的分档信息与属性的分档信息的流程示意图,包括:\n[0091] 步骤201、网上交易系统抽取日志。\n[0092] 日志可以包括点击日志和曝光日志,曝光日志记录有商品信息展示给用户的次数,点击日志记录有展示给用户的商品信息被点击的次数。。网上交易系统从点击日志中提取出商品信息在查询词下的点击情况,从曝光日志提取出商品信息的曝光情况,之后计算出查询词对应的商品信息的点击率(Click Through Rate,简称CTR)。点击率通常用来衡量排序结果的好坏。\n[0093] 根据一个实施例,在计算点击率之前,网上交易系统可以对点击日志和曝光日志中的异常数据进行过滤。比如:某次搜索中,如果曝光的所有商品信息均被点击,则该次搜索行为无效,点击日志和曝光日志中记录的与该次搜索行为相关的点击数据与曝光数据将不用于计算查询词对应的商品信息的点击率。这样,在去除在判断用户需求方面无意义或意义较小数据的同时,还可以减少计算点击率的数据运算量。\n[0094] 此外,什么搜索行为判定为无效是根据该搜索行为是否能体现出用户需求而定的,因此,本领域普通技术人员应可以推断出其他过滤无效搜索行的方式,例如,可以通过设置曝光的商品信息被点击的数目的阈值来确定是否是无效搜索行为,当曝光的商品信息被点击的数据超过阈值时,认为超过阈值的点击行为无效。\n[0095] 步骤202、网上交易系统抽取数据信息。\n[0096] 具体地,网上交易系统可以从描述商品信息的数据中抽取需要的字段,被抽取的字段将被作为特征数据用于用户需求信息的挖掘。在本申请中,抽取了类目和属性这两个特征数据。\n[0097] 步骤203、网上交易系统将步骤201中计算出的商品信息的点击率作为类目的点击率和属性的点击率。\n[0098] 具体地,由于每条商品信息由类目和属性特征组成,网上交易系统可以将商品信息的点击率,作为每个特征数据的点击率,即将商品信息的点击率作为查询词对应的类目的点击率以及每个属性的点击率。\n[0099] 步骤204、网上交易系统对类目和属性进行分档,获取类目与属性的分档信息。具体地,可以根据查询词对应的类目的点击率和/或流量对类目进行分档,根据查询词对应的属性的点击率和/或属性的流量对属性进行分档。具体的分档信息可以参见表一和表三。\n[0100] 步骤204中获取的类目的分档信息与属性的分档信息可以存储在线下系统中,线下系统可以将类目的分档信息与属性的分档信息生成用户偏好字典。\n[0101] 在本申请的实施例中,上述步骤201与步骤202可以顺序执行,也可以由本领域普通技术人员根据实际情况决定,例如,可以同步执行,也可以先执行步骤202,后执行步骤\n201。\n[0102] 根据一个实施例,除了可以采用类目和属性作为特征数据,还可以引入另外的特征数据。比如,可以将商品标题中产品词、商品信息中卖家地域、产品价格等作为特征数据,这样,可以更全面的反应买家偏好。当然,本领域普通技术人员可以根据实际情况提取类目、属性、产品词、卖家地域、产品价格中的任一个或任意组合,作为商品信息的特征数据,还可以采用其他的数据作为商品信息的特征数据。\n[0103] 具体地,网上交易系统接收用户在线输入的查询词,搜索到与当前输入的查询词对应的关于商品信息。网上交易系统提取出每一条商品信息的类目和属性,查询线下系统生成的用户偏好字典来确定该条商品信息的类目的分档信息和属性的分档信息,基于类目的分档信息和属性的分档信息计算该商品信息的用户需求值。根据各商品信息的用户需求值,网上交易系统可以对当前搜索结果的商品信息进行排序,用户需求值越高的商品信息,其排序越靠前。\n[0104] 由于商品信息通常名单很长,有的长达几十屏,采用本申请提供的技术方案,满足用户需求的商品信息可以排在前面的位置,例如第一屏,使得用户可以迅速找到满足其需求的商品信息,提高了买家体验。\n[0105] 并且,由于这种排序结果考虑到了大多数用户的需求,因此可以提高点击转化率,从而会使网上交易系统的流量质量高,点击率高。\n[0106] 根据一个实施例,在对查询结果中商品信息进行排序时,还可以结合相关性模型和市场机制模型进行。在这种情况下,排序分为两部分,首先基于相关性(例如文本相关性)将商品信息进行分档,不同档位内的商品信息不会跨档。然后,通过市场机制模型和基于本申请前述的实施例提供的方法计算出的用户需求值,将各档位的商品信息的排序进行调整,例如,可以根据市场机制模型的权重和用户偏好模型的权重决定商品信息在档位内的排序情况。\n[0107] 根据一个实施例,也可以直接统计每条商品信息的点击率,依据点击率对商品信息进行排序。\n[0108] 例如,对于某一个查询词,点击率较高的商品信息,排序优于点击率较低的商品信息。\n[0109] 但是采用这种方法,无法实现点击特征的泛化,即对于每一个查询词,只有具有点击特征的商品信息(即被点击过的商品信息),才可以参与以点击率为依据的排序。例如在搜索结果的商品信息很多的情况下,只有部分商品信息被点击,其他商品信息没有被点击。\n这些没有被点击的商品信息不能参与以点击率为依据的排序。\n[0110] 本申请各实施例提供的方法可以用C++实现,可以在Linux系统上运行。\n[0111] 图4示例性示出为本申请查询结果排序装置的结构示意图,该装置包括:接收模块11、搜索模块12、提取模块13、查找模块14、获取模块15和排序模块16。接收模块11用于接收用户输入的查询词。搜索模块12与接收模块11连接,用于搜索到与接收模块11接收到的查询词对应的商品信息。提取模块13与搜索模块12连接,用于提取与搜索模块12搜索到的与查询词对应的商品信息的类目与属性。查找模块14与提取模块13连接,用于根据所获取的商品信息的类目的分档信息与属性的分档信息,查找提取模块13提取出的类目的档位与权重最高的属性的个数。获取模块15与查找模块14连接,用于根据查找模块查找出的提取出的类目的档位与权重最高的属性的个数,获取与查询词对应的商品信息的用户需求值。排序模块16与获取模块15连接,用于根据获取模块15所获取的用户需求值对商品信息排序。\n[0112] 如图4所示的装置还可以包括预处理模块17。该预处理模块17可以与查找模块\n14连接,用于根据网上交易系统中的商品信息的类目与属性,获取商品信息的类目的分档信息与属性的分档信息。预处理模块17获取的商品信息的类目的分档信息与属性的分档信息,可以提供给查找模块14。\n[0113] 图5示例性示出图4中预处理模块17的结构示意图。预处理模块17包括:提取单元171、计算单元172和分档单元173。提取单元171用于提取网上交易系统中的所有商品信息的类目与属性。计算单元172用于根据网上交易系统中的点击日志和曝光日志,计算查询词对应的商品信息的点击率。分档单元173与提取单元171和计算单元172连接,用于将查询词对应的商品信息的点击率作为查询词对应的类目的点击率与属性的点击率,根据查询词对应的所述类目的点击率与属性的点击率,将类目与属性分档,获取类目的分档信息与属性的分档信息。\n[0114] 图6示例性示出图4中排序模块16的结构示意图,排序模块16包括第一排序单元161和第二排序单元162。第一排序单元161用于将查询词对应的商品信息进行分档。\n第二排序单元162与第一排序单元161连接,用于根据所获取的用户需求值调整商品信息在各个档位内的排序。第二排序单元162还可以与获取模块15连接。\n[0115] 其中,第二排序单元162还可以用于在根据所获取的用户需求值调整所述商品信息在各个档位内的排序时,过滤掉用户需求值低于预设阈值的商品信息。\n[0116] 本申请提供的查询结果排序装置,查找模块根据所获取的商品信息的类目的分档信息与属性的分档信息,查找提取出的类目的档位与权重最高的属性的个数;获取模块根据提取出的类目的档位与权重最高的属性的个数,获取与查询词对应的商品信息的用户需求值;排序模块根据所获取的用户需求值对商品信息排序。由于所获取的提取出的类目的档位与权重最高的属性的个数能够体现用户的需求程度,使得计算出的用户需求值可以反映用户的需求程度,这样,就可以将用户需求程度高的商品信息优先展示,能够提高网上交易系统的流量质量,提高点击率。\n[0117] 另外,排序模块中的第二排序单元在根据所获取的用户需求值调整所述商品信息在各个档位内的排序时,过滤掉用户需求值低于预设阈值的商品信息,这样,可以减少反馈给客户端的数据量,提高对用户的查询请求的响应速度。而且,可以避免向用户展示用户需求值低的商品信息,提高网上交易系统的流量质量。\n[0118] 本申请提供的商品信息排序装置中,各个模块及单元的具体操作方法可以参照前述方法实施例部分的描述。\n[0119] 综上所述,本申请提供的查询结果排序方法及装置具有以下优点之一或任意组合,但不限于这些优点:对商品信息根据用户需求值进行筛选;根据用户需求值对所述商品信息排序,将用户需求度高的商品信息排在前面,提高网上交易系统的流量质量、点击率;过滤掉用户需求值不高的商品信息,在根据客户端的查询请求做出响应时,减少发往客户端的数据量,提升响应速度。\n[0120] 本申请提供的查询结果排序装置可以是网上交易系统中的一个设备,例如可以是一个服务器。本申请提供的查询结果排序方法可以通过在服务器上运行程序来实现。\n[0121] 虽然已参照典型实施例描述了本申请,但应当理解,所用的术语是说明和示例性、而非限制性的术语。由于本申请能够以多种形式具体实施而不脱离发明的精神或实质,所以应当理解,上述实施例不限于任何前述的细节,而应在随附权利要求所限定的精神和范围内广泛地解释,因此落入权利要求或其等效范围内的全部变化和改型都应为随附权利要求所涵盖。
法律信息
- 2015-10-21
- 2012-09-05
实质审查的生效
IPC(主分类): G06Q 30/02
专利申请号: 201010590355.2
申请日: 2010.12.07
- 2012-07-04
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2003-07-30
|
2002-01-17
| | |
2
| |
2009-08-26
|
2009-04-13
| | |
3
| |
2009-07-29
|
2009-03-09
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |