著录项信息
专利名称 | 一种推荐数据的推送方法及系统 |
申请号 | CN201110104248.9 | 申请日期 | 2011-04-25 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2012-10-31 | 公开/公告号 | CN102760124A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 阿里巴巴集团控股有限公司 | 申请人地址 | 英属开曼群岛大开曼岛资本大厦一座四层847号邮箱
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 阿里巴巴集团控股有限公司 | 当前权利人 | 阿里巴巴集团控股有限公司 |
发明人 | 仇光;刘逸哲;殷维栋;杨松;郭宁;张亮 |
代理机构 | 北京集佳知识产权代理有限公司 | 代理人 | 逯长明;王宝筠 |
摘要
本申请公开了一种推荐数据的推送方法及系统,方法包括:获取预设时间点之前用户行为日志,提取出第一关键词集合,计算关键词集合中各个关键词的第一权重;获取预设时间点之后的用户行为日志,提取出第二关键词集合,计算关键词集合中各个关键词的第二权重;将第一关键词集合和第二关键词集合进行合并处理,合并重复的关键词的权重,得到第三关键词集合以及各个关键词的第三权重;将第三关键词集合中的关键词与推荐数据的关键词进行匹配,确定所需推送的推荐数据,将确定的推荐数据随用户请求的网页数据一起发送给用户所在的客户端,以便客户端根据所述推荐数据进行展现。该方法和系统能够提高网站服务器的处理速度和响应速度。
一种推荐数据的推送方法及系统\n技术领域\n[0001] 本申请涉及数据处理技术,尤其涉及一种推荐数据的推送方法及系统。\n背景技术\n[0002] 随着互联网技术的发展,在网络用户浏览互联网网页内容的同时,网站运营者会通过网站服务器向网络用户所在的客户端推送一些与用户的网页访问请求相关的推荐数据,如,与用户所浏览的网页内容相关的网络推荐广告、与用户购买意图相关的推荐商品等。\n[0003] 以现有的网络广告投放为例,传统的投放方法是:在预设的时间段内,在网站的固定位置展示某一预设的广告。这里所展示的广告是针对所有访问该网站的用户的,也即是说每一个访问该网站的用户均能够浏览到该广告。该投放方法并未考虑访问网站的用户之间的个体差异,广告投放效果较差。从而,定向广告投放方法应运而生。\n[0004] 在现有的定向广告投放方法中,根据用户当前浏览网页的内容,确定与该内容对应的广告,在预设位置展示该广告。具体的,在用户浏览网页的过程中,网站服务器接收用户所在客户端发来的网页数据请求,根据所述网页数据请求查找得到用户所请求的网页数据;根据所述网页数据确定网页内容,进而根据网页内容确定所需投放的广告数据,将广告数据和网页数据一起返回给用户所在的客户端,以便客户端在向用户展示网页的同时进行对应广告的展示。\n[0005] 但是,对于定向广告投放来说,将用户意向与广告精确匹配非常重要,而现有的上述定向广告投放方法中,由于每一页网页所包含内容的多样性,因此,通过网页所包含的内容并无法对用户意向进行准确判断,因此,所投放广告与用户意向之间的匹配程度较低。\n[0006] 更为重要的是,现有的定向广告投放方法中,网站服务器在每次接收到客户端发来的网页数据请求时,都需要实时根据所述网页数据请求所请求的网页数据确定所需投放的广告数据,因此,网站服务器的数据处理量较大,从而影响了网站服务器的处理速度和对于客户端的响应速度;尤其是在网站访问量很大时,网站服务器所接收到的网页浏览请求数量很大,这时,网站服务器再同时进行广告数据的实时确定,必然会严重降低网站服务器的处理速度和响应速度。\n[0007] 综上所述,现有的网页推荐数据与用户意向之间的匹配程度较低,且由于网站服务器的数据处理量较大,从而影响了网站服务器的处理速度和对于客户端的响应速度发明内容\n[0008] 有鉴于此,本申请要解决的技术问题是,提供一种网页推荐数据的推送方法及系统,能够提高用户意向与推荐数据之间的匹配程度,而且,能够提高网站服务器的处理速度和响应速度。\n[0009] 为此,本申请实施例采用如下技术方案:\n[0010] 本申请实施例提供一种推荐数据的推送方法,包括:\n[0011] 获取预设时间点之前用户的行为日志,提取行为日志中的第一关键词集合,利用预设规则计算关键词集合中各个关键词的第一权重;获取预设时间点之后的用户行为日志,提取行为日志中的第二关键词集合,利用预设规则计算关键词集合中各个关键词的第二权重;\n[0012] 将第一关键词集合和第二关键词集合进行合并处理,并对两个集合中重复的关键词的权重进行合并处理,得到第三关键词集合以及各个关键词的第三权重;\n[0013] 将第三关键词集合中的关键词与预先设置的推荐数据的关键词进行匹配,确定所需向该用户推送的推荐数据,将确定的推荐数据随用户请求的网页数据一起发送给用户所在的客户端,以便客户端根据所述推荐数据进行展现。\n[0014] 本申请实施例还提供一种推荐数据的推送系统,包括:\n[0015] 第一计算单元,用于获取预设时间点之前用户的行为日志,提取行为日志中的第一关键词集合,利用预设规则计算关键词集合中各个关键词的第一权重;\n[0016] 第二计算单元,用于获取预设时间点之后的用户行为日志,提取行为日志中的第二关键词集合,利用预设规则计算关键词集合中各个关键词的第二权重;\n[0017] 合并单元,用于将第一关键词集合和第二关键词集合进行合并处理,并对两个集合中重复的关键词的权重进行合并处理,得到第三关键词集合以及各个关键词的第三权重;\n[0018] 匹配单元,用于将第三关键词集合中的关键词与预先设置的推荐数据的关键词进行匹配,确定所需向该用户推送的推荐数据,将确定的推荐数据随用户请求的网页数据一起发送用户所在的客户端,以便客户端根据所述推荐数据进行展现。\n[0019] 对于上述技术方案的技术效果分析如下:\n[0020] 根据用户在预设时间点之前和之后的用户行为日志分别进行关键词的提取以及权重的计算,且为距离当前时间近的关键词赋予更高的权重值,进行关键词以及权重的合并处理后,通过权重值最高的若干个关键词与推荐数据的关键词进行匹配,从而确定所需推送的推荐数据并进行推送处理,从而使得所推送的推荐数据与用户行为日志中的关键词,也即用户的意向进行匹配,提高了推荐数据与用户意向之间的匹配程度;而且,通过预设时间点,将用户的行为日志划分为两部分,从而可以以一个较大的周期值周期性的对预设时间点之前用户的行为日志进行处理,而以一个较小的周期值周期性的对预设时间点之后的用户行为日志进行处理,甚至,可以在网站服务器确定用户进行网页访问时,再对预设时间点之后的用户行为日志进行处理,网站服务器接收到用户通过客户端发来的网页数据请求后,无须根据所请求的网页数据进行推荐数据的实时确定,而是预先进行用户对应推荐数据的确定,在用户访问网页时直接查找得到用户对应的推荐数据即可;即使网站服务器确定用户进行网页访问时,再对预设时间点之后的用户行为日志进行处理,其所需处理的数据量也大大减小,从而相对于现有技术中的推荐数据推送方法,网站服务器的数据处理量大大降低,从而大大提高了网站服务器的处理速度和响应速度;\n[0021] 另外,在实际应用中如果每次用户访问网站时,都进行用户所有行为日志数据的处理,则处理的数据量巨大,对网站系统的处理速率以及响应速度影响较大;而且,同时处理用户所有的行为日志时,对于用户当前的用户意向将会有所忽略。而通过设置预设时间点,分别以不同的周期来进行预设时间点之前和之后行为日志的处理,则处理的数据量相对很小,处理速度快,也可以提高网站系统的响应速度。\n附图说明\n[0022] 图1为本申请实施例中网络环境结构示意图;\n[0023] 图2为本申请实施例一种推荐数据推送方法流程示意图;\n[0024] 图3为本申请实施例另一种推荐数据推送方法流程示意图;\n[0025] 图4为本申请实施例一种推荐数据推送系统结构示意图;\n[0026] 图5为本申请实施例推荐数据推送系统中一单元结构示意图;\n[0027] 图6为本申请实施例推荐数据推送系统中另一单元结构示意图。\n具体实施方式\n[0028] 为使本领域技术人员更加清楚的理解本申请实施例,首先介绍本申请实施例所应用的网络环境。如图1所示,包括网站服务器110以及客户端120,其中,网站服务器用于接收到用户通过客户端发来的网页数据请求时,确定所需向用户推送的推荐数据,将推荐数据与网页数据一起发送给客户端;客户端用于接收用户操作指令,根据用户操作指令向网站服务器发送网页数据请求,并将收到的网页数据和推荐数据向用户进行展现。\n[0029] 以下,结合附图详细说明本申请实施例的推荐数据推送方法及系统的实现。\n[0030] 图2为本申请实施例推荐数据推送方法流程示意图,该方法适用于网站服务器中,如图2所示,包括:\n[0031] 步骤201:获取预设时间点之前用户的行为日志,提取行为日志中的第一关键词集合,利用预设规则计算关键词集合中各个关键词的第一权重;\n[0032] 步骤202:获取预设时间点之后的用户行为日志,提取行为日志中的第二关键词集合,利用预设规则计算关键词集合中各个关键词的第二权重;\n[0033] 其中,步骤201和步骤202之间的执行顺序不限制。\n[0034] 另外,在实际应用中,可以为步骤201设置一个第一周期,以进行步骤201的循环处理;而为步骤202设置一个第二周期,以进行步骤202的循环处理,其中,第一周期大于第二周期,例如,第一周期为1天,而第二周期为1小时等;或者,步骤202也可以在网站服务器确定用户进行网页访问时,再执行,这里并不限制。\n[0035] 步骤203:将第一关键词集合和第二关键词集合进行合并处理,并对两个集合中重复的关键词的权重进行合并处理,得到第三关键词集合以及各个关键词的第三权重;\n[0036] 步骤204:将第三关键词集合中的关键词与预先设置的广告数据的关键词进行匹配,确定所需向该用户推送的推荐数据;\n[0037] 其中,该用户对应的推荐数据也即为:所需向用户推送的推荐数据。\n[0038] 步骤205:将确定的推荐数据随用户请求的网页数据一起发送给用户所在的客户端,以便客户端根据所述推荐数据进行展现。\n[0039] 在实际应用中,可以预先由用户进行登录,从而获知用户信息;或者由网站服务器根据客户端的IP地址等确定所述网页数据请求对应用户的用户信息,以便在本步骤中,根据用户信息查找得到发送网页数据请求的用户对应的广告数据等等,这里并不限制。\n[0040] 图2所示的推荐数据推送方法中,根据用户在预设时间点之前和之后的用户行为日志分别进行关键词的提取以及权重的计算,且为距离当前时间近的关键词赋予更高的权重值,通过权重值最高的若干个关键词与推荐数据的关键词进行匹配,从而确定所需向用户推荐的推荐数据,从而使得所推送的推荐数据与用户行为日志中的关键词,也即用户的意向进行匹配,提高了推荐数据与用户意向之间的匹配程度;而且,通过预设时间点,将用户的行为日志划分为两部分,从而可以以一个较大的周期值周期性的对预设时间点之前用户的行为日志进行处理,而以一个较小的周期值周期性的对预设时间点之后的用户行为日志进行处理,甚至,可以在网站服务器确定用户进行网页访问时,再对预设时间点之后的用户行为日志进行处理,网站服务器接收到用户通过客户端发来的网页数据请求后,无须根据所请求的网页数据进行推荐数据的实时确定,而是预先进行用户对应推荐数据的确定,在用户访问网页时直接查找得到用户对应的推荐数据即可;即使网站服务器确定用户进行网页访问时,再对预设时间点之后的用户行为日志进行处理,其所需处理的数据量也大大减小,从而相对于现有技术中的定向广告投放方法,网站服务器的数据处理量大大降低,从而大大提高了网站服务器的处理速度和响应速度;\n[0041] 另外,在实际应用中如果每次用户访问网站时,都进行用户所有行为日志数据的处理,则处理的数据量巨大,对网站系统的处理速率以及响应速度影响较大;而且,同时处理用户所有的行为日志时,对于用户当前的用户意向将会有所忽略。而通过设置预设时间点,分别以不同的周期来进行预设时间点之前和之后行为日志的处理,则处理的数据量相对很小,处理速度快,也可以提高网站系统的响应速度。\n[0042] 图3为本申请实施例推荐数据推送方法流程示意图,如图3所示,包括:\n[0043] 步骤301:获取预设时间点之前用户的行为日志,提取行为日志中的第一关键词集合,利用预设规则计算关键词集合中各个关键词的第一权重;\n[0044] 其中,在进行用户行为日志的获取时,可以根据用户的ID或者用户的cookie等获取。具体的,如果所述用户为该网站的注册用户,该用户注册并登录了该网站时,则可以以用户ID标识该用户,根据用户ID进行用户行为日志的获取;而如果该用户为非注册用户或者该用户未登录,则可以根据用户的cookie获取该用户的行为日志。\n[0045] 所述用户的行为日志可以包括:用户在网站上的点击、搜索、浏览、收藏等操作记录。\n[0046] 其中,所述提取行为日志中第一关键词集合可以通过以下步骤实现:\n[0047] A1、使用中心词提取方法从所述行为日志中提取出第一预设数量的中心词;\n[0048] A2、将提取的各个中心词与预设产品词库中的产品词进行匹配,提取出中心词中的产品词,提高所述产品词的优先级;\n[0049] A3、将提取出的各个产品词与预设竞价词库中的竞价词进行匹配,提取出产品词中的竞价词,提高所述竞价词的优先级;\n[0050] A4、将所述中心词按照优先级进行排序,从所述中心词中选择优先级最高的第二预设数量个关键词构成所述第一关键词集合。\n[0051] 其中,所述产品词库以及竞价词库可以预先进行设置,其中产品词库可以为根据各类产品词或者若干类产品词所建立的数据库;而竞价词可以与广告(以广告为例对推荐数据加以说明)的关键词相对应,以便更好的将广告与代表用户意向的关键词进行匹配;\n或者,也可以方便网站运营商根据竞价词向对应类别的广告主进行广告位的招标和拍卖。\n[0052] 这里,在具体实现中,可以预先设置优先级为:第一级<第二级<第三级;则,在A1步骤中将所有中心词默认为或设置为第一级;在A2步骤中将提取出的产品词的优先级提高为第二级;在A3步骤中将提取出的竞价词的优先级再提高为第三级。从而在A4步骤中直接按照优先级进行中心词的排序即可。\n[0053] 所述利用预设规则计算各个关键词的第一权重可以通过以下步骤实现:\n[0054] B1、从所述预设时间点开始,按照预设第一时间长度将该时间点之前的时间划分为若干个时间段,并确定每个时间段的顺序号;\n[0055] B2、对于每个关键词,从每个时间段对应的行为日志中查找该关键词的出现次数;\n其中,所述出现次数可以包括:对该关键词的搜索、浏览等操作,可以在实际应用中自主设定。\n[0056] B3、根据预设的权重函数、时间段的顺序号以及在该时间段中出现次数计算该关键词的第一权重。\n[0057] 其中,可以将第一时间长度设置为天、N小时、1小时甚至半小时等。其中,所述时间段的顺序号与权重函数相关,如果权重函数是增函数,则为每个时间段确定顺序号可以为:按照距离预设时间点的远近,越远的时间段顺序号越小,越近的时间段顺序号越大;而如果权重函数为减函数,则为每个时间段确定顺序号可以为:\n[0058] 其中,第一时间长度为天时,可以通过以下公式计算关键词的第一权重:\n[0059] \n[0060] \n[0061] 其中,ti表示所述第i天距离所述预设时间点的天数;n(ti)为预设时间点之前第i天该词出现的次数,f(ti)是一个关于ti的递减函数,也即所述权重函数;通过该计算公式可知,距离预设时间点越远的词所获得分数越低。f(ti)可以根据实际的应用场景选择。\n-a*t\n例如,可以选e ,其中参数a根据实际数据特征进行赋值;k为预设时间点距离当前时间的天数。\n[0062] 以上的权重计算公式既体现了中心词对用户偏好等用户意向的反映,也能兼顾时间因素对用户偏好等用户意向的影响。\n[0063] 例如,以下举例进行说明:假设以天为预设第一时间长度,预设时间点为当天之前,而用户在最近7天的行为日志中,对词W搜索了10次,浏览了100个网页,其中有27个网页中包含了词W,每天的频率如表1所示:\n[0064] 表1\n[0065] \n 发生日期 当天搜索频率 包含词W的浏览网页总数\n 第一天 2 5\n 第二天 1 2\n 第三天 1 1\n 第四天 3 8\n 第五天 2 6\n 第六天 1 5\n 第七天 0 0\n[0066] 则词W在当天之前的7天的权重为:\n[0067] Score(W)=f(1)*0+f(2)*6+f(3)*8+f(4)*11+f(5)*2+f(6)*3+f(7)*7[0068] f(t)可以选函数e-a*t,其中参数a根据实际数据特征进行赋值;其中,所述n(ti)是根据每天的当天搜索频率以及包含词W的浏览网页总数加和得到的。\n[0069] 在具体实现中,通过步骤301,可以得到第一关键词集合以及每个关键词的第一权重,此时,可以将关键词以及第一权重以<关键词,第一权重>的二维向量方式表示,用若干个关键词表示用户的历史兴趣,第一权重表示用户在该关键词上表示出的兴趣程度。如从某用户的行为日志中提取出的关键词集合为:{<葡萄酒,14.1586>,<四特酒,9.29328>,<低档白酒,3.74181>,<中粮长城,3.22576>,<张裕,3.1076>},可以得出该用户对“葡萄酒”的兴趣最强,其次为四特酒、低档白酒等。\n[0070] 步骤302:获取预设时间点之后的用户行为日志,提取行为日志中的第二关键词集合,利用预设规则计算关键词集合中各个关键词的第二权重。\n[0071] 其中,步骤302中各个步骤可以使用与步骤301相同的方式实现,这里不再赘述。\n[0072] 也即是说:在具体实现中可以将步骤301和步骤302进行合并同时进行,而这里之所以将步骤302与步骤301进行区别处理的理由在于:\n[0073] 在实际应用中如果每次用户访问网站时,都进行用户所有行为日志数据的处理,则处理的数据量巨大,对网站系统的处理速率以及响应速度影响较大;而且,同时处理用户所有的行为日志时,对于用户当前的用户意向将会有所忽略。而通过将步骤301和步骤302分别进行处理,则可以以一个较大的周期值周期性的进行步骤301的处理,而以一个较小的周期值进行步骤302的处理,甚至在用户访问网页时进行步骤302的处理,由于步骤301和步骤302已经在网站后台处理完毕,或者,在用户访问网页时只有步骤302中需要处理某一预设时间点之后的用户行为日志,则处理的数据量相对很小,处理速度快,可以提高网站系统的响应速度;而且,单独进行预设时间点之后的用户行为日志中关键词的提取,考虑了用户在最近时间内改变用户意向的可能性,从而提取到的关键词更接近用户意向,可以提高推荐数据与用户意向的匹配精确度。\n[0074] 步骤303:将第一关键词集合和第二关键词集合进行合并处理,并对两个集合中重复的关键词的权重进行合并处理,得到第三关键词集合以及各个关键词的第三权重。\n[0075] 其中,将第一关键词集合和第二关键词集合进行合并处理,也即是将第一关键词集合和第二关键词集合中所有的关键词进行合并,得到第三关键词集合。\n[0076] 而将重复的关键词的权重进行合并处理可以为:将该关键词的第一权重与第二权重相加,或者也可以为不同的权重分别设定系数,再相加。\n[0077] 其中,如果第一关键词集合和第二关键词集合中不重合的关键词过多,例如,用户当天改变了前一段时间的购买习惯,转而对另一类产品感兴趣并进行相关搜索和浏览,可能导致第三关键词集合中关键词数量过多,为了防止这种现象的出现,可以为第三关键词集合预先设定关键词数量阈值,从合并后的关键词集合中选择权重值最大的预设数量个关键词构成第三关键词集合,这里并不限定。\n[0078] 而这里,由于在步骤301和步骤302中,对越与当前时间靠近的关键词赋予的权重越高,从而本步骤中即使按照权重进行了第三关键词集合中关键词的选择,也由于与当前时间靠近的关键词权重较高的缘故,不会造成与用户意向匹配度高的关键词的漏选,从而影响推荐数据与用户意向匹配结果的精确度。\n[0079] 而且,通过这种综合历史行为日志和当前行为日志的方式,在充分掌握用户背景信息基础上,可以更好地理解用户的当前意向。如,用户的即时搜索关键词为“苹果”,由于“苹果”既可以是一种水果,也可以是一种电子产品,仅用这个词很难识别用户真正的意图,但在对用户的历史行为日志分析中,得到了“笔记本”,“mp3”,“笔记本配件”等关键词,由此,用户的意图表示为{苹果,笔记本,mp3,笔记本配件},综合之后可以得到该用户的意向是“苹果”品牌的电子产品。\n[0080] 步骤304:将第三关键词集合中的关键词与预先设置的各个推荐数据的关键词进行匹配,得到匹配程度最高的预设第三数量个推荐数据。\n[0081] 本步骤的实现中,可以使用现有的检索模型,例如BM25、向量空间模型等实现,这里不赘述。\n[0082] 步骤305:按照用户在网站内的访问路径,将所述推荐数据和所述访问路径对应的网页数据一起发送给用户所在的客户端,以便客户端进行所述网页以及推荐数据的展现。\n[0083] 通过本步骤,将推荐数据始终跟随着用户在站内的访问路径进行推送,从而无论用户切换到任何页面,都将展现与其意向相关的推荐数据。\n[0084] 进一步的,以推荐数据为广告数据为例加以说明,在实际应用中,网站运营商可以根据表示用户的意向的关键词来进行广告的投放,从而销售不同产品的广告主也可以根据自身销售的产品所针对的用户意向,也即所述关键词来进行广告的购买,从而使得广告的竞价不再针对所有用户意向,而是在固定时间段内,由广告主对表示用户不同意向的关键词进行购买,分别进行收费。如在网站首页中部的右边有一个广告位,广告主A在购买该广告位时,可以指定自己广告的投放目标是对“运动”感兴趣的用户,而另一个广告主B则可以指定自己广告的投放目标是对“数码产品”感兴趣的用户,因此当对“运动”感兴趣的用户访问网站时即可以根据用户的关键词匹配出广告A,来进行广告的投放,对“数码产品”感兴趣的用户则根据用户的关键词匹配出广告B来进行投放,依次类推。当有多个广告主需要购买“运动”这个关键词时,则可以进行在效果广告中存在的竞价,竞价成功的广告主可以得到向具有该关键词表示的用户意向对应的用户投放广告的机会。所述用来由广告主进行竞价的代表用户意向的关键词可以设置于所述竞价词库中。\n[0085] 从而在进行广告的计费时,可以根据该关键词对应的收费标准以及该广告的投放时间长度来进行计费。\n[0086] 与以上的推荐数据推送方法相对应的,本申请实施例还提供了一种推荐数据的推送系统,该系统可以设置于网站服务器中,如图4所示,该系统包括:\n[0087] 第一计算单元410,用于获取预设时间点之前用户的行为日志,提取行为日志中的第一关键词集合,利用预设规则计算关键词集合中各个关键词的第一权重;\n[0088] 第二计算单元420,用于获取预设时间点之后的用户行为日志,提取行为日志中的第二关键词集合,利用预设规则计算关键词集合中各个关键词的第二权重;\n[0089] 合并单元430,用于将第一关键词集合和第二关键词集合进行合并处理,并对两个集合中重复的关键词的权重进行合并处理,得到第三关键词集合以及各个关键词的第三权重;\n[0090] 匹配单元440,用于将第三关键词集合中的关键词与预先设置的推荐数据的关键词进行匹配,确定所需推送的推荐数据,将确定的推荐数据推送给用户所在的客户端,以便客户端根据所述推荐数据进行展现。\n[0091] 其中,如图5所示,所述第一计算单元410可以包括:\n[0092] 划分子单元510,用于从所述预设时间点开始,按照预设第一时间长度将该时间点之前的时间划分为若干个时间段;\n[0093] 查找子单元520,用于对于每个关键词,从每个时间段对应的行为日志中查找该关键词的出现次数;\n[0094] 计算子单元530,用于根据预设的权重函数、时间段距离预设时间点的时间长度以及在该时间段中出现次数计算该关键词的第一权重。\n[0095] 具体的,所述计算子单元530具体可以用于:使用公式Score(W)=f(ti)*n(ti)计算关键词的权重;其中,W表示关键词;ti表示关键词所在时间段距离所述预设时间点的时间长度;n(ti)表示ti对应的时间段内关键词出现的次数,f(ti)为关于ti的权重函数,-a*ti\n且该权重函数为递减函数。其中,所述权重函数可以为:f(ti)=e ,a为常数。\n[0096] 优选地,如图6所示,第一计算单元410和第二计算单元420分别可以包括如下子单元:\n[0097] 第一提取子单元610,用于使用中心词提取方法从行为日志中提取出第一预设数量的中心词;\n[0098] 第二提取子单元620,用于将提取的各个中心词与预设产品词库中的产品词进行匹配,提取出中心词中的产品词,提高所述产品词的优先级;\n[0099] 第三提取子单元630,用于将提取出的各个产品词与预设竞价词库中的竞价词进行匹配,提取出产品词中的竞价词,提高所述竞价词的优先级;\n[0100] 选择子单元640,用于将所述中心词按照优先级进行排序,从所述中心词中选择优先级最高的第二预设数量个关键词构成所述关键词集合。\n[0101] 优选地,匹配单元440可以包括:\n[0102] 匹配子单元,用于将第三关键词集合中的关键词与预先设置的推荐数据的关键词进行匹配,确定所需推送的推荐数据;\n[0103] 发送子单元,用于按照用户在网站内的访问路径,将所述推荐数据和所述访问路径对应的网页数据一起发送给用户所在的客户端,以便客户端将所述推荐数据以及网页向用户进行展现。\n[0104] 图4~6所示的推荐数据投推送系统中,第一计算单元以及第二计算单元分别根据用户在预设时间点之前和之后的用户行为日志进行关键词的提取以及权重的计算,且为距离当前时间近的关键词赋予更高的权重值;合并单元进行关键词集合以及权重值的合并处理后,匹配单元通过权重值最高的若干个关键词与推荐数据的关键词进行匹配,从而确定所需推送的推荐数据并进行推送处理,使得所推送的推荐数据与用户行为日志中的关键词,也即用户的意向进行匹配,提高了推荐数据与用户意向之间的匹配程度,提高了推荐数据的推送效果;而且,通过预设时间点,将用户的行为日志划分为两部分,从而可以以一个较大的周期值周期性的对预设时间点之前用户的行为日志进行处理,而以一个较小的周期值周期性的对预设时间点之后的用户行为日志进行处理,甚至,可以在网站服务器确定用户进行网页访问时,再对预设时间点之后的用户行为日志进行处理,网站服务器接收到用户通过客户端发来的网页数据请求后,无须根据所请求的网页数据进行推荐数据的实时确定,而是预先进行用户对应推荐数据的确定,在用户访问网页时直接查找得到用户对应的推荐数据即可;即使网站服务器确定用户进行网页访问时,再对预设时间点之后的用户行为日志进行处理,其所需处理的数据量也大大减小,从而相对于现有技术中的定向广告投放方法,网站服务器的数据处理量大大降低,从而大大提高了网站服务器的处理速度和响应速度;\n[0105] 另外,在实际应用中如果每次用户访问网站时,都进行用户所有行为日志数据的处理,则处理的数据量巨大,对网站系统的处理速率以及响应速度影响较大;而且,同时处理用户所有的行为日志时,对于用户当前的用户意向将会有所忽略。而通过设置预设时间点,分别以不同的周期来进行预设时间点之前和之后行为日志的处理,则处理的数据量相对很小,处理速度快,也可以提高网站系统的响应速度。\n[0106] 本领域普通技术人员可以理解,实现上述实施例的方法的过程可以通过程序指令相关的硬件来完成,所述的程序可以存储于可读取存储介质中,该程序在执行时执行上述方法中的对应步骤。所述的存储介质可以如:ROM/RAM、磁碟、光盘等。\n[0107] 以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。
法律信息
- 2022-04-08
未缴年费专利权终止
IPC(主分类): G06F 17/30
专利号: ZL 201110104248.9
申请日: 2011.04.25
授权公告日: 2014.11.12
- 2014-11-12
- 2012-12-19
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201110104248.9
申请日: 2011.04.25
- 2012-10-31
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2009-06-03
|
2008-12-30
| | |
2
| |
2006-12-13
|
2006-07-12
| | |
3
| |
2009-01-28
|
2008-09-09
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |