著录项信息
专利名称 | 一种无位置偏见影响的广告与页面匹配的方法 |
申请号 | CN201310197731.5 | 申请日期 | 2013-05-24 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2013-08-28 | 公开/公告号 | CN103268344A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 华东师范大学 | 申请人地址 | 上海市闵行区东川路500号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 华东师范大学 | 当前权利人 | 华东师范大学 |
发明人 | 贺樑;霍晓骏;向平;倪敏杰;徐晓枫;罗念 |
代理机构 | 上海蓝迪专利商标事务所(普通合伙) | 代理人 | 徐筱梅;张翔 |
摘要
本发明公开了一种无位置偏见影响的广告与页面匹配的方法,包括步骤:a.确定每个搜索页面中所有广告的展示位置、展示次数和点击次数;b.利用统计方法,能够排除广告所在页面位置对广告点击所造成的影响,计算每个页面下刊登的每个广告的固有点击率;c.根据页面与广告的固有点击率,计算页面之间关于广告的相似度关系。d.对于一个待推荐的目标页面,根据相似的其他页面,为其匹配合适的广告。本发明是根据广告展示位置来调整特定页面下特定广告的点击率;其优点是:更贴近地把握页面和广告的相关程度,更准确地为页面匹配了广告,更高效便捷。
1.一种无位置偏见影响的广告与页面匹配的方法,其特征在于,该方法包括如下步骤:
a)确定每个搜索页面中所有广告的展示位置、展示次数和点击次数;
b)根据全概率公式和贝叶斯公式,计算出在某个页面下某个广告被点击的条件概率,即某个广告在某个页面下的无偏见点击率,排除广告位置对广告点击率的影响;其中:
所述计算出在某个页面下某个广告被点击的条件概率是:从搜索引擎日志中获得各个广告在各个页面的各个位置上的点击、展示信息、位置总数P,计算得到带有位置偏见的点击率,包括页面qj下广告ai在位置pk的点击率Pr(ai,qj,pk)、页面qj下位置pk的所有广告的点击率Pr(qj,pk)、广告ai在位置pk的点击率Pr(ai,pk)、位置pk下所有广告的点击率Pr(pk)以及广告ai的点击率Pr(ai);
通过如下公式计算在页面qj下广告ai被点击的条件概率,即广告ai在页面qj下的无偏见点击率,
c)根据页面与广告的无偏见点击率,计算页面之间关于广告的相似度关系;
d)对于一个待推荐的目标页面,根据相似的其他页面,为其匹配合适的广告。
2.根据权利要求1所述的方法,其特征在于,所述步骤a)包括:
Ⅰ)确定页面总数M、广告总数N、页面能展示广告的位置总数P;
Ⅱ)计算每个页面下每个广告在每个位置的展示次数、点击次数;计算每个页面下每个位置的所有广告的展示总数、点击总数;计算每个广告在每个位置的展示总数、点击总数;计算每个位置下所有广告的展示总数、点击总数以及每个广告的展示总数、点击总数;
根据得到的数据,将对应的点击次数除以展示次数,得到每个页面下每个广告在每个位置的点击率、每个页面下每个位置的所有广告的点击率、每个广告在每个位置的点击率、每个位置下所有广告的点击率以及每个广告的点击率。
3.根据权利要求1所述的方法,其特征在于,所述步骤c)包括:
Ⅰ)将一个页面表示成一个N维向量,每一个维度上的元素对应这个页面下相应广告的无偏见点击率;总计有M个页面向量;
Ⅱ)通过调整余弦相似度计算总计M个页面向量两两之间的相似度。
4.根据权利要求1所述的方法,其特征在于,所述步骤d)包括:
Ⅰ)对于一个待匹配P个广告的目标页面q,根据步骤c)中的相似度,找到与页面q最相似的K个页面,称为相似邻居;
Ⅱ)从相似邻居中,找到在相似邻居中展示、但在目标页面q下没有展示过的广告集合A;
Ⅲ)对于属于集合A中的每个广告,根据相似邻居中对应广告的无偏见点击率以及相似邻居与页面q的相似度进行加权求和,计算得到这个广告在目标页面q下预测的无偏见点击率;
Ⅳ)将集合A中所有广告按照预测的无偏见点击率从大到小排序,选择最大的P个广告推荐给目标页面q用作广告展示。
一种无位置偏见影响的广告与页面匹配的方法\n技术领域\n[0001] 本发明涉及用于为搜索引擎页面匹配广告的领域,具体地说是一种基于协同过滤邻域模型的广告匹配选取方法。\n背景技术\n[0002] 在用户浏览网页时,特别是搜索引擎的检索页面,页面的侧边栏会从上到下展示若干条广告,这些广告就是通过广告匹配系统,计算与该页面的匹配程度,将匹配程度高的广告展示在页面侧边栏中靠上的位置。\n[0003] 在各种广告匹配系统中,对特定页面与特定广告之间的相关程度是是否为该页面匹配该广告的一个重要指标。该指标可以借由特定页面下特定广告的点击率加以表示。\n[0004] 传统的点击率计算方法,通过日志找到要计算的广告在要计算的页面下的展示次数、被点击次数,只是简单地相除。忽视了广告展示位置对广告点击次数的影响。在早期的广告匹配系统中,根据广告商的竞价来决定展示的位置,出价高的广告会被展示在靠上的广告位置中,而不考虑这个广告与页面是否相关。根据研究显示,展示在位置靠上的广告更容易被点击,尽管这个广告和刊登它的页面的相关程度没有位置靠下的广告和该页面的相关程度高,这是用户的浏览习惯所导致的。这样一来,即使不相关的广告也拥有大量的点击率,即被视为和该页面相关,这是不合逻辑的。因此,简单地使用传统的点击率计算方法,求得的点击率是带有位置偏见的,这样的点击率不能很好地表达特定广告与特定页面的相关程度。\n发明内容\n[0005] 本发明的目的是针对现有技术中忽略位置偏见的技术缺陷而提供的一种排除位置偏见的广告匹配方法,该方法可根据特定位置下所有广告的点击情况,调整个别广告的点击率,并且根据相似页面的广告刊登情况,调整目标页面的广告匹配。\n[0006] 实现本发明目的的具体技术方案是:\n[0007] 一种无位置偏见影响的广告与页面匹配的方法,该方法包括如下步骤:\n[0008] a)确定每个搜索页面中所有广告的展示位置、展示次数和点击次数;具体包括:\n[0009] Ⅰ)确定页面总数M、广告总数N、页面能展示广告的位置总数P;\n[0010] Ⅱ)计算每个页面下每个广告在每个位置的展示次数、点击次数;计算每个页面下每个位置的所有广告的展示总数、点击总数;计算每个广告在每个位置的展示总数、点击总数;计算每个位置下所有广告的展示总数、点击总数以及每个广告的展示总数、点击总数;\n根据得到的数据,将对应的点击次数除以展示次数,得到每个页面下每个广告在每个位置的点击率、每个页面下每个位置的所有广告的点击率、每个广告在每个位置的点击率、每个位置下所有广告的点击率以及每个广告的点击率;\n[0011] b)利用统计方法,排除广告所在页面位置对广告点击所造成的影响,计算每个页面下刊登的每个广告的固有点击率;具体包括:\n[0012] Ⅰ)根据全概率公式和贝叶斯公式,计算出在某个页面下某个广告被点击的条件概率,即某个广告在某个页面下的无偏见点击率,排除广告位置对广告点击率的影响;\n[0013] c)根据页面与广告的固有点击率,计算页面之间关于广告的相似度关系;具体包括:\n[0014] Ⅰ)将一个页面表示成一个N维向量,每一个维度上的元素对应这个页面下相应广告的无偏见点击率;总计有M个页面向量;\n[0015] Ⅱ)通过调整余弦相似度计算总计M个页面向量两两之间的相似度;\n[0016] d)对于一个待推荐的目标页面,根据相似的其他页面,为其匹配合适的广告;具体包括:\n[0017] Ⅰ)对于一个待匹配P个广告的目标页面q,根据步骤c)中的相似度,找到与页面q最相似的K个页面,称为相似邻居;\n[0018] Ⅱ)从相似邻居中,找到在相似邻居中展示、但在目标页面q下没有展示过的广告集合A;\n[0019] Ⅲ)对于属于集合A中的每个广告,根据相似邻居中对应广告的无偏见点击率以及相似邻居与页面q的相似度进行加权求和,计算得到这个广告在目标页面q下预测的无偏见点击率;\n[0020] Ⅳ)将集合A中所有广告按照预测的无偏见点击率从大到小排序,选择最大的P个广告推荐给目标页面q用作广告展示。\n[0021] 与背景技术相比,本发明有以下优点:\n[0022] 本发明在计算页面与广告的相关程度时,考虑到基础数据由于受到位置偏见的作用而影响了数据的真实性,通过概率统计与计算排除了位置偏见对数据的影响,使得广告的点击率能够真实反映该广告与页面的相关程度,更加合理地还原了数据中所蕴含的信息。\n[0023] 本发明在为页面匹配广告时,参考了协同推荐的思想,利用相似页面进行广告的选择和相关程度的预估计,更加准确的为页面匹配广告。\n[0024] 本发明不需要额外的数据支持,不需要进行文本的分析,向量的计算简化了整个计算流程,提高了系统的效率。\n附图说明\n[0025] 图1为本发明流程示意图;\n[0026] 图2为本发明实施例中的页面示意图。\n具体实施方式\n[0027] 参阅图1,本发明应用于广告匹配系统中,首先确定广告位置对广告的点击产生的影响,计算排除该影响后特定广告在特定页面下的无偏见点击率,然后根据页面刊登广告的情况找到相似的邻居页面,最后结合相似页面,为目标页面匹配合适的广告,其具体步骤如下:\n[0028] 第一步:从搜索引擎日志中获得各个广告在各个页面的各个位置上的点击、展示信息、位置总数P,计算得到带有位置偏见的点击率,包括页面 下广告 在位置 的点\n击率 、页面 下位置 的所有广告的点击率 、广告 在位置\n的点击率 、位置 下所有广告的点击率 以及广告 的点击率 ;\n[0029] 第二步:通过如下公式计算在页面 下广告 被点击的条件概率,即广告 在页面 下的无偏见点击率,\n[0030] \n[0031] 用无偏见点击率构建页面向量。\n[0032] 第三步:利用第二步得到的页面向量,a.利用向量计算两两页面之间的调整余弦相似度,b.存储这些向量,构建无偏见点击率数据库;\n[0033] 第四步:根据相似度构建页面之间的关系数据库;\n[0034] 第五步:等待用户提交一个查询页面 ;\n[0035] 第六步:从第四步中得到的关系数据库中找出与页面 相似度最大的K个页面\n,y= 1~K,以及其与页面 的相似度 ;\n[0036] 第七步:从无偏见数据库中找出在K个相似页面中刊登过,而在页面 中没有刊登过的广告集合A,对于集合A中所有广告 ,通过如下公式计算在页面 下广告 被点\n击的条件概率,即广告 在页面 下的无偏见点击率:\n[0037] \n[0038] 然后选择无偏见点击率最大的P个广告匹配页面 ;\n[0039] 第八步:判断是否完成了所有页面的匹配广告工作,“是”转入结束,“否”转入第五步。\n[0040] 通过以下实施例来更好地理解本发明。\n实施例\n[0041] 假设搜索引擎日志中记载了三个页面及其刊登广告的点击记录,三个页面分别为:出现了三次的搜索词为“天气”的页面;出现了两次的搜索词为“下雨”的页面;出现了一次的搜索词为“春游”的页面。各个页面下每种广告被点击的情况如图2所示,其中带下划线的广告表示该广告在这个页面中被点击,不带下滑线的广告表示该广告在这个页面中没有被点击。\n[0042] 下面要对页面“下雨”进行广告匹配。\n[0043] 第一步:从搜索引擎日志中获得各个广告在各个页面的各个位置上的点击、展示信息、位置总数,计算得到带有位置偏见的点击率,包括每个页面(“天气”、“下雨”、“春游”)下每个广告(“天气研究所”、“天气预报订购”、“雨伞”、“湿度计推销”、“气温计推销”、“烧烤架出租”、“帐篷出租”)在每个位置(“位置一”、“位置二”、“位置三”)的点击率 、每个页面(“天气”、“下雨”、“春游”)下每个位置(“位置一”、“位置二”、“位置三”)的所有广告的点击率 、每个广告(“天气研究所”、“天气预报订购”、“雨伞”、“湿度计推销”、“气温计推销”、“烧烤架出租”、“帐篷出租”)在每个位置(“位置一”、“位置二”、“位置三”)的点击率、每个位置(“位置一”、“位置二”、“位置三”)下所有广告的点击率以及每个广告(“天气研究所”、“天气预报订购”、“雨伞”、“湿度计推销”、“气温计推销”、“烧烤架出租”、“帐篷出租”)的点击率 ;\n[0044] 第二步:通过公式计算无偏见点击率(以下仅展示不为零的点击率):\n[0045] Pr(天气研究院|天气)= 3/8; Pr(天气预报订阅|天气)=5/8;\n[0046] Pr(雨伞推销|天气)=1/2; Pr(湿度计推销|天气)=1/2;\n[0047] Pr(天气预报订阅|下雨)=1/4;Pr(湿度计推销|下雨))=1/3;\n[0048] Pr(气温计推销|下雨)=1;\n[0049] Pr(天气研究院|春游)=1/4;Pr(烧烤架出租|天气)=1;Pr(帐篷出租|春\n游)=1/2\n[0050] 由 此 得 到 三 个 页 面 向 量:天 气 :(3/8,5/8,1/2,1/2,0,0,0); 下雨:(0,1/4,0,1/3,1,0,0);春游:(1/4,0,0,0,0,1,1/2)。根据公式计算三个页面的相似度,得到sim(天气,下雨)=0.2787,sim(下雨,春游)=0,sim(天气,春游)=0.0809;\n[0051] 第三步:利用第二步得到的页面向量,a.利用向量计算两两页面之间的调整余弦相似度,b.存储这些向量,构建无偏见点击率数据库;\n[0052] 第四步,根据相似度构建页面之间的关系数据库;\n[0053] 第五步:等待用户提交查询页面“下雨”;\n[0054] 第六步:从第四步中得到的关系数据库中找出与页面“下雨”相似度最大的页面“天气”,以及其与页面“下雨”的相似度sim(天气,下雨);\n[0055] 第七步:从无偏见数据库中找出在相似页面“天气”中刊登过,而在页面“下雨”中没有刊登过的广告集合A:(广告“天气研究院”,广告“雨伞”),对于集合A中所有广告“天气研究院”和广告“雨伞”,通过公式计算在页面“下雨”下广告“天气研究院”和广告“雨伞”被点击的条件概率,即广告“天气研究院”和广告“雨伞”在页面“下雨”下的无偏见点击率:\n[0056] Pr(天气研究院|下雨)=3/8,Pr(雨伞|下雨)=1/2;\n[0057] 然后选择无偏见点击率最大的广告“雨伞”匹配页面“下雨” ;\n[0058] 第八步:判断是否完成了所有页面的匹配广告工作,“是”转入结束,“否”转入第五步。
法律信息
- 2016-04-06
- 2013-09-25
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201310197731.5
申请日: 2013.05.24
- 2013-08-28
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2007-11-28
|
2006-06-30
| | |
2
| | 暂无 |
2005-04-18
| | |
3
| |
2012-07-18
|
2011-12-28
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |