著录项信息
专利名称 | 页面推送方法和装置 |
申请号 | CN201510609656.8 | 申请日期 | 2015-09-22 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2015-12-02 | 公开/公告号 | CN105117491A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 北京百度网讯科技有限公司 | 申请人地址 | 北京市海淀区上地十街10号百度大厦2层
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 北京百度网讯科技有限公司 | 当前权利人 | 北京百度网讯科技有限公司 |
发明人 | 秦铎浩 |
代理机构 | 北京英赛嘉华知识产权代理有限责任公司 | 代理人 | 王达佐;马晓亚 |
摘要
本申请公开了页面推送方法和装置。所述方法的一具体实施方式包括:采集客户端加载的页面的用户点击率;加载多个用于预测页面点击率的模型,并使用这些模型计算所述页面的预测点击率;基于所述预测点击率和所述用户点击率的比较结果,从多个模型中选择待用模型;使用所述待用模型计算多个待推送页面的预测点击率;基于待推送页面的预测点击率从所述多个待推送页面中选择页面进行推送。该实施方式实现了富于针对性的页面推送。
1.一种页面推送方法,其特征在于,所述方法包括:
采集客户端加载的页面的用户点击率;
加载多个用于预测页面点击率的模型,并使用这些模型计算所述页面的预测点击率;
基于所述预测点击率和所述用户点击率的比较结果,从多个模型中选择待用模型;
使用所述待用模型计算多个待推送页面的预测点击率;
基于待推送页面的预测点击率从所述多个待推送页面中选择页面进行推送。
2.根据权利要求1所述的方法,其特征在于,所述用于预测页面点击率的模型为基于机器学习算法预先训练得到的模型。
3.根据权利要求1所述的方法,其特征在于,基于所述预测点击率和所述用户点击率的比较结果,从多个模型中选择待用模型,包括:
计算所述预测点击率与所述用户点击率之间的差值;
基于计算出的差值,对各个模型进行排序;
基于排序结果,从这些模型中选择至少一个模型作为待用模型。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
以图像的形式呈现以下信息中的至少一项:针对各个模型所计算出的所述差值,所述预测点击率和所述用户点击率。
5.根据权利要求1所述的方法,其特征在于,所述基于待推送页面的预测点击率从所述多个待推送页面中选择页面进行推送,包括:
对所述待推送页面的预测点击率按由大到小的顺序进行排序;
将排序后的前设定个所述待推送页面进行推送。
6.一种页面推送装置,其特征在于,所述装置包括:
采集单元,配置用于采集客户端加载的页面的用户点击率;
计算单元,配置用于加载多个用于预测页面点击率的模型,并使用这些模型计算所述页面的预测点击率;
选择单元,配置用于基于所述预测点击率和所述用户点击率的比较结果,从多个模型中选择待用模型;
预测单元,配置用于使用所述待用模型计算多个待推送页面的预测点击率;
推送单元,配置用于基于待推送页面的预测点击率从所述多个待推送页面中选择网页进行推送。
7.根据权利要求6所述的装置,其特征在于,所述用于预测页面点击率的模型为基于机器学习算法预先训练得到的模型。
8.根据权利要求6所述的装置,其特征在于,所述选择单元进一步配置用于:
计算所述预测点击率与所述用户点击率之间的差值;
基于计算出的差值,对各个模型进行排序;
基于排序结果,从这些模型中选择至少一个模型作为待用模型。
9.根据权利要求8所述的装置,其特征在于,所述装置还包括:
显示单元,配置用于以图像的形式呈现以下信息中的至少一项:针对各个模型所计算出的所述差值,所述预测点击率和所述用户点击率。
10.根据权利要求6所述的装置,其特征在于,所述推送单元进一步配置用于:
对所述待推送页面的预测点击率按由大到小的顺序进行排序;
将排序后的前设定个所述待推送页面进行推送。
页面推送方法和装置\n技术领域\n[0001] 本申请涉及计算机技术领域,具体涉及互联网技术领域,尤其涉及页面推送方法和装置。\n背景技术\n[0002] 信息推送,又称为“网络广播”,是通过一定的技术标准或协议,在互联网上通过推送用户需要的信息来减少信息过载的一项技术。信息推送技术通过主动推送信息给用户,可以减少用户在网络上搜索所花的时间。\n[0003] 现有的信息推送方式通常在页面上直接加载各种推送信息,如果这些推送信息与客户端用户需要的信息存在差异,则推送信息的点击率低,从而导致页面内容相关数据利用不足,信息推送缺乏针对性。\n发明内容\n[0004] 本申请的目的在于提出一种页面推送方法和装置,来解决以上背景技术部分提到的技术问题。\n[0005] 第一方面,本申请提供了一种页面推送方法,所述方法包括:采集客户端加载的页面的用户点击率;加载多个用于预测页面点击率的模型,并使用这些模型计算所述页面的预测点击率;基于所述预测点击率和所述用户点击率的比较结果,从多个模型中选择待用模型;使用所述待用模型计算多个待推送页面的预测点击率;基于待推送页面的预测点击率从所述多个待推送页面中选择页面进行推送。\n[0006] 在一些实施例中,所述用于预测页面点击率的模型为基于机器学习算法预先训练得到的模型。\n[0007] 在一些实施例中,基于所述预测点击率和所述用户点击率的比较结果,从多个模型中选择待用模型,包括:计算所述预测点击率与所述用户点击率之间的差值;基于计算出的差值,对各个模型进行排序;基于排序结果,从这些模型中选择至少一个模型作为待用模型。\n[0008] 在一些实施例中,所述方法还包括:以图像的形式呈现以下信息中的至少一项:针对各个模型所计算出的所述差值,所述预测点击率和所述用户点击率。\n[0009] 在一些实施例中,所述基于待推送页面的预测点击率从所述多个待推送页面中选择页面进行推送,包括:对所述待推送页面的预测点击率按由大到小的顺序进行排序;将排序后的前设定个所述待推送页面进行推送。\n[0010] 第二方面,本申请提供了一种页面推送装置,所述装置包括:采集单元,配置用于采集客户端加载的页面的用户点击率;计算单元,配置用于加载多个用于预测页面点击率的模型,并使用这些模型计算所述页面的预测点击率;选择单元,配置用于基于所述预测点击率和所述用户点击率的比较结果,从多个模型中选择待用模型;预测单元,配置用于使用所述待用模型计算多个待推送页面的预测点击率;推送单元,配置用于基于待推送页面的预测点击率从所述多个待推送页面中选择网页进行推送。\n[0011] 在一些实施例中,所述用于预测页面点击率的模型为基于机器学习算法预先训练得到的模型。\n[0012] 在一些实施例中,所述选择单元进一步配置用于:计算所述预测点击率与所述用户点击率之间的差值;基于计算出的差值,对各个模型进行排序;基于排序结果,从这些模型中选择至少一个模型作为待用模型。\n[0013] 在一些实施例中,所述装置还包括:显示单元,配置用于以图像的形式呈现以下信息中的至少一项:针对各个模型所计算出的所述差值,所述预测点击率和所述用户点击率。\n[0014] 在一些实施例中,所述推送单元进一步配置用于:对所述待推送页面的预测点击率按由大到小的顺序进行排序;将排序后的前设定个所述待推送页面进行推送。\n[0015] 本申请提供的页面推送方法和装置,通过各个模型计算的页面的预测点击率与用户点击率的比较结果,从多个模型中选择待用模型,而后使用选择的待用模型计算多个待推送页面的预测点击率,最后基于待推送页面的预测点击率从多个待推送页面中选择页面进行推送,从而实现了富有针对性的页面推送。\n附图说明\n[0016] 通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本申请的其它特征、目的和优点将会变得更明显:\n[0017] 图1是本申请可以应用于其中的示例性系统架构图;\n[0018] 图2是根据本申请的页面推送方法的一个实施例的流程图;\n[0019] 图3是根据本申请的页面推送方法的一个应用场景的示意图;\n[0020] 图4是根据本申请的页面推送装置的一个实施例的结构示意图;\n[0021] 图5是适于用来实现本申请实施例的终端设备或服务器的计算机系统的结构示意图。\n具体实施方式\n[0022] 下面结合附图和实施例对本申请作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释相关发明,而非对该发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与有关发明相关的部分。\n[0023] 需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。\n[0024] 图1示出了可以应用本申请的页面推送方法或页面推送装置的实施例的示例性系统架构100。\n[0025] 如图1所示,系统架构100可以包括终端设备101、102、103,网络104和服务器105。\n网络104用以在终端设备101、102、103和服务器105之间提供通信链路的介质。网络104可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。\n[0026] 用户可以使用终端设备101、102、103通过网络104与服务器105交互,以接收或发送消息等。终端设备101、102、103上可以安装有各种通讯客户端应用,例如网页浏览器应用、购物类应用、搜索类应用、即时通信工具、邮箱客户端、社交平台软件等。\n[0027] 终端设备101、102、103可以是具有显示屏并且支持页面浏览的各种电子设备,包括但不限于智能手机、平板电脑、电子书阅读器、MP3播放器(Moving Picture Experts Group Audio Layer III,动态影像专家压缩标准音频层面3)、MP4(Moving Picture Experts Group Audio Layer IV,动态影像专家压缩标准音频层面4)播放器、膝上型便携计算机和台式计算机等等。\n[0028] 服务器105可以是提供各种服务的服务器,例如对终端设备101、102、103上显示的页面提供支持的后台网页服务器。后台网页服务器可以对接收到的网页页面请求等数据进行分析等处理,并将处理结果(例如网页页面数据)反馈给终端设备。\n[0029] 需要说明的是,本申请实施例所提供的页面推送方法一般由服务器105执行,相应地,页面推送装置一般设置于服务器105中。\n[0030] 应该理解,图1中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。\n[0031] 继续参考图2,示出了根据本申请的页面推送方法的一个实施例的流程200。所述的页面推送方法,包括以下步骤:\n[0032] 步骤201,采集客户端加载的页面的用户点击率。\n[0033] 在本实施例中,页面推送方法运行于其上的电子设备(例如图1所示的服务器105)可以通过有线连接方式或者无线连接方式从加载了页面的客户端(例如图1所示的终端设备)采集上述客户端加载的页面的用户点击率,其中,用户点击率指的是上述页面被用户点击的次数与被显示的次数之比,其中,上述页面可以是网页,也可以是网页上加载的信息页面,例如,广告信息页面,还可以是与广告有链接关系的文字、图片、视频等。需要指出的是,上述无线连接方式可以包括但不限于3G/4G连接、WiFi连接、蓝牙连接、WiMAX连接、Zigbee连接、UWB(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。\n[0034] 通常,用户利用上述客户端上安装的网页浏览器进行网页浏览,这时,用户可以通过输入网址或者点击网页浏览器中呈现的页面中的链接来向上述电子设备发起页面浏览请求,上述电子设备采集上述页面的用户点击率。在本实施例中,上述页面可以包括html格式、xhtml格式、asp格式、php格式、jsp格式、shtml格式、nsp格式、xml格式的页面或者其它未来将开发的格式的页面(只要这种格式的页面文件可以用浏览器打开并浏览其包含的图片、动画、文字等内容)。\n[0035] 步骤202,加载多个用于预测页面点击率的模型,并使用这些模型计算上述页面的预测点击率。\n[0036] 在本实施例中,首先,上述电子设备加载多个预先训练好的用于预测页面点击率的模型,其次,上述电子设备从上述页面中提取预测用的样本数据,上述预测用的样本数据与训练模型时用的样本数据类型相同,然后,将页面样本数据分别导入上述多个模型,其中,上述模型为可以用于页面点击率预测的任一种模型,例如,逻辑回归模型,由各个模型进行计算,得到上述页面样本数据的预测点击率。\n[0037] 在本实施例的一些可选的实现方式中,上述用于预测页面点击率的模型可以为基于机器学习算法预先训练得到的模型。其中,训练模型的方法可以包括:首先,从用于训练模型的页面集合中提取各个页面的样本数据,构成用于训练模型的样本数据集;然后,利用机器学习方法,基于上述样本数据集训练用于预测页面点击率的模型。\n[0038] 步骤203,基于上述预测点击率和上述用户点击率的比较结果,从多个模型中选择待用模型。\n[0039] 在本实施例中,页面推送方法运行于其上的电子设备可以将步骤202计算的预测点击率和步骤201采集的用户点击率进行比较,并根据比较的结果选择至少一个待用模型。\n例如,假设上述电子设备一共加载了10个模型,使用这10个模型分别计算某个线上页面的样本数据,得到该线上页面的样本数据的预测点击率。采集该线上页面的实际点击率,即用户点击率,将该线上页面的预测点击率和实际点击率进行比较,可以得出各个模型预测的该线上页面的点击率与实际点击率的比较,其中,上述比较可以是比较大小等方式,根据比较结果可以对各个模型计算的准确性进行判断,选择至少一个准确性高的模型。\n[0040] 在本实施例的一些可选的实现方式中,上述电子设备可以分别计算各个模型计算的预测点击率和上述用户点击率之间的差值,并基于计算出的差值,对各个模型进行排序,排序时可以根据各个模型的差值的大小按升序或者降序的方式进行排序。基于排序结果,从这些模型中选择出至少一个模型作为待用模型,例如,可以根据各个模型的差值的大小进行升序排序,即计算的预测点击率与实际点击率差别越小的模型排序越靠前,选择升序排序中位于前设定个数的模型为待用模型。\n[0041] 在本实施例的一些可选的实现方式中,还可以以图像的形式呈现以下信息中的至少一项:针对各个模型所计算出的上述差值,上述预测点击率和上述用户点击率。例如,可以根据设定的时间间隔绘制图像,以设定的时间间隔为横坐标,分别以点击率和差值为纵坐标绘制图像,其中,绘制的图像可以采用曲线图、柱状图或折线图等各种形式,绘制图像时,不同模型可以使用不同的颜色表示。\n[0042] 步骤204,使用上述待用模型计算多个待推送页面的预测点击率。\n[0043] 本实施例中,首先,上述电子设备提取各个待推送页面的样本数据;然后,将待推送网页的样本数据导入步骤203中选择出来的待用模型,由上述待用模型计算待推送页面的预测点击率。\n[0044] 步骤205,基于待推送页面的预测点击率从所述多个待推送页面中选择页面进行推送。\n[0045] 在本实施例中,通过待用模型计算出的待推送页面的预测点击率可以预测各个待推送页面的受欢迎程度。例如,某页面如果能够满足用户需求,则表现为用户点击率高,反之,如果某页面不能满足用户需求,用户将不会点击该页面,则表现为用户点击率低。所以,通过待推送页面的预测点击率可预测待推送页面的受欢迎程度,进行页面推送时优先推送受欢迎程度高的页面,即优先推送预测点击率高的页面。\n[0046] 在本实施例的一些可选的实现方式中,可以对待推送页面的预测点击率按由大到小的顺序进行排序,然后将排序后的前设定个待推送页面进行推送。例如,想要对100个待推送页面中的20个进行推送,首先,使用上述待用模型对这100个待推送页面进行点击率预测,其中,每个模型预测几个待推送页面的点击率由上述电子设备进行调整,例如,可以根据各个模型计算的准确性设置不同模型预测的比例。所有的待推送页面预测完成后,将各个待推送页面按预测的点击率的值由大到小的顺序进行排序,并将排在前20位的待推送页面推送给用户。\n[0047] 继续参见图3,图3是根据本实施例的页面推送方法的应用场景的一个示意图。在图3的应用场景中,上述电子设备可以基于机器学习算法预先训练多个用于预测页面点击率的模型;之后,使用线上数据验证各个模型的准确率,根据各个模型的准确率在多个模型中选择几个待用模型。上述电子设备获取多个待推送页面,上述电子设备使用选择的多个待用模型计算上述多个待推送页面的预测点击率,并可以将上述多个待推送页面按预测点击率由大到小的顺序进行排序,将排在前几名的待推送页面推送到客户端的浏览器,例如,将排在前4位的“页面A”、“页面B”、“页面C”、“页面D”推送到客户端浏览器。客户端浏览器就会如图3所示,弹出推送的“页面A”、“页面B”、“页面C”、“页面D”。\n[0048] 本申请的上述实施例提供的方法通过提前预测待推送页面的预测点击率,选择待推送页面中预测点击率高的页面进行推送,从而实现了满足用户需求的信息推送。\n[0049] 进一步参考图4,作为对上述各图所示方法的实现,本申请提供了一种页面推送装置的一个实施例,该装置实施例与图2所示的方法实施例相对应,该装置具体可以应用于各种电子设备中。\n[0050] 如图4所示,本实施例所述的页面推送装置400包括:采集单元401、计算单元402、选择单元403、预测单元404和推送单元405。采集单元401,配置用于采集客户端加载的页面的用户点击率;计算单元402,配置用于加载多个用于预测页面点击率的模型,并使用这些模型计算所述页面的预测点击率;选择单元403,配置用于基于所述预测点击率和所述用户点击率的比较结果,从多个模型中选择待用模型;预测单元404,配置用于使用所述待用模型计算多个待推送页面的预测点击率;推送单元405,配置用于基于待推送页面的预测点击率从所述多个待推送页面中选择网页进行推送。\n[0051] 本实施例中,页面推送装置400的采集单元401可以采集客户端加载的页面的用户点击率,即线上页面的实际点击率。\n[0052] 本实施例中,采集单元401采集客户端加载的页面的用户点击率。计算单元402加载多个预先训练好的用于预测页面点击率的模型,并使用这些模型计算上述页面的预测点击率,之后,选择单元403将采集单元401采集的上述页面的用户点击率和计算单元402计算的上述页面的预测点击率进行比较,并基于比较的结果从多个模型中选择出待用模型。预测单元404使用选择单元403选择出的待用模型计算多个待推送页面的预测点击率;最后,推送单元405基于预测单元404计算的待推送页面的预测点击率从上述多个待推送页面选择页面进行推送。\n[0053] 在本实施例的一个可选实施方式中,上述页面推送装置400的选择单元403进一步用于计算各个模型计算的预测点击率与上述用户点击率之间的差值,并基于计算出的差值,对各个模型进行排序;最后,基于排序结果,从这些模型中选择至少一个模型作为待用模型。\n[0054] 在本实施例的一个可选实施方式中,上述页面推送装置400还可以包括显示单元,上述显示单元用于以图像的形式呈现以下信息中的至少一项:针对各个模型所计算出的差值,预测点击率和上述用户点击率。\n[0055] 在本实施例的一个可选实施方式中,推送单元405还可以用于对上述多个待推送页面的预测点击率按由大到小的顺序进行排序,并将排序后的前设定个待推送页面进行推送。\n[0056] 本领域技术人员可以理解,上述页面推送装置400还包括一些其他公知结构,例如处理器、存储器等,为了不必要地模糊本公开的实施例,这些公知的结构在图4中未示出。\n[0057] 下面参考图5,其示出了适于用来实现本申请实施例的终端设备或服务器的计算机系统500的结构示意图。\n[0058] 如图5所示,计算机系统500包括中央处理单元(CPU)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储部分508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有系统500操作所需的各种程序和数据。\nCPU 501、ROM 502以及RAM 503通过总线504彼此相连。输入/输出(I/O)接口505也连接至总线504。\n[0059] 以下部件连接至I/O接口505:包括键盘、鼠标等的输入部分506;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分507;包括硬盘等的存储部分508;\n以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分509。通信部分509经由诸如因特网的网络执行通信处理。驱动器510也根据需要连接至I/O接口505。可拆卸介质511,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器510上,以便于从其上读出的计算机程序根据需要被安装入存储部分508。\n[0060] 特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括有形地包含在机器可读介质上的计算机程序,所述计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分509从网络上被下载和安装,和/或从可拆卸介质511被安装。\n[0061] 附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,所述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。\n[0062] 描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括采集单元、计算单元、选择单元、预测单元和推送单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,采集单元还可以被描述为“采集客户端加载的页面的用户点击率的单元”。\n[0063] 作为另一方面,本申请还提供了一种非易失性计算机存储介质,该非易失性计算机存储介质可以是上述实施例中所述装置中所包含的非易失性计算机存储介质;也可以是单独存在,未装配入终端中的非易失性计算机存储介质。上述非易失性计算机存储介质存储有一个或者多个程序,当所述一个或者多个程序被一个设备执行时,使得所述设备:采集客户端加载的页面的用户点击率;加载多个用于预测页面点击率的模型,并使用这些模型计算所述页面的预测点击率;基于所述预测点击率和所述用户点击率的比较结果,从多个模型中选择待用模型;使用所述待用模型计算多个待推送页面的预测点击率;基于待推送页面的预测点击率从所述多个待推送页面中选择页面进行推送。\n[0064] 以上描述仅为本申请的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请中所涉及的发明范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离所述发明构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
法律信息
- 2018-12-25
- 2015-12-30
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201510609656.8
申请日: 2015.09.22
- 2015-12-02
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2014-01-15
|
2012-06-18
| | |
2
| |
2012-02-08
|
2011-10-08
| | |
3
| |
2013-09-18
|
2013-06-28
| | |
4
| |
2013-07-17
|
2012-01-17
| | |
5
| |
2013-10-09
|
2013-07-06
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |