著录项信息
专利名称 | 一种搜索结果的展现方法与装置 |
申请号 | CN201110419966.5 | 申请日期 | 2011-12-15 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2013-06-19 | 公开/公告号 | CN103164449A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 腾讯科技(深圳)有限公司 | 申请人地址 | 广东省深圳市福田区振兴路赛格科技园2栋东403室
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 腾讯科技(深圳)有限公司 | 当前权利人 | 腾讯科技(深圳)有限公司 |
发明人 | 廖宇奇 |
代理机构 | 北京德琦知识产权代理有限公司 | 代理人 | 张晓峰;宋志强 |
摘要
本发明公开了一种搜索结果的展现方法和装置。方法包括:A、接收搜索请求,根据其中的检索词确定所要聚合的至少两种数据源的种类;B、从步骤A所确定的各类数据源中检索与所述检索词匹配的搜索结果;C、将步骤B检索出的各类数据源中的搜索结果进行聚合展现。所述系统包括:搜索请求接收模块;分类模块,用于根据所述接收到的搜索请求中的检索词确定所要聚合的数据源的种类;检索模块,用于从所述分类模块所确定的各类数据源中检索与所述检索词匹配的搜索结果;聚合展现模块,用于将所述检索模块检索出的各类数据源中的搜索结果进行聚合展现。利用本发明,在搜索结果展现页面中可以为用户提供多种类的、更加丰富的聚合信息。
1.一种搜索结果的展现方法,其特征在于,包括:
接收含有检索词的搜索请求,根据所述搜索请求中的检索词和预设的聚合条件,判断是否需要进行信息聚合,在判定需要进行信息聚合后,根据其中的检索词确定所要聚合的至少两种数据源的种类;
从所确定的各类数据源中检索与所述检索词匹配的搜索结果;
将检索出的各类数据源中的搜索结果进行聚合展现;
所述根据其中的检索词确定所要聚合的至少两种数据源的种类具体为:
用所述检索词去匹配预设分类词表中的关键词,该预设分类词表中每一分类设置有对应的至少两种数据源种类;
根据匹配到的关键词所属的类别确定该类别对应的至少两种数据源种类,该类别对应的至少两种数据源种类为所要聚合的至少两种数据源种类。
2.根据权利要求1所述的方法,其特征在于,所述聚合条件为预设的聚合词表;所述判断是否需要进行信息聚合具体为:用所述搜索请求中的检索词查询匹配所述聚合词表中的关键词,如果能匹配到,则判定所述搜索请求需要进行信息聚合,否则判定该搜索请求不需要进行信息聚合。
3.根据权利要求1所述的方法,其特征在于,在从所确定的各类数据源中检索出与所述检索词匹配的搜索结果之后进一步将所述检索出的各类数据源中的搜索结果进行选优处理;且将经过所述选优处理的各类数据源中的搜索结果进行聚合展现。
4.根据权利要求1所述的方法,其特征在于,在所述将检索出的各类数据源中的搜索结果进行聚合展现之后,进一步包括:
在所述聚合展现的搜索结果区域显示信息提交框,接收用户提交的信息,并将所提交的信息存储到对应的数据源库中。
5.根据权利要求1至4任一项所述的方法,其特征在于,所述数据源的种类包括:新闻类数据源、视频类数据源、图片类数据源、日志类数据源、博客类数据源、以及微博类数据源。
6.一种搜索结果的展现装置,其特征在于,包括:
搜索请求接收模块,用于接收含有检索词的搜索请求;
预处理模块,用于根据所述搜索请求中的检索词和预设的聚合条件,判断是否需要进行信息聚合,在判定需要进行信息聚合后,将所述搜索请求发送给分类模块;
所述分类模块,用于根据所述接收到的搜索请求中的检索词确定所要聚合的至少两种数据源的种类;
检索模块,用于从所述分类模块所确定的各类数据源中检索与所述检索词匹配的搜索结果;
聚合展现模块,用于将所述检索模块检索出的各类数据源中的搜索结果进行聚合展现;
所述分类模块用于用所述检索词去匹配预设分类词表中的关键词,该预设分类词表中每一分类设置有对应的至少两种数据源种类,根据匹配到的关键词所属的类别确定该类别对应的至少两种数据源种类,该类别对应的至少两种数据源种类为所要聚合的至少两种数据源种类。
7.根据权利要求6所述的装置,其特征在于,该装置进一步包括:
选优模块,用于对所述检索模块检索出的各类数据源中的搜索结果进行选优处理,将选优处理后的各类数据源的搜索结果发送给所述聚合展现模块进行聚合展现。
8.根据权利要求6所述的装置,其特征在于,该装置进一步包括:
信息提交模块,用于在所述聚合展现模块所聚合展现的搜索结果区域显示信息提交框,接收用户提交的信息,并将所提交的信息存储到对应的数据源库中。
一种搜索结果的展现方法与装置\n技术领域\n[0001] 本发明涉及互联网信息处理技术,尤其涉及一种互联网搜索结果的信息聚合展现方法与装置。\n背景技术\n[0002] 互联网搜索引擎是指根据一定的策略、运用特定的程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。\n[0003] 目前,传统搜索引擎中除了可以直接排序显示搜索结果,还可以实现一定的信息聚合功能。具体的实现方式是:当用户的检索请求到达后台系统后,首先由搜索引擎在数据源库中进行检索,之后将得到的检索结果进行组合,最后将组合后的结果反馈给前台系统进行信息聚合的展示。\n[0004] 图1为现有技术的一种在搜索结果进行新闻信息聚合的页面示意图,参见图1,在用户输入检索词“温州动车”并将该搜索请求发送给后台之系统后,后台系统通过检索判断出该检索词对应存在有大量类似的新闻,则将该检索词对应的新闻聚合成一个单独的信息聚合显示单元呈现在搜索结果页面100中,如图1中的虚线框101为该检索词“温州动车”对应的新闻信息聚合显示单元,其中聚合了若干条关于检索词“温州动车”的新闻,方便用户在一个搜索单元中集中了解多条关于检索词的新闻。\n[0005] 图2为现有技术的一种在搜索结果进行图片信息聚合的页面示意图,参见图2,在用户输入检索词“丽江风景”并将该搜索请求发送给后台之系统后,后台系统通过检索判断出该检索词对应存在有大量类似的图片,则将该检索词对应的图片聚合成一个单独的信息聚合显示单元呈现在搜索结果页面 200中,如图2中的虚线框201为该检索词“丽江风景”对应的图片信息聚合显示单元,其中聚合了若干张关于检索词“丽江风景”的图片,方便用户在一个搜索单元中集中了解多条关于检索词的图片。\n[0006] 但是,上述现有技术存在如下缺陷:\n[0007] 用户的搜索请求到达后台系统后,只会在单一的数据源库中进行检索,例如只在新闻源库中检索新闻,并只聚合新闻信息;只在图片源库中检索图片,并只聚合图片信息。\n然而用户通常希望从多种类的途径了解关于检索词的相关信息,因此上述现有技术在搜索结果中进行信息聚合的信息种类过于单一,无法为用户提供更加全面的信息。用户为了查找目标信息必须重新提交搜索请求,或者从大量的搜索结果页面中人工点击挑选搜索结果,会导致用户通过更多的人机交互操作来获取更丰富的目标信息,每一次人机交互操作都会发出操作请求信息、触发计算过程并产生响应结果信息,从而会占用互联网机器侧的大量资源,包括客户端资源、服务器资源、网络带宽资源等等。\n[0008] 另外,上述现有技术提供的聚合信息中关于用户生成内容(UGC,User Generated Content)的信息较少甚至没有,主要数据源为门户网站等大站点,信息观点较单一,不利于用户获得更加丰富的信息。并且,用户只能获取信息,在搜索结果页中无法参与互动来主动补充内容,搜索结果也无法及时更新UGC数据。\n发明内容\n[0009] 有鉴于此,本发明提供一种搜索结果的信息聚合展现方法与装置,在搜索结果展现页面中为用户提供多种类的聚合信息,减少用户为了获取目标信息而进行的人机交互次数,降低对机器侧资源的占用。\n[0010] 本发明的技术方案是这样实现的:\n[0011] 一种搜索结果的信息聚合展现方法,包括:\n[0012] 接收含有检索词的搜索请求,根据其中的检索词确定所要聚合的至少两种数据源的种类;\n[0013] 从所确定的各类数据源中检索与所述检索词匹配的搜索结果;\n[0014] 将检索出的各类数据源中的搜索结果进行聚合展现。\n[0015] 一种搜索结果的信息聚合展现装置,包括:\n[0016] 搜索请求接收模块,用于接收含有检索词的搜索请求;\n[0017] 分类模块,用于根据所述接收到的搜索请求中的检索词确定所要聚合的数据源的种类;\n[0018] 检索模块,用于从所述分类模块所确定的各类数据源中检索与所述检索词匹配的搜索结果;\n[0019] 聚合展现模块,用于将所述检索模块检索出的各类数据源中的搜索结果进行聚合展现。\n[0020] 与现有技术相比,本发明可以根据检索词确定至少两种数据源种类,并分别到各类数据源中检索,将检索结果进行聚合展示,因此可以在搜索结果的展现页面中为用户提供尽量多的、多种类的聚合信息,减少用户为了获取目标信息而进行的人机交互次数,降低对互联网机器侧资源的占用,提高互联网机器侧的运行效率。\n[0021] 区别于传统搜索引擎的实现方案,本发明在搜索结果中聚合的信息不仅仅来源于门户网站等传统信息点,还来源于空间日志、空间相册、微博、“说说”(“说说”是一种描述用户心情的网络系统,其中可以包括文字、图片、视频等数据内容)等传统搜索引擎所不包含的信息,以提供给用户更全面的信息获取方式。因此也可以说,本发明提供了一种富媒体化的搜索结果信息聚合方式,可以将门户新闻、视频、社区UGC信息,如空间日志、空间相册、博客、微博、说说等多数据源的信息择优聚合并在一个搜索结果页面展现给用户,弥补了传统搜索引擎内容聚合方式过于倾向门户网站导致信息单一的先天不足,更便于用户获取全面的内容。\n附图说明\n[0022] 图1为现有技术的一种在搜索结果进行新闻信息聚合的页面示意图;\n[0023] 图2为现有技术的一种在搜索结果进行图片信息聚合的页面示意图;\n[0024] 图3为本发明所述搜索结果的信息聚合展现方法的一种实施流程图;\n[0025] 图4为本发明所述方法的另一种具体实施流程图;\n[0026] 图5为本发明的一种在搜索结果中进行信息聚合展示的页面示意图;\n[0027] 图6为本发明的一种在搜索结果中进行信息聚合展示并具有互动信息提交框的页面示意图;\n[0028] 图7为本发明所述在搜索结果的信息聚合展现装置的一种实施示意图;\n[0029] 图8为本发明所述搜索结果的信息聚合展现装置的另一种具体实施示意图。\n具体实施方式\n[0030] 下面结合附图及具体实施例对本发明再作进一步详细的说明。\n[0031] 图3为本发明所述搜索结果的信息聚合展现方法的一种流程图。参见图3,本发明的方法包括:\n[0032] 步骤301、接收含有检索词的搜索请求,根据其中的检索词确定所要聚合的至少两种数据源的种类。\n[0033] 本发明中候选的数据源的种类可以包括:新闻类数据源、视频类数据源、图片类数据源、日志类数据源、博客类数据源、以及微博类数据源等。\n[0034] 步骤302、从步骤301所确定的各类数据源中检索与所述检索词匹配的搜索结果;\n[0035] 步骤303、将步骤302检索出的各类数据源中的搜索结果进行聚合展现。\n[0036] 图4为本发明所述方法的另一种具体实施流程图。参见图4,该流程包括:\n[0037] 步骤401、用户发起含有检索词的搜索请求,后台系统收到搜索请求后进行后续处理。\n[0038] 步骤402、进行预处理,即:根据所述搜索请求中的检索词和预设的聚合条件,判断是否需要进行信息聚合,如果是则执行本流程后续步骤;否则结束本流程,按照现有的对搜索请求的处理方式进行处理。\n[0039] 当然,本步骤402为可选步骤,也可以省略该步骤402,步骤401之后直接执行步骤\n403。\n[0040] 本步骤402中,所述预设的聚合条件可以是一个预设的聚合词表,该聚合词表内包括根据搜索(query)热度(搜索热度就是某个关键词近期的搜索量)、信息丰富度(即相关聚合内容网页的结果数)、特殊词表(如明星名、车辆型号、地名)等多个条件优先选入的关键词。该聚合词表可以由程序自动收集相关数据生成并持续更新维护,同时也可以由人工干预生成并向其中添加关键词。\n[0041] 本步骤402中,具体判断是否需要进行信息聚合的方法为:用搜索请求中的检索词查询匹配所述聚合词表中的关键词,此处所述的匹配方式可以采用完全匹配、模糊匹配、部分匹配、类意匹配等业界常用的方式,比如聚类词表中包括关键词“专利法”,当检索词为“中国专利法”也认为可以匹配;如果所述检索词能够匹配到所述聚合词表中的关键词,则判定所述搜索请求需要进行信息聚合,否则判定该搜索请求不需要进行信息聚合。\n[0042] 步骤403、根据所收到的搜索请求中的检索词确定所要聚合的至少两种数据源的种类。\n[0043] 本步骤403中,具体的方式为:可以预设一分类词表,例如本实施例中可以对上述的聚合词表中的关键词进行分类进一步成为一个已分类的聚合词表,如:关键词“个人所得税修改”被划分为“社会热门事件”类;关键词“Iphone4”被划分为“手机型号”类。针对每一个分类,对应设置至少两种的数据源种类,例如“社会热门事件”类对应设置的数据源种类可以包括新闻类数据源、视频类数据源、微博类数据源等。本步骤403中,需要用所述搜索请求中的检索词去匹配所述分类词表中的关键词,再根据匹配到的关键词所属的类别确定该类别对应的至少两种数据源种类,该类别对应的至少两种数据源种类就是本步骤403最终要确定的所述搜索请求最终所要聚合的至少两种数据源种类。\n[0044] 步骤404、从步骤403所确定的各类数据源中检索与所述检索词匹配的 搜索结果。\n例如,如果步骤403确定的需要聚合展示的数据源包括新闻类、视频类、以及微博类数据源,则分别从所述新闻类数据源、视频类数据源、以及微博类数据源对应的数据库中检索出与所述检索词匹配的搜索结果。\n[0045] 步骤405、将步骤404检索出的各类数据源中的搜索结果进行选优处理。此处具体的选优处理方法例如可以为:从系统中的已有的数据库中查询各搜索结果的优选指标数据。所述的优选指标数据例如可以包括但不限于:文本长度、图文丰富度、页面格式、用户分享数(评论数)、是否有垃圾内容,来源是否正规(比如sina等大门户网站的内容属于正规来源,应优先选择)、是否有特殊标识(比如被某个网站系统优先推荐过的优质内容)等。然后根据所述优选指标数据对所述搜索结果进行排序,最好按照预定的选择比例选择排序在前的搜索结果作为优选处理结果。\n[0046] 当然,本步骤405可是可选步骤,也可以在步骤404之后直接执行步骤406,仅将所述步骤404检索出的各类数据源中的搜索结果进行聚合展现。\n[0047] 步骤406、将步骤404检索出的、且经过步骤405所述选优处理后的各类数据源中的搜索结果进行聚合展现。\n[0048] 如图5为本发明的一种在搜索结果中进行信息聚合展示的页面示意图。参见图5,在用户输入检索词“温州动车”并将该搜索请求发送给后台系统后,后台系统通过上述方法返回一个搜索结果页面500,在该搜索结果页面500中,各类数据源的搜索结果被聚合展现在一聚合显示单元501中,其中包括了视频类的搜索结果511、新闻类的搜索结果512、图片类的搜索结果513、以及用户UGC的搜索结果514。因此,本发明提供了一种富媒体化的搜索结果信息聚合方式,可以将门户新闻、视频、社区UGC信息,如空间日志、空间相册、博客、微博、说说等多数据源的信息择优聚合并在一个搜索结果页面展现给用户,弥补了传统搜索引擎内容聚合方式过于倾向门户网站导致信息单一的先天不足,更便于用户获取全面的内容。\n[0049] 步骤407、在所述聚合展现的搜索结果区域显示信息提交框,接收用户提交的信息,并将所提交的信息存储到对应的数据源库中。\n[0050] 另外,对于用户提交的UGC内容,还可以进一步进行过滤,所述过滤条件例如可以是提交的内容是否与当前主题相关,例如:“温州动车”主题下,若用户提交的UGC内容含有相关内容,则会同步展现在当前页面上,若没有含相关内容,则会被过滤掉不予展现;或者,也可以根据文本长度、图文丰富度、文本格式等内容判断其是否为一个优质的UGC内容,如果是则会同步展现在当前页面上,否则过滤掉不予展现。\n[0051] 如图6为本发明的一种在搜索结果中进行信息聚合展示并具有互动信息提交框的页面示意图。参见图6,用户可以在所述互动提示框601中发表关于搜索结果的信息,如果符合上述过滤条件,含可以同步展示在当前搜索页面500中,如图中的UGC信息602所示。\n[0052] 当然,本步骤407也是可选步骤,其目的是使用户在搜索结果页面可以与页面进行互动,产出的UGC内容可以正向反馈回搜索结果,形成搜索结果的自动优化和不断更新,还可以进一步优化和不断更新后台的数据源,进而不断优化和更新后续的搜索结果。\n[0053] 图7为本发明所述搜索结果的信息聚合展现装置的一种实施示意图。参见图7,该装置包括:\n[0054] 搜索请求接收模块701,用于接收含有检索词的搜索请求。\n[0055] 分类模块702,用于根据所述接收到的搜索请求中的检索词确定所要聚合的数据源的种类。\n[0056] 检索模块703,用于从所述分类模块所确定的各类数据源中检索与所述检索词匹配的搜索结果。\n[0057] 聚合展现模块704,用于将所述检索模块检索出的各类数据源中的搜索结果进行聚合展现。\n[0058] 图8为本发明所述搜索结果的信息聚合展现装置的另一种具体实施示意图。参见图8,该实施例除了包括图7所示的模块外,还进一步包括如下模块:\n[0059] 预处理模块7011,设置在所述搜索请求接收模块701和分类模块702之间,用于根据所述搜索请求中的检索词和预设的判断条件,判断是否需要进行信息聚合,在判定需要进行信息聚合后,再将所述搜索请求发送给所述分类模块702。\n[0060] 选优模块7031,设置在所述检索模块703和聚合展现模块704之间,用于对所述检索模块703检索出的各类数据源中的搜索结果进行选优处理,将选优处理后的各类数据源的搜索结果发送给所述聚合展现模块704进行聚合展现。\n[0061] 信息提交模块7041,用于在所述聚合展现模块704所聚合展现的搜索结果区域显示信息提交框,接收用户提交的信息,并将所提交的信息存储到对应的数据源库中。\n[0062] 当然上述预处理模块7011、选优模块7031、信息提交模块7041都是可选的,可以在具体实施例中包括其中任一模块、或任两个模块、或三个模块都包括。\n[0063] 以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明保护的范围之内。
法律信息
- 2016-04-13
- 2013-07-24
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201110419966.5
申请日: 2011.12.15
- 2013-06-19
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2008-09-17
|
2007-03-12
| | |
2
| |
2011-09-14
|
2011-05-11
| | |
3
| |
2011-11-16
|
2009-12-11
| | |
4
| |
2009-11-18
|
2007-12-10
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |