著录项信息
专利名称 | 搜索方法和搜索设备 |
申请号 | CN201210545975.3 | 申请日期 | 2012-12-14 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2014-06-18 | 公开/公告号 | CN103870500A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 联想(北京)有限公司 | 申请人地址 | 北京市海淀区上地西路6号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 联想(北京)有限公司 | 当前权利人 | 联想(北京)有限公司 |
发明人 | 韩瑜;过晓冰 |
代理机构 | 北京市柳沈律师事务所 | 代理人 | 安之斐 |
摘要
本发明公开了一种搜索方法和搜索设备。所述搜索方法,用于在页面中搜索多媒体对象,并且包括:获得用于进行搜索的关键字;获得与所述关键字相关联的多媒体对象的参考样本;根据所述参考样本来在所述页面中搜索与所述关键字相关联的多媒体对象;返回搜索到的与所述关键字相关联的多媒体对象作为搜索结果。因此,在本发明中,可以实现基于多媒体对象的简便搜索,而无需单独地向多媒体对象分配一个或多个文本对象。
搜索方法和搜索设备\n技术领域\n[0001] 本发明涉及计算机技术领域,更具体地,本发明涉及一种搜索方法和搜索设备。\n背景技术\n[0002] 近年来,随着计算机技术的不断发展,出现了越来越多的用于搜索和检索信息的方法,以用于从包括各种对象的文档页面(诸如,网页页面、字处理软件的文档页面等)中搜索用户指定的关键字。\n[0003] 然而,目前针对页面的关键字检索方法还止步于简单的基于文本的搜索。基于本文的搜索方法使用包括一个或多个诸如单词或短语之类的文本对象作为关键字,来在文档页面中进行遍历查询,并且当搜索到与该关键字完全匹配的文本对象时,向用户返回相关结果。这种基于文本的搜索方法能够很好地适用于在基于纯文本的文档中进行搜索,然而却难以应用于包括各种多媒体对象(诸如,音频、图像、视频等)的文档页面之中。\n[0004] 例如,目前用户输入的搜索关键字,在网页中查找到的往往是包含该关键字的信息链接。可是对于网页中显示的图片和音视频,如果在其标题或者名称中没有显示这个关键字,就不会被检索到,那么这些图片或者音视频信息就成为遗漏的内容。\n[0005] 在现有技术中,为了能够搜索多媒体对象,人们想到可以向每个多媒体对象分配一个或多个文本对象,诸如标题、文件名、属性、元数据或标签之类,从而使得能够利用指定的关键字来对这些文本对象进行匹配,并且当出现匹配时,向用户返回与所匹配的文本对象相关联的多媒体对象。\n[0006] 然而,在这种方式中,所分配的文本对象常常具有一定的片面性和主观性,无法全面完整地体现出多媒体对象所实际包括的内容。而且,这些文本对象的添加也使得在加载文档页面的过程中增加了传送负载。\n[0007] 因此,需要一种新型的搜索方法和搜索设备来解决上述问题。\n发明内容\n[0008] 为了解决上述技术问题,根据本发明的一个方面,提供了一种搜索方法,用于在页面中搜索多媒体对象,所述方法包括:获得用于进行搜索的关键字;获得与所述关键字相关联的多媒体对象的参考样本;根据所述参考样本来在所述页面中搜索与所述关键字相关联的多媒体对象;返回搜索到的与所述关键字相关联的多媒体对象作为搜索结果。\n[0009] 此外,根据本发明的另一方面,提供了一种搜索设备,用于在页面中搜索多媒体对象,所述设备包括:关键字获得单元,用于获得用于进行搜索的关键字;参考样本获得单元,用于获得与所述关键字相关联的多媒体对象的参考样本;搜索单元,用于根据所述参考样本来在所述页面中搜索与所述关键字相关联的多媒体对象;返回单元,用于返回搜索到的与所述关键字相关联的多媒体对象作为搜索结果。\n[0010] 与现有技术相比,采用根据本发明的搜索方法和搜索设备,当用户希望在文档页面中包括的多媒体对象之中搜索包括用户指定的关键字的多媒体对象时,可以首先根据该关键字确定参考样本,并且使用该参考样本来搜索包括用户指定的关键字的多媒体对象。\n因此,在本发明中,可以实现基于多媒体对象的简便搜索,而无需单独地向多媒体对象分配一个或多个文本对象,从而避免了由于所分配的文本对象的片面性和主观性而导致产生错误搜索或遗漏搜索,并且节省了现有技术中在加载多媒体对象时必须同时加载与之相关联的文本对象的传送负载。\n[0011] 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。\n附图说明\n[0012] 附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:\n[0013] 图1图示了根据本发明的搜索方法。\n[0014] 图2图示了根据本发明的搜索设备。\n[0015] 图3图示了根据本发明实施例的搜索方法。\n[0016] 图4图示了根据本发明实施例的搜索设备。\n[0017] 图5图示了使用根据本发明实施例的搜索方式得到的搜索结果。\n具体实施方式\n[0018] 将参照附图详细描述根据本发明的各个实施例。这里,需要注意的是,在附图中,将相同的附图标记赋予基本上具有相同或类似结构和功能的组成部分,并且将省略关于它们的重复描述。\n[0019] 在下文中,将参考图1和图2来描述根据本发明的搜索方法和搜索设备。\n[0020] 图1图示了根据本发明的搜索方法,而图2图示了根据本发明的搜索设备。\n[0021] 图1所图示的搜索方法可以通过图2所图示的搜索设备来实现。具体地,所述搜索设备100包括:关键字获得单元110、参考样本获得单元120、搜索单元130、和返回单元140。\n[0022] 如图1所图示的,所述搜索方法用于在页面中搜索多媒体对象,并且包括:\n[0023] 在步骤S110中,关键字获得单元110获得用于进行搜索的关键字;\n[0024] 在步骤S120中,参考样本获得单元120获得与所述关键字相关联的多媒体对象的参考样本;\n[0025] 在步骤S130中,搜索单元130根据所述参考样本来在所述页面中搜索与所述关键字相关联的多媒体对象;\n[0026] 在步骤S140中,返回单元140返回搜索到的与所述关键字相关联的多媒体对象作为搜索结果。\n[0027] 由此可见,采用根据本发明的搜索方法和搜索设备,当用户希望在文档页面中包括的多媒体对象之中搜索包括用户指定的关键字的多媒体对象时,可以首先根据该关键字确定参考样本,并且使用该参考样本来搜索包括用户指定的关键字的多媒体对象。因此,在本发明中,可以实现基于多媒体对象的简便搜索,而无需单独地向多媒体对象分配一个或多个文本对象,从而避免了由于所分配的文本对象的片面性和主观性而导致产生错误搜索或遗漏搜索,并且节省了现有技术中在加载多媒体对象时必须同时加载与之相关联的文本对象的传送负载。\n[0028] 在下文中,将参考图3和图4来描述根据本发明实施例的搜索方法和搜索设备。在本发明的实施例中,以将搜索方法和搜索设备应用于在网页页面中对多媒体对象进行搜索的场景为例来进行说明。该网页页面可以包括文本对象和/或多媒体对象,该多媒体对象可以具有多种格式,例如音频、图像、视频等。用户期望在该网页页面所包括的多媒体对象之中查找到包括指定关键字的多媒体对象。\n[0029] 需要说明的是,尽管此处通过将根据本发明的搜索方法和搜索设备应用于网页页面搜索的场景来说明本发明,但是,本领域技术人员能够理解的是,本发明不限于此。而是,还可以将本发明应用于其他的场景,例如,在字处理软件(诸如,Word、Excel、PowerPoint)的文档页面中进行搜索的场景、在文档阅读软件(诸如,Acrobat Reader)的文档页面中进行搜索的场景、通过搜索引擎在因特网中进行搜索的场景等。\n[0030] 图3图示了根据本发明实施例的搜索方法,而图4图示了根据本发明实施例的搜索设备。\n[0031] 图3所图示的根据本发明实施例的搜索方法可以应用于图4所图示的搜索设备\n100。与图1中相似地,该搜索设备100包括:关键字获得单元110、参考样本获得单元120、搜索单元130、和返回单元140。\n[0032] 如图3所图示的,根据本发明实施例的搜索方法包括:\n[0033] 在步骤S210中,获得用于进行搜索的关键字。\n[0034] 当用户在通过在电子设备(诸如,笔记本计算机、台式计算机、平板电脑(PAD)、移动电话、多媒体播放器、个人数字助理(PDA))中运行的浏览器来浏览网页时,常常会需要进行关键字搜索,以便快速定位自己需要的信息。这时,用户往往不希望这种关键字搜索仅仅局限于文本对象(诸如,在网页上出现的普通文本或超级链接)的范围,而是希望能够同时在多媒体对象中进行搜索。\n[0035] 为了实现上述目的,可以将根据本发明实施例的搜索方法实现在用于浏览网页的浏览器中,换言之,可以将根据本发明实施例的搜索设备作为一个功能模块而集成在该浏览器。\n[0036] 具体地,当用户在通过应用了本发明的浏览器来浏览网页时,用户可以通过菜单(例如,编辑->查找)或者热键(例如,Ctrl+F)来调用弹出的搜索框,或者该搜索框也可以直接集成在浏览器的用户界面中。然后,用户可以通过该搜索框输入意欲搜索的关键字。\n[0037] 此时,在搜索设备100中,关键字获得单元110从该浏览器的搜索框中接收到用户输入的纯文本格式的输入信息,并且将它直接作为关键字。\n[0038] 显然,除了通过文本格式来输入信息之外,用户可能希望输入信息的方式是多样的,诸如通过语音方式、通过插入音频文件方式、通过插入图像文件方式等对于用户最为方便的方式来输入信息。\n[0039] 为此,优选地,可以使得浏览器的搜索框能够接收多种格式的输入信息。从而,在搜索设备100中,关键字获得单元110接收用户在该浏览器的搜索框中输入的输入信息,判断所述输入信息的格式是否是纯文本格式,如果是,则直接根据该输入信息来生成所述关键字;否则,对输入信息的格式进行识别,判断所述输入信息的格式是属于音频、图像、还是视频格式,并且根据所识别的格式,利用声纹提取、语音识别、图像识别等各种手段来从所述输入信息中提取用户意欲进行搜索的关键字。\n[0040] 此外,优选地,该关键字获得单元110还可以通过搜索框来提示用户输入意欲搜索的对象的类型,并且根据用户输入的类型来确定后续在文档页面中是搜索文本对象、搜索一种或多种格式的多媒体对象、还是搜索它们中的某些组合。\n[0041] 在步骤S220中,获得与关键字相关联的多媒体对象的参考样本。\n[0042] 具体地,在关键字获得单元110获得了关键字之后,参考样本获得单元120根据关键字获得单元110获得的关键字来获取与所述关键字相关联的多媒体对象的参考样本。\n[0043] 如果在步骤S210中关键字获得单元110接收到用户期望搜索某一特定格式多媒体对象的指示,则该参考样本获得单元120仅仅获取该特定格式的、与所述关键字相关联的多媒体对象的参考样本。\n[0044] 下面,假设用户希望在文档页面中将某人物的名字ABC作为关键字来执行搜索操作。\n[0045] 在第一示例中,当用户仅仅期望搜索与所述关键字的文字读音相关联的音频对象时,参考样本获得单元120首先确定所述关键字的文字读音是ABC;然后根据所述关键字的文字读音来获得相关联的参考音频样本。例如,参考样本获得单元120可以直接生成一段音频流,其中仅仅包括ABC的文字读音。替换地,也可以将包括各种关键字的文字读音的音频文件预先地存储在数据库中,参考样本获得单元120根据关键字来从该数据库中直接读取与ABC相关联的音频文件,并且从其中提取出关于ABC文字读音的音频流。\n[0046] 在第二示例中,当用户仅仅期望搜索与所述关键字的文字形状相关联的图像对象时,参考样本获得单元120首先确定所述关键字的文字形状是ABC;然后根据所述关键字的文字形状来获得相关联的参考图像样本。例如,参考样本获得单元120可以直接生成一副图像,其中仅仅包括ABC的文字形状。同样地,参考样本获得单元120也可以从数据库中直接读取与ABC相关联的图像文件,并且从其中提取出关于ABC文字形状的图像。\n[0047] 在第三示例中,当用户仅仅期望搜索与所述关键字所指代的对象的声音相关联的音频对象时,参考样本获得单元120首先确定所述关键字所指代的对象是人物ABC;然后根据所述关键字所指代的对象来获得与所述对象的声音相关联的参考音频样本。例如,可以将包括各种对象(人物、动物等)的声纹的音频文件预先地存储在数据库中,参考样本获得单元120根据关键字ABC来从该数据库中读取与ABC相关联的音频文件,并且从其中提取出关于ABC声纹的音频流。该ABC的声纹可以是人物ABC所特有的声音频段、特征频点、或者特征音节等。\n[0048] 在第四示例中,当用户仅仅期望搜索与所述关键字所指代的对象的外观相关联的图像对象时,参考样本获得单元120首先确定所述关键字所指代的对象是人物ABC;然后根据所述关键字所指代的对象来获得与所述对象的外观相关联的参考图像样本。例如,可以将包括各种对象(人物、动物、景点交通工具等各种事物)的外观的图像文件预先地存储在数据库中,参考样本获得单元120根据关键字ABC来从该数据库中读取与ABC相关联的图像文件,并且从其中提取出关于ABC外观的图像。该ABC的图像可以是人物ABC的各个角度视图,诸如正视图、俯视图、侧视图等。\n[0049] 在第五示例中,当用户期望搜索多种格式的多媒体对象时,参考样本获得单元120可以根据用户指定的多种格式来获取相应格式的、与所述关键字相关联的多媒体对象的参考样本。\n[0050] 在步骤S230中,根据参考样本来在页面中搜索与关键字相关联的多媒体对象。\n[0051] 具体地,在参考样本获得单元120获得了与所述关键字相关联的多媒体对象的参考样本之后,搜索单元130根据参考样本获得单元120所获得的参考样本来在所述页面中搜索与所述关键字相关联的多媒体对象。\n[0052] 如上所述,如果在步骤S210中关键字获得单元110接收到用户期望搜索某一特定格式多媒体对象的指示,则该搜索单元130仅仅获取该特定格式的、与所述关键字相关联的多媒体对象。\n[0053] 例如,该搜索单元130首先获得所述页面中的每一个多媒体对象;确定所获得的多媒体对象的格式;判断所述多媒体对象的格式是否是用户所指定的格式,如果不是,则继续获取下一个多媒体对象。如果是,则该搜索单元130继续对所获得的多媒体对象与相应格式的参考样本进行相似度比较,并且判断所获得的多媒体对象与所述参考样本之间的相似度是否大于阈值(例如,75%),如果是,则将所获得的多媒体对象确定为与所述关键字相关联的多媒体对象,如果不是,则认为搜索结果不匹配,并继续获取下一个多媒体对象。\n[0054] 在一个示例中,当多媒体对象是音频流时,该搜索单元130可以对所获得的音频多媒体对象进行音频识别,提取特征音频点、音频频率范围、特征发音音节等等音频特性,将它与参考样本之间的相应音频特性进行比较。\n[0055] 在另一示例中,当多媒体对象是图像时,该搜索单元130可以对所获得的图像多媒体对象进行图像识别,提取特征图像点、图像的亮度、色度、色调范围等等图像特性,将它与参考样本之间的相应图像特性进行比较。\n[0056] 在又一示例中,当多媒体对象是视频流时,该搜索单元130可以对所获得的视频多媒体对象进行逐帧提取,并且将每一帧图像与参考样本之间的相应图像特性进行比较,同时还可以对所获得视频多媒体对象中包括的音频流进行提取,并且将音频流与参考样本之间的相应音频特性进行比较。\n[0057] 另外,如果在步骤S210中关键字获得单元110并没有接收到用户期望搜索某一特定格式多媒体对象的指示,则向该搜索单元130通知获取所有可能格式的、与所述关键字相关联的多媒体对象。\n[0058] 这时,该搜索单元130首先获得所述页面中的每一个多媒体对象并确定所获得的多媒体对象的格式。当确定出所获得的多媒体对象具有第一格式时,该搜索单元130从参考样本获得单元120在步骤S220中所获得的多种格式的参考样本中选择具有所述第一格式的参考样本进行相似度比较。替换地,该搜索单元130还可以从所获得的多种格式的参考样本中选择具有与所述第一格式相应格式的参考样本进行相似度比较。\n[0059] 在一个示例中,当多媒体对象是音频流时,该搜索单元130可以利用关于关键字的文字读音(例如,文字ABC的读音)的音频流、和/或关于所述关键字所指代的对象的声音(例如,人物ABC的声纹)的音频流来进行相似度比较。\n[0060] 在另一示例中,当多媒体对象是图像时,该搜索单元130可以利用关于ABC文字形状(例如,文字ABC的各种字体)的图像、和/或关于所述关键字所指代的对象的外观(例如,人物ABC的容貌、体型)的图像来进行相似度比较。\n[0061] 在又一示例中,当多媒体对象是视频流时,该搜索单元130可以上述提到的所有参考样本来进行相似度比较。\n[0062] 在步骤S240中,返回搜索到的与关键字相关联的多媒体对象作为搜索结果。\n[0063] 具体地,在该搜索单元130判断出已经对所述页面中的每一个多媒体对象进行过匹配之后,向返回单元140发送搜索完成信号。该返回单元140根据该搜索完成信号来将在步骤S230中实时接收到的搜索结果、或者在步骤S240中与该搜索完成信号同时接收到的搜索结果返回给浏览器并显示给用户。例如,该浏览器可以通过对多媒体对象进行高亮显示、逐一跳转等方式来向用户显示搜索结果。\n[0064] 显然,除了搜索多媒体对象之外,该搜索单元130还可以利用现有技术中基于文本的搜索方式来对页面文档中的纯文本对象进行搜索,以实现更为全面的对象搜索。\n[0065] 另外,在优选的实施例中,除了与关键字严格匹配的搜索结果之外,有时用户可能希望能够获得与该关键字相关的更大范围的搜索结果。对此,该搜索设备100还可以包括相近词获得单元150,用于获得所述关键字的相近词,以便进一步丰富用户期望的搜索结果。\n[0066] 相应地,图3所图示的搜索方法进一步包括:\n[0067] 在步骤S250中,用于获得所述关键字的相近词。\n[0068] 具体地,在关键字获得单元110获得了关键字之后,该相近词获得单元150可以根据关键字获得单元110获得的关键字来获取与该关键字相关联的相近词。\n[0069] 在一个示例中,该相近词获得单元150可以根据模糊算法来自动地生成该关键字的近义词。该相近词获得单元150可以通过对用户输入的关键词进行分析,根据分析结果来构建模糊型数学模型,利用隶属关系将数据元素集合灵活地转换成模糊集合,并且确定相关的隶属函数,从而得到该关键字的近义词。例如,当关键词是“北京”时,该相近词获得单元150可以确定“首都”为该关键词的近义词。\n[0070] 在另一示例中,该相近词获得单元150还可以根据预先定义的一些相近词词典、用户词库来查询与该关键字相关联的相近词。例如,当关键词是某人物的名字“ABC”时,该近义词可以是人物ABC的艺名“DEF”、曾用名、亲属姓名、证件号码等等各种相关联的关键字。\n[0071] 在步骤S260中,获得与相近词相关联的多媒体对象的参考样本。\n[0072] 在步骤S270中,根据参考样本来在页面中搜索与相近词相关联的多媒体对象。\n[0073] 在步骤S280中,返回搜索到的与相近词相关联的多媒体对象作为搜索结果。\n[0074] 由于步骤S260到S280的操作与步骤S220到S240中相似,只需将关键字替换为相近词即可,所以在此省略了其详细说明。\n[0075] 下面,将参考图5来描述根据本发明实施例的搜索结果的具体示例。\n[0076] 图5图示了使用根据本发明实施例的搜索方式得到的搜索结果。如图5所示,当用户期望搜索某人物的名字ABC时,搜索设备100将人物的名字ABC作为关键字,并且进一步确定与该人物的名字ABC相关联的相近词。例如,该相近词可以是该人物的艺名DEF。\n[0077] 于是,搜索设备100执行上述步骤S210到S280,以便获得与关键字ABC和相近词DEF相关联的多媒体对象的参考样本,利用该参考样本来进一步搜索与关键字ABC和相近词DEF相关联的多媒体对象,并返回搜索结果。\n[0078] 如图5所示,在搜索结果中,附图标记501指示出包括ABC文字形状的图像;附图标记502指示出包括人物ABC头像的图像;附图标记503和504指示出与关键字ABC完全匹配的文本对象;附图标记505指示出包括人物ABC声音的音频流;附图标记506指示出包括人物ABC艺名DEF的文本对象;附图标记507指示出包括人物ABC的图像的视频流。\n[0079] 其中,附图标记505指示出的包括人物ABC的声音的音频流也可以通过在该音频流的属性信息中包括的纯文本对象“ABC唱片试听”中的“ABC”来获得。\n[0080] 另外,如果在附图标记507指示出的包括人物ABC的图像的视频流中还包括人物ABC自己的语音,则它也可以通过关于ABC声纹的参考样本来获得。同理,如果在附图标记\n507指示出的包括人物ABC的图像的视频流中还包括人物ABC人名图像,则它也可以通过关于ABC文字形状的参考样本来获得。如果在附图标记507指示出的包括人物ABC的图像的视频流中还包括人物ABC人名的音频,则它也可以通过关于ABC文字读音的参考样本来获得。\n[0081] 由此可见,采用根据本发明实施例的搜索方法和搜索设备,当用户希望在文档页面中包括的多媒体对象之中搜索与关键字相关的多媒体对象时,可以根据该关键字确定相近词,并确定关键字与相近词的参考样本,并且使用该参考样本来搜索包括用户指定格式的或者所有格式的多媒体对象。因此,在本发明中,不仅可以将包含关键字的文本对象,而且也可以将与关键字和/或相关词相关的音频、图片、视频等多媒体对象一起标识出来,这样即使在多媒体对象中并不包括文本格式的关键字的情况下,也只要内容匹配,也可以成为搜索结果,从而极大地提高了用户的搜索体验,便于用户进行筛查和选择。\n[0082] 需要说明的是,尽管在上文中以特定的顺序描述了根据本发明实施例的通信方法,但是本发明不限于此。例如,显然,步骤S250可以在步骤S220之前执行或者与之同时执行,同理,步骤S260到S280可以在步骤S220到S240之前执行或者与之同时执行。\n[0083] 通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到本发明可借助于软件加必需的硬件平台的方式来实现,当然也可以全部通过软件、或硬件来实施。基于这样的理解,本发明的技术方案对背景技术做出贡献的全部或者部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁盘、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。\n[0084] 在上面详细描述了本发明的各个实施例。然而,本领域技术人员应该理解,在不脱离本发明的原理和精神的情况下,可对这些实施例进行各种修改,组合或子组合,并且这样的修改应落入本发明的范围内。
法律信息
- 2017-05-24
- 2014-07-16
实质审查的生效
IPC(主分类): G06F 17/30
专利申请号: 201210545975.3
申请日: 2012.12.14
- 2014-06-18
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |