著录项信息
专利名称 | 图片搜索方法及搜索系统 |
申请号 | CN201010574563.3 | 申请日期 | 2010-11-30 |
法律状态 | 驳回 | 申报国家 | 中国 |
公开/公告日 | 2011-04-13 | 公开/公告号 | CN102012934A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F17/30 | IPC分类号 | G;0;6;F;1;7;/;3;0查看分类表>
|
申请人 | 百度在线网络技术(北京)有限公司 | 申请人地址 | 北京市海淀区上地十街10号百度大厦
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 百度在线网络技术(北京)有限公司 | 当前权利人 | 百度在线网络技术(北京)有限公司 |
发明人 | 文林福 |
代理机构 | 深圳市威世博知识产权代理事务所(普通合伙) | 代理人 | 何青瓦;李庆波 |
摘要
本发明提供一种图片搜索方法,包括:接收并处理上传图片;计算所述图片局部特征;通过所述图片局部特征在图片特征索引中搜索相似图片;通过所述相似图片在文本索引中搜索文本数据;输出所述相似图片与所述文本数据。与现有技术相比,本发明的有益效果是:通过本发明的基于图片的搜索方法和系统,不仅可实现在全网通过图片搜索与之相似的图片,还可以根据图片搜索与之相对应的文本信息,满足用户需求,提高搜索效率,节约网络流量,同时,本发明通过空间划分,进行视觉字量化和进行索引,解决了大数据量的查询效率问题,使得上几十亿的图片,检索只需要几百毫秒。
1.一种图片搜索方法,其特征在于,所述图片搜索方法包括以下步骤:
S1、接收并处理上传图片;
S2、计算所述图片局部特征;
S3、通过所述图片局部特征在图片特征索引中搜索相似图片;
S4、通过所述相似图片在文本索引中搜索文本数据;
S5、输出所述相似图片与所述文本数据。
2.根据权利要求1所述的图片搜索方法,其特征在于,在所述S5前,还包括:
排序步骤,对搜索到的所述相似图片和所述文本数据进行排序。
3.根据权利要求2所述的图片搜索方法,其特征在于,所述排序参考因素为图片相似度。
4.根据权利要求2所述的图片搜索方法,其特征在于,所述排序参考因素为图片相似度、死链状态,以及网页权值。
5.根据权利要求1所述的图片搜索方法,其特征在于,所述S1步骤包括:
S11、接收用户上传图片;
S13、根据图片的内容签名分发所述上传图片。
6.根据权利要求5所述的图片搜索方法,其特征在于,在所述S13步骤前,还包括:
S12、压缩所述上传图片:若上传图片大于设定阈值,则将所述上传图片压缩后,再进入S13步骤。
7.根据权利要求1所述的图片搜索方法,其特征在于,所述S2步骤包括:
判断上传图片是否为本地图片;
若不是本地图片,则下载所述URL地址的图片;
计算所述图片局部特征。
8.根据权利要求1所述的图片搜索方法,其特征在于,所述S5步骤包括:
S51、将排序后的搜索结果缓存;
S52、将所述搜索结果拼装后输出结果页面;
S53、将所述结果页面输出。
9.根据权利要求1所述的图片搜索方法,其特征在于,所述图片特征索引和所述文本索引的建立方法包括:
通过网络数据获取网络图片的URL;
获取所述图片的文本信息;
计算所述图片的局部特征;
查询存储的已有图片特征;
判断在已有图片特征中是否存在与所述局部特征相似的图片特征;
若存在与所述局部特征相似的图片特征,则对所述图片的文本信息和图片特征标记至少一个索引号;
重复上述步骤,建立索引。
10.根据权利要求1所述的图片搜索方法,其特征在于,所述图片特征索引和所述文本索引的建立方法包括:
通过网络数据获取网络图片的URL;
获取图片的URL;
计算所述图片的局部特征;
查询存储的已有图片特征;
判断在已有图片特征中是否存在与所述局部特征相似的图片特征;
若存在与所述局部特征相似的图片特征,则对所述图片的文本信息和图片特征标记至少一个索引号;
重复上述步骤,建立索引。
11.根据权利要求1所述的图片搜索方法,其特征在于,所述图片特征索引和所述文本索引的建立方法包括:
通过网络数据获取网络图片的URL;
计算所述图片的局部特征;
查询存储的已有图片特征;
判断在已有图片特征中是否存在与所述局部特征相似的图片特征;
若存在与所述局部特征相似的图片特征,则对所述图片的文本信息和图片特征标记至少一个索引号;
重复上述步骤,建立索引。
12.根据权利要求9或10或11所述的图片搜索方法,其特征在于,在查询存储的已有图片特征后,还包括建缩略图库,所述缩略图库可将缩略图插入到线上缩略图访问服务系统中。
13.根据权利要求9或10或11所述的图片搜索方法,其特征在于,在通过网络数据获取网络图片的URL步骤中,所述网络数据为展示数据,所述网络图片为展示图片。
14.根据权利要求9或10或11所述的图片搜索方法,其特征在于,建立所述已有图片特征,包括以下步骤:
在全网图片数据中提取图片;
分布式计算所述图片的图片特征;
存储所述图片特征。
15.根据权利要求14所述的图片搜索方法,其特征在于,在“分布式计算所述图片的图片特征”步骤之前,还包括:
判断该图片是否已计算过图片特征;
若未计算过图片特征,则进行“分布式计算所述图片的图片特征”步骤。
16.根据权利要求14所述的图片搜索方法,其特征在于,在“分布式计算所述图片的图片特征”之前,还包括:
判断该图片是否已计算过图片特征;
若已计算过所述图片的图片特征,则回到“在全网图片数据中提取图片”步骤中,提取下一图片。
17.根据权利要求14所述的图片搜索方法,其特征在于,所述分布式计算图片特征是载入视觉字典,将图片相关的特征量化到视觉字。
18.一种图片搜索系统,其特征在于,所述图片搜索系统包括:
WEB服务器和分发拼装模块:用于接收并处理上传图片,以及输出搜索到的所述相似图片与所述文本数据;
特征提取模块:用于计算所述图片局部特征;
图片特征索引模块:用于通过所述图片局部特征在所述图片特征索引模块中搜索相似图片;
文本索引模块:用于通过所述相似图片在所述文本索引模块中搜索文本数据。
19.根据权利要求18所述的图片搜索系统,其特征在于,所述WEB服务器的功能还包括:用于负责与用户浏览器交互,支持用户在浏览器上进行图片上传的POST请求,维持与用户的连接,并将用户上传的图片发送给所述分发拼装模块,并维持与所述分发拼装模块的连接,等待所述分发拼装模块返回的结果页面,再得到该所述结果页面后将其返回至所述用户浏览器。
20.根据权利要求18所述的图片搜索系统,其特征在于,所述分发拼装模块的功能还包括:用于接收所述WEB服务器传递的图片,并根据图片内容签名发送给不同的特征提取模块,以及将搜索结果拼装为结果页面并返回至所述WEB服务器。
21.根据权利要求18所述的图片搜索系统,其特征在于,所述特征提取模块的功能还包括:用于对搜索到的所述相似图片与所述文本数据进行缓存和排序。
22.根据权利要求21所述的图片搜索系统,其特征在于,所述排序参考因素为图片相似度。
23.根据权利要求21所述的图片搜索系统,其特征在于,所述排序参考因素为图片相似度、死链状态,以及网页权值。
24.根据权利要求18所述的图片搜索系统,其特征在于,所述一个分发拼装模块对应多个特征提取模块。
25.根据权利要求18或24所述的图片搜索系统,其特征在于,所述一个特征提取模块对应多个图片特征索引模块和多个文本索引模块。
26.根据权利要求18所述的图片搜索系统,其特征在于,所述图片搜索系统还包括URL图片下载模块:用于当用户上传图片URL地址时,下载URL地址上的图片,并将所述图片发送至特征提取模块。
27.根据权利要求18所述的图片搜索系统,其特征在于,为建立所述图片特征索引模块和所述文本索引模块,所述图片搜索系统还包括:
图片获取模块:用于通过网络数据获取网络图片的URL;
文本获取模块:用于获取所述图片的文本信息;
图片特征计算模块:用于计算所述图片的局部特征;
特征存储模块:用于查询存储的已有图片特征;
索引建立模块:用于建立文本索引模块和图片特征索引模块。
28.根据权利要求27所述的图片搜索系统,其特征在于,所述图片搜索系统还包括缩略图建库模块:用于建立缩略图库,将缩略图插入到线上缩略图访问服务系统中。
29.根据权利要求27所述的图片搜索系统,其特征在于,所述网络数据为展示数据,所述网络图片为展示图片。
30.根据权利要求27所述的图片搜索系统,其特征在于,为了建立所述特征存储模块,所述图片搜索系统还包括:
图片数据存储模块:用于存储全网图片数据;
图片传输模块:用于在所述图片数据存储模块中提取图片,并将所述图片传输至分布式计算平台,以及,接收所述分布式计算平台计算完成的图片特征,并将该图片特征传输至所述的所述特征存储模块;
分布式计算平台:用于分布式计算所述图片的图片特征。
31.根据权利要求30所述的图片搜索系统,其特征在于,所述分布式计算图片特征是载入视觉字典,将图片相关的特征量化到视觉字。
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2007-12-26
|
2007-02-15
| | |
2
| |
2009-08-19
|
2009-03-26
| | |
3
| |
2010-09-29
|
2010-02-26
| | |
4
| | 暂无 |
2001-03-29
| | |
5
| |
2010-07-14
|
2009-01-12
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2012-09-10 | 2012-09-10 | | |
2 | | 2013-12-30 | 2013-12-30 | | |
3 | | 2012-11-02 | 2012-11-02 | | |
4 | | 2012-06-27 | 2012-06-27 | | |
5 | | 2014-09-02 | 2014-09-02 | | |
6 | | 2015-09-25 | 2015-09-25 | | |
7 | | 2013-10-30 | 2013-10-30 | | |
8 | | 2012-09-10 | 2012-09-10 | | |
9 | | 2011-11-18 | 2011-11-18 | | |
10 | | 2015-03-13 | 2015-03-13 | | |
11 | | 2013-03-20 | 2013-03-20 | | |
12 | | 2014-09-02 | 2014-09-02 | | |
13 | | 2015-01-13 | 2015-01-13 | | |
14 | | 2012-06-27 | 2012-06-27 | | |
15 | | 2011-12-21 | 2011-12-21 | | |
16 | | 2013-03-20 | 2013-03-20 | | |
17 | | 2013-01-18 | 2013-01-18 | | |
18 | | 2012-02-01 | 2012-02-01 | | |
19 | | 2014-09-29 | 2014-09-29 | | |