著录项信息
专利名称 | 一种图像文字识别方法和装置 |
申请号 | CN201210279368.7 | 申请日期 | 2012-08-07 |
法律状态 | 驳回 | 申报国家 | 中国 |
公开/公告日 | 2013-01-02 | 公开/公告号 | CN102855480A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06K9/20 | IPC分类号 | G;0;6;K;9;/;2;0查看分类表>
|
申请人 | 北京百度网讯科技有限公司 | 申请人地址 | 北京市海淀区上地十街10号百度大厦2层
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 北京百度网讯科技有限公司 | 当前权利人 | 北京百度网讯科技有限公司 |
发明人 | 韩钧宇;丁二锐;吴中勤;文林福 |
代理机构 | 深圳市威世博知识产权代理事务所(普通合伙) | 代理人 | 何青瓦;李庆波 |
摘要
本发明提供了一种图像文字识别的方法和装置,其中方法包括:S1、获取待识别图像中的文字区域;S2、对所述文字区域进行文字识别;S3、利用识别结果查询知识库获得识别结果对应的知识信息;S4、在返回所述识别结果时,推送包含所述知识信息的知识拓展词包。本发明使得用户在获取图像中文字识别结果的同时,能够获取到对应的知识信息,而无需进一步通过手工的方式获得知识信息,显然更加方便和省力。
1.一种图像文字识别的方法,其特征在于,该方法包括:
S1、获取待识别图像中的文字区域;
S2、对所述文字区域进行文字识别;
S3、利用识别结果查询知识库获得识别结果对应的知识信息;
S4、在返回所述识别结果时,推送包含所述知识信息的知识拓展词包。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1具体包括:
服务器接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者,服务器接收移动终端从待识别图像中提取并发送来的文字区域。
3.根据权利要求1所述的方法,其特征在于,所述步骤S2具体包括:
对文字区域进行二值化;
对二值化后的文字区域分割为各字块;
提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果;
按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。
4.根据权利要求1所述的方法,其特征在于,所述步骤S3具体包括以下中的一种或任意组合:
查询文字词典库获得文字的读音、含义、用法或其他语种的翻译信息;
查询文化知识库获得文字对应的典故或出处信息;
查询书籍查询库获得文字对应的书籍信息或网络资源信息;
查询商品查询库获得文字对应的商品信息;
查询音乐查询库获得文字对应的音乐信息或网络资源信息;
查询网络应用搜索库获得文字对应的网络应用信息或网络入口。
5.根据权利要求1或4所述的方法,其特征在于,在所述步骤S3中查询所有知识库,将获得的所有知识信息生成知识拓展词包;或者,
在所述步骤S1中还获取用户选择的个性化选项内容,在所述步骤S3中查询所述个性化选项内容对应的知识库,将获得的知识信息生成知识拓展词包;或者,在所述步骤S3中查询所有知识库,对查询到的知识信息进一步确定知识信息对应的权重,将权重值排在前N个的知识信息生成知识拓展词包,N为预设的正整数。
6.根据权利要求5所述的方法,其特征在于,所述知识信息对应的权重采用以下方式确定:
根据知识信息被查询到的总次数确定该知识信息对应的权重,总次数越大权重值越大;或者,
利用知识信息被查询到的总次数确定该知识信息对应的知识权重,利用该知识信息所属类别的所有知识信息被当前用户查看的总次数确定用户个性化权重,利用知识信息的知识权重与用户个性化权重的乘积确定该知识信息对应的权重。
7.一种图像文字识别的装置,其特征在于,该装置包括:
区域获取单元,用于获取待识别图像中的文字区域;
文字识别单元,用于对所述文字区域进行文字识别;
知识查询单元,用于所述文字识别单元的识别结果查询知识库获得识别结果对应的知识信息;
结果推送单元,用于在返回所述识别结果时,推送包含所述知识信息的知识拓展词包。
8.根据权利要求7所述的装置,其特征在于,所述区域获取单元接收移动终端发送来的待识别图像,从所述待识别图像中提取文字区域;或者,接收移动终端从待识别图像中提取并发送来的文字区域。
9.根据权利要求7所述的装置,其特征在于,所述文字识别单元具体执行:对文字区域进行二值化,对二值化后的文字区域分割为各字块,提取各字块的特征信息并与特征数据库进行匹配,将匹配结果作为各字块的识别结果,按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。
10.根据权利要求7所述的装置,其特征在于,所述知识查询单元具体执行以下中的一种或任意组合:
查询文字词典库获得文字的读音、含义、用法或其他语种的翻译信息;
查询文化知识库获得文字对应的典故或出处信息;
查询书籍查询库获得文字对应的书籍信息或网络资源信息;
查询商品查询库获得文字对应的商品信息;
查询音乐查询库获得文字对应的音乐信息或网络资源信息;
查询网络应用搜索库获得文字对应的网络应用信息或网络入口。
11.根据权利要求7或10所述的装置,其特征在于,所述知识查询单元查询所有知识库,将获得的所有知识信息生成知识拓展词包;或者,
所述区域获取单元还用于获取用户选择的个性化选项内容,所述知识查询单元查询所述个性化选项内容对应的知识库,将获得的知识信息生成知识拓展词包;或者,所述知识查询单元查询所有知识库,对查询到的知识信息进一步确定知识信息对应的权重,将权重值排在前N个的知识信息生成知识拓展词包,N为预设的正整数。
12.根据权利要求11所述的装置,其特征在于,所述知识查询单元采用以下方式确定所述知识信息对应的权重:
根据知识信息被查询到的总次数确定该知识信息对应的权重,总次数越大权重值越大;或者,
利用知识信息被查询到的总次数确定该知识信息对应的知识权重,利用该知识信息所属类别的所有知识信息被当前用户查看的总次数确定用户个性化权重,利用知识信息的知识权重与用户个性化权重的乘积确定该知识信息对应的权重。
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2010-06-23
|
2008-12-12
| | |
2
| |
2007-07-18
|
2007-01-08
| | |
3
| |
2007-09-26
|
2005-10-05
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2013-01-28 | 2013-01-28 | | |
2 | | 2013-01-06 | 2013-01-06 | | |
3 | | 2015-11-13 | 2015-11-13 | | |
4 | | 2016-05-16 | 2016-05-16 | | |
5 | | 2013-05-02 | 2013-05-02 | | |
6 | | 2013-05-10 | 2013-05-10 | | |
7 | | 2013-05-13 | 2013-05-13 | | |
8 | | 2013-05-10 | 2013-05-10 | | |
9 | | 2013-01-28 | 2013-01-28 | | |