一种图像文字识别方法和装置

发明专利无效专利

申请号：
CN201210279368.7
IPC分类号：G06K9/20
申请日期：
2012-08-07
申请人：
北京百度网讯科技有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	一种图像文字识别方法和装置
申请号	CN201210279368.7	申请日期	2012-08-07
法律状态	驳回	申报国家	中国
公开/公告日	2013-01-02	公开/公告号	CN102855480A
优先权	暂无	优先权号	暂无
主分类号	G06K9/20 ? IPC结构图谱： G 物理 G0 仪器 G06 计算；推算；计数 G06K 数据识别；数据表示；记录载体；记录载体的处理（印刷本身入B41J） G06K9/00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置（用于图表阅读或者将诸如力或现状态的机械参量的图形转换为电信号的方法或装置入G06K 11/00；语音识别入G10L 15/00）〔1，7〕 G06K9/20 图像捕获〔3〕	IPC分类号	G;0;6;K;9;/;2;0查看分类表>
申请人	北京百度网讯科技有限公司	申请人地址	北京市海淀区上地十街10号百度大厦2层变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	北京百度网讯科技有限公司	当前权利人	北京百度网讯科技有限公司
发明人	韩钧宇;丁二锐;吴中勤;文林福
代理机构	深圳市威世博知识产权代理事务所（普通合伙）	代理人	何青瓦;李庆波

摘要

本发明提供了一种图像文字识别的方法和装置，其中方法包括：S1、获取待识别图像中的文字区域；S2、对所述文字区域进行文字识别；S3、利用识别结果查询知识库获得识别结果对应的知识信息；S4、在返回所述识别结果时，推送包含所述知识信息的知识拓展词包。本发明使得用户在获取图像中文字识别结果的同时，能够获取到对应的知识信息，而无需进一步通过手工的方式获得知识信息，显然更加方便和省力。

1.一种图像文字识别的方法，其特征在于，该方法包括：
S1、获取待识别图像中的文字区域；
S2、对所述文字区域进行文字识别；
S3、利用识别结果查询知识库获得识别结果对应的知识信息；
S4、在返回所述识别结果时，推送包含所述知识信息的知识拓展词包。
2.根据权利要求1所述的方法，其特征在于，所述步骤S1具体包括：
服务器接收移动终端发送来的待识别图像，从所述待识别图像中提取文字区域；或者，服务器接收移动终端从待识别图像中提取并发送来的文字区域。
3.根据权利要求1所述的方法，其特征在于，所述步骤S2具体包括：
对文字区域进行二值化；
对二值化后的文字区域分割为各字块；
提取各字块的特征信息并与特征数据库进行匹配，将匹配结果作为各字块的识别结果；
按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。
4.根据权利要求1所述的方法，其特征在于，所述步骤S3具体包括以下中的一种或任意组合：
查询文字词典库获得文字的读音、含义、用法或其他语种的翻译信息；
查询文化知识库获得文字对应的典故或出处信息；
查询书籍查询库获得文字对应的书籍信息或网络资源信息；
查询商品查询库获得文字对应的商品信息；
查询音乐查询库获得文字对应的音乐信息或网络资源信息；
查询网络应用搜索库获得文字对应的网络应用信息或网络入口。
5.根据权利要求1或4所述的方法，其特征在于，在所述步骤S3中查询所有知识库，将获得的所有知识信息生成知识拓展词包；或者，
在所述步骤S1中还获取用户选择的个性化选项内容，在所述步骤S3中查询所述个性化选项内容对应的知识库，将获得的知识信息生成知识拓展词包；或者，在所述步骤S3中查询所有知识库，对查询到的知识信息进一步确定知识信息对应的权重，将权重值排在前N个的知识信息生成知识拓展词包，N为预设的正整数。
6.根据权利要求5所述的方法，其特征在于，所述知识信息对应的权重采用以下方式确定：
根据知识信息被查询到的总次数确定该知识信息对应的权重，总次数越大权重值越大；或者，
利用知识信息被查询到的总次数确定该知识信息对应的知识权重，利用该知识信息所属类别的所有知识信息被当前用户查看的总次数确定用户个性化权重，利用知识信息的知识权重与用户个性化权重的乘积确定该知识信息对应的权重。
7.一种图像文字识别的装置，其特征在于，该装置包括：
区域获取单元，用于获取待识别图像中的文字区域；
文字识别单元，用于对所述文字区域进行文字识别；
知识查询单元，用于所述文字识别单元的识别结果查询知识库获得识别结果对应的知识信息；
结果推送单元，用于在返回所述识别结果时，推送包含所述知识信息的知识拓展词包。
8.根据权利要求7所述的装置，其特征在于，所述区域获取单元接收移动终端发送来的待识别图像，从所述待识别图像中提取文字区域；或者，接收移动终端从待识别图像中提取并发送来的文字区域。
9.根据权利要求7所述的装置，其特征在于，所述文字识别单元具体执行：对文字区域进行二值化，对二值化后的文字区域分割为各字块，提取各字块的特征信息并与特征数据库进行匹配，将匹配结果作为各字块的识别结果，按顺序将各字块的识别结果进行组合得到所述文字区域的识别结果。
10.根据权利要求7所述的装置，其特征在于，所述知识查询单元具体执行以下中的一种或任意组合：
查询文字词典库获得文字的读音、含义、用法或其他语种的翻译信息；
查询文化知识库获得文字对应的典故或出处信息；
查询书籍查询库获得文字对应的书籍信息或网络资源信息；
查询商品查询库获得文字对应的商品信息；
查询音乐查询库获得文字对应的音乐信息或网络资源信息；
查询网络应用搜索库获得文字对应的网络应用信息或网络入口。
11.根据权利要求7或10所述的装置，其特征在于，所述知识查询单元查询所有知识库，将获得的所有知识信息生成知识拓展词包；或者，
所述区域获取单元还用于获取用户选择的个性化选项内容，所述知识查询单元查询所述个性化选项内容对应的知识库，将获得的知识信息生成知识拓展词包；或者，所述知识查询单元查询所有知识库，对查询到的知识信息进一步确定知识信息对应的权重，将权重值排在前N个的知识信息生成知识拓展词包，N为预设的正整数。
12.根据权利要求11所述的装置，其特征在于，所述知识查询单元采用以下方式确定所述知识信息对应的权重：
根据知识信息被查询到的总次数确定该知识信息对应的权重，总次数越大权重值越大；或者，
利用知识信息被查询到的总次数确定该知识信息对应的知识权重，利用该知识信息所属类别的所有知识信息被当前用户查看的总次数确定用户个性化权重，利用知识信息的知识权重与用户个性化权重的乘积确定该知识信息对应的权重。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN101751566A	2010-06-23	2008-12-12	一种基于手持设备的菜谱识别及注解方法和装置有效专利	汉王科技股份有限公司
2	CN101000623A	2007-07-18	2007-01-08	通过手机拍照进行图像识别搜索的方法及采用该方法的装置无效专利	深圳市宜搜科技发展有限公司
3	CN101044494A	2007-09-26	2005-10-05	用于可视文本解释的电子装置和方法无效专利	摩托罗拉公司

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN103970753A	2013-01-28	2013-01-28	关联知识的推送方法和装置失效专利	北大方正集团有限公司;方正信息产业控股有限公司;北京北大方正电子有限公司
2	CN103093217A	2013-01-06	2013-01-06	一种交互式的图像文字识别方法及装置无效专利	北京百度网讯科技有限公司
3	CN105426462A	2015-11-13	2015-11-13	一种基于图像元素的图像搜索方法和装置无效专利	深圳码隆科技有限公司
4	CN106021210A	2016-05-16	2016-05-16	一种图片文字的处理方法和装置无效专利	珠海市魅族科技有限公司
5	CN104134064A	2013-05-02	2013-05-02	文字识别方法和装置有效专利	百度国际科技(深圳)有限公司
6	CN104143093A	2013-05-10	2013-05-10	文字识别方法和装置有效专利	百度在线网络技术(北京)有限公司
7	CN103294779A	2013-05-13	2013-05-13	对象信息获取方法及设备无效专利	北京百度网讯科技有限公司
8	CN104143093B	2013-05-10	2013-05-10	文字识别方法和装置有效专利	百度在线网络技术(北京)有限公司
9	CN103970753B	2013-01-28	2013-01-28	关联知识的推送方法和装置失效专利	北大方正集团有限公司;方正信息产业控股有限公司;北京北大方正电子有限公司

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供