加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

文档处理方法及其装置

发明专利有效专利
  • 申请号:
    CN201110192577.3
  • IPC分类号:G06F17/30;G06K9/00
  • 申请日期:
    2011-07-01
  • 申请人:
    富士通株式会社
著录项信息
专利名称文档处理方法及其装置
申请号CN201110192577.3申请日期2011-07-01
法律状态授权申报国家中国
公开/公告日2013-01-02公开/公告号CN102855264A
优先权暂无优先权号暂无
主分类号G06F17/30IPC分类号G;0;6;F;1;7;/;3;0;;;G;0;6;K;9;/;0;0查看分类表>
申请人富士通株式会社申请人地址
日本神奈川县 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人富士通株式会社当前权利人富士通株式会社
发明人常兰兰;孙俊;何源;于浩;直井聪
代理机构北京集佳知识产权代理有限公司代理人王萍;周涛
摘要
本申请涉及文档处理方法及其装置,其中对于多个输入的文档图像中的每个文档图像:检测与初始关键字符相匹配的初始关键字符图像,所述初始关键字符是所述多个文档图像的标题中的关键字符,针对每个初始关键字符图像,提取与该初始关键字符图像相邻的至少一个字符图像作为相邻字符图像,其中初始关键字符图像与相邻字符图像构成准标题区域,计算每个准标题区域的置信度值,并且选择具有最高置信度值的准标题区域作为该文档图像的标题候选,其中所述准标题区域的置信度值表示相应的准标题图像是该文档图像的标题的可能性,基于从所述多个文档图像获得的标题候选对文档图像进行聚类,从而得到具有同类标题的文档分类。

专利服务由北京酷爱智慧知识产权代理公司提供