加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种文本识别方法及装置

发明专利有效专利
  • 申请号:
    CN201911315736.7
  • IPC分类号:--
  • 申请日期:
    2019-12-19
  • 申请人:
    广联达科技股份有限公司
著录项信息
专利名称一种文本识别方法及装置
申请号CN201911315736.7申请日期2019-12-19
法律状态实质审查申报国家中国
公开/公告日2020-05-12公开/公告号CN111144114A
优先权暂无优先权号暂无
主分类号暂无IPC分类号暂无查看分类表>
申请人广联达科技股份有限公司申请人地址
北京市海淀区西北旺东路10号院东区13号楼广联达信息大厦 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人广联达科技股份有限公司当前权利人广联达科技股份有限公司
发明人赵晓
代理机构北京和信华成知识产权代理事务所(普通合伙)代理人张永辉
摘要
本发明实施例涉及一种文本识别方法及装置,包括:将目标图形数据中所有文本图元转换为多个文本实体;基于各文本实体之间的距离关系、以及文本实体的文本排布,对多个文本实体进行聚合,得到多个文本团;其中,每个文本团包括至少一个文本实体;针对每个文本团,利用预设的滑动窗口沿该文本团中的文本实体滑动,得到多个文本组合;将多个文本组合分别输入到预设的文本分类模型中,并获取文本分类模型输出的各文本组合所表达的语义类型及其概率,并选择概率最高的文本组合及其所属语义类型作为文本识别结果。由此,可以实现图纸文本的自动识别。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供