加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

用于文档自动识别入库的方法

发明专利有效专利
  • 申请号:
    CN202110896764.3
  • IPC分类号:G06F40/216;G06F40/242;G06F40/284;G06F40/30
  • 申请日期:
    2021-08-05
  • 申请人:
    成都中世顺朗科技有限公司;中国人民解放军31432部队
著录项信息
专利名称用于文档自动识别入库的方法
申请号CN202110896764.3申请日期2021-08-05
法律状态公开申报国家中国
公开/公告日2021-11-09公开/公告号CN113627154A
优先权暂无优先权号暂无
主分类号G06F40/216IPC分类号G;0;6;F;4;0;/;2;1;6;;;G;0;6;F;4;0;/;2;4;2;;;G;0;6;F;4;0;/;2;8;4;;;G;0;6;F;4;0;/;3;0查看分类表>
申请人成都中世顺朗科技有限公司;中国人民解放军31432部队申请人地址
四川省成都市武侯区武侯新城新城管委会武兴四路166号2栋 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人成都中世顺朗科技有限公司,中国人民解放军31432部队当前权利人成都中世顺朗科技有限公司,中国人民解放军31432部队
发明人王菊;于鹏飞;崔君;赵野;徐璐
代理机构北京市领专知识产权代理有限公司代理人王莹莹
摘要
本发明涉及一种用于文档自动识别入库的方法,包括以下步骤:基于语料库对接入的一个或多个文档依次进行分词处理,从而得到一个或多个文档的分词结果;所述语料库包括通用字典、标准表字典;构建关联词库,所述关联词库包括若干数据表,每个数据表具有多个字段,其中第一个字段为该数据表的内码;对分词结果进行关联关系标记,关联词库通过关联关系标记,从分词结果中选出与关联词库的字段对应的分词结果,将选出的分词结果插入关联词库的字段中,从而对接入的文档完成识别入库。本发明通过模型训练和语料管理对不同的文档进行快速正确的分词,分词后通过和关联词库的对应关系可以实现有用信息的快速入库,真正实现对文档内容进行识别入库。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供