加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种标点预测模型训练方法及文本标点确定方法

发明专利有效专利
  • 申请号:
    CN201911072366.9
  • IPC分类号:G06F40/117;G06F40/279
  • 申请日期:
    2019-11-05
  • 申请人:
    中电科大数据研究院有限公司
著录项信息
专利名称一种标点预测模型训练方法及文本标点确定方法
申请号CN201911072366.9申请日期2019-11-05
法律状态实质审查申报国家中国
公开/公告日2020-02-28公开/公告号CN110852040A
优先权暂无优先权号暂无
主分类号G06F40/117IPC分类号G;0;6;F;4;0;/;1;1;7;;;G;0;6;F;4;0;/;2;7;9查看分类表>
申请人中电科大数据研究院有限公司申请人地址
贵州省贵阳市贵阳国家高新技术产业开发区金阳科技产业园黎阳大厦 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中电科大数据研究院有限公司当前权利人中电科大数据研究院有限公司
发明人刘彦志;曹扬
代理机构贵阳睿腾知识产权代理有限公司代理人宋妍丽
摘要
本发明提供了一种标点预测模型训练方法及文本标点确定方法,标点预测模型训练方法包括:(1)获取用于标点预测模型训练的分字文本训练集;(2)利用数据增强方法从训练集中生成训练样本;(3)获取训练好的标点预测模型。文本标点确定方法包括:(1)获取无标点的目标文本;(2)获取目标文本中每个文字后面的预测标点;(3)将预测标点插入目标文本中对应文字的后面,得到标点确定的文本。本发明所提供的标点预测模型训练方法和文本标点确定方法,可以优化标点预测模型的训练,让标点预测模型达到自身的最佳性能,从而提高标点预测结果的正确性。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供