首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

文本纠错方法、装置、计算机设备和存储介质

发明专利有效专利
  • 申请号:
    CN201910710986.4
  • IPC分类号:G06F17/27
  • 申请日期:
    2019-08-02
  • 申请人:
    深圳市珍爱捷云信息技术有限公司
著录项信息
专利名称文本纠错方法、装置、计算机设备和存储介质
申请号CN201910710986.4申请日期2019-08-02
法律状态实质审查申报国家中国
公开/公告日2019-11-12公开/公告号CN110442870A
优先权暂无优先权号暂无
主分类号G06F17/27IPC分类号G06F17/27查看分类表>
申请人深圳市珍爱捷云信息技术有限公司申请人地址
广东省深圳市南山区粤海街道海德三道168号航天科技广场A座*** 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人深圳市珍爱捷云信息技术有限公司当前权利人深圳市珍爱捷云信息技术有限公司
发明人刘凯;黄佳恒;贺国栋;范成涛
代理机构暂无代理人暂无
摘要
本申请涉及一种文本纠错方法、系统、计算机设备和存储介质。方法包括:获取通过语音数据转换得到的待纠正文本;通过正则表达式对待纠正文本中的词进行纠错,获取每一处被纠正的词语的置信度;通过语言模型对待纠正文本中的词进行预测纠错,获取每一处语言模型预测词语的概率值;将同一处被纠正的词语对应的置信度与概率值输入至预先训练好的分类模型中,获取预先训练好的分类模型输出的预测值;当预测值表明预先训练好的分类模型倾向于置信度时,将置信度对应的词语作为纠正后的词语;当预测值表明预先训练好的分类模型倾向于概率值时,将概率值最高的词语作为纠正后的词语,这种方式可以稳定且大幅度的提高文本纠错的准确率。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供