加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于知识蒸馏的多语言模型压缩方法、装置

发明专利有效专利
  • 申请号:
    CN201911272179.5
  • IPC分类号:G06N20/00
  • 申请日期:
    2019-12-11
  • 申请人:
    北京知道智慧信息技术有限公司
著录项信息
专利名称一种基于知识蒸馏的多语言模型压缩方法、装置
申请号CN201911272179.5申请日期2019-12-11
法律状态实质审查申报国家中国
公开/公告日2020-04-24公开/公告号CN111062489A
优先权暂无优先权号暂无
主分类号G06N20/00IPC分类号G;0;6;N;2;0;/;0;0查看分类表>
申请人北京知道智慧信息技术有限公司申请人地址
北京市朝阳区阜通东大街1号院5号楼1单元311506室 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京知道智慧信息技术有限公司当前权利人北京知道智慧信息技术有限公司
发明人杨焱麒
代理机构北京超凡宏宇专利代理事务所(特殊普通合伙)代理人蒋姗
摘要
本申请提供一种基于知识蒸馏的多语言模型压缩方法、装置,电子设备及存储介质,属于机器学习技术领域。该方法包括:将训练好的N个不同语言的语言模型作为教师模型;通过知识蒸馏算法,利用所述教师模型对学生模型进行训练;其中,所述学生模型的词表中包含所有所述教师模型中的词表。在本申请实施例中,将训练好的N个不同语言的语言模型作为教师模型,通过知识蒸馏算法,利用教师模型对学生模型进行训练,使得最终训练获得的学生模型与现有技术中的多语言模型相比,模型参数少,简化了模型的结构,且在模型参数较少的情况下,还能保证模型的性能、效果。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供