加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于训练数据相似度聚合的模型加速训练方法及装置

发明专利有效专利
  • 申请号:
    CN202110021199.6
  • IPC分类号:G06K9/62;G06N3/08
  • 申请日期:
    2021-01-08
  • 申请人:
    北京匠数科技有限公司
著录项信息
专利名称基于训练数据相似度聚合的模型加速训练方法及装置
申请号CN202110021199.6申请日期2021-01-08
法律状态实质审查申报国家中国
公开/公告日2021-04-30公开/公告号CN112733932A
优先权暂无优先权号暂无
主分类号G06K9/62IPC分类号G;0;6;K;9;/;6;2;;;G;0;6;N;3;/;0;8查看分类表>
申请人北京匠数科技有限公司申请人地址
北京市海淀区吴家场路1号院4号楼2层3单元201 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人北京匠数科技有限公司当前权利人北京匠数科技有限公司
发明人张乐平;侯磊;张博;李海峰;王光曦
代理机构北京盛凡佳华专利代理事务所(普通合伙)代理人王翠
摘要
基于训练数据相似度聚合的模型加速训练方法及装置,以一份最小化的训练数据作为起始,在每个轮次中应用随机采样和随机增量的方式从当前模型的预测结果中提取预测不佳的数据,并且用聚类提取方式采样额外的训练数据,从而获取最具有代表性的训练信息,提高每个轮次的训练效率。本发明减少每个轮次模型训练的数据集规模,训练时间大幅减少,聚类不需要精确结果,可减少迭代次数或使用更快速简单的聚类方法,总体上每个轮次总训练时间仍比原有全训练集训练减少很多;每个轮次选择的训练数据均有针对性,选用推理错误的图像训练,能够最大程度的获取反向传播梯度,降低训练时陷入局部最优解的概率,便于在训练过程中动态调整,以达到最佳训练结果。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供