加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于超参优化的深度强化学习模型的训练方法、装置

发明专利有效专利
  • 申请号:
    CN202011621981.3
  • IPC分类号:G06N20/00
  • 申请日期:
    2020-12-31
  • 申请人:
    京东城市(北京)数字科技有限公司
著录项信息
专利名称基于超参优化的深度强化学习模型的训练方法、装置
申请号CN202011621981.3申请日期2020-12-31
法律状态公开申报国家中国
公开/公告日2021-11-30公开/公告号CN113723615A
优先权暂无优先权号暂无
主分类号G06N20/00IPC分类号G;0;6;N;2;0;/;0;0查看分类表>
申请人京东城市(北京)数字科技有限公司申请人地址
北京市海淀区知春路76号(写字楼)1号楼9层1-7-5号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人京东城市(北京)数字科技有限公司当前权利人京东城市(北京)数字科技有限公司
发明人张玥;尹泽夏;霍雨森;王小波;郑宇
代理机构北京清亦华知识产权代理事务所(普通合伙)代理人张大威
摘要
本申请公开了一种基于超参优化的深度强化学习模型的训练方法、装置,其中,方法包括:获取多个初始超参数组合,和多个第一深度强化学习模型;采用初始超参数组合中的多个超参数训练多个第一深度强化学习模型,以得到与多个第一深度强化学习模型分别对应的训练评价指标;根据训练评价指标从多个第一深度强化学习模型之中筛选出第二深度强化学习模型;采用与第二深度强化学习模型对应的多个目标超参数对初始超参数组合进行优化处理,以形成目标超参数组合;得到目标深度强化学习模型。由此,将超参数优化与模型训练结合起来实现深度强化学习模型的训练,不仅可训练出性能更高的深度强化学习模型,而且可使训练出的模型适应更广泛的应用场景。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供