加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

强化学习系统及训练方法

发明专利有效专利
  • 申请号:
    CN202110265955.X
  • IPC分类号:G06N20/00
  • 申请日期:
    2021-03-11
  • 申请人:
    宏达国际电子股份有限公司
著录项信息
专利名称强化学习系统及训练方法
申请号CN202110265955.X申请日期2021-03-11
法律状态实质审查申报国家暂无
公开/公告日2021-09-14公开/公告号CN113392979A
优先权暂无优先权号暂无
主分类号G06N20/00IPC分类号G;0;6;N;2;0;/;0;0查看分类表>
申请人宏达国际电子股份有限公司申请人地址
中国台湾桃园市桃园区兴华路23号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人宏达国际电子股份有限公司当前权利人宏达国际电子股份有限公司
发明人彭宇劭;汤凯富;张智威
代理机构北京律和信知识产权代理事务所(普通合伙)代理人郝文博
摘要
一种训练方法,适用于具有一奖励函数的一强化学习系统去训练一强化学习模型,且包含:定义该奖励函数的至少一奖励条件;决定相对应于该至少一奖励条件的至少一奖励值范围;藉由超参数最佳化演算法从该至少一奖励值范围中搜寻出至少一奖励值;以及根据该至少一奖励值训练该强化学习模型。本公开内容更提供一种强化学习系统用以执行该训练方法。在没有通过实验人工决定精确数值的情况下,强化学习系统可自动地决定与多种奖励条件相对应的多个奖励值。据此,训练强化学习模型的过程或时间可以缩短。藉由自动地决定与多种奖励条件相对应的多个奖励值,经由强化学习系统训练出来的强化学习模型有很大的机会拥有高的成功率,从而能选择合适的动作。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供