首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于强化学习的神经网络控制方法及强化学习系统

发明专利有效专利
  • 申请号:
    CN202010115498.1
  • IPC分类号:G06N3/04G06N3/08
  • 申请日期:
    2020-02-25
  • 申请人:
    国电新能源技术研究院有限公司
著录项信息
专利名称基于强化学习的神经网络控制方法及强化学习系统
申请号CN202010115498.1申请日期2020-02-25
法律状态实质审查申报国家中国
公开/公告日2020-07-24公开/公告号CN111445005A
优先权暂无优先权号暂无
主分类号G06N3/04IPC分类号G06N3/04;G06N3/08查看分类表>
申请人国电新能源技术研究院有限公司申请人地址
北京市昌平区北七家镇未来科技城*** 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人国电新能源技术研究院有限公司当前权利人国电新能源技术研究院有限公司
发明人陈保卫;刘淼;李庚达;梁凌;李雄威;王昕;段震清;张婷;胡勇;曾德良
代理机构北京大成律师事务所代理人陈福
摘要
本发明公开了一种基于强化学习的神经网络控制方法及强化学习系统。本发明中,动作网络根据被控对象或其机理模型的阶次和迟延来确定状态控制量,被控对象接收动作网络发送的状态控制量输出动作值;由估值网络基于输出动作值对当前控制效果与预定目标对比进行评价,在对被控对象或其机理模型探索过程中加入随机扰动和模型变化,并同时对动作网络和估值网络进行更新,获得控制律。通过动作网络和估值网络对被控对象或其机理模型的探索,不断更新和优化控制策略,在一定程度上模拟人对环境的探索和学习过程,最终得到一个快速准确且具有一定鲁棒性的神经网络控制器,能用于解决许多控制领域的难题。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供