加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于认知的智能体强化学习方法、装置、系统、计算机设备及存储介质

发明专利有效专利
  • 申请号:
    CN201911083011.X
  • IPC分类号:G06N20/00
  • 申请日期:
    2019-11-07
  • 申请人:
    深圳大学
著录项信息
专利名称基于认知的智能体强化学习方法、装置、系统、计算机设备及存储介质
申请号CN201911083011.X申请日期2019-11-07
法律状态实质审查申报国家暂无
公开/公告日2020-02-21公开/公告号CN110826725A
优先权暂无优先权号暂无
主分类号G06N20/00IPC分类号G;0;6;N;2;0;/;0;0查看分类表>
申请人深圳大学申请人地址
广东省深圳市南山区南海大道3688号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人深圳大学当前权利人深圳大学
发明人段炼;徐鹏飞
代理机构深圳市精英专利事务所代理人李翔宇
摘要
本发明实施例提供了一种基于认知的智能体强化学习方法、装置、系统、计算机设备及计算机可读存储介质。属于机器学习技术领域,智能体通过获取外部环境反馈的当前状态;根据当前状态,通过动作预测器预测其它智能体在本回合中将会采取的预测动作;根据预测动作及当前状态,通过动作评估器对候选动作表中包含的第一预设候选动作进行评估,并结合预设策略选择出自身智能体在本回合中将采取的评估动作;发送评估动作至外部环境,以使外部环境根据评估动作和其它智能体的实际动作确定交互结果;接收外部环境返回的交互结果;根据交互结果,更新动作预测器和动作评估器以实现自身智能体强化学习,由于评估动作具有针对性,提高了应对的准确性。

专利服务由北京酷爱智慧知识产权代理公司提供