加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种生成对抗交互模仿学习方法、系统、存储介质及应用

发明专利有效专利
  • 申请号:
    CN202110206564.0
  • IPC分类号:G06N3/04;G06N3/08
  • 申请日期:
    2021-02-24
  • 申请人:
    中国海洋大学
著录项信息
专利名称一种生成对抗交互模仿学习方法、系统、存储介质及应用
申请号CN202110206564.0申请日期2021-02-24
法律状态公开申报国家中国
公开/公告日2021-09-10公开/公告号CN113379027A
优先权暂无优先权号暂无
主分类号G06N3/04IPC分类号G;0;6;N;3;/;0;4;;;G;0;6;N;3;/;0;8查看分类表>
申请人中国海洋大学申请人地址
山东省青岛市崂山区松岭路238号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国海洋大学当前权利人中国海洋大学
发明人李光亮;黄杰;隽荣顺;沙启鑫;何波
代理机构北京汇捷知识产权代理事务所(普通合伙)代理人盛君梅
摘要
本发明属于人工智能技术领域,公开了一种生成对抗交互模仿学习方法、系统、存储介质及应用,所述生成对抗交互模仿学习方法结合生成对抗模仿学习和交互学习框架形成生成对抗交互模仿学习GA2IL;所述GA2IL由两个阶段组成:(1)基于最大熵逆强化学习的类GAIL阶段;(2)交互强化学习阶段。本发明GA2IL无论在专家示教是最优还是次优的情况下,GA2IL智能体都能超越专家演示的表现并习得最优或接近最优的策略,且可以提升策略的稳定性并拓展到大型复杂任务之中。本发明在给定无论是最优还是次优专家演示的情况下,GA2IL智能体总是可以超越专家演示的表现并习得最优或接近最优的策略。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供