加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于多智能体强化学习的目标探测与分配方法及装置

发明专利有效专利
  • 申请号:
    CN202010959038.7
  • IPC分类号:G06F30/27;G06F119/14
  • 申请日期:
    2020-09-14
  • 申请人:
    中国人民解放军军事科学院评估论证研究中心;航天科工系统仿真科技(北京)有限公司
著录项信息
专利名称基于多智能体强化学习的目标探测与分配方法及装置
申请号CN202010959038.7申请日期2020-09-14
法律状态实质审查申报国家中国
公开/公告日2020-12-25公开/公告号CN112131786A
优先权暂无优先权号暂无
主分类号G06F30/27IPC分类号G;0;6;F;3;0;/;2;7;;;G;0;6;F;1;1;9;/;1;4查看分类表>
申请人中国人民解放军军事科学院评估论证研究中心;航天科工系统仿真科技(北京)有限公司申请人地址
北京市海淀区厢红旗东门外1号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人中国人民解放军军事科学院评估论证研究中心,航天科工系统仿真科技(北京)有限公司当前权利人中国人民解放军军事科学院评估论证研究中心,航天科工系统仿真科技(北京)有限公司
发明人伊山;魏晓龙;鹿涛;黄谦;齐智敏;蔡春晓;赵昊;张帅;亢原平
代理机构北京细软智谷知识产权代理有限责任公司代理人谭承世
摘要
本发明涉及一种基于多智能体强化学习的目标探测与分配方法及装置,包括构建作战行为模型和强化学习训练环境;采用强化学习训练环境对所述作战行为模型进行训练至模型收敛,获取人工智能行为模型;采用作战仿真引擎对所述人工智能行为模型进行训练,输出优化模型。本发明将强化学习算法MADDPG集成到兵棋推演系统中,构建从简单到复杂的仿真环境,优化强化学习收敛速度,有效的解决了兵棋推演系统中智能体优化收敛速度的问题。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供