基于多智能体强化学习的目标探测与分配方法及装置

发明专利有效专利

申请号：
CN202010959038.7
IPC分类号：G06F30/27;G06F119/14
申请日期：
2020-09-14
申请人：
中国人民解放军军事科学院评估论证研究中心;航天科工系统仿真科技(北京)有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	基于多智能体强化学习的目标探测与分配方法及装置
申请号	CN202010959038.7	申请日期	2020-09-14
法律状态	实质审查	申报国家	中国
公开/公告日	2020-12-25	公开/公告号	CN112131786A
优先权	暂无	优先权号	暂无
主分类号	G06F30/27	IPC分类号	G;0;6;F;3;0;/;2;7;;;G;0;6;F;1;1;9;/;1;4查看分类表>
申请人	中国人民解放军军事科学院评估论证研究中心;航天科工系统仿真科技(北京)有限公司	申请人地址	北京市海淀区厢红旗东门外1号变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	中国人民解放军军事科学院评估论证研究中心,航天科工系统仿真科技(北京)有限公司	当前权利人	中国人民解放军军事科学院评估论证研究中心,航天科工系统仿真科技(北京)有限公司
发明人	伊山;魏晓龙;鹿涛;黄谦;齐智敏;蔡春晓;赵昊;张帅;亢原平
代理机构	北京细软智谷知识产权代理有限责任公司	代理人	谭承世

摘要

本发明涉及一种基于多智能体强化学习的目标探测与分配方法及装置，包括构建作战行为模型和强化学习训练环境；采用强化学习训练环境对所述作战行为模型进行训练至模型收敛，获取人工智能行为模型；采用作战仿真引擎对所述人工智能行为模型进行训练，输出优化模型。本发明将强化学习算法MADDPG集成到兵棋推演系统中，构建从简单到复杂的仿真环境，优化强化学习收敛速度，有效的解决了兵棋推演系统中智能体优化收敛速度的问题。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有引用任何外部专利数据！

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供