加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于深度强化学习的多智能体导航算法

发明专利有效专利
  • 申请号:
    CN202110533403.2
  • IPC分类号:G01C21/20;G06Q10/04;G06N3/00;G06N3/04;G06N3/08
  • 申请日期:
    2021-05-17
  • 申请人:
    太原科技大学
著录项信息
专利名称一种基于深度强化学习的多智能体导航算法
申请号CN202110533403.2申请日期2021-05-17
法律状态实质审查申报国家中国
公开/公告日2021-08-06公开/公告号CN113218400A
优先权暂无优先权号暂无
主分类号G01C21/20IPC分类号G;0;1;C;2;1;/;2;0;;;G;0;6;Q;1;0;/;0;4;;;G;0;6;N;3;/;0;0;;;G;0;6;N;3;/;0;4;;;G;0;6;N;3;/;0;8查看分类表>
申请人太原科技大学申请人地址
山西省太原市万柏林区窊流路66号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人太原科技大学当前权利人太原科技大学
发明人张春美;白维松;郭红戈;邵杨;郑康智;张京
代理机构太原中正和专利代理事务所(普通合伙)代理人焦进宇
摘要
本发明属于多智能体强化学习技术领域,具体技术方案为:一种基于深度强化学习的多智能体导航算法:一、建模:将智能体速度和角速度均进行限定,定义智能体当前时刻的速度信息、低维环境特征;二、重要性采样,确定最终目标函数;三、置入奖惩函数,通过奖惩函数指导智能体所选择行为好坏的评价标准;该算法将A*算法融合到PPO算法中,利用设计的奖惩函数实现两种算法的深度融合,智能体通过输入传感器原始图像数据,决策规划出最佳行动路径,到达目标点,本算法在不同场景中的成功率、耗时、距离和平均速度等方面均很优秀,并且通过改变场景、增加智能体数量等方式证明了该算法具有良好的迁移能力,通过迁移到更复杂的场景下满足不同的需求。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供