加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于强化学习的机器人时间最优轨迹规划方法及控制器

发明专利有效专利
  • 申请号:
    CN202010746579.1
  • IPC分类号:G05B13/04
  • 申请日期:
    2020-07-29
  • 申请人:
    华南理工大学;中山市华南理工大学现代产业技术研究院
著录项信息
专利名称基于强化学习的机器人时间最优轨迹规划方法及控制器
申请号CN202010746579.1申请日期2020-07-29
法律状态实质审查申报国家中国
公开/公告日2020-11-24公开/公告号CN111983924A
优先权暂无优先权号暂无
主分类号G05B13/04IPC分类号G;0;5;B;1;3;/;0;4查看分类表>
申请人华南理工大学;中山市华南理工大学现代产业技术研究院申请人地址
广东省广州市天河区五山路381号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人华南理工大学,中山市华南理工大学现代产业技术研究院当前权利人华南理工大学,中山市华南理工大学现代产业技术研究院
发明人李琳;肖佳栋;张铁;邹焱飚
代理机构广州粤高专利商标代理有限公司代理人江裕强
摘要
本发明公开了基于强化学习的机器人时间最优轨迹规划方法及控制器,所述方法包括以下步骤:S1将任务路径的各关节参数输入到路径参数化模块转化为关于末端路径的标量参数;S2将参数化后的路径输入到路径离散化模块进行路径离散化;S3将离散化后的路径输入到强化学习模块中构建强化学习环境;S4使用强化学习模块学习最优的策略轨迹;S5运行策略轨迹获得反馈的关节力矩;S6将反馈的关节力矩输入到强化学习模块从而对强化学习环境进行修正;S7使用强化学习模块学习最优的策略轨迹;S8重复步骤S5‑步骤S7,直到强化学习环境不再更新。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供