基于强化学习的机器人时间最优轨迹规划方法及控制器

发明专利有效专利

申请号：
CN202010746579.1
IPC分类号：G05B13/04
申请日期：
2020-07-29
申请人：
华南理工大学;中山市华南理工大学现代产业技术研究院

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	基于强化学习的机器人时间最优轨迹规划方法及控制器
申请号	CN202010746579.1	申请日期	2020-07-29
法律状态	实质审查	申报国家	中国
公开/公告日	2020-11-24	公开/公告号	CN111983924A
优先权	暂无	优先权号	暂无
主分类号	G05B13/04 ? IPC结构图谱： G 物理 G0 仪器 G05 控制；调节 G05B 一般的控制或调节系统；这种系统的功能单元；用于这种系统或单元的监视或测试装置（应用流体作用的一般流体压力执行器或系统入F15B；阀门本身入F16K；仅按机械特征区分的入G05G；传感元件见相应小类，例如G12B，G01、H01的小类；校正单元见相应的小类，例如H02K） G05B13/00 自适应控制系统，即系统按照一些预定的准则自动调整自己使之具有最佳性能的系统（G05B 19/00优先；计算机零部件入G06F 15/18）〔3〕 G05B13/02 电的 G05B13/04 包括使用模型或模拟器的〔3〕	IPC分类号	G;0;5;B;1;3;/;0;4查看分类表>
申请人	华南理工大学;中山市华南理工大学现代产业技术研究院	申请人地址	广东省广州市天河区五山路381号变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	华南理工大学,中山市华南理工大学现代产业技术研究院	当前权利人	华南理工大学,中山市华南理工大学现代产业技术研究院
发明人	李琳;肖佳栋;张铁;邹焱飚
代理机构	广州粤高专利商标代理有限公司	代理人	江裕强

摘要

本发明公开了基于强化学习的机器人时间最优轨迹规划方法及控制器，所述方法包括以下步骤：S1将任务路径的各关节参数输入到路径参数化模块转化为关于末端路径的标量参数；S2将参数化后的路径输入到路径离散化模块进行路径离散化；S3将离散化后的路径输入到强化学习模块中构建强化学习环境；S4使用强化学习模块学习最优的策略轨迹；S5运行策略轨迹获得反馈的关节力矩；S6将反馈的关节力矩输入到强化学习模块从而对强化学习环境进行修正；S7使用强化学习模块学习最优的策略轨迹；S8重复步骤S5‑步骤S7，直到强化学习环境不再更新。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有引用任何外部专利数据！

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供