加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

基于多智能体强化学习的动作集合输出方法及系统

发明专利有效专利
  • 申请号:
    CN202010705611.1
  • IPC分类号:G06K9/62
  • 申请日期:
    2020-07-21
  • 申请人:
    赵佳
著录项信息
专利名称基于多智能体强化学习的动作集合输出方法及系统
申请号CN202010705611.1申请日期2020-07-21
法律状态实质审查申报国家中国
公开/公告日2020-10-30公开/公告号CN111860649A
优先权暂无优先权号暂无
主分类号G06K9/62IPC分类号G;0;6;K;9;/;6;2查看分类表>
申请人赵佳申请人地址
上海市浦东新区周浦镇周南村157号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人赵佳当前权利人赵佳
发明人赵佳
代理机构暂无代理人暂无
摘要
本发明公开了基于多智能体强化学习的动作集合输出方法及系统,方法包括S1、构建树结构的模型架构;S2、将步骤S1中构建的树结构中的每个子节点均建模为智能体,并通过层级化扩展的马尔科夫博弈建模多智能体强化学习系统;S3、所有智能体与环境交互,进行强化学习训练以形成动作集合输出模型;S4、利用基于多智能体强化学习动作集合输出模型对待处理的动作空间中的各动作进行评分,生成目标动作集合进行推荐。本发明使用多智能体强化学习方法处理大规模动作空间的动作集合决策问题,可以获得良好的可扩展性、更精准更快的训练和推理速度;本发明使用MCTS算法增加上层智能体决策的信息量,可进行有效的搜索,得到更加准确的决策。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供