加载中...
首页专利查询专利详情

*来源于国家知识产权局数据,仅供参考,实际以国家知识产权局展示为准

一种基于忆阻器的在线训练强化学习方法

发明专利有效专利
  • 申请号:
    CN202011634224.X
  • IPC分类号:G06N3/04;G06N3/063;G06N3/08
  • 申请日期:
    2020-12-31
  • 申请人:
    上海交通大学
著录项信息
专利名称一种基于忆阻器的在线训练强化学习方法
申请号CN202011634224.X申请日期2020-12-31
法律状态实质审查申报国家暂无
公开/公告日2021-04-20公开/公告号CN112686373A
优先权暂无优先权号暂无
主分类号G06N3/04IPC分类号G;0;6;N;3;/;0;4;;;G;0;6;N;3;/;0;6;3;;;G;0;6;N;3;/;0;8查看分类表>
申请人上海交通大学申请人地址
上海市闵行区东川路800号 变更 专利地址、主体等相关变化,请及时变更,防止失效
权利人上海交通大学当前权利人上海交通大学
发明人纪志罡;景凌琳;杜意德
代理机构上海伯瑞杰知识产权代理有限公司代理人孟旭彤
摘要
本发明公开了一种基于忆阻器的在线训练强化学习方法:传感器采集智能体当前状态信息St并转换为数字信号,将其编码并转换为电压信号;第一忆阻器交叉杆阵列接收该信号,并对该信号进行乘累加后将输出电流转换为数字信号存储于数字存储器中;当St存储于数字存储器中时,处理器进行归一化处理,之后通过第二忆阻器交叉杆阵列进行缩放和偏移;接着数据被激活,经过编码并转换为电压信号后传输至第三忆阻器交叉杆阵列,步骤重复次数与隐藏层数相同;第n忆阻器交叉杆阵列接受电压信号输出电流信号并选出最大电流列所表示的动作At,并对最大电流进行电压转换和存储;根据智能体的动作给予奖惩,并将新状态信息St+1存储到经验池中。

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供