基于NVIDIAKeplerGPU汇编指令的单精度矩阵乘优化方法与系统

专利类型:
发明专利(1)
专利有效性:
无效专利(1)
法律状态:
撤回(1)
高级筛选:

路标网共为您找到相关结果1

公开(公告)时间
申请时间

基于NVIDIAKeplerGPU汇编指令的单精度矩阵乘优化方法与系统

发明专利无效专利
  • 申请号:CN201611260732.X
  • 申请人:中国科学院计算技术研究所;中国科学院国有资产经营有限责任公司
  • 申请日:2016-12-30
  • 主分类号:G06F9/302
  • 公开(公告)日:2017-05-17
  • 公开/公告号:CN106681694A
申请同类专利

摘要:本发明涉及单精度矩阵乘优化方法,该方法基于NVIDIA Kepler GPU汇编指令,包括:根据A矩阵分块的列长度bm和B矩阵分块的行长度bn对原始矩阵进行分块,每个block处理维度的输出矩阵C;在GPU二级存储上创建4个暂存空间smA,smB,smAx和smBx;从GPU一级存储上的矩阵A读取该smA大小的矩阵到该smA,从矩阵B读取该smB大小的矩阵到该smB;每次从该smA加载一列A矩阵分块数据到寄存器,从该smB加载一行B矩阵分块数据到寄存器,读取该寄存器内容,并运用乘加融合指令做矩阵乘运算,且在做矩阵乘运算的同时,从该GPU一级存储读取下一个该smA的一列到该smAx,并储读取下一个该smB的一行到该smBx;步骤5,做完该smA和该smB的矩阵乘以后,将该smA和该mAx地址互换,将该smB和该smBx地址互换。

著录信息权利要求说明书PDF全文法律状态引证文献
  • 1
前往
没找到想要的结果?为您推荐专业专利顾问检索  基于NVIDIAKeplerGPU汇编指令的单精度矩阵乘优化方法与系统 专利,更快更准确
免费
我想查:已帮助0位用户进行查询

*来源于国家知识产权局数据,仅供参考,专利服务由北京酷爱智慧知识产权代理公司提供