著录项信息
专利名称 | 显微CT机用GPU数字图像系统及其控制方法 |
申请号 | CN201210581660.4 | 申请日期 | 2012-12-27 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2013-05-15 | 公开/公告号 | CN103099635A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | A61B6/03 | IPC分类号 | A;6;1;B;6;/;0;3查看分类表>
|
申请人 | 李华 | 申请人地址 | 北京市海淀区上地信息路26号中关村创业大厦9层914室
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 李华 | 当前权利人 | 李华 |
发明人 | 李华 |
代理机构 | 北京海虹嘉诚知识产权代理有限公司 | 代理人 | 李正清 |
摘要
一种加快并行图像处理速度、从而可在便携式显微CT机上使用的显微CT机用GPU数字图像系统。技术方案是:其特征是由为成像光源(1)、CMOS或CCD成像器(3)、嵌入式成像和光源控制系统(6)、精密机电耦合XYZ和旋转被测物体成像平台(12)、LinuxOs为基础的CPU运算平台(15)组成。本发明还公开了其控制方法。
1.显微CT机用GPU数字图像系统,其特征是由为成像光源(1)、CMOS或CCD成像器(3)、嵌入式成像和光源控制系统(6)、精密机电耦合XYZ和旋转被测物体成像平台(12)、Linux Os为基础的CPU运算平台(15)组成,
其中,成像光源(1)通过RS232串行线与嵌入式成像和光源控制系统(6)连接;CMOS或CCD成像器(3)的成像聚集导轨(9)与嵌入式成像和光源控制系统(6)中的步进电机驱动单元阵列(10)连接;精密机电耦合XYZ和旋转被测物体成像平台(12)与嵌入式成像和光源控制系统(6)中的步进电机驱动单元阵列(10)连接;Linux Os为基础的CPU运算平台(15)通过路由器(14)与光源控制系统(6)连接。
2.如权利要求1所述的显微CT机用GPU数字图像系统的控制方法,其特征是包括下列步骤:
步骤26:主机CPU启动CMOS或CCD成像器,成像器经过控制函数(API)获取数字图像IInner(x,y);
步骤27:检测该数字图像的X方向和Y方向的解析度Rx、Ry;
步骤28:假若GPU的本地内存25为MEM_local大于数字图像IInner(x,y)的2.5倍,则执行步骤29;否则将数字图像IInner(x,y)分割成子图像IInner_sub(x,y),使得本地内存MEM_local大于子图像的2.5倍,然后执行步骤29;
步骤29:将数字图像IInner(x,y)全部读入该内存中,
步骤30:对存于线程处理阵列即TPC内存中的图像或子图像进行二维拉普拉斯-高斯算子卷积:
第一步:首先选取两维卷积用高斯核kernel,G(x,y;x0,y0,u,S),如式(1),其中(x0,y0)设定为(0,0)点,S根据图像质量选取,选取值为[2,3],x,y的单位为像素(pixel):
G(x,y;x0,y0,u,S)=
1/(sqrt(2pi)*S)exp{[(x-x0)^2+(y-y0)^2)]/(2S*S)}…(1)
第二步:对高斯核进行拉普拉斯算子运算,如式(2):
2 2 2 2
d/dx+d/dy[G(x,y;x0,y0,u,S)]...(2)
第三步:使用式(2)二维拉普拉斯-高斯算子对GPU本地内存中的数字图像进行两维卷积运算,即G(z,y;uz,uy,S)*I(z,y),并将运算结果存储于GPU本地内存中;
步骤31:检查是否对数字图像IInner(x,y)分割后的每个子图像都进行了读入TPC本地内存,并进行了步骤30第三步的处理,如果没有,则执行步骤29,如果是,则结束。
显微CT机用GPU数字图像系统及其控制方法\n技术领域\n[0001] 本发明属于显微CT机成像系统领域,尤其是一种加快并行图像处理速度、从而可在便携式显微CT机上使用的显微CT机用GPU数字图像系统及其控制方法。\n背景技术\n[0002] 目前,显微CT机成像系统图像处理速度慢、使用范围受到限制。\n发明内容\n[0003] 本发明的目的是提供一种加快并行图像处理速度、从而可在便携式显微CT机上使用的显微CT机用GPU数字图像系统及其控制方法。\n[0004] 本发明的技术方案是:\n[0005] 显微CT机用GPU数字图像系统,其特征是由为成像光源(1)、CMOS或CCD成像器(3)、嵌入式成像和光源控制系统(6)、精密机电耦合XYZ和旋转被测物体成像平台(12)、Linux Os为基础的CPU运算平台(15)组成,\n[0006] 其中,成像光源(1)通过RS232串行线与嵌入式成像和光源控制系统(6)连接;\nCMOS或CCD成像器(3)的成像聚集导轨(9)与嵌入式成像和光源控制系统(6)中的步进电机驱动单元阵列(10)连接;精密机电耦合XYZ和旋转被测物体成像平台(12)与光源控制系统(6)中的步进电机驱动单元阵列(10)连接;Linux Os为基础的CPU运算平台(15)通过路由器(14)与光源控制系统(6)连接。\n[0007] 显微CT机用GPU数字图像系统的控制方法,其特征是包括下列步骤:\n[0008] 步骤26:主机CPU启动CMOS或CCD成像器,成像器经过控制函数API获取数字图像I Inner(x,y);\n[0009] 步骤27:检测该数字图像的X方向和Y方向的解析度Rx、Ry;\n[0010] 步骤28:假若GPU的本地内存25为MEM_local大于数字图像I Inner(x,y)的2.5倍,则执行步骤29;否则将数字图像I Inner(x,y)分割成子图像I Inner_sub(x,y),使得本地内存MEM_local大于子图像的2.5倍,然后执行步骤29;\n[0011] 步骤29:将数字图像I Inner(x,y)全部读入该内存中,\n[0012] 步骤30:对存于TPC内存中的图像或子图像进行二维拉普拉斯-高斯算子卷积:\n[0013] 第一步:首先选取两维卷积用高斯核kernel,G(x,y;x0,y0,S),如式(1),其中x0,y0设定为0,0点,S根据图像质量选取,常见选取值为[2,3],x,y的单位为像素(pixel):\n[0014] G(x,y;x0,y0,u,S)=\n[0015] 1/(sqrt(2 pi)*S)exp{[(x-x0)^2+(y-y0)^2)]/(2 S*S)}…(1)\n[0016] 第二步:对高斯核进行拉普拉斯算子运算,如式(2):\n[0017] d2/dx2+d2/dy2[G(x,y;x0,y0,u,S)] ...(2)\n[0018] 第三步:使用式(2)二维拉普拉斯-高斯算子对GPU本地内存中的数字图像进行两维卷积运算,即G(z,y;uz,uy,S)*I(z,y),并将运算结果存储于GPU本地内存中;\n[0019] 步骤31:检查是否对数字图像I Inner(x,y)分割后的每个子图像都进行了读入TPC本地内存,并进行了步骤30第三步的处理,如果没有,则执行步骤29,如果是,则结束。\n[0020] 本发明的效果是:本发明采用基于GPU图形图像处理显卡组成的CPU-GPU系统实现便携式显微CT(Computed Tomography)机使用的并行高速二维拉普拉斯-高斯算子数字图像处理。\n[0021] 所述CPU-GPU系统优化了线程处理阵列(TPC,Thread Processing Clus ter)与被处理图像解析度(resolution)的优化耦合,通过嵌入式实时图像获取系统的软件驱动函数将图像解析参数与CPU-GPU算法结合,优选了图像分割阵列处理,简化了CPU与GPU之间的图像数据交换,将每个线程处理阵列拥有的N(SP)个流处理器(SP,Stream Processor)流多处理器(SM,Streaming Multiprocessor)的运算进行了并行优化处理,解决了GPU没有分支预测机制,因此在分支得到机会执行之前运算被挂起,等待所有的分支路径执行完成的运算瓶颈,加快了并行图像处理速度,从而可在便携式显微CT机上使用。实现对二维拉普拉斯-高斯算子数字图像处理的并行高速处理,加速微小物体三维断层扫描数字成像计算。\n[0022] 下面结合附图和实施例对本发明做进一步的说明。\n附图说明\n[0023] 图1是本发明的结构示意图;\n[0024] 图2是图1中显微CT用GPU系统结构示意图;\n[0025] 图3是本发明的控制流程图。\n具体实施方式\n[0026] 图1中,显微CT机用GPU数字图像系统,由为成像光源1、CMOS或CCD成像器3、嵌入式成像和光源控制系统6、精密机电耦合XYZ和旋转被测物体成像平台12、Linux Os为基础的CPU运算平台15组成。\n[0027] 其中,成像光源1通过RS232串行线与嵌入式成像和光源控制系统6连接;CMOS或CCD成像器3的成像聚集导轨9与嵌入式成像和光源控制系统6中的步进电机驱动单元阵列10连接;精密机电耦合XYZ和旋转被测物体成像平台12与光源控制系统6中的步进电机驱动单元阵列10连接;Linux Os为基础的CPU运算平台15通过路由器14与光源控制系统6连接。\n[0028] 图中,2为被测三维物体;3为CMOS或CCD成像器,该成像器形成数字图像I Inner(x,y);4为光源主射线RCenter(ray equation);5为在光源S下形成的角锥状投影(CONE Pro jection)的边缘射线RPeripheral;7为连接X光源到嵌入式控制系统的RS232串行线;8为CMOS或CCD成像器的USB控制连线;9为成像聚集导轨,该导轨含有快进和微调慢进功能;11为连接步进电机驱动单元阵列到成像聚集导轨步进电机的控制线;12为精密机电耦合XYZ和旋转被测物体成像平台,该平台具有XYZ和旋转四维自由度;13为连接步进电机驱动单元阵列到精密机电耦合XYZ和旋转被测物体成像平台步进电机的控制线。\n[0029] 图2中,17为CPU平台的内存;18为CPU;19为GPU单元的多个线程处理阵列TPC;\n20为线程处理阵列的控制单元;21为流处理器SP;22为多个流处理器SP组成的一个流多处理器SM;23为流多处理器的本地内存;24为流多处理器的特殊函数单元SFU;25为线程处理阵列TPC的本地内存。\n[0030] 图3中,显微CT机用GPU数字图像系统的控制方法,包括下列步骤:\n[0031] 步骤26:主机CPU启动CMOS或CCD成像器,成像器经过控制函数API获取数字图像I Inner(x,y);\n[0032] 步骤27:检测该数字图像的X方向和Y方向的解析度Rx、Ry;\n[0033] 步骤28:假若GPU的本地内存25为MEM_local大于数字图像I Inner(x,y)的2.5倍,则执行步骤29;否则将数字图像I Inner(x,y)分割成子图像I Inner_sub(x,y),使得本地内存MEM_local大于子图像的2.5倍,然后执行步骤29;\n[0034] 步骤29:将数字图像I Inner(x,y)全部读入该内存中,\n[0035] 步骤30:对存于TPC内存中的图像或子图像进行二维拉普拉斯-高斯算子卷积:\n[0036] 第一步:首先选取两维卷积用高斯核kernel,G(x,y;x0,y0,S),如式(1),其中x0,y0设定为0,0点,S根据图像质量选取,常见选取值为[2,3],x,y的单位为像素(pixel):\n[0037] G(x,y;x0,y0,u,S)=\n[0038] 1/(sqrt(2 pi)*S)exp{[(x-x0)^2+(y-y0)^2)]/(2S*S)}…(1)\n[0039] 第二步:对高斯核进行拉普拉斯算子运算,如式(2):\n[0040] d2/dx2+d2/dy2[G(x,y;x0,y0,u,S)]...(2)\n[0041] 第三步:使用式(2)二维拉普拉斯-高斯算子对GPU本地内存中的数字图像进行两维卷积运算,即G(z,y;uz,uy,S)*I(z,y),并将运算结果存储于GPU本地内存中;\n[0042] 步骤31:检查是否对数字图像I Inner(x,y)分割后的每个子图像都进行了读入TPC本地内存,并进行了步骤30第三步的处理,如果没有,则执行步骤29,如果是,则结束。\n[0043] 本发明的主要功能为:\n[0044] 1、采用基于GPU图形图像处理显卡组成的CPU-GPU系统实现便携式显微CT(Computed Tomography)机的并行图像处理功能。\n[0045] 2、采用CPU-GPU处理平台,并实现了其线程处理阵列(TPC,Thread Processing Cluster)与被处理图像解析度(resolution)的优化耦合,通过嵌入式实时图像获取系统的软件驱动函数将图像解析参数与CPU-GPU算法结合,优选了图像分割阵列处理,简化了CPU与GPU之间的图像数据交换,将每个线程处理阵列拥有的N(SP)个流处理器(SP,Stream Processor)流多处理器(SM,Streaming Multiprocessor)的运算进行了并行优化处理,解决了GPU没有分支预测机制,因此在分支得到机会执行之前运算被挂起,等待所有的分支路径执行完成的运算瓶颈,加快了并行图像处理速度。
法律信息
- 2019-12-13
未缴年费专利权终止
IPC(主分类): A61B 6/03
专利号: ZL 201210581660.4
申请日: 2012.12.27
授权公告日: 2014.12.24
- 2014-12-24
- 2013-06-12
实质审查的生效
IPC(主分类): A61B 6/03
专利申请号: 201210581660.4
申请日: 2012.12.27
- 2013-05-15
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |