显微CT机用GPU数字图像系统及其控制方法

发明专利无效专利

申请号：
CN201210581660.4
IPC分类号：A61B6/03
申请日期：
2012-12-27
申请人：
李华

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	显微CT机用GPU数字图像系统及其控制方法
申请号	CN201210581660.4	申请日期	2012-12-27
法律状态	权利终止	申报国家	中国
公开/公告日	2013-05-15	公开/公告号	CN103099635A
优先权	暂无	优先权号	暂无
主分类号	A61B6/03 ? IPC结构图谱： A 人类生活必需 A6 保健；救生；娱乐 A61 医学或兽医学；卫生学 A61B 诊断；外科；鉴定（分析生物材料入G01N，如G01N33/48） A61B6/00 用于放射诊断的仪器，如与放射治疗设备相结合的（应用在核医疗学方面的测量辐射强度的仪器，如在体内计数的入G01T1/161；用于X光摄影的设备入G03B42/02） A61B6/02 依次在不同平面中诊断的仪器；立体放射诊断的 A61B6/03 用电子计算机处理的层析X射线摄影机（回波层析X射线摄影法入A61B8/14）〔4〕	IPC分类号	A;6;1;B;6;/;0;3查看分类表>
申请人	李华	申请人地址	北京市海淀区上地信息路26号中关村创业大厦9层914室变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	李华	当前权利人	李华
发明人	李华
代理机构	北京海虹嘉诚知识产权代理有限公司	代理人	李正清

摘要

一种加快并行图像处理速度、从而可在便携式显微CT机上使用的显微CT机用GPU数字图像系统。技术方案是：其特征是由为成像光源（1）、CMOS或CCD成像器（3）、嵌入式成像和光源控制系统（6）、精密机电耦合XYZ和旋转被测物体成像平台（12）、LinuxOs为基础的CPU运算平台（15）组成。本发明还公开了其控制方法。

1.显微CT机用GPU数字图像系统，其特征是由为成像光源(1)、CMOS或CCD成像器(3)、嵌入式成像和光源控制系统(6)、精密机电耦合XYZ和旋转被测物体成像平台(12)、Linux Os为基础的CPU运算平台(15)组成，
其中，成像光源(1)通过RS232串行线与嵌入式成像和光源控制系统(6)连接；CMOS或CCD成像器(3)的成像聚集导轨(9)与嵌入式成像和光源控制系统(6)中的步进电机驱动单元阵列(10)连接；精密机电耦合XYZ和旋转被测物体成像平台(12)与嵌入式成像和光源控制系统(6)中的步进电机驱动单元阵列(10)连接；Linux Os为基础的CPU运算平台(15)通过路由器(14)与光源控制系统(6)连接。
2.如权利要求1所述的显微CT机用GPU数字图像系统的控制方法，其特征是包括下列步骤：
步骤26：主机CPU启动CMOS或CCD成像器，成像器经过控制函数(API)获取数字图像IInner(x,y)；
步骤27：检测该数字图像的X方向和Y方向的解析度Rx、Ry；
步骤28：假若GPU的本地内存25为MEM_local大于数字图像IInner(x,y)的2.5倍，则执行步骤29；否则将数字图像IInner(x,y)分割成子图像IInner_sub(x,y)，使得本地内存MEM_local大于子图像的2.5倍，然后执行步骤29；
步骤29：将数字图像IInner(x,y)全部读入该内存中，
步骤30：对存于线程处理阵列即TPC内存中的图像或子图像进行二维拉普拉斯-高斯算子卷积：
第一步：首先选取两维卷积用高斯核kernel，G(x,y；x0,y0,u,S)，如式(1)，其中(x0,y0)设定为(0,0)点，S根据图像质量选取，选取值为[2,3]，x,y的单位为像素(pixel)：
G(x,y；x0,y0,u,S)＝
1/(sqrt(2pi)*S)exp{[(x-x0)^2+(y-y0)^2)]/(2S*S)}…(1)
第二步：对高斯核进行拉普拉斯算子运算，如式(2)：
2 2 2 2
d/dx+d/dy[G(x,y；x0,y0,u,S)]...(2)
第三步：使用式(2)二维拉普拉斯-高斯算子对GPU本地内存中的数字图像进行两维卷积运算,即G(z,y；uz,uy,S)*I(z,y)，并将运算结果存储于GPU本地内存中；
步骤31：检查是否对数字图像IInner(x,y)分割后的每个子图像都进行了读入TPC本地内存，并进行了步骤30第三步的处理，如果没有，则执行步骤29，如果是，则结束。

显微CT机用GPU数字图像系统及其控制方法\n技术领域\n[0001] 本发明属于显微CT机成像系统领域，尤其是一种加快并行图像处理速度、从而可在便携式显微CT机上使用的显微CT机用GPU数字图像系统及其控制方法。\n背景技术\n[0002] 目前，显微CT机成像系统图像处理速度慢、使用范围受到限制。\n发明内容\n[0003] 本发明的目的是提供一种加快并行图像处理速度、从而可在便携式显微CT机上使用的显微CT机用GPU数字图像系统及其控制方法。\n[0004] 本发明的技术方案是：\n[0005] 显微CT机用GPU数字图像系统，其特征是由为成像光源（1）、CMOS或CCD成像器（3）、嵌入式成像和光源控制系统（6）、精密机电耦合XYZ和旋转被测物体成像平台（12）、Linux Os为基础的CPU运算平台（15）组成，\n[0006] 其中，成像光源（1）通过RS232串行线与嵌入式成像和光源控制系统（6）连接；\nCMOS或CCD成像器（3）的成像聚集导轨（9）与嵌入式成像和光源控制系统（6）中的步进电机驱动单元阵列（10）连接；精密机电耦合XYZ和旋转被测物体成像平台（12）与光源控制系统（6）中的步进电机驱动单元阵列（10）连接；Linux Os为基础的CPU运算平台（15）通过路由器（14）与光源控制系统（6）连接。\n[0007] 显微CT机用GPU数字图像系统的控制方法，其特征是包括下列步骤：\n[0008] 步骤26：主机CPU启动CMOS或CCD成像器，成像器经过控制函数API获取数字图像I Inner(x,y)；\n[0009] 步骤27：检测该数字图像的X方向和Y方向的解析度Rx、Ry；\n[0010] 步骤28：假若GPU的本地内存25为MEM_local大于数字图像I Inner(x,y)的2.5倍，则执行步骤29；否则将数字图像I Inner(x,y)分割成子图像I Inner_sub(x,y)，使得本地内存MEM_local大于子图像的2.5倍，然后执行步骤29；\n[0011] 步骤29：将数字图像I Inner(x,y)全部读入该内存中，\n[0012] 步骤30：对存于TPC内存中的图像或子图像进行二维拉普拉斯-高斯算子卷积：\n[0013] 第一步：首先选取两维卷积用高斯核kernel，G(x,y;x0,y0,S)，如式（1），其中x0,y0设定为0,0点，S根据图像质量选取，常见选取值为[2,3]，x,y的单位为像素（pixel）：\n[0014] G(x,y;x0,y0,u,S)=\n[0015] 1/(sqrt(2 pi)*S)exp{[(x-x0)^2+(y-y0)^2)]/(2 S*S)}…(1)\n[0016] 第二步：对高斯核进行拉普拉斯算子运算，如式（2）：\n[0017] d2/dx2+d2/dy2[G(x,y;x0,y0,u,S)] ...(2)\n[0018] 第三步：使用式（2）二维拉普拉斯-高斯算子对GPU本地内存中的数字图像进行两维卷积运算,即G(z,y;uz,uy,S)*I(z,y)，并将运算结果存储于GPU本地内存中；\n[0019] 步骤31：检查是否对数字图像I Inner(x,y)分割后的每个子图像都进行了读入TPC本地内存，并进行了步骤30第三步的处理，如果没有，则执行步骤29，如果是，则结束。\n[0020] 本发明的效果是：本发明采用基于GPU图形图像处理显卡组成的CPU-GPU系统实现便携式显微CT（Computed Tomography)机使用的并行高速二维拉普拉斯-高斯算子数字图像处理。\n[0021] 所述CPU-GPU系统优化了线程处理阵列（TPC，Thread Processing Clus ter）与被处理图像解析度(resolution)的优化耦合,通过嵌入式实时图像获取系统的软件驱动函数将图像解析参数与CPU-GPU算法结合，优选了图像分割阵列处理，简化了CPU与GPU之间的图像数据交换，将每个线程处理阵列拥有的N(SP)个流处理器（SP，Stream Processor）流多处理器(SM,Streaming Multiprocessor)的运算进行了并行优化处理，解决了GPU没有分支预测机制，因此在分支得到机会执行之前运算被挂起，等待所有的分支路径执行完成的运算瓶颈，加快了并行图像处理速度，从而可在便携式显微CT机上使用。实现对二维拉普拉斯-高斯算子数字图像处理的并行高速处理，加速微小物体三维断层扫描数字成像计算。\n[0022] 下面结合附图和实施例对本发明做进一步的说明。\n附图说明\n[0023] 图1是本发明的结构示意图；\n[0024] 图2是图1中显微CT用GPU系统结构示意图；\n[0025] 图3是本发明的控制流程图。\n具体实施方式\n[0026] 图1中，显微CT机用GPU数字图像系统，由为成像光源1、CMOS或CCD成像器3、嵌入式成像和光源控制系统6、精密机电耦合XYZ和旋转被测物体成像平台12、Linux Os为基础的CPU运算平台15组成。\n[0027] 其中，成像光源1通过RS232串行线与嵌入式成像和光源控制系统6连接；CMOS或CCD成像器3的成像聚集导轨9与嵌入式成像和光源控制系统6中的步进电机驱动单元阵列10连接；精密机电耦合XYZ和旋转被测物体成像平台12与光源控制系统6中的步进电机驱动单元阵列10连接；Linux Os为基础的CPU运算平台15通过路由器14与光源控制系统6连接。\n[0028] 图中，2为被测三维物体；3为CMOS或CCD成像器，该成像器形成数字图像I Inner(x,y)；4为光源主射线RCenter（ray equation);5为在光源S下形成的角锥状投影(CONE Pro jection)的边缘射线RPeripheral；7为连接X光源到嵌入式控制系统的RS232串行线；8为CMOS或CCD成像器的USB控制连线;9为成像聚集导轨，该导轨含有快进和微调慢进功能；11为连接步进电机驱动单元阵列到成像聚集导轨步进电机的控制线；12为精密机电耦合XYZ和旋转被测物体成像平台，该平台具有XYZ和旋转四维自由度；13为连接步进电机驱动单元阵列到精密机电耦合XYZ和旋转被测物体成像平台步进电机的控制线。\n[0029] 图2中，17为CPU平台的内存；18为CPU；19为GPU单元的多个线程处理阵列TPC；\n20为线程处理阵列的控制单元；21为流处理器SP；22为多个流处理器SP组成的一个流多处理器SM；23为流多处理器的本地内存；24为流多处理器的特殊函数单元SFU；25为线程处理阵列TPC的本地内存。\n[0030] 图3中，显微CT机用GPU数字图像系统的控制方法，包括下列步骤：\n[0031] 步骤26：主机CPU启动CMOS或CCD成像器，成像器经过控制函数API获取数字图像I Inner(x,y)；\n[0032] 步骤27：检测该数字图像的X方向和Y方向的解析度Rx、Ry；\n[0033] 步骤28：假若GPU的本地内存25为MEM_local大于数字图像I Inner(x,y)的2.5倍，则执行步骤29；否则将数字图像I Inner(x,y)分割成子图像I Inner_sub(x,y)，使得本地内存MEM_local大于子图像的2.5倍，然后执行步骤29；\n[0034] 步骤29：将数字图像I Inner(x,y)全部读入该内存中，\n[0035] 步骤30：对存于TPC内存中的图像或子图像进行二维拉普拉斯-高斯算子卷积：\n[0036] 第一步：首先选取两维卷积用高斯核kernel，G(x,y;x0,y0,S)，如式（1），其中x0,y0设定为0,0点，S根据图像质量选取，常见选取值为[2,3]，x,y的单位为像素（pixel）：\n[0037] G(x,y;x0,y0,u,S)=\n[0038] 1/(sqrt(2 pi)*S)exp{[(x-x0)^2+(y-y0)^2)]/(2S*S)}…(1)\n[0039] 第二步：对高斯核进行拉普拉斯算子运算，如式（2）：\n[0040] d2/dx2+d2/dy2[G(x,y;x0,y0,u,S)]...(2)\n[0041] 第三步：使用式（2）二维拉普拉斯-高斯算子对GPU本地内存中的数字图像进行两维卷积运算,即G(z,y;uz,uy,S)*I(z,y)，并将运算结果存储于GPU本地内存中；\n[0042] 步骤31：检查是否对数字图像I Inner(x,y)分割后的每个子图像都进行了读入TPC本地内存，并进行了步骤30第三步的处理，如果没有，则执行步骤29，如果是，则结束。\n[0043] 本发明的主要功能为:\n[0044] 1、采用基于GPU图形图像处理显卡组成的CPU-GPU系统实现便携式显微CT（Computed Tomography)机的并行图像处理功能。\n[0045] 2、采用CPU-GPU处理平台，并实现了其线程处理阵列（TPC，Thread Processing Cluster）与被处理图像解析度(resolution)的优化耦合,通过嵌入式实时图像获取系统的软件驱动函数将图像解析参数与CPU-GPU算法结合，优选了图像分割阵列处理，简化了CPU与GPU之间的图像数据交换，将每个线程处理阵列拥有的N(SP)个流处理器（SP，Stream Processor）流多处理器(SM,Streaming Multiprocessor)的运算进行了并行优化处理，解决了GPU没有分支预测机制，因此在分支得到机会执行之前运算被挂起，等待所有的分支路径执行完成的运算瓶颈，加快了并行图像处理速度。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有引用任何外部专利数据！

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供