著录项信息
专利名称 | 基于视觉跟踪与语音识别的鼠标系统 |
申请号 | CN200710039996.7 | 申请日期 | 2007-04-26 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2007-09-19 | 公开/公告号 | CN101038523 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G06F3/038 | IPC分类号 | G;0;6;F;3;/;0;3;8;;;G;0;6;F;3;/;1;6查看分类表>
|
申请人 | 上海交通大学 | 申请人地址 | 上海市闵行区东川路800号
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 上海交通大学 | 当前权利人 | 上海交通大学 |
发明人 | 赵子健;刘允才;郁生阳;仝明磊 |
代理机构 | 上海交达专利事务所 | 代理人 | 王锡麟;张宗明 |
摘要
一种基于视觉跟踪与语音识别的鼠标系统,属于计算机技术领域。本发明中,摄像头通过检测跟踪红外标志物的光斑图像,动态跟踪光斑在摄像头成像平面上的位置移动,然后通过光标定位子模块将光斑在图像上的运动转换为鼠标光标在显示桌面上的运动,并将鼠标的位置信息传递给信息反馈模块;信息反馈模块通过计算机显示器将鼠标驱动模块传来的鼠标光标的位置表示出来,并给用户相应的信息提示;语音指令处理模块通过与计算机主机相连接的麦克风接收用户发出的语音指令,通过语音识别子模块对输入语音信号进行识别,由分类结果激发并驱动相应的鼠标事件响应。本发明结构简单,使用方便,通用性强,为计算机系统提供方便的人机接口。
1、一种基于视觉跟踪与语音识别的鼠标系统,其特征在于,包括:鼠标驱 动模块、信息反馈模块和语音指令处理模块;鼠标驱动模块由摄像头、红外发光 标志物以及光标定位子模块构成,摄像头通过自适应阈值分割的方法进行红外发 光标志物的红外光斑检测,通过求重心的方法获取红外光斑的图像位置坐标,然 后以前一帧图像上红外光斑的位置坐标为基准,在一个较小的图像坐标范围内检 测后一帧图像的红外光斑位置,从而实现跟踪红外发光标志物的光斑图像,动态 跟踪红外光斑在摄像头成像平面上的位置移动,然后通过光标定位子模块将红外 光斑在图像上的运动转换为鼠标光标在显示桌面上的运动,并将鼠标的位置信息 传递给信息反馈模块,信息反馈模块通过计算机显示器将鼠标驱动模块传来的鼠 标光标的位置表示出来,并给用户相应的信息提示;语音指令处理模块由麦克风 及语音识别子模块组成,当信息反馈模块显示鼠标光标到达用户的感兴趣位置 时,语音指令处理模块通过与计算机主机相连接的麦克风接收用户发出的语音指 令,语音识别子模块根据语音信号提取出的线性预测系数,再通过最近相邻分类 方法进行识别和分类并得出分类结果后,由分类结果激发并驱动相应的鼠标事件 响应。
2、根据权利要求1所述的基于视觉跟踪与语音识别的鼠标系统,其特征是, 所述语音指令处理模块中的语音识别子模块,其输入为麦克风接收到语音信号的 线性预测系数,输出为语音指令的分类识别结果,分类结果驱动相应的操作系统 资源实现相应的鼠标事件响应,包括左键单击、右键单击、左键双击。
3、根据权利要求1所述的基于视觉跟踪与语音识别的鼠标系统,其特征是, 所述麦克风采集用户使用的所有指令语音信号,提取这些语音信号的线性预测系 数存储到计算机主机的磁盘上,作为标准语音样本。
4、根据权利要求1所述的基于视觉跟踪与语音识别的鼠标系统,其特征是, 所述鼠标驱动模块中,红外发光标志物在摄像头可视范围内移动,摄像头的镜头 上装有红外滤光片,只能感应红外发光标志物发出的光。
技术领域\n本发明是一种计算机技术领域的鼠标系统,具体是一种基于视觉跟踪与语音 识别的鼠标系统。\n背景技术\n在传统的计算机系统中,传统键盘、鼠标是最主要的输入输出设备,目前大 部分计算机系统采用的人机交互模式为:键盘鼠标->显示器->键盘鼠标,即 操作人员是通过键盘、鼠标给计算机输入有关信息及提示请示,而计算机通过显 示器给人提供大量相关信息及提示请示等。目前大部分计算机操作系统及应用软 件都是基于这种人机交互模式开发的。虽然这种人机交互的模式可以满足计算机 用户的日常业务需要,但是在不少情况下使用传统的鼠标键盘作为输入输出设备 是不合适的,例如残障人士使用的计算机系统就不宜用传统的鼠标键盘,还有大 部分多媒体娱乐设备也不方便使用传统的鼠标键盘作为输入输出设备。目前也出 现了不少专用的输入输出设备,例如汉字手写板、力矩球、数据手套和三维鼠标 等。但是这些设备有以下不足之处:构造复杂,价格昂贵,只适于专门领域应用, 通用性不强,无法与传统的鼠标键盘兼容。\n经对现有技术文献的检索发现,专利申请号为00134143.X名称为“视窗的 光标视觉点选方法及装置”,该技术提出了一种方便的鼠标控制方法,主要是使 用瞳孔的相对移动信息控制鼠标光标在桌面上的相对位置移动的方法,其瞳孔跟 踪方法主要是通过定位框动态跟踪的方法确定瞳孔的相对位移量。由于鼠标位置 定位是相对定位的方法,故而鼠标光标的定位受噪声扰动的影响比较大,鲁棒性 不强。在进一步的检索中,尚未见有报道过有那种基于视觉跟踪技术的鲁棒的鼠 标系统。\n发明内容\n本发明针对现有技术的问题和不足,提出了一种基于视觉跟踪与语音识别的 鼠标系统。本发明通过摄像头可以实时跟踪检测红外发光标志物的移动,并以此 控制鼠标光标的位置,通过麦克风接收语音指令,从而为计算机系统提供方便友 好的人机接口。\n本发明是通过以下技术方案实现的,本发明包括:鼠标驱动模块,信息反馈 模块和语音指令处理模块;鼠标驱动模块由摄像头、红外发光标志物以及光标定 位子模块构成,摄像头通过检测跟踪红外标志物的光斑图像,可以动态跟踪光斑 在摄像头成像平面上的位置移动,然后通过光标定位子模块将光斑在图像上的运 动转换为鼠标光标在显示桌面上的运动,并将鼠标的位置信息传递给信息反馈模 块;信息反馈模块通过计算机显示器将鼠标驱动模块传来的鼠标光标的位置表示 出来,并给用户相应的信息提示;语音指令处理模块由麦克风及语音识别子模块 组成,当信息反馈模块显示鼠标光标到达用户的感兴趣位置时,语音指令处理模 块通过与计算机主机相连接的麦克风接收用户发出的语音指令,通过语音识别子 模块对输入语音信号进行识别,由分类结果激发并驱动相应的鼠标事件响应(左 键单击、右键单击、左键双击)。\n所述鼠标驱动模块中的光标定位子模块,其输入信息为摄像头图像,分辨率 H×W,显示器分辨率L×M,红外标志物光斑位置坐标(a,b),输出为鼠标光标 位置(A,B)。该光标定位子模块可以将红外发光标志物的运动转化为鼠标光标在 显示桌面上的运动,其传递函数为:\n\n\n所述语音指令处理模块中的语音识别子模块,其输入为麦克风接收到语音信 号的线性预测系数(LPCC),输出为语音指令的分类识别结果,分类结果可以驱 动相应的操作系统资源实现相应的鼠标事件响应(左键单击、右键单击、左键双 击)。\n与现有技术相比,本发明系统结构简单、容易实现,抗噪声干扰,鲁棒性强, 鼠标定位误差小于2个像素,语音指令的识别率则高达到90%。与现有技术相比, 使用设备器材购买方便、价格低廉;本发明系统使用方便通用性强,不仅可以单 独使用,还可以配合传统的鼠标键盘一起使用。\n附图说明\n图1为本发明组成示意图。\n图2为本发明系统流程框图。\n具体实施方式\n下面结合附图对本发明的实施例作详细说明:本实施例在以本发明技术方案 为前提下进行实施,给出了详细的实施方式和过程,但本发明的保护范围不限于 下述的实施例。\n如图1所示,本实施例包括:鼠标驱动模块,信息反馈模块和语音指令处理 模块;所述鼠标驱动模块由红外发光标志物1、摄像头2、红外滤光片3以及光 标定位子模块组成,信息反馈模块由连接在计算机主机5上显示器6组成,语音 指令处理模块由连接在计算机主机上麦克风4及语音识别子模块组成。其中光标 定位、语音识别两个子模块都是计算机主机5上的应用模块。鼠标驱动模块由装 有红外滤光片3的摄像头2、红外发光标志物1以及光标定位子模块构成,摄像 头2通过检测跟踪红外标志物1的光斑图像,可以动态跟踪光斑在摄像头成像平 面上的位置移动,然后通过光标定位子模块将光斑在图像上的运动转换为鼠标光 标在显示桌面上的运动,并将鼠标的位置信息传递给信息反馈模块;信息反馈模 块通过计算机显示器6将鼠标驱动模块传来的鼠标光标的位置表示出来,并给用 户相应的信息提示;当信息反馈模块显示鼠标光标到达用户的感兴趣位置时,语 音指令处理模块通过与计算机主机5相连接的麦克风4接收用户发出的语音指 令,通过语音识别子模块对输入语音信号进行识别,由分类结果激发并驱动相应 的鼠标事件响应(左键单击、右键单击、左键双击)。\n如图2所示,本实施例首先使用麦克风4采集用户使用的所有指令语音信号, 提取这些语音信号的线性预测系数(LPCC)存储到计算机主机5的磁盘上,作为 标准语音样本。然后,用户手持红外发光标志物1在摄像头2可视范围内移动, 鼠标驱动模块中摄像头2的镜头上装有红外滤光片3,只能感应红外标志物1发 出的光,采用自适应阈值分割的方法进行红外光斑检测,通过求重心的方法获取 红外光斑的图像位置坐标。得知前一帧图像上红外光斑的位置坐标,以此为基准 在一个较小的图像坐标范围内检测后一帧图像的红外光斑位置,从而实现红外光 斑的动态跟踪,光标定位子模块将红外发光标志物1的位置移动转化为鼠标光标 在显示桌面上的运动。信息反馈模块将通过鼠标驱动模块得到的鼠标光标位置显 示在显示器6上。通常用户通过观察显示器6上的鼠标光标的移动,判断是否要 发出语音指令;语音指令处理模块当接收到麦克风4采集的语音信号后,语音识 别子模块将输入语音指令以最近邻法分类(以标准语音样本为分类中心)并以分 类结果驱动鼠标事件响应。\n通过使用本实施例的鼠标系统在装有Windows XP操作系统的计算机上面进 行常规鼠标操作(鼠标左键单击;鼠标右键单击;鼠标左键双击)100次,测得 本发明的语音指令正确执行率大于86%,鼠标定位误差为1.6个像素,由这两项 指标可以看出本实施例具有鲁棒、精确的良好特性。
法律信息
- 2012-06-27
未缴年费专利权终止
IPC(主分类): G06F 3/038
专利号: ZL 200710039996.7
申请日: 2007.04.26
授权公告日: 2009.01.07
- 2009-01-07
- 2007-11-14
- 2007-09-19
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2002-07-10
|
2000-12-06
| | |
2
| | 暂无 |
1989-11-22
| | |
3
| |
2006-04-19
|
2004-10-12
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |