1.一种用于机顶盒的语音控制系统,其特征在于:包括前端处理子系统和语音识别子系统,其中
1)前端处理子系统用于实现对语音控制信号的采集、转换和发送;包括信号采集模块、A/D转换模块及传输模块,前端处理子系统位于遥控器中;
2)语音识别子系统接收前端处理子系统发送过来的语音信号,并对信号进行语音识别以产生一条机顶盒可以执行的控制命令,所述语音识别子系统位于机顶盒中,它包括传输模块、噪声处理模块和语音识别模块;
所述语音识别模块通过语音特征提取、声学模型与模式匹配、语义理解三个处理过程,将语音控制信号转换为机顶盒可直接执行的控制命令并交给控制模块执行;
其中,声学模型与模式匹配处理过程中,在识别时将未知的语音特征同声学模型进行匹配与比较,计算未知语音的特征矢量序列和每个发音模板之间的距离。
2.根据权利要求1所述的一种用于机顶盒的语音控制系统,其特征是,所述语音信号采集模块为话筒。
3.根据权利要求1所述的一种用于机顶盒的语音控制系统,其特征是,所述A/D转换模块为一模数转换器,将模拟的语音控制信号转换为数字信号。
4.根据权利要求1所述的一种用于机顶盒的语音控制系统,其特征是,所述传输模块是通过无线传输技术完成信号的发送和接收。
5.根据权利要求4所述的一种用于机顶盒的语音控制系统,其特征是,所述无线传输技术为红外线技术。
6.根据权利要求1所述的一种用于机顶盒的语音控制系统,其特征是,所述噪声处理模块为一数字滤波器,可以通过滤波去除控制信号中的噪声信号。
一种用于机顶盒的语音控制系统\n技术领域\n[0001] 本发明涉及一种控制系统,特别是涉及一种用于机顶盒的语音控制系统。\n背景技术\n[0002] 语音识别技术是2000年至2010年间信息技术领域十大重要的科技发展技术之一。它是一门交叉学科,正逐步成为信息技术中人机接口的关键技术。语音识别技术发展到今天,特别是中小词汇量非特定人语音识别系统识别精度已经大于98%。这些技术已经能够满足通常应用的要求。由于大规模集成电路技术的发展,这些复杂的语音识别系统也已经完全可以制成专用芯片,大量生产。在西方经济发达国家,大量的语音识别产品已经进入市场和服务领域。一些用户交机、电话机、手机已经包含了语音识别拨号功能,还有语音记事本、语音智能玩具等产品也包括语音识别与语音合成功能。人们可以通过电话网络用语音识别口语对话系统查询有关的机票、旅游、银行信息,并且取得很好的结果。调查统计表明多达85%以上的人对语音识别的信息查询服务系统的性能表示满意。可以预测在近五到十年内,语音识别系统的应用将更加广泛。各种各样的语音识别系统产品将出现在市场上。\n[0003] 在IPTV方面,目前商家推出的种类繁多的机顶盒虽然性能用途不同,但操作方式却基本相同,都是通过遥控进行按键操作。随着机顶盒集成的功能越来越多,按键操作的难度和繁琐度也将越来越大。将语音识别技术融入机顶盒的操作系统中,实现控制命令的语音操作将使用户将双手解放出来,仅靠说话就能轻松的完成操作。\n[0004] 一种现有的基于语音的人机通讯系统和方法中,采用服务器模式进行语音识别,语音识别模块在服务器端,也就是说用户发出的每条语音控制命令都需要经机顶盒发送给服务器端进行语音识别,再由服务器将识别出的操作命令交由机顶盒进行执行,这样势必会占用信号传输带宽,增加操作时间,降低语音操作的灵敏度。\n[0005] 嵌入式语音识别模式是将语言识别软件及模型写在设备(如机顶盒)的存储器里,识别过程在终端完成。机顶盒的操作命令较固定,需要识别的词汇量不是很大,不会占用存储器太大的空间,所以本发明采用嵌入式语音识别模式,嵌入式模式与服务器模式相比识别所需的时间更短,可以使用户更快速的完成操作。\n发明内容\n[0006] 本发明的目的是提供一种方便快速的机顶盒的语音控制系统。\n[0007] 本发明的目的通过以下技术方案予以实现:\n[0008] 一种用于机顶盒的语音控制系统包括前端处理子系统和语音识别子系统。\n[0009] 所述前端处理子系统包括语音采集模块,A/D转换模块,传输模块。\n[0010] 其中语音采集模块为一话筒,用来采集用户发出的语音控制命令。A/D转换模块对话筒输入的模拟的语音信号进行抽样、量化和编码,获得数字化的语音信号。传输模块则负责将转换好的信号通过无线技术发送给机顶盒。\n[0011] 所述的无线技术是红外线技术。\n[0012] 所述语音识别子系统包括传输模块,噪声处理模块和语音识别模块。\n[0013] 其中传输模块用来接收遥控器发送过来的信号,并将信号传递给噪声处理模块,由噪声处理模块去除干扰噪声之后交由语音识别模块进行语音识别,最后将识别出的命令交给机顶盒的控制模块进行执行。\n[0014] 所述噪声处理模块为一数字滤波器,是由数字乘法器、加法器和延时单元组成的一种装置。其功能是对输入离散信号的数字代码进行运算处理,以达到改变信号频谱的目的。数字滤波器与模拟滤波器的区别主要在于一个是采用软件(程序)的数值计算(数字滤波器),另外一个是采用硬件电路获得(模拟滤波器)。数字滤波器具有高精度、高可靠性、可程控改变特性或复用、便于集成等优点,因此在语言信号处理、图像信号处理、医学生物信号处理以及其他应用领域都得到了广泛应用。\n[0015] 所述的语音识别模块对语音信号的识别包括语音特征提取、声学模型与模式匹配、语义理解三个步骤,其中各个步骤的作用如下:\n[0016] 1)语音特征提取:目的是从语音信号中提取随时间变化的语音特征序列。2)声学模型与模式匹配(识别算法):声学模型是识别系统的底层模型,并且是语音识别系统中最关键的一部分。声学模型通常由获取的语音特征通过训练产生,目的是为每个发音建立发音模板。在识别时将未知的语音特征同声学模型(模式)进行匹配与比较,计算未知语音的特征矢量序列和每个发音模板之间的距离。声学模型的设计和语言发音特点密切相关。\n声学模型单元大小(字发音模型、半音节模型或音素模型)对语音训练数据量大小、系统识别率,以及灵活性有较大影响。\n[0017] 3)语义理解:对识别结果进行语法、语义分析。明白语言的意义以便作出相应的反应。通常是通过语言模型来实现。\n[0018] 本发明具有以下有益效果:\n[0019] 本发明是建立在非特定人识别的声学模型基础上的,非特定人识别的声学模型是针对某一种特定的语言来训练的,发音人不需要训练既可使用。对用户来说提供了很大方便,他们甚至不需要了解该过程。\n附图说明\n[0020] 下面将结合实施例和附图对本发明作进一步的详细描述:\n[0021] 图1是结构示意图;\n[0022] 图2是本发明的实现流程图;\n具体实施方式\n[0023] 下面结合附图对本发明做进一步的说明。\n[0024] 本发明的结构示意图如附图1所示,一种用于机顶盒的语音控制系统由前端子系统包括信号采集模块、A/D转换模块及传输模块;语音识别子系统又包括传输模块、噪声处理模块和语音识别模块。\n[0025] 本发明的实现流程图如附图2所示,用户发出一语音控制命令,语音被遥控器上的话筒采集,采集后的语音信号交由A/D转换模块。A/D转换模块通过抽样把模拟的语音信号进行周期性扫描,把时间上连续的信号变成时间上离散的信号,再经过量化把抽样得到的瞬时值的幅度离散,即用一组规定的电平,把瞬时抽样值用最接近的电平值来表示,最后用一组二进制码组来表示每一个有固定电平的量化值完成编码,从而将连续的模拟语音信号转换为离散的数字语音信号,方便下一步的处理。遥控器的传输模块将转换好的数字信号通过无线红外线技术传送给机顶盒进行下一步的处理。机顶盒的接收模块同样通过无线技术接收遥控器传送过来的数字信号,并将接收到的信号交给噪声处理模块。噪声处理模块为一数字滤波器,通过滤波减弱、消除信号中噪声信号的频谱成分,增强信号的信噪比,使语音识别模块能更有效、准确的进行语音识别。语音识别模块对信号进行语音特征提取,提取出信号的语音特征序列,将语音特征与已建立的声学模型进行比对,并对结果进行语法、语义分析完成语音识别。若用户发出的命令为合法的(与声学模型中已建立的模型相匹配),则将识别出的词汇转换为控制命令交给机顶盒的控制模块进行执行,完成用户的操作指示。若用户的命令为非法的,则不作出反应。\n[0026] 例如,用户对遥控器的话筒发出“菜单”命令,话筒对语音命令进行拾取后经过各级的处理交由机顶盒的语音识别模块,语音识别模块对语音信号提取特征后与已建立的声学模型进行比对,比对后发现特征序列与模型库中已有的声学模型“菜单”相匹配,则识别出用户发出的命令为“菜单”,将识别出的词汇转换为一条控制命令,使机顶盒执行“菜单”命令,显示出系统的菜单选项。\n[0027] 对于上述实施方式的一种替换,所述的无线传输技术也可以是蓝牙技术,语音信号和控制信息通过蓝牙技术进行传输。
法律信息
- 2015-10-14
未缴年费专利权终止
IPC(主分类): H04N 21/41
专利号: ZL 200810030253.8
申请日: 2008.08.19
授权公告日: 2012.04.18
- 2012-04-18
- 2009-03-04
- 2009-01-14
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |