著录项信息
专利名称 | 一种家电用声控遥控器及其控制方法 |
申请号 | CN201210234836.9 | 申请日期 | 2012-07-06 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2012-10-31 | 公开/公告号 | CN102760432A |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G10L15/02 | IPC分类号 | G;1;0;L;1;5;/;0;2;;;G;1;0;L;1;5;/;0;8;;;G;0;8;C;2;3;/;0;4查看分类表>
|
申请人 | 广东美的制冷设备有限公司 | 申请人地址 | 广东省佛山市顺德区北滘镇林港路
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 广东美的制冷设备有限公司 | 当前权利人 | 广东美的制冷设备有限公司 |
发明人 | 卢军;向阳;陈明瑜 |
代理机构 | 佛山市粤顺知识产权代理事务所 | 代理人 | 唐强熙 |
摘要
本发明公开了一种家电用声控遥控器及其控制方法,包括显示屏、按键、红外发射单元和主控芯片,显示屏、按键、红外发射单元分别与主控芯片连接,还包括语音模块和遥控模块,语音模块包括拾音单元、语音处理芯片、存储单元和发声部件构成,遥控模块包括主控芯片与射频发射单元连接构成,或主控芯片与红外发送单元连接构成,或主控芯片与射频发射单元、红外发送单元三者连接构成;语音处理芯片和主控芯片之间通过通讯接口连接;拾音单元通过放大电路与语音处理芯片连接,存储单元通过读写端口和语音处理芯片连接,语音处理芯片通过功放单元和发声部件连接。它具有便捷、耐用,能通过语音识别方式将用户的语音命令首先解析成家电可以识别的控制命令。
1.一种家电用声控遥控器的控制方法,其特征是包括以下步骤:
步骤一:用户对着拾音器(5)用声音发出家电的控制命令,拾音器将声音信号变换为电信号,经放大后传送到语音处理芯片(7)中,语音处理芯片(7)将存储单元(3)中的语音音素库(31)与语音信息库(32)读取到语音处理芯片(7)中;
步骤二:语音识别单元(72)将收到的语音信息进行处理,提取出用户所发声音的音素特征值,将该音素特征值与语音音素库(31)中的特征值进行比对,筛选出相似度超过阀值F的语音命令词条N;
步骤三:当相似度超过阀值F时,判断用户发出的语音命令就是语音命令词条N,当相似度超过阀值F的有多条语音命令N1、N2、N3、......,则取相似度最高的那条语音命令词条为用户发出的语音命令N;
步骤四:同时语音合成单元(71)根据语音命令N对应的提示语音信息,查找语音信息库(32)中对应的语音元素并进行合成,发出与语音命令N对应的提示语音信息,通过发声部件(4)发出对应的语音信息提醒用户;
步骤五:当相似度都不超过阀值F时,判断该命令为无效的语音命令,语音合成单元(71)根据无效的语音命令对应的提示语音信息,查找语音信息库(32)中对应的语音元素并进行合成,发出与无效的语音命令对应的提示语音信息,通过发声部件(4)发出对应的语音信息,提醒用户重发语音命令;
步骤六:当语音识别单元(72)判断用户所发的语音是方言时,系统会自动使用对应的方言进行语音发声提示;
步骤七:语音命令词条N查找出命令码库(74)中对应的命令码M,将命令码M通过公知的通讯接口发送给主控芯片(9),主控芯片(9)收到命令码M后根据控制协议(91)进行命令解析,解析成具体的家电控制命令,通过射频发射单元(10)和/或红外发送单元(11)向家电发出控制命令。
2.根据权利要求1所述的一种家电用声控遥控器的控制方法,其特征在于:对于使用射频发射单元(10)的系统,家电产品收到遥控命令后通过射频收发单元(10)反馈一个状态信息给声控遥控器的主控芯片(9),主控芯片(9)将该信息根据控制协议(91)解析成对应的语音信息码X,并通过公知的通讯接口传送给语音处理芯片(7);语音合成单元(71)将语音信息码X变换成对应的语音信息,查找语音信息库(32)中对应的语音元素并进行合成,将合成好的语音通过发声部件(4)发出对应的声音提醒用户,实现用户和家电之间的语音交互。
3.根据权利要求1所述的一种家电用声控遥控器的控制方法,其特征在于:使用双路拾音器时,语音处理芯片(7)将得到的两路语音信息进行差分处理,消除环境中的噪音,然后进行语音识别。
一种家电用声控遥控器及其控制方法\n技术领域\n[0001] 本发明涉及家电遥控的技术领域,具体涉及家电的语音识别遥控技术领域。\n背景技术\n[0002] 遥控器是一种用来远控机械的装置,主要由集成电路板和用来产生不同信息的按键组成。目前使用的家电用遥控器主要是通过按键输入信息,通过集成电路板中的红外遥控来进行控制家电产品。但按键往往在长时间使用后,会出现接触不灵敏等现象。同时,按键上的标志字迹也会逐渐被磨损而显示不清,这就给视力较差的使用者,尤其是老年人,带来诸多不便,从而影响遥控器的使用。而且,现有家电用遥控器都是通过按键、出口界面进行人机交互的,没有使用声音进行人机交互的。因此,有必要作进一步改进。\n发明内容\n[0003] 本发明的目的旨在提供一种便捷、耐用,能通过语音识别的方式将用户的语音命令首先解析成家电可以识别的控制命令,然后进行遥控控制的家电用声控遥控器及其控制方法,以克服现有技术中的不足之处。\n[0004] 本发明的目的是这样实现的。\n[0005] 一种家电用声控遥控器,包括显示屏、按键、红外发射单元和主控芯片,显示屏、按键、红外发射单元分别与主控芯片连接,还包括语音模块和遥控模块,语音模块包括拾音单元、语音处理芯片、存储单元和发声部件构成,遥控模块包括主控芯片与射频发射单元连接构成,或者,主控芯片与红外发送单元连接构成,或者,主控芯片与射频发射单元、红外发送单元三者连接构成;\n[0006] 语音处理芯片和主控芯片之间通过通讯接口连接;拾音单元通过放大电路与语音处理芯片连接,存储单元通过读写端口和语音处理芯片连接,语音处理芯片通过功放单元和发声部件连接。\n[0007] 还包括有电池单元和电源单元,电池单元包含可充电电池、可充电电池的充电电路、充电电路与外部连接的接口单元;电源单元将电池单元的单一电压变换成多路电压,每路电压值在1.2V到10V之间,向本遥控器的功能单元电路供电;本声控遥控器使用的电子单元电路较多,需要的电源各不相同,涉及到+1.2V、+1.5V、+3V、+5V等多种电源,具体的要与所选择的单元电路与电子器件有关。\n[0008] 在电池单元1和电源单元2之间还可以增加一个电源开关,用于控制声控遥控器的电源的通断,在不用遥控器时断开声控遥控器的电源,以降低声控遥控器的耗电。\n[0009] 上述技术方案还可作下述进一步完善。\n[0010] 拾音单元5可以包含一个拾音器单元,此时,对周围的环境噪音或较远处的无关人员的语音无法有效滤除;易受杂音干扰。\n[0011] 拾音单元为一个拾音器单元,或者两个拾音器单元;其中拾音单元为两个拾音器单元时两路拾音器的特性完全一致,拾音器的拾音方向、放置的腔体与安放方式也保持一致,其输出分别通过与各自连接的放大电路独立连接到语音处理芯片。\n[0012] 红外发射单元可以是单个红外发射电路,此时使用声控遥控器时需要将遥控器的红外发射头对准需要遥控的家电;还可以包含两路或以上红外发射电路,并且每路发射电路中红外发射头所指的方向各不相同,这样遥控器的红外发射头所覆盖的范围就很宽,即使是任意放置,也一定会有一个红外发射头对准需要遥控控制的家电,使用红外遥控方式可以是声控遥控器兼容大量的已经上市的家电产品,实现声控遥控器对普通的红外遥控家电产品的声控遥控功能。\n[0013] 射频收发单元和红外发射单元可以根据需要取消其中的一个功能单元。当不需要兼容时就可以仅选择其中的一种。\n[0014] 与拾音单元连接的放大电路是独立的放大电路,或者是集成到语音处理芯片中,或者集成到拾音器中;拾音单元还可以是数字化的拾音器,将声音信号直接变换为数字信号并通过通讯接口传送到语音处理芯片中。\n[0015] 存储单元包括语音音素库、语音信息库;语音音素库包含了用于语音控制的所有语音命令的音素特征值,用于语音识别之用;语音信息库包含了所有的用于语音信息提示用的语音单元元素信息,用于合成提示信息的发声语音。\n[0016] 语音音素库包含了用于语音控制的所有语音命令的音素特征值,用于语音识别之用;每句语音都是由多个发音音素组成的,单个字的发音就可以构成一个音素,但有时单个发音音素的识别率较低;多个字的发音也可以构成一个音素,使用多个字的发音音素的识别率会比使用单个字的发音音素的识别率高很多,可以达到100%的识别率;故音素是声音识别的基本单元,它可以是一个字,也可以是多个字。语音识别就是通过算法提取语音信号的音素特征值,并将该特征值与语音音素库中的已有特征值进行相似性比对,进而完成语音识别。\n[0017] 语音信息库包含了所有的用于语音信息提示用的语音单元元素信息,用于合成提示信息的发声语音。语音单元元素可以是一个字,比如:冷,也可以是一个词,比如:制冷、故障,当将语音单元元素按照一定的顺序依次发出,就构成了一句完整的、意思明确的话语,就是语音合成。\n[0018] 语音音素库中包含符合普通话发音特征和习惯的语音识别音素特征,还可以包含符合中国一种或以上方言发音特征和习惯的语音识别音素特征;语音信息库相应的包含符合普通话发音特征的语音单元元素,还可以包含符合中国一种或以上方言发音特征的语音单元元素。发音特征和习惯是因人因地而异的,比如说:“先走”,广东人说:“走先”,意思一样,语序不同,还比如:“吃饭”,广东人说:“食饭”,意思一样但字不一样,还比如:“开空调”,也可以说“开制冷”,还可以说“打开空调”,等等。这就要求语音音素符合人们的发音特征及用语习惯。\n[0019] 语音信息库32相应的包含符合普通话发音特征的语音单元元素,还可以包含符合中国一种或以上方言发音特征的语音单元元素。当使用普通话进行语音控制时,对应的提示语音就是普通话,若使用方言进行语音控制时,对应的提示语音就是对应的同种方言。\n[0020] 还包括语音处理芯片包含语音合成单元、语音识别单元、语音命令词条库、命令码库,主控芯片包含控制协议。\n[0021] 所述语音命令词条库中的一条语音命令词条对应命令码库中的一条命令码,还可以是语音命令词条库中的多条语音命令词条对应命令码库中的一条命令码。\n[0022] 特别地,语音命令词条库中的多条语音命令词条对应命令码库中的一条命令码;\n比如:语音命令“开机”、“开空调”、“开制冷”、“打开空调”,都对应唯一的一条开机命令码。\n[0023] 语音处理芯片和主控芯片集成为同一主控芯片内。\n[0024] 一种家电用声控遥控器的控制方法,其特征在于:对于使用射频发射单元的系统,家电产品收到遥控命令后通过射频收发单元反馈一个状态信息给声控遥控器的主控芯片,主控芯片将该信息根据控制协议解析成对应的语音信息码X,并通过公知的通讯接口传送给语音处理芯片;语音合成单元将语音信息码X变换成对应的语音信息,查找语音信息库中对应的语音元素并进行合成,将合成好的语音通过发声部件发出对应的声音提醒用户,实现用户和家电之间的语音交互。\n[0025] 使用双路拾音器时,语音处理芯片将得到的两路语音信息进行差分处理,消除环境中的噪音,然后进行语音识别。\n[0026] 本发明的有益效果是。\n[0027] 本发明实现家电产品使用语音进行交互和控制,同时红外发射单元的使用,还可以兼容已有的普通家电产品的语音遥控,双路拾音器的使用可以有效的消除环境杂音的干扰,有效提高语音的识别率,可充电电池的使用可以有效应对本遥控器的较大的功率消耗,满足用户的日常使用而不必经常更换电池;本遥控器语音识别中对方言的兼容,方便仅能讲方言人士的使用。\n附图说明\n[0028] 图1为本发明的原理框图;\n[0029] 图2为本发明第一实施例的原理框图;\n[0030] 图3为第二实施例的原理框图。\n具体实施方式\n[0031] 下面结合附图对发明作进一步详述。\n[0032] 第一实施例:\n[0033] 参见图1-图2,一种家电用声控遥控器,包括显示屏、功能按键、电池单元1和电源单元2,还包括拾音单元5、语音处理芯片7、存储单元3、发声部件4构成的语音功能部,主控芯片9、射频收发单元10和/或红外发射单元11构成的遥控功能部,语音处理芯片7和主控芯片9之间一体设置或通过公知的通讯接口连接;拾音单元5通过放大电路6或直接与语音处理芯片7连接,存储单元3通过读写端口和语音处理芯片7连接,语音处理芯片7通过功放单元8和发声部件4连接,功能按键、显示屏、射频收发单元10和/或红外发射单元11分别与主控芯片9连接。\n[0034] 声控遥控器的电源部分包括:电池单元1和电源单元2,电池单元1包含4.2V电压的可充电电池、可充电电池的充电电路、充电电路与外部连接的接口单元,该接口单元可以连接外部的充电电源适配器,实现对可充电电池的充电功能;电源单元2将电池单元1的单一4.2V电压变换成多路电压:1.8V、3.3V、5V三路电源。\n[0035] 在电池单元1和电源单元2之间有一个电源开关K1,用于控制声控遥控器的电源的通断,在不用遥控器时断开声控遥控器的电源,以降低声控遥控器的耗电。\n[0036] 拾音单元5为数字拾音器,并通过通讯接口直接和语音处理芯片7相连,将声音信号直接变换为数字信号并通过通讯接口传送到语音处理芯片7中。\n[0037] 红外发射单元11是单个红外发射电路,使用声控遥控器时需要将遥控器的红外发射头对准需要遥控的家电。\n[0038] 存储单元3为非易失性存储器,包括语音音素库31、语音信息库32。\n[0039] 语音音素库31包含了用于语音控制的所有语音命令的音素特征值,用于语音识别之用;每句语音都是由多个发音音素组成的,单个字的发音就可以构成一个音素,但有时单个发音音素的识别率较低;多个字的发音也可以构成一个音素,使用多个字的发音音素的识别率会比使用单个字的发音音素的识别率高很多,可以达到100%的识别率;故音素是声音识别的基本单元,它可以是一个字,也可以是多个字。语音识别就是通过算法提取语音信号的音素特征值,并将该特征值与语音音素库中的已有特征值进行相似性比对,进而完成语音识别。语音信息库32包含了所有的用于语音信息提示用的语音单元元素信息,用于合成提示信息的发声语音。语音单元元素可以是一个字,比如:冷,也可以是一个词,比如:制冷、故障,当将语音单元元素按照一定的顺序依次发出,就构成了一句完整的、意思明确的话语,就是语音合成。\n[0040] 语音音素库31中包含符合普通话发音特征和习惯的语音识别音素特征,还包含广东方言的发音特征和习惯的语音识别音素特征,比如说:“先走”,广东人说:“走先”,意思一样,语序不同,还比如:“吃饭”,广东人说:“食饭”,意思一样但字不一样,还比如:“开空调”,也可以说“开制冷”,还可以说“打开空调”,等等。这就要求语音音素符合人们的发音特征及用语习惯。语音信息库32相应的包含符合普通话发音特征的语音单元元素,还包含广东方言发音特征的语音单元元素。当使用普通话进行语音控制时,对应的提示语音就是普通话,若使用广东方言进行语音控制时,对应的提示语音就是广东方言。\n[0041] 语音处理芯片7包含语音合成单元71、语音识别单元72、语音命令词条库73、命令码库74,主控芯片9包含控制协议91。\n[0042] 语音合成单元71是一个算法单元,实现将语音提示信息合成为一个完整的、意思明确的话语。语音识别单元72也是一个算法单元,实现将语音命令识别并转化为控制命令。\n[0043] 语音命令词条库73包含了所有可以用于控制的语音命令,一条语音命令词条对应命令码库74中的一条命令码,比如语音命令“开机”,对应一条开机命令码。特别地,语音命令词条库73中也存在多条语音命令词条对应命令码库74中的一条命令码;比如:语音命令“开机”、“开空调”、“开制冷”、“打开空调”,都对应唯一的一条开机命令码。\n[0044] 家电用声控遥控器的控制方法是:\n[0045] 用户对着拾音单元5用声音发出家电的控制命令,比如“开机”语音命令,拾音器将声音信号变换为电信号,通过通讯接口传送到语音处理芯片7中,语音处理芯片7将存储单元3中的语音音素库31与语音信息库32读取到语音处理芯片7中;\n[0046] 语音识别单元72将收到的语音信息进行处理,提取出用户所发声音的音素特征值,将该音素特征值与语音音素库31中的特征值进行比对,筛选出相似度超过阀值F的语音命令词条N;\n[0047] 当相似度超过阀值F时,判断用户发出的语音命令就是语音命令词条N,当相似度超过阀值F的有多条语音命令N1、N2、N3、……,则取相似度最高的那条语音命令词条为用户发出的语音命令N,即“开机”语音命令;\n[0048] 同时语音合成单元71根据语音命令N对应的提示语音信息,查找语音信息库32中对应的语音元素并进行合成,发出与语音命令N对应的提示语音信息,通过发声部件4发出对应的语音信息提醒用户:“您发出的是开机命令”;\n[0049] 当相似度都不超过阀值F时,判断该命令为无效的语音命令,语音合成单元71根据无效的语音命令对应的提示语音信息,查找语音信息库32中对应的语音元素并进行合成,发出与无效的语音命令对应的提示语音信息,通过发声部件4发出对应的语音信息,提醒用户重发语音命令“无法识别,请重复”;\n[0050] 当语音识别单元72判断用户所发的语音是广东方言时,系统会自动使用广东方言进行语音发声提示;\n[0051] 语音命令词条N查找出命令码库74中对应的命令码M,比如:语音“开机”命令对应开机命令码,将命令码M通过公知的通讯接口发送给主控芯片9,主控芯片9收到命令码M后根据控制协议91进行命令解析,比如:将开机命令码解析成家电可以接收的遥控控制码,通过红外发送单元11向家电发出开机命令。\n[0052] 第二实施例:\n[0053] 参见图3,本实施例与第一实施例的不同之处在与拾音单元5采用双路拾音器单元、用射频收发单元10代替红外发射单元11、及主控芯片9与语音处理芯片7合并成一个主控芯片9。其中拾音单元5包括拾音器单元51和拾音器单元52,两路拾音器的特性完全一致,拾音器的拾音方向保持一致、放置的腔体形状一样、拾音器的安放方式也保持一致,其输出分别通过放大电路61和放大电路62独立连接到语音处理芯片7。\n[0054] 主控芯片9包含语音合成单元71、语音识别单元72、语音命令词条库73、命令码库\n74、控制协议91,即将语音处理芯片功能和主控功能合并到一个主控芯片9中。\n[0055] 本实施例使用射频收发单元10,家电产品收到遥控命令后通过射频收发单元10反馈一个状态信息给声控遥控器的主控芯片9,主控芯片9将该信息根据控制协议91解析成对应的语音信息码X,语音合成单元71将语音信息码X变换成对应的语音信息,查找语音信息库32中对应的语音元素并进行合成,将合成好的语音通过发声部件4发出对应的声音提醒用户,实现用户和家电之间的语音交互。主控芯片9将得到的两路语音信息进行差分处理,消除环境中的噪音,然后进行语音识别。其它部分的工作原理同第一实施例类似,不再敷述。\n[0056] 本发明不只限于上述实例,在本发明的实质范围内,做出的变化、改型、增加或者替换(如采用含一个拾音器单元的拾音单元5,此时,对周围的环境噪音或较远处的无关人员的语音无法有效滤除,易受杂音干扰;或将与拾音器连接的放大电路集成到语音处理芯片7或拾音器中;或红外发射单元11包含有两路以上红外发射电路等),也属于本发明的保护范围。
法律信息
- 2015-08-19
- 2012-12-19
实质审查的生效
IPC(主分类): G10L 15/02
专利申请号: 201210234836.9
申请日: 2012.07.06
- 2012-10-31
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2007-06-06
|
2006-12-15
| | |
2
| |
2012-02-08
|
2011-07-14
| | |
3
| | 暂无 |
2011-06-14
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |