著录项信息
专利名称 | 家电语音控制器 |
申请号 | CN200920209937.4 | 申请日期 | 2009-09-23 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | | 公开/公告号 | |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | 暂无 | IPC分类号 | 暂无查看分类表>
|
申请人 | 上海大屯能源股份有限公司 | 申请人地址 | 上海市浦东南路256号华夏银行大厦12楼
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 上海大屯能源股份有限公司 | 当前权利人 | 上海大屯能源股份有限公司 |
发明人 | 于坤;王建贵 |
代理机构 | 暂无 | 代理人 | 暂无 |
摘要
本实用新型公开了一种家电语音控制器,涉及家电控制领域。单片机以及分别与单片机连接的键盘电路、语音录入电路、放音电路共同组成了单片机控制系统,电源电路给单片机控制系统供电,单片机控制系统输出连接家电控制电路。单片机对声音进行实时监控,并完成语音的识别、声音的存储和回放。采用对特定人语音的识别来控制家电,即系统首先通过训练,然后根据训练结果完成识别。I/OA口作为键盘输入以完成训练、留言、擦除等功能,I/OB口作为输出完成对家电的控制。本实用新型的有益效果是:操作简单并配有语音提示、体积小、价格便宜,适用于各种家电的语音控制。
家电语音控制器\n技术领域\n[0001] 本实用新型涉及家电控制领域,具体是一种家电语音控制器,可以完成对数字量以及模拟量的控制,因此可用作电视机、空调、冰箱等各种家电的控制中心。\n背景技术\n[0002] 目前智能化设备的迅速发展,并且得到了广泛的应用,家用电器业开始朝着智能的方向发展。智能化、人性化已成为目前衡量一个家电性能的重要指标,方便自然已成为人们的重要追求,但是目前家电设备的控制方式给用户的使用带来诸多不便。利用语音识别技术实现语音控制是提高家电产品人性化、智能化的重要途径之一\n[0003] 语音识别技术自从引入了隐马尔可夫模型(HMM)之后,识别率有了很大的提高,尤其是在孤立词和连接词识别中,识别率达到95%以上,基本达到实用的水平。但是因为语音识别的计算量非常大,难以实现,因此一直制约着应用。目前对语音识别的应用并不是很多,尤其是家用电器这个行业。\n发明内容\n[0004] 为了解决现有家电设备的控制方式给用户的使用带来的诸多不便,本实用新型提供一种用语音来控制家用电器的设备,用户只需说出指令即可通过该设备控制家用电器完成相应的动作。\n[0005] 本实用新型采取的技术方案是:一种家电语音控制器,主要由给单片机控制系统供电的电源模块、单片机控制系统,连接在家电设备和单片机输出端口之间的家电控制电路组成;单片机控制系统由具有语音识别功能的单片机,与单片机连接的键盘电路、语音录入电路、放音电路组成。\n[0006] 工作原理是:通过语音录入电路把声音录入单片机中,单片机对声音进行实时监控,并完成语音的识别、声音的存储和回放。采用对特定人语音的识别控制家电,即系统首先通过训练,然后根据训练结果完成识别。单片机I/OA口作为键盘输入以完成训练、留言、擦除等功能,I/OB口作为输出完成对家电的控制。\n[0007] 本实用新型的有益效果:操作简单并配有语音提示、体积小、价格便宜、控制方便灵活,适用于各种家电的语音控制。\n附图说明\n[0008] 图1是本实用新型电原理框图;\n[0009] 图2是基于HMM的孤立字或词识别流程图;\n[0010] 图3是硬件电路原理图;\n[0011] 图4是主程序流程图;\n[0012] 图5是语音辨识原理框图;\n[0013] 图6是辨识程序流程图;\n[0014] 图7是语音播放与识别中断服务程序流程图。\n具体实施方式\n[0015] 如图1所示,基于单片机和语音辨识技术的嵌入式智能控制系统,单片机以及分别与单片机连接的键盘电路、语音录入电路、放音电路共同组成了单片机控制系统,电源模块给单片机控制系统供电,单片机控制系统输出连接家电控制电路。\n[0016] 如图2所示,在嵌入式语音命令辨识系统中,既要保证识别的正确率,又要受到存储空间的限制,所以采用了离散的隐马尔可夫模型(DHMM)对孤立字或词的识别,即对每一个孤立字或词用HMM加以描述,并通过训练来完成。特征提取可采用线性预测倒谱系数作为特征矢量,用Viterbi识别算法进行模板的匹配。\n[0017] 如图3所示,主控元件单片机采用凌阳SPCE061A单片机,属于凌阳u’nSPTM系列产品的微控制器,主要作用是实现语音的训练和识别、语音的播放,并完成对周边电路的控制。SPCE061A是具有DSP功能的十六位单片机,有较高的处理速度,能够容易的处理复杂的数字信号,也适于数字语音识别应用,并且具有内置自动增益控制功能的麦克风输入方式、双通道10位DAC方式的音频输出功能和32位可独立编程的I/O接口,具有很强的控制能力。SPCE061A的I/OB口的输出对家电的开关动作进行控制。\n[0018] 电源模块采用正5V直流电源供电,5V直流电压经过电压调整元件SPY0029后给整个系统供电。VDDH为SPCE061A单片机的I/O电平参考,接SPCE061A单片机的51脚,这种接法使得I/O输入输出高电平为3.3V;VDDP为PLL锁相环电源,接SPCE061A单片机的7脚;VDD和VDDA为数字电源,分别接SPCE061A单片机的15脚和36脚;AVSS1是模拟地,接SPCE061A单片机的24脚;VSS是数字地,接SPCE061A单片机的38脚;AVSS2接音频输出电路的AVSS2。\n[0019] 在语音录入电路中,AGC接音频录入AGC引脚,OPI接麦克风的第二运放输入脚,MICOUT接麦克风的第一运放输出脚,MICN接麦克风的负向输入脚,MICP接麦克风正向输入脚,VCM接ADC参考电压输出脚,VMIC接麦克风电源。语音信号经麦克风转换成电信号,由隔直电容隔掉直流成分,然后输入至SPCE061A单片机内部前置放大器。SPCE061A单片机内部自动增益控制电路AGC能随时跟踪、监视前置放大器输出的音频信号电平,当输入信号增大时,AGC电路自动减小放大器的增益;当输入信号减小时,AGC电路自动增大放大器的增益,以便使进入A/D的信号保持在最佳电平,又可使削波减至最小。\n[0020] 键盘电路采用I/OA的低八位作为键盘输入,I/OA3-I/OA7目前保留不用。I/OA0为训练按键1,I/OA1为训练按键2,I/OA2位识别键。如有需要可扩展更多,以便完成更为复杂的动作。\n[0021] 在放音电路中,SPCE061A单片机内置了两个DAC通道,均可用于音频输出,DAC1和DAC2输出的模拟电流信号通过DAC1和DAC2管脚输出。DAC的输出范围从0x0000到\n0xFFFF。如果DAC的输出数据被处理成PCM数据,必须让DAC输出数据的直流电平保持为\n0x8000,且仅高10位数据起作用。DAC1和DAC2的输出数据应写入P_DAC1(写)($7017)和P_DAC2(写)($7016)单元。上电复位后,两个DAC均被自动打开。该实施例采用一路信号作为音频输出,另一路作为模拟量的控制信号输出,用于模拟信号的控制,如需多路模拟信号的输出,可采用0832等DAC器件进行外部扩展。\n[0022] 如图4所示,系统初始化之后,就是一个死循环。这个循环里的运作可以分为三部分:键盘扫描、根据键值设置子状态及根据子状态作相应的操作。\n[0023] 系统初始化程序主要完成I/O端口的初始化,键盘扫描的初始化,程序用汇编语言编写。设置I/OA口的低八位为带有下拉电阻的输入口。I/OB口为带上拉电阻的输出口。\n键盘扫描初始化,程序调用I/O端口初始化程序,完成初始化。\n[0024] 内部FLASH的读写程序,32K字的内部FLASH被划分为128个PAGE(每个PAGE存储容量为256字),第一页[0x8000-0x80ff]最后一页为[0xff00-0xffff]。上电以后,芯片就处于读存储单元状态,读存储单元的操作与SRAM相同。\n[0025] 对于特定人声的识别需要经过训练来完成识别前的准备工作,训练完成以后将训练模板保存,识别时调用模板进行匹配,语音辨识原理框图如图5所示。\n[0026] 训练完成以后将训练模板保存即命令序号和播放提示音的序号,训练成功返回0,用C语言编写程序。由于受到片内SRAM存储空间的限制,采用分组识别的方式,以增加识别命令数目。即只有当训练人输入触发命令以后才能进行相应的操作,执行过程中先将触发命令调入SRAM,等识别出触发命令以后再调入其对应的其他命令并完成相应得操作,若没有识别出命令则程序重新返回到初始位置,辨识程序流程图如图6所示。\n[0027] 放音程序,凌阳SPCE061A单片机的音频压缩格式有多种,本系统采用的是SACM_S480,压缩比为80∶3,压缩比较大,音质一般,但占有存储空间小。适用于在嵌入式系统中语音播放。\n[0028] 中断服务程序,凌阳SPCE061A单片机中断系统,可以提供14个中断源,具有两个中断优先级,可实现两级中断嵌套功能。用户可以用关中断指令(或复位)屏蔽所有的中断请求,也可以用开中断指令使CPU接受中断申请。每一个中断源可以用软件独立控制为开或关中断状态,但中断级别不可用软件设置,语音播放与识别中断服务程序流程图如图7所示。\n[0029] I/OB输出控制程序,凌阳SPCE061A单片机的I/OB口为十六位可独立编程的双向输入输出口。设置I/OB的相应的控制寄存器既可完成对I/OB的编程操作实现复杂的控制功能。对某一位的设定都可以通过设定3个基本项(数据向量Data、属性向量AttributI/On和方向控制向量DirectI/On)来完成。3个端口内每个对应的位组合在一起,形成一个控制字,用来定义相应I/O口位的输入输出状态和方式。\n[0030] 由于目前条件的限制,本实施例中只做了两人训练识别,控制两路信号,但是只要需要可以对其进行扩展,完成更复杂的控制功能。系统运行如下:\n[0031] 当设备加电以后,系统开始初始化,播放使用帮助提示音,然后进入键盘扫描程序,并根据按键进入相应的子程序。\n[0032] 当按下一键时,开始按照系统的提示音进行训练,完成之后会把训练结果自动存入FLASH对应的存储单元中去。过程如下:\n[0033] \n提示音 输入语音\n″请输入触发名称″ ″电视″\n提示音 输入语音\n″请输入第一条命令″ ″启动设备1″\n″请输入第二条命令″ ″关闭设备1″\n″请输入第三条命令″ ″启动设备2″\n″请输入第四条命令″ ″关闭设备2″\n″请再说一遍″ (以上提示音每说完一遍出现此命令)\n″没有听到任何声音″ (当没有检测到声音时出现此命令)\n″两次输入名称不相同″ (当两次输入名称不同时出现此命\n令)\n″两次输入命令不相同″ (当两次输入命令差异时出现此命\n令)\n″训练完毕″ (以上三条语句全部训练成功时出\n现)\n[0034] 当按下按键二时,训练方法同按键一,只是将训练结果存入了不同的存储单元中。\n[0035] 当按下按键三时,播放开始识别提示音并将FLASH中触发命令的数据写入到SRAM中去,辨识器初始化并启动实时监控程序,进入辨识子程序。过程如下:\n[0036] \n发布命令 应答/动作\n″电视″ ″请您吩咐″\n″启动设备1″ 将I/OB0置高电平开启设备1\n″关闭设备1″ 将I/OB0置低电平关闭设备1\n″启动设备2″ 将I/OB1置高电平开启设备2\n″关闭设备2″ 将I/OB1置低电平关闭设备2\n[0037] 当到达设定时间仍没有听到触发命令时,系统将重新初始的辨识状态,以便完成其他的动作。需要注意的是在每次提示音结束后2-3秒再输入命令或当上次应答结束2-3秒后再发布命令。\n[0038] 本实用新型是基于凌阳SPCE061A十六位单片机和语音识别技术的嵌入式智能控制系统,既可以控制数字量也可以控制模拟量,有着丰富的输出控制口,具有非常强的控制能力。其最大特色就是可以完成语音对家电的控制。使用户可以用语言控制家电,从而摆脱使用遥控器的麻烦,系统经过进一步改造可以形成家庭的语音控制终端。
法律信息
- 2014-11-12
未缴年费专利权终止
IPC(主分类): G10L 15/00
专利号: ZL 200920209937.4
申请日: 2009.09.23
授权公告日: 2010.06.23
- 2010-06-23
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 1 | | 2012-08-31 | 2012-08-31 | | |
2 | | 2012-08-20 | 2012-08-20 | | |
3 | | 2012-08-31 | 2012-08-31 | | |
4 | | 2014-11-20 | 2014-11-20 | | |