著录项信息
专利名称 | 带有可下载话音命令集的话音控制的遥控装置 |
申请号 | CN01802485.8 | 申请日期 | 2001-08-10 |
法律状态 | 权利终止 | 申报国家 | 中国 |
公开/公告日 | 2003-01-01 | 公开/公告号 | CN1389064 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | 暂无 | IPC分类号 | 暂无查看分类表>
|
申请人 | 皇家菲利浦电子有限公司 | 申请人地址 | 荷兰艾恩德霍芬
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 皇家菲利浦电子有限公司 | 当前权利人 | 皇家菲利浦电子有限公司 |
发明人 | W·勒梅;J·M·诺瓦克 |
代理机构 | 中国专利代理(香港)有限公司 | 代理人 | 程天正;张志醒 |
摘要
用于控制电子设备的遥控装置,包括:用于检测口头命令数据的话筒,用于执行使用模板数据来识别由所述话筒检测的口头命令的语音识别算法和控制所述电子设备的处理器,用于从外部存储装置或网络接收模板数据以便使得该遥控装置能够识别口头命令的接收器,用于存储所述选定的和接收的模板数据的存储器。
1.用于控制一个电子设备的遥控装置,包括:
用于检测口头命令数据的话筒;
用于执行使用模板数据来识别由所述话筒检测的口头命令的语音 识别算法和控制所述电子设备的处理器;
接收来自一个数据库的模板数据以使得该遥控装置能够识别口头 命令的接收器;以及
存储所述接收的模板数据的存储器,由此识别新的口头命令所需 的新模板数据被首先从一组存储在该数据库中的命令中选出,然后被 下载和存储到该遥控装置中;
其特征在于,该数据库可以由一个被链接到互联网的电视机显 示,并且该选出的模板被通过互联网下载以及从电视机无线地发送到 该遥控装置。
2、按照权利要求1的遥控装置,其中该用户可以滚动可检测口头 命令的显示列表并删除不再被需要的命令,由此该附属的模板数据被 从所述存储器中擦除。
3、用于控制电子设备的方法,包括以下步骤:
检测口头命令数据的检测步骤;
执行使用模板数据来识别由所述检测步骤检测的口头命令和控制 所述电子设备的执行步骤;
接收来自一个数据库的模板数据以使得能够识别口头命令的接收 步骤;以及
将所述接收的模板数据存储在存储器中的存储步骤,由此识别新 的口头命令所需的新模板数据被首先从一组存储在该数据库中的命令 中选出,然后被下载和存储到该存储器中;
其特征在于,该数据库可以由一个被链接到互联网的电视机显 示,并且该选出的模板被通过互联网下载以及从电视机无线地发送到 该存储器。
4、按照权利要求3的方法,其中用户可以滚动可检测口头命令的 显示列表并删除不再被需要的命令,由此该附属的模板数据被从所述 存储器中擦除。
技术领域\n本发明总地涉及一个具有语音接口的遥控装置,以及更具体地涉及 一个用于观看和收集信息及电影的电视机或者电子设备的遥控装置。\n背景技术\n必须在遥控装置中实施的特征(诸如实施的语音识别)的数目不断 增加。今天遥控装置不再控制仅仅一个电子设备。而是一个遥控装置被 用于去控制不同的电子设备,诸如电视机、VCR和圆盘式卫星接收机。 那些电子设备通过实施更有价值的、类似例如图文电视和互联网通信能 力的特征而正变得越来越复杂。因而遥控装置可执行的命令数目也不断 增加。特征和命令的增加一般会导致键盘上越来越多的键,这会使遥控 装置更大和更笨重。\n语音识别看来是对上述问题的解决方案。而语音识别本身的问题是 语音识别算法非常消耗存储空间。所以遥控装置仅能够识别几个口头命 令。近来已经开发出一种话音操作的遥控系统,它采用话音控制命令, 以取代通过键输入的控制命令。该话音操作的遥控系统有一个装在发送 器上用于将话音命令转换成电子话音信号的话筒,以及用于生成对应于 由话音信号代表的话音模式的遥控信号的语音识别LSI(大规模集成)电 路。这样生成的遥控信号被传送到受控电子设备中的接收器。在该系统 中,事先登记有对应于由操作员给出的话音命令的标准模式数据。这个 系统有一个与说话者无关的识别且在美国专利第5,774,859号中描述。对 于与说话者无关的识别系统,模板已经被存储在语音识别器的存储器中 (“预训练”)。该模板正常地通过对大量的说话者进行平均,覆盖不 同的音调、方言等而获得。这种解决方案的很大的优点在于:不同的使 用者可以使用该话音命令。其缺陷是缺乏个性化和固定的语言。命令是 由遥控装置制造者选定的。对于诸如“静音”、“调大音量”或者“一 频道”的标准命令而言,这可能是便利的,但是它可能不允许用户选择 多个宏。当命令被预训练(这意味着语言是固定的)时,必须为不同的 国家生产不同的遥控装置,从而导致更大和更昂贵的多样性。\n另一种概念是与说话者有关的识别。这种遥控装置在美国专利第 5,199,080号中给出。该话音操作的遥控系统传送一个遥控信号以响应话 音命令,该话音命令由所实施的语音识别来辨别。该语音识别电路有一 个标准模式数据存储单元用于存储相对各个话音命令的多个标准模式数 据。输入的话音命令被与多个标准模式数据比较以便进行精确的语音识 别。该系统包括一个学习单元,用于自动地更新所存储的标准模式数据 以响应新输入的话音命令的模式数据中的改变。该系统还可以被训练用 于新说出的命令。诸如美国专利第5,199,080号中所描述系统的、与说话 者相关的识别的主要优点是:用户可以训练他想要用作话音命令的、以 他希望的任何语言给出的单词。通常地,这以两次发出一个单词的音为 基础。然后语音识别器从捕获的单词中提取特征,并且将该模式作为模 板存储在一个非易失性的存储器中。与说话者相关的识别的另一个优点 是高度的个性化。语音识别器将以很高的可靠性识别训练它们的用户的 命令。但它将几乎总是拒绝由另一个说话者说出的相同的命令。因而与 说话者相关的识别的缺点在于:该系统在能够使用话音命令之前必须被 训练,这总是很费时间的,以及不允许诸如家庭成员的不同用户使用该 遥控装置。由不同用户训练该遥控装置是不可能的,因为每个被训练的 单词用完了有限存储空间。\n发明内容\n本发明将一个语音识别接口添加到一个遥控装置,后者将与说话者 有关和与说话者无关的语音识别的优点组合起来。\n一个完整的话音数据库可能例如运行在一个PC、电视机、机顶盒 (STB)上或者通过例如互联网或者任何其它的广域网的网络可接入。该 数据库可存储在供应给该遥控装置的一个光盘(CD-ROM)或者其它存 储介质上。在这种情况下,将经由一个本地下载设备,例如PC、电视机、 机顶盒(STP)或者受控电子设备,来进行下载。\n使用网络来接入该数据库,则首先经由一个类似受控电子设备或者 PC、电视机、机顶盒(STB)的接入设备来从网络取回模板,并且接着 下载该模板到该遥控装置—可能在该模板已经经由一个本地通信系统从 互联网接入设备分发到该下载设备之后。\n该数据库类似多语言的字典,存储所有种类的不同命令或者单词。 通过便利的用户接口,通过搜索功能等,用户可以从他优选语言的字典 中选择一组单词。该数据库以话音模板的数据库为特征,并且查找所选 单词的声音的模板。这些模板接着通过一条有线或者无线的链路被传递 给遥控装置。作为从一个基于PC的字典软件中选择单词的替代,也可能 使用一个由受控电视机显示的互联网业务数据库。所需要的话音命令然 后可以通过该遥控装置选择,并且接着从通过互联网接收该模板数据的 电视机传递给该遥控装置。\n本发明的优点是:用户有很高的自由度来通过选择语言、挑选单词、 改变单词而快速地定制遥控装置,用户可以总是或者自动地下载最复杂 的模板用于他需要的话音命令。该系统是一个与说话者无关的系统,这 意味着所有家庭成员可以使用该选定的话音命令而无需训练语音识别。 该遥控装置可以作为一个在所有国家都相同的“空”设备被销售。\n本发明的另一个方面是用户可以下载一个单词的字母代表,它属于 一个或者多个话音模板,可以在遥控装置的LCD上显示。这可能帮助用 户滚动被训练命令的列表,以擦除某些不再被需要的命令。\n附图说明\n当结合其中借助说明性示例显示本发明优选实施例的附图时,本发 明上述的目的、特征和优点将从以下说明中变得更明显。\n图1是一个可编程遥控装置的框图;\n图2是该可编程遥控装置的详细框图。\n具体实施方式\n图1显示了一个可编程遥控装置1的框图。可编程意味着可以从一 个数据库2、2a或者20下载一组模板(数据)到该遥控装置1的存储器 中,以便使得该遥控装置1能够识别特定的口头命令。编程可用通过PC4 来完成,PC4在类似光盘(CD)或者硬盘驱动器的本地存储装置上存储 该数据库2。PC4从数据库2通过数据总线3接收数据。用户可以通过一 个便利的用户接口选择例如一个运行在PC4上的程序、代表该口头命令 的一组单词,并且将它们链接到在语音识别已经识别所述口头命令之后 应由该遥控装置生成并且传送到某个电子设备的信号。该模板数据可以 通过使用红外光的无线链路11或者通过一个传输电缆(未显示)从PC4 传递到遥控装置1。\n作为对使用一个本地数据库的替代,数据库2a、20可以是外部的, 并且可以通过互联网和/或电话线路9或者其它类似电视广播7、21的通 信信道接入。数据库2的项可以从由可编程遥控装置1控制的远程PC10、 电视机8或者机顶盒19中选择。PC10、电视机8或者机顶盒19之间的 通信是无线地实现的,这由参考数字11指示。\n很多不同的设备被利用来对该遥控装置1编程。有可能遥控装置的 存储的话音可激活命令由遥控装置自身的显示器来显示以便擦除、添加 或者改变该链接和命令。也可能是该遥控装置的存储的话音可激活命令 在PC4、10或者电视机8上显示。所以,存储的数据首先被传递给所使 用的显示设备。在按了该遥控装置的某个键或者一个特定的口头命令之 后。这个特定命令的模板数据可能是非用户可擦除的。在对可检测命令 集重新编程之后,该新模板数据以及如果希望,对于各个可检测口头命 令的字母数字表示被在该遥控装置1的存储器中传递。显然,那些未改 变的可检测命令的模板数据没有被传递,以便缩短传送该模板数据所需 的时间。\n图2显示了该可编程遥控装置1的详细框图。该遥控装置包括一个 发送单元12,用于使用红外(IR)或者RF将遥控命令无线地传送给诸 如电视机、VCR、机顶盒或者PC的受控电子设备。该遥控装置可以包括 一个单独的模板接收器22,它可能也例如经由IR或者RF而无线地操 作。该遥控装置用模板接收器22从外部数据库接收模板数据。在本发明 的另一个优选实施例中,该遥控装置使用一个发送器12来接收该模板数 据并且将控制命令传送给受控的电子设备。\n该遥控装置1的操作由一个中央处理单元(CPU)13来控制。接收 的模板数据和类似用于该可检测口头命令的字母数字表示的额外数据由 CPU13存储在存储器15中。该CPU13生成用于控制外部电子设备的远 程信号,该信号对应于由话筒16检测并由语音识别处理器14分析的话 音信号代表的话音模式。语音识别处理器14比较该话音模式和所存储的 模板数据,以便检测该口头命令。该遥控装置1可以包括一个键盘18和 一个显示器17。\n本发明可以以其它特定形式实现,而不偏离其精神或者必要特性。 本实施例因而被认为是在各方面都是说明性的而非限制的。
法律信息
- 2008-10-08
专利权的终止(未缴年费专利权终止)
专利权的终止(未缴年费专利权终止)授权公告日:2005.4.6
- 2005-04-06
- 2003-01-01
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有引用任何外部专利数据! |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |