一种对特定人的语音进行自动录制的系统

发明专利无效专利

申请号：
CN200610063732.0
IPC分类号：G11B19/02;G10L17/00
申请日期：
2006-12-31
申请人：
于柏泉

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	一种对特定人的语音进行自动录制的系统
申请号	CN200610063732.0	申请日期	2006-12-31
法律状态	权利终止	申报国家	中国
公开/公告日	2008-07-02	公开/公告号	CN101211615
优先权	暂无	优先权号	暂无
主分类号	G11B19/02 ? IPC结构图谱： G 物理 G9 G部其他 G11 信息存储 G11B 基于记录载体和换能器之间的相对运动而实现的信息存储（以不需要通过换能器重现记录值的方式记录测量值的入G01D 9/00；利用有机械标记的带子，例如，穿孔纸带或利用单元记录卡，如穿孔卡片或具有磁性标记的卡片的记录或重现设备入G06K；将数据从记录载体的一种类型转移到另一种类型上的入G06K 1/18；将重放装置的输出耦合到无线电接收机上去的电路入H04B 1/20；唱机拾音器之类的声音机电传感器或为此所用的电路入H04R） G11B19/00 并非专用于细丝或薄片形记录载体或具有支承物的记录载体的驱动、起动、停动；它们的控制；操作功能的控制 G11B19/02 操作功能的控制，例如，从记录到重现的切换〔4〕	IPC分类号	G;1;1;B;1;9;/;0;2;;;G;1;0;L;1;7;/;0;0查看分类表>
申请人	于柏泉	申请人地址	广东省深圳市车公庙泰然工贸园苍松大厦13A08 变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	于柏泉	当前权利人	于柏泉
发明人	于柏泉
代理机构	深圳市顺天达专利商标代理有限公司	代理人	郭伟刚

摘要

本发明涉及录音领域，提供了一种对特定人的语音进行自动录制的方法、系统及设备。所述方法包括以下步骤：A.对所采集到的语音进行识别，判断其是否为所述特定人的语音，若否则循环采集，若是则执行步骤B；B.对所述采集到的语音进行录制，并保存录制结果。本发明通过建立语音库，在采集到语音数据时则将其与语音库数据进行对比，从而识别是否为要录制的特定人的语音，如果是则对该语音进行自动录制和存储，从而提高了录音过程的针对性。

一种对特定人的语音进行自动录制的系统\n技术领域\n[0001] 本发明涉及录音领域，更具体地说，涉及一种对特定人的语音进行自动录制的方法、系统及设备。 \n背景技术\n[0002] 目前，录音技术的应用已经相当普遍，录音包括现场录音和通话录音两种：现场录音是指对说话人的语音直接录制，相当于环境录音，例如记者采访即属此类；通话录音是指对通话双方(或多方)进行录音。 \n[0003] 现有技术在录音过程中是采用人为操作或声控、压控(电压控制)的方式控制录音设备的启动和停止，因此不能对录音过程进行完全自动的控制；更重要的是，现有技术对声源的录制没有针对性，无法有选择地对特定人的讲话进行录制和存储。 [0004] 因此需要一种新的录音方法，对特定人的语音进行有针对性的自动录制。发明内容\n[0005] 本发明的目的在于提供一种对特定人的语音进行自动录制的系统，旨在解决现有技术的录音过程针对性低的问题。 \n[0006] 本发明的目的还在于提供另一种对特定人的语音进行自动录制的设备，以更好地解决现有技术中存在的上述问题。 \n[0007] 本发明的目的还在于提供另一种对特定人的语音进行自动录制的方法，以更好地解决现有技术中存在的上述问题。 \n[0008] 为了实现发明目的，所述对特定人的语音进行自动录制的系统，包括语音终端和语音服务器，所述语音终端包括用于采集语音的语音采集模块，所述语音终端或语音服务器中包括语音录制模块，所述语音服务器还包括语音库和语音处理模块； [0009] 所述语音库用于存储包括所述特定人的语音样本的语音数据； \n[0010] 所述语音处理模块与所述语音库相连，用于将所述语音终端中语音采集模块采集到的语音与所述语音库中的语音数据进行对比，判断是否为特定人的语音，若是则控制所述语音录制模块进行录音。 \n[0011] 所述语音终端和语音服务器中各包括一个语音录制模块，根据系统的缺省设置或者用户的选择进行启动，对所述特定人的语音进行录制。 \n[0012] 所述语音处理模块根据其中设置的录音控制信息和声控方式，对所述语音录制模块的录音过程进行控制。 \n[0013] 所述录音控制信息包括录音功能启动、语音匹配程度、录音时间长短以及语音间隔； \n[0014] 所述声控方式是指，根据所述录音控制信息中的语音间隔，用声音信号控制录音是否继续。 \n[0015] 为了更好地实现发明目的，所述对特定人的语音进行自动录制的设备，即语音终端，包括语音采集模块、语音录制模块，所述语音终端还包括语音库和语音处理模块； [0016] 所述语音库用于存储包括所述特定人的语音样本的语音数据； \n[0017] 所述语音处理模块与所述语音库相连，用于将所述语音采集模块采集到的语音与所述语音库中的语音数据进行对比，判断是否为特定人的语音，若是则控制所述语音录制模块进行录音。 \n[0018] 所述语音终端进一步包括存储模块和收发模块； \n[0019] 所述存储模块与所述语音处理模块和语音录制模块相连，用于存储所述语音录制模块所录制的特定人的语音，并供所述语音处理模块的提取； \n[0020] 所述收发模块与所述语音处理模块相连，用于将所述语音处理模块从所述存储模块中提取的特定人的语音发送至指定的设备或地址。 \n[0021] 为了更好地实现发明目的，所述对特定人的语音进行自动录制的方法包括以下步骤： \n[0022] A.对所采集到的语音进行识别，判断其是否为所述特定人的语音，若否则循环采集语音，若是则转步骤B； \n[0023] B.对所述采集到的语音进行录制，并保存录制结果。 \n[0024] 所述步骤A中的判断是指：根据匹配程度进行判断，若所采集到的语音与预先存储的包括特定人的语音样本的语音信息在匹配程度上达到一个阈值，则判断所述采集到的语音为所述特定人的语音。 \n[0025] 所述步骤B包括：根据所设置的录音控制信息和声控方式，对所述采集到的语音进行录制。 \n[0026] 所述步骤A之前进一步包括： \n[0027] 建立包括所述特定人的语音样本的数据库，并设置录音控制信息和声控方式； [0028] 所述录音控制信息包括录音功能启动、语音匹配程度、录音时间长短以及语音间隔； \n[0029] 所述声控方式是指，根据所述录音控制信息中的语音间隔，用声音信号控制录音是否继续。\n[0030] 实施本发明，通过建立语音库，在采集到语音数据时则将其与语音库数据进行对比，从而识别是否为要录制的特定人的语音，如果是则对该语音进行自动录制和存储，从而提高了录音过程的针对性，为对特定人语音识别提供了高效的工具。 \n附图说明\n[0031] 图1是本发明对特定人的语音进行自动录制的其中一个系统的结构图； [0032] 图2是本发明对特定人的语音进行自动录制的另一个系统的结构图； [0033] 图3是本发明对特定人的语音进行自动录制的设备的结构图； \n[0034] 图4是本发明利用如图1所示系统对特定人的语音进行自动录制的方法流程图； [0035] 图5是本发明利用如图2所示系统对特定人的语音进行自动录制的方法流程图； [0036] 图6是本发明利用如图3所示设备对特定人的语音进行自动录制的方法流程图。具体实施方式\n[0037] 为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。 \n[0038] 本发明通过在语音终端或者语音服务器建立语音库，当语音终端采集到语音数据时则将其与语音库数据进行对比，从而识别是否为要录制的特定人的语音，如果属于特定人的语音则利用语音终端或者语音服务器对该语音进行自动录制和存储，从而提高了录音过程的针对性。 \n[0039] 图1示出了本发明对特定人的语音进行自动录制的其中一个系统的结构，该系统包括语音终端100和语音服务器200。 \n[0040] 在此系统中，语音终端100主要用于采集语音，并将所采集到的语音发送给语音服务器200进行处理。本发明中的语音终端100典型的可为但不限于手机终端、录音笔、个人数字助理等，其在内部结构方面包括语音采集模块101、收发模块102和存储模块103，其中： \n[0041] (1)语音采集模块101用于采集语音，在本发明中语音可包括两种，其一是环境语音，其二是通话语音，采集前者所得到的是一个声音信号，需要进行处理才能转换为电信号，采集后者所得到的即是一个电信号。本发明中在采集到用户的语音后会将其在语音采集模块101中缓存，然后再进行转发。由于语音种类的不同，导致语音采集模块101需采用两种不同的采集方式：对于环境语音，该语音采集模块101典型可为但不限于麦克风等设备，用于获取讲话人的语音；对于通话语音，该语音采集模块101通过数据传输线与通话线路或者网络相连，从而直接采集到电信号形式的语音数据。本发明中语音终端100中的语音采集模块101上电即可运行，对语音进行采集，或者通过用户的操作而开始运行。 [0042] (2)收发模块102与语音采集模块101相连，用于与服务器200之间进行信息交互，包括：将语音采集模块101所采集到的语音数据转发给语音服务器200，并接收服务器\n200反馈的控制信息或语音数据。 \n[0043] (3)存储模块103与收发模块102相连，在本系统中，存储模块103用于存储语音服务器200录制并反馈的特定人的语音信息。 \n[0044] 在此系统中，语音服务器200与语音终端100相连，主要用于对语音终端100 采集并发送过来的语音进行各种处理，包括对比识别、录音控制、存储、发送等操作。本发明中，语音服务器200一般是一个大型的中央控制设备，可与多个语音终端100相连，为多个语音终端100提供服务。语音服务器200在内部结构方面包括语音库201、收发模块202、语音处理模块203、语音录制模块204和存储模块205，其中： \n[0045] (1)语音库201与语音处理模块203相连，用于存储包括特定人的语音样本的语音数据，从而当语音服务器200接受到语音终端100采集并发送过来的语音数据后，可供语音处理模块203对该采集到的语音数据进行对比识别，判断是否为特定人的语音。 [0046] (2)收发模块202与语音处理模块203相连，用于接收语音终端100发送的各种数据，包括其所采集到的语音信息，并反馈各种数据(例如录制结果)给语音终端100。 [0047] (3)语音处理模块203与语音库201相连，用于将语音终端100中语音采集模块\n101采集到的语音与语音库201中的语音数据进行对比，判断是否为特定人的语音，若是则控制语音录制模块205进行录音。该语音处理模块203中预先设置有录音控制信息和声控方式，其中录音控制信息包括但不限于：语音匹配程度、录音功能启动、录音时间长短、语音间隔、录音存储或传输地址等等，从而可根据语音匹配程度判断所采集到的语音是否为特定人的语音，例如可设定该语音匹配程度值为70％，若在两者对比的结果是匹配程度超过\n70％，则认定该采集到的语音是特定人的语音，从而可根据设置的录音功能启动信息启动语音录制模块204；而声控方式是指，根据录音控制信息中的语音间隔，用声音信号控制录音是否继续。 \n[0048] (4)语音录制模块204与语音处理模块203相连，用于根据语音处理模块 203中设置的录音控制信息和声控方式，对特定人的语音进行录制。 \n[0049] (5)存储模块205与语音处理模块203相连，当语音录制模块204录制完毕，语音处理模块203则将录制结果保存到存储模块205中，且可在之后从中提取录制结果。 [0050] 图2示出了本发明对特定人的语音进行自动录制的另一个系统的结构，该系统也包括语音终端100和语音服务器200，此系统与图1所示系统的区别在于，语音终端100中包括一个语音录制模块104。 \n[0051] 在此系统中，语音终端100的语音采集模块101采集到语音，并利用收发模块102发送给语音服务器200，语音服务器200则利用其语音处理模块203将该采集到的语音与语音库201中预存的语音数据进行对比，判断该采集到的语音是否是特定人的语音，若是则语音处理模块203进一步根据决定，是由语音终端100中的语音录制模块104对该采集到的语音进行录音，还是由语音服务器200中的语音录制模块204进行录音。若由语音终端100中的语音录制模块104进行录音，则将录制结果首先保存在语音终端100的存储模块103中，然后可传送给语音服务器200备份；若由语音服务器200中的语音录制模块204进行录音，则将录制结果首先保存在语音服务器200的存储模块205中，然后可传送给语音终端100备份。 \n[0052] 图2所示系统中的其他功能模块与图1所示系统中一致，此处不再赘述。 [0053] 图3示出了本发明对特定人的语音进行自动录制的设备的结构，该设备即语音终端100。在本发明中，可采用如图1和图2的方式，将语音终端100与语音服务器200结合起来协调工作，将语音服务器200作为一个大型的中央控制设备，与多个语音终端100相连，为多个语音终端100提供服务，也可采用如图3所示的方式，将语音终端100完全独立出来，对语音进行采集、识别、录音控制、录制和存储等全部操作，功能非常强大，加之可随身携带，极大地方便了用户的使用。 \n[0054] 该语音终端100包括语音采集模块101、收发模块102、存储模块103、语音录制模块104、语音库105和语音处理模块106，其中： \n[0055] (1)语音采集模块101用于采集语音，在本发明中语音可包括两种，其一是环境语音，其二是通话语音，采集前者所得到的是一个声音信号，需要进行处理才能转换为电信号，采集后者所得到的即是一个电信号。由于语音种类的不同，导致语音采集模块101需采用两种不同的采集方式：对于环境语音，该语音采集模块101典型可为但不限于麦克风等设备，用于获取讲话人的语音；对于通话语音，该语音采集模块101通过数据传输线与通话线路或者网络相连，从而直接采集到电信号形式的语音数据。本发明中语音终端100中的语音采集模块101上电即可运行，对语音进行采集，或者通过用户的操作而开始运行。 [0056] (2)收发模块102与语音处理模块106和存储模块103相连，用于将存储模块103所存储的录制结果发送至指定的设备或地址。应当注意的是，该收发模块102与图1和图2中所示的收发模块102在功能上是不尽相同的，后者主要用于语音终端100和语音服务器\n200之间的数据传输。 \n[0057] (3)存储模块103与语音处理模块106相连，用于存储语音录制模块104录制的特定人的语音信息。 \n[0058] (4)语音录制模块104与语音处理模块106相连，用于根据语音处理模块106中设置的录音控制信息和声控方式，对特定人的语音进行录制。 \n[0059] (5)语音库105与语音处理模块106相连，用于存储包括特定人的语音样本的语音数据，从而当语音采集模块101采集到语音数据后，可供语音处理模块106对该采集到的语音数据进行对比识别，判断是否为特定人的语音。\n[0060] (6)语音处理模块106与语音库105相连，用于将语音采集模块101采集到的语音与语音库105中的语音数据进行对比，判断是否为特定人的语音，若是则控制语音录制模块104进行录音。该语音处理模块106中预先设置有录音控制信息和声控方式，其中录音控制信息包括但不限于：语音匹配程度、录音功能启动、录音时间长短、语音间隔、录音存储或传输地址等等，从而可根据语音匹配程度判断所采集到的语音是否为特定人的语音，例如可设定该语音匹配程度值为70％，若在两者对比的结果是匹配程度超过70％，则认定该采集到的语音是特定人的语音，从而可根据设置的录音功能启动信息启动语音录制模块\n104；而声控方式是指，根据录音控制信息中的语音间隔，用声音信号控制录音是否继续。 [0061] 图4示出了本发明利用如图1所示系统对特定人的语音进行自动录制的方法流程。 \n[0062] 在执行所有步骤之前，需要采集特定人的语音信息，从而在语音服务器200中建立语音库201，同时还要在语音处理模块203中设置录音控制信息和声控方式。其中录音控制信息包括但不限于：语音匹配程度、录音功能启动、录音时间长短、语音间隔、录音存储或传输地址等；而声控方式是指，根据录音控制信息中的语音间隔，用声音信号控制录音是否继续。 \n[0063] 在步骤S401中，语音终端100利用其语音采集模块101采集语音信息，并将其发送到语音服务器200中。如前所述，由于语音种类的不同，导致语音采集模块101需采用两种不同的采集方式：对于环境语音，该语音采集模块101典型可为但不限于麦克风等设备，用于获取讲话人的语音；对于通话语音，该语音采集模块101通过数据传输线与通话线路或者网络相连，从而直接采集到电信号形式的语音数据。\n[0064] 在步骤S402中，语音服务器200将语音终端100所采集到的语音与语音库201中预存的语音数据进行对比。语音服务器200进行对比所依据的，是如前所述的语音匹配程度。 \n[0065] 在步骤S403中，语音服务器200根据对比结果，判断是否需要录音。如果需要，则转步骤S404；若不需要，则转步骤S401，继续采集语音信息。 \n[0066] 在步骤S404中，当需要录音，则语音终端100将所采集到的语音不断传送到语音服务器200中进行录制。具体实现过程包括：(1)语音终端100将所采集到的语音通过收发模块102发送至语音服务器200；(2)语音服务器200接收到语音终端100所采集到的语音后，根据语音处理模块203中预先设置的录音控制信息和声控方式，控制语音录制模块204的录音过程，包括启动录音、停止录音等。 \n[0067] 在步骤S405中，当语音录制模块204录制语音完毕后，语音服务器200利用存储模块205保存录制结果。 \n[0068] 在步骤S406中，将录制结果传送给指定的设备或地址。该设备可以是语音终端\n100或者其他任何终端，包括手机终端、录音笔、个人数字助理等等。 \n[0069] 图5示出了本发明利用如图2所示系统对特定人的语音进行自动录制的方法流程。 \n[0070] 与图4所述方法流程相似，在执行所有步骤之前，需要采集特定人的语音信息，从而在在语音服务器200中建立语音库201，同时还要在语音处理模块203中设置录音控制信息和声控方式。其中录音控制信息包括但不限于：语音匹配程度、录音功能启动、录音时间长短、语音间隔、录音存储或传输地址等；而声控方式是指，根据录音控制信息中的语音间隔，用声音信号控制录音是否继续。\n[0071] 在步骤S501中，语音终端100利用其语音采集模块101采集语音信息，并将其发送到语音服务器200中。如前所述，由于语音种类的不同，导致语音采集模块101需采用两种不同的采集方式：对于环境语音，该语音采集模块101典型可为但不限于麦克风等设备，用于获取讲话人的语音；对于通话语音，该语音采集模块101通过数据传输线与通话线路或者网络相连，从而直接采集到电信号形式的语音数据。 \n[0072] 在步骤S502中，语音服务器200利用语音处理模块203将语音终端100所采集到的语音与语音库201中预存的语音数据进行对比。语音服务器200进行对比所依据的，是如前所述的语音匹配程度。 \n[0073] 在步骤S503中，语音服务器200的语音处理模块203根据对比结果，判断是否需要录音。如果需要，则转步骤S504；若不需要，则转步骤S501，继续采集语音信息。 [0074] 在步骤S504中，语音服务器200的语音处理模块203进一步确定，是由语音终端\n100中的语音录制模块104对该采集到的语音进行录音，还是由语音服务器200中的语音录制模块204进行录音。若确定由语音服务器200中的语音录制模块204进行录音，则转步骤S505；若确定由语音终端100中的语音录制模块104进行录音，则转步骤S507。 [0075] 在步骤S505中，语音终端100将其语音采集模块101所采集到的语音不断的传送到语音服务器200中，由语音服务器200中的语音录制模块204进行录制。具体过程包括：\n(1)语音终端100的语音采集模块101不断的采集语音，并将所采集的语音通过收发模块\n102向语音服务器200发送；(2)语音服务器200利用其收发模块202接收到语音终端100发送过来的语音数据，并将其转入语音处理模块203；(3)语音处理模块203利用其所设置的录音控制信息和声控方式，启动语音录制模块204进行录音。 \n[0076] 在步骤S506中，语音服务器200将录制结果保存在存储模块205中。 [0077] 在步骤S507中，语音处理模块203发送控制信号给语音终端100中的语音录制模块104，控制其进行录音。具体过程是：(1)语音处理模块203根据其所设置的录音控制信息和声控方式，发送控制信号给语音终端100；(2)语音终端100的收发模块102接收到该控制信号后，则将其转入语音录制模块104；(3)语音录制模块104根据该控制信号，开始对语音进行录制。 \n[0078] 在步骤S508中，当语音录制模块104录音完毕后，语音终端100将录制结果保存在存储模块103上。 \n[0079] 在步骤S509中，将录制结果传送给指定的设备或地址。该设备可以是其他任何终端，包括手机终端、录音笔、个人数字助理等。在本方法流程中，如采用的是语音服务器200中的语音录制模块204进行录音，则在步骤S509中可将录制结果传送给语音终端100备份；如采用的是语音终端100中的语音录制模块104进行录音，则在步骤S509中可将录制结果传送给语音服务器200备份。 \n[0080] 图6示出了本发明利用如图3所示设备对特定人的语音进行自动录制的方法流程，该设备是一个独立的语音终端100，能够对语音进行采集、识别、录音控制、录制和存储等全部操作，功能强大。 \n[0081] 在执行所有步骤之前，需要采集特定人的语音信息，从而在在语音终端100中建立语音库105，同时还要在语音处理模块106中设置录音控制信息和声控方式。其中录音控制信息包括但不限于：语音匹配程度、录音功能启动、录音时间长短、语音间隔、录音存储或传输地址等；而声控方式是指，根据录音控制信息中的语音间隔，用声音信号控制录音是否继续。 \n[0082] 在步骤S601中，语音终端100利用其语音采集模块101采集语音信息，并利用语音处理模块106将其与语音库105中预存的语音数据进行对比，其进行对比所依据的，是如前所述的语音匹配程度。例如可设定该语音匹配程度值为70％，若在两者对比的结果是匹配程度超过70％，则认定该采集到的语音是特定人的语音。 \n[0083] 在步骤S602中，语音处理模块106根据对比结果，判断是否需要录音。如果需要，则转步骤S603；若不需要，则转步骤S601，由语音采集模块101继续采集语音信息。 [0084] 在步骤S603中，语音处理模块106根据其所设置的，启动语音终端100中的语音录制模块104，开始对语音信息进行录制。 \n[0085] 在步骤S604中，当语音录制模块104录制语音完毕后，则将录制结果保存到存储模块103中。 \n[0086] 在步骤S605中，若需要将语音录制结果发送给其他设备或地址，则由语音处理模块106从存储模块105中提取录制结果，并由收发模块102进行发送。 \n[0087] 应当说明的是，本发明中上述系统和设备的录音功能可与视频或图像设备的录像功能相结合，具有较强的扩展性和兼容性。例如在一个典型的应用中，可将本发明的语音设备100与一个录像设备集成为同一个设备，实现在录像的同时进行语音的录制。 [0088] 以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明的保护范围之内。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN1877697A	2006-12-13	2006-07-25	一种基于分布式结构的说话人确认方法无效专利	北京理工大学
2	CN1808567A	2006-07-26	2006-01-26	验证真人在场状态的声纹认证设备和其认证方法无效专利	覃文华
3	CN1726489A	2006-01-25	2003-10-28	个人音频录制系统无效专利	格雷斯诺特有限公司
4	CN2745173Y	暂无	2004-06-15	用于庭审的计算机录音信息系统的硬件结构失效专利	梁国雄
5	CN1825865A	2006-08-30	2006-03-10	通讯终端自动录音的方法和装置无效专利	深圳市杰特电信控股有限公司

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供