一种音量调节方法及装置、电子设备

发明专利有效专利

申请号：
CN201210124700.2
IPC分类号：H04M1/60
申请日期：
2012-04-25
申请人：
华为技术有限公司

基础信息

权利要求

说明书

PDF全文

法律信息

引证文献

著录项信息

专利名称	一种音量调节方法及装置、电子设备
申请号	CN201210124700.2	申请日期	2012-04-25
法律状态	暂无	申报国家	中国
公开/公告日	2012-10-03	公开/公告号	CN102710838A
优先权	暂无	优先权号	暂无
主分类号	H04M1/60 ? IPC结构图谱： H 电学 H9 电学 H04 电通信技术 H04M 电话通信（通过电话电缆控制其他设备，但不包括电话交换设备的电路入G08） H04M1/00 分局设备，例如用户使用的（交换机提供的用户服务或设备入H04M 3/00；预付费电话硬币箱入H04M 17/00；电流供给装置入H04M 19/08）〔1，7〕 H04M1/60 包括话音放大器	IPC分类号	H;0;4;M;1;/;6;0查看分类表>
申请人	华为技术有限公司	申请人地址	北京市西城区德胜门外大街11号5幢400室(德胜园区) 变更专利地址、主体等相关变化，请及时变更，防止失效
权利人	咪咕文化科技有限公司	当前权利人	咪咕文化科技有限公司
发明人	薛黎;张小波
代理机构	深圳市深佳知识产权代理事务所（普通合伙）	代理人	唐华明

摘要

一种音量调节方法及装置、电子设备，该音量调节方法包括：采集使用者发出的语音信息，所述语音信息至少包括平均音量值；计算所述平均音量值与存储的平均正常音量值的差值，以获得所述使用者潜意识下的音量急速变化量；若所述音量急速变化量大于或等于预设阈值，则控制增大音频输出音量。本发明实施例可以基于使用者的潜意识行为实现音量的自动调节，提升使用者体验。

一种音量调节方法及装置、电子设备\n技术领域\n[0001] 本发明涉及电子设备领域，具体涉及一种音量调节方法及装置、电子设备。\n背景技术\n[0002] 在各种具有音频输入输出功能的电子设备中，音量调节是一个不可或缺的基本功能。其中，电子设备的音量调节方法主要有机械按键调节、触摸调节以及结合传感器技术的动作感应调节等，这些音量调节方法都需要使用者有意识地判断出电子设备输出音量不满足需求(如用户听不到或听不清楚)后，再通过手指主动触发音量调节。特别地，如果使用者在通话的同时还在进行其他手工操作(例如开车、电脑打字、提重物等)，那么通过手指主动触发音量调节则很不方便甚至不能进行。\n发明内容\n[0003] 本发明实施例所要解决的技术问题是提供一种音量调节方法及装置、电子设备，能够实现音量的自动调节，提升使用者体验。\n[0004] 本发明实施例一方面提供一种音量调节方法，包括：\n[0005] 采集使用者发出的语音信息，所述语音信息至少包括平均音量值；\n[0006] 计算所述平均音量值与存储的平均正常音量值的差值，以获得所述使用者潜意识下的音量急速变化量；\n[0007] 若所述音量急速变化量大于或等于预设阈值，则控制增大音频输出音量。\n[0008] 本发明实施例另一方面提供一种音量调节装置，包括：\n[0009] 语音采集单元，用于采集使用者发出的语音信息，所述语音信息至少包括平均音量值；\n[0010] 计算单元，用于计算所述平均音量值与存储单元存储的平均正常音量值的差值，以获得所述使用者潜意识下的音量急速变化量；\n[0011] 控制单元，用于在所述音量急速变化量大于或等于所述存储单元存储的预设阈值时，发送增大音频输出音量指令至音频调节单元；\n[0012] 所述音频调节单元，用于接收所述控制单元发送的增大音频输出音量指令控制增大音频输出音量；\n[0013] 所述存储单元，用于存储所述平均正常音量值和所述预设阈值。\n[0014] 本发明实施例另一方面还提供一种电子设备，所述电子设备包括主控装置以及上述音量调节装置，其中，所述主控装置与所述音量调节装置电连接。\n[0015] 本发明实施例中，在采集到使用者发出的至少包括平均音量值的语音信息之后，可以计算上述平均音量值与存储的平均正常音量值的差值以获得使用者潜意识下的音量急速变化量，以及在该音量急速变化量大于或等于预设阈值时，控制增大音频输出音量。可见，本发明实施例不需要使用者对电子设备进行主动操作，而是根据使用者潜意识行为来实现输出音量的自动调节，提升使用者体验。本发明实施例将使用者潜意识行为与音量调节结合在一起，通过使用者潜意识行为来牵引音量的自动调节，使得音量调节变得更为人性化和智能化。\n附图说明\n[0016] 为了更清楚地说明本发明实施例或现有技术中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。\n[0017] 图1是本发明实施例一提供的一种音量调节方法的流程图；\n[0018] 图2是本发明实施例二提供的一种音量调节方法的流程图；\n[0019] 图3是本发明实施例三提供的一种音量调节方法的流程图；\n[0020] 图4是本发明实施例三提供的一种预设阈值B的正态分布图；\n[0021] 图5是本发明实施例四提供的一种音量调节方法的流程图；\n[0022] 图6～图7是本发明实施例提供的两种音量调节装置的结构图；\n[0023] 图8是本发明实施例提供的一种电子设备的结构图。\n具体实施方式\n[0024] 下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。\n[0025] 本发明实施例所要解决的技术问题是提供一种音量调节方法及装置，用于实现音量的自动调节，提升使用者体验。以下分别进行详细说明。\n[0026] 实施例一：\n[0027] 请参阅图1，图1为本发明实施例一提供的一种音量调节方法的流程图。如图1所示，该音量调节方法可以包括以下步骤：\n[0028] 101、采集使用者发出的语音信息，该语音信息至少包括平均音量值。\n[0029] 作为一种可选的实施方式，本发明实施例可以采用麦克风(MIC)或者其他具有语音采集功能的模块或单元来采集使用者发出的至少包括平均音量值的语音信息。\n[0030] 102、计算上述平均音量值与存储的平均正常音量值的差值，以获得使用者潜意识下的音量急速变化量。\n[0031] 其中，使用者潜意识下的音量急速变化量是指具有音频输入输出功能的电子设备音频输出音量过小而导致使用者听不到或者听不清时，使用者潜意识下提高的那一部分语音音量。\n[0032] 其中，具有音频输入输出功能的电子设备包括但不限于手机，蓝牙耳机以及其它具有通话能力的终端等等。\n[0033] 103、若该音量急速变化量大于或等于预设阈值，则控制增大音频输出音量。\n[0034] 作为一种可选的实施方式，本发明实施例一在增大音频输出音量之后，还可以对音频进行噪声抑制，以提高音频的信噪比。\n[0035] 作为一种可选的实施方式，上述步骤103中控制增大音频输出音量的方式可以为控制音频输出音量增大至少一个音量等级；其中，音量等级的具体划分是本领域技术人员所公知的常识，本发明实施例不作赘述。\n[0036] 本发明实施例一中，在采集到使用者发出的至少包括平均音量值的语音信息之后，可以计算该平均音量值与存储的平均正常音量值的差值以获得使用者潜意识下的音量急速变化量，以及在该音量急速变化量大于或等于预设阈值时，控制增大音频输出音量。可见，本发明实施例不需要使用者对电子设备进行主动操作，而是根据使用者潜意识行为来实现输出音量的自动调节，提升使用者体验。本发明实施例将使用者潜意识行为与音量调节结合在一起，通过使用者潜意识行为来牵引音量的自动调节，使得音量调节变得更为人性化和智能化。\n[0037] 实施例二：\n[0038] 请参阅图2，图2为本发明实施例二提供的另一种音量调节方法的流程图。如图2所示，该音量调节方法可以包括以下步骤：\n[0039] 201、采集使用者发出的语音信息，该语音信息至少包括平均音量值和关键字。\n[0040] 其中，使用者发出的语音信息中包括的关键字通常是具有音频输入输出功能的电子设备音频输出音量过小而导致使用者听不到或者听不清时，使用者潜意识下发出的关键字。例如，常见的使用者潜意识下发出的关键字包括但不限于“喂”、“听不清”、“大声点”、“说什么”、“再说一遍”、“听到没有”以及“听不到”等等。\n[0041] 202、计算上述平均音量值与存储的平均正常音量值的差值，以获得使用者潜意识下的音量急速变化量。\n[0042] 203、判断该音量急速变化量是否大于或等于预设阈值，如果是，则执行步骤204；\n如果否，则执行步骤205。\n[0043] 204、保持存储的平均正常音量值不变，并执行步骤207。\n[0044] 205、计算上述平均音量值与存储的平均正常音量值的平均值，并将存储的平均正常音量值更为上述平均音量值与存储的平均正常音量值的平均值，以及执行步骤206。\n[0045] 206、将上述语音信息包括的关键字与存储的关键字进行比较，若存储的关键字中存在有关键字与上述语音信息包括的关键字相同，则执行步骤207；否则，保持音频输出音量不变。\n[0046] 207、控制增大音频输出音量。\n[0047] 作为一种可选的实施方式，本发明实施例二在控制增大音频输出音量之后，还可以对音频进行噪声抑制，以提高音频的信噪比。\n[0048] 与本发明实施例一相比，本发明实施例二在判断出使用者潜意识下的音量急速变化量小于预设阈值时，可以进一步将上述语音信息包括的关键字与存储的关键字进行比较，并且在存储的关键字中存在有关键字与上述语音信息包括的关键字相同时，控制增大音频输出音量。与本发明实施例一相比，本发明实施例二可以提高控制增大音频输出音量的智能性。本发明实施例二将使用者潜意识行为(包括音量急速变化量和关键字)与音量调节结合在一起，通过使用者潜意识行为来牵引音量的自动调节，使得音量调节变得更为人性化和智能化。\n[0049] 实施例三：\n[0050] 请参阅图3，图3为本发明实施例三提供的一种音量调节方法的流程图。在图3所示的音量调节方法中，可以采用动态循环检测法来获得使用者的平均正常音量值，即可以将每一次采集到的平均音量值与存储介质存储的平均正常音量值进行对比，并按照设定的条件选择取两者值的平均值作为平均正常音量值An，并将存储介质存储的平均正常音量值更新为An。通过计算当前时间窗口中的平均音量值与上一时间窗口存储的平均正常音量值的差值，并将该差值与预设值B(B值为判断音量突变阈值的设定值)比较，从而决定是否控制增大音频输出音量。而随着检测的循环进行，该方法获得的平均正常音量值An将更接近于使用者的实际语言音量值。在图3所示的音量调节方法中，可以将语音时长分割成适合的均匀时间窗口1～n(n大于1)。其中，n值大小的确定，可以通过多样本试验测试得到，其约束条件有：时间窗口不能过大，防止因为该时间窗内对音量的平均而将发生音量突变时的音量大小拉低影响判断条件；时间窗不能过小，防止出现误判。\n[0051] 其中，图3所示的音量调节方法的流程如下：\n[0052] 301、在时间窗口n内采集使用者发出的语音信息，该语音信息至少包括时间窗口n的平均音量值An和关键字。\n[0053] 302、计算上述平均音量值An与时间窗口n-1存储的平均正常音量值An-1的差值，以获得使用者潜意识下的音量急速变化量。\n[0054] 303、判断该音量急速变化量是否大于或等于预设阈值B，如果是，则执行步骤\n304；如果否，则执行步骤305。\n[0055] 304、保持存储的平均正常音量值An-1不变，并执行步骤307。\n[0056] 305、计算上述平均音量值An与存储的平均正常音量值An-1的平均值，并将存储的平均正常音量值An-1更为上述平均音量值An与存储的平均正常音量值An-1的平均值，以及执行步骤306。\n[0057] 306、将上述语音信息包括的关键字与存储的关键字进行比较，若存储的关键字中存在有关键字与上述语音信息包括的关键字相同，则执行步骤307；否则，保持音频输出音量不变。\n[0058] 307、控制增大音频输出音量。\n[0059] 本发明实施例中，上述的预设阈值B是判断是否音量出现突变的依据。其获得可以通过但不限于以下两种方法得到。\n[0060] 方法一：一般人在听不到声音时不自觉提高的声音分贝差值的统计平均。\n[0061] 在方法一中，预设阈值B的定义为：使用者在听不清音频输出音量的情况下，潜意识地提高音量值与平均正常音量值的差值定义为预设阈值B。当使用者音量与平均正常音量的差值大于或等于预设阈值B时，则认为达到控制增大音频输出音量的触发条件。\n[0062] 方法二：普通使用者通常说话最高音量与平均正常音量的差值的统计平均。\n[0063] 在方法二中，预设阈值B的定义为：使用者通常通话时最高音量与平均正常音量值的差值定义为预设阈值B。当使用者音量与平均正常音量值的差值大于或等于预设阈值B时，认为达到控制增大音频输出音量的触发条件。\n[0064] 以上两种方法均由统计平均得到。根据概率统计学原理，可以知道如果一个量是由许多微小的独立随机因素影响的结果，那么就可以认为这个量具有正态分布(即高斯分布)。作为样本的个人的音量差值(方法一：非正常使用音量值与平均正常音量值的差值；\n方法二：通话时最高音量值与平均正常音量值的差值)受各种随机因素影响，其相互之间是独立的。故可以认为预设阈值B的统计平均符合正态分布(在此仅提到一种符合自然界最常见的统计分布方法，但不仅限于该方法)，如图4所示。\n[0065] 在图4中，可以选取一定数量样本，获取单个样本的B值，可绘制出样本群体的B值统计曲线。取适量B1为阈值，令B＝B1，即得到本发明实施例所需的预设阈值B。低于B1值的这一部分群体，在统计学上称为5％的小概率事件。而为了解决这一部分误判问题，在本发明实施例中引入了关键词对比这一补充措施。\n[0066] 本发明实施例三不需要使用者对电子设备进行主动操作，而是根据使用者潜意识行为来实现输出音量的自动调节，提升使用者体验。本发明实施例三将使用者潜意识行为与音量调节结合在一起，通过使用者潜意识行为来牵引音量的自动调节，使得音量调节变得更为人性化和智能化。\n[0067] 实施例四：\n[0068] 请参阅图5，图5为本发明实施例四提供的一种音量调节方法的流程图。在图5所示的音量调节方法中，可以采用静态检测法来获得使用者的平均正常音量值。其中，静态检测法与动态循环检测法的区别在于：增加首次试音步骤，由该步骤确定使用者的平均正常音量值A。在后续通话中A值确定，不再调整。故针对不同的使用环境或者不同使用者，A值需要重新写入一次，即需要重复试音步骤一次。\n[0069] 其中，图5所示的音量调节方法的流程如下：\n[0070] 501、使用者按照平时说话音量试音。\n[0071] 502.将使用者的平均正常音量值A写入存储介质中存储。\n[0072] 503、在时间窗口n内采集使用者发出的语音信息，该语音信息至少包括时间窗口n的平均音量值An和关键字。\n[0073] 本发明实施例四中，时间窗口的设置与实施例三相同。\n[0074] 504、计算上述平均音量值An与平均正常音量值A的差值，以获得使用者潜意识下的音量急速变化量。\n[0075] 505、判断该音量急速变化量是否大于或等于预设阈值B，如果是，则执行步骤\n507；如果否，则执行步骤506。\n[0076] 506、将上述语音信息包括的关键字与存储的关键字进行比较，若存储的关键字中存在有关键字与上述语音信息包括的关键字相同，则执行步骤507；否则，保持音频输出音量不变。\n[0077] 507、控制增大音频输出音量。\n[0078] 本发明实施例四不需要使用者对电子设备进行主动操作，而是根据使用者潜意识行为来实现输出音量的自动调节，提升使用者体验。本发明实施例三将使用者潜意识行为与音量调节结合在一起，通过使用者潜意识行为来牵引音量的自动调节，使得音量调节变得更为人性化和智能化。\n[0079] 实施例五：\n[0080] 请参阅图6，图6为本发明实施例五提供的一种音量调节装置的结构图。其中，本发明实施例五提供的音量调节装置可以作为一种独立装置，用于对具有音频输入输出功能的电子设备的输出音量进行调节；或者，本发明实施例五提供的音量调节装置可以作为具有音频输入输出功能的电子设备新增的一部分，用于对该电子设备的输出音量进行调节，本发明实施例不作限定。如图6所示，该音量调节装置可以包括：\n[0081] 语音采集单元601，用于采集使用者发出的语音信息，该语音信息至少包括平均音量值；\n[0082] 计算单元602，用于计算该平均音量值与存储单元605存储的平均正常音量值的差值，以获得使用者潜意识下的音量急速变化量；\n[0083] 控制单元603，用于在该音量急速变化量大于或等于存储单元605存储的预设阈值时，发送增大音频输出音量指令至音频调节单元604；\n[0084] 音频调节单元604，用于接收控制单元603发送的增大音频输出音量指令控制增大音频输出音量；\n[0085] 存储单元605，用于存储上述的平均正常音量值和预设阈值。\n[0086] 请一并参阅图7，图6为本发明实施例五提供的另一种音量调节装置的结构图。其中，图7所示的音量调节装置是由图6所示的音量调节装置进行优化得到的。在图7所示的音量调节装置中，语音采集单元601采集到的语音信息还可以进一步包括关键字，则该音量调节装置还可以包括：\n[0087] 关键字识别单元606，用于在上述音量急速变化量小于存储单元605存储的预设阈值时，将语音信息包括的关键字与存储单元605存储的关键字进行比较，若存储单元605存储的关键字中存在有关键字与语音信息包括的关键字相同，则发送增大音频输出音量指令至音频调节单元604；\n[0088] 相应地，音频调节单元604用于接收关键字识别单元606发送的增大音频输出音量指令控制增大音频输出音量；\n[0089] 相应地，存储单元605还用于存储关键字。\n[0090] 作为一种可选的实施方式，图7所示的音量调节装置还可以包括：\n[0091] 第一更新单元607，用于在上述音量急速变化量小于存储单元605存储的预设阈值时，计算语音采集单元601采集到的语言信息包含的平均音量值与存储单元605存储的平均正常音量值的平均值，以及将存储单元605存储的平均正常音量值更为该平均值。\n[0092] 作为一种可选的实施方式，上述关键字可以包括但不限于“喂”、“听不清”、“大声点”、“说什么”、“再说一遍”、“听不到”以及“听到没有”等。\n[0093] 作为一种可选的实施方式，图7所示的音量调节装置还可以包括：\n[0094] 噪声控制单元608，还用于在音频调节单元604控制增大音频输出音量之后，对音频进行噪声抑制，以提高所述音频的信噪比。\n[0095] 作为一种可选的实施方式，音频调节单元604具体可以用于控制音频输出音量增大至少一个音量等级。\n[0096] 本发明实施例五不需要使用者对电子设备进行主动操作，而是根据使用者潜意识行为来实现输出音量的自动调节，提升使用者体验。本发明实施例三将使用者潜意识行为与音量调节结合在一起，通过使用者潜意识行为来牵引音量的自动调节，使得音量调节变得更为人性化和智能化。\n[0097] 实施例六：\n[0098] 请参阅图8，图8为本发明实施例六提供的一种电子设备的结构图。如图8所示，该电子设备可以包括主控装置801以及音量调节装置802，其中，主控装置801与音量调节装置802电连接。\n[0099] 本发明实施例中，音量调节装置802的结构、功能均可以参照图6或图7所描述的音量调节装置，本发明实施例不作复述。\n[0100] 本发明实施例中，主控装置801可以是手机，蓝牙耳机以及其它具有通话能力的终端所共有的主板、控制板等，本发明实施例不作赘述。\n[0101] 图8所描述的电子设备可以根据使用者潜意识行为来实现输出音量的自动调节，提升使用者体验。本发明实施例六将使用者潜意识行为与音量调节结合在一起，通过使用者潜意识行为来牵引音量的自动调节，使得音量调节变得更为人性化和智能化。\n[0102] 本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random Access Memory，RAM)、磁盘或光盘等。\n[0103] 以上对本发明实施例所提供的方法、系统和设备进行了详细介绍，本文中应用了具体个例对本发明的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本发明的方法及其核心思想；同时，对于本领域的一般技术人员，依据本发明的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本发明的限制。

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
1	CN101552823A	2009-10-07	2008-04-03	音量管理系统及方法有效专利	华硕电脑股份有限公司
2	EP0880256A2	暂无	1998-05-22	Portable telephone device失效专利	MATSUSHITA ELECTRIC INDUSTRIAL CO.; LTD.
3	CN101600018A	2009-12-09	2009-07-03	一种实现移动终端静音的方法、系统及移动终端无效专利	宇龙计算机通信科技(深圳)有限公司
4	CN101651732A	2010-02-17	2009-08-12	免持通话装置和方法及具有免持通话功能的声学再现装置失效专利	索尼株式会社

序号	公开(公告)号	公开(公告)日	申请日	专利名称	申请人
该专利没有被任何外部专利所引用！

我浏览过的专利

专利服务由北京酷爱智慧知识产权代理公司提供