著录项信息
专利名称 | 声音判断装置、声音检测装置以及声音判断方法 |
申请号 | CN200880004020.9 | 申请日期 | 2008-08-25 |
法律状态 | 授权 | 申报国家 | 中国 |
公开/公告日 | 2009-12-09 | 公开/公告号 | CN101601088 |
优先权 | 暂无 | 优先权号 | 暂无 |
主分类号 | G10L21/02 | IPC分类号 | G;1;0;L;2;1;/;0;2;;;G;1;0;L;1;5;/;2;0查看分类表>
|
申请人 | 松下电器产业株式会社 | 申请人地址 | 日本大阪府
变更
专利地址、主体等相关变化,请及时变更,防止失效 |
权利人 | 松下电器产业株式会社 | 当前权利人 | 松下电器产业株式会社 |
发明人 | 芳泽伸一;中藤良久 |
代理机构 | 永新专利商标代理有限公司 | 代理人 | 陈萍 |
摘要
噪声除去装置(100)包括:FFT分析部(2402),接受包含抽出音和噪声的混合音,并针对规定的时间宽度中所包含的多个时刻的每一个来求所述混合音的频率信号;以及抽出音判断部(101(j)),针对所述规定的时间宽度中所包含的多个时刻的所述频率信号,将由第一阈值以上的数量构成的、且频率信号之间的相位距离在第二阈值以下的频率信号的每一个,判断为所述抽出音的频率信号;所述相位距离是,在将时刻t的频率信号的相位设为ψ(t)时,以ψ′(t)=mod2π(ψ(t)-2πft)来表示相位时的频率信号的相位间距离,相位的单位为弧度,f为分析频率。
1.一种声音判断装置,包括:
频率分析部,接受包含抽出音和噪声的混合音,并针对规定的时间宽度中所包含的多个时刻的每一个来求所述混合音的频率信号;以及
抽出音判断部,针对所述规定的时间宽度中所包含的多个时刻的所述频率信号,将由第一阈值以上的数量构成的、且频率信号之间的相位距离在第二阈值以下的频率信号的每一个,判断为所述抽出音的频率信号;
所述相位距离是,在将时刻t的频率信号的相位设为ψ(t)时,以ψ′(t)=mod2π(ψ(t)-2πft)来表示相位时的频率信号的相位间距离,相位的单位为弧度,f为分析频率。
2.如权利要求1所述的声音判断装置,
所述抽出音判断部制作多个由第一阈值以上的数量构成的、且频率信号间的所述相位距离在第二阈值以下的所述频率信号的集合,将所述频率信号的集合之间的所述相位距离成为第三阈值以上的每个所述频率信号的集合判断为不同种类的抽出音的频率信号。
3.如权利要求1所述的声音判断装置,
所述抽出音判断部从所述规定的时间宽度中所包含的多个时刻的频率信号中,选择1/f的时间间隔的时刻的频率信号,并利用被选择的时刻的频率信号来求所述相位距离,f为分析频率。
4.如权利要求1所述的声音判断装置,
该声音判断装置进一步包括相位校正部,将时刻t的频率信号的相位ψ(t)校正为ψ′(t)=mod2π(ψ(t)-2πft),相位的单位为弧度,f为分析频率;
所述抽出音判断部利用被校正后的所述频率信号的相位ψ′(t)来求所述相位距离。
5.如权利要求1所述的声音判断装置,
所述抽出音判断部利用所述规定的时间宽度中所包含的多个时刻的频率信号,来求以时刻和相位表示的空间中的所述多个时刻的频率信号的相位的近似直线,并求所述近似直线和所述多个时刻的频率信号之间的所述相位距离。
6.一种声音检测装置,包括:
权利要求1所述的声音判断装置;以及
声音检测部,在所述声音判断装置中,当在所述声音判断装置处理的混合音的频率信号所包含的频率信号被判断为所述抽出音的频率信号之时,制作抽出音检测标志并输出制作后的抽出音检测标志。
7.如权利要求6所述的声音检测装置,
所述频率分析部接受以每个麦克风所收集的多个所述混合音,并按照每个所述混合音来求频率信号;
所述抽出音判断部针对所述混合音的每一个进行所述抽出音的判断;
所述声音检测部,在同一时刻,所述混合音的频率信号中所包含的至少一个频率信号被判断为所述抽出音的频率信号之时,制作抽出音检测标志并输出制作后的抽出音检测标志。
8.一种声音抽出装置,包括:
权利要求1所述的声音判断装置;以及
声音抽出部,在所述声音判断装置中,当所述混合音的频率信号所包含的频率信号被判断为所述抽出音的频率信号之时,输出被判断为所述抽出音的频率信号的所述频率信号。
9.一种声音判断方法,包括:
频率分析步骤,接受包含抽出音和噪声的混合音,并针对规定的时间宽度中所包含的多个时刻的每一个来求所述混合音的频率信号;以及
抽出音判断步骤,针对所述规定的时间宽度中所包含的多个时刻的所述频率信号,将由第一阈值以上的数量构成的、且频率信号之间的相位距离在第二阈值以下的频率信号的每一个,判断为所述抽出音的频率信号;
所述相位距离是,在将时刻t的频率信号的相位设为ψ(t)时,以ψ′(t)=mod2π(ψ(t)-2πft)来表示相位时的频率信号的相位间距离,相位的单位为弧度,f为分析频率。
声音判断装置、声音检测装置以及声音判断方法 \n技术领域\n[0001] 本发明涉及按照时频区域来判断混合音中所包含的抽出音的频率信号的声音判断装置,尤其涉及对引擎声音、警报音、语音等具有音色的声音和风噪声、雨声、背景噪声等不具有音色的声音进行区别,并按照时频区域来判断具有音色的声音(或不具有音色的声音)的频率信号。 \n背景技术\n[0002] 第一个以往技术是,从输入语音信号(混合音)中抽出音高周期,在音高周期没有被抽出的情况下,判断为是噪声(例如,参照专利文献1)。在第一个以往技术中,从被判断为语音候补的输入语音中识别语音。 \n[0003] 图1是专利文献1所记载的第一以往技术所涉及的噪声除去装置的构成方框图。 [0004] 该噪声除去装置包括:识别部2501、音高抽出部2502、判断部2503、以及周期范围存储部2504。 \n[0005] 识别部2501是一处理部,输出语音识别候补,该语音识别候补在被推定为输入语音信号(混合音)中的语音部分(抽出音)的信号区间中。音高抽出部2502是一处理部,从输入语音信号中抽出音高周期。判断部2503是一处理部,根据在识别部2501被输出的针对信号区间的语音识别候补和在音高抽出部2502抽出的该区间中的信号的音高抽出结果,输出语音识别结果。周期范围存储部2504是一存储装置,存储针对由音高抽出部2502抽出的音高周期的周期范围。在该噪声除去装置中,若音高周期在针对预先设定的音高周期的设定周期的范围内的情况下,则判断该信号区间的信号为语音候补,若在针对音高周期的设定周期的范围外的情况下,则判断为噪声。 \n[0006] 并且,第二个以往的技术是,根据三个判断单元的判断结果,进行最后的判断,判断是否输入有人的声音(例如,参照专利文献2)。第一判断 单元在从输入信号(混合音)中检测到具有谐波结构信号成分的情况下,则判断为人的声音(抽出音)被输入。第二判断单元在输入信号的频率重心在规定的频率范围内的情况下,则判断为人的声音被输出。第三判断单元在针对噪声电平存储单元所存储的噪声电平的输入信号功率比超过了规定的阈值的情况下,则判断为人的声音被输入。 \n[0007] 专利文献1日本特开平5-210397号公报(权利要求2、图1) \n[0008] 专利文献1日本特开平5-210397号公报(权利要求2、图1) \n[0009] 专利文献2日本特开2006-194959号公报(权利要求1) \n[0010] 在第一个以往技术构成中,音高周期是按照时间区间抽出的。因此,不能按照时频区域来判断混合音中所包含的抽出音的频率信号。并且,不能判断如引擎声音(按照引擎的转动数而音高周期发生变化的声音)等音高周期发生变化的声音。 \n[0011] 发明内容\n[0012] 并且,在第二个以往技术的构成中,根据谐波结构以及频率重心等频谱形状来判断抽出音。为此,若混入了大的噪声,则频谱形状会歪曲,从而不能判断抽出音。尤其是,虽然由于噪声频谱形状消失,而在按照时频区域来看,在抽出音存在一部分的情况下,则不能将此部分的频率信号作为抽出音的频率信号来判断。 \n[0013] 本发明的为了解决以往的课题,目的在于提供一种声音判断装置等,其能够按照时频区域来判断混合音中所包含的抽出音的频率信号。尤其是,本发明提供的声音判断装置等能够对引擎声音、警报音、语音等具有音色的声音和风噪声、雨声、背景噪声等不具有音色的声音进行区别,并按照时频区域来判断具有音色的声音(或不具有音色的声音)的频率信号。 \n[0014] 本发明的某种局面所涉及的噪声除去装置包括:频率分析部,接受包含抽出音和噪声的混合音,并针对规定的时间宽度中所包含的多个时刻的每一个来求所述混合音的频率信号;以及抽出音判断部,针对所述规定的时间宽度中所包含的多个时刻的所述频率信号,将由第一阈值以上的数量构成的、且频率信号之间的相位距离在第二阈值以下的频率信号的每一个,判断为所述抽出音的频率信号;所述相位距离是,在将时刻t的频率信号的相位设为ψ(t)时,以ψ′(t)=mod2π(ψ(t) -2πft)来表示相位时的频率信号的相位间距离,相位的单位为弧度,f为分析频率。 \n[0015] 通过此构成,在将时刻t的频率信号的相位设为ψ(t)(弧度)时,利用ψ′(t)=mod2π(ψ(t)-2πft)(f为分析频率)中的距离(表示规定的时间宽度中相位ψ′(t)在时间上的变化的一个指标)。据此,能够按照时频区域对引擎声音、警报音、语音等具有音色的声音和风噪声、雨声、背景噪声等不具有音色的声音进行区别。并且,能够判断具有音色的声音(或不具有音色的声音)的频率信号。 \n[0016] 最好是,所述抽出音判断部制作多个由第一阈值以上的数量构成的、且频率信号间的所述相位距离在第二阈值以下的所述频率信号的集合,将所述频率信号的集合之间的所述相位距离成为第三阈值以上的每个所述频率信号的集合判断为不同种类的抽出音的频率信号。 \n[0017] 通过这种构成,在相同时频区域中存在有多个种类的抽出音的情况下,能够对这些抽出音分别进行区别并判断。例如,能够区别多个车辆的引擎声音,并判断。因此,在将本发明的噪声除去装置适用于车辆检测装置的情况下,能够向驾驶者通知存在多个不同的车辆,从而驾驶者能够安全驾驶。并且,由于能够区别多个人的语音并进行判断,因此在将本发明的噪声除去装置适用于语音抽出装置的情况下,能够将多个人的语音分离并能够听到。 \n[0018] 并且,最好是,所述抽出音判断部从所述规定的时间宽度中所包含的多个时刻的频率信号中,选择1/f的时间间隔的时刻的频率信号,并利用被选择的时刻的频率信号来求所述相位距离,f为分析频率。 \n[0019] 通过这种构成,在1/f(f为分析频率)的时间间隔的频率信号中成为ψ′(t)=mod2π(ψ(t)-2πft)=ψ(t),并能够利用ψ(t)来简单地计算求出相位距离。 [0020] 并且,最好是,上述的声音判断装置进一步包括相位校正部,将时刻t的频率信号的相位ψ(t)校正为ψ′(t)=mod2π(ψ(t)-2πft),相位的单位为弧度,f为分析频率;\n所述抽出音判断部利用被校正后的所述频率信号的相位ψ′(t)来求所述相位距离。 [0021] 通过这样的构成,能够进行以ψ′(t)=mod2π(ψ(t)- 2πft)来表示的校正。\n这样,针对比1/f(f为分析频率)的时间间隔更小的时间间隔的频率信号的相位距离,可以利用ψ′(t)以简单地计算来求相位距离。因此,即使在1/f的时间间隔增大的低频带中,也能够按照短时域利用ψ′(t)进行简单地计算,从而判断抽出音。 \n[0022] 本发明的某种局面所涉及的声音检测装置包括:上述的声音判断装置;以及声音检测部,在所述声音判断装置中,当所述混合音的频率信号所包含的频率信号被判断为所述抽出音的频率信号之时,制作抽出音检测标志并输出制作后的抽出音检测标志。 [0023] 通过这种构成,能够按照时频区域检测抽出音,并通知给利用者。例如,在将本发明的噪声除去装置组装到车辆检测装置的情况下,能够检测作为抽出音的引擎声音,并能够向驾驶者通知车辆的接近。 \n[0024] 最好是,所述频率分析部接受以每个麦克风所收集的多个所述混合音,并按照每个所述混合音来求频率信号;所述抽出音判断部针对所述混合音的每一个进行所述抽出音的判断;所述声音检测部,在同一时刻,所述混合音的频率信号中所包含的至少一个频率信号被判断为所述抽出音的频率信号之时,制作抽出音检测标志并输出制作后的抽出音检测标志。 \n[0025] 通过这种构成,由于噪声的影响,即使从以一个麦克风收集的混合音中检测不到抽出音,也能够从其他的麦克风中检测到抽出音。因此,能够减少检测失误。例如,在将本发明的噪声除去装置组装到车辆检测装置的情况下,能够利用通过设置麦克风的位置而风噪声影响小的麦克风所收集的混合音。为此,能够正确地检测出作为抽出音的引擎声音,并能够通知驾驶者有车辆的接近。此时,有可能会考虑到因噪声大的混合音而出现不好的影响。但是,作为本发明的特征,在噪声大的时频区域中,相位的时间变化是不规则的,通过很好地利用能够自动地除去噪声这一性质,从而能够除去不好的影响。 \n[0026] 本发明的另外的某种局面所涉及的声音抽出装置包括:上述的声音判断装置;以及声音抽出部,在所述声音判断装置中,当所述混合音的频率信号所包含的频率信号被判断为所述抽出音的频率信号之时,输出被判断为所述抽出音的频率信号的所述频率信号。 [0027] 通过这种构成,能够利用按照时频区域而被判断的抽出音的频率信号。 因此,例如在将本发明的噪声除去装置组装到声音输出装置的情况下,能够再现被除去噪声后的清晰的抽出音。并且,若将本发明的噪声除去装置组装到声源方向检测装置中,则能够求出被除去噪声之后的正确的声源方向。并且,若将本发明的噪声除去装置组装到声音识别装置中,即使在周围存在噪声的情况下,也能够正确地进行声音识别。 \n[0028] 并且,本发明不仅可以作为具有这些特征性单元的声音判断装置来实现,也可以作为将声音判断装置中所包含的特性性单元作为步骤的声音判断方法来实现,并且可以作为使计算机执行声音判断方法中所包含的特征性步骤的声音判断程序来实现。并且,这样的程序也是可以通过光盘(Compact Disc-Read Only Memory:CD-ROM)等的记录介质和互联网等的传输介质来流通的。 \n[0029] 通过本发明的声音判断装置等,能够按照时频区域来判断混合音中所包含的抽出音的频率信号。尤其能够对引擎声音、警报音、语音等具有音色的声音和风噪声、雨声、背景噪声等不具有音色的声音进行区别,并按照时频区域来判断具有音色的声音(或不具有音色的声音)的频率信号。 \n[0030] 例如,本发明能够适用于,对按照时频区域而被判断的语音的频率信号进行输入,并通过逆频率变换来输出抽出音的语音输出装置。并且,能够适用于一种声源方向检测装置,该音源方向检测装置能够针对由两个以上的麦克风输入的混合音的每一个,输入按照时频区域而被判断的抽出音的频率信号,并输出抽出音的声源方向。并且,能够适用于一种声音识别装置,该声音识别装置输入按照时频区域而被判断的抽出音的频率信号,并进行语音和声音的识别。而且,能够适用于风噪声等级判断装置,该风噪声等级判断装置输入按照时频区域判断的风的噪声的频率信号,并输出功率大小。并且,能够适用于车辆检测装置,该车辆检测装置输入按照时频区域而被判断的轮胎摩擦而发出的行驶声音的频率信号,并根据功率的大小来检测车辆。并且,能够适用于车辆检测装置,该车辆检测装置检测按照时频区域而被判断的引擎声音的频率信号,并通知车辆的接近。并且,能够适用于紧急车辆检测装置等,该紧急车辆检测装置检测按照时频区域而被判断的警报音的频率信号,并通知紧急车辆的接近。 \n附图说明\n[0031] 图1是以往的噪声除去装置的全体构成方框图。 \n[0032] 图2是本发明中的相位的定义的说明图。 \n[0033] 图3A是用于说明本发明的特征之一的概念图。 \n[0034] 图3B是用于说明本发明的特征之一的概念图。 \n[0035] 图4A是用于说明具有音色的声音的声源的性质和相位的关系的说明图。 [0036] 图4B是用于说明不具有音色的声音的声源的性质和相位的关系的说明图。 [0037] 图5是本发明的实施例1中的噪声除去装置的外观图。 \n[0038] 图6是本发明的实施例1中的噪声除去装置的全体构成的方框图。 [0039] 图7是示出本发明的实施例1中的噪声除去装置的抽出音判断部101(j)的方框图。 \n[0040] 图8是示出本发明的实施例1中的噪声除去装置的工作顺序的流程图。 [0041] 图9是示出本发明的实施例1中的噪声除去装置在判断抽出音的频率信号时的步骤S301(j)的工作顺序流程图。 \n[0042] 图10示出了混合音2401的声谱图的一个例子。 \n[0043] 图11示出了在制作混合音2401时所使用的语音的声谱图的一个例子。 [0044] 图12是说明了选择频率信号的方法的一个例子。 \n[0045] 图13A说明了选择频率信号的方法的其他的一个例子。 \n[0046] 图13B说明了选择频率信号的方法的其他的一个例子。 \n[0047] 图14说明了求出相位距离的方法的一个例子。 \n[0048] 图15示出了从混合音2401抽出语音的声谱图。 \n[0049] 图16在模式上示出了在求相位距离的时间范围(规定的时间宽度)时的混合音的频率信号的相位。 \n[0050] 图17说明了有关在ψ′(t)=mod2π(ψ(t)-2πft)(f为分析频率)的相位距离。 \n[0051] 图18说明了有关相位的时间变化成为逆时针方向的构成。 \n[0052] 图19说明了有关在ψ′(t)=mod2π(ψ(t)-2πft)(f为分析频率)的相位距离。 \n[0053] 图20示出了本发明的实施例1中的其他的噪声除去装置的全体构成的方框图。 [0054] 图21示出了混合音2401在200Hz时的频率信号的时间波形。 \n[0055] 图22示出了在制作混合音2401时所使用的200Hz正弦波中的频率信号的时间波形。 \n[0056] 图23示出了从混合音2401中抽出200Hz中的频率信号的时间波形。 [0057] 图24说明了制作频率信号的相位成分的直方图的方法的一个例子。 [0058] 图25示出了频率信号选择部200(j)所选择的频率信号和被选择的频率信号的相位的直方图的一个例子。 \n[0059] 图26是本发明的实施例2中的噪声除去装置的全体构成的方框图。 [0060] 图27是本发明的实施例2中的噪声除去装置中的抽出音判断部1502(j)的方框图。 \n[0061] 图28是本发明的实施例2中的噪声除去装置的工作顺序流程图。 \n[0062] 图29是在判断本发明的实施例2中的噪声除去装置的抽出音的频率信号时的步骤S1701(j)的工作顺序的流程图。 \n[0063] 图30说明了校正因时间差而造成的相位差的方法的一个例子。 \n[0064] 图31说明了校正因时间差而造成的相位差的方法的一个例子。 \n[0065] 图32说明了校正因时间差而造成的相位差的方法的一个例子。 \n[0066] 图33在模式上示出了求出相位距离的时间范围(规定的时间宽度)中的混合音的频率信号的相位。 \n[0067] 图34在模式上示出了在规定的时间宽度中的混合音的相位。 \n[0068] 图35说明了制作频率信号的相位的直方图的方法的一个例子。 \n[0069] 图36示出了在本发明实施例3中的车辆检测装置的全体构成的方框图。 [0070] 图37示出了在本发明实施例3中的车辆检测装置的抽出音判断部4103(j)的方框图。 \n[0071] 图38示出了本发明的实施例3中的车辆检测装置的工作顺序的流程图。 [0072] 图39示出了混合音2401(1)和混合音2401(2)的声谱图的一个例子。 [0073] 图40说明了设定适当的分析频率f的方法的一个例子。 \n[0074] 图41说明了设定适当的分析频率f的方法的一个例子。 \n[0075] 图42示出了判断引擎声音的频率信号的结果的例子。 \n[0076] 图43说明的抽出音检测标志的制作方法的一个例子。 \n[0077] 图44用于观察相位的时间变化。 \n[0078] 图45用于观察相位的时间变化。 \n[0079] 图46示出了分析摩托车的相位时间变化的结果。 \n[0080] 图47示出了判断警报音的频率信号的结果的例子。 \n[0081] 图48示出了判断语音的频率信号的结果的例子。 \n[0082] 图49A示出了在输入了100Hz的正弦波的情况下的检测结果。 \n[0083] 图49B示出了在输入了白噪声的情况下的检测结果。 \n[0084] 图49C示出了在输入了100Hz的正弦波和白噪声的混合音的情况下的检测结果。 [0085] 图50A示出了在输入了100Hz的正弦波的情况下的检测结果。 \n[0086] 图50B示出了在输入了白噪声的情况下的检测结果。 \n[0087] 图50C示出了在输入了100Hz的正弦波和白噪声的混合音的情况下的检测结果。 [0088] 符号说明\n[0089] 100、1500噪声除去装置 \n[0090] 101、1504噪声除去处理部 \n[0091] 101(j)(j=1至M)、1502(j)(j=1至M)、4103(j)(j=1至M)抽出音判断部 [0092] 200(j)(j=1至M)、1600(j)(j=1至M)频率信号选择部 \n[0093] 201(j)(j=1至M)、1601(j)(j=1至M)、4200(j)(j=1至M)相位距离判断部 [0094] 202(j)(j=1至M)、1503(j)(j=1至M)声音抽出部 \n[0095] 1100离散傅里叶变换(DFT)分析部 \n[0096] 1501(j)(j=1至M)、4102(j)(j=1至M)相位校正部 \n[0097] 2401、2401(1)、2401(2)混合音 \n[0098] 2402快速傅立叶变换(FFT)分析部 \n[0099] 2408抽出音的频率信号 \n[0100] 2501识别部 \n[0101] 2502音高抽出部 \n[0102] 2503判断部 \n[0103] 2504周期范围存储部 \n[0104] 4100车辆检测装置 \n[0105] 4101车辆检测处理部 \n[0106] 4104(j)(j=1至M)声音检测部 \n[0107] 4105抽出声音检测标志 \n[0108] 4106出示部 \n[0109] 4107(1)、4107(2)麦克风 \n具体实施方式\n[0110] 本发明的特征之一是,在对输入的混合音进行频率分析之后,通过分析的频率信号的相位在时间上的变化是否以(1/f)(f是分析频率)进行有规则地反复,从而针对分析频率f、对引擎声音、警报音、语音等具有音色的声音和风噪声、雨声、背景噪声等不具有音色的声音进行区别,并按照时频区域来判断具有音色的声音(或不具有音色的声音)。 [0111] 在此,利用图2对本发明中的相位的定义进行说明。图2(a)示出了输入的混合音。横轴表示时间,纵轴表示振幅。在该例子中采用了频率f的正弦波。并且,图2(b)示出了利用离散傅里叶变换进行频率分析时的基底波形(频率f的正弦波)的概念图。横轴和纵轴与图2(a)相同。通过进行此基底波形和输入的混合音的卷积处理,来求频率信号(相位)。在此例子中,通过一边使基底波形向时间轴方向移动,一边与输入的混合音进行卷积处理,从而按照时刻来求出频率信号(相位)。该处理所求出的结果由图2(c)示出。横轴表示时间,纵轴表示相位。在此例子中,由于输入的混合音为频率f的正弦波,因此,在频率f的相位的图形以1/f的时刻为周期进行有规则地反复。 \n[0112] 在本发明中,如图2所示,将一边使基底波形向时间轴方向移动而求出的相位,作为本发明中的“相位”的定义。 \n[0113] 图3A以及图3B是用于说明本发明的特征的概念图。图3A在模式上示出了将摩托车的声音(引擎声音)以频率f来进行频率分析而得到的结果。图3B在模式上示出了将背景噪声以频率f来进行频率分析而得到的结果。在这两个图中,横轴为时间轴,纵轴为频率轴。如图3所示,由于频率的时间变化等的影响,虽然频率信号的振幅(功率)大小发生变化,但是频率信号的相位以1/f的时间间隔(f为分析频率)有规则地、并以等角速度在\n0至2π(弧度)之间变化。例如,对于100Hz的频率信号而言,相位在10ms的间隔之间旋转2π(弧度),对于200Hz的频率信号而言,相位在5ms间隔之间旋转2π(弧度)。另外,如图3所示,背景噪声等没有音色的声音中的频率信号的相位的时间变化是不规则的。并且,在因混合音而变形的部分,相位的时间变化也会紊乱不规则。这样,通过判断频率信号的相位的时间变化是有规则的时频区域的频率信号,从而能够区别风噪声、雨声、背景噪声等不具有音色的声音,并判断出引擎声音、警报音、语音等具有音色的声音的频率信号。并且,区别具有音色的声音,从而能够判断没有音色的声音的频率信号。 \n[0114] 在此,对具有音色的声音和不具有音色的声音的声源的性质上的不同和相位的关系进行说明。 \n[0115] 图4A(a)在模式上示出了频率f的具有音色的声音(引擎声音、警报音、语音、正弦波)的相位。图4A(b)示出了频率f的基准波形。图4A(c)示出了频率f的具有音色的声音中的优势声音的波形。图4A(d)示出了基于基准波形的相位差。并且图4A(d)是基于图4A(c)所示的声音波形的图4A(b)所示的基准波形的相位差。 \n[0116] 图4B(a)在模式上示出了频率f的不具有音色的声音(背景噪声、风噪声、雨声、白噪声)的相位。图4B(b)示出了频率f的基准波形。图4B(c)示出了频率f的不具有音色的声音的声音波形(声音A、声音B、声音C)。图4B(d)示出了基于基准波形的相位差。\n是基于图4B(c)所示的声音波形的图4A(b)所示的基准波形的相位差。 \n[0117] 具有音色的声音(引擎声音、警报音、语音、正弦波)如图4A(a)和图4A(c)所示,在频率f中成为由频率f的优势正弦波构成的声音波形。另外,不具有音色的声音(背景噪声、风噪声、雨声、白噪声)如4B(a)和图4B(c) 所示,在频率f中成为频率f的多个正弦波混合而成的声音波形。 \n[0118] 在此,对不具有音色的声音的情况下示出多个声音波形的理由进行说明。 [0119] 也就是说,背景噪声是在短时间区间(几百毫秒以下的长度)中,由存在于远方的多个重叠的声音(相同频率的声音)构成的。 \n[0120] 并且,由于空气的湍流而产生风噪声,湍流在短时间区间(几百毫秒以下的长度)中由多个重叠的漩涡声音构成。 \n[0121] 并且,雨声在短时间间隔(几百毫秒以下的长度)中,由多个重叠的雨点的声音(相同频带的声音)构成。 \n[0122] 在图4A(c)和图4B(c)中,横轴表示时间,纵轴表示振幅。 \n[0123] 首先,利用图4A(b)、图4A(c)、图4A(d)来讨论具有音色的声音的相位。在此,以图\n4A(b)所示的频率f的正弦波作为基准波形。横轴表示时间,纵轴表示振幅。此基准波形与不使图2(b)所示的离散傅里叶变换的基底波形在时间轴方向移动而固定的波形对应。图\n4A(c)示出了具有音色的声音的频率f中的优势声音波形。图4A(d)中示出了图4A(b)所示的基准波形和图4A(c)所示的声音波形的相位差。从图4A(d)可知,在具有音色的声音的情况下,图4A(b)所示的基准波形和图4A(c)所示的优势波形的相位差在时间上的起伏变小。在此,若考虑与本发明所定义的相位的关系,则在图4A(d)所示的相位差上,加上图\n2(b)所示的基底波形在时间轴方向移动了t时的相位增加部分2πft而得到的值,是本发明所定义的相位。在具有音色的声音中,图4A(d)所示的相位差的值几乎是一定的。为此,在此相位差上加上2πft而求出的本发明中的相位图形,以图2(c)所示的1/f时刻为周期进行具有规则性的反复。 \n[0124] 以下,利用图4B(b)、图4B(c)、图4B(d)来对不具有音色的声音的相位进行讨论。\n在此,与图4A(b)同样,以图4B(b)所示的频率f的正弦波作为基准波形。横轴表示时间,纵轴表示振幅。图4B(c)示出了在不具有音色的声音的频率f中的被混合的多个正弦波的声音波形(声音A、声音B、声音C)。这些的声音波形以几百毫秒以下的长度的短时间间隔被混合。图4B(d)中示出了图4B(b)所示的基准波形和图4B(c)所示的多个声音混合的声音波形的相位差。在图4B(d)的开始的时刻,由于声音A的振幅比声音B和声音 C的振幅大,因此出现了声音A的相位差。并且,在中间的时刻,由于声音B的振幅比声音A和声音C的振幅大,因此出现了声音B的相位差。并且,在结束的时刻,由于声音C的振幅比声音A和声音B的振幅大,因此出现了声音C的相位差。这样,在不具有音色的声音的情况下,在几百毫秒以下的长度的短时间间隔中,图4B(b)所示的基准波形和图4B(c)所示的多个声音被混合的声音波形的相位差,在时间上起伏变大。在此,若考虑与本发明所定义的相位的关系,则在图4B(d)所示的相位差上,加上图2(b)所示的基底波形在时间轴方向移动了t时的相位增加部分2πft而得到的值,是本发明所定义的相位。因此,在不具有音色的声音中,本发明中的相位的图形以1/f的时刻为周期进行有规则性地反复。 \n[0125] 这样,利用根据像图4A(d)或图4B(d)所示的基准波形的相位差,通过根据基本波形的相位差在时间上的起伏大小来求相位距离,从而能够判断具有音色的声音和不具有音色的声音。并且,利用在将图2(c)所示的基底波形向时间轴方向移动时而求出的本发明中的相位,通过相位在以1/f(f为分析频率)的时刻为周期而反复进行的时间波形上的偏离,来求相位距离,从而能够判断具有音色的声音和不具有音色的声音。以上的这些方法都是利用相位距离来对具有音色的声音和不具有音色的声音进行判断的具体方法,所述相位距离是指,将相位以ψ′(t)=mod2π(ψ(t)-2πft)(f为分析频率)来表示时的相位间的距离。 \n[0126] 并且可以考虑到,像警报音这种机械上与正弦波接近的声音和像摩托车(引擎声音)这种物理构造上的声音,他们的相位的时间变化在规则性上程度不同。为此,若以不等号来表示相位的时间变化的规则程度,则可以考虑以公式1来表示。 \n[0127] 像(公式1) \n[0128] 规则性=正弦波>警报音>摩托车声音(引擎声音)>背景噪声>随机这样,在从警报音和摩托车声音和背景噪声的混合音中判断摩托车声音的频率信号的情况下,只要对相位的时间变化的规则程度进行判断就可以。 \n[0129] 并且,在本发明中,通过利用相位距离,可以在不必考虑噪声和抽出音的频率信号的功率大小的情况下,对抽出音的频率信号进行判断。例如,即使在某一时频区域中的噪声的频率信号的功率大的情况下,也可以通过 利用相位的规则性,来判断比该噪声的功率大的时频区域中的抽出音的频率信号,并且还能够判断比该噪声的功率小的时频区域中的抽出音的频率信号。 \n[0130] 以下,参照附图对本发明的实施例进行说明。 \n[0131] (实施例1) \n[0132] 图5是本发明的实施例1中的噪声除去装置的外观图。噪声除去装置100包括频率分析部、抽出音判断部、以及声音抽出部,通过在作为构成计算机的一个部件的CPU上执行用于实现这些处理部的功能的程序来实现。并且,各种中间数据以及执行结果数据等被存储在存储器中。 \n[0133] 图6以及图7是本发明的实施例1中的噪声除去装置的构成方框图。 [0134] 在图6中,噪声除去装置100包括:FFT(快速傅立叶变换)分析部2402(频率分析部)和噪声除去处理部101(由抽出音判断部和声音抽出部构成)。FFT分析部2402以及噪声除去处理部101是通过在计算机上执行用于实现各个处理部的功能的程序来实现的。 [0135] FFT分析部2402是一处理部,对输入的混合音2401进行快速傅里叶变换处理,从而求出混合音2401的频率信号。以下,将在FFT分析部2402求出的频率信号的频带的个数设为M,并以符号j(j=1至M)来表示指定这些频带的编号。 \n[0136] 噪声除去处理部101包括抽出音判断部101(j)(j=1至M)和声音抽出部202(j)(j=1至M)。噪声除去处理部101是一处理部,通过对由FFT分析部2402求出的频率信号,按照频带j(j=1至M),并利用抽出音判断部101(j)(j=1至M)和声音抽出部202(j)(j=1至M),从混合音中取出抽出音的频率信号,从而除去噪声。 \n[0137] 抽出音判断部101(j)(j=1至M)利用从规定的时间宽度中所包含的1/f(f为分析频率)的时间间隔的时刻中选择的多个时刻的频率信号,来求成为分析对象的时刻的频率信号和与成为分析对象的时刻不同的多个时刻的频率信号的相位距离。此时,在求相位距离时而使用的频率信号的数量由第一阈值以上的数量构成。并且,相位距离为,在时刻t的频率信号的相位为ψ(t)(弧度)时,以ψ′(t)=mod2π(ψ(t)-2πft)(f为分析频率)来表示相位时的频率信号的相位的距离。并且, 将作为相位距离在第二阈值以下的分析对象的时刻的频率信号判断为抽出音的频率信号2408。 \n[0138] 最后,声音抽出部202(j)(j=1至M)通过取出抽出音判断部101(j)(j=1至M)所判断的抽出音的频率信号2408,从而从混合音中除去噪声。 \n[0139] 通过在移动规定的时间宽度时执行这些处理,从而能够按照时频区域来取出抽出音的频率信号2408。 \n[0140] 图7是示出抽出音判断部101(j)(j=1至M)的构成方框图。 \n[0141] 抽出音判断部101(j)(j=1至M)由频率信号选择部200(j)(j=1至M)和相位距离判断部201(j)(j=1至M)构成。 \n[0142] 频率信号选择部200(j)(j=1至M)是一处理部,从规定的时间宽度的频率信号中选择由第一阈值以上的数量构成的频率信号,以作为在求相位距离时所使用的频率信号。相位距离判断部201(j)(j=1至M)是一处理部,利用频率信号选择部200(j)(j=1至M)所选择的频率信号的相位来计算相位距离,将相位距离在第二阈值以下的频率信号判断为抽出音的频率信号2408。 \n[0143] 以下,对具有以上这种构成的噪声除去装置100的工作进行说明。 [0144] 以下,对第j个频带进行说明。对于其他的频带也进行同样的处理。在此,以频带的中心频率和分析频率(在求相位距离ψ′(t)=mod2π(ψ(t)-2πft)中的频率f)一致的情况为例进行说明。在这种情况下,能够判断频率f中是否存在抽出音。作为其他的方法,也可以将包括频带的多个频率作为分析频率来进行抽出音的判断。在这种情况下,能够判断中心频率的周边频率中是否存在抽出音。 \n[0145] 图8以及图9是示出噪声除去装置100的工作顺序的流程图。 \n[0146] 在此,将语音(有声音)和白噪声的混合音(在计算机上混合而制作的)作为混合音2401的一个例子来进行说明。该例子中的目的在于,从混合音2401中除去白噪声(不具有音色的声音),并抽出语音(具有音色的声音)的频率信号。 \n[0147] 图10示出了语音和白噪声的混合音2401的声谱图的一个例子。横轴为时间轴,纵轴为频率轴。颜色的浓度表示频率信号的功率的大小,浓的 颜色表示频率信号大。在此示出了50Hz至1000Hz的频率范围的0秒至5秒的声谱图。在此对频率信号的相位成分的表示进行省略。 \n[0148] 图11示出了在制作图10所示的混合音2401时所使用的语音的声谱图。由于表示方法与图10相同,因此省略详细说明。 \n[0149] 根据图10和图11,在混合音2401中,能够仅对语音的频率信号的功率大的部分中的语音进行观测。并且可以知道此时的语音的谐波结构出现了局部消失。 [0150] 首先,FFT分析部2402接受混合音2401,并通过对混合音2401进行快速傅里叶变换处理,来求混合音2401的频率信号(步骤S300)。在此例子中,通过快速傅里叶变换处理,来求复数空间上的频率信号。在该例子中的快速傅里叶变换处理的条件是,通过利用时间窗宽度ΔT=64ms(1024pt)的汉宁(Hanning)窗,来处理以采样频率=16000Hz而被采样的混合音2401。并且,时间轴方向上,在移动1pt(0.0625ms)的时间的同时求出各个时刻的频率信号。仅表示该处理结果中的频率信号的功率大小的图为图10。 \n[0151] 之后,噪声除去处理部101对在FFT分析部2402求出的频率信号,按照频带j,并利用抽出音判断部101(j),按照时频区域在混合音中判断抽出音的频率信号(步骤S301(j))。并且,通过利用声音抽出部202(j),取出在抽出音判断部101(j)判断的抽出音的频率信号,来进行噪声的除去(步骤S302(j))。在此之后,仅对第j个频带进行说明。对于其他的频带的处理是相同的。在此例子中,第j个频带的中心频率为f。 [0152] 抽出音判断部101(j)利用在规定的时间宽度(192ms)中的1/f的时间间隔的所有时刻的频率信号,来求成为分析对象的时刻的频率信号和与成为分析对象的时刻不同的所有时刻的频率信号的相位距离。在此,采用规定的时间宽度中所包含的1/f的时间间隔的频率信号的数量的30%的值,以作为第一阈值,在此例子中,规定的时间宽度中所包含的1/f的时间间隔的频率信号的数量在第一阈值以上的情况下,利用该规定的时间宽度中所包含的所有的频率信号来求相位距离。并且,将相位距离在第二阈值以下的成为分析对象的时刻的频率信号判断为抽出音的频率信号2408(步骤S301(j))。最后,声音抽出部\n202(j)通过取出在抽出音判断部 101(j)判断为抽出音的频率信号的频率信号,从而除去噪声(步骤S302(j))。在此,以频率f=500Hz的情况为例进行说明。 \n[0153] 图12(b)在模式上示出了图12(a)所示的混合音2401中的频率f=500Hz的频率信号。图12(a)与图10相同,在图12(b)中示出了,水平轴为时间轴,垂直平面上的两个轴分别为频率信号的实部和虚部。在此例子中,由于频率f=500Hz,因此1/f=2ms。 [0154] 首先,频率信号选择部200(j)选择第一阈值以上的、规定的时间宽度中1/f的时间间隔的所有的频率信号(步骤S400(j))。此时,在用于求出相位距离而被选择的频率信号的数量少的情况下,判断相位的时间变化的规则性将会变得困难。在图12(b)中,从1/f的时间间个的时刻选择出来的频率信号的位置以白圆圈来表示。在此,如图12(b)所示,从\n1/f=2ms的时间间隔中选择出所有的时刻的频率信号。 \n[0155] 在此,图13A和图13B示出了频率信号的其他的选择方法。由于表示的方法与图\n12(b)相同,因此省略详细说明。图13A示出了从1/f的时间间隔的时刻中选择1/f×N(N=2)的时间间隔的时刻的频率信号的一个例子。并且,图13B是出了从1/f的时间间隔的时刻中选择随意选择的时刻的频率信号的一个例子。即,选择频率信号的方法可以采用用于选择从1/f的时间间隔的时刻得到得频率信号的所有的方法。但是,被选择的频率信号的数量要在第一阈值以上。 \n[0156] 在此,频率信号选择部200(j)也设定在相位距离判断部201(j)用于相位距离的计算时的频率信号的时间范围(规定的时间宽度),对于时间范围的设定方法的说明将与相位距离判断部201(j)的说明一起进行。 \n[0157] 之后,相位距离判断部201(j)利用频率信号选择部200(j)所选择的频率信号,来计算相位距离(步骤S401(j))。在此,采用以功率而被正规化了的频率信号彼此之间的相关值的倒数来作为相位距离。 \n[0158] 图14示出了求出相位距离的方法的一个例子。图14所示的方法中,对于与图\n12(b)共同的部分省略说明。在图14中,以黑圆点来表示成为分析对象的时刻的频率信号,以白圆圈来表示与成为分析对象的时刻不同的时刻中被选择出来的频率信号。 [0159] 在此例子中,从与成为分析对象的时刻(黑圆圈的时刻)相差±96 ms以内的时刻(规定的时间宽度为192ms)中存在的1/f(=2ms)的时间间隔的时刻中,除去成为分析对象的时刻的时刻的频率信号,将该频率信号作为用于求出与成为分析对象的频率信号的相位距离的频率信号。在此,规定的时间宽度的时间长度为,根据作为抽出音的语音的特征在实验中求出的值。 \n[0160] 对于相位距离的计算方法将在以下进行说明。在此例子中,利用1/f的时间间隔的频率信号来计算相位距离。以下利用公式2来表示频率信号的实部, \n[0161] (公式2) \n[0162] xk(k=-K,...,-2,-1,0,1,2,...,K) \n[0163] 利用公式3来表示频率信号的虚部。 \n[0164] (公式3) \n[0165] yk(k=-K,...,-2,-1,0,1,2,...,K) \n[0166] 在此的符号k是指定频率信号的编号。k=0的频率信号表示成为分析对象的时刻的频率信号。零以外的k(k=-K,…,-2,-1,1,2,…,K)的频率信号表示用于求出与成为分析对象的时刻的频率信号的相位距离的频率信号(参照图14)。 \n[0167] 在此,为了求出相位距离,因此,求以频率信号的功率的大小进行了正规化的频率信号。以功率对频率信号的实部进行正规化后的值以公式4来表示, \n[0168] (公式4) \n[0169] \n[0170] 以功率对频率信号的虚部进行正规化后的值以公式5来表示。 \n[0171] (公式5) \n[0172] \n[0173] 利用公式6计算相位距离S。 \n[0174] (公式6) \n[0175] \n[0176] 由于,在此的频率信号为ψ′(t)=mod2(ψ(t)-2ft)=ψ(t),因此,能够直接利用频率信号来计算相位距离。 \n[0177] 对于其他的相位距离S的算出方法如以下所示。在计算相关值中,采用的方法如下:以合计了频率信号的数量来进行正规化的方法,即, \n[0178] (公式7) \n[0179] \n[0180] 加上成为分析对象的时刻的频率信号彼此之间的相位距离的方法,即, [0181] (公式8) \n[0182] \n[0183] 利用频率信号的差分误差的方法,即, \n[0184] (公式9) \n[0185] \n[0186] 利用相位的差分误差的方法,即, \n[0187] (公式10) \n[0188] \n[0189] \n[0190] 以及利用相位的方差值等方法。成为ψ′(t)=mod2(ψ(t)-2ft)=ψ(t),能够以利用ψ(t)的简单的计算来求出相位距离。在此,公式6、公式7、公式8中的α是为了不使S发散为无限大而预先规定的一个小的值。 \n[0191] (公式11) \n[0192] α \n[0193] 另外,对于相位的值,可以在考虑连接成环状(是指0(弧度)和2π(弧度)是相同的)的情况下来求相位距离。例如,在利用公式10所示的相位的差分误差来计算相位距离的情况下,在右边部分可以以公式12来求相位距离。 \n[0194] (公式12) \n[0195] |mod 2π(arctan(y0/x0))-mod 2π(arctan(yk/xk))|≡ \n[0196] min{|mod 2π(arctan(y0/x0))-mod 2π(arctan(yk/xk))|, \n[0197] |mod 2π(arctan(y0/x0))-(mod 2π(arctan(yk/xk))+2π)|, \n[0198] |mod 2π(arctan(y0/x0))-(mod 2π(arctan(yk/xk))-2π)|} \n[0199] 之后,相位距离判断部201(j),将相位距离在第二阈值以下的成为分析对象的每个频率信号判断为抽出音(语音)的频率信号2408(步骤S402(j))。第二阈值被设定成,根据在语音和白噪声的192ms的时间宽度(规定的时间宽度)中的相位距离而尝试求出的值。 \n[0200] 这些处理可以作为,将在时间轴方向上移动1pt(0.0625ms)的时间的同时,求出的所有时刻的频率信号作为分析对象的频率信号来进行。 \n[0201] 最后,声音抽出部202(j)通过取出由抽出音判断部101(j)被判断为抽出音的频率信号2408的频率信号,从而除去噪声。 \n[0202] 图15示出了从图10所示的混合音2401抽出的语音的声谱图的一个例子。由于表示方法与图10相同,因此省略重复部分的说明。并且可以知道,从语音谐波结构发生局部消失的混合音中,语音的频率信号被抽出。 \n[0203] 在此,将对作为噪声而被除去的频率信号的相位进行讨论。在此,将第二阈值设定为π/2(弧度)。图16在模式上示出了在求相位距离的规定的时间宽度中的混合音的频率信号的相位。横轴为时间轴,纵轴为相位轴。黑圆点表示成为分析对象的频率信号的相位,白圆圈表示在与成为分析对象的频率信号之间求出相位距离的频率信号的相位。\n在此示出了1/f的时间间隔中的频率信号的相位。如图16(a)所示,求出在ψ′(t)=mod2π(ψ(t)-2πft)(f为分析频率)的相位的距离,与求出通过成为分析对象的频率信号的相位ψ(t)、且对于时刻t具有2πf 的倾斜的直线(在1/f的时间间隔中时间轴上成为水平的直线)和ψ(t)之间的距离相同。在图16(a)中,由于频率信号的相位聚集在该直线附近,因此,与第一阈值以上的数量的频率信号的相位距离则成为第二阈值以下,成为分析对象的频率信号被判断为抽出音的频率信号。并且,如图16(b)所示,通过成为分析对象的频率信号的相位,在对于时间具有2πf的倾斜的直线的附近几乎不存在频率信号的情况下,由于与第一阈值以上的数量的频率信号的相位距离比第二阈值大,因此,不会被判断为是抽出音的频率信号,而是作为噪声来除去。 \n[0204] 通过所具有的构成,在将时刻t的频率信号的相位设为ψ(t)(弧度)时,通过利用在ψ′(t)=mod2π(ψ(t)-2πft)(f为分析频率)的相位的距离,从而,能够按照时频区域对引擎声音、警报音、语音等具有音色的声音和风噪声、雨声、背景噪声等不具有音色的声音进行区别。并且,能够判断具有音色的声音(或不具有音色的声音)的频率信号。 [0205] 并且,在1/f(f为分析频率)的时间间隔的频率信号中成为ψ′(t)=mod2π(ψ(t)-2πft)=ψ(t),能够利用ψ(t)以简单地计算来算出相位距离。 [0206] 以下,对利用ψ′(t)=mod2π(ψ(t)-2πft)(f为分析频率)的相位距离进行说明。如利用图3A进行的说明那样,具有音色的声音的频率信号(设为具有频率f的成分),在规定的时间宽度,相位以规则的等角速度且在1/f的时间间隔之间旋转2π(弧度)。 \n[0207] 图17(a)示出了在进行频率分析时,以DFT(Discrete FourierTransform:离散傅里叶变换)的计算叠入到抽出音中的信号的波形。实部为余弦波形,虚部为负的正弦波形。\n在此,对频率f的信号进行分析。抽出音为频率f的正弦波时,在进行频率分析时的频率信号的相位ψ(t)的时间变化,如图17(b)所示为逆时针方向。此时,横轴表示实部,纵轴表示虚部。若将逆时针方向设为正,则相位ψ(t)在1/f的时间中增加2π(弧度)。并且,相位ψ(t)对于时刻t而言,以2πf的倾斜进行变化。利用图18对相位ψ(t)的时间变化成为逆时针方向的构成进行说明。图18(a)示出抽出音(频率f的正弦波)。在此,将抽出音的振幅的大 小(功率的大小)正规化为1。图18(b)示出了在进行频率分析时以DFT计算而被叠入抽出音的信号的波形(频率f)。实线表示实部的余弦波形,虚线表示虚部的负的正弦波形。图18(c)示出了以DFT计算将图18(a)的抽出音和图18(b)的波形叠入时的值的符号。通过图18(c)可知,时刻在(t1至t2)时,相位变化到图17(b)的第一象限,时刻在(t2至t3)时,相位变化到图17(b)的第二象限,时刻在(t3至t4)时,相位变化到图17(b)的第三象限,时刻在(t4至t5)时,相位变化到图17(b)的第四象限。这样可知,相位ψ(t)的时间变化为逆时针方向。 \n[0208] 需要补充说明的是,如图19(a)所示,若将横轴设为虚部,纵轴设为实部,则相位ψ(t)的增减正好相反。若将逆时针方向设为正,则相位ψ(t)在1/f的时间中减少2π(弧度)。即,相位ψ(t)对于时刻t以(-2πf)的倾斜来变化,在此,为了与图17(b)的轴的设定相吻合,对校正了的相位进行说明。并且,如图19(b)所示,在进行频率分析时叠入的波形成为,在将实部设为余弦波形、虚部设为正弦波形时,相位ψ(t)的增减是正好相反的,在将逆时针方向设为正时,相位ψ(t)在1/f的时间减少2π(弧度)。即,相位ψ(t)对于时刻t以(-2πf)的倾斜来变化,在此,为了与图17(a)的频率分析的结果相吻合,对校正了的实部和虚部的符号进行说明。 \n[0209] 据此,由于具有音色的声音的频率信号的相位ψ(t)对于时刻t以2πf的倾斜进行变化,因此,在ψ′(t)=mod2π(ψ(t)-2πft)(f为分析的频率)中的相位的距离变小。 \n[0210] (实施例1的变形例1) \n[0211] 以下,对实施例1所示出的噪声除去装置的变形例1进行说明。 \n[0212] 在此,作为混合音2401,以100Hz的正弦波和200Hz的正弦波以及300Hz的正弦波的混合音为例进行说明。该例子的目的在于,除去在混合音中的200Hz的正弦波(抽出音)中的、因100Hz的正弦波和300Hz的正弦波的频率的混入而产生的失真的频率信号。若能够正确地除去因频率的混入而产生的失真的频率信号,例如就能够正确地分析在混合音中所包含的引擎声音的频率结构,从而能够根据多普勒频移来检测接近的车辆。并且,能够正确地分析混合音中所包含的声音的共 振峰结构。 \n[0213] 图20是变形例1所涉及的噪声除去装置的构成。 \n[0214] 对于图20中与图6相同的构成要素赋予相同的参照符号,并省略重复地说明。\n在此例子中,与实施例1所涉及的噪声除去装置的不同之处是,以DFT(Discrete Fourier Transform)分析部1100(频率分析部)来取代FFT分析部2402。示出噪声除去装置110的工作顺序的流程图与实施例1相同,由图8以及图9示出。 \n[0215] 在图21中示出了利用100Hz的正弦波和200Hz的正弦波以及300Hz的正弦波的混合音2401时的频率200Hz中的频率信号的时间波形的一个例子。图21(a)中示出了频率200Hz中频率信号的实部的时间波形,图21(b)示出了频率200Hz中的频率信号的虚部的时间波形。横轴为时间轴,纵轴表示频率信号的振幅。在此示出了50ms的时间长度的时间波形。 \n[0216] 图22示出了在制作图21所示的混合音2401时所利用的200Hz的正弦波在频率\n200Hz中的频率信号的时间波形。由于表示的方法与图21相同,因此不重复详细说明。 [0217] 从图21和图22可知,在混合音2401中,200Hz的正弦波因被混入了100Hz的正弦波和300Hz的正弦波的频率,而存在失真部分。 \n[0218] 首先,DFT分析部1100接受混合音2401,并通过对混合音2401进行离散傅里叶变换处理,来求混合音2401的中心频率200Hz的频率信号(步骤S300)。在该例子中分析频率也作为200Hz。在该例子中的离散傅里叶变换处理的条件是,通过利用时间窗宽度ΔT=5ms(80pt)的汉宁(Hanning)窗,来处理以采样频率=16000Hz而被采样的混合音2401。\n并且,时间轴方向上,在移动1pt(0.0625ms)的时间的同时求出各个时刻的频率信号。仅表示该处理结果中的频率信号的时间波形的图为图21。 \n[0219] 之后,噪声除去处理部101对在DFT分析部1100求出的频率信号,按照频带j(j=\n1至M),并利用抽出音判断部101(j)(j=1至M),按照时频区域在混合音中判断抽出音的频率信号(步骤S301(j)(j=1至M))。并且,通过利用声音抽出部202(j)(j=1至M),取出在抽出音判 断部101(j)判断的抽出音的频率信号,来进行噪声的除去(步骤S302(j)(j=1至M))。在该例子中,M=1,j=第1个频带的中心频率f=200Hz(与分析频率的值相同)。以下,对j=1的情况进行说明,不过,j为其他的值的情况下进行同样的处理。 [0220] 抽出音判断部101(1)利用在规定的时间宽度(100ms)中的1/f(f为分析频率)的时间间隔的所有时刻的频率信号,来求成为分析对象的时刻的频率信号和与成为分析对象的时刻不同的所有时刻的频率信号的相位距离。在此,采用规定的时间宽度中所包含的\n1/f的时间间隔的频率信号的数量在第一阈值以上的情况下,利用该规定的时间宽度中所包含的所有的频率信号来求相位距离。并且,将相位距离在第二阈值以下的成为分析对象的时刻的频率信号判断为抽出音的频率信号2408(步骤S301(1))。 \n[0221] 最后,声音抽出部202(1)通过取出在抽出音判断部101(1)判断为抽出音的频率信号的频率信号,从而除去噪声(步骤S302(1))。 \n[0222] 以下,对步骤S301(1)的详细处理进行说明。首先,频率信号选择部200(1)与实施例1所示的例子相同,从规定的时间宽度中的1/f(f=200Hz)的时间间隔的时刻中选择第一阈值以上的数量的频率信号(步骤S400(1))。 \n[0223] 在此,与实施例1所示的例子不同之处是,相位距离判断部201在进行相位距离的计算时所使用的频率信号的时间范围(规定的时间宽度)的长度。在实施例1所示的例子中,时间范围为192ms,在求频率信号时所使用的时间窗的宽度ΔT为64ms。在此例子中,时间范围被设为100ms,在求频率信号时所使用的时间窗的宽度ΔT为5ms。 [0224] 之后,相位距离判断部201(1)利用频率信号选择部200(1)所选择的频率信号的相位,来计算相位距离(步骤S401(1))。由于在此的处理与实施例1所示的处理相同,因此省略重复说明。相位距离判断部201(1),将相位距离s在第二阈值以下的成为分析对象的时刻的频率信号判断为抽出音(语音)的频率信号2408(步骤S402(1))。据此,能够判断出在200Hz的正弦波中没有失真的部分的频率信号。 \n[0225] 最后,声音抽出部202(1)通过取出在抽出音判断部101(1)判断为抽出 音的频率信号2408的频率信号,从而除去噪声(步骤S302(1))。由于在此的处理与实施例1所示的处理相同,因此省略重复说明。 \n[0226] 图23示出了从图21所示的混合音2401中抽出的200Hz中的频率信号的时间波形。对于表示方法中与图21共同的部分省略说明。在图23中,斜线部分的区域是因频率的混入而产生了失真的频率信号,因而被除去的部分。对图23与图21和图22进行比较可知,因100Hz的正弦波的频率混入和300Hz的正弦波的频率混入而产生的频率信号,从混合音2401中被除去,200Hz的正弦波的频率信号被抽出。 \n[0227] 通过实施例1以及实施例1的变形例1所涉及的构成,通过采用相位距离,从而能够除去在细分时间分解(ΔT)时而造成的、因周边频率的混入而产生的失真频率信号,所述相位距离是指,成为分析对象的时刻的频率信号,和包括成为分析的对象的时刻、且包括相隔ΔT的时间间隔的时刻的多个时刻的频率信号的相位距离。 \n[0228] (实施例1的变形例2) \n[0229] 以下,对实施例1所示的噪声除去装置的变形例2进行说明。 \n[0230] 变形例2所涉及的噪声除去装置具有与参照图6和图7所说明的实施例1所涉及的噪声除去装置同样的构成。但是,噪声除去处理部101所执行的处理不同。 [0231] 在抽出音判断部101(j)中,相位距离判断部201(j)利用频率发信号选择部\n200(j)所选择的1/f的时间间隔的时刻的频率信号,制作相位的直方图。相位距离判断部\n201(j),根据制作出的直方图,将相位距离为第二阈值以下且出现频繁度在第一阈值以上的频率信号判断为抽出音频率信号2408。 \n[0232] 最后,声音抽出部202(j)通过取出由相位距离判断部201(j)被判断为抽出音的频率信号2408,从而除去噪声。 \n[0233] 以下,对具有以上这种构成的噪声除去装置100的工作进行说明。示出噪声除去装置100的工作顺序的流程图与实施例1相同,由图8以及图9示出。 \n[0234] 噪声除去处理部101对在FFT分析部2402(频率分析部)求出的频率信号,按照频带j(j=1至M),并利用抽出音判断部101(j)(j=1至 M),来判断抽出音的频率信号(步骤S301(j)(j=1至M))。在此之后,仅对第j个频带进行说明。对于其他的频带的处理是相同的。在此例子中,第j个频带的中心频率为f。 \n[0235] 抽出音判断部101(j),利用频率信号选择部200(j)所选择的1/f的时间间隔的时刻的频率信号制作相位的直方图。并且,将相位距离在第二阈值以下,且出现频繁度在第一阈值以上的频率信号判断为抽出音的频率信号2408(步骤S301(j))。 \n[0236] 相位距离判断部201(j)利用频率信号选择部200(j)所选择的频率信号,来制作所述频率信号的相位的直方图,并判断相位距离(步骤S401(j))。以下,对求直方图的方法进行说明。 \n[0237] 以公式2和公式3来表示频率信号选择部200(j)所选择的频率信号。在此,利用以下的公式来求频率信号的相位。 \n[0238] (公式13) \n[0239] \n[0240] 图24示出了制作频率信号的相位的直方图的方法的一个例子。在此,以相位区间为Δψ(i)(i=1至4),通过求出按照相位针对时间以2πf(f为分析频率)的倾斜来变化的频域的、规定时间宽度中的频率信号的出现频繁度,来制作直方图。图24的斜线所表示的部分是Δψ(1)的区域。在此,由于将相位限制在0至2π(弧度)之间来表示的,因此成为分散隔开的区域。在此,通过按照Δψ(i)(i=1至4)计数这些区域中所包含的频率信号的数量,从而制作直方图。 \n[0241] 图25示出了频率信号选择部200(j)所选择的频率信号和该频率信号的相位的直方图的一个例子。在此,以比图24的直方图更小的Δψ(i)(i=1至L)来分析。 [0242] 图25(a)示出了被选择的频率信号。由于图25(a)的表示的方法与图12(b)相同,因此省略详细说明。在此例子中,被选择的频率信号中包含语音A(具有音色的声音)和语音B(具有音色的声音)和背景噪声(不具有音色的声音)以及频率信号。 \n[0243] 图25(b)在模式上示出了频率信号的相位的直方图的一个例子。语音A 的频率信号的集合具有相似的相位(在此例子中为π/2(弧度)的近旁),语音B的频率信号的集合具有相似的相位(在此例子中为π(弧度)的近旁)。为此,在直方图的π/2(弧度)的近旁和π(弧度)的近旁呈现两个山形。并且,由于背景噪声的频率信号不具有特定的相位,因此,直方图中没有呈现出山形。 \n[0244] 在此,相位距离判断部201(j),将相位距离为第二阈值(π/4(弧度)以下、且出现频繁度在第一阈值(规定的时间宽度中所包含的1/f的时间间隔的所有频率信号的数量的\n30%)以上的频率信号,判断为抽出音的频率信号2408。在该例子中,π/2(弧度)的近旁的频率信号和π(弧度)近旁的频率信号被判断为抽出音的频率信号2408。此时,π/2(弧度)近旁的频率信号和π(弧度)近旁的频率信号之间的相位距离为π/4(弧度)(第三阈值)以上。为此,这两个山形的频率信号的集合被判断为不同种类的抽出音。即,区别语音A和语音B,作为两个抽出音的频率信号来判定。 \n[0245] 最后,声音抽出部202(j)通过取出各个由相位距离判断部201(j)判断的不同种类的抽出音的频率信号,从而除去噪声(步骤S402)。 \n[0246] 通过所涉及的构成,抽出音判断部制作多个由第一阈值以上的数量构成、且频率信号间的相位的相似性在第二阈值以下的频率信号的集合。并且,抽出音判断部将频率信号的集合之中相位距离成为第三阈值以上的频率信号的各个集合判断为不同种类的抽出音。通过这些处理,在相同时频区域中存在有多个种类的抽出音的情况下,能够对这些抽出音进行区别并判断。例如,能够区别多个车辆的引擎声音,并判断。为此,在将本发明的噪声除去装置适用于车辆检测装置的情况下,能够向驾驶者通知存在多个不同的车辆,从而驾驶者能够安全驾驶。并且,能够区别并判断多个人的语音。为此,在将本发明的噪声除去装置适用于语音抽出装置的情况下,能够将多个人的语音分离并能够听到。 [0247] 例如,若将本发明的噪声除去装置组装到语音输出装置中,则能够按照时频区域从混合音中判断语音的频率信号之后,通过进行逆频率变换,从而能够输出清晰的语音。并且,例如,若将本发明的噪声除去装置组装到声源方向检测装置中,则能够通过抽出被除去噪声之后的抽出音的频率信号,从而求出正确的声源方向。并且,例如,若将本发明的噪声除去装 置组装到语音识别装置中,则即使周围存在噪声,也能够通过按照时频区域从混合音中抽出语音的频率信号,从而能够正确地进行语音识别。并且,例如,若将本发明的噪声除去装置组装到声音识别装置中,则即使周围存在噪声,也能够通过按照时频区域从混合音中抽出抽出音的频率信号,从而能够正确地进行声音识别。并且,例如,若将本发明的噪声除去装置组装到其它的车辆检测装置中,则在按照时频区域从混合音中抽出引擎声音的频率信号时,能够通知车辆的接近。并且,例如,若将本发明的噪声除去装置组装到救急车辆检测装置中,则在按照时频区域从从混合音中抽出警报音的频率信号时,能够通知救急车辆的接近。 \n[0248] 并且,在本发明,若考虑没有被判断为抽出音(具有音色的声音)的噪声(不具有音色的声音)的频率信号被抽出的情况,例如,若将本发明的噪声除去装置组装到风声等级判断装置中,则能够按照时频区域从混合音中抽出风噪声的频率信号,并且能够求出功率大小并输出。并且,例如,若将本发明的噪声除去装置组装到其它的车辆检测装置中,则在按照时频区域从混合音中抽出因轮胎摩擦而产生的行驶声音的频率信号,从而能够从功率的大小中检测到车辆的接近。 \n[0249] 并且,作为频率分析部可以采用余弦变换、小波变换或者带通滤波器等。 [0250] 并且,作为频率分析部的窗函数可以采用汉明窗、矩形窗或布拉克曼窗(Blackman Window)等。 \n[0251] 并且,频率分析部所求出的频率信号的中心频率f和求出相位距离的分析频率f′可以采用不同的值。此时,在中心频率f的频率信号中存在有频率f′中的频率信号的情况下,该频率信号被判断为抽出因的频率信号。并且,该频率信号的详细的频率为f′。 [0252] 并且,在实施例1以及变形例1中,抽出音判断部101(j)(j=1至M)针对1/f(f为分析频率)的时间间隔时刻的过去时刻和未来时刻,从同一时间区间K(时间宽度为96ms)中选择了频率信号,但并非受此所限。例如,也可以针对过去时刻和未来时刻从不同的时间区间中选择频率信号。 \n[0253] 并且,在实施例1以及变形例1中,设定了成为求出相位距离时的分 析对象的时刻的频率信号,并针对各个时刻的频率信号判断了是否存在抽出音的频率信号,但并非受此所限。例如,可以将多个频率信号之间的相位距离合在一起来求,通过与第二阈值进行比较,从而可以对多个频率信号的全部是否为抽出音的频率信号一起进行判断。此时,分析的是时间区间的平均相位的时间变化。为此,即使噪声的相位偶尔与抽出音相位一致,也能够稳定地判断抽出音的频率信号。 \n[0254] (实施例2) \n[0255] 以下,对实施例2所涉及的噪声除去装置进行说明。实施例2所涉及的噪声除去装置与实施例1所涉及的噪声除去装置不同,在将混合音的时刻t的频率信号的相位设为ψ(t)(弧度)时,将相位校正为ψ′(t)=mod2π(ψ(t)-2πft)(f为分析频率),利用校正后的频率信号的相位ψ′(t)来判断抽出音的频率信号并除去噪声。 \n[0256] 图26以及图27是本发明的实施例2中的噪声除去装置的构成方框图。 [0257] 在图26中,噪声除去装置1500包括:FFT分析部2402(频率分析部)和噪声除去处理部1504。在噪声除去处理部1504中包括相位校正部1501(j)(j=1至M)、抽出音判断部1502(j)(j=1至M)、以及声音抽出部1503(j)(j=1至M)。 \n[0258] FFT分析部2402是一处理部,对输入的混合音2401进行快速傅里叶变换处理,从而求出混合音2401的频率信号。以下,将在FFT分析部2402求出的频带的个数设为M,并以符号j(j=1至M)来表示指定这些频带的编号。 \n[0259] 相位校正部1501(j)(j=1至M)是一处理部,在针对FFT分析部2402所求出的频带j的频率信号,将时刻t的频率信号的相位设为ψ(t)(弧度)时,将相位校正为ψ′(t)=mod2π(ψ(t)-2πft)(f为分析频率)。 \n[0260] 抽出音判断部1502(j)(j=1至M)在规定的时间宽度中,求出作为分析对象的时刻的被相位校正后的频率信号,和与成为分析对象的时刻不同的其他的多个时刻的被相位校正后的频率信号的相位距离。此时,在求相位距离时而使用的频率信号的数量由第一阈值以上的数量构成。此时的相位距离利用ψ′(t)来计算。并且,将作为相位距离在第二阈值以下 的分析对象的时刻的频率信号判断为抽出音的频率信号2408。 \n[0261] 最后,声音抽出部1503(j)(j=1至M)通过取出抽出音判断部1502(j)(j=1至M)所判断的抽出音的频率信号2408,从而从混合音中除去噪声。 \n[0262] 通过在移动规定的时间宽度时执行这些处理,从而能够按照时频区域来取出抽出音的频率信号2408。 \n[0263] 图27是示出抽出音判断部1502(j)(j=1至M)的构成方框图。 \n[0264] 抽出音判断部1502(j)(j=1至M)由频率信号选择部1600(j)(j=1至M)和相位距离判断部1601(j)(j=1至M)构成。 \n[0265] 频率信号选择部1600(j)(j=1至M)是一处理部,在规定的时间宽度中,从相位校正部1501(j)(j=1至M)进行相位校正后的频率信号中,选择相位距离判断部1601(j)(j=1至M)在计算相位距离时所使用的频率信号。相位距离判断部1601(j)(j=1至M)是一处理部,利用频率信号选择部1600(j)(j=1至M)所选择的频率信号的被校正后的相位ψ′(t)来计算相位距离,将相位距离在第二阈值以下的频率信号判断为抽出音的频率信号2408。 \n[0266] 以下,对具有以上这种构成的噪声除去装置1500的工作进行说明。 [0267] 以下,对第j个频带进行说明。对于其他的频带也进行同样的处理。在此,以频带的中心频率和分析频率(在求相位距离ψ′(t)=mod2π(ψ(t)-2πft)中的频率f)一致的情况为例进行说明。在这种情况下,能够判断频率f中是否存在抽出音。作为其他的方法,也可以将包括频带的周边的多个频率作为分析频率来进行抽出音的判断。在这种情况下,能够判断中心频率的周边频率中是否存在抽出音。在此的处理与实施例1相同。 [0268] 图28以及图29是示出噪声除去装置1500的工作顺序的流程图。 \n[0269] 首先,FFT分析部2402接受混合音2401,并通过对混合音2401进行快速傅里叶变换处理,来求混合音2401的频率信号(步骤S300)。在此,与实施例1同样求出频率信号。 [0270] 之后,相位校正部1501(j)在针对FFT分析部2402所求出的频带j的频率信号,将时刻t的频率信号的相位设为ψ(t)(弧度)时,通过将相 位变换为ψ′(t)=mod2π(ψ(t)-2πft)(f为分析频率),从而进行相位校正(步骤S1700(j))。 [0271] 利用图30至图32对进行相位校正的方法的一个例子进行说明。图30(a)在模式上示出了FFT分析部2402所求出的频率信号。图30(b)在模式上示出了从图30(a)求出的频率信号的相位。图30(c)在模式上示出了从0(a)求出的频率信号的大小(功率)。图\n30(a)、30(b)以及30(c)的横轴为时间轴。图30(a)的表示方法与图12(b)相同,在此省略重复说明。图30(b)的纵轴表示频率信号的相位,以0至2π(弧度)之间的值来表示。\n图30(c)的纵轴表示频率信号的大小(功率)。频率信号的相位ψ(t)以及大小(功率)P(t)为,频率信号的实部以公式14来表示, \n[0272] (公式14) \n[0273] x(t) \n[0274] 频率信号的虚部以公式15来表示, \n[0275] (公式15) \n[0276] y(t) \n[0277] (公式16) \n[0278] \n[0279] 以及 \n[0280] (公式17) \n[0281] \n[0282] 在此的记号t表示频率信号的时刻。 \n[0283] 在此,通过将图30(b)所示的频率信号的相位ψ(t)变换为ψ′(t)=mod2π(ψ(t)-2πft)(f为分析频率)的值,从而进行相位校正。 \n[0284] 首先,决定基准时刻。图31(a)与图30(b)的内容相同,在此例子中,将图31(a)的黑圆点的时刻t0决定为基准时刻。 \n[0285] 之后,决定校正相位的频率信号的多个时刻。在此例子中,图31(a)的五个白圆圈的时刻(t1、t2、t3、t4、t5)决定为校正相位的频率信号的时刻。 \n[0286] 在此,以公式18来表示基准时刻t 0中的频率信号的相位, \n[0287] (公式18) \n[0288] \n[0289] 以公式19来表示校正相位的五个时刻的频率信号的相位。 \n[0290] (公式19) \n[0291] \n[0292] 这些被校正之前的相位在图31(a)中以“×”来表示。并且,对应的时刻的频率信号的大小以公式20来表示。 \n[0293] (公式20) \n[0294] \n[0295] 之后,图32示出了校正时刻t 2中的频率信号的相位的方法。图32(a)和图31(a)的内容相同。并且,图32(b)示出了,以1/f(f为分析频率)的时间间隔并以等角速度,从\n0至2π(弧度)进行有规则地变化的相位。在此,校正后的相位以公式21来表示。 [0296] (公式21) \n[0297] \n[0298] 在图32(b)中,若对基准时刻t0和时刻t2的相位差进行比较,则时刻t2的相位比时刻t0的相位大公式22所示的值。 \n[0299] (公式22) \n[0300] \n[0301] 在此,在图32(a)中,由于要校正因与基准时刻t0的相位ψ(t0)的时间差而引起的相位差,因此,从时刻t2的相位ψ(t2)中减去Δ ψ从而求出ψ′(t2)。这是相位校正后的时刻t2的相位。此时,由于时刻t0的相位是基准时刻的相位,因此相位校正后的值是相同的。具体而言,由公式23和公式24来求相位校正后的相位。 \n[0302] (公式23) \n[0303] \n[0304] (公式24) \n[0305] \n[0306] 相位校正后的频率信号的相位在图31(b)中以“×”来表示。由于图31(b)的表示方法与图31(a)同样,因此省略详细的重复说明。 \n[0307] 之后,抽出音判断部1502(j)利用在相位校正部1501(j)求出的规定的时间宽度中的相位校正后的频率信号,来求成为分析对象的时刻的频率信号和与成为分析对象的时刻不同的多个时刻的频率信号的相位距离。此时,在求相位距离时而使用的频率信号的数量由第一阈值以上的数量构成。并且,将相位距离在第二阈值以下的成为分析对象的时刻的频率信号判断为抽出音的频率信号2408(步骤S1701(j))。 \n[0308] 首先,频率信号选择部1600(j)从相位校正部1501(j)所求出的规定的时间宽度中的相位校正后的频率信号中,选择相位距离判断部1601(j)在计算相位距离时所使用的频率信号(步骤S1800(j))。在此,将成为分析对象的时刻设为t0,将由于求出与时刻t0的频率信号的相位距离的多个频率信号的时刻设为t1、t2、t3、t4、t5。此时,在求相位距离时而使用的频率信号的数量(t0至t5共六个)由第一阈值以上的数量构成。这是因为,在为了求出相位距离而被选择的频率信号的数量少的情况下,判断相位的时间变化的规则性是比较困难的缘故。在此,规定的时间宽度的时间长度是根据抽出音的相位的时间变化的性质来决定的。 \n[0309] 之后,相位距离判断部1601(j)利用频率信号选择部1600(j)所选择的相位校正后的频率信号,来计算相位距离(步骤S1801(j))。在此例子中,相位距离S是相位的差分误差,以公式25来求。 \n[0310] (公式25) \n[0311] \n[0312] 并且,将成为分析对象的时刻设为t2,将用于求出与时刻t2的频率信号的相位距离的多个频率信号的时刻设为t0、t1、t3、t4、t5时的相位距离S成为公式26所示。 [0313] (公式26) \n[0314] \n[0315] 另外,对于相位的值,可以在考虑连接成环面状(是指0(弧度)和2π(弧度)是相同的)的情况下来求相位距离。例如,在利用公式25所示的相位的差分误差来计算相位距离的情况下,在右边部分可以以公式27来求相位距离。 \n[0316] (公式27) \n[0317] \n[0318] \n[0319] 在此例子中,频率信号选择部1600(j)从相位校正部1501(j)所求出的相位校正后的频率信号中,选择相位距离判断部1601(j)在计算相位距离时所使用的频率信号。作为其他的方法也可以是,将相位校正部1501(j)进行相位校正的频率信号,预先由频率信号选择部1600(j)来选择,相位距离判断部1601(j)直接利用由相位校正部1501(j)进行相位校正后的频率信号来求相位距离。此时,由于仅对用于计算相位距离的频率信号进行相位校正,因此能够消减处理量。 \n[0320] 之后,相位距离判断部1601(j),将相位距离在第二阈值以下的成为分析对象的每个频率信号判断为抽出音的频率信号2408(步骤S1802(j))。 \n[0321] 最后,声音抽出部1503(j)通过取出由抽出音判断部1502(j)被判断为抽出音的频率信号2408,从而除去噪声。 \n[0322] 在此,将对作为噪声而被除去的频率信号的相位进行讨论。在该例子中,将相位距离设为相位的差分误差。并且,将第二阈值设定为π(弧度)。并且,将第三阈值设定为π(弧度)。 \n[0323] 图33在模式上示出了在求相位距离的规定的时间宽度(192ms)中的混合音的频率信号被相位校正后的相位ψ′(t)。横轴表示时间t,纵轴表示被相位校正后的相位ψ′(t)。黑圆点表示成为分析对象的频率信号的相位,白圆圈表示在与成为分析对象的频率信号之间求出相位距离的频率信号的相位。如图33(a)所示,求相位距离和求与通过成为分析对象的频率信号的相位校正后的相位、且与时间轴平行的直线的相位距离相同。\n在图33(a)中,在该直线的近旁聚集了求相位距离的频率信号的被相位校正后的相位。为此,与第一阈值以上的数量的频率信号的相位距离则成为第二阈值以下(π(弧度)),成为分析对象的频率信号被判断为抽出音的频率信号。并且,如图33(b)所示,通过成为分析对象的频率信号的相位,在对于时间轴具有平行倾斜的直线的近旁几乎不存在求相位距离的频率信号的情况下,与第一阈值以上的数量的频率信号的相位距离比第二阈值大(π(弧度))。为此,成为分析对象的频率信号不会被作为抽出音的频率信号被判断,而是作为噪声被除去。 \n[0324] 图34在模式上示出了混合音的相位的另外的例子。横轴为时间轴,纵轴为相位轴。圆圈表示相位校正后的混合音的频率信号的相位。以实线围起来的各个频率信号属于同一个组,是相位距离在第二阈值(π(弧度))以下的频率信号的集合。这些组也可以利用多元分析来求。在同一个组中的、第一阈值以上的数量的频率信号所存在的组中的频率信号不是被除去而是被抽出,只有比第一阈值小的数量的频率信号所存在的组中的频率信号才作为噪声被除去。如图34(a)所示,在规定的时间宽度中只有一部分包含噪声部分的情况下,能够仅除去这一部分的噪声。并且,如图34(b)所示,即使在存在两种抽出音的情况下,通过针对规定的时间宽度,抽出该规定的时间宽度中所包含的频率信号的40%以上(在此为七个)的频率信号之间的相位距离成为第二阈值(π(弧度))以下的频率信号,从而能够抽出两个抽出音。此时,由于这些组之间的相位距离在第三阈值以上(π(弧度)),因此,频率信号被判断为不同种类的抽出音。 \n[0325] 通过所涉及的构成,在比1/f(f为分析频率)的时间间隔更小的时间间隔中的频率信号中,进行ψ′(t)=mod2π(ψ(t)-2πft)的校正。据此,针对比1/f(f为分析频率)的时间间隔更小 的时间间隔的频率信号的相位距离,可以利用ψ′(t)以简单地计算来求。为此,即使是1/f的时间间隔增大的低频带中的抽出音,也能够按照短时域利用ψ′(t)进行简单地计算,从而能够判断频率信号。 \n[0326] 例如,若将本发明的噪声除去装置组装到语音输出装置中,则能够按照时频区域从混合音中判断语音的频率信号之后,通过进行逆频率变换,从而能够输出清晰的语音。并且,例如,若将本发明的噪声除去装置组装到声源方向检测装置中,则能够通过抽出被除去噪声之后的抽出音的频率信号,从而求出正确的声源方向。并且,例如,若将本发明的噪声除去装置组装到语音识别装置中,则即使周围存在噪声,也能够通过按照时频区域从混合音中抽出语音的频率信号,从而能够正确地进行语音识别。《100%》并且,例如,若将本发明的噪声除去装置组装到声音识别装置中,则即使周围存在噪声,也能够通过按照时频区域从混合音中抽出抽出音的频率信号,从而能够正确地进行声音识别。并且,例如,若将本发明的噪声除去装置组装到其它的车辆检测装置中,则在按照时频区域从混合音中抽出引擎声音的频率信号时,能够通知车辆的接近。并且,例如,若将本发明的噪声除去装置组装到救急车辆检测装置中,则在按照时频区域从从混合音中抽出警报音的频率信号时,能够通知救急车辆的接近。 \n[0327] 并且,在本发明,若考虑没有被判断为抽出音(具有音色的声音)的噪声(不具有音色的声音)的频率信号被抽出的情况,例如,若将本发明的噪声除去装置组装到风声等级判断装置中,则能够按照时频区域从混合音中抽出风噪声的频率信号,并且能够求出功率大小并输出。并且,例如,若将本发明的噪声除去装置组装到其它的车辆检测装置中,则在按照时频区域从混合音中抽出因轮胎摩擦而产生的行驶声音的频率信号,从而能够从功率的大小中检测到车辆的接近。 \n[0328] 并且,作为频率分析部可以采用离散傅里叶变换、余弦变换、小波变换或者带通滤波器等。 \n[0329] 并且,作为频率分析部的窗函数可以采用汉明窗、矩形窗或布拉克曼窗(Blackman Window)等。 \n[0330] 并且,噪声除去装置1500虽然是针对FFT分析部2402所求出的所有(M个)频带进行噪声的除去的,不过也可以是在选择想要除去噪声的一部 分频带后,再除去所选择的频带中的噪声。 \n[0331] 并且,可以不规定成为分析对象的频率信号,而是通过求出多个频率信号间的相位距离,并与第二阈值进行比较,从而可以对多个频率信号的全部是否为抽出音的频率信号一起进行判断。此时,分析的是时间区间的平均相位的时间变化。为此,即使噪声的相位偶尔与抽出音相位一致,也能够稳定地判断抽出音的频率信号。 \n[0332] 并且,也可以利用相位校正后的相位,与实施例1的变形例1同样,利用频率信号的相位的直方图来判断抽出音的频率信号。在这种情况下,成为图35所示的直方图。由于表示方法与图24相同,因此省略重复部分的说明。由于进行了相位校正,因此直方图的Δψ′的区域与时间轴平行,便于求出出现频繁度。 \n[0333] 并且,通过利用相位校正后的相位ψ′(t)来计算公式28和公式29, [0334] (公式28) \n[0335] \n[0336] (公式29) \n[0337] \n[0338] 从而,求出以功率而被正规化了的频率信号的实部和虚部,利用实施例1中的相位距离(公式6、公式7、公式8、公式9)来判断抽出音的频率信号。 \n[0339] (实施例3) \n[0340] 以下,对实施例3所涉及的车辆检测装置进行说明。实施例3所涉及的车辆检测装置,从由多个麦克风输入的各个混合音中的至少一个混合音中,判断出存在引擎声音(抽出音)的频率信号时,输出抽出音检测标志,并向驾驶者通知有车辆接近。此时,根据以时刻和相位表示的空间中的近似直线,事先求出适合于每个时频区域的混合音,并针对求出的分析频率,根据求出的直线和相位的距离来求相位距离,并判断引擎声音的频率信号。 [0341] 图36和图37是示出本发明的实施例3中的车辆检测装置的构成的方 框图。 [0342] 在图36中,车辆检测装置4100包括:麦克风4107(1)、麦克风4107(2)、DFT分析部1100(频率分析部)、车辆检测处理部4101、以及出示部4106。在车辆检测处理部4101中包括:相位校正部4102(j)(j=1至M)、抽出音判断部4103(j)(j=1至M)、以及声音检测部4104(j)(j=1至M)。 \n[0343] 并且,在图37中,抽出音判断部4103(j)(j=1至M)由相位距离判断部4200(j)(j=1至M)构成。 \n[0344] 麦克风4107(1)输入混合音2401(1),麦克风4107(2)输入混合音2401(2)。在该例子中,麦克风4107(1)和麦克风4107(2)被分别设置在该车辆的左前和右前的保险杠上。\n这些混合音的每一个由摩托车的引擎声音和风噪声构成。 \n[0345] DFT分析部1100是一处理部,对输入的混合音2401(1)和混合音2401(2)分别进行快速傅里叶变换处理,从而求出混合音2401(1)和混合音2401(2)的频率信号。在此的DFT的时间窗宽度是38ms。并且,按每0.1ms来求频率信号。以下,将在DFT分析部1100求出的频带的个数设为M,并以符号j(j=1至M)来表示指定这些频带的编号。在此例子中,以10Hz间隔来划分摩托车的引擎声音所存在的10Hz至300Hz的频带(M=30),并求频率信号。 \n[0346] 相位校正部4102(j)(j=1至M)是一处理部,在针对DFT分析部1100所求出的频带j(j=1至M)的频率信号,将时刻t的频率信号的相位设为ψ(t)(弧度)时,将相位校正为ψ″(t)=mod2π(ψ(t)-2πf′t)(f′为频带的频率)。在此例子中与实施例2不同的部分是,不是利用分析频率来校正ψ(t),而是利用求出频率信号的频带的频率f′来进行校正。 \n[0347] 抽出音判断部4103(j)(j=1至M)(相位距离判断部4200(j)j=1至M)),利用相位校正部4102(j)(j=1至M)所校正的频率信号的相位ψ″(t),按照每个混合音(混合音2401(1)、混合音2401(2)),利用113ms的时间宽度(规定的时间宽度)中的时刻的频率信号,根据以时刻和相位表示的空间中的近似直线来求适合于该频率信号的分析频率,并求出相位距离。并且,抽出音判断部4103(j)(j=1至M)(相位距离判 断部4200(j)(j=1至M)),根据求出的近似直线和向为的距离,来求相位距离,将相位距离在第二阈值以下的规定的时间宽度中的频率信号判断为引擎声音的频率信号。 \n[0348] 声音检测部4104(j)(j=1至M),在相同的时刻,在由抽出音判断部4103(j)(j=\n1至M)判断出在混合音2401(1)以及混合音2401(2)的至少一个混合音中存在引擎声音(抽出音)的频率信号时,制作抽出音检测标志4105并输出。 \n[0349] 出示部4106在从声音检测部4104(j)(j=1至M)被输入了抽出音检测标志4105时,向驾驶者通知有车辆接近。 \n[0350] 各个处理部中的这些处理是在移动规定的时间宽度的时刻的同时被进行的。 [0351] 以下,对具有以上这种构成的车辆检测装置4100的工作进行说明。 [0352] 以下,对第j个频带(频带的频率为f′)进行说明。对于其他的频带也进行同样的处理。 \n[0353] 图38是示出车辆检测装置4100的工作顺序的流程图。 \n[0354] 首先,DFT分析部1100接受混合音2401(1)和混合音2401(2),并分别对混合音\n2401(1)和混合音2401(2)分别进行离散傅里叶变换处理,从而求出混合音2401(1)和混合音2401(2)的频率信号(步骤S300)。 \n[0355] 图39示出了混合音2401(1)和混合音2401(2)的声谱图的一个例子。由于表示方法与图10相同,因此省略重复部分的说明。图39(a)与图39(b)分别是混合音2401(1)和混合音2401(2)的声谱图,由摩托车的引擎声音和风噪声构成。若注意图39(a)和图39(b)的区域B,在双方的混合音中出现引擎声音的频率信号。另外,若注意图39(a)和图39(b)的区域A,在混合伴音2401(1)中出现引擎声音,而在混合音2401(2)中由于风噪声的影响掩盖了引擎声音。像这样在麦克风之间的混合音的状态不同是因为,风噪声是取决于麦克风的设置位置而变化的噪声的缘故。 \n[0356] 之后,相位校正部4102(j),在针对DFT分析部1100所求出的频带j(频率f′)的频率信号,将时刻t的频率信号的相位设为ψ(t)(弧度)时,通过将相位变换为ψ″(t)=mod2π(ψ(t)-2πf′t)(f′为频带的频率),从而进行相位校正(步骤S4300(j))。在此例子中与实 施例2不同的部分是,不是利用分析频率f来校正ψ(t),而是利用求出频率信号的频带的频率f′来进行校正。由于除此之外的条件与实施例2相同,因此省略重复部分的说明。 \n[0357] 之后,抽出音判断部4103(j)(相位距离判断部4200(j))按照每个混合音(混合音2401(1)、混合音2401(2)),利用规定的时间宽度中的所有的时刻的被相位校正后的频率信号(第一阈值为规定的时间宽度中的时刻的频率信号的80%的数量,由第一阈值以上的数量构成)的相位ψ″(t),来设定分析频率f。抽出音判断部4103(j)(相位距离判断部4200(j))利用被设定的分析频率f来求相位距离。并且,抽出音判断部4103(j)(相位距离判断部4200(j)),将相位距离在第二阈值以下的规定的时间宽度中的频率信号判断为引擎声音的频率信号(步骤S4301(j))。 \n[0358] 图40(a)是混合音2401(1)的声谱图。由于表示方法与图39(a)相同,因此省略重复部分的说明。在此,对图40(a)所示的、在时刻3.6秒的规定时间宽度(113ms)的频率为100Hz的频带的时频区域中,设定恰当的分析频率f的方法进行说明。 \n[0359] 图40(b)示出了在图40(a)中的、在时刻3.6秒的规定时间宽度(113ms)的频率为100Hz的频带的时频区域中,以频带的f′校正的相位ψ″(t)。横轴表示时间,纵轴表示相位ψ″(t)。在此例子中,以频带的频率(f′=100Hz)校正了相位,ψ″(t)=mod2π(ψ(t)-2π×100×t)。并且,图40(b)还示出了这些被校正了的相位ψ″(t)和以时刻与相位ψ″(t)的空间定义的直线之间的距离(与相位距离对应)成为最小的直线(直线A)。 \n[0360] 该直线能够通过线性回归分析来求。具体而言,将时刻t(i)(i(i=1至N)是对t进行离散化时的索引)作为说明变量,将校正后的相位ψ″(t(i))作为目标变量。并且,将时刻3.6秒的规定的时间宽度(113ms)的频率为100Hz的频带的时频区域中的、每个时刻的被校正的相位ψ″(t(i))(i=1至N)作为N个的数据,直线A能够以公式30来求出。 \n[0361] (公式30) \n[0362] \n[0363] 在此,公式31为时刻的平均, \n[0364] (公式31) \n[0365] \n[0366] 公式32是校正后的相位的平均, \n[0367] (公式32) \n[0368] \n[0369] 公式33是时刻的方差, \n[0370] (公式33) \n[0371] \n[0372] 公式34是时刻和校正后的相位的协方差。 \n[0373] (公式34) \n[0374] \n[0375] 在此,利用图41对利用图40(b)的直线A的倾斜来求分析频率f进行说明。在此,直线A是具有以1/f″的时间间隔、ψ″(t)增加0至2π(弧度)的倾斜的直线。即,直线A的倾斜为2πf″。 \n[0376] 图41的直线A与图40(b)的直线A相同。图41的横轴为时间轴,纵轴为相位轴。\n图41中的以时间和ψ(t)定义的直线B是,以时间和ψ(t)定义的直线,在此的时间是指,直线A以频率f′(频带的频率)进行相位校正之前的时间。也就是说,直线B是针对直线A,在时刻每行进了1/f′就加上2π(弧度)而得到的直线。该直线B可以被视为在该时频区 域中存在有抽出音时的抽出音的相位ψ(t),能够以1/f的时间间隔(f为分析频率)以等角速度在0至2π(弧度)之间变化。与该直线B的倾斜(2πf)相对应的频率f是想要求出的分析频率f。 \n[0377] 在该例子中,由于频带的频率f′比分析频率f的值小,因此,直线A具有正的倾斜。并且,在分析频率f和频带的频率f′的值一致时,直线A的倾斜为零,在频带的频率f′的值比分析频率f大时,直线A具有负的倾斜。 \n[0378] 从图41中的直线A和直线B的关系可以推导出公式35。 \n[0379] (公式35) \n[0380] 2π(f/f′)=2π+2π(f″/f′) \n[0381] 这样,公式36成立。 \n[0382] (公式36) \n[0383] f=(f′+f″) \n[0384] 即,可知分析频率f是由频带的频率f′和与直线A的倾斜(2πf″)相对应的频率f″的和来表示的。 \n[0385] 关于图40(b)的直线A,由于被校正的相位ψ″(t)从0(弧度)增加到2π(弧度)所需要的时间为0.113/0.6(=1/f″)(秒),因此,f″=5(Hz),分析频率f成为\n105Hz(100Hz+5Hz)。 \n[0386] 以 下,利 用 被 设 定 的 分 析 频 率f来 求 相 位 距 离( 在ψ ′(t) =mod2π(ψ(t)-2πft)(f为分析频率)的距离)。相位距离能够以图40(b)所示的被校正后的相位ψ″(t)和直线A的距离来求。这是因为,成为公式37, \n[0387] (公式37) \n[0388] \n[0389] \n[0390] 以及与具有ψ(t)和2πf的倾斜的直线(直线B)之间距离,和与具有ψ″(t)和2πf″的倾斜的直线(直线A)之间的距离是一致的。 \n[0391] 在此例子中,能够以规定的时间宽度中的所有时刻的被相位校正后的频率信号的相位ψ″(t)和直线A之间的差分误差来求相位距离。 \n[0392] 另外,对于相位的值,可以在考虑连接成环面状(是指0(弧度)和2π(弧度)是相同的)的情况下来求相位距离。 \n[0393] 在此,若从另外的观点来看,可以求相位距离为最小的直线A。为此,可以知道,根据与直线A的倾斜相对应的频率f″来求出的分析频率f的相位距离成为最小,在该时频区域中为恰当的分析频率f。 \n[0394] 之后,将相位距离在第二阈值以下的规定的时间宽度的频率信号判断为引擎声音的频率信号。在此例子中,将第二阈值设定为0.17(弧度)。并且,在此例子中,对规定的时间宽度中的频率信号全体来求一个相位距离,按每个时间区间对抽出音的频率信号一起进行判断。 \n[0395] 图42示出了判断引擎声音的频率信号的结果的一个例子。该结果是从图39所示的混合音中判断引擎声音的频率信号的结果,以黑色区域来表示被判断为引擎声音的频率信号的时频区域。图42(a)是从图39(a)的混合音2401(1)中判断引擎声音的结果,图\n42(b)是从图39(b)的混合音2401(2)中判断引擎声音的结果。横轴为时间轴,纵轴为频率轴。若注意图42(a)和图42(b)的区域B,在双方的混合音中出现引擎声音的频率信号。\n另外,若注意图42(a)和图42(b)的区域A,则可以知道,因风噪声的影响,只能从非常少的时频区域中检测到混合音2401(2)中的引擎声音的频率信号,而从混合音2401(1)中能够以更多的时频区域检测到引擎声音的频率信号。 \n[0396] 这些处理是针对所有的频带j(j=1至M)进行的。 \n[0397] 之后,声音检测部4104(j),在由抽出音判断部4103(j)判断出在混合音2401(1)以及混合音2401(2)的至少一个混合音中存在引擎声音的频率信号时,制作抽出音检测标志4105并输出(步骤S4302(j))。 \n[0398] 图43示出了抽出音检测标志4105的制作方法的一个例子。图43是示出将图\n42(a)和图42(b)所示的判断结果的0至2秒之间的部分按照时间轴上下(图42(a)是上侧,图42(b)是下侧)排列的图。横轴为时间轴,纵轴为频率轴。并且,以黑色区域来表示被判断为是引擎声音的频率信号的时频区域。在此例子中,利用在存在摩托车的引擎声音的10Hz至300Hz的频带中的所有的判断结果,来决定是否按照每个成为求出相位距离的时间单位的规定的时间宽度(113ms)来制作抽出音检测标志4105并输出。 \n[0399] 在图43中的时刻1中,从图43(a)的混合音2401(1)中检测出引擎声音的频率信号。另外,从图43(b)的混合音2401(2)中检测不到引擎声音的频率信号。在此情况下,由于至少能够从图43(a)的混合音2401(1)中检测出引擎声音的频率信号,因此,能够知道在附近存在有车辆,从而制作抽出音检测标志4105并输出。 \n[0400] 在图43中的时刻2中,从图43(a)的混合音2401(1)中没有检测出引擎声音的频率信号。另外,从图43(b)的混合音2401(2)中检测出引擎声音的频率信号。在此情况下,由于至少能够从图43(b)的混合音2401(2)中检测出引擎声音的频率信号,因此,能够知道在附近存在有车辆,从而制作抽出音检测标志4105并输出。 \n[0401] 在图43中的时刻3中,从图43(a)的混合音2401(1)中没有检测出引擎声音的频率信号。并且,从图43(b)的混合音2401(2)中没有检测到引擎声音的频率信号。在此情况下,判断为在附近没有车辆的存在,从而不制作抽出音检测标志4105。 [0402] 作为其他的抽出音检测标志4105的制作方法有,按照与成为求出相位距离的时间单位的规定的时间宽度独立被设定的时刻,来决定是否制作抽出音检测标志4105并输出。例如,在按照比规定的时间宽度长的时刻(例如1秒)来决定是否制作抽出音检测标志\n4105并输出的情况下,即使因瞬间的噪声的影响而检测不到引擎声音的频率信号的时刻存在的情况下,也能够稳定地制作抽出音检测标志4105并输出。据此,能够正确地进行车辆检测。 \n[0403] 最后,出示部4106在抽出音检测标志4105被输入的情况下,向驾驶者通知接近车辆的存在(步骤S4303)。 \n[0404] 这些处理是在移动规定的时间幅度的时刻的同时被进行的。 \n[0405] 根据此构成,能够按照时频区域预先求出适于判断抽出音的分析频率。因此,在针对较多数量的分析频率求出相位距离之后,不需要判断抽出音。 为此,能够大幅度减少求相位距离的处理量。 \n[0406] 并且,能够利用近似值预先求出适于判断抽出音的分析频率。因此,由于针对较多数量的分析频率求出了相位距离,所以抽出音的判断就不需要了。为此,能够大幅度减少求相位距离的处理量。 \n[0407] 并且,由于求出了具体的分析频率,因此,在从混合音判断出抽出音的频率信号时,能够求出抽出音的详细频率。 \n[0408] 并且,由于噪声的影响,即使从以一个麦克风收集的混合音中检测不到抽出音,也能够从其他的麦克风中检测到抽出音。因此,能够减少检测失误。在此例子中,能够利用通过设置麦克风的位置而风噪声影响小的麦克风所收集的混合音。因此,能够正确地检测出作为抽出音的引擎声音,并能够通知驾驶者有车辆的接近。并且,在此例子中虽然使用了两个麦克风,也可以使用三个以上的麦克风来判断抽出音。 \n[0409] 并且,可以将多个频率信号之间的相位距离合在一起来求,通过与第二阈值进行比较,从而可以对多个频率信号的全部是否为抽出音的频率信号一起进行判断。因此,即使噪声的相位偶尔与抽出音相位一致,也能够稳定地判断抽出音的频率信号。 [0410] 并且,在实施例3所涉及的车辆检测装置中,也可以利用实施例1或实施例2中的抽出音判断部。并且,在实施例1以及实施例2中也可以利用实施例3中的抽出音判断部。 [0411] 最后,关于其他的混合音,对从混合音判断抽出音的频率信号的方法进行总结。 [0412] (I)对从200Hz的正弦波和白噪声的混合音中,判断200Hz的正弦波(200Hz的频率信号)的方法进行说明。 \n[0413] 图44示出了分析在中心频率f=200Hz的频带中,将分析频率设为f=200Hz时的相位的时间变化的结果。图44示出了分析在中心频率f=150Hz的频带中,将分析频率设为f=150Hz时的相位的时间变化的结果。在此,将在求相位距离时所利用的规定的时间宽度设定为100ms,并分析100ms的时间宽度中的相位的时间变化。图44和图45是分别利用200Hz的正弦波和白噪声进行分析的结果。 \n[0414] 图44(a)示出了200Hz的正弦波的相位ψ(t)(无相位校正)的 时间变化。在此时间宽度中,200Hz的正弦波的相位ψ(t)相对于时刻以2π×200的倾斜规则地变化。图\n44(b)是将图44(a)的相位ψ(t)校正为ψ′(t)=mod2π(ψ(t)-2π×200×t)(分析频率为200Hz)的图。并可知,相位校正后的200Hz的正弦波的相位ψ′(t)与时刻无关,是一定的值。因此,以此时间宽度中的ψ′(t)=mod2π(ψ(t)-2π×200×t)(分析频率为200Hz)定义的距离空间的相位距离变小。 \n[0415] 图44(c)示出了白噪声的相位ψ(t)(无相位校正)的时间变化。在此时间宽度中,白噪声的相位ψ(t)相对于时刻,看上去以2π×200的倾斜规则地变化,严密而言不是规则地变化。图44(d)示出了将图44(c)的相位ψ(t)校正为相位ψ′(t)=mod2π(ψ(t)-2π×200×t)(分析频率为200Hz)。可知,相位校正后的白噪声的相位ψ′(t)的值随着时刻在0至2π(弧度)之间变化。为此,以在此时间宽度中的ψ′(t)=mod2π(ψ(t)-2π×200×t)(分析频率为200Hz)定义的距离空间的相位距离比图44(a)或图44(b)的200Hz的正弦波中的相位距离大。 \n[0416] 图45(a)示出了200Hz的正弦波的相位ψ(t)(无相位校正)的时间变化。在此时间宽度中,200Hz的正弦波的相位ψ(t)相对于时刻以2π×150的倾斜没有发生变化(相对于时刻以2π×200的倾斜发生了变化)。图45(b)示出了将图45(a)的相位ψ(t)校正为相位ψ′(t)=mod2π(ψ(t)-2π×150×t)(分析频率为150Hz)。可知,相位校正后的200Hz的正弦波的相位ψ′(t)的值随着时刻在0至2π(弧度)之间规则地变化。因此,以在此时间宽度中的ψ′(t)=mod2π(ψ(t)-2π×150×t)(分析频率为150Hz)定义的距离空间的相位距离比图44(a)或图44(b)的200Hz的正弦波中的相位距离大。 [0417] 图45(c)示出了白噪声的相位ψ(t)(无相位校正)的时间变化。在此时间宽度中,白噪声的相位ψ(t)相对于时刻以2π×150的倾斜没有发生变化。图45(d)示出了将图45(c)的相位ψ(t)校正为相位ψ′(t)=mod2π(ψ(t)-2π×150×t)(分析频率为\n150 Hz)。可知,相位校正后的白噪声的相位ψ′(t)的值随着时刻在0至2π(弧度)之间变化。因此,以在此时间宽度中的ψ′(t)=mod2π(ψ(t)-2π×150×t)(分析频率为150Hz)定义的距离空间的相位距离比图45(a)或图45(b)的200Hz的正弦波中的相位距离大。 \n[0418] 根据图44和图45的分析结果,对200Hz的正弦波和白噪声进行区别,在判断\n200Hz的正弦波的频率信号的情况下,可以将第二阈值设定为:比图44(a)或图44(b)的\n200Hz的正弦波的相位距离大,比图44(c)或图44(d)的白噪声的相位距离小,比图45(a)或图45(b)的200Hz的正弦波的相位距离小,比图45(c)或图45(d)的白噪声的相位距离小。例如,可以将第二阈值设定为图44(b)、图44(d)、图45(b)、图45(d)所记载的Δψ′=π/6至π/2(弧度)。此时,没有被判断为抽出音的频率信号为白噪声的频率信号。 [0419] 并且,能够从中心频率150Hz的频带(也包含200Hz的频率)的混合音中判断抽出音中的200Hz的频率信号。在图45(a)中,可以将分析频率设为200Hz来判断在ψ′(t)=mod2π(ψ(t)-2π×200×t)(分析频率为200Hz)的相位距离。 \n[0420] (II)对从摩托车声音(引擎声音)和背景噪声的混合音判断摩托车声音的频率信号的方法进行说明。在此例子中,将第二阈值设定为π/2。 \n[0421] 图46示出了分析摩托车声音的相位的时间变化的结果。图46(a)示出了摩托车声音的声谱图,黑色部分是摩托车声音的频率信号的部分。表现了摩托车通过时的多普勒频移。图46(b)、图46(c)、图46(d)均示出了进行相位校正时的相位ψ′(t)的时间变化。 [0422] 图46(b)示出了利用120Hz的频带的频率信号,将分析频率设为120Hz时的分析结果。在该时刻的100ms的时间间隔(规定的时间间隔)中的相位ψ′(t)的相位距离在第二阈值以下。因此,该时频区域中的频率信号被判断为摩托车声音的频率信号。并且,由于分析频率为120Hz,因此能够确定被判断的摩托车声音的频率信号的频率为120Hz。 [0423] 图46(c)示出了利用140Hz的频带的频率信号,将分析频率设为140Hz时的分析结果,在该时刻的100ms的时间宽度(规定的时间宽度)中的相位ψ′(t)的相位距离在第二阈值以下。因此,该时频区域的频率信号被判断为摩托车声音的频率信号。并且,由于分析频率为140Hz,因此,被判断的摩托车声音的频率信号的频率能够被确定为140Hz。 [0424] 图46(d)示出了利用80Hz的频带的频率信号,将分析频率设为80Hz时的分析结果。该时刻的100ms的时间宽度(规定的时间宽度)中的相位ψ′(t)的相位距离比第二阈值大。因此,可知该时频区域的频率信号不是摩托车声音的频率信号。 [0425] (III)利用图44和图46,对从摩托车声音(引擎声音)和200Hz的正弦波以及白噪声的混合音中,判断200Hz的正弦波和摩托车声音的频率信号的方法、判断200Hz的正弦波的频率信号的方法、判断摩托车声音的频率信号的方法以及判断白噪声的频率信号的方法进行说明。在该例子中,设规定的时间宽度为100ms。 \n[0426] 首先,对区别白噪声,并判断200Hz的正弦波和摩托车声音的频率信号的方法进行说明。在此,将第二阈值设定为π/2(弧度)。 \n[0427] 此时,通过图44的分析结果和图46的分析结果可知,白噪声的相位距离比第二阈值大,200Hz的正弦波以及摩托车声音的各个相位距离成为第二阈值以下。因此,能够区别白噪声,并能够判断200Hz的正弦波和摩托车声音的频率信号。 \n[0428] 之后,对区别白噪声和摩托车声音,并判断200Hz的正弦波的频率信号的方法进行说明。在此,将第二阈值设定为π/6(弧度)。 \n[0429] 此时,通过图44的分析结果可知,白噪声的相位距离比第二阈值大,200Hz的正弦波的相位距离成为第二阈值以下。因此,能够区别白噪声,并能够判断200Hz的正弦波的频率信号。并且,通过图46的分析结果可知,在此例子中,摩托车声音的相位距离比第二阈值大。因此,能够区别摩托车声音,并能够判断200Hz的正弦波的频率信号。 [0430] 之后,对区别白噪声和200Hz的正弦波,并判断摩托车声音的频率信号的方法进行说明。在此,将第二阈值设定为π/6(弧度),将第三 阈值设定为π/2(弧度)。 [0431] 首先,将第二阈值设定为π/2(弧度)。此时,通过图44的分析结果和图46的分析结果可知,摩托车声音和200Hz的正弦波的频率信号是被合在一起被判断的。之后,将第二阈值设定为π/6(弧度)。此时,通过图44的分析结果和图46的分析结果,200Hz的正弦波的频率信号被判断。最后,从摩托车声音和200Hz的正弦波合在一起被判断的频率信号中,去除被判断为200Hz的正弦波的频率信号,从而判断摩托车声音的频率信号。 [0432] 最后,对区别200Hz的正弦波以及摩托车声音,并判断白噪声的频率信号的方法进行说明。在此,将第二阈值设定为2π(弧度)。 \n[0433] 此时,通过图44的分析结果和图46的分析结果可知,白噪声的相位距离比第二阈值大,200Hz的正弦波以及摩托车声音的各个相位距离成为第二阈值以下。在此,通过去除相位距离比第二阈值大的频率信号,从而能够判断白噪声的频率信号。 \n[0434] (IV)对从警报音合背景噪声的混合音中判断警报音的频率信号的方法进行说明。 [0435] 在该例子中,以与实施例3同样的方法,按照时频区域来判断警报音的频率信号。\n在此例子中的DFT的时间窗宽度是13ms。并且,以10Hz的间隔来划分900Hz至1300Hz的频带,并求频率信号。在此的规定的时间宽度为38ms,将第二阈值设定为0.03(弧度)。第一阈值与实施例3相同。 \n[0436] 图47(a)示出了警报音和背景噪声的混合音的声谱图。由于图47(a)的表示的方法与图40(a)相同,因此省略详细说明。图47(b)示出了从图47(a)的混合音中判断警报音的结果。由于图47(b)的表示的方法与图42(b)相同,因此省略详细说明。从图47(b)的结果可知,能够按照时频区域来判断警报音的频率信号。 \n[0437] (V)对从语音和背景噪声的混合音中判断语音的频率信号的方法进行说明。 [0438] 在此例子中,与实施例3相同,按照时频区域来判断语音的频率信号。在此例子中的DFT的时间窗宽度是6ms。并且,以10Hz的间隔来划 分0Hz至1200Hz的频带并求频率信号。在此的规定的时间宽度为19ms,将第二阈值设定为0.09(弧度)。第一阈值与实施例3相同。 \n[0439] 图48(a)示出了语音和背景噪声的混合音的声谱图。由于图48(a)的表示的方法与图40(a)相同,因此省略详细说明。图48(b)示出了从图48(a)的混合音中判断语音的结果。由于图48(b)的表示的方法与图42(b)相同,因此省略详细说明。从图48(b)的结果可知,能够按照时频区域来判断语音的频率信号。 \n[0440] (VI)示出了判断了100Hz的正弦波和白噪声的频率信号的结果。 \n[0441] 图49A示出了输入了100Hz的正弦波的情况下的检测结果。图49A(a)是输入的声音波形的图。横轴表示时间,纵轴表示振幅。图49A(b)是图49A(a)所示的声音波形的声谱图。由于表示方法与图10相同,因此省略重复部分的说明。图49A(c)是示出在输入了图49A(a)所示的声音波形时的检测结果的图。由于表示的方法与图42(b)相同,因此省略详细说明。通过图49A(c)可知,能够检测100Hz的正弦波的频率信号。 \n[0442] 图49B示出了输入了白噪声的情况下的检测结果。图49B(a)是输入的声音波形的图。横轴表示时间,纵轴表示振幅。图49B(b)是图49B(a)所示的声音波形的声谱图。由于表示方法与图10相同,因此省略重复部分的说明。图49B(c)是示出在输入了图49B(a)所示的声音波形时的检测结果的图。由于表示的方法与图42(b)相同,因此省略详细说明。\n通过图49B(c)可知白噪声没有被检测出。 \n[0443] 图49C示出了输入了100Hz的正弦波和白噪声的混合音的情况下的检测结果。图\n49C(a)是输入的声音波形的图。横轴表示时间,纵轴表示振幅。图49C(b)是图49C(a)所示的声音波形的声谱图。由于表示方法与图10相同,因此省略重复部分的说明。图49C(c)是示出在输入了图49C(a)所示的声音波形时的检测结果的图。由于表示的方法与图42(b)相同,因此省略详细说明。通过图49C(c)可知,100Hz的正弦波的频率信号被检测到,白噪声没有被检测到。 \n[0444] 图50A示出了输入了比图49A的振幅小的100Hz的正弦波的情况下的检测结果。\n图50A(a)是输入的声音波形的图。横轴表示时间,纵轴表 示振幅。图50A(b)是图50A(a)所示的声音波形的声谱图。由于表示方法与图10相同,因此省略重复部分的说明。图\n50A(c)是示出在输入了图50A(a)所示的声音波形时的检测结果的图。由于表示的方法与图42(b)相同,因此省略详细说明。通过图50A(c)可知,能够检测100Hz的正弦波的频率信号。通过与图49A的结果比较可知,能够在不依赖于输入的声音波形的振幅大小的情况下检测正弦波的频率信号。 \n[0445] 图50B示出了在输入了比图49B的振幅大的白噪声的情况下的检测结果。图\n50B(a)是输入的声音波形的图。横轴表示时间,纵轴表示振幅。图50B(b)是图50B(a)所示的声音波形的声谱图。由于表示方法与图10相同,因此省略重复部分的说明。图50B(c)是示出在输入了图50B(a)所示的声音波形时的检测结果的图。由于表示的方法与图42(b)相同,因此省略详细说明。通过图50B(c)可知白噪声没有被检测出。通过对与图49A的结果比较,能够在不依赖于输入的声音波形的振幅大小的情况下,知道白噪声没有被检测到。 [0446] 图50C示出了在输入了与图49B的信噪比不同的100Hz的正弦波和白噪声的混合音的情况下的检测结果。图50C(a)是输入的混合音的声音波形的图。横轴表示时间,纵轴表示振幅。图50C(b)是图50C(a)所示的声音波形的声谱图。由于表示方法与图10相同,因此省略重复部分的说明。图50C(c)是示出在输入了图50C(a)所示的声音波形时的检测结果的图。由于表示的方法与图42(b)相同,因此省略详细说明。通过图50C(c)可知,\n100Hz的正弦波的频率信号能够被检测到,白噪声没有被检测到。若与图49A的结果比较可知,能够在不依赖于输入的声音波形的振幅大小的情况下检测正弦波的频率信号。 [0447] 在此公开的实施例的所有部分都是例示,应当认为并不是加以限制的内容。本发明的范围不在于上述的说明,是根据权利要求而表示的,并意味着包括与权利要求同等的意思以及在范围内的所有变更。 \n[0448] 本发明所涉及的声音判断装置等能够在时频区域中对混合音中所包含的抽出音的频率信号进行判断。尤其能够对引擎声音、警报音、语音等具有音色的声音和风噪声、雨声、背景噪声等不具有音色的声音进行区别,并按照时频区域来判断具有音色的声音(或不具有音色的声音)的频率信 号。 \n[0449] 因此,本发明能够适用于,对按照时频区域而被判断的语音的频率信号进行输入,并通过逆频率变换来输出抽出音的语音输出装置。并且,能够适用于一种声源方向检测装置,该音源方向检测装置能够针对由两个以上的麦克风输入的混合音的每一个,输入按照时频区域而被判断的抽出音的频率信号,并输出抽出音的声源方向。并且,能够适用于一种声音识别装置,该声音识别装置输入按照时频区域而被判断的抽出音的频率信号,并进行语音和声音的识别。而且,能够适用于风噪声等级判断装置,该风噪声等级判断装置输入按照时频区域判断的风的噪声的频率信号,并输出功率大小。并且,能够适用于车辆检测装置,该车辆检测装置输入按照时频区域而被判断的轮胎摩擦而发出的行驶声音的频率信号,并根据功率的大小来检测车辆。并且,能够适用于车辆检测装置,该车辆检测装置检测按照时频区域而被判断的引擎声音的频率信号,并通知车辆的接近。并且,能够适用于紧急车辆检测装置等,该紧急车辆检测装置检测按照时频区域而被判断的警报音的频率信号,并通知紧急车辆的接近。
法律信息
- 2012-05-30
- 2010-08-25
实质审查的生效
IPC(主分类): G10L 21/02
专利申请号: 200880004020.9
申请日: 2008.08.25
- 2009-12-09
引用专利(该专利引用了哪些专利)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 |
1
| |
2007-01-17
|
2005-06-15
| | |
被引用专利(该专利被哪些专利引用)
序号 | 公开(公告)号 | 公开(公告)日 | 申请日 | 专利名称 | 申请人 | 该专利没有被任何外部专利所引用! |