太阳城集团

  • / 29
  • 下载费用:30 金币  

用于调节音频信号的感知响度的系统.pdf

摘要
申请专利号:

CN200880121963.X

申请日:

2008.12.19

公开号:

太阳城集团CN102017402B

公开日:

2015.01.07

当前法律状态:

授权

有效性:

有权

法律详情: 授权|||专利申请权的转移IPC(主分类):H03G 3/00变更事项:申请人变更前权利人:SRS实验室有限公司变更后权利人:DTS有限责任公司变更事项:地址变更前权利人:美国加利福尼亚州变更后权利人:美国加利福尼亚州登记生效日:20121204|||实质审查的生效号牌文件类型代码:1604号牌文件序号:101074689847IPC(主分类):H03G 3/00专利申请号:200880121963X申请日:20081219|||公开
IPC分类号: H03G3/00 主分类号: H03G3/00
申请人: DTS有限责任公司
发明人: 泰米斯·卡奇诺斯
地址: 美国加利福尼亚州
优先权: 2007.12.21 US 61/016,270
专利代理机构: 中科专利商标代理有限责任公司 11021 代理人: 王波波
PDF完整版下载: PDF下载
法律状态
申请(专利)号:

CN200880121963.X

授权太阳城集团号:

102017402B|||||||||

法律状态太阳城集团日:

太阳城集团2015.01.07|||2013.01.02|||2011.06.01|||2011.04.13

法律状态类型:

授权|||专利申请权、专利权的转移|||实质审查的生效|||公开

摘要

一种对音频信号的响度进行调节的方法,该方法可以包括:接收电子音频信号,以及使用一个或多个处理器来处理音频信号的至少一个通道,以确定音频信号的一部分的响度。这种处理可以包括:利用多个逼近滤波器来处理通道,所述多个逼近滤波器逼近多个听觉滤波器,所述多个听觉滤波器还逼近人类听力系统。此外,该方法还可以包括:至少部分基于所确定的响度来计算至少一个增益,以使音频信号的响度在一段太阳城集团内保持实质上恒定。此外,该方法可以包括对电子音频信号应用增益。

权利要求书

1: 一种对音频信号的响度进行调节的系统,用于对来自于多媒体设备的音频信号进 行调节,以向收听者呈现实质上恒定的感知响度,而不管音频信号的响度级变化,所述 系统包括 : 预处理模块,操作用于 : 接收包括一个或多个音频通道的电子音频信号, 选择至少一个音频通道,所述选择包括 :确定两个或多个音频通道中的主通道,并 选择所述主通道 ; 响度分析模块,包括操作用于对至少一个通道的响度进行估计的一个或多个处理 器,所述估计包括 : 利用多个逼近滤波器对至少一个通道进行处理,所述多个逼近滤波器被配置为逼近 多个伽马通滤波器,使得所述多个逼近滤波器仿真人耳的听觉滤波器组,以及 利用反转响度加权曲线对逼近滤波器的输出进行加权 ;以及 增益控制模块,操作用于至少部分基于所估计的响度来计算至少一个增益,以使音 频信号的感知响度在一段太阳城集团内保持实质上恒定,所述计算包括 : 至少部分基于所估计的响度来计算音频信号的一部分的增益,以及 在音频信号的所述一部分的多个采样上平滑所述增益。
2: 根据权利要求 1 所述的系统,其中,响度分析模块还被配置为,抽取所选通道。
3: 根据权利要求 1 所述的系统,其中,预处理模块还被配置为,通过比较每个通道的 能量值来确定主通道。
4: 根据权利要求 1 所述的系统,其中,增益控制模块还被配置为,通过在所述多个采 样上递增所述增益,来在所述多个采样上平滑所述增益。
5: 一种对音频信号的响度进行调节的方法,所述方法包括 : 接收包括一个或多个音频通道的电子音频信号 ; 使用一个或多个处理器来处理所述一个或多个通道中的至少一个通道,以至少部分 地通过以多个逼近滤波器处理所述至少一个通道,来确定音频信号的一部分的响度,所 述多个逼近滤波器被配置为逼近多个听觉滤波器,所述多个听觉滤波器还逼近人类听力 系统 ; 至少部分基于所确定的响度来计算至少一个增益,以使音频信号的响度在一段太阳城集团 内保持实质上恒定 ;以及 对电子音频信号应用所述至少一个增益。
6: 根据权利要求 5 所述的方法,其中,听觉滤波器包括伽马通滤波器。
7: 根据权利要求 5 所述的方法,其中,逼近滤波器包括一阶带通滤波器。
8: 根据权利要求 5 所述的方法,还包括 :通过使用对伽马通滤波器的一个或多个巴 特沃斯逼近,来导出逼近滤波器。
9: 根据权利要求 8 所述的方法,其中,所述导出还包括 :使用对所述一个或多个巴 特沃斯逼近的频率响应最小二乘拟合。
10: 根据权利要求 5 所述的方法,其中,逼近滤波器的数目至少部分依赖于扬声器尺 寸配置。
11: 根据权利要求 5 所述的方法,其中,确定响度还包括 :通过反转响度加权曲线, 2 对逼近滤波器的输出进行加权。
12: 一种对音频信号的响度进行调节的方法,所述方法包括 : 接收包括两个或多个音频通道的电子音频信号 ; 选择所述两个或多个音频通道中的通道,所述选择包括 : 确定所述两个或多个音频通道中的主通道,以及 选择所述主通道 ; 使用一个或多个处理器来处理所选通道,以确定音频信号的一部分的响度 ; 至少部分基于所确定的响度来计算至少一个增益 ;以及 对电子音频信号应用所述至少一个增益。
13: 根据权利要求 12 所述的方法,其中,确定主通道包括 :比较每个通道的最大采 样值。
14: 根据权利要求 12 所述的方法,其中,确定主通道包括 :比较每个通道的能量 值。
15: 根据权利要求 12 所述的方法,其中,确定主通道包括 :比较每个通道的功率 值。
16: 根据权利要求 12 所述的方法,还包括 :抽取所选通道,使得使用一个或多个处 理器来处理所选通道包括处理抽取的所选通道。
17: 根据权利要求 12 所述的方法,其中,音频信号包括多个通道,确定主通道包括 : 确定第一对通道的第一主通道以及第二对通道的第二主通道。
18: 根据权利要求 17 所述的方法,其中,使用一个或多个处理器来处理所选通道包 括 :处理第一主通道和第二主通道。
19: 根据权利要求 18 所述的方法,其中,计算至少一个增益包括 :计算针对第一对 通道和第二对通道的第一增益和第二增益。
20: 根据权利要求 19 所述的方法,还包括 :在第一增益和第二增益中的一个或多个 与针对中心通道的增益之间保持实质上恒定的比值。
21: 一种用于对音频信号的响度进行调节的系统,所述系统包括 : 预处理模块,操作用于接收包括一个或多个音频通道的电子音频信号,并选择至少 一个音频通道 ; 响度分析模块,包括操作用于计算至少一个所选通道的响度的一个或多个处理器 ; 增益控制模块,操作用于至少部分基于所述响度,来计算至少一个增益,所述计算 包括 : 至少部分基于所估计的响度,来计算音频信号的至少一个所选通道的增益,以及 对音频信号的每个通道应用所述增益。
22: 根据权利要求 21 所述的系统,其中,增益控制模块还被配置为,通过将所估计的 响度与基准级相比较,来计算增益。
23: 根据权利要求 21 所述的系统,其中,增益控制模块还被配置为,递增地对每个通 道的采样应用所述增益。
24: 根据权利要求 21 所述的系统,其中,增益控制模块还被配置为,通过应用平滑函 数,在每个通道的采样上平滑所述增益。 3
25: 一种用于区分背景声音与其他声音的方法,所述方法包括 : 接收包括两个或多个音频通道的电子音频信号 ; 选择电子音频信号的一部分 ; 分析电子音频信号的所选部分的每个通道之间的相位,以确定具有相应相位的采样 的数目 ;以及 将采样的数目与阈值相比较,以确定电子音频信号的所选部分是否与背景噪声相对 应。
26: 根据权利要求 25 所述的方法,还包括 :响应于确定电子音频信号的所选部分与 背景噪声相对应,绕过响度处理。
27: 根据权利要求 25 所述的方法,还包括 :响应于确定所选部分与背景噪声相对 应,使用修改后的响度处理来处理电子音频信号的所选部分。
28: 一种用于对音频信号的响度进行调节的系统,所述系统包括 : 包括一个或多个音频通道的音频信号 ; 响度模块,包括操作用于计算音频信号的响度的一个或多个处理器,所述计算包 括 :利用多个无限脉冲响应 IIR 滤波器来处理音频信号,每个 IIR 滤波器包括带通滤波 器, IIR 滤波器被配置为逼近人类听力系统 ;以及 增益模块,被配置为至少部分基于计算的响度来计算增益。
29: 根据权利要求 28 所述的系统,其中,增益模块还被配置为,对音频信号应用所述 增益。
30: 根据权利要求 28 所述的系统,其中, IIR 滤波器还被配置为,逼近伽马通滤波 器。

说明书


用于调节音频信号的感知响度的系统

    相关申请
     本申请要求基于 35 U.S.C§119(e) 的于 2007 年 12 月 21 日提交的题为 “System for Adjusting Perceived Loudness of Audio Signals” 的 No.61/016,270 的美国临时专利申请 的权益,其全部公开一并在此作为参考。
     技术领域 许多电视观众抱怨,在商业广告期间以及在不同频道之间切换时他们要忍受 音量的变化。 其他设备 ( 例如,便携式音频播放器、 A/V 接收机、个人计算机以及车 载音频系统 ) 也会发生类似的音量极值现象。 该问题的一个解决方案是自动增益控制 (AGC)。 典型的自动增益控制 (AGC) 通过以下方式来对音量变化作出反应 :将高幅度的 音频信号截除,然后以低幅度来传送该音频信号,而不管响度尖峰发生在频率范围内的 哪个频率下。
     当采用 AGC 时,可能经常会听到抽气 (pumping) 或喘息 (breathing) 波动形式的 不期望的变化和不自然的伪迹。 抽吸波动可能是由于在响度突然增大时 ( 如,在响亮的 动作序列期间 ) 低音消失引起的。 在安静阶段产生低水平的嘘声时可能发生呼吸波动。 不幸地,这种处理音量变化的强力方法并没有考虑人实际感知音量变化的程度。
     发明内容 在特定实施例中,一种对音频信号的响度进行调节的方法,包括 :接收电子音 频信号,以及使用一个或多个处理器来处理音频信号的至少一个通道,以确定音频信号 的一部分的响度。 这种处理可以包括 :利用多个逼近滤波器来处理通道,所述多个逼近 滤波器逼近多个听觉滤波器,所述多个听觉滤波器还逼近人类听力系统。 此外,该方法 还可以包括 :至少部分基于所确定的响度来计算至少一个增益,以使音频信号的响度在 一段太阳城集团内保持实质上恒定。 此外,该方法可以包括对电子音频信号应用增益。
     在不同实施例中,一种对音频信号的响度进行调节的方法包括 :接收具两个或 多个音频通道的电子音频信号,以及选择所述两个或多个音频通道中的通道。 所述选择 可以包括 :确定所述两个或多个音频通道中的主通道,以及选择主通道。 该方法还包 括 :使用一个或多个处理器来处理所选通道,以确定音频信号的一部分的响度 ;以及至 少部分基于所确定的响度来计算至少一个增益。 此外,该方法还可以包括对电子音频信 号应用所述至少一个增益。
     在特定实施例中,一种用于对音频信号的响度进行调节的系统,包括 :预处理 模块,可以接收具有一个或多个音频通道的电子音频信号,并选择至少一个音频通道。 该系统还可以包括响度分析模块,所述响度分析模块具有可以计算至少一个所选通道的 响度的一个或多个处理器。 该系统还可以包括 :增益控制模块,可以至少部分基于响度 来计算至少一个增益。 增益计算可以包括 :至少部分基于所估计的响度来计算音频信号 的至少一个所选通道的增益,以及对音频信号的每个通道应用所述增益。
     在特定实施例中,一种区分背景声音与其他声音的方法可以包括 :接收具有两 个或多个音频通道的电子音频信号 ;选择电子音频信号的一部分 ;分析电子音频信号的 所选部分的每个通道之间的相位,以确定具有相应相位的采样的数目 ;以及将采样的数 目与阈值相比较,以确定电子音频信号的所选部分是否与背景噪声相对应。
     在特定实施例中,一种用于对音频信号的响度进行调节的系统可以包括 :具有 一个或多个音频通道的音频信号 ;响度模块,具有可以计算音频信号的响度的一个或多 个处理器,所述计算包括 :利用多个无限脉冲响应 (IIR) 滤波器来处理音频信号,每个 IIR 滤波器是带通滤波器,IIR 滤波可以逼近人类听力系统。 该系统还可以包括 :增益模 块,可以至少部分基于所计算的响度来计算增益。
     为了概括本公开,本文描述了本发明的特定方面、优点和新颖的特征。 应理 解,不必根据本文所公开的本发明的任何具体实施例来实现所有这些优点。 因此,可以 以实现或最优化本文所提出的一个或一组优点的方式来体现或实现本文所公开的发明作 为教导,而不必实现本文所教导或建议的其他优点。 附图说明 附图中,可以重用参考数字以指示所引用的单元之间的对应。 附图用于说明这 里所描述的本发明的实施例,而不用于限制本发明实施例的范围。
     图 1A 示出了用于对音频信号的感知响度进行调节的系统的实施例 ;
     图 1B 示出了与人耳所使用的滤波器相类似的示例听觉滤波器组 ;
     图 1C 示出了表示示例等响度曲线的曲线图 ;
     图 2A 示出了对立体声信号的感知响度进行调节的过程的实施例 ;
     图 2B 示出了对环绕声信号的感知响度进行调节的过程的实施例 ;
     图 3 示出了音频预处理器的实施例 ;
     图 4 示出了执行相位分析的过程的实施例 ;
     图 5 示出了执行主通道选择的过程的实施例 ;
     图 6 示出了示例抽取滤波器脉冲响应 ;
     图 7 示出了确定响度的响度处理的实施例 ;
     图 8 示出了逼近伽马通 (gammatone) 滤波器的多个滤波器的频率响应的实施 例;
     图 9 示出了确定响度的响度估计过程的实施例 ;
     图 10A 示出了在特定实施例中可以用于开发逼近滤波器的示例 C 加权曲线 ;
     图 10B 示出了在特定实施例中可以用于开发逼近滤波器的示例反转加权曲线 ; 以及
     图 11 示出了基于所测量的响度来调节增益的过程的实施例。
     具体实施方式
     一些音量控制系统尝试在确定如何改变增益的过程中考虑响度。 响度可以是 听觉系统的属性,所述听觉系统允许将声音分为从安静到嘈杂的等级。 可以在称作 “phon.”的单元中测量响度。 当收听不同类型的音频素材时,使用主观的响度量,以便使耳朵对听到的各种声音的强度加以分类,并产生听觉。 与以分贝 (dB) 来度量的声压级 不同,感知到的响度可以随频率而变化。 可以基于响度来对人耳进行建模的音量控制系 统经常使用复杂的高阶滤波器,来对人类听力系统进行建模。 这些系统可以消耗大量的 计算资源,从而将这些系统的能力限制为工作在诸如电视和汽车音频系统之类的特定设 备中。
     本公开描述了对音频信号的感知响度进行调节的特定系统和方法。 在特定实施 例中,使用一个或多个处理效率高的技术来确定音频信号的估计响度。 这些技术可以包 括 :使用逼近滤波器组的更低阶滤波器,所述滤波器组对人耳进行建模 ;抽取音频信号 以减少所处理的音频采样的数目 ;处理少数音频通道而不是所有音频通道 ;以及并对增 益系数进行平滑而不是对输出信号进行平滑。 有利地,在特定实施例中,应用这些技术 中的一种或多种可以使得例如许多电子设备中的低能力处理器能够动态地调节音频信号 的响度。
     参照图 1A,示出了音频系统 100A 的实施例,音频系统 100A 包括用于对音频信 号的感知响度进行调节的响度调节系统 110。 音频系统 100A 可以实现于再现音频的任何 机器中,如,电视、计算机、便携式音频播放器、头戴式耳机、 A/V 接收机、车载音频 系统等。 有利地,在特定实施例中,响度调节系统 110 对音频输入信号 102 的响度进行 调节,以将响度维持在特定等级。 例如,响度调节系统 110 可以在用户切换频道时或这 在商业广告播送时,维持电视音频的特定响度。 响度分析模块 110 可以在高效地使用计 算机资源的同时执行这些功能。 如图 1A 所示,响度调节系统 110 接收音频输入信号 102。 在所描述的实施例 中,音频输入信号 102 包括两个通道,例如,立体声通道。 在其他实施例中,音频输入 信号 102 包括一个通道或多于两个的通道。 例如,可以提供 5.1、6.1 或 7.1 环绕声通道或 矩阵编码通道 ( 如,圆环绕编码通道或其他 )。 音频输入信号 102 可以是表示实际物理声 音 ( 如,音乐、语音、效果或其组合等 ) 的电信号或其他信号。
     响度调节系统 110 的预处理模块 120 接收音频输入信号 102。 预处理模块 120 可 以包括用于聚集来自于音频输入信号 102 的每个通道的能量太阳城集团的硬件和 / 或软件。 在 一个实施例中,通过使用能量太阳城集团,预处理模块 120 可以确定响度分析模块 130 要进行响 度分析的至少一个主通道。 更一般地,预处理模块 120 可以选择音频输入信号 102 的通 道的子集以用于响度分析。 在特定实施例中,通过使用少数通道而不是所有通道来确定 响度,预处理模块 120 可以减少用于确定响度的计算资源。
     响度分析模块 130 可以包括用于基于预处理模块 120 所选的一个或多个通道来估 计响度的硬件和 / 或软件。 响度分析模块 130 可以将所选通道的估计响度与基准响度级 相比较。 如果估计响度与基准响度级不同,则响度分析模块 130 可以输出估计响度与基 准响度级之间的级差。 如以下将描述的,增益控制模块 140 可以使用该级差来调节应用 于音频输入信号 102 的增益。
     在特定实施例中,响度分析模块 130 使用人类听力系统的非线性多频带模型来 分析音频输入信号 102 的响度特性。 该模型可以仿真人类外围听觉系统的滤波器组行 为。 这样,模型可以通过估计音频输入信号 102 的响度来解释可以是声音强度的主观度 量的响度。
     人类听觉系统表现为,如同其包含具有连续交叠的中心频率的带通滤波器组。 图 1B 示出了由带通滤波器 160 组成的这种带通滤波器组 100B 的示例。 有利地,在特定 实施例中,图 1A 的响度分析模块 130 使用对人类自然带通滤波器加以逼近的滤波器 ( 见 图 8),对该听觉结构进行建模。 在特定实施例中,响度分析模块 130 对听觉滤波器的低 阶逼近,以更高效地使用计算资源。
     此外,如上所述,可以使用一个或多个等响度曲线来针对不同个人测量响度。 图 1B 示出了示例等响度曲线 170。 响度分析模块 130 还可以使用一个或多个响度曲线, 或基于响度曲线的曲线,来对听觉滤波器的输出进行加权。 因此,通过使用对听觉滤波 器的逼近以及通过使用响度曲线,以及以下将描述的其他处理,响度分析模块 130 可以 估计音频输出信号 102 的响度。
     音频分析模块 130 还可以对其用来处理音频太阳城集团的采样量进行下采样、抽取或 以其他方式进行减少。 例如,通过抽取音频输入信号 102,响度分析模块 130 使用更少的 采样来估计响度。 可以在特定实施例中执行抽取,这是因为人类听力系统可能无法以用 于对音频输入信号 102 进行采样的相同采样速率来检测响度变化。 抽取或其他采样速率 技术可以减少用于计算响度的计算资源。 如上所述,响度分析模块 130 将计算的响度与基准响度级相比较,并将级差输 出至增益控制模块 140。 基准响度级可以是响度调节系统个 110 内部的基准。 例如,基 准级可以是满刻度响度 ( 例如,0dB),使得将响度调节到该级保持了动态范围。 在另一 实施例 ( 未示出 ) 中,基准级可以是由用户例如经由音量控制而设置的音量级。
     增益控制模块 140 可以经由混频器 142a 和 142b 逐采样地向音频信号输入 110 施 加级差。 在特定实施例中,增益控制模块 140 对采样或采样块之间的过渡进行平滑,以 防止刺耳的响度过渡。 因此,混频器 142 可以输出具有恒定平均响度级或实质上恒定平 均响度级的音频信号。 因此,在特定实施例中,响度调节系统 110 可以将音频输入信号 102 转换成具有恒定平均响度级或实质上恒定平均响度级的音频信号。
     将混频器 142 的输出提供至混频器 152a、152b。 这些混频器 152 受音量控制 150 的控制。 例如,音量控制 150 可以由用户来操作。 混频器 152 根据音量控制 150 的音量 设置向混频器 142 的输出应用增益。 然后混频器 152 提供音频输出信号 162,所述音频输 出信号 162 可以被提供至一个或多个扬声器或其他模块以供进一步处理。
     图 2A 和 2B 示出了对音频信号的感知响度进行调节的响度调节过程 200A、200B 的实施例。 这两个过程 200 可以由响度调节系统 100 来实现。 过程 200A 示出了立体声 信号的示例响度调节,过程 200B 示出了包括环绕声信号在内的多通道 ( 例如,大于两个 通道 ) 音频信号的示例响度调节。
     参照图 2A,在方框 202a,接收立体声输入信号。 立体声输入信号 202a 包括左 通道和右通道。 可以将通道划分成采样块,通过过程 200A 来单独分析每个采样块。 以 下将太阳城集团图 3 来进一步详细描述采样块。 在方框 204a,可以通过计算左通道和右通道的 能量或功率,来对两个通道进行预处理。 至少部分基于该计算,可以确定哪个通道是主 通道。 可以选择主通道以进行进一步的响度处理。 可以针对立体声输入信号的每个采样 块来确定主通道,主通道可以随块的不同而不同。
     此外,如以下将更详细描述的,预处理可以包括检查通道的噪声特性。 例如,
     如果采样块主要包括噪声,则可以对采样块应用很少的响度处理或不对采样块应用响度 处理。
     在抽取方框 210a,可以通过对主通道进行下采样和 / 或滤波,来对主通道信号 进行抽取。 在响度处理方框 212a,可以使用逼近听觉滤波器的一个或多个滤波器以及一 个或多个响度曲线,来估计较低速率的信号的响度。 还可以确定估计响度级与基准响度 级之间的级差。
     在增益调节方框 214a,可以基于级差来计算增益。 可以将该增益应用到立体 声输入信号 202a 的两个通道,而不是仅应用到所抽取的通道。 增益计算可以包括平滑 函数,所述平滑函数在立体声输入信号的多个采样上对所计算的增益进行平滑。 在方框 216a,基于所应用的增益来提供立体声输出信号。
     在备选实施例中,不选择主通道,而是对每个通道进行处理以确定该通道的响 度。 可以基于所计算的响度对每个通道应用不同的增益。 在另一备选实施例中,不执行 抽取,响度处理 212a 对全速率输入信号或主通道进行操作。 还可以使用许多其他实现方 式和配置。
     参照图 2B,示出了多通道音频信号 202b,多通道音频信号 202b 包括左 (L) 输 入、右 (R) 输入、中心 (C) 输入、左环绕 (Ls) 输入和右环绕 (Rs) 输入。 尽管未示出, 但是音频信号 202b 还可以包括超低音扬声器 (subwoofer) 输入。 可以将这些通道分成采 样块,通过过程 200B 来单独分析每个采样块。 以下太阳城集团图 3 进一步详细描述了采样块。
     有利地,在特定实施例中,将左输入和右输入作为一对提供至预处理方框 204b,将左环绕输入和右环绕输入提供至预处理方框 204c。 这些方框 204b 和 204c 中的 每一个方框可以计算信号能量并确定主通道,所述主通道分别被提供至抽取方框 210b 或 210c。 预处理方框 204d 还可以计算中心输入的信号能量,但是在特定实施例中并不选择 主通道。 然而,中心通道的信号能量可以稍后用在过程 200B 中。
     每个抽取方框 210 可以抽取所选通道,并将抽取通道分别提供至响度处理块 212b、212c 或 212d。 每个响度处理方框 212 可以确定通道的响度级与基准级之差,并将 级差输出至增益调节方框 214b。 抽取方框 210 和响度处理方框 212 都可以具有与以上关 于图 2A 所描述的特征相同或相似的特征。
     在特定实施例中,增益调节方框 214b 基于从响度处理方框 212 接收到的级差来 计算每个输入通道的增益。 增益对于每个通道而不同。 在一些实现方式中,希望强调中 心通道以增强收听者的对话感知。 然而,响度处理 212 可能产生增益,所述增益使各个 通道下压过 (drowncut) 中心通道。 为了解决这一问题,增益调节方框 214b 可以针对中心 通道产生比针对其他通道高的增益。 在一个实施例中,增益调节方框 214b 可以维持中心 通道增益与其他通道增益之比。
     在过程 200B 的备选实施例中,不选择主通道,而是对所有通道进行处理以确 定响度,并向每个通道应用单独的增益。 作为另一备选方式,可以在左通道与右通道之 间而不是在左环绕通道与右环绕通道之间确定主通道,或反之亦然。 在另一备选实施例 中,不执行抽取。 此外,图 2B 所示的特征可以扩展到具有诸如 7.1 环绕声扬声器装置之 类的附加扬声器的实施例。 还可以使用许多其他实现方式和配置。
     图 3 示出了预处理模块 320 的更详细实施例。 预处理模块 320 可以具有以上太阳城集团图 1 和图 2 而描述的所有特征。 所示预处理模块 320 接收立体声输入信号,所述立体 声输入信号具有左信号 302 和右信号 304。 为了便于说明,说明书的其余部分主要指立体 声信号。 然而,所讨论的特征同样可以应用于具有更少或更多通道的信号。
     在特定实施例中,预处理模块 320 对左信号和右信号 302、304 的采样块进行操 作。 例如,预处理模块 320 可以将多个输入采样缓冲成预定采样块大小,并然后对采样 块进行处理。 采样块的大小是可以任意选择的。 例如,每个采样块可以包括 256 个、512 个、768 个采样或其他数目个采样。
     当前可用的 AGC 系统通常并不区分对话与背景噪声 ( 例如,效果 )。 这样,诸 如雨声之类的背景噪声可能会被这些系统放大,导致背景噪声相对于非背景噪声的响度 高于应有水平。 为了解决这一问题,在特定实施例中,将左信号和右信号 302 的采样块 提供至相位分析模块 322。 相位分析模块 322 可以包括用于使用相位分析来检测左信号和 右信号 302、304 的每个采样块的背景噪声部分和非背景噪声部分的硬件和 / 或软件。
     相位噪声分析模块 322 可以基于以下认知来进行分析 :有声 ( 或非背景 ) 采样可 以高度相关,而非有声采样将被去相关。 这意味着,如果基于每个采样检测左通道和右 通道 302、304,则有声采样将同时在两个通道 302、304 上具有相同的相位。 换言之, 有声采样将在两个通道 302、304 上是同相的。 另一方面,非有声采样将在同一太阳城集团点具 有不同的相位,使得一个通道上的采样是正的,而另一通道上的相应采样可以是负的。 因此,主要有声采样的相位分布可以高度相关,而主要非有声采样的相位分布相关性较 差。 相位分析模块 322 可以执行处理,以基于上述认知来确定给定的采样块主要包 括有声采样还是非有声采样。 图 4 示出了该过程 400 的示例实施例。 在方框 402,对 于采样块,对多个采样执行相位分析。 相位分析可以包括对于在两个输入通道上具有相 同或不同相位的、在两个输入通道上具有负相位的、以及反相位的采样对的数目进行计 数。 在该方框处,相位分析模块 322 可以例如针对相同或不同相位的每个采样对来递增 计数器。
     在判定方框 404,确定相位分布是否超过阈值。例如,可以确定具有相同相位的 采样对的总数是否大于阈值数目。如果是,则在方框 406,使用采样块来进行响度处理, 这是因为,采样块可以包括或实质上包括有声信号。 否则,在方框 408 处,在采样块上 绕过响度处理。 这是因为,采样块可能包括或实质上包括非有声信号。 可以对采样块应 用最小增益,以削弱采样块的背景噪声。
     在备选实施例中,对非有声采样块以及有声采样块应用响度处理。 然而,仍然 可以向包含实质上非有声采样数目的采样块应用较低增益。 此外,可以调节上述阈值, 以更强或更弱地应用相位分析。
     上述相位分析过程还可以用在其他应用中。 例如,这种相位分析可以与硬限幅 器或诸如压缩器之类的其他传统增益调节系统一起使用。 减噪系统可以得益于这种分析 的使用。 音调检测系统也可以使用这种分析。
     再次参照图 3,相位分析模块 322 向能量分析模块 324 提供采样块。 例如,相位 分析模块 322 可以向能量分析模块 324 提供有声采样块而不是非有声采样块。 能量分析 模块 324 可以包括用于计算采样块的能量或功率的硬件和 / 或软件。 例如,能量分析模
     块 324 可以计算采样块中采样值的均方或均方根或其他。 主通道模块 326 可以使用计算 的采样块的能量或功率,来确定左信号通道和右信号通道 302 和 304 中的哪个是 ( 以下描 述的 ) 采样块的主通道。 此外,计算的能量或功率可以用于以下将描述的其他用途。
     能量分析模块 324 还可以计算采样块的每个通道的最大值或峰值。 能量分析模 块 324 可以创建临时缓冲器以保存该太阳城集团。 临时缓冲器可以包括每个通道 (L, R) 上的 采样的绝对值的最大值。 临时缓冲器还可以包括先行延迟线,能量分析模块 324 以下一 采样块的采样的最大值来填充先行延迟线。 以下将参照图 11 来更详细描述先行延迟线。
     再次参照图 3,能量分析模块 324 可以向主通道模块 326 提供计算出的能量或功 率以及计算的、采样块的每个通道的最大值。 主通道模块 326 可以使用这两个值之一或 两者,来确定对于给定采样块哪个通道是主通道。 例如,主通道模块 326 可以确定具有 较大最大值的通道是主通道,或者具有较大能量或功率的通道是主通道。
     图 5 示出了可以由主通道模块 326 来执行的示例过程 500。 在判定方框 502, 确定左通道的均方值是否大于或等于右通道的均方值,以及右通道的最大值是否大于阈 值。 均方值可以是每个通道的能量或功率。 如果方框 502 的条件为真,则在方框 504 确 定左通道是主通道,并且在方框 506 可以提供左通道用于响度处理。 另一方面,如果方框 502 的条件不为真,则在判定方框 508 进一步确定右通道的 均方值是否大于或等于左通道的均方值,以及左通道的最大值是否大于阈值。 如果是, 则在方框 510,认为右通道是主通道,并在方框 512 可以提供右通道用于响度处理。
     如果方框 508 的条件不为真,则可能存在单声道信号,在判定方框 514,确定左 信号的最大值是否大于阈值。 如果是,则提供左通道用于响度处理。 否则,在判定方框 518,进一步确定右通道的最大值是否大于阈值。 如果是,则在方框 520 提供右通道用于 响度处理。 否则,在方框 522 使采样块经过,并且不提供该采样块用于响度处理,这是 因为,采样块可以被看作是不具有任何音频或实质上不具有任何音频。
     再次参照图 3,主通道模块 326 输出主通道 332。 主通道模块 326 可以针对各个 采样块选择不同的主通道 322。如上所述,一旦选择了主通道,就可以提供主通道用于抽 取和响度处理。 例如,主通道模块 326 可以存储与主通道缓冲器 ( 未示出 ) 中的主通道 322 相对应的采样块。
     图 6 示出了抽取滤波器的示例脉冲响应 600。 如上所述,可以对主通道应用抽取 滤波器以减小该通道的采样速率。 减小主通道的采样速率可以便于利用更少的计算资源 来进行响度处理。
     在特定实施例中,抽取过程包括可以对以上参照图 3 描述的主通道缓冲器进行 下采样的抽取滤波器。 该下采样可以包括使用与采样速率有关的抽取因子。 在一些实施 例中,下采样缓冲器仅用于响度分析用途,并且不提供作为至最终用户的输出。 滤波器 ( 例如,低通滤波器 ) 可以对下采样信号进行频带限制,以避免反混叠。 因此,具有图 6 的脉冲响应 600 的抽取滤波器可以是这种滤波器的一个示例。
     具有所示脉冲响应 600 的抽取滤波器是长度为 33 的有限脉冲响应 (FIR) 滤波 器。 如以下以等式 (1) 表示的,可以通过对因果理想脉冲响应进行加窗来导出这种滤波 器:
     h(n′ ) = w(n′ )d(n′ -LM) (1)
     在等式 (1) 中,理想脉冲相应由以下等式给出 :抽取采样由以下等式给出 :有利地,在特定实施例中,每个抽取采样块可以用于更节省计算资源的响度处理。 图 7 示出了用于确定响度的响度处理 700 的实施例。 响度处理 700 可以由响度 调节系统 110 来实现,具体地,由响度分析模块 130 来实现。 此外,响度处理 700 的实 施例与响度处理方框 212a、212b、212c 和 212d 相对应。 响度处理 700 可以计算采样块 的估计响度。 响度处理 700 还可以将估计响度级与基准级相比较,以确定要应用于采样 块的级差。
     在所描述的实施例中,将抽取输入 702 提供至逼近滤波器 710。 抽取输入 702 可 以包括以上太阳城集团图 6 所描述的抽取滤波器所产生的抽取采样块。 每个逼近滤波器 710 可 以是逼近听觉外围系统的带通滤波器。 在一个实施例中,每个滤波器 710 都逼近伽马通 滤波器。 在另一实施例中,滤波器逼近倍频程滤波器或逼近听觉外围系统的其他带通滤 波器。
     已使用伽马通滤波器来仿真以上太阳城集团图 1B 所描述的人耳的带通滤波器组。 以下 给出了在时域描述伽马通滤波器的等式 :
     在等式 (4) 中, a 表示幅度, f 表示频率, n 是滤波器的阶数, b 是滤波器的带 宽,是 滤波器的相位。
     伽马通滤波器可以是处理密集型滤波器,因此对于计算资源少的电子设备 ( 例 如,某些电视 ) 来说伽马通滤波器不是合适的选择。 因此,在特定实施例中,每个滤波 器 710 逼近伽马通滤波器。 滤波器 710 还可以具有不同的中心频率,以仿真人耳的带通 滤波器组。 至少一些滤波器 710 可以是伽马通滤波器的一阶逼近。 在特定实施例中,可 以 a) 使用与每个滤波器的所选中心频率相匹配的一阶巴特沃斯滤波器逼近以及 b) 使用与 初始巴特沃斯估计的频率响应的最小二乘拟合,来导出每个一阶逼近。 每个滤波器 710 可以被实现为无限脉冲响应 (IIR) 滤波器,以更高效地使用处理资源。
     还为其他逼近滤波器 720 提供了另一输入 704。 在特定实施例中,输入 704 是 全速率采样输入而不是抽取输入。 全速率输入 704 可以用于人耳较为敏感的一些频带、 用于更高的频带或其他频带。 此外,全速率输入 704 可以用于防止特定的频率折返效应 (fold-back effects)。
     向滤波器 720 提供全速率输入 704。 如滤波器 710 一样,滤波器 720 可以是逼近 伽马通滤波器的带通滤波器。 可以采用与以上针对滤波器 710 而描述的方式相类似的方 式来导出滤波器 720。 然而,在特定实施例中,滤波器 720 可以是伽马通滤波器的二阶逼 近。 这些滤波器 720 还可以是 IIR 滤波器。 在图 8 的曲线图 1100 中示出了示例逼近滤
     波器集合的归一化频率响应 1110。
     在其他实施例中,所有的滤波器都对抽取输入 ( 或取而代之,全速率输入 ) 进行 操作。 此外,所示的滤波器数目是一个示例,该数目可以变化,更少的滤波器可以以可 能的低精度,得到更好的性能。 所选的滤波器的数目还可以依赖于可用扬声器的尺寸, 更大的扬声器使用更多的滤波器。
     滤波器 710、720 分别向增益块 742a、742b 提供滤波采样,增益块 724a、724b 分 别将采样提供至响度估计器 730a、730b。 每个响度估计器可以实现响度估计过程,如在 图 9 中描述的响度估计 1200。
     参照图 9,在方框 904,每个响度估计器 730 可以通过反转响度曲线 ( 例如,经 由增益方框 742) 对滤波器 710 或 720 的输出进行加权。 反转响度曲线可以基于多个可能 的响度加权曲线之一。 例如,图 10A 示出了称作 C 加权曲线的示例响度加权曲线 1010 的 曲线图 1000A。 C 加权曲线可以基于 100-phon 响度曲线 ( 参见图 1C)。 图 10B 示出了 可以在过程 900 的方框 904 处使用的示例反转 C 加权曲线 1020 的曲线图 1000B。 还示出 了可以在其他实施例中使用的示例反转 A 加权曲线 1030。 曲线 1020、1030 的特性可以 所选的采样速率。
     再次参照图 9,方框 904 中的加权可以包括将采样乘以与采样的频带相对应的反 转响度曲线上的值。 例如,图 10B 的曲线图 1300B 示出了 x 轴上的 16 个频带 ( 在一个 实施例中,与 16 个逼近滤波器相对应 )。 在 y 轴上可以找到针对给定频带的反转 C 加权 曲线 1020 的相应权重值。
     再次转向图 9,在方框 906,在每个频带中,为采样使用每个滤波并加权后的采 样的绝对值。在方框 910,可以对每个频带的加权后的采样应用幂律函数,以得到每个频 带的估计响度。 该函数可以应用于在特定阈值以上的采样。 取而代之地,幂律函数还可 以应用于每个频带的采样的平均。 幂律函数可以是以下形式 :
     Lband = blk (8)
     其中, I 表示针对给定频带的加权后的采样或采样的平均, b 和 k 表示可以在经 验上确定的常量, Lband 表示该频带的响度。
     在方框 912,通过对每个频带的响度值求和,来计算采样块的估计总响度。 例 如,可以对每个频带的等式 (8) 的输出进行求和,以得到采样块的估计响度。
     再次参照图 7,每个响度估计器 730 的输出由增益方框 742c 来缩放,并且被提供 至求和方框 750,在求和方框 750,将估计响度加在一起以提供总估计响度。 将该总估计 响度提供至零交叉调节方框 760 和能量缩放方框 770。 除了上述相位分析以外,零交叉 调节方框 760 还使用零交叉计数来区分类噪声信号和类周期信号。 例如,零交叉调节方 框 760 可以检测具有较多零交叉的信号,并确定这些信号包含更多噪声。 零交叉调节方 框 760 可以根据需要进一步提高类噪声低级别信号的级别。
     能量缩放方框 770 利用能量分析模块 324( 图 3) 所计算的块的能量或功率对总估 计响度进行加权。 这种加权可以是以下形式 :
     在等式 (9) 中,a 是可以基于用户定义的模式而变化的常量。 在一个实施例中,可以应用两个响度控制模式,轻度控制或正常控制。 轻度控制可以执行较弱响度调节。 例如,对于轻度响度调节,常量 “a” 的值可以更低。 Ltotal 表示总估计响度, E 表示块 的能量。 Level 指的是对于该采样模块计算出的响度级 780。 该总响度级可以表示 :为 了使采样块的响度遵循以上使用的等响度曲线 ( 例如, C 加权曲线所基于的 100-phon 曲 线 ),信号的增益应当达到的标量值。
     在特定实施例中,利用块的能量 E( 或在其他实现方式中,功率 ) 对总估计响度 进行缩放,这是因为一些信号在可听阈值以下。 如果基于以上响度曲线之一用这些信号 来度量响度,则这些信号可能不够接近用于计算精确响度的响度曲线。 因此,可以利用 块的能量来均衡总估计响度。 将总估计响度除以来自低信号块的较小能量可以提高总等 级估计。
     图 11 示出了用于基于所测量的响度来调节增益的增益调节过程 1100 的实施例。 过程 1100 可以由图 1 的增益控制模块 140 来实现,例如,当增益控制模块 140 接收到了如 以上太阳城集团图 7 所描述的总响度级计算时。 由于两个连续采样块的响度级可能不同,所以 可以针对每个块产生不同的增益系数,以使块达到基准级。 为了避免增益的突然变化, 增益调节过程 1100 可以递增地应用增益系数。 此外,增益调节过程 1100 可以计算一个 通道 ( 例如,主通道 ) 的增益系数并将增益系数应用至两个通道。
     在方框 1102,计算德尔塔级。 德尔塔级可以包括 ( 例如针对先前采样的 ) 上一 增益系数 (Last Gain Coefficient) 与以上太阳城集团图 7 所确定的总响度级 (Level) 之差。 可以 将该差值乘以常量 g。 得到的结果是德尔塔增益 (delta gain),可以逐采样以递增的方式 来应用该德尔塔增益 :
     delta gain = (Level-Last Gain Coefficient)*g (10) 常量 g 可以有效地将增益级计 算结果与上一增益系数之差分成更小的德尔塔增益。 在特定实施例中,当首先初始化增 益控制模块 140 时,将 LGC 设置为 1.0 标量 ( 或 0dB),作为与总响度级相关或相等的基 准级。 在特定实施例中,这是用于保持动态范围的满刻度基准级。
     如以下将描述的,可以递增地将德尔塔增益应用到采样块的每个采样,直到采 样与其相应增益系数的乘积达到缩放的满刻度值的特定百分比为止。 因此,采样块的第 一采样的增益可以是 LGC1+ 德尔塔增益。 对于下一采样,具有等于 LGC1+ 德尔塔增益的 新的 LGC2。 因此,第二采样的增益可以是 LGC1+ 德尔塔增益。 因此,德尔塔增益可以 用于基于图 7 的动态变化的响度计算结果,逐步从先前采样块的增益系数过渡为新的增 益系数集合。 这种逐步过渡可能减小信号输出级别的突然变化。
     为了防止其他的突然变化,在方框 1104,采用先行线来检查所计算的德尔塔增 益的递增对增益系数的更新是否会导致相应的采样值超过目标限幅器级。 先行线可以是 如以上太阳城集团图 3 所描述的先行线。 先行线可以包括在正在被处理的当前采样块之后的采 样块的采样。 可以为先行线填充每一个左右采样对的最大采样。 在特定实施例中,通过 将块的每个采样对的绝对值的最大值包含在内,先行线可以确保输出信号级不会超过设 置的基准级。 因此,可以使用一个通道而不是两个通道来分析增益系数。
     在判定方框 1106,确定是否会超过目标限幅器级。 如果是,则可以在方框 1108 计算衰减 (Decay),并且可以针对该采样将德尔塔增益归零。 可以通过考虑先行线中相 应采样值超过目标限幅器级的下标 (index) 来计算衰减值。 下标可以是任何数组下标或其他。 可以使用以下等式来计算这种衰减 :
     其中,R 表示目标限幅器级,G 是电流增益系数,index( 索引 ) 是先行线中采样 值超过目标限幅器级的下标。 在一个实施例中,针对电流采样块计算衰减值的点也存储 在临时缓冲器中,并且稍后使用在过程 1100 中,以对在检测到的衰减点周围的计算增益 系数进行平滑。
     在方框 1110,如上所述,以等于当前德尔塔增益的量来更新当前采样的增益系 数。 该德尔塔增益是已经使用等式 (10) 计算出的德尔塔增益,或者在已经检测到衰减点 的情况下该德尔塔增益是零。 如果已经检测到衰减点,则利用通过等式 (11) 计算出的衰 减来更新增益系数,例如,通过将衰减与上一增益系数相加来更新增益系数。 然后,在 方框 1112,对增益系数进行平滑。 例如,可以由一阶平滑函数来处理增益系数。
     平滑函数可以使用先行线中发生衰减的存储下标。 还可以根据衰减点在增益系 数临时缓冲器中的位置,在缓冲器中向前或向后应用平滑函数。 通过应用平滑函数,可 以调节相邻的增益系数,使得在衰减点周围存在更平滑的增益过渡。
     在方框 1114,针对每个采样来应用增益。 因此,在特定实施例中,由于在采 样之间对增益进行平滑,过程 1100 可以输出具有实质上恒定的、可能会有微小变化的平 均响度级的音频信号。 输出信号还可以遵循或实质上遵循以上所选的响度曲线 ( 例如, 100phon 曲线或其他曲线 )。 因此,在一个实施例中 ( 参见图 1A) 在用户进行音量处理之 前,一个采样块的响度可以实质上与先前采样块的响度相同。
     结论
     根据实施例,本文所描述特定动作、事件或任何算法的函数可以按照不同顺序 来执行,都可以被添加、合并或省略 ( 例如,对于实现算法来说,不是所描述的所有动 作或事件都是必要的 )。此外,在特定实施例中,动作或事件是可以同时执行的,例如, 通过多线程处理、中断处理或多个处理器或处理器核来执行,而不是顺序地执行。
     可以以电子硬件、计算机软件或两者的组合来实现与本文所公开的实施例相结 合而描述的各个示意性逻辑块、模块以及算法步骤。 为了清楚地说明硬件和软件的可互 换性,以上总体在功能上描述了各个说明性组件、块、模块以及步骤。 这样的功能是以 硬件还是以软件来实现取决于具体应用以及强加在整个系统上的设计限制。 对于每一种 具体应用可以以多种方式来实现上述功能,但是这种实现方式的判定不应被解释为导致 脱离本公开的范围。
     与本文所公开的实施例相结合而描述的各个说明性逻辑块和模块可以由机器 来实现或执行,所述机器例如是通用处理器、数字信号处理器 (DSP)、专用集成电路 (ASIC)、现场可编程门阵列 (FPGA) 或其他可编程逻辑器件、离散门或晶体管逻辑、离 散硬件组件、或用于执行本文所描述的功能的以上项目的任意组合。 通用处理器可以是 微处理器,但是备选地,通用处理器可以是处理器、控制器、微控制器、或状态机、上 述项目的组合或其他。 处理器还可以被实现为计算设备的组合,例如, DSP 与微处理器 的组合、多个微处理器、与 DSP 核相结合的一个或多个微处理器、或任何其他类似的配 置。
     与本文公开的实施例相结合而描述的方法步骤或算法可以直接以硬件、由处理 器执行的软件模块、或两者的组合的形式来实现。 软件模块可以驻留在 RAM 存储器、闪 存存储器、 ROM 存储器、 EPROM 存储器、 EEPROM 存储器、寄存器、硬盘、可拆卸磁 盘、CD-ROM 或现有技术已知的任何形式的存储介质中。 示例存储介质可以耦合至处理 器,使得处理器可以从存储介质读取太阳城集团和向存储介质写入太阳城集团。 备选地,存储介质可 以集成到处理器。 处理器和存储介质可以驻留在 ASIC 中。 ASIC 可以驻留在用户终端 中。 备选地,处理器和存储介质可以作为离散的组件驻留在用户终端中。
     除非具体声明或通过上下文可以理解,否则这里使用的诸如 “可以”、 “能 够”、 “可能”、 “例如” 等条件性语言一般旨在传达的意思是 :特定实施例包括特定 的特征、元件和 / 或状态,而其他实施例不包括这些特征、元件和 / 或状态。 因此,这 样的条件性语言通常并不旨在暗示 :特征、元件和 / 或状态对于一个或多个实施例而言 无论如何都是需要的,或者一个或多个实施例有必要包括用于在有或没有程序设计者输 入或提示的情况下,判定这些特征、元件和 / 或状态是否包含在任何具体实施例中或由 其来执行的逻辑。
     尽管以上详细描述示出、描述并指出了应用于不同实施例的新的特征,然而将 理解,在不脱离本公开的精神的前提下,可以对所说明的设备或算法进行各种省略、替 换或形式和细节上的修改。 将认识到,本文所描述的本发明的特定实施例并没有提供本 文所产生的所有特征和优点,因为一些特征是可以彼此独立地使用或实现的。 本文所公 开的特定发明的范围所附权利要求来限定,而非由前述说明书来限定。 在权利要求等价 物的含义和范围之内的所有改变都将包含在权利要求的范围之内。

关 键 词:
用于 调节 音频 信号 感知 响度 系统
  专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
太阳城集团本文
本文标题:用于调节音频信号的感知响度的系统.pdf
链接地址:http://zh228.com/p-6420402.html
太阳城集团我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

copyright@ 2017-2018 zhuanlichaxun.net网站版权所有
经营许可证编号:粤ICP备17046363号-1 
 


收起
展开
葡京赌场|welcome document.write ('');