房间脉冲响应测量与模拟方法

可以发现最大长度序列信号的自相关函数为单位脉冲响应。在计算房间脉冲响应时,正是利用了公式中最大长度序列的自相关函数性质。房间可以被视为一个线性时不变系统,因此计算房间脉冲响应可以被视为一个系统辨识问题。在忽略噪声的情况下,系统的输出信号y(t)可以由系统的输入信号x(t)和系统的脉冲响应h(t)卷积得到:

在公式两端对输入信号x(t)进行互相关运算,可得:

将最大长度序列的自相关函数的性质带入上式,可得:

以上推导表明:对系统的输入信号和输出信号进行互相关运算,即可计算出系统的脉冲响应。对于房间系统而言,互相关运算计算出了房间脉冲响应。

由于最大长度序列是可重复信号,因此可以进行多次测量取平均以减少测量的随机误差,这也是最大长度序列信号相对于白噪声信号的优势之一。需要注意的是,在生成最大长度序列信号时应该根据所需房间脉冲响应的长度选择合适的阶数。如果阶数过小,生成的最大长度序列信号长度短于所需房间脉冲响应的长度,会造成信号混叠,导致计算错误[2]。图1分别展示了在真实房间中使用最大长度序列法进行测量时的输入信号、输出信号,以及测得的房间脉冲响应。

精准地测量房间脉冲响应需要专业的仪器与人员,并且耗费较多的时间与精力,不利于大规模测量。在构建混响语音数据集用于训练深度神经 络时,由于数据集的大小与质量直接决定了算法的性能,因此为了获取大量的房间脉冲响应数据,往往采用计算机模拟的方法人工生成房间脉冲响应。

计算机模拟房间脉冲响应的方法主要可分为四类:第一类是基于波动声学的方法,如有限元法[3]和边界元法[4]。这类方法可以准确地模拟房间中的声波传输,但是对于高频声波的计算复杂度比较高。第二类是基于射线声学的方法,如虚源法[5]和路径追踪法[6]。这类方法因为计算复杂度较低而被广泛使用,但是该类方法对于低频声波的仿真存在局限。第三类是基于RIR统计模型的方法,如Schroder统计模型,但是该类方法模拟的RIR与真实的RIR在早期混响部分存在显著差异。第四类是基于深度学习的方法,以上介绍的三类传统RIR模拟。

(a)输入信号

(b)输出信号

(c)测得的房间脉冲响应

图1 在真实房间中使用最大长度序列法进行测量时的信号

图2 使用虚源法模拟的房间脉冲响应时域波形图

房间脉冲响应主要由直达声、早期反射声、晚期反射声三部分组成,分别使用黑色、红色、蓝色进行标注。从房间脉冲响应最大值所对应的时间开始计算,前8ms的信号属于直达声,从8ms到50ms的信号属于早期反射声,50ms以后的信号属于晚期反射声。在具有长混响时间的房间中,晚期反射声占有主导地位。

虚源法所模拟的房间脉冲响应具有在时域上稀疏的特性,并且其波形由标准的脉冲声和反射声组成。然而,实际房间中的房间性质及反射物更为复杂,因此使用虚源法模拟的房间脉冲响应往往与实际房间中的房间脉冲响应不符。此外,由于虚源法是一种基于射线声学理论的理论模型,无法模拟低频声波特性和复杂房间中的声波传播过程。因此,在使用虚源法所模拟的房间脉冲响应训练深度学习模型时,会造成模型失配问题,导致混响时间盲估计模型在实际应用中性能下降。因此,需要提出一些更加切合实际的房间脉冲响应模拟法,尽量避免了使用虚源法模拟房间脉冲响应带来的弊端。

关键词:

房间脉冲响应、房间脉冲响应测量

参考文献:

[1]STAN G B, EMBRECHTS J J, ARCHAMBEAU D. Comparison of different impulse response measurement techniques[J]. Journal of the Audio engineering society, 2002, 50(4): 249-262.

[2]NIELSEN J L. Maximum-Length Sequence Measurement of Room Impulse Responses with High-Level Disturbances[C]//Audio Engineering Society Convention 100. Audio Engineering Society, 1996.

[3]SHUKU T, ISHIHARA K. The analysis of the acoustic field in irregularly shaped rooms by the finite element method[J]. Journal of Sound and Vibration, 1973, 29(1): 67-IN1.

[4]KIRKUP S. The boundary element method in acoustics: A survey[J]. Applied Sciences, 2019, 9(8): 1642.

[5]ALLEN J B, BERKLEY D A. Image method for efficiently simulating small-room acoustics[J]. The Journal of the Acoustical Society of America, 1979, 65(4): 943-950.

[6]KROKSTAD A, STROM S, S?RSDAL S. Calculating the acoustical room response by the use of a ray tracing technique[J]. Journal of Sound and Vibration, 1968, 8(1): 118-125.

[7]RATNARAJAH A, TANG Z, MANOCHA D. IR-GAN: Room Impulse Response Generator for Far-field Speech Recognition[J/OL]. 2020[2021-07-26]. https://arxiv.org/abs/2010.13219v3.

[8]RATNARAJAH A, ZHANG S X, YU M, 等. FAST-RIR: Fast neural diffuse room impulse response generator[J]. arXiv preprint arXiv:2110.04057, 2021.


关于我们

21dB声学人是中国科学院声学研究所苏州电声产业化基地旗下科技媒体,专注于声学新技术、音频测试与分析、声学市场调研、声学学习社群建设等。

合作推广

稿件投稿 | 项目推广 | 创业支持

请发送需求至以下邮箱,我们将派专人与您联系

21db@ioasonic.com

版权声明

文中所有图片和文字版权归21dB声学人所有

如需转载或媒体合作,请与我们联系

声明:本站部分文章内容及图片转载于互联 、内容不代表本站观点,如有内容涉及侵权,请您立即联系本站处理,非常感谢!

(0)
上一篇 2022年9月5日
下一篇 2022年9月5日

相关推荐