设计

环境建模

更新时间: 2026年2月26日

头部相关传输功能 (HRTF) 与衰减相结合，提供了三维声音的无回声模型，该模型展现出明显的方向提示，但由于缺乏房间氛围，声音听起来干涩和人工。为了弥补这一点，我们可以添加环境建模来模仿附近几何图形的声学效果。

在本节中，我们将介绍推动环境建模的几个核心概念，包括混响和反射、示例模型、模拟和世界声场等。

混响和反射

当声音在空间中传播时，它会从各个表面反射，产生一系列的回声。初始的不同回声（又被称为“早期反射”）有助于确定声音的方向和距离。随着这些回声的传播、减弱和相互作用，它们会创造出晚期混响尾音，这有助于营造空间感。

Visualization of how projected sounds reflect off surfaces, while early reflections reach us first

鞋盒模型

一些 3D 位置实现会将简单的“鞋盒房间”建模放置在 HRTF 实现之上。这包括指定六面平行墙壁（例如：“鞋盒”）的距离和反射率，有时还指定听众在房间内的位置和方向。通过这个基本模型，您可以模拟墙壁的早期反射和晚期混响特性。

虽然仍有许多不足，但该模型比人工或无混响模型要好得多。

Visualization of the shoebox model, showing the listener within a three dimensional shape that resembles a shoebox

人工混响

由于模拟实际墙壁和晚期混响在计算方面很快变得成本昂贵，因此混响经常通过人工的特别方法引入，例如 20 世纪 80 年代和 90 年代的数字混响设备中使用的方法。虽然比物理模型的计算量小，但这些模型不考虑听众的方向或周围的实际环境，因此这些方法听起来不太现实。

采样脉冲响应混响

卷积混响会从特定的真实世界地点采样脉冲响应 (IR)，例如录音室、体育场或礼堂。然后，它可以应用于信号，使声音听起来像是从那个位置内播放的；这样可以产生非常真实和沉浸式的混响效果。缺点是，从中捕捉 IR 的真实环境未必能够完美地映射到虚拟世界，而且由于 IR 是从单一位置捕捉的，它不会随着用户在整个布景中移动而调整。

世界几何图形和声场

“鞋盒模型”尝试以简化的方式代表布景的几何图形。该模型假设没有遮挡，所有表面的吸收频率相等，六面平行墙与听众头部之间的距离固定。不用说，这是为了性能而做出的重大简化。随着沉浸式环境变得更加复杂和动态，它可能无法正确地缩放。

目前存在一些模拟衍射和复杂环境几何图形的解决方法，但没有得到广泛支持，并且性能影响仍然很大。

声学射线追踪

声学效果射线追踪是 Meta XR 音频 SDK 中包含的用于 Unity 或 Unreal 的新工具，它可以根据实际的游戏几何图形模拟声音从声源传播到听众的方式。这包括早期反射、混响、遮挡、阻挡和衍射。声学效果射线追踪能够快速、轻松地在复杂空间中实现现实声学效果，还可以使用控件微调响应以实现您的创意愿景。这是相对于用于 Unity、Unreal、FMOD（Unity 或 Unreal 集成）以及 Wwise（Unity 或 Unreal 集成）的轻量鞋盒房间声学模型的另一选择。