设计

环境建模

更新时间: 2026年2月26日
头部相关传输功能 (HRTF) 与衰减相结合,提供了三维声音的无回声模型,该模型展现出明显的方向提示,但由于缺乏房间氛围,声音听起来干涩和人工。为了弥补这一点,我们可以添加环境建模来模仿附近几何图形的声学效果。
在本节中,我们将介绍推动环境建模的几个核心概念,包括混响和反射、示例模型、模拟和世界声场等。

混响和反射

当声音在空间中传播时,它会从各个表面反射,产生一系列的回声。初始的不同回声(又被称为“早期反射”)有助于确定声音的方向和距离。随着这些回声的传播、减弱和相互作用,它们会创造出晚期混响尾音,这有助于营造空间感。
Visualization of how projected sounds reflect off surfaces, while early reflections reach us first

鞋盒模型

一些 3D 位置实现会将简单的“鞋盒房间”建模放置在 HRTF 实现之上。这包括指定六面平行墙壁(例如:“鞋盒”)的距离和反射率,有时还指定听众在房间内的位置和方向。通过这个基本模型,您可以模拟墙壁的早期反射和晚期混响特性。
虽然仍有许多不足,但该模型比人工或无混响模型要好得多。
Visualization of the shoebox model, showing the listener within a three dimensional shape that resembles a shoebox

人工混响

由于模拟实际墙壁和晚期混响在计算方面很快变得成本昂贵,因此混响经常通过人工的特别方法引入,例如 20 世纪 80 年代和 90 年代的数字混响设备中使用的方法。虽然比物理模型的计算量小,但这些模型不考虑听众的方向或周围的实际环境,因此这些方法听起来不太现实。

采样脉冲响应混响

卷积混响会从特定的真实世界地点采样脉冲响应 (IR),例如录音室、体育场或礼堂。然后,它可以应用于信号,使声音听起来像是从那个位置内播放的;这样可以产生非常真实和沉浸式的混响效果。缺点是,从中捕捉 IR 的真实环境未必能够完美地映射到虚拟世界,而且由于 IR 是从单一位置捕捉的,它不会随着用户在整个布景中移动而调整。

世界几何图形和声场

“鞋盒模型”尝试以简化的方式代表布景的几何图形。该模型假设没有遮挡,所有表面的吸收频率相等,六面平行墙与听众头部之间的距离固定。不用说,这是为了性能而做出的重大简化。随着沉浸式环境变得更加复杂和动态,它可能无法正确地缩放。
目前存在一些模拟衍射和复杂环境几何图形的解决方法,但没有得到广泛支持,并且性能影响仍然很大。

声学射线追踪

声学效果射线追踪是 Meta XR 音频 SDK 中包含的用于 UnityUnreal 的新工具,它可以根据实际的游戏几何图形模拟声音从声源传播到听众的方式。这包括早期反射、混响、遮挡、阻挡和衍射。声学效果射线追踪能够快速、轻松地在复杂空间中实现现实声学效果,还可以使用控件微调响应以实现您的创意愿景。这是相对于用于 UnityUnreal、FMOD(UnityUnreal 集成)以及 Wwise(UnityUnreal 集成)的轻量鞋盒房间声学模型的另一选择。

模拟和沉浸

音频在打造整体沉浸式体验中作用巨大,高质量的空间音频可以增强沉浸感并营造出一种真实的临场感,让用户感觉他们真的身处虚拟世界中。
当听众位于场景内,而不是从远处观看时,音频沉浸就能实现最大化。例如,在 3D 棋盘游戏中,当玩家低头看向虚拟棋盘时,会比玩家站在棋盘上下棋带来更少的空间化震撼感。同样,当移动元素带着逼真的音效经过听众的头部时,比起一个通过音频线索将听众从活动中隔离并让其意识到自己不在活动范围内的音景,更加震撼。
Visualization of user outside of the scene, looking down on a traditional sized chess board
Visualization of user inside of the scene, standing on chess board, only slightly larger than chess pieces

后续内容

请务必查看混合沉浸式音频指南,以及音频设备概览,进一步提高您对空间音频的理解。
如果您已准备好启动沉浸式音频工作,请务必查阅以下文档:

Meta 空间 SDK

Unity

Unreal 引擎