💡 Key Takeaways
- The Moment Everything Changed
- Understanding the Three Layers of Sound Design
- The Technical Foundation: Tools and Workflow
- Recording Techniques That Actually Matter
一切变化的瞬间
我仍然记得我意识到声音设计能决定一个项目成败的确切时刻。那是2009年,我正在制作我的第一款独立游戏——一款视觉上惊艳但感觉完全无生命的恐怖游戏。我们花了八个月的时间来完善图形、灯光和角色模型。一切看起来都很惊人。但是当我们将其展示给第一个焦点小组时,反馈非常残酷:“感觉空荡荡的。就像一个技术演示,而不是一个游戏。”
💡 关键要点
- 一切变化的瞬间
- 理解声音设计的三层结构
- 技术基础:工具与工作流程
- 真正重要的录音技巧
那个晚上,我熬夜到凌晨四点,只添加了三个声音元素:从废弃走廊传来的遥远风声、玩家脚下地板的轻微吱吱声,以及每30秒脉动一次的几乎不可察觉的低频隆隆声。第二天,我们把同一个版本展示给了另一组人,反应截然不同。玩家们表示感到“真正的不安”、“沉浸其中”,以及“仿佛环境是活的”。我们没有改变一个像素,只是添加了声音。
这次经验开启了我作为专业声音设计师的职业生涯。在过去的15年里,我参与制作了47个商业游戏标题、数十个视频项目,并与三个大洲的工作室合作。我明白了声音设计不仅仅是让声音听起来好——而是创建情感共鸣、引导注意力以及构建即使在完全幻想的世界中也能感觉真实的世界。
今天,我想分享那些把我从“为项目添加声音”的人转变为“构建完整音频体验”的核心原则。不管你是制作第一部YouTube视频还是开发一款雄心勃勃的游戏,这些原则将使你的作品从业余提升到专业水平。
理解声音设计的三层结构
大多数初学者在进行声音设计时呈线性思维——他们看到屏幕上的动作,就添加相应的声音。门开了,就添加门声;角色说话,就录制对话。这种方法创造了功能性音频,但忽略了使声音设计真正有效的更深层架构。
“声音设计不仅仅是让事情听起来好——而是创建情感共鸣、引导注意力以及构建即使在完全幻想的世界中也能感觉真实的世界。”
专业声音设计在三个不同的层次上运作,每个层次都有其特定的目的。我称之为“层蛋糕模型”(Layer Cake Model),理解这一点是我职业生涯中最重要的突破。
第一层是 叙事声音(diegetic sound)——存在于你的视频或游戏世界中的声音。这些是你的角色理论上可以听到的声音:脚步声、对话、环境音、物体交互。这个层次使你的观众扎根于你所创造的现实。在我的经验中,叙事声音在大多数项目中应占总音频混合的60%到70%左右。当我在《遗忘的回声》(Echoes of the Forgotten)中工作时,这是一款售出超过200,000份的益智冒险游戏,我们花了三周时间来完善叙事层——古老机制的磨动声、洞穴中水滴的声响以及主角的呼吸声,随着体力消耗而变化。
第二层是 非叙事声音(non-diegetic sound)——为观众存在但角色无法听到的音频。这包括你的音乐配乐、游戏中的用户界面声音以及视频中的旁白。这个层次塑造了情感反应并提供信息。它在混合中应占大约20%-30%。关键是让这一层听起来是整体的一部分,而不是在上面附加的。当我为戏剧场景作曲时,我经常使用能与叙事层声音相呼应的乐器或音色。如果你的游戏设定在森林中,也许你的配乐会使用木制打击乐器或带呼吸声的长笛,从潜意识上与沙沙作响的树叶和风相连接。
第三层是我称之为 心理声学设计(psychoacoustic design)——在意识下运作以创造感觉和引导注意力的声音。这包括造成紧张感的微弱低频隆隆声、暗示魔法或科技的高频闪烁声,以及战略性使用的沉默。这个层次的音量通常只占混合的大约10%-20%,但它对情感影响的贡献大约占40%。在恐怖游戏中,我经常使用超低频声波(频率低于20 Hz,人类意识无法听到但能感受到)来产生不安。在一个项目中,我们在探索序列中添加了一个17 Hz的音调,它的脉动是不规则的。玩家无法识别是什么让他们感到焦虑,但他们的心率明显增加。
当这三个层次协调工作时,魔力就会出现。打开的门不仅仅是叙事层的吱吱声——它可能还有一段微妙的非叙事音乐,强调其重要性,还有一个低频成分,暗示在门后是什么安全的还是危险的。这种分层的方法使专业声音设计与业余工作之间的区别。
技术基础:工具与工作流程
让我们谈谈实际方面。你不需要一个50,000美元的工作室来创造专业的声音设计,但你确实需要了解你的工具,并建立一个高效的工作流程。经过多年的实验,我开发了一个平衡质量与可及性的设置。
| 声音层 | 目的 | 示例 | 频率范围 |
|---|---|---|---|
| 环境音(Ambient) | 创造气氛和世界存在感 | 风、房间音、远处交通、环境环绕音 | 20-500 Hz(低中频) |
| 音效/叙事声音(Foley/Diegetic) | 将动作扎根于物理现实 | 脚步声、门吱声、物体交互、衣物沙沙声 | 200-8000 Hz(中高频) |
| 界面/UI(Interface/UI) | 提供反馈,引导注意力 | 按钮点击声、通知声、菜单声音、成就提示音 | 1000-12000 Hz(高频) |
| 音乐/配乐(Music/Score) | 推动情感叙事和节拍 | 背景音乐、动态主题、紧张提示 | 完整频谱20-20000 Hz |
| 标志性/冲击声(Signature/Impact) | 创造难忘时刻和强调 | 爆炸、特殊能力、戏剧性揭示、过渡效果 | 完整频谱和超低频 |
在录音方面,我使用Zoom H6录音机(约350美元)配备Rode NTG3枪式麦克风(700美元)。这个组合可以捕捉到从移动游戏到戏剧电影的项目声音。是的,还有更昂贵的选择——我在专业工作室使用过3000美元的麦克风——但质量差异可能只有15%-20%,而价格差距却是400%。对大多数创作者而言,这样的数学是不合理的。
我选择的数字音频工作站(DAW)是Reaper,它的个人许可费用仅为60美元。我也曾广泛使用Pro Tools(行业标准,约600美元每年),老实说,对于声音设计工作,Reaper以极低的成本完成了Pro Tools 95%的功能。剩下的5%仅在你在大型协作环境中进行特定工作流要求时才重要。
在声音库方面,我维护着约180,000个单独声音文件的集合,组织得非常有条理。大约40%是我自己录制的声音,30%来自像Boom Library这样的商业库(多年来我大约投资了2000美元),还有30%来自Freesound.org等免费来源。这是许多初学者没有意识到的一点:免费声音往往和商业声音一样好。不同之处在于组织和多样性。商业库提供50种关闭门的变体;而免费库可能只提供三种。但如果你愿意进行更多的编辑和分层,你可以达到相同的效果。
我的工作流程遵循着一致的模式,我在数百个项目中不断精炼。首先,我进行一次完整的声音标注——观看整个视频或玩完游戏的一部分,并记录每种所需声音。我使用一个包含时间码、声音描述、优先级(A/B/C)和备注的电子表格。对于一段10分钟的视频或30分钟的游戏部分,这通常需要2-3小时。
其次,在开始编辑之前,我会采集或创建所有声音。这种“批处理”方法比线性工作方法高效约40%。我会花一整天录制声音效果,另一整天搜索库,或许再花一天合成声音。只有在那之后,我才会打开我的DAW开始放置声音。
第三,我会分阶段进行工作。第一次是将声音放置到位——粗略的时机,没有任何处理。第二次是时机精化和基本均衡。第三次是添加效果和处理。第四次是混音和调平。这种方法能够阻止我在一个我可能之后发现没用的声音上花费30分钟来完美化。
真正重要的录音技巧
互联网充满了录音建议,但大多数都集中在