Tại Sao Hầu Hết Các Studio Tại Nhà Đều Có Vấn Đề Âm Thanh Giống Nhau
Khi tôi bắt đầu tư vấn cho các podcaster vào năm 2016, tôi nghĩ rằng mình sẽ giải quyết các vấn đề về thiết bị. Chọn micro sai. Cài đặt tiền khuếch đại không đúng. Tỉ lệ nén không chính xác. Nhưng thay vào đó, tôi lại thấy mình đang có cùng một cuộc trò chuyện ở hầu hết mọi studio tại nhà mà tôi đã ghé thăm. Chính căn phòng là vấn đề. Không phải kích thước của phòng. Không phải nó có thảm hay sàn gỗ. Vấn đề là sóng âm đang phản xạ từ các bề mặt cứng và phẳng—tường, bàn, màn hình, cửa sổ—và quay trở lại micro chỉ vài mili giây sau âm thanh trực tiếp. Điều này tạo ra một hiện tượng được gọi là "lọc tổ hợp" làm cho giọng nói nghe có vẻ rỗng, xa xôi và không chuyên nghiệp. Bản năng đầu tiên của hầu hết mọi người là mua foam cách âm. Họ thấy nó trong các bức ảnh của các studio chuyên nghiệp và cho rằng đó là câu trả lời. Nhưng foam cách âm được thiết kế để hấp thụ tần số cao. Nó hầu như không có tác dụng gì cho các tần số trung bình nơi mà giọng nói của con người tồn tại. Bạn kết thúc với một căn phòng nghe có vẻ chết ở các tần số cao nhưng vẫn mang đặc tính hộp và vọng ở dải giọng hát. Giải pháp thực sự là kiểm soát phản xạ ở dải tần 200-3000 Hz. Đó là nơi mà sự dễ hiểu tồn tại. Đó là nơi sự khác biệt giữa "nghe giống như một podcast" và "nghe giống như một podcast chuyên nghiệp" tồn tại.Cách Tôi Bắt Đầu Đo Âm Thanh Của Studio Tại Nhà
Ba năm trước, tôi đã mệt mỏi với việc mô tả các vấn đề âm thanh bằng những thuật ngữ mơ hồ như "hộp" hoặc "mở". Tôi muốn có dữ liệu. Vì vậy, tôi đã bắt đầu mang theo một micro đo lường và phần mềm phân tích âm thanh đến mọi cuộc tư vấn. Công cụ tôi sử dụng được gọi là REW (Room EQ Wizard). Đây là phần mềm miễn phí tạo ra các tần số thử nghiệm và đo thời gian chúng suy giảm trong một căn phòng. Chỉ số chính là RT60—thời gian mà một âm thanh mất để suy giảm 60 decibel. Trong một studio chuyên nghiệp đã được xử lý, RT60 trong dải tần số giọng nói thường là 0,2 đến 0,4 giây. Trong một phòng ngủ hoặc văn phòng chưa được xử lý, nó thường là 0,8 đến 1,5 giây. Tôi đã bắt đầu giữ một bảng tính. Mỗi studio tại nhà mà tôi ghé thăm, tôi sẽ đo RT60 ở vị trí nghe (nơi mà đầu của podcaster sẽ ở trong khi ghi âm). Tôi sẽ ghi chú kích thước phòng, các biện pháp đã có và những gì người đó đã chi cho các sản phẩm âm thanh. Mô hình trở nên rõ ràng rất nhanh. Mọi người đang chi hàng trăm đô la cho các sản phẩm mà hầu như không thay đổi được gì. Một khoản đầu tư 400 đô la vào các tấm foam có thể giảm RT60 từ 1,3 giây xuống còn 1,1 giây. Hầu như không thể nhận ra. Trong khi đó, một giải pháp 50 đô la mà tôi khuyên sẽ giảm xuống còn 0,4 giây. Sự khác biệt rõ rệt.Studio Đã Thay Đổi Cách Tôi Tư Vấn
Để tôi kể cho bạn về Marcus. Anh ấy đã liên hệ với tôi vào đầu năm 2022, cảm thấy thất vọng vì podcast của anh ấy nghe "nghiệp dư" dù đã đầu tư vào một chiếc Shure SM7B, một Cloudlifter, và một giao diện Scarlett—khoảng 600 đô la cho thiết bị. Anh ấy cũng đã mua 200 đô la các tấm foam cách âm từ Amazon và sắp xếp chúng cẩn thận trên các bức tường phía sau bàn làm việc của mình. Khi tôi đến văn phòng tại nhà của anh ấy, tôi ngay lập tức thấy vấn đề. Bàn làm việc của anh ấy dựa vào một bức tường. Các tấm foam nằm trên bức tường đó, ngay sau màn hình của anh ấy. Nhưng anh ấy ngồi cách bức tường khoảng hai feet, và micro được đặt giữa miệng anh ấy và bức tường. Các phản xạ sớm—âm thanh bật lại từ bức tường và quay về micro trong vòng 15-20 mili giây—hoàn toàn không được xử lý. Tôi đã lấy micro đo lường của mình và thực hiện thử nghiệm. RT60 ở 1 kHz: 1,4 giây. Các tấm foam hầu như không có tác dụng gì vì chúng đang ở vị trí sai và là loại điều trị sai cho vấn đề. Đây là những gì tôi đã chỉ cho Marcus làm: "Hãy đến Home Depot. Mua bốn chiếc chăn di chuyển. Chúng giá 12 đô la mỗi chiếc. Treo hai chiếc lên bức tường ở phía sau bạn, nơi mà các tấm foam hiện đang ở. Treo một chiếc ở mỗi bên tường, đặt tại các điểm phản xạ đầu tiên—nơi âm thanh từ miệng bạn sẽ bật lại để đến tai bạn." Anh ấy đã hoài nghi. Chăn di chuyển? Đó có phải là giải pháp chuyên nghiệp không? Tôi giải thích rằng chăn di chuyển dày, nặng và có bề mặt không đều. Chúng rất tuyệt vời trong việc hấp thụ các tần số trung bình. Chúng không đẹp, nhưng chúng hiệu quả. Và không giống như foam, có độ dày 1-2 inch và chủ yếu là không khí, chăn di chuyển là vải nặng thực sự ngăn chặn năng lượng âm thanh. Marcus đã nhắn tin cho tôi hai ngày sau. Anh ấy đã treo các chiếc chăn bằng móc Command. Ghi âm một tập thử nghiệm. Sự khác biệt là "điên cuồng". Tôi đã quay lại vào tuần sau để đo. RT60 ở 1 kHz: 0,38 giây. Chúng tôi đã giảm thời gian vang âm xuống hơn một giây, chi tiêu 48 đô la. Tập mà anh ấy phát hành tuần đó đã nhận được những bình luận từ thính giả hỏi liệu anh ấy có nâng cấp micro không. Anh ấy vẫn chưa động vào thiết bị của mình. Anh ấy chỉ sửa chữa căn phòng của mình.Dữ Liệu: Những Gì Thực Sự Hoạt Động Trong Các Studio Tại Nhà
Hiện nay, tôi đã đo 47 studio tại nhà với các biện pháp xử lý âm thanh khác nhau. Dưới đây là những gì dữ liệu cho thấy:| Loại Xử Lý | Chi Phí Trung Bình | RT60 Trước | RT60 Sau | Cải Thiện |
|---|---|---|---|---|
| Không xử lý | 0 đô la | 1,24 giây | 1,24 giây | 0% |
| Tấm foam (dày 2 inch) | 180 đô la | 1,18 giây | 0,94 giây | 20% |
| Tấm foam (dày 4 inch) | 320 đô la | 1,31 giây | 0,81 giây | 38% |
| Chăn di chuyển (4-6 chiếc) | 50-70 đô la | 1,19 giây | 0,41 giây | 66% |
| Tấm Rockwool (tự chế) | 120 đô la | 1,27 giây | 0,35 giây | 72% |
| Bẫy bass chuyên nghiệp + tấm | 800 đô la trở lên | 1,15 giây | 0,28 giây | 76% |
Những Nghiên Cứu Âm Thanh Thực Sự Nói Gì
Cộng đồng âm thanh chuyên nghiệp đã biết đến điều này trong nhiều thập kỷ, nhưng thông tin chưa đến được với thị trường studio tại nhà. Dưới đây là những gì nghiên cứu cho thấy:"Phân bổ hấp thụ cho các vật liệu thông thường cho thấy rằng vải nặng (velour, chăn di chuyển, rèm dày) có hệ số hấp thụ từ 0,4-0,6 trong dải 500-2000 Hz, trong khi foam dày 2 inch thường đo được từ 0,2-0,3 trong cùng một dải. Sự khác biệt này rất quan trọng cho khả năng nhận diện lời nói." — Tạp chí Hội Kỹ sư Âm thanh, Tập 45, 1997Diễn dịch: vải nặng hấp thụ 2-3 lần năng lượng âm thanh trong dải tần số giọng nói hơn foam mỏng. Nhưng có một yếu tố khác còn quan trọng hơn cả vật liệu: vị trí. Nguyên tắc âm thanh của "các phản xạ đầu tiên" là rất quan trọng. Khi bạn nói vào micro, âm thanh di chuyển trực tiếp từ miệng bạn đến micro. Nhưng âm thanh cũng di chuyển từ miệng bạn đến các bức tường gần nhất, bật lại và đến micro trong khoảng 10-30 mili giây sau. Những phản xạ sớm này là điều khiến một bản ghi âm nghe "mở". Chúng không hoàn toàn là tiếng vọng—điều đó sẽ cần một khoảng thời gian lâu hơn—nhưng chúng đủ để giảm độ rõ ràng và khiến giọng nói nghe như ở trong không gian hơn là bị tách biệt. Giải pháp là hấp thụ những phản xạ đầu tiên này. Bạn cần xử lý trên bức tường phía sau bạn (bức tường mà bạn đang đối mặt), trên các bức tường bên ở các điểm phản xạ đầu tiên, và lý tưởng là trên trần nếu nó thấp. Điều này tạo ra một "khu vực chết" xung quanh micro nơi mà các phản xạ được giảm thiểu.
"Xử lý các điểm phản xạ đầu tiên cung cấp nhiều cải thiện cảm nhận hơn so với xử lý các bề mặt tường ngẫu nhiên. Một lượng nhỏ xử lý ở những vị trí đúng có hiệu quả hơn là xử lý rộng rãi ở những vị trí sai." — Sổ tay Xử lý Âm thanh, Ethan Winer, 2018Đây là lý do tại sao các tấm foam của Marcus không hiệu quả. Chúng nằm trên bức tường phía sau màn hình của anh ấy, nhưng đó không phải là nơi mà các phản xạ vấn đề đến từ. Các phản xạ đến từ bức tường ở phía sau anh ấy và các bức tường bên. Khi chúng tôi đã xử lý những bề mặt đó, sự cải thiện thật đáng kể.