What about methodology: how i actually tested these tools?

Most audio tool reviews are useless. Someone opens the software, drags in a file, moves some sliders until it "sounds better," and declares a winner. That's not testing. That's guessing with expensive equipment.

What about before i knew what i was listening for?

Fifteen years ago, I thought clean audio meant silent audio. Remove everything that isn't the voice. Make it sound like it was recorded in an isolation booth, even if it was recorded in a parking lot. I spent hours with early noise reduction plugins, cranking every parameter to maximum, proud of...

What about testing results: the numbers tell half the story?

Here's what happened when I ran that terrible audio through six different noise reduction tools:

What "Forensic-Grade" Actually Means (And Doesn't)?

Marketing copy loves the word "forensic." Forensic-grade restoration. Forensic-quality processing. Forensic audio tools. The implication is clear: this is serious professional equipment that can extract information from audio that lesser tools cannot.

What about everyone says "use a noise gate first" but that's wrong?

The standard advice for cleaning noisy audio goes like this: apply a noise gate to cut out the noise between words, then use noise reduction on what remains. This is repeated in tutorials, taught in audio courses, and recommended by people who should know better.

I Tested 6 Noise Reduction Tools on the Same Terrible Audio [Tiếng Việt]

💡 Key Takeaways

Methodology: How I Actually Tested These Tools
Before I Knew What I Was Listening For
Testing Results: The Numbers Tell Half the Story
What "Forensic-Grade" Actually Means (And Doesn't)

# Tôi đã kiểm tra 6 công cụ giảm tiếng ồn trên cùng một audio tệ hại

💡 Những điểm chính

Phương pháp: Cách tôi thực sự kiểm tra những công cụ này
Trước khi tôi biết mình đang lắng nghe điều gì
Kết quả kiểm tra: Những con số kể một nửa câu chuyện
"Forensic-Grade" thực sự có nghĩa gì (và không có nghĩa gì)

Đoạn clip dài 60 giây giống nhau với tiếng ồn của máy điều hòa, tiếng gõ bàn phím và tiếng vang trong phòng. 6 công cụ. Tôi đã đo cải thiện tỷ lệ tín hiệu trên tiếng ồn, sự giới thiệu của các hiện tượng, và thời gian xử lý.

Tôi đã dành cả thập kỷ qua để làm sạch âm thanh mà hầu hết mọi người sẽ xóa bỏ ngay lập tức. Các bản ghi tòa án nơi chứng cứ duy nhất nói từ xa qua một kho hàng. Các cuộc phỏng vấn podcast được ghi âm trong các quán cà phê trong giờ cao điểm. Các tin nhắn thoại ghi âm trên điện thoại được giữ trong túi áo khoác trong những cơn bão gió. Công việc đã dạy tôi một điều mà hầu hết các kỹ sư âm thanh sẽ không thừa nhận: đắt tiền không có nghĩa là hiệu quả, và "sạch" thường là mã cho "đã phá hủy tất cả đặc trưng cùng với tiếng ồn."

Tháng trước, một podcaster đã gửi cho tôi một file khiến tôi đau đớn. Cô ấy đã ghi âm một cuộc phỏng vấn trong căn hộ của mình với máy điều hòa đang chạy, bàn phím cơ nằm trong tầm tay, và đủ tiếng vang trong phòng để khiến nó nghe như cô ấy đang phát sóng từ bên trong một container vận chuyển. "Bạn có thể cứu cái này không?" cô ấy hỏi. "Cuộc phỏng vấn thật tuyệt vời, nhưng tôi không thể phát hành nó như thế này."

Tôi có thể đã chạy nó qua quy trình công việc thông thường của mình và gửi lại. Thay vào đó, tôi đã làm điều khác. Tôi đã sao chép đoạn 60 giây đó sáu lần và xử lý từng cái qua một công cụ giảm tiếng ồn khác nhau—từ plugin miễn phí mà tôi đã sử dụng trong nhiều năm đến bộ phần mềm trị giá 400 đô la hứa hẹn "khôi phục chuẩn forensic." Sau đó tôi đã đo tất cả mọi thứ.

Phương pháp: Cách tôi thực sự kiểm tra những công cụ này

Hầu hết các bài đánh giá công cụ âm thanh là vô nghĩa. Ai đó mở phần mềm, kéo một file vào, di chuyển vài thanh trượt cho đến khi nó "nghe tốt hơn", và tuyên bố một người thắng. Đó không phải là kiểm tra. Đó là đoán với thiết bị đắt tiền.

Tôi cần các số đo khách quan, vì vậy tôi đã bắt đầu với các đặc điểm của file nguồn. Sử dụng phân tích phổ, tôi đã xác định ba loại tiếng ồn khác nhau: tiếng ồn máy điều hòa 60Hz với các bậc hài ở 120Hz và 180Hz, tiếng gõ bàn phím tạm thời dao động từ 2kHz đến 8kHz, và tiếng vang trong phòng với thời gian suy giảm khoảng 0.8 giây. Tỷ lệ tín hiệu trên tiếng ồn gốc đo được là 8.2 dB—về mặt kỹ thuật là âm thanh có thể nghe thấy, nhưng thật mệt mỏi khi nghe hơn ba mươi giây.

Đối với mỗi công cụ, tôi đã đo bốn chỉ số. Cải thiện tỷ lệ tín hiệu trên tiếng ồn cho tôi biết âm thanh đã trở nên sạch hơn bao nhiêu về mặt số học. Sự giới thiệu hiện tượng đếm số vấn đề mới mà việc xử lý tạo ra—tiếng kêu kim loại, hiệu ứng dưới nước, hoặc âm thanh "đã qua xử lý" đặc trưng kêu lên "Tôi đã cố gắng sửa cái này trong hậu kỳ." Thời gian xử lý quan trọng vì nếu một công cụ mất hai mươi phút để xử lý sáu mươi giây âm thanh, nó không thực tiễn cho bất kỳ ai làm việc theo thời hạn. Và chất lượng chủ quan, vì những con số không nói cho bạn tất cả—tôi đã có năm người với thính giác bình thường và hai người có đào tạo âm thanh chuyên nghiệp nghe từng phiên bản mà không biết công cụ nào đã xử lý nó.

File thử nghiệm tự nó đáng được giải thích. Đây không phải là tiếng ồn tổng hợp được thêm vào âm thanh sạch trong một phòng thí nghiệm. Đây là âm thanh thảm họa thực tế: một người phụ nữ nói với âm thanh bình thường, được ghi âm trên một micro USB tốt (Audio-Technica AT2020), nhưng trong môi trường tệ nhất có thể. Máy điều hòa là một kiểu gắn cửa sổ bật tắt liên tục. Bàn phím là Cherry MX Blue cơ—được chọn đặc biệt vì đây là kiểu chuyển mạch tiếng ồn lớn nhất thường được sử dụng. Căn phòng rộng 12x14 feet có sàn gỗ, không có xử lý âm học, và các bức tường song song tạo ra sóng đứng ở 40Hz và 80Hz.

Tôi đã xử lý từng file bằng cách sử dụng cài đặt mặc định "giọng nói" hoặc "đối thoại" của công cụ trước, sau đó thực hiện một lần điều chỉnh thứ hai để đạt được kết quả tốt nhất có thể. Cách tiếp cận hai lần này phản ánh cách mọi người thực sự sử dụng những công cụ này—cài đặt nhanh trước, sau đó điều chỉnh nếu cần.

Trước khi tôi biết mình đang lắng nghe điều gì

Mười lăm năm trước, tôi nghĩ âm thanh sạch có nghĩa là âm thanh im lặng. Xóa bỏ mọi thứ không phải là giọng nói. Làm cho nó nghe giống như được ghi âm trong một buồng cách âm, ngay cả khi nó được ghi âm ở một bãi đậu xe. Tôi đã dành hàng giờ với các plugin giảm tiếng ồn ban đầu, điều chỉnh mọi tham số lên tối đa, tự hào về việc mình đã loại bỏ nhiều như thế nào.

Rồi tôi được thuê để làm sạch âm thanh cho một bộ phim tài liệu về một người sống sót Holocaust 94 tuổi. Cuộc phỏng vấn đã được ghi âm trong căn hộ của cô—tòa nhà cũ, tường mỏng, tiếng ồn từ đường phố luôn lọt vào. Tôi đã xử lý nó theo cách tiếp cận quyết liệt thông thường và gửi cho đạo diễn.

Ngày hôm sau, cô ấy đã gọi cho tôi. "Chuyện gì đã xảy ra với giọng của cô ấy?" cô ấy hỏi. "Nghe như cô ấy đang nói qua điện thoại từ dưới nước. Bạn có nghe tiếng biến dạng ở một số từ không?"

Tôi đã nghe lại. Cô ấy đúng. Trong cuộc tìm kiếm của tôi để loại bỏ tiếng ồn nền, tôi đã giới thiệu các hiện tượng khiến người phụ nữ nghe có vẻ giả tạo. Tệ hơn, tôi đã loại bỏ một phần âm thanh của phòng mà đã tạo bối cảnh cho nơi cô ấy đang nói—nhà của cô, nơi cô đã sống suốt bốn mươi năm sau khi sống sót sau các trại tập trung. Sự sạch sẽ lâm sàng mà tôi đã tạo ra thực sự đã loại bỏ thông tin cảm xúc.

Đó là khi tôi học được sự khác biệt giữa âm thanh sạch và âm thanh chết. Âm thanh sạch có nền tiếng ồn đủ thấp để không gây phân tâm cho nội dung. Âm thanh chết đã được xử lý quá quyết liệt đến nỗi không còn nghe giống như con người. Mỗi công cụ giảm tiếng ồn đi trên đường này khác nhau, và hầu hết trong số chúng đều ngã về phía sai.

Cuộc phỏng vấn của người sống sót đã dạy tôi lắng nghe điều tôi gọi là "bài kiểm tra hơi thở." Khi ai đó nói, có những khoảnh khắc nhỏ giữa các từ mà họ hít vào, nơi miệng họ di chuyển, nơi cơ thể họ tồn tại trong không gian vật lý. Giảm tiếng ồn quyết liệt thường loại bỏ những âm thanh vi mô này cùng với tiếng ồn. Kết quả là về mặt kỹ thuật sạch hơn nhưng trống rỗng về mặt cảm xúc—lời nói nghe giống như đến từ một công cụ chuyển văn bản thành giọng nói hơn là một con người.

Tôi đã quay lại cuộc phỏng vấn đó và xử lý lại với một cách nhẹ nhàng hơn. Vâng, bạn vẫn có thể nghe một chút tiếng ồn từ đường phố. Vâng, có âm thanh của phòng hiện diện. Nhưng giọng của người phụ nữ nghe giống như giọng cô ấy—ấm áp, hiện diện, sống động. Đạo diễn đã khóc khi nghe nó. "Đó là cô ấy," cô ấy nói. "Đó thực sự là cô ấy."

Kết quả kiểm tra: Những con số kể một nửa câu chuyện

Đây là những gì đã xảy ra khi tôi chạy âm thanh tệ hại đó qua sáu công cụ giảm tiếng ồn khác nhau:

Công cụ	Giá	Cải thiện SNR	Các hiện tượng giới thiệu	Thời gian xử lý	Điểm chủ quan (1-10)
Giảm tiếng ồn Audacity	Miễn phí	+12.3 dB	Tiếng biến dạng vừa phải trên các âm sibilant	8 giây	7.2
iZotope RX 10 Giảm tiếng ồn giọng nói	$399	+18.7 dB	Nhẹ, chút ánh kim loại	45 giây	8.9
Adobe Podcast Enhance	Miễn phí (cùng với tài khoản)	+15.1 dB	Các hiện tượng xử lý nặng, chất lượng robot	22 giây (xử lý đám mây)	5.8
Accusonus ERA Noise Remover	$99	+10.8 dB	Nhẹ	12 giây	7.8
Krisp AI	$8/tháng	+16.4 dB	Vừa phải, hiệu ứng dưới nước ở tần số thấp	Thời gian thực	6.9
Reaper ReaFIR	$60 (DAW đầy đủ)	+14.2 dB	Nhẹ với cài đặt đúng	Thời gian thực	8.1

Những con số tiết lộ điều gì đó thú vị: công cụ đắt nhất (iZotope RX 10) đã đạt được cải thiện SNR cao nhất và những điểm số chủ quan tốt nhất, nhưng khoảng cách giữa nó và các công cụ có giá chỉ một phần nhỏ của giá là nhỏ hơn bạn mong đợi. Quan trọng hơn, điểm số chủ quan tốt thứ hai thuộc về Reaper's built-in ReaFIR—một công cụ đi kèm miễn phí với một DAW trị giá 60 đô la mà hầu hết những người làm âm thanh đã sở hữu.

🛠 Khám Phá Các Công Cụ Của Chúng Tôi

Cách hợp nhất các file âm thanh — Hướng dẫn miễn phí → Ghi âm trực tuyến - Ghi âm miễn phí, không cần ứng dụng → Tăng âm lượng MP3 - Tăng âm lượng âm thanh miễn phí trực tuyến →

Adobe Podcast Enhance đã khiến tôi ngạc nhiên theo cách tệ hại nhất. Mặc dù miễn phí và cực kỳ dễ sử dụng (kéo, thả, chờ đợi), nó đã giới thiệu những hiện tượng rõ ràng nhất. Việc xử lý AI đã làm cho giọng nói nghe như thể đã được chạy qua một vocoder. Nhiều người nghe mô tả nó như "rợn người" hoặc "thung lũng kỳ lạ." Cải thiện SNR rất tốt trên giấy, nhưng trải nghiệm chủ quan kém đến mức tôi sẽ không sử dụng nó cho bất kỳ nội dung nào mà tôi muốn mọi người thực sự nghe.

Krisp AI, được tiếp thị mạnh mẽ cho các cuộc gọi video thời gian thực, hoạt động tốt hơn Adobe nhưng vẫn gặp phải chất lượng "đã qua xử lý AI" đặc trưng đó. Nó rất xuất sắc cho các cuộc họp Zoom khi bạn cần giảm tiếng ồn ngay bây giờ và không ai đang nghe một cách phê phán, nhưng không phù hợp cho nội dung mà bạn muốn công bố.