Grabaste algo importante (entrevista, audiencia, podcast, mensaje a un cliente) y el audio quedó con ruido de fondo. Esta guía te muestra cómo quitar ese ruido sin distorsionar la voz, gratis con FFmpeg + RNNoise o con software comercial cuando la calidad importa.
Tipos de ruido y técnica óptima para cada uno
| Tipo de ruido | Ejemplo | Mejor técnica |
|---|---|---|
| Constante | Aire acondicionado, computadora, ventilador | afftdn (FFT spectral) |
| Voz humana de fondo | Conversaciones en cafetería | RNNoise (entrenado en voces) |
| Intermitente | Tráfico, alarmas, perro ladrando | Edición manual + denoise localizado |
| Hum eléctrico | 50/60 Hz línea de poder | Filtro notch específico |
| Compresión MP3 | Audio re-comprimido varias veces | Re-encoding a WAV + denoise |
| Eco | Habitación con paredes vacías | Dereverberation (ML) — FFmpeg no alcanza |
Receta FFmpeg + RNNoise (mejor para voces)
RNNoise está entrenado específicamente para voces humanas. Para descargarlo y usarlo:
git clone https://github.com/xiph/rnnoise cd rnnoise && ./autogen.sh && ./configure && make ./examples/rnnoise_demo audio_sucio.raw audio_limpio.raw
O si querés usar FFmpeg con el modelo arnndn (versión integrada):
ffmpeg -i sucio.wav -af "arnndn=m=cb.rnnn" limpio.wav
Receta FFmpeg afftdn (uso general)
Para ruido genérico que no sea solo voz:
ffmpeg -i sucio.mp3 -af "afftdn=nr=20:nf=-25" limpio.mp3
Parámetros importantes:
nr=20— Noise reduction en dB. 12-30 es típico. Más alto = más limpio pero más artefactos.nf=-25— Noise floor estimado. -20 (suave) a -40 (agresivo).nt=w— Tracking mode.w(windowing) para ruido constante,v(variable) para cambiantes.
Cuándo usar Adobe Enhance Speech vs FFmpeg
Adobe Enhance Speech (parte de Premiere/Audition Cloud) es brutal para casos donde FFmpeg pierde:
- Audios de smartphone grabados afuera con viento.
- Entrevistas en cafetería con conversaciones ajenas casi al mismo volumen.
- Voces grabadas con micrófono malo a través de Zoom comprimido.
Pero cuesta suscripción Adobe (~USD 23/mes). Para uso esporádico, conviene contratar un servicio como TranscribeNode que incluye limpieza pre-transcripción incluida en el costo del audio.
Validación A/B (paso obligatorio)
Después de cualquier denoise, compará el archivo limpio con el original en headphones (no parlantes). Buscás dos cosas:
- El ruido se redujo (obvio).
- La voz NO suena robótica (artefacto típico de over-denoising).
Si la voz se distorsiona, bajá nr en 5 dB y volvé a procesar. Mejor un audio con un poco
de ruido que una voz robótica.
Más recetas para limpiar audio · Cómo transcribir un podcast en español después de limpiarlo.