Cambiador de voz con IA de baja latencia en Windows 11 (GPU NVIDIA + micrófono virtual)
Guía para cambio de voz en tiempo real con IA en Windows 11 usando la app de escritorio Voicechanger.co, aceleración NVIDIA CUDA y VB-Audio VB-Cable para Zoom, Microsoft Teams, Google Meet, Discord y Messenger.
Palabras clave SEO
cambiador de voz Windows 11, micrófono virtual Teams, Zoom baja latencia voz IA, Discord RTX voz, VB-Cable tutorial, clonación de voz CUDA.
Requisitos
- Windows 11 actualizado
- GPU NVIDIA con controladores recientes
- Auriculares para reducir eco
- VB-Cable
- Aplicación de escritorio Voicechanger.co
VB-Cable: flujo de audio
Descarga en vb-audio.com. La app envía el audio procesado a CABLE Input (VB-Audio Virtual Cable). En tu app de videollamadas elige CABLE Output como micrófono.
Configuración
- Confirma NVIDIA CUDA.
- Micrófono físico de entrada.
- Salida a CABLE Input.
- Audio de referencia corto e inicia la sesión en vivo.
Variables de entorno
OMNIVOICE_LIVE_UTTERANCE=1, OMNIVOICE_LIVE_END_SILENCE_MS, OMNIVOICE_LIVE_MAX_UTTERANCE_MS, OMNIVOICE_LIVE_CHUNK_SECONDS.
Rendimiento
Los benchmarks por lotes (hasta unas 40× más rápido que tiempo real) no igualan la latencia percibida en una llamada: dependen del final de frase y de la GPU.
Windows 11
- Prefiere DirectSound para captura si está disponible.
- Privacidad → Micrófono: permitir apps de escritorio.
FAQ
¿Interrumpe el audio en reproducción?
El motor suele terminar de reproducir una frase sintetizada antes de la siguiente; la detección segmenta turnos, no una interrupción tipo barge-in a menos que se implemente audio no bloqueante.