Pueden clonar la voz de una persona con una grabación de un minuto
Una compañía china afirma que puede clonar la voz de alguien con tan solo una grabación de 60 segundos de la persona que habla. Aunque el mimetismo de la voz no es algo novedoso, esta tecnología ha evolucionado rápidamente en los últimos años.
VoCo es un software de edición y generación de audio lanzado en 2016 por Adobe. El programa puede duplicar una voz en aproximadamente 20 minutos.
Una herramienta similar lanzada por una empresa canadiense llamada Lyrebird redujo el tiempo necesario para replicar una voz digital en solo un minuto. Luego está la WaveNet de Google, que nuevamente promete imitar «cualquier voz humana».
El sistema de clonación de voz realizado por la compañía tecnológica china, Baidu, es el último en extraer los patrones de voz de un hablante individual a partir de fragmentos de audio. Utiliza esta información para crear una copia digital, que puede «leer» cualquier texto que esté conectado al programa. Lo que elijas hacer con ello… ya depende de ti.
Los duplicados digitales de Baidu aún no son perfectos, pero sí lo suficientemente convincientes como para engañar a los sistemas de reconocimiento de voz. Con unos 100 fragmentos, el programa puede crear una imitación creíble que suena como la voz original en una línea telefónica.
A partir de aquí llega la problemática de con qué fin se utilizaría dicha tecnología. Muchas son las suposiciones: las empresas hoy en día utilizan sistemas de reconocimiento de voz para firmar contratos (como las telefónicas, por ejemplo). ¿Se podría crear una voz que firmase un contrato sin tu consentimiento?
Citando a Futurama, «la tecnología no es buena o mala de por sí. Es cómo se usa».