Así es Voice Engine, la IA de OpenAI capaz de clonar voces de forma realista

Ver Así es Voice Engine, la IA de OpenAI capaz de clonar voces de forma realista - Diario Libre en Dailymotion

Transcript

00:00OpenAI ha presentado VoiceEngine, un nuevo modelo de inteligencia artificial capaz de

00:05clonar la voz de las personas con una muestra de audio de 15 segundos, así como de leer

00:09indicaciones de texto con dicha voz en varios idiomas con resultados naturales.

00:13La compañía tecnológica estadounidense continúa desarrollando nuevas herramientas

00:17y modelos de IA de cara a proseguir con su compromiso de comprender la frontera técnica

00:21y compartir abiertamente lo que es posible con la IA, en este caso, en el campo de las

00:26voces sintéticas.

00:27En este sentido, OpenAI ha dado a conocer este modelo, diseñado para crear voces personalizadas

00:32utilizando entrada de texto y una única muestra de audio de 15 segundos para generar un habla

00:37con sonido natural que se parece mucho al hablante original.

00:40Tal y como ha explicado la compañía en un comunicado en su web, comenzaron a desarrollar

00:43este modelo a finales de 2022 y, por el momento, es un modelo a pequeña escala que han utilizado

00:48para potenciar las voces preestablecidas disponibles en la API de conversión de texto a voz, así

00:53como en chat GPT y read aloud.

00:55Sin embargo, al mismo tiempo también han desarrollado este nuevo modelo con un enfoque

00:59de investigación para comprender mejor los usos potenciales de esta tecnología.