• anteayer

Categoría

🗞
Noticias
Transcripción
00:00OpenAI ha presentado VoiceEngine, un nuevo modelo de inteligencia artificial capaz de
00:05clonar la voz de las personas con una muestra de audio de 15 segundos, así como de leer
00:09indicaciones de texto con dicha voz en varios idiomas con resultados naturales.
00:13La compañía tecnológica estadounidense continúa desarrollando nuevas herramientas
00:17y modelos de IA de cara a proseguir con su compromiso de comprender la frontera técnica
00:21y compartir abiertamente lo que es posible con la IA, en este caso, en el campo de las
00:26voces sintéticas.
00:27En este sentido, OpenAI ha dado a conocer este modelo, diseñado para crear voces personalizadas
00:32utilizando entrada de texto y una única muestra de audio de 15 segundos para generar un habla
00:37con sonido natural que se parece mucho al hablante original.
00:40Tal y como ha explicado la compañía en un comunicado en su web, comenzaron a desarrollar
00:43este modelo a finales de 2022 y, por el momento, es un modelo a pequeña escala que han utilizado
00:48para potenciar las voces preestablecidas disponibles en la API de conversión de texto a voz, así
00:53como en chat GPT y read aloud.
00:55Sin embargo, al mismo tiempo también han desarrollado este nuevo modelo con un enfoque
00:59de investigación para comprender mejor los usos potenciales de esta tecnología.

Recomendada