Voice Engine: un modelo de IA para voces sintéticas de OpenAI

Después de la generación de texto, imágenes y videos con modelos de IA, OpenAI presenta Voice Engine, un modelo para crear voces sintéticas a partir de una muestra de 15 segundos. Debido a los riesgos éticos y al posible mal uso de la clonación de la voz, Voice Engine no está disponible públicamente y por ahora la compañía solo lo ha puesto en manos de equipos de confianza para realizar una prueba a pequeña escala. Se trata del mismo enfoque que OpenAI adoptó con Sora, su modelo de IA de texto a vídeo revelado hace apenas unas semanas.

OpenAI explica que Voice Engine lleva en desarrollo desde 2022, momento a partir del cual se empezó a usar para potenciar las voces disponibles en la API de texto a voz así como ChatGPT Voice, una herramienta para interactuar con el chatbot con la voz, y Read Aloud, una función que lee en voz alta. Para generar una voz con un “sonido natural” que se “parece mucho” a la fuente original, Voice Engine necesita 15 segundos de voz grabada. Cuando tiene el material, el modelo de IA puede emplear esa voz para pronunciar cualquier texto.

Las primeras aplicaciones de Voice Engine incluyen usarlo para ofrecer asistencia en la lectura y la combinación con GPT-4 para crear respuestas personalizadas en tiempo real; traducción de contenido con la opción de conservar el acento nativo de la voz original; aplicaciones terapéuticas para personas con enfermedades que afectan el habla; o ayuda para recuperar la voz a pacientes con dificultades del habla. En la página de OpenAI encontraréis diferentes ejemplos donde se escucha la voz original y el audio generado con Voice Engine.

Nos encontramos ante una tecnología con enormes implicaciones para aquellos que se ganan la vida con la voz, incluyendo los narradores de audiolibros, actores de doblaje, servicio de atención al cliente, presentadores de radio, podcasteros… Por no hablar del uso que se puede hacer de la voz sintética para suplantar la identidad. OpenAI reconoce que la capacidad que tiene Voice Engine para pronunciar discursos con una voz que se asemeje a la de una persona “conlleva serios riesgos” que son “especialmente importantes en un año electoral [en Estados Unidos]”.

Para abordar estos peligros, OpenAI tiene una política de uso que prohíbe la suplantación de otra persona sin su consentimiento y el permiso explícito e informado de la persona que pone la voz original. Los usuarios de Voice Engine también están obligados a revelar al oyente que está escuchando una voz generada por IA. Además, OpenAI ha implantado un conjunto de medidas de seguridad que incluyen marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine, así como un sistema de monitorización proactivo para saber cómo se utiliza.

OpenAI presenta Voice Engine, un modelo de IA para clonar la voz

Noticias relacionadas

OpenAI lanza Sora, su modelo de generación de vídeo 43 9 dic 2024

OpenAI integra un motor de búsqueda en ChatGPT para acceder a información en tiempo real 22 31 oct 2024

OpenAI presenta SearchGPT, un buscador impulsado por la IA 51 26 jul 2024

Scarlett Johansson asegura que OpenAI copió su voz sin permiso para su asistente y pide leyes para regular su uso 92 21 may 2024

OpenAI lanza GPT-4o, un modelo más rápido y con mejores capacidades de texto, visión y audio 23 13 may 2024

Microsoft y OpenAI estarían planeando un centro de datos de IA con un coste de 100.000 millones de dólares 31 30 mar 2024

Elon Musk demanda a OpenAI por abandonar su propósito de crear una inteligencia artificial en beneficio de la humanidad 62 1 mar 2024

OpenAI muestra la evolución de la IA aplicada a la producción multimedia con Sora, su nuevo modelo de texto a vídeo 67 16 feb 2024

Lo más visto de la semana

Primera imagen de Kratos y Atreus en la serie God of War

Anunciado Pokémon Viento y Oleaje para Nintendo Switch 2

Marvel’s Wolverine estará disponible el 15 de septiembre

Netflix se retira de la compra de Warner Bros. después de que Paramount haya mejorado su oferta

Peaky Blinders y One Piece vuelven a Netflix, HBO estrena la comedia Rooster y Young Sherlock llega a Prime Video

Amazon no publicará el juego de conducción de mundo abierto de los desarrolladores de Forza Horizon

Samsung anuncia la serie Galaxy S26, una actualización conservadora de su smartphone insignia

Paramount confirma la compra de Warner Bros. Discovery por 110.000 millones de dólares

Bluepoint propuso un remake de Bloodborne, pero Sony lo rechazó a instancias de FromSoftware

Disponible Resident Evil Requiem, un survival horror con Grace Ashcroft y un juego de acción con Leon Kennedy