Voice Engine, la IA de OpenAI capaz de clonar voces de forma realista La empresa de inteligencia artificial (IA) OpenAI es capaz, mediante su modelo Voice Engine, de clonar voces humanas reproduciendo un sonido natural «emotivo y realista» a partir de una muestra de voz de 15 segundos. Pero no lanzará todavía esta tecnología al público general, ya que sería demasiado arriesgado. «Reconocemos que generar un discurso que se asemeje a las voces de las personas conlleva serios riesgos, especialmente en un año electoral«, apuntan en un comunicado los creadores de ChatGPT. Voice Engine es un nuevo modelo de IA que puede convertir texto a voz para crear voces sintéticas, que, según la compañía, permitirá que creadores de contenidos puedan traducir su trabajo a otras lenguas sin perder sus acentos nativos y ayudar a las personas con problemas de comunicación verbal a usar su voz para, por ejemplo, llamar por teléfono. En uno de los ejemplos que da la empresa se puede escuchar como la voz de una anglosajona se tradujo al español, mandarín, alemán, francés y japonés conservando el acento nativo de la persona. Por el momento, las empresas que pueden acceder a esta tecnología son la empresa de tecnología educativa Age of Learning, la plataforma de narración visual HeyGen, el fabricante de software de salud Dimagi, el creador de aplicaciones de comunicación de inteligencia artificial Livox y el sistema de salud Lifespan. «Estamos adoptando un enfoque cauteloso e informado para una publicación más amplia debido al potencial de uso indebido de la voz sintética», indica la empresa en un comunicado donde además apunta que las empresas con las que trabajan han aceptado sus políticas de uso. Normas de uso y medidas de seguridad Entre esas reglas está que no se use la voz de alguien sin su consentimiento o que hay que indicar a los usuarios que son voces sintéticas. «Finalmente, hemos implementado un conjunto de medidas de seguridad, que incluyen marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine, así como una monitorización proactiva de cómo se utiliza», añade OpenAI. Este año electoral en Estados Unidos ya se han dado casos de llamadas automáticas con voces clonadas de políticos como el presidente Joe Biden. Otro gran problema de las voces sintéticas generadas por IA es que los estafadores las podrían usar para acceder a cuentas bancarias que utilizan autenticación de voz. Enlace a la fuente original
Voice Engine, la IA de OpenAI capaz de clonar voces de forma realista La empresa de inteligencia artificial (IA) OpenAI es capaz, mediante su modelo Voice Engine, de clonar voces humanas reproduciendo un sonido natural «emotivo y realista» a partir de una muestra de voz de 15 segundos. Pero no lanzará todavía esta tecnología al público general, ya que sería demasiado arriesgado. «Reconocemos que generar un discurso que se asemeje a las voces de las personas conlleva serios riesgos, especialmente en un año electoral«, apuntan en un comunicado los creadores de ChatGPT. Voice Engine es un nuevo modelo de IA que puede convertir texto a voz para crear voces sintéticas, que, según la compañía, permitirá que creadores de contenidos puedan traducir su trabajo a otras lenguas sin perder sus acentos nativos y ayudar a las personas con problemas de comunicación verbal a usar su voz para, por ejemplo, llamar por teléfono. En uno de los ejemplos que da la empresa se puede escuchar como la voz de una anglosajona se tradujo al español, mandarín, alemán, francés y japonés conservando el acento nativo de la persona. Por el momento, las empresas que pueden acceder a esta tecnología son la empresa de tecnología educativa Age of Learning, la plataforma de narración visual HeyGen, el fabricante de software de salud Dimagi, el creador de aplicaciones de comunicación de inteligencia artificial Livox y el sistema de salud Lifespan. «Estamos adoptando un enfoque cauteloso e informado para una publicación más amplia debido al potencial de uso indebido de la voz sintética», indica la empresa en un comunicado donde además apunta que las empresas con las que trabajan han aceptado sus políticas de uso. Normas de uso y medidas de seguridad Entre esas reglas está que no se use la voz de alguien sin su consentimiento o que hay que indicar a los usuarios que son voces sintéticas. «Finalmente, hemos implementado un conjunto de medidas de seguridad, que incluyen marcas de agua para rastrear el origen de cualquier audio generado por Voice Engine, así como una monitorización proactiva de cómo se utiliza», añade OpenAI. Este año electoral en Estados Unidos ya se han dado casos de llamadas automáticas con voces clonadas de políticos como el presidente Joe Biden. Otro gran problema de las voces sintéticas generadas por IA es que los estafadores las podrían usar para acceder a cuentas bancarias que utilizan autenticación de voz. Enlace a la fuente original