Notebookcheck Logo

OpenAI previsualiza la capacidad del motor de voz para clonar de forma convincente la voz de una persona con una muestra de voz de 15 segundos

OpenAI demuestra las capacidades del motor de voz que puede clonar la voz de una persona con una muestra de 15 segundos. (Imagen de la IA Dall-E 3)
OpenAI demuestra las capacidades del motor de voz que puede clonar la voz de una persona con una muestra de 15 segundos. (Imagen de la IA Dall-E 3)
OpenAI ha presentado en primicia la capacidad de su tecnología Voice Engine para clonar de forma convincente la voz de una persona con una muestra de voz de 15 segundos. El Motor también puede transferir el acento de una persona a otros idiomas hablados mientras traduce el habla, pronunciar un nuevo texto de manera informal y restaurar el habla clara a aquellas personas con discapacidades o enfermedades vocales.

OpenAI ha presentado en primicia el estado actual de su tecnología Voice Engine, capaz de clonar de forma convincente la voz de una persona utilizando como entrada una muestra de voz de 15 segundos. La tecnología también puede transferir el acento de una persona a otros idiomas hablados mientras traduce el habla, incluso si el idioma de destino utiliza un habla informal, o jerga. Para los hablantes con problemas de voz o enfermedades que provocan un habla poco clara, como la laringitis, Voice Engine puede repetir lo que se dice con una voz clara.

La tecnología de la IA ha avanzado hasta el punto de que reconoce las vocales, las palabras y otras partes del habla y puede entender la esencia de las frases. La IA de clonación de voz reconoce los rasgos únicos del habla de una persona, como el acento, la emoción, el ritmo y el énfasis, y luego utiliza esas características para pronunciar el texto como un clon convincente.

OpenAI demostró en la página de su blog ejemplos convincentes de:

  • Clonación de voz
  • Traducción de voz con clonación del acento vocal
  • Hablar de manera informal o en argot
  • Hablar para los mudos
  • Cuando se padecen afecciones del habla, hablar con la voz original y clara de una persona

OpenAI no está liberando el motor de voz al público en este momento debido a las preocupaciones de mal uso, a pesar de muchos otros servicios de clonación de voz de IA y adaptación de voz en el mercado. Esta tecnología ya se utilizó durante el ciclo electoral estadounidense para crear 'fake President Biden', y en todo el mundo para estafar dinero a empresas de https://edition.cnn.com/2024/02/04/asia/deepfake-cfo-scam-hong-kong-intl-hnk/index.html y personas. Por desgracia, una vez que se ha abierto la caja de Pandora, como la tecnología de imagen de IA generativa utilizada para crear imágenes falsas del Papaya no hay vuelta atrás.

Los lectores preocupados deberían crear palabras de seguridad con miembros de su familia y amigos cercanos para verificar sus identidades, leer cómo reconocer las llamadas fraudulentas de https://consumer.ftc.gov/system/files?file=consumer_ftc_gov/pdf/1009a_how_to_avoid_a_scam_aug2022_508.pdf, desactivar el uso de la verificación por reconocimiento de voz con los proveedores financieros y considerar el uso de un cambiador de voz para protegerse contra la copia de su voz al responder a llamadas desconocidas.

Please share our article, every link counts!
> Análisis y pruebas de ordenadores portátiles y móviles teléfonos > Noticias > Archivo de noticias > Archivo de noticias 2024 03 > OpenAI previsualiza la capacidad del motor de voz para clonar de forma convincente la voz de una persona con una muestra de voz de 15 segundos
David Chien, 2024-03-30 (Update: 2024-03-30)