Cádiz (1973) Escritor y editor de tecnología. Redactando profesionalmente desde 2017 para medios y blogs en español. Como sabes, Open AI es la empresa detrás de ChatGPT o Sora, una herramienta para crear vídeos realistas utilizando inteligencia artificial.
Ahora ha ido aún más lejos y ha lanzado su proyecto Voice Engine, capaz de replicar voces tras apenas 15 segundos de escucha. Sí, es sorprendente lo que nos pasa. Este proyecto comenzó a finales de 2022 y la empresa Open AI lo anunció en su blog la semana pasada.
Sólo 15 segundos de la voz de referencia son suficientes para que Voice Engine realice el entrenamiento y luego produzca una voz muy similar. Si quieres escuchar un ejemplo, puedes verlo aquí con una voz que te sirva como referencia, y la voz se puede reproducir usando Voice Engine. Sí, fue algo extraordinario.
Automáticamente lo primero que nos viene a la cabeza es el mal uso de este tipo de herramientas. Voces falsas, suplantaciones de otros, noticias falsas, etc. Sí, nuestra mente siempre piensa en lo peor.
Sin embargo, es posible que Voice Engine nunca surja comercialmente como GPT Chat. Puede limitarse a empresas que sean capaces de proporcionar un uso eficaz y valioso. Podemos pensar en personas que han perdido la capacidad de hablar y son capaces de recuperarla, en niños que tienen la oportunidad de desarrollar habilidades lectoras con voz natural o son capaces de comunicarse de forma más natural con personas en su lengua materna.
pocas lenguas habladas. También me parece un gran recurso para conseguir traducciones mucho más eficientes sin verse ‘contaminados’ por otras variaciones, como por ejemplo del español español al español argentino, por ejemplo. Las capacidades de Voice Engine son enormes.
No cabe duda de que este recurso es uno más a añadir a la gran cantidad de herramientas que están surgiendo gracias a la Inteligencia Artificial. De hecho, ya lo utilizamos en aplicaciones como WhatsApp gracias al asistente LuzIA, desarrollado en España. O podemos crear imágenes inimaginables con DALL·E.
Algo que hace unos años parecía imposible y ahora podemos conseguirlo. nuestro celular. Voice Engine suena casi a ciencia ficción, pero aun así representa un salto de gigante en la forma en que interactuamos con los avances en los lenguajes de programación.