15.ai – El Deep Fake del Sonido
El 8 de septiembre de 2022, 15.ai se desactivó temporalmente para prepararse para una actualización futura, un año después de su última versión estable (v24.2.1). Hasta septiembre de 2023, sigue estando temporalmente fuera de línea. Sigue leyendo para ver que esta pasando con esta empresa.
15.ai es una herramienta de texto a voz que se puede usar para generar voces de 44,1 kHz de varios caracteres. Las voces se generan en tiempo real utilizando múltiples algoritmos de síntesis de audio y redes neuronales profundas personalizadas, entrenadas con muy pocos datos disponibles (entre 30 y 120 minutos de diálogo limpio para cada personaje). Este proyecto demuestra una reducción significativa de la cantidad de audio necesaria para clonar voces de manera realista, conservando al mismo tiempo sus prosodias afectivas.
En otras palabras, 15.ai es un deep fake , pero para voces…
El autor (al que sólo se conoce por el apodo «15» y se presume que es un investigador del MIT) agradece al MIT CSAIL la financiación inicial, junto con otras organizaciones conexas. En particular, el autor agradece a las juntas específicas de la tabla de imágenes anónimas 4chan por sus respectivos papeles en el proyecto, a los que hace referencia en todo el sitio web a través de sus diversos in-jokes y memes.
La aplicación actualmente incluye personajes como GLaDOS de Portal, el Narrador de La Parábola de Stanley, el Décimo Doctor de Doctor Who, y Twilight Sparkle and Fluttershy de My Little Pony.
Los ejemplos están a continuación.
Ejemplo de Bob Esponja
El autor (al que sólo se conoce por el apodo «15» y se presume que es un investigador del MIT) agradece al MIT CSAIL la financiación inicial, junto con otras organizaciones conexas. En particular, el autor agradece a las juntas específicas de la tabla de imágenes anónimas 4chan por sus respectivos papeles en el proyecto, a los que hace referencia en todo el sitio web a través de sus diversos in-jokes y memes.
La aplicación actualmente incluye personajes como GLaDOS de Portal, el Narrador de La Parábola de Stanley, el Décimo Doctor de Doctor Who, y Twilight Sparkle and Fluttershy de My Little Pony.
¿Cómo descargar las voces de 15.ai?
- Paso 1: Ve al sitio web oficial de 15.ai y elige la emoción, el personaje y la fuente que prefieras.
- Paso 2: Escribe el texto que quieras convertir en audio. A continuación, haz clic en «Reproducir» para escuchar el audio. Si estás satisfecho, haz clic en «Descargar» para guardar el clip.