DALL-E 2 | todo sobre la IA de generación de imágenes de OpenAI
La inteligencia artificial ha cobrado mucho protagonismo en los últimos años. Sin embargo, en 2022 vimos un despunte en cuanto a ciertas de sus aplicaciones para el mundo real. Y es que gracias al entrenamiento de complejos modelos de lenguaje, a día de hoy podemos hacer uso de multitud de herramientas con IA. Una de ellas es DALL-E 2, desarrollada por OpenAI.
La compañía ya ofreció detalles sobre su herramienta de generación de imágenes en el 2021. Sin embargo, un año después mostró al público su siguiente versión, más capaz, y basada en el modelo de lenguaje GPT-3. DALL-E 2, junto a otras tantas como Stable Diffusion o Midjourney, fueron algunas de las herramientas de IA más populares del pasado 2022, y en este artículo te explicamos todo acerca de la desarrollada por OpenAI.
¿Qué es DALL-E 2?
DALL-E 2 es una herramienta de generación de imágenes por medio de inteligencia artificial. A través de lenguaje natural, es posible indicarle qué queremos que nos dibuje, y la IA creará una imagen única basada en la descripción que le hayamos dado.
Esto puede hacerlo gracias a que la herramienta está basada en GPT-3, un complejísimo modelo de lenguaje que ha sido entrenado con miles de millones de parámetros. Esto quiere decir que la inteligencia artificial siempre generará imágenes basadas en una amplia biblioteca de obras de arte y experiencias propias del ser humano recopiladas de Internet y con las que la compañía ha ido alimentando su modelo de lenguaje para hacerlo más capaz.
La herramienta es capaz de combinar conceptos, atributos o estilos para generar la imagen, por lo que además de explicarle qué es lo que quieres que te dibuje, también puedes describirle en qué estilo quieres que te genere la imagen.
Para generar las imágenes hace uso de un proceso conocido como ‘difusión’, el cual empieza con un modelo de puntos aleatorios que gradualmente va alterando cuando la IA empieza a reconocer ciertos aspectos de la imagen.
Si bien en 2021 OpenAI presentó DALL-E al mundo, un año más tarde sorprendía con las capacidades de DALL-E 2, pudiendo generar imágenes mucho más realistas y precisas, además de aumentar en hasta 4 veces la resolución de la imagen.
¿Cómo usar DALL-E 2?
OpenAI puso la herramienta a disposición de solo unos pocos, aunque a día de hoy todo el mundo puede entrar y probarla gratis. Sin embargo, no podemos generar imágenes de manera ilimitada, sino que tendremos una serie de créditos iniciales que estos se irán gastando a cada imagen que generemos.
Para probar la herramienta, lo único que tienes que hacer es ir a la web oficial de DALL-E 2 y registrarte, o iniciar sesión a través de Google o Microsoft. Una vez hayas iniciado sesión, ya podrás usar la herramienta sin problemas.
Para dar comienzo a tu primera creación, basta con describir la imagen que deseas generar en el cuadro de texto que aparece en el centro de la página. Ten en cuenta que cuanto más detalle en la descripción, más se ajustará a nuestras preferencias. Además, podemos decirle a la IA el estilo en el que queremos ver dibujada la imagen, pudiendo citar a autores célebres, o estilos artísticos en concreto.
Al presionar sobre el botón para generar la imagen, la IA te mostrará cuatro ejemplos distintos y quedarán registrados en tu historial, por lo que podrás ver las imágenes siempre que quieras.
Restricciones y Desafíos de DALL-E 2
DALL-E 2, una creación de inteligencia artificial de OpenAI, está lejos de ser infalible. La compañía ha establecido ciertas barreras para evitar la generación de imágenes que involucren a famosos, desnudos o individuos reales.
En la documentación disponible en GitHub, OpenAI también señala los peligros asociados con el uso de DALL-E 2, como la posibilidad de crear material potencialmente perjudicial. A pesar de esto, aseguran haber implementado diversas medidas para suprimir cualquier contenido inapropiado en las imágenes creadas con esta herramienta.
DALL-E 2 está equipado con una variedad de filtros diseñados para bloquear material sexual o violento. Sin embargo, OpenAI reconoce que aún es posible manipular la IA usando «sinónimos visuales» para producir contenido dañino. Burlar a la IA para obtener resultados explícitos no es una tarea difícil, y es un área en la que la compañía está enfocada en mejorar para enriquecer la experiencia con su herramienta.
La Inteligencia Artificial en la Industria Artística: Oportunidades y Desafíos
La integración de inteligencias artificiales como DALL-E 2 en herramientas de edición está en auge y abre nuevas puertas para los artistas, pero también plantea preocupaciones en la comunidad artística.
Aplicaciones famosas de edición como Photoshop ya incorporan DALL-E 2 a través de complementos de terceros, permitiendo a los usuarios modificar imágenes según sus instrucciones.
Grandes corporaciones, como Microsoft, también están invirtiendo en esta tecnología, aunque algunos artistas expresan su descontento, argumentando que esto desvaloriza su trabajo. A pesar de las preocupaciones, el uso de DALL-E 2 y otras IA puede ser beneficioso para empresas, ahorrando tiempo en tareas repetitivas y permitiendo enfocarse en aspectos más creativos y complejos.
Para terminar, DALL-E 2 es una herramienta fascinante que demuestra las capacidades de la inteligencia artificial en la generación de imágenes. Su entrenamiento en el modelo de lenguaje GPT-3 asegura que las imágenes generadas sean realistas y precisas, y la posibilidad de indicar el estilo deseado permite una personalización aún mayor. Aunque el acceso a la herramienta está limitado, aquellos que tengan la oportunidad de probarla seguro disfrutarán de su potencial creativo.