Aunque la IA generativa puede crear imágenes de personas casi perfectas, como si fueran obras de arte digitales, ¿por qué no puede generar algo tan simple como manos humanas?
La inteligencia artificial es un asombroso avance tecnológico que progresa a pasos agigantados, y esto es solo el principio. Gracias a la inteligencia artificial generativa, podemos crear imágenes sorprendentes a partir de texto con la ayuda de programas especializados como Midjourney o DALL-E 2.
La tecnología actual permite entrenar a una inteligencia artificial para generar imágenes de diversas categorías con resultados impresionantes. Tan solo se requiere describir una persona o un entorno, y la IA se encargará de crear la imagen de manera impecable.
Herramientas avanzadas como Bing Image Creator o DALL-E utilizan la inteligencia artificial como motor principal, lo que les permite generar imágenes realistas de rostros con todos sus rasgos faciales. Esta tecnología se basa en algoritmos de aprendizaje automático.
LA IA y los artistas, la eterna agonía
Esto posibilita que la inteligencia artificial pueda componer canciones, redactar guiones, diagnosticar enfermedades e incluso desarrollar software. Sin embargo, hay algo en lo que esta tecnología todavía falla: las manos humanas.
Aunque la IA generativa puede crear imágenes de personas casi perfectas, como si fueran obras de arte digitales, ¿por qué no puede generar algo tan simple como manos humanas? Según un informe publicado por ScienceFocus, esto se debe a que los programas de IA generan imágenes en 2D y no poseen un concepto tridimensional de la geometría.
Peter Bentley, científico informático y autor del University College London, menciona lo siguiente: "Estos programas comprenden la idea básica de lo que es una mano. Saben que tiene una palma, dedos y uñas, pero ninguno de estos modelos generativos comprende realmente cómo es una mano en su totalidad".
Los programas de imágenes impulsados por inteligencia artificial pueden generar una imagen muy genérica de una mano, lo cual no sería un problema grave.
Sin embargo, cuando se les proporciona un contexto específico, la IA se confunde y no logra comprender la totalidad, resultando en un resultado insatisfactorio.
La IA generativa se encuentra alejada de la realidad y no logra entender el contexto ni posee un conocimiento real de las cosas. Solo reciben numerosos ejemplos de objetos para intentar reunir la información de la mejor manera posible.
Para que los programas de imágenes impulsados por IA puedan generar imágenes de manos u otros objetos con resultados perfectos, deben ser entrenados con algoritmos más complejos, especialmente aquellos que puedan comprender la geometría tridimensional y así entender las cosas de manera más precisa.