Volvemos con la Batalla de las IAs. El objetivo de esta serie es comparar las IA de imágenes más diversas del mundo. Utilizaremos la misma instrucción para todas las imágenes, generaremos 8 resultados y elegiremos los 4 mejores para compartirlos en este artículo.
¿Cómo funcionan las categorías de evaluación?
Calidad visual
Detalles de la imagen
Coherencia contextual
Seguridad en el trabajo (SFW)
Prompt: A guy in a cafe, smiling (Un hombre en un café, sonriendo)
Complejidad: 3 (1 punto por carácter. 1 punto por localización. 1 punto por expresión)
Formato: 1:1
Localización: Todas las IAs fueron generadas en https://tess.pareto.io
¡Vamos con los resultados!
MidJourney v4
Midjourney es una inteligencia artificial que permite a los usuarios generar imágenes de alta calidad a partir de descripciones textuales. Midjourney utiliza un amplio modelo lingüístico para generar imágenes precisas y coherentes con las instrucciones del usuario.
Actualmente es la IA de imágenes más popular del mundo, con algo más de 15M de usuarios. La herramienta tiene un precio medio de 30$ al mes, con una limitación en la velocidad de generación tras un cierto tiempo de uso de la herramienta.
Integrado con Tess AI: Sí. Puede generar imágenes con MidJourney dentro de Tess AI.
Observaciones: Aunque estas 4 fotos eran de buena calidad, el resto tienen bastantes deformidades. Incluso en estas 4 fotos, se pueden ver algunas deformidades y faltan detalles. Un ejemplo son los dedos de la mano en la imagen 4. Además, la foto 3 muestra el cuerpo relativamente pequeño delante de la cabeza. Las manos de la imagen 2 también están deformadas. Otro elemento que observamos fue la presencia duplicada de tazas.
Difusión estable
Con 5,3 millones de visitas al mes, Stable Diffusion es una de las IA de imagen más populares del planeta y una de las precursoras de toda esta tecnología.
Integrado con Tess AI: Sí. Puede generar imágenes con Stable Diffusion dentro de Tess AI.
Observaciones: Las imágenes muestran deformidades más aparentes, sobre todo en los brazos, los ojos y la boca. También observamos elementos repetidos, como tazas.
DALL-E 2
DALL-E 2 es una herramienta de inteligencia artificial capaz de generar imágenes realistas a partir de mensajes de texto. Por ejemplo, puedes pedirle a DALL-E 2 que genere una imagen de un gato sentado en un piano, y generará una imagen de un gato sentado en un piano.
DALL-E 2 aún está en desarrollo, pero tiene el potencial de convertirse en una poderosa herramienta para artistas, diseñadores y creativos. Se trata de la IA generadora de imágenes de Open AI, la mayor empresa de IA del planeta.
Su precio medio oscila entre 30 $/m y 60 $/m, permitiendo el uso de las más diversas indicaciones.
Integrado con Tess AI: Sí. Puede generar imágenes con el DALL-E 2 dentro de Tess AI.
Comentarios: Definitivamente, la IA no consiguió construir la escena del café. Sin embargo, fue capaz de entender muy bien la expresión facial solicitada. Un punto positivo es que no hay deformidades.
OpenJourney
OpenJourney es una plataforma de desarrollo de imágenes generadas por IA que te ayuda a crear imágenes de alta calidad de forma rápida y sencilla.
Nuestra sencilla pero potente API le permite controlar todos los aspectos del proceso de generación de imágenes, desde la introducción de texto hasta el estilo y la resolución de salida.
Con 26,2k visitas al mes, OpenJourney se ha convertido en una de las API de IA más utilizadas. El coste medio de la API oscila entre 50 y 100 dólares al mes.
Integrado con Tess AI: Sí. Puede generar imágenes con OpenJourney dentro de Tess AI.
Observaciones: Se perdieron algunos puntos en la categoría "Detalles" debido a la presencia constante de pequeñas deformidades y elementos duplicados. La IA también tuvo algunos errores de proporción.
Tess AI Dream Pro V2
Comentarios: Esta IA tiene una versatilidad muy interesante, algo muy útil en las IAs. Es común que las IAs, para un prompt, presenten 4 versiones muy parecidas - lo que típicamente no es deseable. Lo ideal sería que la IA fuera versátil y capaz de presentar incluso rasgos diferentes, para que el usuario pueda definir el que más le guste y, con el tiempo, trabajar con indicaciones imagen a imagen, es decir, trabajar sobre la imagen que más le guste. Otro punto positivo fue el hecho de no vincular el establecimiento Café con un café en las manos.
Tess AI Dream Pro V1
Observaciones: Se perdieron algunos puntos en la categoría "Detalles" debido a la presencia constante de pequeñas deformidades y errores de proporción.
Tess AI Sueño V1
Observaciones: Se perdieron algunos puntos en la categoría "Detalles" debido a la formación duplicada de dientes en algunas fotos. En general, las fotos generadas eran muy buenas. Seguramente con algunos intentos más podríamos conseguir resultados increíbles.
Tess AI Sueño V2
Observaciones: A la composición del lugar le faltaba un poco de detalle para que realmente lo calificáramos de increíble.
Tess AI Sueño Realista Pro
Comentarios: Además de unos resultados increíbles, esta IA también fue capaz de variar las personas de la foto, ¡lo que sin duda la convirtió en la campeona de esta batalla!