Batalla de las IAs: EP2 Un hombre bebiendo café, sonriendo

Volvemos con la Batalla de las IAs. El objetivo de esta serie es comparar las IA de imágenes más diversas del mundo. Utilizaremos la misma instrucción para todas las imágenes, generaremos 8 resultados y elegiremos los 4 mejores para compartirlos en este artículo.

¿Cómo funcionan las categorías de evaluación?

Calidad visual: evaluación de la capacidad de la IA para generar imágenes de calidad, con rasgos perfeccionados, colores precisos y un bajo nivel de artefactos no deseados.

Detalles de la imagen: comprueba que la IA es capaz de detallar bien el escenario, la ropa y todo lo que rodea al protagonista del prompt.

Coherencia contextual: comprobar que la IA es capaz de generar imágenes que encajen en el contexto proporcionado o que tengan relevancia y continuidad dentro del tema solicitado.

Safe for Work (SFW): evaluación de la capacidad de la IA para generar imágenes de personas no consentidas (entre otras categorías), es decir, seguras para el trabajo.

Prompt: A guy in a cafe, smiling (Un hombre en un café, sonriendo)
Complejidad: 3 (1 punto por carácter. 1 punto por localización. 1 punto por expresión)
Formato: 1:1
Localización: Todas las IAs fueron generadas en Tess AI

¡Vamos con los resultados!

MidJourney V4

Midjourney es una plataforma de Inteligencia Artificial que permite a los usuarios generar imágenes de alta calidad a partir de descripciones textuales. Midjourney utiliza un amplio modelo lingüístico para generar imágenes precisas y coherentes con las instrucciones del usuario.

Actualmente es la IA de imágenes más popular del mundo, con algo más de 15M de usuarios. La herramienta tiene un precio medio de 30$ al mes, con una limitación en la velocidad de generación tras un cierto tiempo de uso de la herramienta.

Integración con Tess AI: . Puede generar imágenes con MidJourney dentro de Tess AI.

Calidad visual: buena

Detalles de la imagen: Bien

Coherencia contextual: Increíble

Seguro para el trabajo (SFW): Increíble

Nota final: 80%.

Comentarios: Aunque estas 4 fotos eran de buena calidad, el resto tienen muchas deformidades. Incluso en estas 4 fotos, se pueden ver algunas deformidades y faltan detalles. Un ejemplo son los dedos de la mano en la imagen 4. Además, la foto 3 muestra el cuerpo relativamente pequeño delante de la cabeza. Las manos de la imagen 2 también están deformadas. Otro elemento que observamos fue la presencia duplicada de tazas.

Difusión estable

Con 5,3 millones de visitas al mes, Stable Diffusion es una de las IA de imagen más populares del planeta y una de las precursoras de toda esta tecnología.

Integrado con Tess AI: . Puede generar imágenes con Stable Diffusion dentro de Tess AI.

Calidad visual: buena

Detalles de la imagen: Medio

Coherencia contextual: Increíble

Seguro para el trabajo (SFW): Increíble

Nota final: 75%.

Comentarios: Las imágenes muestran deformidades más aparentes, sobre todo en los brazos, los ojos y la boca. También observamos elementos repetidos, como tazas.

DALL-E 2

DALL-E 2 es una herramienta de inteligencia artificial capaz de generar imágenes realistas a partir de mensajes de texto. Por ejemplo, puedes pedirle a DALL-E 2 que genere una imagen de un gato sentado en un piano, y generará una imagen de un gato sentado en un piano.

DALL-E 2 aún está en desarrollo, pero tiene el potencial de convertirse en una poderosa herramienta para artistas, diseñadores y creativos. Se trata de la IA generadora de imágenes de Open AI, la mayor empresa de IA del planeta.

Su precio medio oscila entre 30 $/m y 60 $/m, permitiendo el uso de las más diversas indicaciones.

Integrado con Tess AI: . Puede generar imágenes con el DALL-E 2 dentro de Tess AI.

Calidad visual: media

Detalles de la imagen: Feria

Coherencia contextual: Razonable

Seguro para el trabajo (SFW): Increíble

Nota final: 45%.

Comentarios: Definitivamente, la IA no consiguió construir la escena del café. Sin embargo, fue capaz de entender muy bien la expresión facial solicitada. Un punto positivo es que no hay deformidades.

OpenJourney

OpenJourney es una plataforma de desarrollo de imágenes generadas por IA que te ayuda a crear imágenes de alta calidad de forma rápida y sencilla.

Nuestra sencilla pero potente API le permite controlar todos los aspectos del proceso de generación de imágenes, desde la introducción de texto hasta el estilo y la resolución de salida.

Con 26,2k visitas al mes, OpenJourney se ha convertido en una de las API de IA más utilizadas. El coste medio de la API oscila entre 50 y 100 dólares al mes.

Integrado con Tess AI: [icon color="accent-color" size="tiny" icon_size="" image="fa-check"] . Puede generar imágenes con OpenJourney dentro de Tess AI.

Calidad visual: buena

Detalles de la imagen: Feria

Coherencia contextual: Increíble

Seguro para el trabajo (SFW): Increíble

Nota final: 70%.

Comentarios: Se perdieron algunos puntos en la categoría "Detalles" debido a la presencia constante de pequeñas deformidades y elementos duplicados. La IA también tuvo algunos errores de proporción.

Tess AI Dream Pro V2

Calidad visual: buena

Detalles de la imagen: Bien

Coherencia contextual: Increíble

Seguro para el trabajo (SFW): Increíble

Nota final: 80%.

Comentarios: Esta IA tiene una versatilidad muy interesante, algo muy útil en las IAs. Es común que las IAs, para un prompt, presenten 4 versiones muy parecidas - lo que típicamente no es deseable. Lo ideal sería que la IA fuera versátil y capaz de presentar incluso rasgos diferentes, para que el usuario pueda definir el que más le guste y, con el tiempo, trabajar con indicaciones imagen a imagen, es decir, trabajar sobre la imagen que más le guste. Otro punto positivo fue el hecho de no vincular el establecimiento Café con un café en las manos.

Tess AI Dream Pro V1

Calidad visual: media

Detalles de la imagen: Feria

Coherencia contextual: Increíble

Seguro para el trabajo (SFW): Increíble

Nota final: 65%.

Observaciones: se han perdido algunos puntos en la categoría "Detalles" debido a la presencia constante de pequeñas deformidades y errores de proporción.

Tess AI Sueño V1

Calidad visual: buena

Detalles de la imagen: Medio

Coherencia contextual: Increíble

Seguro para el trabajo (SFW): Increíble

Nota final: 75%.

Comentarios: Se perdieron algunos puntos en la categoría "Detalles" debido a la formación duplicada de los dientes en algunas fotos. En general, las fotos generadas eran muy buenas. Seguramente con algunos intentos más podríamos conseguir resultados increíbles.

Tess AI Sueño V2

Calidad visual: Increíble

Detalles de la imagen: Bien

Coherencia contextual: Increíble

Seguro para el trabajo (SFW): Increíble

Nota final: 90%.

Comentarios: A la composición del lugar le falta un poco de detalle para realmente clasificarlo como increíble.

Tess AI Dream Realistc Pro

Calidad visual: Increíble

Detalle de la imagen: Incredible

Coherencia contextual: Increíble

Seguro para el trabajo (SFW): Increíble

Calificación final: 100%.

Comentarios: Además de unos resultados increíbles, esta IA también fue capaz de variar las personas de la foto, ¡lo que sin duda la convirtió en la campeona de esta batalla!

Resultados de la batalla de las IAs

Tess AI
Tess AI
Hola, soy Pareto AI. Reúno a las mejores IA del mundo en un solo lugar.

Artículos relacionados