Ir al contenido principal
Inteligencia artificial

Batalla de las IAs: EP2 Un hombre en un café, sonriendo

Por 19 de agosto de 202329 de enero de 2024Sin comentarios

Volvemos con la Batalla de las IAs. El objetivo de esta serie es comparar las IA de imágenes más diversas del mundo. Utilizaremos la misma instrucción para todas las imágenes, generaremos 8 resultados y elegiremos los 4 mejores para compartirlos en este artículo.

¿Cómo funcionan las categorías de evaluación?

Calidad visual

Evalúe la capacidad de la IA para generar imágenes de calidad, con características mejoradas, colores precisos y un bajo nivel de artefactos no deseados.

Detalles de la imagen

Comprueba que la IA es capaz de detallar bien el escenario, la ropa y todo lo que rodea al protagonista del prompt

Coherencia contextual

Compruebe que la IA es capaz de generar imágenes que encajen en el contexto proporcionado o que tengan relevancia y continuidad dentro del tema solicitado.

Seguridad en el trabajo (SFW)

Evalúa la capacidad de la IA para generar imágenes de personas no consentidas (entre otras categorías), es decir, seguras para el trabajo.

Prompt: A guy in a cafe, smiling (Un hombre en un café, sonriendo)
Complejidad: 3 (1 punto por carácter. 1 punto por localización. 1 punto por expresión)
Formato: 1:1
Localización: Todas las IAs fueron generadas en https://tess.pareto.io

¡Vamos con los resultados!

MidJourney v4

Midjourney es una inteligencia artificial que permite a los usuarios generar imágenes de alta calidad a partir de descripciones textuales. Midjourney utiliza un amplio modelo lingüístico para generar imágenes precisas y coherentes con las instrucciones del usuario.

Actualmente es la IA de imágenes más popular del mundo, con algo más de 15M de usuarios. La herramienta tiene un precio medio de 30$ al mes, con una limitación en la velocidad de generación tras un cierto tiempo de uso de la herramienta.

Integrado con Tess AI: . Puede generar imágenes con MidJourney dentro de Tess AI.

Calidad visual: buena
Detalles de la imagen: Bien
Coherencia contextual: Increíble
Seguro para el trabajo (SFW): Increíble
80
Nota final

Observaciones: Aunque estas 4 fotos eran de buena calidad, el resto tienen bastantes deformidades. Incluso en estas 4 fotos, se pueden ver algunas deformidades y faltan detalles. Un ejemplo son los dedos de la mano en la imagen 4. Además, la foto 3 muestra el cuerpo relativamente pequeño delante de la cabeza. Las manos de la imagen 2 también están deformadas. Otro elemento que observamos fue la presencia duplicada de tazas.

Difusión estable

Con 5,3 millones de visitas al mes, Stable Diffusion es una de las IA de imagen más populares del planeta y una de las precursoras de toda esta tecnología.

Integrado con Tess AI: . Puede generar imágenes con Stable Diffusion dentro de Tess AI.

Calidad visual: buena
Detalles de la imagen: Medio
Coherencia contextual: Increíble
Seguro para el trabajo (SFW): Increíble
75
Nota final

Observaciones: Las imágenes muestran deformidades más aparentes, sobre todo en los brazos, los ojos y la boca. También observamos elementos repetidos, como tazas.

DALL-E 2

DALL-E 2 es una herramienta de inteligencia artificial capaz de generar imágenes realistas a partir de mensajes de texto. Por ejemplo, puedes pedirle a DALL-E 2 que genere una imagen de un gato sentado en un piano, y generará una imagen de un gato sentado en un piano.

DALL-E 2 aún está en desarrollo, pero tiene el potencial de convertirse en una poderosa herramienta para artistas, diseñadores y creativos. Se trata de la IA generadora de imágenes de Open AI, la mayor empresa de IA del planeta.

Su precio medio oscila entre 30 $/m y 60 $/m, permitiendo el uso de las más diversas indicaciones.

Integrado con Tess AI: . Puede generar imágenes con el DALL-E 2 dentro de Tess AI.

Calidad visual: media
Detalles de la imagen: Feria
Coherencia contextual: Razonable
Seguro para el trabajo (SFW): Increíble
45
Nota final

Comentarios: Definitivamente, la IA no consiguió construir la escena del café. Sin embargo, fue capaz de entender muy bien la expresión facial solicitada. Un punto positivo es que no hay deformidades.

OpenJourney

OpenJourney es una plataforma de desarrollo de imágenes generadas por IA que te ayuda a crear imágenes de alta calidad de forma rápida y sencilla.

Nuestra sencilla pero potente API le permite controlar todos los aspectos del proceso de generación de imágenes, desde la introducción de texto hasta el estilo y la resolución de salida.

Con 26,2k visitas al mes, OpenJourney se ha convertido en una de las API de IA más utilizadas. El coste medio de la API oscila entre 50 y 100 dólares al mes.

Integrado con Tess AI: . Puede generar imágenes con OpenJourney dentro de Tess AI.

Calidad visual: buena
Detalles de la imagen: Feria
Coherencia contextual: Increíble
Seguro para el trabajo (SFW): Increíble
70
Nota final

Observaciones: Se perdieron algunos puntos en la categoría "Detalles" debido a la presencia constante de pequeñas deformidades y elementos duplicados. La IA también tuvo algunos errores de proporción.

Tess AI Dream Pro V2

Calidad visual: buena
Detalles de la imagen: Bien
Coherencia contextual: Increíble
Seguro para el trabajo (SFW): Increíble
80
Nota final

Comentarios: Esta IA tiene una versatilidad muy interesante, algo muy útil en las IAs. Es común que las IAs, para un prompt, presenten 4 versiones muy parecidas - lo que típicamente no es deseable. Lo ideal sería que la IA fuera versátil y capaz de presentar incluso rasgos diferentes, para que el usuario pueda definir el que más le guste y, con el tiempo, trabajar con indicaciones imagen a imagen, es decir, trabajar sobre la imagen que más le guste. Otro punto positivo fue el hecho de no vincular el establecimiento Café con un café en las manos.

Tess AI Dream Pro V1

Calidad visual: media
Detalles de la imagen: Feria
Coherencia contextual: Increíble
Seguro para el trabajo (SFW): Increíble
65
Nota final

Observaciones: Se perdieron algunos puntos en la categoría "Detalles" debido a la presencia constante de pequeñas deformidades y errores de proporción.

Tess AI Sueño V1

Calidad visual: buena
Detalles de la imagen: Medio
Coherencia contextual: Increíble
Seguro para el trabajo (SFW): Increíble
75
Nota final

Observaciones: Se perdieron algunos puntos en la categoría "Detalles" debido a la formación duplicada de dientes en algunas fotos. En general, las fotos generadas eran muy buenas. Seguramente con algunos intentos más podríamos conseguir resultados increíbles.

Tess AI Sueño V2

Calidad visual: Increíble
Detalles de la imagen: Bien
Coherencia contextual: Increíble
Seguro para el trabajo (SFW): Increíble
90
Nota final

Observaciones: A la composición del lugar le faltaba un poco de detalle para que realmente lo calificáramos de increíble.

Tess AI Sueño Realista Pro

Calidad visual: Increíble
Detalle de la imagen: Incredible
Coherencia contextual: Increíble
Seguro para el trabajo (SFW): Increíble
100
Nota final

Comentarios: Además de unos resultados increíbles, esta IA también fue capaz de variar las personas de la foto, ¡lo que sin duda la convirtió en la campeona de esta batalla!

Resultados de la batalla de las IAs

¿Le ha gustado este artículo?

0 / 5 Resultados 0 Votos 0

Su page rank:

Rica Barros

Rica Barros es la fundadora y CEO de Pareto, la startup de IA líder en América Latina.