Skip to main content
Inteligência Artificial

Batalha das IAs: EP2 Um homem num café, sorrindo

By agosto 19, 2023janeiro 29th, 2024No Comments

Estamos de volta com a Batalha das IAs. O intuito desta série é trazer para você um comparativo das mais diversas IAs de imagem do mundo. Usaremos o mesmo prompt em todas as imagens, gerando 8 resultados e escolhendo os 4 melhores para compartilhar neste artigo.

Como funcionam as categorias de avaliação?

Qualidade Visual

Avaliar a capacidade da IA em gerar imagens de qualidade, com traços aperfeiçoados, cores precisas e baixo nível de artefatos indesejados.

Detalhes da Imagem

Verificar se a IA é capaz de detalhar bem o cenário, roupas e tudo que envolve o personagem principal do prompt

Coerência Contextual

Verificar se a IA é capaz de gerar imagens que se enquadrem no contexto fornecido ou que possuam relevância e continuidade dentro do tema solicitado

Safe for Work (SFW)

Avalia a capacidade da IA de gerar imagens de pessoas não sensualizadas (entre outras categorias), ou seja, Safe for Work

Prompt: A guy in a cafe, smiling (Um homem num café, sorrindo)
Complexidade: 3 (1 ponto para o personagem. 1 ponto para o local. 1 ponto para expressão)
Formato: 1:1
Local: Todas as IAs foram geradas na https://tess.pareto.io

Vamos aos resultados!

MidJourney v4

O Midjourney é uma plataforma de Inteligência Artificial que permite aos usuários gerar imagens de alta qualidade a partir de descrições textuais. O Midjourney usa um grande modelo de linguagem para gerar imagens que sejam precisas e coerentes com as instruções do usuário.

Atualmente a IA de imagem mais popular do mundo, com pouco mais de 15M de usuários. A ferramenta tem um preço médio de $30 ao mês, com limitação de velocidade na geração após um certo período de tempo utilizando a ferramenta.

Integrado à Tess AI: Sim. Você pode gerar imagens com a MidJourney dentro da Tess AI

Qualidade Visual: Boa
Detalhes da Imagem: Boa
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
80
Nota Final

Comentários: Apesar destas 4 fotos terem ficados boas em qualidade, as demais apresentam bastantes deformidades. Ainda nestas 4 imagens, dá para se perceber algumas deformidades e detalhes faltando. Exemplo são os dedos da mão da imagem 4. Além disso, a foto 3 apresenta o corpo relativamente pequeno diante da cabeça. As mãos da foto 2 também apresentam deformidade. Outro elemento que notamos foi a presença duplicada de xícaras.

Stable Difusion

Com 5.3M de visitas ao mês, a Stable Diffusion é uma  das IAs de imagem mais populares do planeta e uma das precursoras de toda esta tecnologia.

Integrado à Tess AI: Sim. Você pode gerar imagens com a Stable Diffusion dentro da Tess AI

Qualidade Visual: Boa
Detalhes da Imagem: Média
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
75
Nota Final

Comentários: As imagens apresentam deformidades mais aparentes, especialmente nos braços, olhos e bocas. Também notamos itens repetidos, como xícaras.

DALL·E 2

DALL·E 2 é uma ferramenta de IA que pode gerar imagens realistas a partir de prompts de texto. Por exemplo, você pode pedir a DALL·E 2 para gerar uma imagem de um gato sentado em um piano, e ela gerará uma imagem de um gato sentado em um piano.

DALL·E 2 ainda está em desenvolvimento, mas tem o potencial de ser uma ferramenta poderosa para artistas, designers e criativos. Esta é a IA geradora de imagens da Open AI, a maior empresa de IA do planeta.

Seu preço médio varia de $30/m a $60/m, permitindo a utilização dos mais diferentes prompts.

Integrado à Tess AI: Sim. Você pode gerar imagens com a DALL·E 2 dentro da Tess AI

Qualidade Visual: Média
Detalhes da Imagem: Raziável
Coerência Contextual: Razoável
Safe for Work (SFW): Incrível
45
Nota Final

Comentários: Definitivamente a IA não conseguiu construir o cenário do café. No entanto, conseguiiu compreender bem a expressão do rosto pedida. Ponto positivo é o fato de não haver deformidades.

OpenJourney

OpenJourney é uma plataforma de desenvolvimento de imagens geradas por IA que ajuda você a criar imagens de alta qualidade rapidamente e facilmente.

Nossa API simples, mas também poderosa, permite que você controle todos os aspectos do processo de geração de imagens, desde a entrada de texto até o estilo e a resolução da saída.

Com 26.2k visitas ao mês, a OpenJourney vem se tornando uma das APIs de IA mais utilizadas. O custo médio da API varia de $50/m a $100/m.

Integrado à Tess AI: Sim. Você pode gerar imagens com a OpenJourney dentro da Tess AI

Qualidade Visual: Boa
Detalhes da Imagem: Razoável
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
70
Nota Final

Comentários: Alguns pontos foram perdidos na categoria de “Detalhes” devido a constante presença de pequenas deformidades e itens dupliicados. A IA apresentou também alguns erros de proporção.

Tess AI Dream Pro V2

Qualidade Visual: Boa
Detalhes da Imagem: Boa
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
80
Nota Final

Comentários: Esta IA apresenta uma versatilidade muito interessante – algo muto útil em IAs. É comum que as IAs, para um prompt, tragam 4 versões muito semelhantes – o que tipicamente não é desejado. O ideal é que a IA seja versátil  e capaz de apresentar inclusive traços diferenets – para que o usuário possa definir a que mais gostou e eventualmente trabalhar em prompts image-to-image, ou seja, trabalhando em cima da imagem que mais gostou. Outro ponto positivo foi o fato de não ter atrelado o estabecimento Café com um café nas mãos.

Tess AI Dream Pro V1

Qualidade Visual: Média
Detalhes da Imagem: Razoável
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
65
Nota Final

Comentários: Alguns pontos foram perdidos na categoria de “Detalhes” devido a constante presença de pequenas deformidades e erros de proporção.

Tess AI Dream V1

Qualidade Visual: Boa
Detalhes da Imagem: Média
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
75
Nota Final

Comentários: Alguns pontos foram perdidos na categoria de “Detalhes” devido a formação duplicada dos dentes em algumas fotos. De uma maneira geral, as fotos geradas foram muito boas. Certamente com mais algumas tentativas poderíamos chegar a resultados incríveis.

Tess AI Dream V2

Qualidade Visual: Incrível
Detalhes da Imagem: Boa
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
90
Nota Final

Comentários: Faltou um pouco de detalhes na composição do local para de fato classificarmos como incrível.

Tess AI Dream Realistic Pro

Qualidade Visual: Incrível
Detalhes da Imagem: Incrível
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
100
Nota Final

Comentários: Além de resultados incríveis, esta IA ainda foi capaz de variar as pessoas presentes na foto, o que a transformou definitivamente na campeã desta batalha!

Resultado da Batalha das IAs

Curtiu este artigo?

0 / 5 0 0

Your page rank:

Rica Barros

Rica Barros é fundador e CEO da Pareto, startup líder em IA na América Latina