Batalha das IAs: EP2 Um Homem Tomando Café, Sorrindo

Estamos de volta com a Batalha das IAs. O intuito desta série é trazer para você um comparativo das mais diversas IAs de imagem do mundo. Usaremos o mesmo prompt em todas as imagens, gerando 8 resultados e escolhendo os 4 melhores para compartilhar neste artigo.

Como funcionam as categorias de avaliação?

Qualidade Visual: avaliar a capacidade da IA em gerar imagens de qualidade, com traços aperfeiçoados, cores precisas e baixo nível de artefatos indesejados.

Detalhes da Imagem: verificar se a IA é capaz de detalhar bem o cenário, roupas e tudo que envolve o personagem principal do prompt.

Coerência Contextual: verificar se a IA é capaz de gerar imagens que se enquadrem no contexto fornecido ou que possuam relevância e continuidade dentro do tema solicitado.

Safe for Work (SFW): avaliar a capacidade da IA de gerar imagens de pessoas não sensualizadas (entre outras categorias), ou seja, Safe for Work.

Prompt: A guy in a cafe, smiling (Um homem num café, sorrindo)
Complexidade: 3 (1 ponto para o personagem. 1 ponto para o local. 1 ponto para expressão)
Formato: 1:1
Local: Todas as IAs foram geradas na Tess AI

Vamos aos resultados!

MidJourney V4

O Midjourney é uma plataforma de Inteligência Artificial que permite aos usuários gerar imagens de alta qualidade a partir de descrições textuais. O Midjourney usa um grande modelo de linguagem para gerar imagens que sejam precisas e coerentes com as instruções do usuário.

Atualmente a IA de imagem mais popular do mundo, com pouco mais de 15M de usuários. A ferramenta tem um preço médio de $30 ao mês, com limitação de velocidade na geração após um certo período de tempo utilizando a ferramenta.

Integrado à Tess AI: Sim. Você pode gerar imagens com a MidJourney dentro da Tess AI

Qualidade Visual: Boa

Detalhes da Imagem: Boa

Coerência Contextual: Incrível

Safe for Work (SFW): Incrível

Nota Final: 80%

Comentários: apesar destas 4 fotos terem ficados boas em qualidade, as demais apresentam bastantes deformidades. Ainda nestas 4 imagens, dá para se perceber algumas deformidades e detalhes faltando. Exemplo são os dedos da mão da imagem 4. Além disso, a foto 3 apresenta o corpo relativamente pequeno diante da cabeça. As mãos da foto 2 também apresentam deformidade. Outro elemento que notamos foi a presença duplicada de xícaras.

Stable Difusion

Com 5.3M de visitas ao mês, a Stable Diffusion é uma  das IAs de imagem mais populares do planeta e uma das precursoras de toda esta tecnologia.

Integrado à Tess AI: Sim. Você pode gerar imagens com a Stable Diffusion dentro da Tess AI

Qualidade Visual: Boa

Detalhes da Imagem: Média

Coerência Contextual: Incrível

Safe for Work (SFW): Incrível

Nota Final: 75%

Comentários: as imagens apresentam deformidades mais aparentes, especialmente nos braços, olhos e bocas. Também notamos itens repetidos, como xícaras.

DALL·E 2

DALL·E 2 é uma ferramenta de IA que pode gerar imagens realistas a partir de prompts de texto. Por exemplo, você pode pedir a DALL·E 2 para gerar uma imagem de um gato sentado em um piano, e ela gerará uma imagem de um gato sentado em um piano.

DALL·E 2 ainda está em desenvolvimento, mas tem o potencial de ser uma ferramenta poderosa para artistas, designers e criativos. Esta é a IA geradora de imagens da Open AI, a maior empresa de IA do planeta.

Seu preço médio varia de $30/m a $60/m, permitindo a utilização dos mais diferentes prompts.

Integrado à Tess AI: Sim. Você pode gerar imagens com a DALL·E 2 dentro da Tess AI

Qualidade Visual: Média

Detalhes da Imagem: Raziável

Coerência Contextual: Razoável

Safe for Work (SFW): Incrível

Nota Final: 45%

Comentários: definitivamente a IA não conseguiu construir o cenário do café. No entanto, conseguiiu compreender bem a expressão do rosto pedida. Ponto positivo é o fato de não haver deformidades.

OpenJourney

OpenJourney é uma plataforma de desenvolvimento de imagens geradas por IA que ajuda você a criar imagens de alta qualidade rapidamente e facilmente.

Nossa API simples, mas também poderosa, permite que você controle todos os aspectos do processo de geração de imagens, desde a entrada de texto até o estilo e a resolução da saída.

Com 26.2k visitas ao mês, a OpenJourney vem se tornando uma das APIs de IA mais utilizadas. O custo médio da API varia de $50/m a $100/m.

Integrado à Tess AI: [icon color=”accent-color” size=”tiny” icon_size=”” image=”fa-check”] Sim. Você pode gerar imagens com a OpenJourney dentro da Tess AI

Qualidade Visual: Boa

Detalhes da Imagem: Razoável

Coerência Contextual: Incrível

Safe for Work (SFW): Incrível

Nota Final: 70%

Comentários: alguns pontos foram perdidos na categoria de “Detalhes” devido a constante presença de pequenas deformidades e itens dupliicados. A IA apresentou também alguns erros de proporção.

Tess AI Dream Pro V2

Qualidade Visual: Boa

Detalhes da Imagem: Boa

Coerência Contextual: Incrível

Safe for Work (SFW): Incrível

Nota Final: 80%

Comentários: esta IA apresenta uma versatilidade muito interessante – algo muto útil em IAs. É comum que as IAs, para um prompt, tragam 4 versões muito semelhantes – o que tipicamente não é desejado. O ideal é que a IA seja versátil  e capaz de apresentar inclusive traços diferenets – para que o usuário possa definir a que mais gostou e eventualmente trabalhar em prompts image-to-image, ou seja, trabalhando em cima da imagem que mais gostou. Outro ponto positivo foi o fato de não ter atrelado o estabecimento Café com um café nas mãos.

Tess AI Dream Pro V1

Qualidade Visual: Média

Detalhes da Imagem: Razoável

Coerência Contextual: Incrível

Safe for Work (SFW): Incrível

Nota Final: 65%

Comentários: alguns pontos foram perdidos na categoria de “Detalhes” devido a constante presença de pequenas deformidades e erros de proporção.

Tess AI Dream V1

Qualidade Visual: Boa

Detalhes da Imagem: Média

Coerência Contextual: Incrível

Safe for Work (SFW): Incrível

Nota Final: 75%

Comentários: alguns pontos foram perdidos na categoria de “Detalhes” devido a formação duplicada dos dentes em algumas fotos. De uma maneira geral, as fotos geradas foram muito boas. Certamente com mais algumas tentativas poderíamos chegar a resultados incríveis.

Tess AI Dream V2

Qualidade Visual: Incrível

Detalhes da Imagem: Boa

Coerência Contextual: Incrível

Safe for Work (SFW): Incrível

Nota Final: 90%

Comentários: faltou um pouco de detalhes na composição do local para de fato classificarmos como incrível.

Tess AI Dream Realistc Pro

Qualidade Visual: Incrível

Detalhes da Imagem: Incrível

Coerência Contextual: Incrível

Safe for Work (SFW): Incrível

Nota Final: 100%

Comentários: além de resultados incríveis, esta IA ainda foi capaz de variar as pessoas presentes na foto, o que a transformou definitivamente na campeã desta batalha!

Resultado da Batalha das IAs

Rica Barros
Rica Barros
CEO da Pareto

Artigos Relacionados