Estamos de volta com a Batalha das IAs. O intuito desta série é trazer para você um comparativo das mais diversas IAs de imagem do mundo. Usaremos o mesmo prompt em todas as imagens, gerando 8 resultados e escolhendo os 4 melhores para compartilhar neste artigo.
Como funcionam as categorias de avaliação?
Qualidade Visual: avaliar a capacidade da IA em gerar imagens de qualidade, com traços aperfeiçoados, cores precisas e baixo nível de artefatos indesejados.
Detalhes da Imagem: verificar se a IA é capaz de detalhar bem o cenário, roupas e tudo que envolve o personagem principal do prompt.
Coerência Contextual: verificar se a IA é capaz de gerar imagens que se enquadrem no contexto fornecido ou que possuam relevância e continuidade dentro do tema solicitado.
Safe for Work (SFW): avaliar a capacidade da IA de gerar imagens de pessoas não sensualizadas (entre outras categorias), ou seja, Safe for Work.
Prompt: A guy in a cafe, smiling (Um homem num café, sorrindo)
Complexidade: 3 (1 ponto para o personagem. 1 ponto para o local. 1 ponto para expressão)
Formato: 1:1
Local: Todas as IAs foram geradas na Tess AI
Vamos aos resultados!
MidJourney V4
O Midjourney é uma plataforma de Inteligência Artificial que permite aos usuários gerar imagens de alta qualidade a partir de descrições textuais. O Midjourney usa um grande modelo de linguagem para gerar imagens que sejam precisas e coerentes com as instruções do usuário.
Atualmente a IA de imagem mais popular do mundo, com pouco mais de 15M de usuários. A ferramenta tem um preço médio de $30 ao mês, com limitação de velocidade na geração após um certo período de tempo utilizando a ferramenta.
Integrado à Tess AI: Sim. Você pode gerar imagens com a MidJourney dentro da Tess AI
Qualidade Visual: Boa
Detalhes da Imagem: Boa
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
Nota Final: 80%
Comentários: apesar destas 4 fotos terem ficados boas em qualidade, as demais apresentam bastantes deformidades. Ainda nestas 4 imagens, dá para se perceber algumas deformidades e detalhes faltando. Exemplo são os dedos da mão da imagem 4. Além disso, a foto 3 apresenta o corpo relativamente pequeno diante da cabeça. As mãos da foto 2 também apresentam deformidade. Outro elemento que notamos foi a presença duplicada de xícaras.
Stable Difusion
Com 5.3M de visitas ao mês, a Stable Diffusion é uma das IAs de imagem mais populares do planeta e uma das precursoras de toda esta tecnologia.
Integrado à Tess AI: Sim. Você pode gerar imagens com a Stable Diffusion dentro da Tess AI
Qualidade Visual: Boa
Detalhes da Imagem: Média
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
Nota Final: 75%
Comentários: as imagens apresentam deformidades mais aparentes, especialmente nos braços, olhos e bocas. Também notamos itens repetidos, como xícaras.
DALL·E 2
DALL·E 2 é uma ferramenta de IA que pode gerar imagens realistas a partir de prompts de texto. Por exemplo, você pode pedir a DALL·E 2 para gerar uma imagem de um gato sentado em um piano, e ela gerará uma imagem de um gato sentado em um piano.
DALL·E 2 ainda está em desenvolvimento, mas tem o potencial de ser uma ferramenta poderosa para artistas, designers e criativos. Esta é a IA geradora de imagens da Open AI, a maior empresa de IA do planeta.
Seu preço médio varia de $30/m a $60/m, permitindo a utilização dos mais diferentes prompts.
Integrado à Tess AI: Sim. Você pode gerar imagens com a DALL·E 2 dentro da Tess AI
Qualidade Visual: Média
Detalhes da Imagem: Raziável
Coerência Contextual: Razoável
Safe for Work (SFW): Incrível
Nota Final: 45%
Comentários: definitivamente a IA não conseguiu construir o cenário do café. No entanto, conseguiiu compreender bem a expressão do rosto pedida. Ponto positivo é o fato de não haver deformidades.
OpenJourney
OpenJourney é uma plataforma de desenvolvimento de imagens geradas por IA que ajuda você a criar imagens de alta qualidade rapidamente e facilmente.
Nossa API simples, mas também poderosa, permite que você controle todos os aspectos do processo de geração de imagens, desde a entrada de texto até o estilo e a resolução da saída.
Com 26.2k visitas ao mês, a OpenJourney vem se tornando uma das APIs de IA mais utilizadas. O custo médio da API varia de $50/m a $100/m.
Integrado à Tess AI: [icon color=”accent-color” size=”tiny” icon_size=”” image=”fa-check”] Sim. Você pode gerar imagens com a OpenJourney dentro da Tess AI
Qualidade Visual: Boa
Detalhes da Imagem: Razoável
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
Nota Final: 70%
Comentários: alguns pontos foram perdidos na categoria de “Detalhes” devido a constante presença de pequenas deformidades e itens dupliicados. A IA apresentou também alguns erros de proporção.
Tess AI Dream Pro V2
Qualidade Visual: Boa
Detalhes da Imagem: Boa
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
Nota Final: 80%
Comentários: esta IA apresenta uma versatilidade muito interessante – algo muto útil em IAs. É comum que as IAs, para um prompt, tragam 4 versões muito semelhantes – o que tipicamente não é desejado. O ideal é que a IA seja versátil e capaz de apresentar inclusive traços diferenets – para que o usuário possa definir a que mais gostou e eventualmente trabalhar em prompts image-to-image, ou seja, trabalhando em cima da imagem que mais gostou. Outro ponto positivo foi o fato de não ter atrelado o estabecimento Café com um café nas mãos.
Tess AI Dream Pro V1
Qualidade Visual: Média
Detalhes da Imagem: Razoável
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
Nota Final: 65%
Comentários: alguns pontos foram perdidos na categoria de “Detalhes” devido a constante presença de pequenas deformidades e erros de proporção.
Tess AI Dream V1
Qualidade Visual: Boa
Detalhes da Imagem: Média
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
Nota Final: 75%
Comentários: alguns pontos foram perdidos na categoria de “Detalhes” devido a formação duplicada dos dentes em algumas fotos. De uma maneira geral, as fotos geradas foram muito boas. Certamente com mais algumas tentativas poderíamos chegar a resultados incríveis.
Tess AI Dream V2
Qualidade Visual: Incrível
Detalhes da Imagem: Boa
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
Nota Final: 90%
Comentários: faltou um pouco de detalhes na composição do local para de fato classificarmos como incrível.
Tess AI Dream Realistc Pro
Qualidade Visual: Incrível
Detalhes da Imagem: Incrível
Coerência Contextual: Incrível
Safe for Work (SFW): Incrível
Nota Final: 100%
Comentários: além de resultados incríveis, esta IA ainda foi capaz de variar as pessoas presentes na foto, o que a transformou definitivamente na campeã desta batalha!