Um mês criando imagens com inteligência artificial no DALL-E 2

Pouco mais de um mês atrás, recebi o tão esperado convite para usar o DALL-E 2, ferramenta da OpenAI que permite criar artes em vários estilos a partir de frases, usando algoritmos e inteligência artificial.

O DALL-E 2 é muito poderoso, e além de criar imagens originais, também permite inclusive fazer o upload de imagens reais para criar variações delas. Além disso, também é possível inserir novos personagens, bichos, itens ou objetos nas suas fotos, sempre com resultados muito surpreendentes.

Com a possibilidade de gerar imagens usando outras no centro, é possível criar o efeito de zoom infinito, e nesse post eu vou mostrar alguns exemplos e também te ensinar a criar uma imagem em cima da outra, o passo inicial para criar suas animações.

São Paulo no estilo de Blade Runner / Imagem: Nick Ellis (DALL-E 2, OpenAI)

Nesse post, vou dar uma pequena mostra do que é possível fazer com o DALL-E 2, mas para quem quiser ir (muito) além, uma ótima dica com muitas informações sobre como criar melhores imagens é o DALL-E 2 Prompt Book, um livro digital gratuito criado por Guy Parsons, disponível no site DALL-Ery GALL-Ery.

Uma breve história do DALL-E

Wall-E e o que era para ser o HAL (de 2001) mas está mais para Mike Wazowski / Imagem: Nick Ellis (DALL-E 2, OpenAI)

Em janeiro de 2021, foi lançada sua primeira versão, chamada simplesmente de DALL-E. O nome é uma mistura entre o eterno mestre do surrealismo, Salvador Dali, com o personagem-título do já clássico filme WALL-E da Pixar.

Formigas em escadas de M.C. Escher com fundo de galáxia / Imagem: Nick Ellis (DALL-E 2, OpenAI)

Em julho desse ano, a OpenAI lançou a versão beta do DALL-E 2, quando falamos no app pela primeira vez aqui no site. A versão beta está disponível para todos, basta entrar em uma lista de espera que está disponível no site, através da qual recebi o meu convite.

Como funciona o DALL-E 2?

Um pote de lámen com uma galáxia em seu interior

Um pote de lamen com uma galáxia em seu interior / Nick Ellis (DALL-E 2, OpenAI)

Resumindo bem, a inteligência artificial do DALL-E 2 foi treinada com milhões de imagens reais e também de obras de arte de diferentes artistas, pintores ou escultores, além de diferentes tipos de materiais.

Quando o usuário digita uma frase, ou sobe uma imagem, e clica no botão para gerar a imagem, o codificador do DALL-E 2 mapeia o texto (ou foto) para identificar do que se trata. Um modelo então mapeia esses itens ou termos com imagens que representam a informação semântica. E finalmente, um decodificador de imagens gera as representações visuais dessas informações.

Como usar o DALL-E 2 e o que são os prompts

Ao ser convidado e se inscrever, você recebe 50 créditos que podem ser usados para gerar um prompt. Mas, o que é um prompt? Geralmente é uma frase, mas também pode ser outra imagem, desde que não mostre um rosto humano, algo que não é permitido pelos termos do app.

É possível usar vírgulas para inserir estilos de imagem e novos detalhes, como fiz no exemplo abaixo.

Cada prompt gera 4 variações que podem ser salvas / Captura de tela com imagens do DALL-E 2 da OpenAI

Cada prompt gera quatro variações (por exemplo, os quatro robôs da captura de tela acima), e gasta um dos créditos disponíveis. Se tiver gostado de alguma das variações, ou quem sabe de todas, você pode gerar novas alternativas no mesmo estilo.

Astronauta em Mercúrio fugindo do sol / Imagens: Nick Ellis (DALL-E 2, OpenAI)

Na imagem acima, pedi ao DALL-E 2 para criar um astronauta correndo do Sol no planeta Mercúrio. Gostei das quatro opções, mas se tivesse que escolher uma única, certamente seria essa primeira, pois achei seu movimento interessante.

Cada imagem pode gerar mais três variações

Cada arte pode gerar mais três variações / Imagem: Nick Ellis (DALL-E 2, OpenAI)

Assim, fiz algumas variações dessa primeira imagem, para mostrar a vocês como é o resultado desse recurso, e devo dizer que gostei de todas mais do que a original. Muitas vezes você vai ter que gastar várias tentativas (e créditos) até você encontrar exatamente o que procura.

Nenhum desses lindos cães existe de verdade / Imagem: Nick Ellis (DALL-E 2, OpenAI)

Outra possibilidade é criar variações das suas imagens, sempre com efeitos bem curiosos. Na foto acima, vemos três versões alternativas dos cães da minha namorada, suas versões do multiverso, se você preferir.

Além disso, também é possível brincar com as fotos, inserindo coisas completamente novas, o que é uma das coisas mais divertidas do app. É bem fácil fazer uma máscara para apagar áreas específicas da imagem para serem ocupadas pelo que será gerado pelo DALL-E 2.

Godzilla visitando São Paulo / Imagem: Nick Ellis (DALL-E 2, OpenAI)

Na imagem acima, apaguei uma parte da minha foto original de uma São Paulo noturna e pedi ao DALL-E 2 para inserir o Godzilla destruindo prédios ali. Gostei tanto das duas versões que não consegui escolher uma só. É incrível ver como ele é fiel à iluminação original da foto.

Vale citar que esse tipo de efeito com uma foto original é impossível no seu concorrente Midjourney, que até permite subir imagens, mas só para gerar novos prompts, e não para interagir com elas dessa maneira tão criativa.

Alguns exemplos de prompts feitos no DALL-E 2

Imagem feita com o DALL-E 2 mostra uma capivara de traje espacial no topo de um prédio / Imagem: Nick Ellis (DALL-E 2, OpenAI)

Na imagem acima, meu prompt foi uma renderização 3D de uma capivara em uma roupa espacial no topo de um edifício alto em um planeta alienígena, e pedi para que fosse aplicado o estilo arte digital (“digital art”).

Doctor Who e TARDIS nos estilos Monet e em Picasso, e Sgt. Peppers no estilo Van Gogh / Nick Ellis (DALL-E 2, OpenAI)

Também me diverti criando imagens no estilo de diferentes artistas. Na imagem acima, por exemplo, prompts do Doctor Who e sua TARDIS nos estilos de Monet e Picasso (desenho em linha), além da capa do disco Sgt. Pepper´s dos Beatles pintado no estilo de Van Gogh.

Duas versões de um alienígena steampunk / Nick Ellis (DALL-E 2, OpenAI)

A imagem acima mostra um alienígena steampunk, com duas versões geradas a partir do mesmo prompt. Gostei de usar o termo steampunk, então também criei o olho abaixo, em mais uma tentativa de recriar a marca do nosso site.

Um olho steampunk / Imagem: Nick Ellis (DALL-E 2, OpenAI)

Na imagem abaixo, pedi ao DALL-E 2 para criar uma nave se aproximando de um satélite altamente tecnológico no ano 3000, com a aurora de Saturno aparecendo ao fundo.

Também aprovei o resultado, que ficou bem high-tech com essas luzes neon, então gerei mais 3 variações desse tema, que você pode ver abaixo.

Usando imagens como parte central de uma nova imagem

Marca do Olhar Digital reimaginada pelo DALL-E 2 para mostrar o efeito de uma imagem feita a partir de outra

Marca do Olhar Digital reimaginada pelo DALL-E 2 demonstra o efeito de uma imagem feita ao redor de outra / Nick Ellis (DALL-E 2, OpenAI)

Um dos recursos mais interessantes do DALL-E 2 é poder criar uma imagem usando outra como ponto central, como nas três imagens acima, uma criada a partir da outra. Na imagem abaixo, fiz mais uma versão, ainda usando a imagem central como base.

Quarta etapa do zoom de uma imagem na outra criado pelo DALL-E 2 / Imagem: Nick Ellis (DALL-E 2, OpenAI)

Assim, usando esse efeito, é possível editar um vídeo com um zoom infinito entre as artes. Sim, dá um bom trabalho, mas o resultado fica simplesmente incrível, pelo menos na minha opinião.

Criando uma imagem no DALL-E 2 com outra imagem no centro

Para fazer uma imagem a partir da outra, você vai precisar de um programa como o Photoshop, mas qualquer outro concorrente (online ou não) já resolve. O primeiro passo é gerar uma imagem no DALL-E 2, que no meu exemplo, é a imagem do olho computadorizado.

Depois, basta abrir essa arte em um editor de imagens e reduzir o tamanho em 50%, ou seja, para 512 pixels, deixando a área da imagem centralizada, com o resto da área transparente. Salve essa imagem no seu computador.

Primeiro passo é subir a imagem que será usada no centro da montagem / Captura de tela

O próximo passo é fazer o upload dessa imagem com a borda transparente para o DALL-E 2, e depois clicar em editar a imagem (Edit Image). O DALL-E 2 vai pedir para você clicar em uma parte da imagem para fazer a máscara.

Passo a passo para criar uma imagem com outra no centro / Captura de tela

Clique na lateral em branco. Então, no campo de texto, crie um prompt para especificar os detalhes que ficarão ao lado da imagem original.

Salve a imagem gerada com a outra imagem no centro / Captura de tela

Escolha a variação que você preferir, e salve a imagem. Repita o processo no Photoshop ou app similar para deixar ela com 50% do tamanho e as bordas transparentes.

Passo a passo para criar uma imagem com outra no centro / Captura de tela

Voltando ao DALL-E 2, faça o upload da imagem, e pense em um novo prompt. É possível repetir esse processo quantas vezes você quiser, e assim criar um vídeo com zoom infinito indo de um ponto para o outro completamente diferente.

50 créditos de graça e mais 15 por mês

No DALLE-2 não é possível gerar imagens com maior resolução, como no rival Midjourney, assim todas contam com o mesmo tamanho, 1024 x 1024 pixels. Mesmo que os seus 50 créditos acabarem, o usuário poderá seguir usando o app gratuitamente, pois a OpenAI vai dar 15 créditos que podem ser usados em um mês. Quem precisar de mais, pode comprar 115 créditos por US$ 15.

Sim, o seu concorrente Midjourney consegue apresentar resultados mais artísticos, digamos assim, mas o DALL-E 2 segue imbatível na sua tarefa de recriar o mundo real, ou algo bem próximo a ele. Por falar no Midjourney, se você não leu o meu texto sobre ele, é só clicar aqui.

Além disso, também recomendo ouvir nosso podcast Sync sobre o tema, no qual falamos sobre tanto sobre o DALL-E 2 quanto sobre o Midjourney.

FONTE: https://olhardigital.com.br/2022/08/16/reviews/um-mes-criando-imagens-com-inteligencia-artificial-no-dall-e-2/