“Foto grande angular de baixo de uma astronauta com um corpo feminino atlético andando com arrogância em direção à câmera em Marte em um universo infinito, arte digital de ondas sintéticas”. Esse foi o comando de texto que a artista Karen X. Cheng inseriu no DALL-E 2, um sistema de inteligência artificial que pode criar imagens e arte realistas a partir de uma descrição em texto de linguagem natural. A imagem resultante acabou estampando a capa da revista Cosmopolitan, a primeira da história a contar com esse tipo de criação.
O DALL-E 2 (uma brincadeira com os nomes do pintor Salvador Dalí e o robô do cinema WALL-E) é, talvez, a mais famosa entre as várias ferramentas desenvolvidas pelo mundo afora (incluindo uma do Google, o Imagen) dedicadas à geração de imagens por meio da inteligência artificial.
Basta digitar o texto (na imagem acima foi: “ursinhos de pelúcia misturando produtos químicos brilhantes como cientistas loucos, steampunk”) e o programa vasculha uma base de dados com milhões de imagens produzidas em diferentes momentos da história e suas respectivas legendas para criar uma nova imagem, inédita, inexistente até então. O software é baseado em um sistema computacional chamado CLIP, capaz de analisar imagens e resumir seu conteúdo de forma similar ao funcionamento do cérebro humano. A partir dele, foi desenvolvido o unCLIP, uma versão que começa com a descrição em texto para, em seguida, criar uma imagem.
A inteligência artificial já está sendo usada para finalizar sinfonias inacabadas, roteirizar filmes, compor letras para músicas e muito mais. Como qualquer tecnologia, tem seus prós e contras. Entre os aspectos positivos, pode-se citar a facilidade que empresas sem capital podem ter para obter imagens, logomarcas e outras peças necessárias para fazer a sua divulgação e campanhas de marketing. Entre os negativos, o impacto no mercado de designers, ilustradores e fotógrafos e questões éticas – a falta de filtro existente no universo de imagens utilizadas pode fazer com que o DALL-E 2 reforçe preconceitos, deepfakes e estereótipos que pululam na internet, ao replicá-los.
Há quem já vislumbre avanços grandes nos próximos anos: com a capacidade de gerar vídeos ou objetos em 3D, esses sistemas poderão criar ambientes e objetos para mundos virtuais e metaversos, diminuindo muito os custos de etapas que consomem boa parte dos orçamentos das empresas que oferecem serviços para esses ambientes.
Quem quiser testar a tecnologia pode entrar em uma fila de espera para usar o sofisticado DALL-E 2. Mas existe uma ferramenta (também há outras, e gratuitas) baseada no DALL-E 2, mais simples e BEM menos poderosa, o DALL-E mini.
(publicado originalmente no Globo em 22 de agosto de 2022)