Traduzido por Julio Batista
Original de Brendan Paul Murphy para The Conversation
O aplicativo de edição de fotos e vídeos Lensa ganhou destaque nas mídias sociais nas últimas semanas, depois de adicionar um recurso que permite gerar retratos digitais impressionantes de si mesmo em estilos de arte contemporânea.
Ele faz isso por apenas uma pequena taxa e pelo esforço de carregar de 10 a 20 fotos diferentes de você mesmo.
2022 foi o ano em que a tecnologia de texto para mídia da Inteligência Artificial deixou os laboratórios e começou a colonizar nossa cultura visual, e o Lensa pode ser a aplicação comercial mais inteligente dessa tecnologia até hoje.
Isso viralizou entre os influenciadores de mídia social que procuram se destacar – mas gerou um debate quente na comunidade artística. O artista australiano Kim Leutwyler disse ao The Guardian que reconheceu os estilos de artistas específicos – incluindo seu próprio estilo – nos retratos de Lensa.
Desde que o Midjourney, o Dall-E da OpenAI e a Stable Diffusion do grupo CompVis entraram em cena no início deste ano, a facilidade com que os estilos de artistas individuais podem ser emulados soou um sinal de alerta.
Os artistas sentem que sua propriedade intelectual – e talvez um pouco de sua alma – foi comprometida. Mas isso é mesmo o caso?
Bem, não tanto segundo a lei de direitos autorais existente.
Se não é roubo direto, o que é?
A IA de texto para mídia é inerentemente muito complexa, mas é possível para nós, os que não são cientistas da computação, entender conceitualmente.
Para realmente entender os pontos positivos e negativos do Lensa, vale a pena ir passo a passo para entender como os estilos individuais dos artistas podem entrar e sair das caixas pretas que alimentam sistemas como o Lensa.
O Lensa é essencialmente um front-end simplificado e personalizado para o modelo de aprendizado profundo Stable Diffusion disponível gratuitamente. É assim chamado porque usa um sistema chamado difusão latente para alimentar sua produção criativa.
A palavra “latente” é a chave aqui. Na ciência de dados, uma variável latente é uma qualidade que não pode ser medida diretamente, mas pode ser inferida a partir de coisas que podem ser medidas.
Quando a Stable Diffusion estava sendo construída, os algoritmos de aprendizado de máquina foram alimentados com um grande número de imagens associadas a texto e aprenderam bilhões de maneiras diferentes pelas quais essas imagens e legendas poderiam ser conectadas.
Isso formou uma base de conhecimento complexa, nenhuma das quais é diretamente inteligível para os humanos. Podemos ver “modernismo” ou “tinta espessa” em suas saídas, mas a Stable Diffusion vê um universo de números e conexões.
E tudo isso decorre de uma matemática complexa que envolve os números gerados a partir das imagens associadas a textos originais.
Como o sistema ingeriu descrições e dados de imagem, ele nos permite traçar um caminho através do enorme mar de saídas possíveis, digitando prompts significativos.
Tome a imagem abaixo como exemplo. O prompt de texto incluía os termos “arte digital” e “artstation” – um site que abriga muitos artistas digitais contemporâneos.
Durante seu treinamento, Stable Diffusion aprendeu a associar essas palavras com certas qualidades que identificou nas várias obras de arte em que foi treinado. O resultado é uma imagem que caberia bem no ArtStation.
O que faz a Lensa se destacar?
Portanto, se a Stable Diffusion é um sistema de texto para imagem em que navegamos por diferentes possibilidades, o Lensa parece bem diferente, pois aceita imagens, não palavras. Isso porque uma das maiores inovações do Lensa é agilizar o processo de inversão textual.
O Lensa obtêm fotos fornecidas pelo usuário e as insere na base de conhecimento existente da Stable Diffusion, ensinando o sistema a “capturar” os recursos do usuário para que possa estilizá-los. Embora isso possa ser feito com a Stable Diffusion regular, está longe de ser um processo simplificado.
Embora você não possa enviar as imagens no Lensa em nenhuma direção específica desejada, a compensação é uma ampla variedade de opções que quase sempre são impressionantes. Essas imagens emprestam ideias do trabalho de outros artistas, mas não contêm nenhum elemento real de seu trabalho.
O Australian Arts Law Center deixa claro que, embora as obras de arte individuais estejam sujeitas a direitos autorais, os elementos estilísticos e as ideias por trás delas não estão. Da mesma forma, o caso Dave Grossman Designs Inc. v Bortin nos EUA estabeleceu que a lei de direitos autorais não se aplica a um estilo de arte.
E os artistas?
No entanto, o fato de que os estilos e técnicas de arte são agora transferíveis dessa maneira é imensamente perturbador para os artistas. À medida que tecnologias como o Lensa se tornam mais populares e os artistas se sentem cada vez mais roubados de sua propriedade intelectual, pode haver pressão para que a legislação se adapte a ela.
Para artistas que trabalham em obras de pequena escala, como criar ilustrações digitais para influenciadores ou outras empresas da web, o futuro parece desafiador.
No entanto, embora seja fácil fazer uma obra de arte com boa aparência usando IA, ainda é difícil criar um trabalho muito específico, com um tema e contexto específicos. Portanto, independentemente de como aplicativos como o Lensa abalam a maneira como a arte é feita, a personalidade do artista continua sendo um contexto importante para seu trabalho.
Pode ser que os próprios artistas precisem se tornar cada vez mais influenciadores e investir mais esforço em se divulgar.
Ainda é cedo e será uma década tumultuada para produtores e consumidores de arte. Mas uma coisa é certa: o gênio saiu da garrafa.