Primeiramente, esse post se baseia nos argumentos expostos neste vídeo do Steve Zapata sobre o uso de inteligência artificial na arte. Ele estabelece a relação entre ética e inteligência artificial. Por isso, não entrarei na discussão se a arte feita por IA é arte de verdade ou não. Contudo, rolou uma discussão bem massa sobre esse assunto no Mograph News.
Contudo, os argumentos a seguir não são sobre isso. Eles são sobre o ambiente falho, não ético e enganoso ao redor dos sistemas de inteligência artificial. Porém, não é difícil imaginar um sistema de geração de imagens por IA que seja ético e consensual e isso deixa ainda mais evidente que os sistemas atuais não são éticos e muito menos consensuais.
Dessa forma, caso eles se propaguem sem verificação, forma-se um precedente perigoso, revelando que artistas não estão dispostos a defender a si mesmos e os seus trabalhos contra roubo e exploração. No estado atual, esses sistemas baseiam-se na coleta e exploração oportunista de grandes quantidades de trabalhos criativos de um número gigante de pessoas, sem consenso ou compensação.
O principal argumento utilizado por empresas e defensores é: “A IA apenas pesquisa referências da internet do mesmo jeito que os artistas fazem”.
O processo
Você já deve ter ouvido sobre várias IAs geradoras de imagens a partir de texto, tanto na comunidade artística quanto no noticiário. Os mais conhecidos são o MidJourney, DALL-E, Stable Diffusion e Imagen. Porém, você não deve ter ouvido falar das bases de dados de cada um desses sistemas, que funcionam como um serviço separado.
Desse modo, vamos utilizar um dos sistemas mais populares como exemplo, o LAION. Ele foi a coleção de dados utilizada para treinar as versões atuais do StableDiffusion e do Imagen. Uma das suas ofertas é o LAION 5B, uma coleção de 5 bilhões de URLs de imagens e textos descritivos que apontam e descrevem imagens por toda a rede. Por isso, Quando um modelo como o StableDiffusion é “treinado” para fazer o seu trabalho, um procedimento caro e altamente dependente de recursos, ele funciona a partir de um algoritmo que solidifica a conexão entre imagem e texto.
Os detalhes do processo não são importantes, mas o que é interessante notar é que o conjunto de imagens fornecidas que define o potencial do modelo. Dessa forma, a boa performance do modelo não seria possível sem todos os dados fornecidos, muitos deles com copyright. Após o treinamento do modelo com um conjunto de imagens você não é possível realizar mudanças de forma fácil. Caso queira modificar um conjunto de dados e atualizar o modelo, você deve treiná-lo do zero novamente.
O pacote de dados
Um fato sobre o conjunto de imagens que formam o pacote de dados: existe de tudo lá dentro. Até imagens médicas particulares já foram encontradas. Isso ocorre porque as imagens são localizadas e catalogadas de forma indiscriminada e a coleção em si é um labirinto confuso e difícil de entender e navegar. Uma grande parte das imagens utilizadas têm copyright. Para ser bem claro, você, como pessoa física, não poderia sequer copiar e postar algumas dessas imagens no seu blog pessoal sem correr algum tipo de risco legal.
O esquema
Entretanto, como esses sistemas podem incluir essas imagens nos seus modelos? Através das organizações. O LAION 5B é oferecido pela LAION, uma organização alemã sem fins lucrativos, enquanto o rastreamento das imagens é feito por outra organização chamada CommonCrawl. Dependendo de onde estão localizadas, essas empresas recebem isenções legais privilegiadas e não serão consideradas culpadas por coletar e usar dados protegidos por direitos autorais.
Contudo, a questão é que esses conjuntos de dados, coletados sob essas isenções, são canalizados para empreendimentos comerciais com fins lucrativos, como o Stable Diffusion. E sabe quem financiou grande parte do poder de processamento do LAION para criar esse conjunto de dados? A empresa Stability.AI, a mesma criadora do Stable Diffusion. Na verdade, o LAION está listado ao lado de outros serviços em seu site.
Portanto, esse conjunto de dados que seriam supostamente para pesquisa acadêmica, sem fins lucrativos e legalmente privilegiado, está sendo usado no principal produto de uma empresa com fins lucrativos e atualmente avaliada em um bilhão de dólares. Isso parece ser uma violação direta dos privilégios de pesquisa. Essa prática é cada vez mais comum, e dificulta a identificação de qualquer irregularidade. O objetivo aqui é evitar a responsabilidade legal por meio de uma lavagem de dados que eles argumentam ser legal e mascaram através do discurso de IA disponível para todos.
O queridinho DALL-E
Outro exemplo desse modelo de responsabilidade evasivo é o sistema DALL-E de conversão de texto em imagem, chamado “OpenAI”. Ele é composto por duas corporações: a OpenAI LP, com fins lucrativos, e sua empresa irmã sem fins lucrativos, a OpenAI Inc.
Confuso, certo? Olhe o que eles escreveram no blog da empresa:
“Queremos aumentar nossa capacidade de levantar capital enquanto ainda cumprimos nossa missão, e nenhuma estrutura legal pré-existente que conhecemos atinge o equilíbrio certo. Nossa solução é criar o OpenAI LP como um híbrido de uma empresa com fins lucrativos e sem fins lucrativos, que estamos chamando de empresa de “lucro limitado”.
Não é uma pena que nenhuma outra estrutura legal pré-existente funcione para eles? Pelo menos eles foram corajosos o suficiente para inventar sua própria estrutura legal (contém ironia). Em suma, eles ganham o máximo de dinheiro possível, enquanto aproveitam incentivos fiscais, privilégios legais e a cobertura nublada de uma organização sem fins lucrativos que coleta ativos para fins de “pesquisa”. Se você quiser dar uma boa risada, pesquise os “limites” que eles estabeleceram para sua empresa de “lucro limitado”.
O problema
Primeiramente, essas jogadas são o tipo de coisa para a qual quero chamar a atenção. Por isso, as preocupações mais importantes sobre IA estão sendo abafadas por argumentos incongruentes, como o puritanismo tecnológico e a natureza da arte e do progresso. Muitos desses “argumentos” não têm substância – eles apenas exaltam as virtudes de ter a mente aberta sobre um futuro tecno-utópico, em vez de abordar as implicações éticas e legais nele contidas. Além disso, algumas das IAs, como MidJourney, sequer divulgam informações sobre os conjuntos de dados em que foram treinados. São caixas pretas e provavelmente mais empresas seguirão esse caminho para evitar reações do público informado.
Portanto não, as IAs não coletam referências da Internet da mesma forma que os artistas fazem, e eles as utilizam de maneiras que você, como pessoa física, não teria permissão para fazer. Você não teria os privilégios legais de uma pesquisa sem fins lucrativos quando se trata de coletar e utilizar obras protegidas por direitos autorais sem consentimento, muito menos utilizar isso para fins lucrativos. Na verdade você seria rapidamente penalizado por qualquer infração do gênero.
Um sistema ético
Então, como foi dito no início do post, não é difícil imaginar um gerador de texto para imagem justo e ético. Você poderia construí-lo com uma base de imagens de domínio público e creative commons, aprimorá-lo com imagens que sua empresa produz internamente, contratar artistas para criar imagens de treinamento para você ou compensar artistas que optarem por ter suas imagens adicionadas ao conjunto de dados.
Não vejo nada de errado com um modelo como esse. Seria mais fascinante e eficaz, permitindo que muita arte ainda fosse produzida por seres humanos. Além disso, eu também acredito que uma grande quantidade de artistas optaria por adicionar suas imagens ao projeto. Nesse sentido, por mais que essas empresas de IA queiram nos pintar com os chatos puritanos do passado, a maioria de nós usa e ama tecnologia. Estamos constantemente tentando coisas novas, experimentando e ficando animado com as estranhas reviravoltas do mundo.
Portanto, vamos acabar com esse roubo em massa de nosso trabalho criativo. Eu o encorajo a fazer mais pesquisas sobre como esses sistemas funcionam e como as empresas que os fabricam estão controlando a narrativa.
Caso queira uma abordagem mais filosófica do assunto, esse post aqui explora a relação entre IA e criatividade.
Boa semana a todos!
Fonte: Steve Zapata.