> >
'As pessoas têm que ser preparadas para diferenciar verdadeiro e falso'

"As pessoas têm que ser preparadas para diferenciar verdadeiro e falso"

Responsável por criar "deepfakes" de humor, montagens de vídeo em que são inseridos rostos em corpos alheios, fala sobre o sucesso na internet e o risco da tecnologia ser usada para manipular informação

Publicado em 3 de agosto de 2019 às 00:35

Ícone - Tempo de Leitura 0min de leitura

Você provavelmente já viu vídeos na internet do presidente Jair Bolsonaro como Elizabeth II, a rainha da Inglaterra, e do ministro da Justiça, Sérgio Moro, como uma melindrosa. Eles são obra do mineiro Bruno Sartori, de 30 anos, e utilizam a chamada “deepfake”, uma tecnologia que usa inteligência artificial para modificar o rosto de pessoas em vídeos. Assim é possível inserir a face de políticos, além das vozes, em cenas de dança, por exemplo. A técnica de montagem aplicada com crítica política e bom humor tem conquistado as pessoas por meio das redes sociais. Responsável pela criação e disseminação, Bruno é jornalista, editor de mídias digitais e deepfaker.

O primeiro vídeo que fez sucesso na internet foi publicado no dia 18 de maio deste ano. Na ocasião, Bolsonaro incorpora o Chapolin Colorado durante discurso que fez em viagem aos Estados Unidos. Somente no Twitter, havia 705 mil visualizações até o dia 1º de agosto. Bruno também fez um vídeo para o Gazeta Online. 

Com a publicação das deepfakes nas redes sociais, desde maio, Bruno saltou de 300 seguidores para 38,6 mil no Instagram, e os números também não param de crescer no Twitter (nas duas redes, o perfil é @brunnosarttori). O Gazeta Online conversou com ele, que mora em Unaí, interior de Minas Gerais. Bruno conta que a deepfake foi uma forma encontrada para potencializar o trabalho já realizava desde os 15 anos, de crítica usando o bom humor. Antes, suas criações eram feitas com charges e com personagens da política da região onde vive. Em entrevista para o Gazeta Online, ele falou sobre como são feitas as montagens e como é possível identificar que um vídeo não é real

O que é deepfake?

É um vídeo que usa a tecnologia de inteligência artificial (que imita a humana por mecanismos ou software) para a substituição de rostos. Os vídeos não são reais, mas são realistas e colocam pessoas em situações que não viveram e fazendo algo que não fizeram.

Como isso é feito?

O primeiro passo é reunir um conjunto de fotos e guardá-las no banco de dados. A gente busca vídeos das pessoas que irão substituir o rosto original e extrai deles diversas imagens. Quanto mais e diferentes forem, melhor. O meu banco de imagens do Bolsonaro, por exemplo, tem cerca de 6 mil itens. Então, utilizamos o algoritmo de inteligência artificial para analisar as fotos do banco de dados e fazer um “treinamento do programa”. O computador analisa essas imagens e aprende como elas funcionam e depois é capaz de inseri-las com bastante realismo em qualquer local. A cada posição desses rostos, a programação atribui um número e calcula como se comportariam em outro posicionamento. A partir daí, o vídeo vai sendo composto.

Quanto tempo leva para fazer?

Eu comecei com esses vídeos há um ano e seis meses. Eu levava 30 dias para treinar um rosto (quando as imagens já foram analisadas e há um arquivo com os códigos matemáticos). Hoje, com o mesmo equipamento, eu levo quatro dias para ter um “rosto aceitável”. Quando o rosto está treinado, é mais rápido de inserir no vídeo. Após a inserção, é possível fazer a pós-produção para corrigir as imperfeições.

Como a deepfake surgiu?

O termo deepfake surgiu em dezembro de 2017, quando um usuário que usava esse nome, num fórum da internet chamado Reddit, usou a inteligência artificial para trocar o rosto de pessoas em vídeos pornográficos. Naquele ano os resultados eram ruins, mas já impressionantes. Como era um código aberto (software cujo código está disponível para download por qualquer pessoa na internet), outros usuários que entendem de programação trabalharam para melhorar a tecnologia. Atualmente, somente com essa tecnologia ainda dá para perceber que o vídeo é falso, por isso é preciso fazer a edição para corrigir as falhas.

Qualquer pessoa pode fazer uma deepfake?

Hoje não é preciso entender de programação. Só que ainda existem limitadores, como a placa de vídeo de um computador (componente responsável por administrar e controlar as funções de exibição de vídeo na tela). A minha placa de vídeo custa no mercado R$ 4 mil reais, um usuário comum não tem isso em casa. Ele até consegue fazer o vídeo, mas vai demorar muitos dias e as imagens podem sair com imperfeições. Para ter o primeiro vídeo com qualidade aceitável, eu demorei seis meses.

Como identificar se o vídeo é uma deepfake?

Há inteligência artificial sendo desenvolvida para detectar se o vídeo é falso ou não, alguns pesquisadores universitários estão estudando isso. Mas detectar é relativamente fácil: é preciso observar a imagem. Um das dicas é olhar a diferença de nitidez do corpo e do rosto; o segundo fica mais embaçado. Outro ponto são os olhos, você quase não vê os cílios; a boca fica mais embaçada que o restante do rosto.

As deepfakes podem ser perigosas se usadas por gente má intencionada, não é mesmo?

Minha preocupação principal é com o uso dessa tecnologia para a pornografia, isso vai prejudicar muitas mulheres. Em segundo lugar, me preocupo com as fake news que podem ser criadas com vídeos. O que ainda “entrega” a deepfake é que ela copia apenas o rosto, então, se quer copiar completamente o Bolsonaro, tem que arrumar um dublê com um biotipo parecido também.

Nas últimas eleições houve muito problema com a disseminação de fake news. Nas próximas eleições as deepfakes podem ser um problema?

Depende. Se as pessoas não tiverem conhecimento de que existe a deepfake, isso pode ser um problema porque podem acreditar no vídeo. É preciso divulgar que a deepfake existe, porque muita gente pode se especializar no assunto e as pessoas têm que ser preparadas para saber diferenciar o que é verdadeiro e o que é falso. Um problema é que, se esse extremismo que ocorre no Brasil hoje não for amenizado, por mais que exista a instrução, as pessoas vão acreditar no que querem.

Você já foi procurado para desvendar algum caso ou fazer um “trabalho sujo”?

Muitas vezes. As pessoas queriam me pagar para fazer vídeos de políticos em situações constrangedoras, algumas ainda me pediam exclusividade. Eu não faço esse material, é antiético. Acredito que o profissional que trabalha com deepfake vai ser valorizado, mas terá mais destaque ainda aquele que souber desvendar a autenticidade ou não desse vídeo. No último workshop que participei, em São Paulo, havia um professor que trabalha com inteligência artificial que foi procurado pela Polícia Federal para desvendar se era mesmo uma autoridade que estava fazendo sexo com uma criança. Conseguiram provar que era falso.

Como é o lado positivo das deepfakes?

Elas podem ser usadas para inúmeras coisas. No futuro, os filmes poderão não ser somente dublados em português, poderão ter gestual de brasileiro. Além disso, terá tecnologia no futuro para copiar a voz original do ator nessa dublagem. O profissional que trabalhar com esse tipo de produção vai fazer com que o ator fale em qualquer idioma. Também poderemos gravar clipes com cantores que já morreram, como Raul Seixas. Podemos fazer com que ele “esteja presente” no clipe.

É um mercado promissor?

Sem dúvida. Quem chegar a trabalhar num filme todo gesticulado “em outra língua” vai ser valorizado. Os profissionais que trabalham com produção de vídeo também serão procurados. Se a família do Raul Seixas quiser trazê-lo à vida para regravar as músicas, será possível. Um artista já me procurou porque não tem tempo de gravar comerciais para algumas marcas, eles vão buscar um ator com o mesmo biotipo dele para inserir o rosto. Assim, usa a imagem do artista original sem que ele precise estar presente na gravação.

Hoje você faz críticas na internet através do humor. Por quê?

Quando eu conheci a tecnologia vi que ela era utilizada para pornografia e fiquei assustado porque sabia que ela seria promissora. Desde os meus 15 anos eu edito vídeos e trabalho com humor político, fazia isso através de charges com pessoas locais. Com a tecnologia, sabia que ela poderia melhorar o meu trabalho, por ser mais realista que as charges. Passei a estudar, o primeiro vídeo que estourou foi o do Chapolin Colorado com o rosto do Bolsonaro. Naquele dia, o presidente tinha errado o slogan do governo federal (o correto é “Brasil acima de tudo, Deus acima de todos”; o presidente disse “o Brasil acima de sempre” e gaguejou) e, para mim, era parecido com o Chapolin Colorado que tinha mania de errar o próprio ditado. Eu enviei para o chargista Maurício Ricardo, com quem já converso há um bom tempo. Ele também compartilhou em suas redes sociais.

No Brasil tem mais gente trabalhando na área?

Eu não conheço. Há cerca de 65 dias eu produzo esses vídeos para a internet e ainda não vi ninguém fazendo algo semelhante. Hoje ainda é algo limitador porque depende de uma boa placa de vídeo, é preciso saber as imagens que serão usadas, quantas e as configurações, por exemplo. Já pensei em ensinar, mas tenho medo de usarem para o lado negativo. Então, eu prefiro que ainda exista um “filtro” de pessoas que façam deepfakes.

Você já foi atacado nas redes devido ao que produz?

Meus vídeos são todos de teor político, quem se sente atacado procura algum meio para me atingir. Uma vez fizeram uma imagem minha no corpo de uma mulher utilizando o photoshop, a resposta que eu dei foi com um deepfake com o meu rosto num corpo de mulher. O que me preocupa mais, na verdade, é que eu não tenho nenhuma conta verificada pelas redes sociais, que sinalize que o meu perfil é o real. Assim, fica difícil apontar para as pessoas onde estão os verdadeiros conteúdos produzidos por mim.

Atualmente, você está fazendo uma vaquinha na internet de R$ 20 mil para comprar um novo computador. Isso irá melhor as deepfakes produzidos?

A minha placa de vídeo hoje tem uma velocidade alta em relação a de um usuário comum. Com ela, gasto de quatro a cinco dias para treinar um rosto. Quando surge uma nova temática para fazer, por mais rápido que eu já tenha treinado o rosto, vou demorar cerca de sete horas para fazer um vídeo. O computador que eu quero comprar tem uma placa 10 vezes mais rápida para esse procedimento. Assim, terei duas máquinas para treinar, ou seja, quando uma estiver treinando posso editar na outra. Hoje, não consigo fazer os dois ao mesmo tempo.

Este vídeo pode te interessar

 

Notou alguma informação incorreta no conteúdo de A Gazeta? Nos ajude a corrigir o mais rapido possível! Clique no botão ao lado e envie sua mensagem

Envie sua sugestão, comentário ou crítica diretamente aos editores de A Gazeta

A Gazeta integra o

The Trust Project
Saiba mais