Categorias

A tecnologia por trás do deep fake de Deep Nostalgia

Quando Harry Potter chegou aos cinemas, os fãs do bruxinho conseguiram visualizar muito de seu mundo mágico que antes estava preso apenas nas páginas dos livros e na imaginação de quem lia. Um dos detalhes que ajudavam a construir essa fantasia era o conceito de fotos animadas, que funcionavam como pequenos clipes da pessoa fotografada. A ideia seria aproveitada e tornada real depois em alguns smartphones.

Aparentemente, não há limites para a tecnologia e outra proeza foi obtida no final de fevereiro usando uma combinação magistral de emoções, nostalgia e algoritmos de inteligência artificial. O sistema Deep Nostalgia do MyHeritage conseguiu o que antes parecia magia: trazer de volta à vida personalidades antigas e parentes falecidos, nem que fossem por treze segundos.

A nostalgia bate fundo…

A startup israelense MyHeritage foi fundada em 2003 e nesses quase vinte anos no ar se tornou um gigante no serviço de genealogia. Usuários do serviço podem criar árvores geneálogicas detalhadas, navegar por fotos dos membros da família, localizar parentes perdidos e mergulhar em seu próprio passado. Não é uma brincadeira: a empresa tem acesso a 13 bilhões de registros históricos e conta com 60 milhões de usuários no mundo todo, operando em 42 linguagens.

Seu sucesso mais recente é o aplicativo Deep Nostalgia que oferece uma premissa muito simples: ver, muito provavelmente pela primeira vez, como seria um parente antigo em toda sua glória, piscando os olhos, sorrindo, com expressões. O resultado pode impressionar.

Os usuários do serviço (gratuito, mas limitado na quantidade de transformações) precisam fazer o upload de uma foto antiga de seus entes queridos. A partir daí, a “mágica” passa a operar: utilizando aprendizado profundo de reconhecimento facial, são aplicados movimentos pré-determinados à imagem. São poucos segundos que trazem elementos e dinamismo que sequer existiam na foto original, seja na forma de dentes aparecendo em um sorriso ou o outro lado de um rosto, antes encoberto.

“Você terá um ‘momento incrível’ quando vir uma foto de família preciosa ganhar vida com Deep Nostalgia”, declarou Gilad Japhet, fundador e CEO of MyHeritage, e ele não estava exagerando.

“Ver os rostos de nossos amados ancestrais ganharem vida em uma simulação de vídeo nos permite imaginar como eles poderiam ter sido na realidade e fornece uma maneira nova e profunda de nos conectarmos com nossa história familiar”, completou o executivo.

O resultado obtido pelo programa gerou uma forte resposta emocional na internet. Muitos conseguiram ver ali o sorriso de uma avó, uma última manifestação de um falecido pai ou outras reações de igual impacto emocional. Até mesmo figuras históricas ou artísticas podem ser interpretadas pelos algoritmos, produzindo uma conexão inesperada com um passado remoto.

Como explica Hany Farid, diretor da School of Information na UC Berkeley, “A atração aqui é que as imagens visuais são viscerais e convincentes e nós respondemos a isso. Somos seres visuais. Quando você vê sua avó ou Mark Twain ganhando vida, há algo fascinante nisso.

“A maneira como nosso cérebro processa imagens de pessoas é diferente da de objetos inanimados. Ele se conecta ao circuito neural”, continua Farid. Entretanto, ele destaca que o efeito obtido com o Deep Nostalgia é surpreendente:  “durante anos, fomos capazes de sintetizar objetos inanimados, e isso engana completamente o sistema visual porque não temos noções preconcebidas de como eles se movem. Mas quando se trata de humanos, está atrasado. Parte disso é a maneira sutil como nos movemos e reconhecemos esses movimentos.”

Boa parte desse encantamento, entretanto, se dá por um fenômeno psicológico: o próprio desejo pela nostalgia. As distorções que ainda fazem parte do chamado Uncanny Valley da tecnologia são sublimadas diante da sensação de se estar diante de um resgate do passado. Testes conduzidos com fotos mais recentes (em relação às quais, inclusive, temos parâmetros de comparação) geram animações menos surpreendentes. Entretanto, para muitos que não veem seus entes queridos há anos ou mesmo décadas, o efeito emocional vence as limitações tecnológicas.

… mas só é possível com tecnologia do futuro

Ainda que parte dessa “mágica” aconteça em nosso cérebro, com uma boa dose de suspensão de descrença, há de se destacar que sua origem está na tecnologia. Ainda em 2006, meros três anos após sua fundação, a MyHeritage já investia em programas de reconhecimento facial para identificar possíveis parentes em seu banco de dados de fotografia.

Essa tecnologia evoluiu, assim como o volume do banco de dados. Em parceria com a também israelense D-ID foi possível empregar inteligência artificial para treinar algoritmos a partir de vídeos pré-gravados de pessoas vivas, movendo o rosto e realizando gestos, para identificar padrões. Esses vídeos são a base que direciona os movimentos e a animação das fotos digitalizadas.

“Gosto da parceria com eles porque ambos realmente nos preocupamos com a sensibilidade de animar as pessoas que não estão mais conosco,” declarou Gil Perry, um dos fundadores e CEO da D-ID.

Ele acredita que sua empresa conseguiu finalmente quebrar a grande barreira da mídia sintética, após anos de pesquisa. “Com a mídia sintética, você atinge um nível em que parece bom, mas o espectador ainda sente que algo está errado”, declarou. Porém, Perry conclui: “conseguimos cruzar o Uncanny Valley e criar uma mídia sintética perfeita”.

Antes do processo começar, para obter resultados melhores, as fotos são aperfeiçoadas, também de forma automática através do sistema Photo Enhancer criado pela MyHeritage previamente. Esse tratamento permite que imagens de baixa qualidade, tiradas em outras épocas, com desfoque ou baixa resolução, sejam melhoradas com maior contraste e maior resolução. A partir daí, Deep Nostalgia seleciona automaticamente o melhor modelo para cada face, baseando-se em sua orientação.

Então, é gerado um vídeo com compressão MP4 que pode ser baixado pelo usuário ou compartilhado nas redes sociais.

No site oficial do MyHeritage, figuras históricas como a Rainha Vitória ou Florence Nightingale já haviam passado por processos semelhantes, em testes iniciais da tecnologia, antes de ela se tornar pública. No começo desse ano, o ex-Presidente norte-americano Abraham Lincoln teve uma foto colorizada, animada e ganhou voz em um vídeo publicado no YouTube usando essas tecnologias, que agora estão acessíveis a todos os usuários.

Porém, há riscos envolvidos

Para muitos, esse aparentemente inofensivo truque de salão é mais um degrau na escalada da ameaça da mídia sintética. Ao mesmo tempo em que a tecnologia se populariza, cresce a preocupação de especialistas e autoridades à respeito. No momento, a comissão de justiça do Reino Unido estuda propostas que tornariam ilegal a criação de vídeos deep fakes sem o consentimento da pessoa representada.

A própria MyHeritage tem consciência do potencial nocivo dessas ferramentas. A empresa israelense alega que não incluiu e nem incluirá um recurso de fala no programa “para evitar abusos, como a criação de vídeos falsos de pessoas vivas”.

Para Hany Farid, “o setor de tecnologia tem feito coisas porque pode e não porque deveria. Precisamos parar de construir coisas porque são legais e começar a fazer essas perguntas difíceis antes que seja tarde demais”.

Esse ponto de virada, de acordo com o especialista, pode ser justamente agora, quando a tecnologia se torna tão boa que nossas emoções ignoram os sinais claros de falsificação, um efeito que já foi testado e repetido à exaustão com as fake news.

É apenas uma questão de tempo até que outro programa, desenvolvido ou não pela MyHeritage, nos traga uma fidelidade ainda maior de vídeo e sejamos capazes até mesmo de “interagir” com aqueles que já se foram. Uma tecnologia com essas características iria trazer todo um conjunto de questões éticas ou de segurança para as quais ainda não temos respostas.

Não, Tom Cruise não está no TikTok. É um Deep Fake…

Avivah Litan, analista de segurança e privacidade do grupo Gartner, ecoa esse alerta. Ele aponta que o Deep Nostalgia não é a única oferta no mercado e é relativamente fácil gerar deep fakes atualmente. Eles não estão mais nos laboratórios ou nos estúdios de produtoras de vídeo. “Os serviços estão disponíveis na Internet. Você pode ir buscá-los”, afirma a analista.

“No momento, está sendo usado principalmente na indústria pornográfica para pornografia de vingança. A indústria pornográfica sempre lidera em inovação”, explica Litan.

Entretanto, mais do que uma ferramenta saudosista ou um instrumento pornográfico, ou mesmo uma máquina de manipulação política e/ou ideológica, o deep fake também traz o risco de tornar obsoleta boa parte de nossa biometria.

Aviva Litan avisa: “falsificações profundas tornarão a maioria das autenticações e verificações biométricas inúteis, pois os criminosos podem facilmente imitar as vozes, imagens e vídeos do usuário. A maior parte da autenticação biométrica de usuário existente deve ser atualizada para incorporar tecnologias que possam detectar a presença de um impostor falso e garantir a presença de um usuário legítimo”.

Para complicar ainda mais o cenário que se aproxima, até mesmo a detecção automática desse tipo de mídia sintética tem se mostrado inconsistente.  “A taxa de detecção provavelmente terminará em 50 por cento, mas mesmo agora o Facebook tem sido apenas 65 por cento preciso na detecção de falsificações profundas,” alerta Litan. E completa: “é uma grande ameaça crescendo no horizonte”.