Big techs usam fotos publicadas de crianças para desenvolver reconhecimento facial

O MegaFace, que reúne mais de 4 milhões de fotos do Flickr, é um banco de dados usado por empresas como Google e Tencent para desenvolver machine learning

O BANCO FOI FORMADO A PARTIR DE FOTOS PUBLICADAS NO FLICKR (FOTO: GETTY IMAGES )

“É nojento e desconfortável”, diz Chloe Papa ao New York Times. “Eu gostaria que eles tivessem me perguntado primeiro se eu queria fazer parte disso”. Papa é uma das milhares de pessoas que tiveram suas fotos de infância usadas, sem consentimento, para treinar algoritmos de reconhecimento facial. O banco de dados MegaFace conta com mais de quatro milhões de fotos, de quase 700 mil pessoas. Empresas como Google e Tencent usam a plataforma para treinar seus softwares de inteligência artificial (IA).

O banco foi formado a partir de fotos publicadas no Flickr. Em 2014, o Yahoo usou fotos da plataforma para criar um banco público de mais de 100 milhões de fotos e vídeos. Segundo os criadores, o intuito era nivelar o setor de machine learning, já que empresas como Google e Facebook teriam vantagens em relação a outras companhias devido a quantidade de dados que detinham.

No entanto, esse banco de fotos públicas foi usado, em 2015, por Ira Kemelmacher-Shlizerman e Steve Seitz, professores de ciência da computação da Universidade de Washington, para criar o MegaFace. A universidade lançou o “desafio MegaFace” para que grupos de IA usassem o banco a fim de desenvolver tecnologias de reconhecimento facial. Na época, mais de 100 empresas participaram, incluindo Google, Tencent, SenseTime e NtechLab.

A plataforma de compartilhamento de fotos foi adotada pelas empresas, de olho na oportunidade de treinar os seus softwares com imagens de crianças – algo que não conseguem a partir de câmeras de segurança ou imagens online.

Segundo Adam Harvey, artista que rastreia bancos de dados, plataformas como o MegaFace são comuns: existem mais de 200 delas com milhões de fotos de aproximadamente um milhão de pessoas. Estes tipos de bancos de imagens são mais efetivos porque normalmente as imagens de câmeras de segurança estão em baixa qualidade e ao pegar da internet vem milhares de fotos de celebridades.

Mas, como aponta o NYT, as pessoas não foram contatadas ou deram permissão para que suas imagens fossem usadas pelo MegaFace. Além disso, a identidade das pessoas nas fotos é facilmente identificada. Cada foto ganha um número de identificação que leva à conta original do usuário no Flickr. E ainda por causa de um bug no sistema do Yahoo, mesmo as contas que foram apagadas ou estão no modo privado, podem ser acessadas.

“Absolutamente eu não teria deixado minhas fotos serem usadas em projetos de machine learning”, afirma Nick Alt, empreendedor que teve fotos que tirou de crianças usadas no MegaFace. “Eu me sinto um idiota por ter postado, mas eu fiz isso há 13 anos, antes que a privacidade fosse uma pauta.”

Segundo a universidade, as empresas só tinham permissão de usar os dados para “pesquisas não comerciais e propósitos educacionais”. Mas, de acordo com o NYT, recentemente Kemelmacher-Shlizerman vendeu uma empresa que edita fotos para o Facebook e tecnologia para criação de deepfakes. Ela ainda está trabalhando com o Google em um projeto intitulado “moonshot”.

O MegaFace continua disponível para download. A Universidade de Washington não quis comentar e disse que seus pesquisadores estão tocando outros projetos.

Possíveis consequências

As empresas correm o risco de serem processadas, dependendo das leis de cada estado nos Estados Unidos. Illinois, por exemplo, é o estado com a lei mais rígida sobre a privacidade dos seus cidadãos. Desde 2008, o estado tem a Lei de Privacidade da Informação Biométrica que proíbe estritamente entidades privadas de coletar, capturar, comprar ou obter a biometria de uma pessoa sem o seu consentimento.

Segundo estimativas do NYT, dentre as fotos no MegaFace, entre seis a 13 mil pessoas são possivelmente de Illinois. Cada foto teria sido usada por pelo menos dezenas de empresas, o que, de acordo com especialistas, pode resultar em ações bilionárias.

Desde 2015 mais de 200 ações pela Lei de Privacidade foram iniciadas em Illinois. O Facebook é uma das empresas que corre o risco de pagar US$ 35 bilhões por usar reconhecimento facial para marcar os usuários em fotos publicadas na rede social.

Mas, para Victor Balta, porta-voz da Universidade de Washington, o MegaFace está dentro da lei. “A universidade é uma universidade pública de pesquisa, não um órgão privado, e a lei de Illinois só é referente a entidades privadas”, diz.

FONTE: ÉPOCA