Novidade!!
Instale e experimente nosso App exclusivo para celulares Android, é grátis!
Clique Aqui

Início Rumo a Nova Humanidade Tecnologia #TECNOLOGIA – Reconhecimento Facial ‘segredinho maldoso’: Milhões de fotos online nas redes...

#TECNOLOGIA – Reconhecimento Facial ‘segredinho maldoso’: Milhões de fotos online nas redes sociais estão sendo digitalizadas sem consentimento

317
0

Centenas de milhares de rostos de pessoas nas redes sociais, estão sendo usados ​​sem a permissão delas, para alimentar a tecnologia que poderia eventualmente ser usada para vigiá-los, dizem especialistas legais.
Ilustração da foto de pontos do reconhecimento da cara em fotos de Flickr.

O reconhecimento facial pode registrar você no seu iPhone, rastrear criminosos por meio de multidões e identificar clientes fiéis nas lojas.

A tecnologia – que é imperfeita, mas está melhorando rapidamente – é baseada em algoritmos que aprendem como reconhecer rostos humanos e as centenas de maneiras pelas quais cada um é único.

Para fazer isso bem, os algoritmos devem ser alimentados com centenas de milhares de imagens de uma matriz diversificada de faces. Cada vez mais, essas fotos vêm da Internet, onde são varridas por milhões sem o conhecimento das pessoas que as publicaram, categorizadas por idade, sexo, tom de pele e dezenas de outras métricas, e compartilhadas com pesquisadores em universidades e  empresas.

À medida que os algoritmos se tornam mais avançados – o que significa que eles são mais capazes de identificar mulheres e pessoas de cor, uma tarefa com a qual historicamente lutaram – especialistas legais e defensores dos direitos civis estão soando o alarme no uso de fotos de pessoas comuns por pesquisadores. Os rostos dessas pessoas estão sendo usados ​​sem o seu consentimento, a fim de alimentar a tecnologia que poderia eventualmente ser usada para vigiá-los.

Essa é uma preocupação especial para as minorias que poderiam ser perfiladas e direcionadas, dizem os especialistas e defensores.

“Esse é o segredinho maldoso dos conjuntos de treinamento de Inteligencias Artificiais. 

Pesquisadores geralmente pegam as imagens que estão disponíveis na natureza ”, disse Jason Schultz, professor da NYU School of Law.

A mais recente empresa a entrar nesse território foi a IBM, que em janeiro divulgou uma coleção de quase um milhão de fotos que foram tiradas do site de hospedagem de fotos Flickr e codificadas para descrever a aparência dos assuntos. A IBM promoveu a coleta para pesquisadores como um passo progressivo para reduzir o viés no reconhecimento facial.

Mas alguns dos fotógrafos cujas imagens foram incluídas no conjunto de dados da IBM ficaram surpresos e desconcertados quando a NBC News disse a eles que suas fotografias foram anotadas com detalhes incluindo geometria facial e tom de pele e podem ser usadas para desenvolver algoritmos de reconhecimento facial. (A NBC News obteve o conjunto de dados da IBM de uma fonte depois que a empresa se recusou a compartilhá-lo, dizendo que ele poderia ser usado apenas por grupos de pesquisa acadêmicos ou corporativos.)

“Nenhuma das pessoas que eu fotografei teve a menor idéia de que suas imagens estavam sendo usadas dessa maneira”, disse Greg Peverill-Conti, executivo de relações públicas de Boston que tem mais de 700 fotos na coleção da IBM, conhecido como “conjunto de dados de treinamento”. “

“Parece um pouco incompleto que a IBM possa usar essas imagens sem dizer nada a ninguém”, disse ele.

John Smith, que supervisiona a pesquisa de inteligência artificial na IBM, disse que a empresa está comprometida em “proteger a privacidade dos indivíduos” e “trabalhará com quem solicitar que uma URL seja removida do conjunto de dados”.

Apesar das garantias da IBM de que os usuários do Flickr podem optar por sair do banco de dados, a NBC News descobriu que é quase impossível remover fotos. A IBM exige que os fotógrafos enviem links por e-mail para as fotos que desejam remover, mas a empresa não compartilhou publicamente a lista de usuários e fotos do Flickr incluídos no conjunto de dados, portanto não há maneira fácil de descobrir quais fotos estão incluídas. 

A IBM não respondeu a perguntas sobre esse processo.

Para ver se suas fotos do Flickr fazem parte do conjunto de dados, insira seu nome de usuário em uma ferramenta NBC News criada com base no conjunto de dados da IBM:

A IBM diz que seu conjunto de dados foi desenvolvido para ajudar pesquisadores acadêmicos a tornar a tecnologia de reconhecimento facial mais justa. 

A empresa não está sozinha no uso de fotos publicas disponíveis na internet dessa maneira. 

Dezenas de outras organizações de pesquisa coletaram fotos para treinamento de sistemas de reconhecimento facial, e muitas das coleções maiores e mais recentes foram extraídas da web.

Alguns especialistas e ativistas argumentam que isso não é apenas uma violação da privacidade de milhões de pessoas cujas imagens foram varridas – também levanta preocupações mais amplas sobre a melhoria da tecnologia de reconhecimento facial e o medo de que ela seja usada por lei. agências de aplicação para atingir de forma desproporcional as minorias.

“As pessoas deram seu consentimento para compartilhar suas fotos em um ecossistema de internet diferente”, disse Meredith Whittaker, codiretora do AI Now Institute, que estuda as implicações sociais da inteligência artificial. “Agora eles estão sendo involuntariamente ou sem saber, envolvidos no treinamento de sistemas que poderiam potencialmente ser usados ​​de maneira opressiva contra suas comunidades.”

COMO O RECONHECIMENTO FACIAL EVOLUIU

Nos primórdios da construção de ferramentas de reconhecimento facial, os pesquisadores pagavam às pessoas para irem a seus laboratórios, assinar formulários de consentimento e tirar fotos em diferentes poses e condições de iluminação. 

Como isso era caro e demorado, os conjuntos de dados iniciais eram limitados a algumas centenas de indivíduos.

Com o surgimento da web durante os anos 2000, os pesquisadores de repente tiveram acesso a milhões de fotos de pessoas.

De Stock: Povos seguidos através da tecnologia facial do reconhecimento
O Amazon Rekognition permite aos usuários rastrear pessoas através de um vídeo, mesmo quando seus rostos não estão visíveis. Amazon

“Eles entrariam em um mecanismo de busca, digitariam o nome de uma pessoa famosa e baixariam todas as imagens”, disse P. Jonathon Phillips , que coleciona conjuntos de dados para medir o desempenho de algoritmos de reconhecimento facial para o Instituto Nacional de Padrões e Tecnologia. . “No início, essas pessoas tendem a ser pessoas famosas, celebridades, atores e esportistas.”

À medida que a mídia social e o conteúdo gerado pelo usuário assumiam, as fotos de pessoas comuns estavam cada vez mais disponíveis. Pesquisadores trataram isso como uma galeria livre de copia de rostos em vídeos do YouTube e imagens no Facebook, Google Images, Wikipedia e bancos de dados.

 

Os acadêmicos geralmente apelam para a natureza não comercial de seu trabalho para contornar questões de direitos autorais. O Flickr tornou-se um recurso atraente para os pesquisadores de reconhecimento facial porque muitos usuários publicaram suas imagens sob licenças “Creative Commons”, o que significa que outras pessoas podem reutilizar suas fotos sem pagar taxas de licenciamento. Algumas dessas licenças permitem uso comercial.

Para construir seu banco de dados Diversity in Faces, a IBM diz que recolheu uma coleção de 100 milhões de imagens publicadas com licenças Creative Commons que o proprietário do Flickr, o Yahoo, lançou como um lote para download de pesquisadores em 2014 . 

A IBM reduziu esse conjunto de dados a cerca de 1 milhão de fotos de faces que foram anotadas, usando codificação automatizada e estimativas humanas, com quase 200 valores para detalhes como medidas de características faciais, pose, tom de pele e idade e sexo estimados, de acordo com o conjunto de dados obtido pela NBC News.

De Stock: Medidas de reconhecimento facial
A IBM calculou dezenas de medições para cada face incluída no conjunto de dados. IBM

É um estudo de caso único em um mar de conjuntos de dados retirados da web. De acordo com o Google Scholar, centenas de artigos acadêmicos foram escritos na parte de trás dessas enormes coleções de fotos – que têm nomes como MegaFace , CelebFaces e Faces in the Wild – contribuindo para grandes avanços na precisão das ferramentas de reconhecimento facial e análise. 

Era difícil encontrar acadêmicos que falassem sobre as origens de seus conjuntos de dados de treinamento; muitos avançaram suas pesquisas usando coleções de imagens extraídas da web sem licenciamento explícito ou consentimento informado.

Os pesquisadores que criaram esses conjuntos de dados não responderam aos pedidos de comentários.

COMO A IBM ESTÁ USANDO O BANCO DE DADOS DE FACES

A IBM lançou sua coleção de imagens anotadas para outros pesquisadores, para que possa ser usada para desenvolver sistemas de reconhecimento facial “mais justos”. Isso significa que os sistemas podem identificar com mais precisão pessoas de todas as raças, idades e sexos.

“Para que os sistemas de reconhecimento facial tenham o desempenho desejado e os resultados se tornem cada vez mais precisos, os dados de treinamento devem ser diversos e oferecer uma cobertura ampla”, disse John Smith , da IBM , em um post no blog anunciando a divulgação dos dados .

O conjunto de dados não vincula as fotos dos rostos das pessoas a seus nomes, o que significa que qualquer sistema treinado para usar as fotos não seria capaz de identificar indivíduos nomeados. Mas os defensores da liberdade civil e os pesquisadores de ética tecnológica ainda questionaram os motivos da IBM, que tem uma história de vender ferramentas de vigilância que foram criticadas por infringirem as liberdades civis.

Por exemplo, após os ataques de 11 de setembro, a empresa vendeu tecnologia para o departamento de polícia da cidade de Nova York, que permitia a pesquisa de feeds de CCTV para pessoas com determinados tons de pele ou cor de cabelo . A IBM também lançou um produto de “análise de vídeo inteligente” que usa vigilância de câmeras corporais para detectar pessoas por tags de “etnicidade”, como asiático, preto ou branco.

A IBM disse em um email que os sistemas “não são inerentemente discriminatórios”, mas acrescentou: “Acreditamos que tanto os desenvolvedores desses sistemas quanto as organizações que os implementam têm a responsabilidade de trabalhar ativamente para mitigar o preconceito. É a única maneira de garantir que os sistemas de IA ganhem a confiança de seus usuários e do público. A IBM aceita totalmente essa responsabilidade e não participaria de trabalhos envolvendo perfis raciais ”.

Hoje, a empresa vende um sistema chamado IBM Watson Visual Recognition, que a IBM diz que pode estimar a idade e o sexo de pessoas representadas em imagens e, com os dados de treinamento corretos, pode ser usado por clientes para identificar pessoas específicas de fotos ou vídeos .

A NBC News perguntou à IBM quais dados de treinamento o IBM Watson usava para suas habilidades de reconhecimento facial comercial, apontando para um post no blog da empresa que afirmava que o Watson é “transparente sobre quem treina nossos sistemas de IA, quais dados foram usados ​​para treinar esses sistemas”. que usa dados “adquiridos de várias fontes” para treinar seus modelos de IA, mas não divulga publicamente esses dados para “proteger nossas percepções e propriedade intelectual”.

A IBM disse em declarações públicas e diretamente à NBC News que o conjunto de dados Diversity in Faces é puramente para pesquisa acadêmica e não será usado para melhorar as ferramentas comerciais de reconhecimento facial da empresa. Isso parece entrar em conflito com a afirmação da empresa em janeiro de que o lançamento do conjunto de dados é uma resposta direta à pesquisa de Joy Buolamwini, do MIT, que mostrou que a tecnologia de reconhecimento facial comercial da IBM era muito pior na identificação precisa de mulheres de pele mais escura do que homens esfolados .

Quando perguntado sobre este conflito, e particularmente sobre como o conjunto de dados Diversity in Faces pode ter um impacto real na redução do preconceito se a IBM não o estiver usando em produtos de reconhecimento facial comercial, Smith disse em um e-mail que “os aprendizados científicos sobre diversidade facial irá avançar nossa compreensão e nos permitirá criar sistemas mais justos e precisos na prática. ”

“Reconhecemos que o viés social não é necessariamente algo que podemos abordar completamente com a ciência, mas nosso objetivo é abordar o viés matemático e algorítmico”, disse Smith.

Os especialistas observam que a distinção entre as alas de pesquisa e as operações comerciais de corporações como a IBM e o Facebook é tremida. Por fim, a IBM possui qualquer propriedade intelectual desenvolvida por sua unidade de pesquisa.

Mesmo quando algoritmos são desenvolvidos por pesquisadores acadêmicos que usam conjuntos de dados não comerciais, esses algoritmos são frequentemente usados ​​por empresas, disse Brian Brackeen, CEO da Kairos.

Como uma analogia, ele disse, “pense nisso como a lavagem de dinheiro do reconhecimento facial. Você está lavando os direitos de IP e privacidade dos rostos ”.

A IBM disse que não usaria o conjunto de dados Diversity in Faces dessa maneira.

FOTÓGRAFOS DIVIDIDOS NO CONJUNTO DE DADOS DA IBM

Um fotógrafo e empreendedor austríaco, Georg Holzer, enviou suas fotos para o Flickr para lembrar grandes momentos com sua família e amigos, e usou as licenças Creative Commons para permitir que organizações sem fins lucrativos e artistas usassem suas fotos gratuitamente. Ele não esperava que mais de 700 de suas imagens fossem varridas para estudar a tecnologia de reconhecimento facial.

“Eu sei sobre os danos que tal tecnologia pode causar”, disse ele ao Skype, depois que a NBC News informou que suas fotos estavam no banco de dados da IBM. “É claro que você nunca pode esquecer os bons usos do reconhecimento de imagens, como encontrar fotos de família mais rapidamente, mas também pode ser usado para restringir direitos fundamentais e privacidade. Eu nunca posso aprovar ou aceitar o uso generalizado de tal tecnologia. ”

Imagem: Uma foto do Flickr por Georg Holzer.
Uma foto do Flickr por Georg Holzer incluída no conjunto de dados da IBM. Georg Holzer / Flickr

Holzer estava preocupado que uma empresa como a IBM – até mesmo sua divisão de pesquisa – tivesse usado fotos que ele publicou sob uma licença não comercial.

“Desde que eu assumo que a IBM não é uma organização de caridade e no final do dia quer ganhar dinheiro com esta tecnologia, isso é claramente um uso comercial”, disse ele.

Dolan Halbrook, que está baseado em Portland, Oregon, e tem 452 fotos no conjunto de dados, concordou que a IBM deveria ter pedido sua permissão.

“Estou irritado com eles sendo usados ​​sem notificação prévia e uma chance de rever quais seriam incluídos”, disse Halbrook. “Sou ambivalente sobre melhorar a tecnologia em si.”

Imagem: Uma foto do Flickr por Greg Peverill-Conti
Uma foto do Flickr por Greg Peverill-Conti incluída no conjunto de dados da IBM. Greg Peverill-Conti / Flickr

Outros fotógrafos ficaram contentes em saber que suas imagens podem ser usadas para avançar no campo do reconhecimento facial.

“Reconhecimento facial é uma daquelas coisas que não podemos deixar de inventar, então ter um sistema confiável é melhor do que aquele que gera erros e identificações falsas”, disse Neil Moralee, um consultor de alimentos e fotógrafo baseado no Reino Unido, especializado em retratos.

Imagem: Uma foto do Flickr por Sebastian Gambolati.
Uma foto do Flickr por Sebastian Gambolati incluída no conjunto de dados da IBM. Sebastian Gambolati / Flickr

Guillaume Boppe, da Suíça, concordou. “Se as fotos de caras que eu tiro estão ajudando a IA a melhorar, reduzindo a falsa detecção e, finalmente, melhorando a segurança global, eu estou bem com isso”, disse ele.

Sebastian Gambolati, da Argentina, estava feliz em contribuir para uma tecnologia mais precisa para encontrar pessoas desaparecidas ou rastrear criminosos, mas ele disse que seria “legal se eles pedissem”.

“Na minha conta do Flickr, há muitas fotos tiradas de pessoas em eventos que não são próximos de mim”, ele disse, “e não sei o que eles acham da empresa usando suas fotos sem o consentimento deles”.

POUCAS OPÇÕES PARA RECUSAR

A IBM oferece um modelo de opt-out: as pessoas podem entrar em contato com a IBM com links individuais para fotografias que desejam remover do conjunto de dados – tanto os que pegaram quanto os que são mostrados – e a IBM diz que os removerá, de acordo com seus dados. aviso de privacidade . “no entanto, não há nenhuma maneira fácil de saber se estão em destaque no conjunto de dados, e até mesmo se você descobrir que você é, a IBM disse que não vai remover fotos com base em sua ID de usuário do Flickr, a menos que você também tem ligações para cada uma das fotografias.

Quando a NBC News alertou um fotógrafo, que pediu para não ser identificado por razões de privacidade, que mais de 1.000 de suas fotos foram incluídas no conjunto de dados da IBM, ele tentou recusar enviando à IBM seu ID de usuário do Flickr. A IBM disse a ele que nenhuma de suas fotos estava no banco de dados, de acordo com um e-mail visto pela NBC News. Quando a NBC News compartilhou links específicos para algumas de suas fotos no banco de dados da IBM, a empresa culpou um “erro de indexação” por sua incapacidade inicial de confirmar que suas imagens foram incluídas. Após mais de uma semana, a IBM confirmou que havia removido as quatro fotos tinha fornecido links para. De acordo com a análise da NBC News, ele ainda tem 1.001 fotos no conjunto de dados.

Smith, da IBM, disse em uma declaração que todas as solicitações de remoção de URL foram concluídas.

Mesmo depois que uma imagem é removida do conjunto de dados da IBM, ela não será removida das versões do conjunto de dados já compartilhadas com parceiros de pesquisa (cerca de 250 organizações solicitaram acesso até agora), disse a IBM. Nem será removido do conjunto de dados subjacente do Flickr.

Para aqueles apanhados no conjunto de dados da IBM ou em outros semelhantes, isso faz com que a noção de optar por sair pareça sem esperança.

Pode, no entanto, haver recurso legal em algumas jurisdições graças ao aumento das leis de privacidade, reconhecendo o valor único das fotos dos rostos das pessoas. Sob o Regulamento Geral de Proteção de Dados da Europa, as fotos são consideradas “informações pessoais confidenciais” se forem usadas para confirmar a identidade de um indivíduo. Moradores da Europa que não querem seus dados incluídos podem pedir à IBM que os exclua. Se a IBM não obedecer, eles podem reclamar com a autoridade de proteção de dados de seu país, que, se as fotos específicas caírem na definição de “informações pessoais confidenciais”, poderá aplicar multas contra empresas que violarem a lei.

Nos EUA, alguns estados têm leis que podem ser relevantes. 

De acordo com a Lei de privacidade de informações biométricas de Illinois, por exemplo, pode ser uma violação capturar, armazenar e compartilhar informações biométricas sem o consentimento por escrito de uma pessoa. De acordo com o ato, a informação biométrica inclui impressões digitais, imagens da íris e geometria do rosto.

“Este é o tipo de coleta em massa e uso de dados biométricos que podem ser facilmente abusados, e parece estar ocorrendo sem o conhecimento daqueles nas fotos”, disse Jay Edelson, um advogado de ação coletiva de Chicago processando atualmente o Facebook. para o uso de ferramentas de reconhecimento facial .

Até agora nenhuma dessas leis foi rigorosamente testada.

A IBM se recusou a comentar sobre as leis.

“INCRIVELMENTE OPRESSIVO QUANTO MAIS PRECISO É OBTIDO”

Além das questões de privacidade, uma grande questão permanece: os sistemas de reconhecimento facial mais precisos são realmente mais “justos”? E é possível que o reconhecimento facial seja justo?

“Você realmente tem uma situação de rock-and-hard-place acontecendo aqui”, disse Woody Hartzog , professor de direito e ciência da computação na Northeastern University. “O reconhecimento facial pode ser incrivelmente prejudicial quando é impreciso e incrivelmente opressivo quanto mais preciso ele é.”

Embora existam usos benignos para o reconhecimento facial, ele também pode ser usado para monitorar e direcionar pessoas de cor e outras comunidades vulneráveis ​​e minoritárias . Os bancos de dados de reconhecimento facial de mugshots são mais propensos a incluir afro-americanos, latinos e imigrantes, uma vez que esses grupos são alvo de práticas de policiamento tendenciosas, dizem grupos de direitos civis. Isso significa que essas pessoas são muito mais “localizáveis” pela tecnologia de reconhecimento facial , mesmo que tenham sido presas erroneamente quando foram tiradas as fotos.

O uso de sistemas de vigilância de reconhecimento facial pela aplicação da lei é tão controverso que uma coalizão de mais de 85 grupos de justiça racial e direitos civis pediu que as empresas de tecnologia se recusem a vender a tecnologia aos governos. Esses grupos argumentam que a tecnologia exacerba o “viés histórico e existente” que prejudica comunidades que já são “super policiadas e super-vigiadas”.

“Esses sistemas estão sendo implantados em contextos opressivos, muitas vezes pela aplicação da lei”, disse Whittaker, do AI Now Institute, “e o objetivo de torná-los mais capazes de vigiar alguém é um que devemos analisar com muita ceticismo”.

FONTE

Tradução: Gooel Tradutos

Revisão: SR.Black

Compartilhe esse conhecimento com seus amigos(as)…

 

DEIXE UMA RESPOSTA

Entre com seu comentário
Entre com seu nome