Por Douglas Heaven
Publicado na Nature
Rostos humanos aparecem em uma tela, centenas deles, um após o outro. Alguns têm os olhos bem abertos, outros mostram os lábios fechados. Alguns têm os olhos bem fechados, as bochechas para cima e a boca aberta. Para cada um, você deve responder a esta pergunta simples: este é o rosto de alguém tendo um orgasmo ou uma dor repentina?
A psicóloga Rachael Jack e seus colegas recrutaram 80 pessoas para fazer este teste como parte de um estudo em 2018. A equipe, da Universidade de Glasgow, no Reino Unido, recrutou participantes de culturas do oeste e leste da Ásia para explorar uma antiga e altamente cobrada pergunta: as expressões faciais comunicam emoções de forma confiável?
Os pesquisadores têm perguntado às pessoas quais emoções elas percebem nos rostos há décadas. Eles questionaram adultos e crianças em diferentes países e populações indígenas em partes remotas do mundo. Observações influentes nas décadas de 1960 e 1970 pelo psicólogo norte-americano Paul Ekman sugeriram que, em todo o mundo, os humanos poderiam determinar com segurança estados emocionais a partir de expressões nos rostos – o que implica que as expressões emocionais são universais.
Essas ideias permaneceram praticamente incontestáveis por uma geração. Mas um novo grupo de psicólogos e cientistas cognitivos tem revisado esses dados e questionado as conclusões. Muitos pesquisadores agora acham que o cenário é muito mais complicado e que as expressões faciais variam muito entre contextos e culturas. O estudo de Jack, por exemplo, descobriu que embora os ocidentais e os asiáticos orientais tivessem conceitos semelhantes de como os rostos exibem dor, eles tinham ideias diferentes sobre as expressões de prazer.
Os pesquisadores estão cada vez mais divididos sobre a validade das conclusões de Ekman. Mas o debate não impediu empresas e governos de aceitar sua afirmação de que o rosto é um oráculo de emoções – e de usá-lo de maneiras que afetam a vida das pessoas. Em muitos sistemas jurídicos do Ocidente, por exemplo, ler as emoções de um réu faz parte de um julgamento justo. Como escreveu o juiz da Suprema Corte dos Estados Unidos, Anthony Kennedy, em 1992, fazer isso é necessário para “conhecer o coração e a mente do infrator”.
A decodificação de emoções também está no centro de um polêmico programa de treinamento desenvolvido por Ekman para a Administração de Segurança de Transporte dos EUA (TSA) e introduzido em 2007. O programa, denominado SPOT (da sigla em inglês para Triagem de Passageiros por Técnicas de Observação), foi criado para ensinar funcionários da TSA a monitorar os passageiros em busca de dezenas de sinais potencialmente suspeitos que podem indicar estresse, decepção ou medo. Mas foi amplamente criticado por cientistas, membros do Congresso dos Estados Unidos e organizações como a American Civil Liberties Union por ser impreciso e preconceituoso racialmente.
Essas preocupações não impediram as empresas líderes de tecnologia de acreditar que as emoções podem ser detectadas prontamente, e algumas empresas criaram softwares para fazer exatamente isso. Os sistemas estão sendo testados ou comercializados para avaliar a adequação dos candidatos a empregos, detectar mentiras, tornar os anúncios mais atraentes e diagnosticar distúrbios de demência a depressão. As estimativas colocam o valor da indústria em dezenas de bilhões de dólares. Gigantes da tecnologia, incluindo Microsoft, IBM e Amazon, bem como empresas mais especializadas, como Affectiva em Boston, Massachusetts, e NeuroData Lab em Miami, Flórida, todos oferecem algoritmos projetados para detectar as emoções de uma pessoa em seu rosto.
Com os pesquisadores ainda discutindo se as pessoas podem produzir ou perceber expressões emocionais com fidelidade, muitos na área acham que os esforços para fazer com que os computadores façam isso automaticamente são prematuros – especialmente quando a tecnologia pode ter repercussões prejudiciais. O AI Now Institute, um centro de pesquisa da Universidade de Nova York, até mesmo pediu a proibição do uso de tecnologia de reconhecimento de emoções em situações delicadas, como recrutamento ou aplicação da lei.
Expressões faciais são extremamente difíceis de interpretar, mesmo para pessoas, disse Aleix Martinez, que pesquisa o assunto na Universidade Estadual de Ohio, em Columbus, nos Estados Unidos. Com isso em mente, disse ele, e dada a tendência para a automação, “devemos estar muito preocupados”.
Análise das expressões
O rosto humano tem 43 músculos, que podem esticar, levantar e contorcer-se em dezenas de expressões. Apesar dessa vasta gama de movimentos, os cientistas há muito sustentam que certas expressões transmitem emoções específicas.
Uma pessoa que defendeu essa opinião foi Charles Darwin. Seu livro de 1859, A Origem das Espécies, resultado de um árduo trabalho de campo, foi uma aula de observação. Seu segundo trabalho mais influente, A Expressão das Emoções no Homem e nos Animais (1872), foi mais dogmático.
Darwin observou que os primatas fazem movimentos faciais que parecem expressões humanas de emoção, como nojo ou medo, e argumentou que as expressões devem ter alguma função adaptativa. Por exemplo, franzir os lábios, franzir o nariz e estreitar os olhos – expressão ligada ao nojo – pode ter se originado para proteger o indivíduo contra patógenos nocivos. Somente quando os comportamentos sociais começaram a se desenvolver, essas expressões faciais assumiram um papel mais comunicativo.
Os primeiros estudos de campo transculturais, realizados por Ekman na década de 1960, corroboraram essa hipótese. Ele testou a expressão e percepção de seis emoções principais – felicidade, tristeza, raiva, medo, surpresa e repulsa – em todo o mundo, incluindo em uma população remota na Nova Guiné.
Ekman escolheu essas seis expressões por razões práticas, disse ele à Nature. Algumas emoções, como vergonha ou culpa, não têm leituras óbvias, disse ele. “As seis emoções em que me concentrei têm expressões, o que significa que eram passíveis de estudo”.
Esses primeiros estudos, disse Ekman, mostraram evidências da universalidade que a teoria da evolução de Darwin esperava. E trabalhos posteriores sustentaram a afirmação de que algumas expressões faciais podem conferir uma vantagem adaptativa.
“Por muito tempo, supôs-se que as expressões faciais eram movimentos obrigatórios”, disse Lisa Feldman Barrett, psicóloga da Universidade do Nordeste em Boston, nos Estados Unidos, que estuda as emoções. Em outras palavras, nossos rostos são impotentes para esconder nossas emoções. O problema óbvio com essa suposição é que as pessoas podem fingir emoções e experimentar sentimentos sem mover o rosto. Os pesquisadores do campo de Ekman reconhecem que pode haver uma variação considerável nas expressões do “padrão de ouro” esperadas para cada emoção.
Mas uma multidão crescente de pesquisadores argumenta que a variação é tão extensa que leva a ideia do padrão de ouro ao ponto de ruptura. Seus pontos de vista são sustentados por uma vasta revisão da literatura. Há alguns anos, os editores da revista Psychological Science in the Public Interest reuniram um painel de autores que discordavam uns dos outros e pediram que revisassem a literatura.
“Fizemos o possível para deixar de lado nossas bagagens”, disse Barrett, que liderou a equipe. Em vez de começar com uma hipótese, eles mergulharam nos dados. “Quando havia um desacordo, apenas ampliamos nossa busca por evidências”. Eles acabaram lendo cerca de 1.000 estudos. Depois de dois anos e meio, a equipe chegou a uma conclusão definitiva: havia pouca ou nenhuma evidência de que as pessoas podem determinar com segurança o estado emocional de outra pessoa a partir de um conjunto de movimentos faciais.
Em um extremo, o grupo citou estudos que não encontraram nenhuma ligação clara entre os movimentos de um rosto e um estado emocional interno. O psicólogo Carlos Crivelli, da Universidade de Montfort em Leicester, Reino Unido, trabalhou com residentes das ilhas Trobriand em Papua-Nova Guiné e não encontrou evidências das conclusões de Ekman em seus estudos. Tentar avaliar os estados mentais internos de sinais externos é como tentar medir a massa em metros, concluiu Crivelli.
Outra razão para a falta de evidência para expressões universais é que o rosto não é a imagem completa. Outras coisas, incluindo movimento corporal, personalidade, tom de voz e mudanças no tom da pele têm papéis importantes na forma como percebemos e exibimos emoções. Por exemplo, mudanças no estado emocional podem afetar o fluxo sanguíneo e isso, por sua vez, pode alterar a aparência da pele. Martinez e seus colegas mostraram que as pessoas são capazes de relacionar as mudanças no tom da pele às emoções. O contexto visual, como o cenário e o ambiente ao redor, também pode fornecer pistas sobre o estado emocional de alguém.
Emoções confusas
Outros pesquisadores acham que a reação aos resultados de Ekman é um pouco exagerada – principalmente o próprio Ekman. Em 2014, respondendo a uma crítica de Barrett, ele apontou para um corpo de trabalho que, segundo ele, sustenta suas conclusões anteriores, incluindo estudos sobre expressões faciais que as pessoas fazem espontaneamente e pesquisas sobre a ligação subjacente entre as expressões, o cérebro e o estado corporal. Este trabalho, escreveu ele, sugere que as expressões faciais são informativas não apenas sobre os sentimentos dos indivíduos, mas também sobre os padrões de ativação neurofisiológica. Suas opiniões não mudaram, disse ele.
De acordo com Jessica Tracy, psicóloga da Universidade da Colúmbia Britânia em Vancouver, Canadá, os pesquisadores que concluem que a teoria da universalidade de Ekman está errada com base em um punhado de contraexemplos estão exagerando. Uma população ou cultura com uma ideia ligeiramente diferente sobre uma cara zangada não destrói toda a teoria, disse ela. A maioria das pessoas reconhece um rosto zangado ao vê-lo, acrescenta ela, citando uma análise de quase 100 estudos. “Toneladas de outras evidências sugerem que a maioria das pessoas na maioria das culturas em todo o mundo vê que essa expressão é universal”.
Tracy e três outros psicólogos argumentam que a revisão da literatura de Barrett caricatura sua posição como um mapeamento rígido de um a um entre seis emoções e seus movimentos faciais. “Não conheço nenhum pesquisador no campo da ciência da emoção que pense que esse seja o caso”, disse Disa Sauter, da Universidade de Amsterdã, coautora da resposta.
Sauter e Tracy pensam que o que é necessário para dar sentido às expressões faciais é uma taxonomia muito mais rica de emoções. Em vez de considerar a felicidade como uma emoção única, os pesquisadores devem separar as categorias emocionais em seus componentes; o escopo da felicidade cobre alegria, prazer, compaixão, orgulho e assim por diante. As expressões para cada um podem diferir ou se sobrepor.
No centro do debate está o que é importante. Em um estudo em que os participantes escolhem um dos seis marcadores de emoção para cada rosto que veem, alguns pesquisadores podem considerar que uma opção que é escolhida mais de 20% das vezes mostra semelhanças significativas. Outros podem pensar que 20% é insuficiente. Jack argumenta que o limite de Ekman era muito baixo. Ela leu seus primeiros estudos como estudante de doutorado. “Continuei indo ao meu supervisor e mostrando a ele esses gráficos das décadas de 1960 e 1970 e cada um deles mostra grandes diferenças no reconhecimento cultural”, disse ela. “Ainda não há dados que mostrem que as emoções são universalmente reconhecidas”.
Significância à parte, os pesquisadores também têm que enfrentar a subjetividade: muitos estudos dependem do experimentador ter identificado uma emoção no início do teste, para que os resultados finais possam ser comparados. Portanto, Barrett, Jack e outros estão tentando encontrar maneiras mais neutras de estudar as emoções. Barrett está analisando medidas fisiológicas, na esperança de fornecer um indicador para raiva, medo ou alegria. Em vez de usar fotos simuladas, Jack usa um computador para gerar expressões faciais aleatoriamente, para evitar se concentrar nas seis comuns. Outros estão pedindo aos participantes que agrupem os rostos em tantas categorias quanto eles acham que são necessárias para capturar as emoções, ou fazendo com que participantes de diferentes culturas rotulem as imagens em seu próprio idioma.
Sentimentos in silico
As empresas de software tendem a não permitir que seus algoritmos tenham tanto espaço para associação livre. Um programa típico de inteligência artificial (IA) para detecção de emoções é alimentado por milhões de imagens de rostos e centenas de horas de imagens de vídeo em que cada emoção foi associada e a partir da qual ele pode discernir padrões. A Affectiva afirma que treinou seu software em mais de 7 milhões de faces de 87 países, e que isso lhe dá uma precisão de 90%. A empresa se recusou a comentar sobre a ciência por trás de seu algoritmo. O Neurodata Lab reconhece que há variação na forma como os rostos expressam emoções, mas disse que “quando uma pessoa está tendo um episódio emocional, algumas configurações faciais ocorrem com mais frequência do que o acaso permitiria”, e que seus algoritmos levam essa semelhança em consideração.
Ekman disse que contestou as reivindicações das empresas diretamente. Ele escreveu para várias empresas – ele não revelou quais, apenas disse que “elas estão entre as maiores empresas de software do mundo” – pedindo para ver evidências de que suas técnicas automatizadas funcionam. Ele não teve resposta. “Pelo que eu sei, eles estão reivindicando coisas que não há evidências para isso”, disse ele.
Martinez admite que a detecção automática de emoções pode ser capaz de dizer algo sobre a resposta emocional média de um grupo. A Affectiva, por exemplo, vende software para agências de marketing e marcas para ajudar a prever como uma base de clientes pode reagir a um produto ou campanha de marketing.
Se este software cometer um erro, as apostas são baixas – um anúncio pode ser um pouco menos eficaz do que o esperado. Mas alguns algoritmos estão sendo usados em processos que podem ter um grande impacto na vida das pessoas, como em entrevistas de emprego e em fronteiras de países. No ano passado, a Hungria, a Letônia e a Grécia testaram um sistema de pré-seleção de viajantes que visa detectar fraudes por meio da análise de microexpressões no rosto.
Resolver o debate sobre as expressões emocionais exigirá diferentes tipos de investigação. Barrett – que muitas vezes é solicitada a apresentar sua pesquisa a empresas de tecnologia e que visitou a Microsoft este mês – acha que os pesquisadores precisam fazer o que Darwin fez para A Origem das Espécies: “Observe, observe, observe”. Observe o que as pessoas realmente fazem com seus rostos e corpos na vida real – não apenas no laboratório. Em seguida, use máquinas para gravar e analisar imagens do mundo real.
Barrett acredita que mais dados e técnicas analíticas podem ajudar os pesquisadores a aprender algo novo, em vez de revisitar conjuntos de dados e experimentos ultrapassados. Ela lança um desafio para as empresas de tecnologia ansiosas para explorar o que ela e muitos outros veem cada vez mais como ciência instável. “Estamos realmente neste precipício”, disse ela. “As empresas de IA continuarão a usar suposições erradas ou farão o que precisa ser feito?”.