Como inteligência artificial usa voz e sinais vitais para prever briga de casal

ALGUMAS CARACTERÍSTICAS DA FALA HUMANA NÃO PODEM SER CAPTADAS PELOS NOSSOS OUVIDOS, MAS PODEM REVELAR COMO REALMENTE NOS SENTIMOS SOBRE ALGUÉM (FOTO: BBC)

A maneira como falamos com nosso cônjuge pode contradizer nossos verdadeiros sentimentos, e a inteligência artificial aprendeu a perceber isso para prever se o seu amor vai durar

Suponha que seu relacionamento subiu no telhado. Você vem tentando resolver seus problemas a dois, com terapia de casal, mas no final das contas, quer saber se o esforço vai valer a pena. As coisas vão melhorar ou piorar?

A recomendação pode parecer óbvia: pare por um segundo e escute seu parceiro. Faça isso. Quando falamos um com o outro, nossas vozes contêm todo tipo de informação que pode revelar a resposta. Inflexões sutis no tom, as pausas entre as frases, o volume em que você fala – tudo isso transmite sinais ocultos sobre como você realmente se sente.

Muito disso nós aprendemos intuitivamente. E usamos essas informações para ajustar o significado de nossas palavras. Pense na diferença entre essas questões:

“POR QUE você está aqui?”

“Por que VOCÊ está aqui?”

“Por que você está AQUI?”

Essa mudança de ênfase é uma das formas mais óbvias de dar significado à nossa fala. Mas há muito mais camadas que adicionamos sem perceber.

Há uma maneira de extrair essa informação oculta do nosso discurso. Os pesquisadores até desenvolveram inteligência artificial que pode usar essas informações para prever o futuro dos relacionamentos de casais. A tecnologia já é mais precisa em aspectos como esse do que os terapeutas profissionais.

Terapeutas x algoritmos
Em um estudo realizado recentemente, pesquisadores monitoraram 134 casais com dificuldades em seus relacionamentos. Ao longo de dois anos, os casais tiveram duas sessões de terapia de 10 minutos. Cada cônjuge escolheu um tópico sobre seu relacionamento que considerava importante e discutiu-os juntos. Os pesquisadores também coletaram dados sobre se os relacionamentos dos casais melhoraram ou pioraram e se ainda estavam juntos dois anos depois.

Terapeutas treinados assistiram a vídeos das gravações. Ao avaliar a maneira como os casais conversavam entre si, o que diziam e sua aparência enquanto falavam, os terapeutas fizeram uma avaliação psicológica sobre o provável resultado de seu relacionamento.

Os pesquisadores também treinaram um algoritmo para analisar a fala dos casais. Pesquisas anteriores forneceram à equipe algumas pistas de que certos recursos provavelmente estavam envolvidos na comunicação humana, como a entonação, a duração da fala e como os indivíduos se revezavam para falar. O trabalho do algoritmo era calcular exatamente como esses recursos estavam ligados ao vigor do relacionamento.

O algoritmo foi puramente baseado nas gravações de som, sem considerar informações visuais dos vídeos. Ele também ignorou o conteúdo de suas conversas – as próprias palavras. Em vez disso, o algoritmo detectou recursos como cadência, volume e quanto tempo cada participante falava.

Surpreendentemente, o algoritmo também captou características da fala além da percepção humana. Esses recursos são quase impossíveis de descrever porque normalmente não temos consciência deles – como a inclinação espectral, uma função matemática complexa da fala.

“Usando muitos dados, podemos encontrar padrões que podem ser indescritíveis para olhos e ouvidos humanos”, diz Shri Narayanan, engenheiro da Universidade do Sul da Califórnia, nos Estados Unidos, que liderou o estudo.

Depois de ser treinado nas gravações dos casais, o algoritmo se tornou marginalmente melhor do que os terapeutas em prever se os casais ficariam juntos ou não. A taxa de acerto do algoritmo foi 79,3%.

Já os terapeutas – que tinham a vantagem de também poder entender o conteúdo do discurso dos casais e observar sua linguagem corporal – chegaram a uma precisão de 75,6%.

“Os seres humanos são bons em decodificar muitas informações”, diz Narayanan. “Mas não podemos processar todos os aspectos da informação disponíveis.”

Nossas vozes revelam mais sobre nossos pensamentos e emoções do que somos capazes de captar com nossos ouvidos (Foto: BBC)

NOSSAS VOZES REVELAM MAIS SOBRE NOSSOS PENSAMENTOS E EMOÇÕES DO QUE SOMOS CAPAZES DE CAPTAR COM NOSSOS OUVIDOS (FOTO: BBC)

“Vazando” emoções
A ideia é que estamos “vazando” mais informações sobre nossos pensamentos e emoções do que nós, como seres humanos, podemos entender. Mas os algoritmos não estão restritos apenas à decodificação dos recursos de voz que as pessoas tendem a usar para transmitir informações. Em outras palavras, existem outras dimensões “ocultas” em nosso discurso que podem ser acessadas pela inteligência artificial.

“Uma das vantagens dos computadores é a capacidade de encontrar padrões e tendências em grandes quantidades de dados”, diz Fjola Helgadottir, psicóloga clínica da Universidade de Oxford. “O comportamento humano pode dar uma visão sobre os processos mentais subjacentes”, diz ela.

“No entanto, os algoritmos de aprendizado de máquina podem fazer o trabalho difícil de classificar, encontrar informações pertinentes e fazer uma previsão sobre o futuro.”

Um algoritmo que prevê se seu relacionamento está ou não fadado ao fracasso pode não ser a ideia mais atraente. Especialmente porque só consegue atingir 75% de precisão. Tal previsão poderia mudar o curso do seu relacionamento e como você se sente em relação ao seu parceiro.

Mas decifrar a informação escondida na maneira como falamos – e em como nossos corpos funcionam – pode ser usado para melhorar nossos relacionamentos.

Termômetro de discussão
Theodora Chaspari, engenheira de computação da Texas A & M University, nos Estados Unidos, vem desenvolvendo um programa de inteligência artificial que pode prever quando é provável que os conflitos aumentem em um relacionamento. Chaspari e seus colegas coletaram dados de sensores não intrusivos – como uma pulseira de fitness – que 34 casais usaram por um dia.

Os sensores medem o suor, a frequência cardíaca e os dados de voz, incluindo o tom da voz, mas também analisam o conteúdo do que os casais disseram – se usaram palavras positivas ou negativas. Um total de 19 dos casais experimentou algum nível de conflito durante o dia em que usaram os sensores.

Chaspari e seus colegas usaram o aprendizado de máquina para treinar um algoritmo para entender os padrões associados aos argumentos que os casais relataram ter. Depois de receber treinamento sobre esses dados, o algoritmo conseguiu detectar conflitos em outros casais usando apenas os dados dos sensores, com uma precisão de 79,3%.

Agora, a equipe está desenvolvendo algoritmos preditivos que espera usar para detectar sinais de uma possível briga e alertar o casal antes de a briga ocorrer.

Ao monitorar seus níveis de transpiração, batimentos cardíacos e a maneira como você está falando, o algoritmo faria um cálculo da probabilidade de enfrentar um atrito com seu parceiro.

A maneira como ele funciona é a seguinte: você teve uma péssima jornada no trabalho, saiu uma reunião estressante e está a caminho de casa. O dia do seu parceiro foi igualmente difícil. Ao monitorar os dois níveis de transpiração, os batimentos cardíacos e o modo como você vem falando nas últimas horas, o algoritmo faria um cálculo da probabilidade de uma briga entre vocês acontecer.

“Nesse ponto, podemos intervir para resolver o conflito de maneira mais positiva”, diz Chaspari.

Isso pode ser feito simplesmente enviando uma mensagem aos casais antes que uma discussão venha à tona, diz Adela Timmons, psicóloga do projeto baseado no Centro de Psicologia Clínica e Quantitativa para Crianças e Famílias da Universidade Internacional da Flórida, nos Estados Unidos.

“Acreditamos que podemos ser mais eficazes em nossos tratamentos se pudermos administrá-los na vida real das pessoas nos pontos em que eles mais precisam”, diz ela.

O aprendizado de máquina é capaz de captar informações da maneira como falamos e não das palavras que usamos para fazer previsões sobre a duração de um relacionamento (Foto: BBC)

O APRENDIZADO DE MÁQUINA É CAPAZ DE CAPTAR INFORMAÇÕES DA MANEIRA COMO FALAMOS E NÃO DAS PALAVRAS QUE USAMOS PARA FAZER PREVISÕES SOBRE A DURAÇÃO DE UM RELACIONAMENTO (FOTO: BBC)

Intervenção antes do conflito
O modelo tradicional de terapia não é capaz de cumprir o objetivo de intervenção direta. Normalmente, uma sessão pode ocorrer durante uma hora por semana, quando os pacientes lembram o que aconteceu desde a última sessão e discutem os problemas que surgiram.

“O terapeuta não pode estar presente no momento em que alguém realmente precisa do apoio”, diz Timmons. “Há muitas etapas no processo tradicional, em que qualquer intervenção pode ser menos eficaz.”

Mas um alerta automatizado baseado no monitoramento consistente da fisiologia e da fala das pessoas poderia preencher o sonho em tempo real da intervenção terapêutica. Também poderia permitir uma forma mais padronizada de tratamento, afirma Helgadottir.

“Ninguém realmente sabe o que acontece entre quatro paredes em uma sala de terapia “, diz Helgadottir, que desenvolveu uma plataforma baseada em evidências usando a IA para tratar a ansiedade social. “Às vezes, as técnicas mais eficazes não estão sendo usadas, pois exigem mais esforço da parte do terapeuta. Por outro lado, os componentes clínicos dos sistemas de terapia de IA podem ser completamente abertos e transparentes.

“Eles podem ser projetados e revisados pelos principais pesquisadores e profissionais da área. Além disso, os computadores não têm dias de folga, e não há diferença se 1.100 ou 1.000 usuários estiverem se beneficiando ao mesmo tempo.”

No entanto, há riscos. Não existe garantia de que uma mensagem em seu celular avisando você ou seu parceiro sobre a suscetibilidade de uma discussão não vai “colocar mais lenha na fogueira”. O momento da intervenção é crucial.

“Provavelmente, não queremos realmente intervir durante um conflito”, diz Timmons. “Se as pessoas já estão chateadas, elas não ficarão totalmente receptivas a solicitações em seus telefones para que se acalmem. Mas se pudermos pegar as pessoas no período em que a discussão está começando a ganhar força, mas elas não perderam a capacidade de regular seu comportamento – esse é o ponto ideal da intervenção.”

Existem muitos obstáculos tecnológicos a serem superados antes que um aplicativo como esse possa ser implementado. A equipe precisa refinar seus algoritmos e testar sua eficácia em uma variedade maior de pessoas. Há também grandes questões sobre privacidade.

Uma violação de dados de um dispositivo que armazena dados em seu relacionamento com seu parceiro colocaria em risco muitas informações confidenciais. Além disso, o que aconteceria com os dados se houvesse um suposto crime, como a violência doméstica?

“Temos que pensar em como lidaríamos com essas situações e maneiras de manter as pessoas seguras, protegendo a privacidade delas”, diz Timmons. “Essas são questões sociais mais amplas que continuaremos a discutir.”

Se esse modelo de terapia for realmente bem-sucedido, ele também poderá abrir portas para formas semelhantes de melhorar outros tipos de relacionamento – como na família, no trabalho ou na dinâmica médico-paciente. Quanto mais nossos diferentes sistemas corporais são monitorados – desde os movimentos dos nossos olhos até a tensão muscular – mais pode ser revelado sobre o futuro dos nossos relacionamentos.

Pode haver muito mais camadas de significado, além de nossa fala e reações fisiológicas básicas, que podem ser melhor decodificadas pelas máquinas.

FONTE: ÉPOCA