As inteligências artificiais focadas na identificação facial e de vozes humanas podem ser usadas para auxiliar no diagnóstico de problemas psicológicos.
Um programa de computador especialmente projetado pode ajudar a diagnosticar o Transtorno de Estresse Pós-Traumático (TEPT) em pessoas a partir da análise de suas vozes. O estudo descobriu que uma ferramenta de inteligência artificial pode distinguir, com 89% de precisão, entre as vozes daqueles com ou sem TEPT.
Métodos mais seguros de diagnóstico
Os resultados sugerem que as características baseadas na fala podem ser usadas para diagnosticar o Transtorno de Estresse Pós-Traumático. Com maior refinamento e validação, essa tecnologia pode ser aplicada no atendimento clínico em um futuro próximo.
Mais de 70% dos adultos em todo o mundo experimentam um evento traumático em algum momento da vida. As pessoas diagnosticadas com TEPT chegam a 12% dos casos e nessa condição experimentam sofrimento forte e persistente quando lembradas do evento desencadeador do trauma.
Os autores do estudo dizem que um diagnóstico de TEPT é mais frequentemente determinado por uma entrevista clínica ou por uma avaliação de autorrelato. Ambos métodos podem levar a erros de interpretação, impedindo muitas pessoas de tratarem o problema adequadamente. Essa questão levou ao desenvolvimento de marcadores físicos, objetivos e mensuráveis da progressão do TEPT, semelhantes a valores laboratoriais para outras condições médicas.
Método usado: florestas aleatórias
No estudo atual, a equipe de pesquisa usou uma técnica de aprendizado simples de máquina e estatística, chamada de florestas aleatórias, que tem a capacidade de “aprender” como classificar os indivíduos com base em exemplos. Tais programas de inteligência artificial constroem regras de decisão e modelos matemáticos que permitem a tomada de decisões com maior precisão à medida que a quantidade de dados de treinamento aumenta.
Os pesquisadores registraram pela primeira vez entrevistas diagnósticas padronizadas, com duração de uma hora, chamadas de PTSD Scale, ou CAPS, de 53 veteranos do Iraque e Afeganistão com TEPT relacionado ao serviço militar, bem como de 78 veteranos sem a doença. As gravações foram então introduzidas no software de voz da SRI International para renderizar um total de 40.526 recursos baseados em fala capturados em pequenos trechos de conversa, que o programa de inteligência artificial da equipe selecionou por padrões.
A floresta aleatória relacionou padrões de características específicas de voz com TEPT, incluindo menor clareza no tom de voz e vivacidade, ambos há muito relatados como úteis no diagnóstico.
Embora o estudo atual não tenha explorado os mecanismos da doença por trás do TEPT, a teoria é que eventos traumáticos alteram os circuitos cerebrais que processam a emoção e o tônus muscular, afetando portanto a voz.
No futuro, a equipe de pesquisa planeja treinar a ferramenta de voz com mais dados, validá-la cada vez como uma amostra independente e solicitar aprovação do governo americano para usar a ferramenta clinicamente.
A tecnologia de análise da fala usada no atual estudo sobre detecção de TEPT está dentro da gama de recursos incluídos na plataforma de análise de fala chamada SenSay Analytics. O software analisa palavras em combinação com frequência, ritmo, tom e características articulatórias da fala para inferir o estado do falante, incluindo emoção, sentimento, cognição, saúde, saúde mental e qualidade de comunicação. A tecnologia tem sido envolvida em uma série de aplicações industriais visíveis em startups como Oto, Ambit e Decoded Health.