Se você só ler isso: a análise baseada em esqueleto é uma técnica de visão computacional que extrai os pontos articulares do corpo a partir de um vídeo e mede padrões de movimento. Pesquisas exploram esse recurso como medida objetiva de hiperatividade e inquietação no TDAH. É uma fronteira promissora, não um exame que fecha diagnóstico sozinho. O diagnóstico de TDAH continua sendo clínico.

Ilustração conceitual sobre análise baseada em esqueleto e movimento no TDAH, em verde petróleo e dourado
Pontos articulares extraídos de um vídeo formam um esqueleto digital do movimento.

O que é a análise baseada em esqueleto

A análise baseada em esqueleto, ou skeleton-based analysis, é um campo da visão computacional. A partir de um vídeo comum, algoritmos de estimativa de pose localizam os principais pontos articulares do corpo: cabeça, ombros, cotovelos, punhos, quadris, joelhos e tornozelos. Esses pontos formam um esqueleto digital, e o sistema acompanha cada um deles quadro a quadro. O resultado não é uma imagem da pessoa, mas uma descrição numérica de como o corpo se move ao longo do tempo: coordenadas que sobem, descem e oscilam, frame após frame.

Vale separar duas etapas que o público costuma confundir. A primeira é a estimativa de pose: o sistema olha cada quadro e responde "onde estão as articulações agora?". A segunda é o reconhecimento de ação: a partir da sequência dessas posições no tempo, classifica o que o corpo faz, por exemplo "parado", "mexendo a mão" ou "girando o tronco". É a combinação das duas que transforma um vídeo em medidas tratáveis por estatística e aprendizado de máquina.

Reduzir a pessoa a um conjunto de articulações tem uma vantagem técnica. Como o método foca no movimento em si, torna-se mais robusto a fatores que confundiriam uma câmera comum, como iluminação, cor de roupa e fundo da sala. O esqueleto também carrega menos informação identificável que um vídeo bruto do rosto, o que, em tese, ajuda em privacidade. Por isso a abordagem ganhou interesse em saúde, da análise de marcha em reabilitação à avaliação de funções motoras, e foi proposta como caminho de baixo custo para estudar transtornos do neurodesenvolvimento (Li, Li, Nair e Naqvi, 2023).

Como funciona, em termos técnicos mas claros

Na prática, um sistema desse tipo encadeia três blocos. Primeiro, um detector encontra a pessoa no quadro e a delimita; no trabalho de Li e colaboradores (2024), uma rede Faster R-CNN com base ResNet-50. Segundo, um estimador de pose localiza dentro dela os pontos articulares; os autores usaram a HRNet, que mantém alta resolução e acerta bem a posição das juntas, trabalhando com 17 pontos, o padrão de bases como a COCO.

O terceiro bloco é o que de fato "entende" o movimento: a sequência de esqueletos no tempo é entregue a uma rede de reconhecimento de ação. Uma escolha recorrente é a PoseConv3D, que converte os pontos em mapas de calor empilhados no tempo e os processa com convoluções tridimensionais. Há ainda a distinção entre esqueleto 2D, de uma única câmera, e 3D, que estima profundidade. Pode soar que 3D seria sempre melhor, mas, para uso clínico, o 2D tende a ser mais confiável: estimativas 2D têm melhor qualidade e maior acurácia que as 3D, que acumulam erro ao inferir profundidade de uma imagem plana (Li, Nair e Naqvi, 2024).

Por que medir movimento no TDAH

A hiperatividade e a inquietação são, em parte, fenômenos de movimento. A pessoa que mexe as mãos sem parar, balança as pernas, gira no assento ou levanta repetidas vezes está expressando, no corpo, algo que as escalas tentam capturar em palavras. A lógica da pesquisa é direta: se dá para medir esse movimento de forma objetiva, obtém-se um dado que não depende da memória nem da interpretação de quem observa.

Esse desejo de objetividade tem raiz prática. Boa parte do diagnóstico de TDAH apoia-se em relatos: o próprio paciente, os pais, os professores. Relatos são insubstituíveis, mas estão sujeitos a esquecimento, expectativa e até ao efeito placebo. Uma medida física do corpo, em tese, escaparia de parte desse ruído. Daí o esforço, ao longo de décadas, para encontrar um sinal motor que acompanhe os sintomas, e a esperança de que o vídeo, hoje barato e onipresente, entregue isso de forma acessível.

De onde vem essa ideia: um panorama das medidas objetivas

A análise por esqueleto não surge do nada. Ela é o capítulo mais recente de uma história longa de tentativas de medir o TDAH por instrumentos, e entender essa linhagem ajuda a calibrar o entusiasmo.

A actigrafia é a mais antiga e estabelecida: um pequeno sensor de movimento, parecido com um relógio, usado no pulso ou tornozelo, que registra a atividade motora por horas ou dias, inclusive durante o sono. Uma meta-análise de De Crescenzo e colaboradores (2016) concluiu que a actigrafia indexa de forma confiável níveis aumentados de movimento no TDAH e é útil tanto para detectar diferenças de atividade quanto para acompanhar o sono, embora com heterogeneidade considerável entre estudos. Sua vantagem é capturar a vida real; sua limitação é não dizer nada sobre atenção.

O teste de desempenho contínuo (CPT) ataca o outro lado do problema: são tarefas de computador, longas e monótonas, em que a pessoa responde a certos estímulos e inibe respostas a outros, medindo desatenção (erros de omissão) e impulsividade (erros de comissão). Uma das versões mais conhecidas, o QbTest, junta um CPT a um rastreamento por câmera infravermelha que segue um refletor preso a uma faixa na cabeça por cerca de 20 minutos, medindo movimento e atenção ao mesmo tempo. O QbTest tem marcação CE como dispositivo médico e foi liberado pela FDA dos Estados Unidos como ferramenta de apoio à decisão, explicitamente para aumentar, não substituir, a avaliação clínica padrão.

É exatamente nesse mapa que a análise baseada em esqueleto se encaixa. Ela busca a mesma medida de movimento da actigrafia e do rastreamento infravermelho do QbTest, mas sem exigir sensor no corpo nem refletor na cabeça: bastaria uma câmera comum apontada para a pessoa. A promessa é capturar a inquietação visível com hardware trivial. O preço dessa simplicidade aparece nos limites técnicos e éticos discutidos adiante.

O que a pesquisa recente mostra

Convém olhar os achados sem nem inflar nem desprezar. Eles existem, são interessantes e ainda são preliminares.

Li, Nair e Naqvi (2024), na Neuroscience Applied, propuseram um sistema de detecção de TDAH baseado em reconhecimento de ação a partir de vídeos RGB comuns, usando o pipeline descrito acima, e o posicionam como alternativa de baixo custo às vias apoiadas em fMRI e EEG. O estudo anterior do grupo (Li, Li, Nair e Naqvi, 2023) já organizava as ações em categorias como permanecer parado, pequenos movimentos repetitivos dos membros e rotações maiores do tronco, mostrando que esses padrões diferenciavam, no conjunto analisado, participantes com e sem TDAH.

Lin e colaboradores (2021), no International Journal of Environmental Research and Public Health, foram em outra direção útil: usaram análise de esqueleto por vídeo para quantificar de forma objetiva o efeito da medicação sobre o movimento, comparando o antes e o depois. Esse uso, de monitorar resposta a tratamento, é menos ambicioso que diagnosticar e talvez mais maduro, porque compara a mesma pessoa consigo mesma.

A literatura paralela das medidas vestíveis reforça o quadro. Revisões sobre sensores de movimento no TDAH descrevem estudos que, com acelerômetros e redes neurais, distinguiram crianças com TDAH de controles típicos, e trabalhos que classificaram episódios de agressividade com acurácia em torno de 82% (revisão crítica sobre sensores de movimento no TDAH, 2024). São números animadores em amostras específicas, mas que não se traduzem automaticamente em um teste diagnóstico de uso geral.

O que a análise de movimento mede, e o que ela não mede.
O que a técnica capturaO que ela não captura sozinha
Frequência e amplitude de movimentos do corpoA história de vida e o início precoce dos sintomas
Padrões de inquietação visíveis em vídeoA desatenção interna, que não aparece no corpo
Comparações objetivas antes e depoisO prejuízo real em estudo, trabalho e relações
Um dado numérico de apoioO diagnóstico diferencial com ansiedade, sono e outros quadros

O que essas medidas medem, e o que não medem

Antes de discutir números, vale fixar o que está em jogo. As tecnologias de movimento, do acelerômetro ao esqueleto, capturam um recorte específico do quadro e deixam de fora outro, maior. A tabela a seguir resume essa fronteira, e ela é o coração da leitura honesta do tema.

O que a análise de movimento mede, e o que ela não mede.
O que a técnica capturaO que ela não captura sozinha
Frequência e amplitude de movimentos do corpoA história de vida e o início precoce dos sintomas
Padrões de inquietação visíveis em vídeoA desatenção interna, que não aparece no corpo
Comparações objetivas antes e depois de um tratamentoO prejuízo real em estudo, trabalho e relações
Um dado numérico de apoio, reprodutívelO diagnóstico diferencial com ansiedade, sono e outros quadros

Promessa real, limite honesto

O entusiasmo tem fundamento. Boa parte das medidas objetivas de TDAH existentes hoje depende de equipamento caro, como ressonância e eletroencefalograma. Uma análise feita a partir de um vídeo seria, em tese, mais acessível e menos invasiva. É justamente esse potencial de baixo custo que motiva a área (Li, Nair e Naqvi, 2024).

O limite, porém, precisa ficar claro. Esses estudos são, em geral, pequenos, feitos em contextos controlados e ainda longe de validação para uso clínico de rotina. Movimento não é sinônimo de TDAH: ansiedade, falta de sono e simples desconforto também agitam o corpo, e há pessoas com TDAH cujo sofrimento é sobretudo de desatenção interna, com pouca hiperatividade visível, o chamado apresentação predominantemente desatenta. Por isso, hoje, a análise baseada em esqueleto é uma fronteira de pesquisa, não um exame que fecha diagnóstico.

Quão precisas são, afinal, as medidas objetivas

Há um número que surpreende quem espera que a tecnologia resolva o diagnóstico: mesmo as medidas objetivas mais maduras acertam apenas de forma modesta a moderada. Uma revisão sistemática com meta-análise sobre os testes de desempenho contínuo, no Journal of the American Academy of Child & Adolescent Psychiatry (Arrondo e colaboradores, 2024), encontrou sensibilidade combinada em torno de 0,75 e especificidade em torno de 0,71 para os escores totais. Em linguagem simples: o teste deixa passar cerca de um em cada quatro casos reais e marca como suspeito cerca de três em cada dez pessoas sem o transtorno. Para o QbTest, uma meta-análise (Hall e colaboradores, 2023) descreveu sensibilidade de cerca de 0,78 e especificidade de cerca de 0,70, com subescalas mais fracas.

Esses números não desqualificam as ferramentas; eles definem o papel delas. Uma medida com essa precisão é boa para somar peso a uma hipótese clínica ou para acompanhar mudança ao longo do tempo, mas é insegura como juíza isolada. Já em 2001, uma revisão clássica resumiu o ponto em frase que envelheceu bem: os testes de desempenho contínuo são sensíveis ao TDAH em adultos, mas carecem de especificidade, porque vários transtornos pioram o desempenho na mesma tarefa. A análise por esqueleto herda esse mesmo teto: ela mede um sinal real, mas um sinal que não é exclusivo do TDAH.

Limitações: do laboratório à vida real

Além da precisão, há limitações estruturais que pesam ainda mais quando se pensa em usar isso com pessoas de verdade.

Amostras pequenas e pouco diversas. Muitos estudos de esqueleto e TDAH têm dezenas, não milhares de participantes, frequentemente crianças, em um único centro. Um modelo que separa bem dois grupos pequenos pode falhar diante da variedade do mundo: idades diferentes, culturas diferentes, corpos diferentes. Generalização não é dada; precisa ser demonstrada em coortes independentes, e isso ainda não aconteceu de forma robusta.

Laboratório não é vida. Filmar alguém numa sala silenciosa por alguns minutos captura um comportamento sob observação, que pode diferir do dia a dia. A pessoa sabe que está sendo gravada; crianças se contêm, adultos mascaram. A actigrafia mede dias inteiros na vida real; o vídeo de consultório, não.

Sobreposição com outros quadros. Inquietação aparece em ansiedade, em alguns transtornos de humor, em quadros do sono, no uso de certas substâncias e em pessoas simplesmente entediadas. No adulto, soma-se o fato de que o TDAH raramente vem sozinho. Um sinal motor, por mais bem medido, não distingue por si só essas origens. Esse é o trabalho do diagnóstico diferencial, que é raciocínio clínico, não cálculo.

O perfil desatento escapa. Como o método mede movimento visível, ele tende a enxergar melhor a hiperatividade e quase nada da desatenção interna. Isso introduz um viés silencioso: justamente os perfis que mais passam despercebidos, comuns em mulheres e em adultos com diagnóstico tardio, são os que uma medida de movimento corre o risco de subdetectar.

Ética, privacidade e equidade

Medir o corpo por vídeo levanta questões que vão além da técnica. Vídeo do rosto e do corpo é dado sensível; usá-lo em saúde exige consentimento informado claro, finalidade definida, guarda segura e controle sobre quem acessa o material. Trabalhar com o esqueleto, e não com a imagem bruta, reduz parte do risco, mas não o elimina, porque padrões de movimento também podem identificar pessoas e revelar mais do que o pretendido.

Há ainda o viés algorítmico, bem documentado na literatura de IA em saúde. Modelos treinados em amostras pouco representativas tendem a funcionar pior para grupos sub-representados; exemplos reais incluem um algoritmo clínico amplamente usado que subestimou a necessidade de cuidado de pacientes negros e sistemas de visão computacional com mais erro em pessoas de pele mais escura (revisões sobre equidade e viés em IA na saúde, 2024-2025). Aplicado ao TDAH, um modelo enviesado poderia errar mais com certos perfis, agravando desigualdades em vez de corrigi-las. Daí a exigência de auditoria, transparência sobre dados de treino e validação em populações diversas antes de qualquer uso clínico.

Por que o diagnóstico continua clínico

Reunindo tudo, a conclusão é serena, não cética. O TDAH, conforme o DSM-5-TR, é definido por um padrão de desatenção e/ou hiperatividade-impulsividade que começa na infância, persiste, aparece em mais de um contexto e causa prejuízo real. Nada disso é um número de um sensor: é história de vida, sofrimento subjetivo e impacto em estudo, trabalho e relações. Por construção, o diagnóstico é clínico.

O que as medidas objetivas oferecem é apoio, não substituição. Elas podem adicionar um dado a uma avaliação já bem conduzida, ajudar a acompanhar resposta a tratamento ou reforçar a comunicação com o paciente, mostrando em gráfico algo que ele sente. O próprio órgão regulador que liberou o QbTest foi explícito nisso: trata-se de ferramenta para aumentar, não para trocar, o julgamento clínico. A tecnologia melhora a clínica quando entra a serviço dela; piora quando tenta ocupar o lugar dela.

Como isso dialoga com a avaliação do funcionamento

A busca por objetividade não é nova nem estranha à boa psiquiatria. Ela só não pode terceirizar a clínica para um sensor. No trabalho do Dr. João, a objetividade vem de instrumentos consolidados: entrevista clínica aprofundada com a história de vida desde a infância, Bateria de Avaliação Cognitiva (CAB) e escalas clínicas validadas, com diagnóstico diferencial cuidadoso. O objetivo é medir funcionamento real, não marcar critérios soltos.

Há um detalhe que a análise de movimento ilumina por contraste: ela mede o que se vê. A avaliação do funcionamento que sustenta o Método Espectral Amplo faz o oposto, parte do que não se vê de imediato: a história de vida, o esforço escondido, o mascaramento, o custo emocional de parecer bem enquanto se sofre. Por isso a entrevista aprofundada e a CAB capturam dimensões que nenhum sensor alcança, e o olhar é multidimensional, do biológico ao sensorial e ao contexto de vida.

Tecnologias como a análise de movimento podem, no futuro, somar um dado a esse conjunto, sobretudo no acompanhamento de tratamento, onde comparar a pessoa consigo mesma faz sentido. O que elas não substituem é a escuta e o raciocínio clínico que transformam números em entendimento. Vale lembrar, ainda, que o TDAH no adulto raramente vem isolado e que a regulação emocional é parte central do quadro: a desatenção que passa despercebida e a sensibilidade à rejeição não aparecem em gráfico de movimento, mas mudam profundamente a vida de quem as carrega.

Para situar melhor o tema, vale ler o guia de TDAH no adulto, conhecer os tipos de apresentação do TDAH e entender como funciona a avaliação de TDAH no consultório. Quem chega depois de anos sendo descartado costuma precisar, antes de qualquer aparelho, de algo simples e raro: ser escutado a sério, com método.

Importante: este conteúdo tem caráter educativo e não substitui avaliação, diagnóstico ou acompanhamento médico individual. A análise baseada em esqueleto é uma linha de pesquisa, e o Dr. João Carlos Leitão não oferece esse exame específico.

Cartão de bolso (se esquecer tudo, lembra disso)

  • Análise baseada em esqueleto extrai os pontos articulares do corpo de um vídeo e mede o movimento, sem sensor no corpo.
  • A pesquisa explora isso como medida objetiva de hiperatividade e inquietação no TDAH; o atrativo é o baixo custo frente a ressonância e EEG.
  • Ela entra numa linhagem que inclui actigrafia (sensor no pulso) e o QbTest (CPT + câmera infravermelha).
  • Mesmo as medidas maduras têm precisão modesta a moderada: sensibilidade e especificidade em torno de 0,70 a 0,78.
  • Movimento não é igual a TDAH: ansiedade e sono ruim também agitam o corpo, e o perfil desatento quase não aparece.
  • É fronteira de pesquisa, não exame que fecha diagnóstico. O diagnóstico de TDAH é clínico (DSM-5-TR) e o Dr. João não oferece esse exame.

Perguntas frequentes

É uma técnica de visão computacional que, a partir de um vídeo, extrai os pontos articulares do corpo, como ombros, cotovelos, quadris e joelhos, formando um esqueleto digital. Acompanhando esses pontos quadro a quadro, é possível quantificar padrões de movimento de forma objetiva.

Não. É uma linha de pesquisa promissora para medir hiperatividade e inquietação de forma objetiva, mas não é um exame que fecha o diagnóstico. O diagnóstico de TDAH é clínico, feito por avaliação detalhada, e nenhum sensor de movimento substitui essa investigação.

Porque a hiperatividade e a inquietação são, em parte, fenômenos de movimento. Quantificar pequenos movimentos das mãos e dos pés ou rotações do tronco oferece uma medida objetiva que complementa, mas não substitui, a observação clínica e as escalas validadas.

É uma fronteira de pesquisa, ainda fora da prática clínica de rotina. O Dr. João Carlos Leitão não oferece esse exame específico. O que existe hoje na avaliação séria de TDAH são entrevista clínica aprofundada, bateria cognitiva e escalas validadas.

Por meio de entrevista clínica detalhada desde a infância, Bateria de Avaliação Cognitiva (CAB) e escalas clínicas validadas, com diagnóstico diferencial cuidadoso. O objetivo é medir o funcionamento real, não apenas marcar critérios soltos.

A actigrafia usa um sensor de movimento no pulso ou tornozelo para registrar a atividade ao longo de horas ou dias. O QbTest combina um teste de desempenho contínuo com uma câmera infravermelha que segue um refletor na cabeça por cerca de 20 minutos. A análise baseada em esqueleto dispensa sensor: ela extrai os pontos do corpo de um vídeo comum. As três medem movimento ou atenção por caminhos diferentes, e nenhuma fecha o diagnóstico sozinha.

Têm precisão modesta a moderada. Em meta-análise, os testes de desempenho contínuo mostraram sensibilidade em torno de 0,75 e especificidade em torno de 0,71, e o QbTest, números semelhantes. Isso significa que erram tanto em sentido de incluir quem não tem o transtorno quanto de deixar passar quem tem, e por isso só fazem sentido dentro de uma avaliação clínica mais ampla.

Sim. Vídeo do corpo e do rosto é dado sensível, e qualquer uso clínico exige consentimento claro, guarda segura e finalidade definida. Também há risco de viés: modelos treinados em amostras pouco diversas podem funcionar pior para alguns grupos. Por isso a área pede cautela, transparência e auditoria antes de qualquer aplicação real.

Porque o TDAH é definido por critérios de funcionamento ao longo da vida, com início na infância e prejuízo em mais de um contexto, conforme o DSM-5-TR. Nenhum sensor mede história de vida, sofrimento subjetivo ou prejuízo real em estudo, trabalho e relações. As medidas objetivas podem apoiar, mas o raciocínio diagnóstico é humano e clínico.

Referências

  1. Li Y, Li Y, Nair R, Naqvi SM. Skeleton-based action analysis for ADHD diagnosis. arXiv preprint, 2023. arXiv:2304.09751. Disponível em: https://arxiv.org/abs/2304.09751.
  2. Li Y, Nair R, Naqvi SM. ADHD detection based on human action recognition. Neuroscience Applied, 2024. Disponível em: https://www.sciencedirect.com/science/article/pii/S2772408524001583.
  3. Lin HY, et al. Evaluating therapeutic effects of ADHD medication objectively by movement quantification with a video-based skeleton analysis. International Journal of Environmental Research and Public Health, 2021;18(17):9363. DOI: 10.3390/ijerph18179363.
  4. De Crescenzo F, Licchelli S, Ciabattini M, et al. The use of actigraphy in the monitoring of sleep and activity in ADHD: A meta-analysis. Sleep Medicine Reviews, 2016. PubMed PMID: 26163053. Disponível em: https://pubmed.ncbi.nlm.nih.gov/26163053/.
  5. Arrondo G, et al. Systematic Review and Meta-Analysis: Clinical Utility of Continuous Performance Tests for the Identification of Attention-Deficit/Hyperactivity Disorder. Journal of the American Academy of Child & Adolescent Psychiatry, 2024. Disponível em: https://www.jaacap.org/article/S0890-8567(23)00171-5/fulltext.
  6. Hall CL, et al. Practitioner Review: Clinical utility of the QbTest for the assessment and diagnosis of attention-deficit/hyperactivity disorder — a systematic review and meta-analysis. Journal of Child Psychology and Psychiatry, 2023. PubMed PMID: 37800347. Disponível em: https://pubmed.ncbi.nlm.nih.gov/37800347/.
  7. Continuous performance tests are sensitive to ADHD in adults but lack specificity. A review and critique for differential diagnosis. 2001. PubMed PMID: 11462737. Disponível em: https://pubmed.ncbi.nlm.nih.gov/11462737/.
  8. Wearable Motion Sensors in the Detection of ADHD: A Critical Review. Springer, 2024. Disponível em: https://link.springer.com/chapter/10.1007/978-3-031-59091-7_12.
  9. Privacy, ethics, transparency, and accountability in AI systems for wearable devices. Frontiers in Digital Health, 2025. Disponível em: https://www.frontiersin.org/journals/digital-health/articles/10.3389/fdgth.2025.1431246/full.
  10. AI-driven healthcare: A review on ensuring fairness and mitigating bias. PLOS Digital Health, 2025. Disponível em: https://journals.plos.org/digitalhealth/article?id=10.1371/journal.pdig.0000864.
Dr. João Carlos Leitão, médico psiquiatra
Dr. João Carlos Leitão
Médico Psiquiatra · CRM-PE 19651 · RQE 10486 · Mestre em Autismo (ISEP, Barcelona)

Procura uma avaliação de TDAH com critério?

Mais do que tecnologia da moda, o que muda a vida é uma avaliação que olha o seu funcionamento real e termina com um plano claro. O atendimento é online e acolhe quem ainda está investigando.