O que médicos precisam saber de estatística

Dados têm tido um papel central no combate e no entendimento da pandemia, conforme o #SeCuidaDoutor já mencionou anteriormente. Nos noticiários e programas de TV é crescente o uso de alguns termos matemáticos e estatísticos a respeito da COVID-19, fato que até pouco tempo incomum —a média móvel é a celebridade da vez.

Segundo David Coggon, professor de Medicina Ocupacional e Ambiental da Universidade de Southhampton, todos os profissionais da saúde deveriam ter pelo menos um conhecimento básico de princípios relevantes da estatística.

"Eles não precisam de conhecimentos matemáticos para executar cálculos estatísticos, mas deveriam ter conhecimento suficiente de descrição estatística, valor-p e intervalo de confiança para serem capazes de interpretar resultados publicados e aplicá-los na prática", afirma.

Reunimos alguns dos indicadores e padrões mais utilizados na epidemiologia e na medicina como um todo, além de alguns caminhos para quem lida bem com os números e quer se aprofundar.

Estatística descritiva

Considerada a etapa inicial da análise utilizada para descrever e resumir dados, a estatística descritiva consiste no ramo que sumariza e descreve conjuntos de dados. Muitos dos conceitos básicos dessa área da estatística são ensinados ainda na escola, caso das médias, medianas, modas e desvio padrão.

Média: soma de n valores dividida por n.

Exemplo: um grupo é composto por 7 estudantes. Eles têm 21, 23, 23, 24, 26, 30 e 40 anos. A média é a soma das idades dividida por 7. Logo, n = 26,7.

Mediana: valor m de um conjunto de medidas, em que 50% das medidas é igual ou menor que m e 50% das medidas é igual ou maior que m.

Exemplo: considerando o grupo acima, a mediana = 24, já que 3 medidas são menores (21, 23 e 23) e 3 medidas são maiores (26, 30 e 41).

Moda: consiste no valor que ocorre com mais frequência.

Exemplo: considerando o grupo acima, a moda = 23, já que o número aparece duas vezes na amostra.

Desvio padrão: medida que expressa o grau de dispersão de um conjunto de dados. Quanto mais próximo de 0, mais homogêneo é o conjunto. Consiste na raiz quadrada da variância, que por sua vez é calculada achando a distância entre cada elemento do grupo e a média, depois elevando ao quadrado, e fazendo a média da soma desses resultados. Calma! Complicou? Confira um vídeo rápido na Khan Academy para nunca mais errar.

Exemplo: no grupo acima, a variância é calculada subtraindo cada número pela média (26,7) e elevando ao quadrado. Depois, é feita a média com esses valores. Logo, σ ≅ 6,52.

Média móvel

Citada por praticamente todos os veículos de comunicação e órgãos governamentais para indicar se as mortes pelo novo coronavírus estão aumentando ou diminuindo, a média móvel consiste na média de um fator em um determinado intervalo de tempo.

No caso da pandemia, o mais comum é observar a média de mortes ou casos nos últimos sete dias. Para se chegar a esse número, são somados os casos/mortes do dia com os 6 anteriores, para então dividir o total por 7.

Para visualizar se há tendência de crescimento ou redução, a média móvel de um dia é comparada com o da data de 14 dias atrás. Se a variação percentual entre essas médias for de até 15% (positivo ou negativo), os noticiários e autoridades públicas têm considerado que há estabilidade. Se for superior a 15%, há crescimento, e se for inferior a -15%, há retração.

Valor-p

O valor-p é uma ferramenta utilizada para medir a significância estatística de um resultado, assim como o teste de hipóteses e distribuição normal.

Nas palavras de Cassie Kozyrkov, cientista de dados do Google, o que o valor-p faz é prover resposta a uma pergunta: nossas evidências ou os dados que temos fazem com que nossa hipótese nula pareça ridícula? Se sim, então devemos assumir que nossa hipótese alternativa é verdadeira.

Também conhecido como probabilidade de significância, o valor-p é definido como a probabilidade de uma estatística de teste ser igual ou mais extrema que a observada em uma amostra, assumindo a hipótese nula como verdadeira. Caso o conceito pareça complexo demais, uma boa alternativa pode ser consultar novamente a Khan Academy ou tentar compreender a explicação do cientista de dados Admond Lee baseada em um exemplo sobre... entrega de pizza.

Onde se aprofundar

Para quem busca expandir os conhecimentos sobre estatística, há diversas opções disponíveis. Além da Khan Academy, há outras plataformas especializadas em cursos à distância que oferecem inúmeras opções, assim como sites especializados em cursos voltados para profissionais da saúde:

- Curso de Estatística, da Univesp

- Estatística Aplicada à Pesquisa, do Instituto D'Or

- Pílulas de Estatística, da Educação Médica Continuada (AMB)

- Probabilidade e Estatística, no Veduca

- E-book "Bases Estatísticas para Profissionais da Saúde"

*A Bayer não tem parceria ou se responsabiliza pelos serviços citados e prestados por terceiros.

<< voltar para Covid-19