Estatística Prática para Docentes e Pós-Graduandos
de Geraldo Maia Campos

15. Interpretação dos resultados

O que significam valor tabelado e valor calculado?

    É possível que alguma dúvida ainda paire no espírito de muitos daqueles que ainda estão se iniciando nos meandros desse mundo misterioso da Estatística: o que significam exatamente os valores calculados pelos diversos testes, e o que quer dizer esse misterioso valor critico das tabelas estatísticas?
    Isso, porém, não é nem tão complicado nem tão difícil de entender, mesmo que para alguns possa parecer assim. E passo a explicar por quê. 

Valor calculado, valor tabelado, e significância.

    O valor calculado, bem como os valores tabelados, resultam sempre de uma divisão por algum valor, que é tomado como denominador comum, ou termo de comparação entre as grandezas comparadas.
    Esse denominador comum, conforme o teste considerado, pode ser tanto o desvio-padrão da amostra, como a variância dos erros não-controlados, ou mesmo um valor teórico esperado. Neste caso, o esperado refere-se ao valor que seria teoricamente encontrado, caso a distribuição amostral seguisse religiosamente uma determinada distribuição matemática teórica previamente conhecida, ou pelo menos prevista por cálculos matemáticos teóricos.

Significância no teste t.

    No caso do teste t, por exemplo, o que se divide é a diferença entre as 
duas médias que se deseja comparar pelo desvio padrão comum às amostras a que elas se referem. Portanto, o valor resultante dessa divisão indica quantas vezes a distância 
que vai de uma média à outra contém a distância representada pelo valor do desvio-padrão: t = (m1 - m2) / s.

Significância na análise de variância.

    Na análise de variância, como o próprio nome sugere, a divisão se dá entre variâncias: a variância dos erros controlados (s2i) pela variância dos erros não-controlados (s2r), esta última conhecida como variância residual, ou simplesmente resíduo: F = (s2i) / (s2r).

Significância nos testes que usam o c2.

    Por sua vez, nos testes que utilizam a distribuição conhecida como 
distribuição do Qui-quadrado (c2), o que se divide é a diferença entre dois 
valores — o obtido (oi) e o esperado (ei), que comumente, porém não sempre, são freqüências — pelo valor teoricamente esperado para a variação casual, e portanto não-significante: c2 = (oi - ei )2 / ei .

Significância: observação final.

    Seja qual for o teste, portanto, o resultado será sempre o quociente de uma divisão, e o quociente de qualquer divisão sempre traduz o quantas vezes o numerador é maior (ou menor, se for inferior a 1) do que o denominador, ou seja, quantas vezes este está contido naquele.
    Assim, o resultado do teste, em última análise, apenas indica a proporção entre os erros controlado e não-controlado, embora estes erros possam receber outros nomes, dependendo do tipo de teste estatístico considerado. Mas, no fundo, são apenas variações do mesmo conceito.

A hipótese nula (H0), símbolo da igualdade estatística.

    Do exposto, é fácil concluir que, em Estatística, a igualdade não está representada propriamente pelo valor 0 (zero), mas sim pelo valor 1 (um). Esse valor 1 acontece quando o dividendo (numerador da fração que representa a razão proporcional entre os dois erros comparados) e o divisor (representado pelo denominador dessa mesma razão proporcional) são exatamente iguais. De fato, a divisão de qualquer número por si mesmo é sempre igual a 1. Ora, se o erro relativo aos fatores de variação (controlado) é igual ao erro detectado entre as repetições (não-controlado), é evidente que não pode ser considerado diferente deste último, cuja natureza é puramente casual.
    Contudo, poderá alguém argumentar, e com razão: se é assim, se a igualdade estatística ocorre quando o quociente da divisão é igual a 1, o que significa a chamada Hipótese nula (H0), que é o próprio símbolo da igualdade estatística?
    É que o zero da hipótese nula é uma reminiscência que nos ficou dos testes que avaliavam a significância das diferenças entre as médias de duas amostras comparadas — mais especificamente, do teste t de Student. Nesse caso, o zero referia-se à diferença que existiria quando as duas médias comparadas fossem iguais, circunstância em que a diferença entre elas seria 0 (zero). De fato, m1 - m2 = 0 somente quando m1 = m2 . Nesse caso, o "nula" referia-se evidentemente à hipótese de essa diferença entre as médias ser igual a zero.
    Em tempo: o símbolo H0 lê-se Hzero e não Hó, como já tenho ouvido algumas vezes. A hipótese de nulidade, portanto, refere-se à hipótese de que essas grandezas, ou essas médias, sejam estatisticamente iguais, naturalmente a um certo grau de probabilidade de que essa igualdade seja real. Por sua vez, a expressão H1 indica apenas a hipótese alternativa para H0, ou seja, a hipótese de que não haja igualdade estatística entre as grandezas confrontadas ¾ e isso, evidentemente, também a um determinado grau de probabilidade de que sejam de fato diferentes (ou não-iguais, como os estaticistas preferem dizer).

Nível de significância estatística: probabilidade.

    Mas disso tudo talvez ainda reste uma dúvida: o que seria, afinal, nível de significância? O que significaria exatamente significância estatística ao nível de 5 % de probabilidade? A expressão indica apenas que o valor calculado pelo teste (qualquer que seja este) só poderia ser encontrado, por simples variação natural do acaso, no máximo 5 vezes em 100 amostras aleatórias semelhantes. No caso da significância ao nível de 1 %, o valor encontrado pelo teste seria ainda mais difícil de obter por mero acaso, pois seria da ordem de 1 caso em 100 amostras do mesmo tipo.

Interpretação da significância e dos resultados dos testes.

    Como já foi observado páginas atrás, quando se falou do teste de Cochran para a homogeneidade das variâncias, nem sempre o mais interessante para uma determinada pesquisa é que os testes estatísticos dêem resultados significantes.
    No caso específico da homogeneidade, somente um valor não-significante seria vantajoso, pois só assim indicaria não haver diferenças estatisticamente relevantes entre as variâncias, sendo estas, pois, homogêneas, ou seja, não-discrepantes.
    Mas esse não seria um caso isolado, pois há muitos trabalhos de pesquisa em que uma não-diferença estatística seria desejável, e eu próprio já me vi diante de inúmeros casos assim. Por exemplo, imaginem dois métodos, um caríssimo e outro muito mais barato, para realizar um ensaio qualquer. Nesse caso, o mais conveniente para o pesquisador seria que o teste comparativo entre os resultados fornecidos por ambos fossem não-significantes, pois nesse caso o pesquisador estaria autorizado a usar indiferentemente um ou outro, e por certo daria preferência ao mais barato, uma vez que os resultados seriam equivalentes, a um preço menor, o que em países como o nosso, e em muitos outros, que carecem de recursos para a investigação científica, é importantíssimo.
    Outra observação importante é a que se refere ao distanciamento que muitas vezes existe entre a significância puramente matemática dos resultados estatísticos e a relevância desses mesmo resultados em termos de aplicação prática, seja em clínica, seja na vida prática em qualquer campo da atividade científica, ou simplesmente no dia-a-dia da atividade humana.

Esta página foi elaborada com apoio do Programa Incentivo à Produção de Material Didático do SIAE, Pró-Reitorias de Graduação e Pós-Graduação da USP.