Estatística Prática para Docentes
e Pós-Graduandos
de Geraldo Maia Campos
15. Interpretação dos resultados
O que significam valor tabelado e valor calculado?
É possível que alguma dúvida
ainda paire no espírito de muitos daqueles que ainda estão
se iniciando nos meandros desse mundo misterioso da Estatística:
o que significam exatamente os valores calculados pelos diversos testes,
e o que quer dizer esse misterioso valor critico das tabelas estatísticas?
Isso, porém, não é nem tão
complicado nem tão difícil de entender, mesmo que para alguns
possa parecer assim. E passo a explicar por quê.
Valor calculado, valor tabelado, e significância.
O valor calculado, bem como os valores tabelados,
resultam sempre de uma divisão por algum valor, que é tomado
como denominador comum, ou termo de comparação entre as grandezas
comparadas.
Esse denominador comum, conforme o teste considerado,
pode ser tanto o desvio-padrão da amostra, como a variância
dos erros não-controlados, ou mesmo um valor teórico esperado.
Neste caso, o esperado refere-se ao valor que seria teoricamente encontrado,
caso a distribuição amostral seguisse religiosamente uma
determinada distribuição matemática teórica
previamente conhecida, ou pelo menos prevista por cálculos matemáticos
teóricos.
Significância no teste t.
No caso do teste t, por exemplo, o que se divide
é a diferença entre as
duas médias que se deseja comparar pelo desvio padrão
comum às amostras a que elas se referem. Portanto, o valor resultante
dessa divisão indica quantas vezes a distância
que vai de uma média à outra contém a distância
representada pelo valor do desvio-padrão: t = (m1 - m2)
/ s.
Significância na análise de variância.
Na análise de variância, como o próprio
nome sugere, a divisão se dá entre variâncias: a variância
dos erros controlados (s2i) pela variância
dos erros não-controlados (s2r), esta última
conhecida como variância residual, ou simplesmente resíduo:
F = (s2i) / (s2r).
Significância nos testes que usam o c2.
Por sua vez, nos testes que utilizam a distribuição
conhecida como
distribuição do Qui-quadrado (c2),
o que se divide é a diferença entre dois
valores — o obtido (oi) e o esperado (ei), que
comumente, porém não sempre, são freqüências
— pelo valor teoricamente esperado para a variação casual,
e portanto não-significante: c2
= (oi - ei )2 / ei .
Significância: observação final.
Seja qual for o teste, portanto, o resultado será
sempre o quociente de uma divisão, e o quociente de qualquer divisão
sempre traduz o quantas vezes o numerador é maior (ou menor, se
for inferior a 1) do que o denominador, ou seja, quantas vezes este está
contido naquele.
Assim, o resultado do teste, em última análise,
apenas indica a proporção entre os erros controlado e não-controlado,
embora estes erros possam receber outros nomes, dependendo do tipo de teste
estatístico considerado. Mas, no fundo, são apenas variações
do mesmo conceito.
A hipótese nula (H0), símbolo da igualdade
estatística.
Do exposto, é fácil concluir que, em
Estatística, a igualdade não está representada propriamente
pelo valor 0 (zero), mas sim pelo valor 1 (um). Esse valor 1 acontece quando
o dividendo (numerador da fração que representa a razão
proporcional entre os dois erros comparados) e o divisor (representado
pelo denominador dessa mesma razão proporcional) são exatamente
iguais. De fato, a divisão de qualquer número por si mesmo
é sempre igual a 1. Ora, se o erro relativo aos fatores de variação
(controlado) é igual ao erro detectado entre as repetições
(não-controlado), é evidente que não pode ser considerado
diferente deste último, cuja natureza é puramente casual.
Contudo, poderá alguém argumentar,
e com razão: se é assim, se a igualdade estatística
ocorre quando o quociente da divisão é igual a 1, o que significa
a chamada Hipótese nula (H0), que é o próprio
símbolo da igualdade estatística?
É que o zero da hipótese nula é
uma reminiscência que nos ficou dos testes que avaliavam a significância
das diferenças entre as médias de duas amostras comparadas
— mais especificamente, do teste t de Student. Nesse caso, o zero referia-se
à diferença que existiria quando as duas médias comparadas
fossem iguais, circunstância em que a diferença entre elas
seria 0 (zero). De fato, m1 - m2 = 0 somente quando
m1 = m2 . Nesse caso, o "nula" referia-se evidentemente
à hipótese de essa diferença entre as médias
ser igual a zero.
Em tempo: o símbolo H0 lê-se
Hzero e não Hó, como já tenho ouvido algumas vezes.
A hipótese de nulidade, portanto, refere-se à hipótese
de que essas grandezas, ou essas médias, sejam estatisticamente
iguais, naturalmente a um certo grau de probabilidade de que essa igualdade
seja real. Por sua vez, a expressão H1 indica apenas
a hipótese alternativa para H0, ou seja, a hipótese
de que não haja igualdade estatística entre as grandezas
confrontadas ¾ e isso, evidentemente, também a um determinado
grau de probabilidade de que sejam de fato diferentes (ou não-iguais,
como os estaticistas preferem dizer).
Nível de significância estatística: probabilidade.
Mas disso tudo talvez ainda reste uma dúvida:
o que seria, afinal, nível de significância? O que significaria
exatamente significância estatística ao nível de 5
% de probabilidade? A expressão indica apenas que o valor calculado
pelo teste (qualquer que seja este) só poderia ser encontrado, por
simples variação natural do acaso, no máximo 5 vezes
em 100 amostras aleatórias semelhantes. No caso da significância
ao nível de 1 %, o valor encontrado pelo teste seria ainda mais
difícil de obter por mero acaso, pois seria da ordem de 1 caso em
100 amostras do mesmo tipo.
Interpretação da significância e dos resultados
dos testes.
Como já foi observado páginas atrás,
quando se falou do teste de Cochran para a homogeneidade das variâncias,
nem sempre o mais interessante para uma determinada pesquisa é que
os testes estatísticos dêem resultados significantes.
No caso específico da homogeneidade, somente
um valor não-significante seria vantajoso, pois só assim
indicaria não haver diferenças estatisticamente relevantes
entre as variâncias, sendo estas, pois, homogêneas, ou seja,
não-discrepantes.
Mas esse não seria um caso isolado, pois
há muitos trabalhos de pesquisa em que uma não-diferença
estatística seria desejável, e eu próprio já
me vi diante de inúmeros casos assim. Por exemplo, imaginem dois
métodos, um caríssimo e outro muito mais barato, para realizar
um ensaio qualquer. Nesse caso, o mais conveniente para o pesquisador seria
que o teste comparativo entre os resultados fornecidos por ambos fossem
não-significantes, pois nesse caso o pesquisador estaria autorizado
a usar indiferentemente um ou outro, e por certo daria preferência
ao mais barato, uma vez que os resultados seriam equivalentes, a um preço
menor, o que em países como o nosso, e em muitos outros, que carecem
de recursos para a investigação científica, é
importantíssimo.
Outra observação importante é
a que se refere ao distanciamento que muitas vezes existe entre a significância
puramente matemática dos resultados estatísticos e a relevância
desses mesmo resultados em termos de aplicação prática,
seja em clínica, seja na vida prática em qualquer campo da
atividade científica, ou simplesmente no dia-a-dia da atividade
humana. |