de Geraldo Maia Campos 14. A escolha do teste mais adequado Testes paramétricos e não-paramétricos. Os testes estatísticos podem ser divididos em dois grandes grupos, conforme fundamentem ou não os seus cálculos na premissa de que a distribuição de freqüências dos erros amostrais é normal, as variâncias são homogêneas, os efeitos dos fatores de variação são aditivos e os erros independentes. Se tudo isso ocorrer, é muito provável que a amostra seja aceitavelmente simétrica, terá com certeza apenas um ponto máximo, centrado no intervalo de classe onde está a média da distribuição, e o seu histograma de freqüências terá um contorno que seguirá aproximadamente o desenho em forma de sino da curva normal. O cumprimento desses requisitos condiciona pois a primeira escolha do pesquisador, uma vez que, se forem preenchidos, ele poderá utilizar a estatística paramétrica, cujos testes são em geral mais poderosos do que os da estatística não-paramétrica, e conseqüentemente devem ter a preferência do investigador, quando o seu emprego for permitido. O que são testes paramétricos? Os termos paramétrico e não-paramétrico referem-se à média e ao desvio-padrão, que são os parâmetros que definem as populações que apresentam distribuição normal. Essa observação já foi feita e repetida muitas vezes neste texto. Volto a reafirmá-la, todavia, porque tenho visto muitas vezes artigos científicos, além de trabalhos e teses acadêmicas, em que se usaram testes não-paramétricos, mas os resultados eram apresentados em termos de média ± desvio-padrão da distribuição, ou então em termos de média ± erro-padrão da média, erro este que é também um valor calculado em função do desvio-padrão da amostra. Os parâmetros da curva normal. Ora, de qualquer conjunto de valores numéricos pode-se calcular a média, porém, desvio-padrão, somente as curvas normais o possuem, uma vez que, por definição, "desvio-padrão é o ponto de inflexão da curva normal" — e de mais nenhuma outra. São eles em número de dois e simétricos em relação à média da distribuição. Portanto, curvas assimétricas jamais podem ter desvio-padrão porque, mesmo que tenham pontos de inflexão, como os possuem muitas outras curvas matemáticas, eles dificilmente seriam simétricos em relação à média. Enfim, mesmo que distribuições experimentais possam apresentar alguma assimetria, esta deve manter-se dentro de certos limites, aceitáveis em termos estatísticos — e aceitáveis porque atribuídos à variação casual determinada pelos erros não-controlados de amostragem, ou seja, à variação do acaso, típica das variáveis e amostras chamadas aleatórias. Desvio-padrão e testes não-paramétricos. Quando um pesquisador utiliza testes não-paramétricos, supõe-se que a distribuição de seus dados experimentais não seja normal, ou que ele não tenha elementos suficientes para poder afirmar que seja. Na dúvida quanto a essa informação, nada impede que ele opte pelo uso da estatística não-paramétrica. O que ele não pode fazer, de modo algum, é argumentar em termos de desvios ou erros padrões, embora possa perfeitamente fazê-lo pura e simplesmente em termos de médias. Qual teste usar, sejam paramétricos ou não-paramétricos? Qualquer que seja pois a opção do pesquisador,
a essa altura de sua investigação científica ele se
acha diante de mais um dilema: qual, dentre os muitos testes estatísticos
existentes em ambas as categorias acima citadas, seria o mais apropriado,
no caso específico de seu trabalho, ou do modelo matemático
de seus ensaios? Que elementos desse modelo matemático condicionariam
a opção por um ou outro desses testes?
a) a existência ou não de vinculação entre
dois ou mais fatores de variação;
De fato, seja qual for o tipo de estatística
escolhida, paramétrica ou não-paramétrica, há
testes especificamente destinados a amostras em que há independência
entre os fatores de variação, e outros para amostras em que
existe vinculação ou dependência entre eles.
Alguns desses testes usam números como variável, outros usam sinais + e – , outros usam valores fixos, como 1 e 0, e outros ainda utilizam freqüências. Esses testes evidentemente estão todos incluídos no grupo dos testes não-paramétricos, simplesmente porque não usam os parâmetros média e desvio-padrão em seus cálculos. A filosofia de cada teste estatístico. Após a conclusão destes conceitos iniciais
e dos conhecimentos básicos que se deve ter sobre os métodos
estatísticos, serão incluídos neste texto alguns breves
comentários sobre cada um dos testes listados acima. São
resumos sobre o que chamei de Filosofia do Teste, e neles procurei dar
uma idéia geral sobre o que tinha em mente o criador de cada um
deles, e a quais modelos matemáticos eles se adaptam, bem como em
quais circunstâncias cada qual poderia ser utilizado.
Apresentação dos resultados dos testes. Uma vez realizados os testes adequados, estes dão o seu parecer, sob a forma de um valor numérico, apresentado (conforme o teste) como valor de F (análise de variância), de t (teste t, de Student), U (Mann-Whitney), Q (teste de Cochran), c² (letra grega qui, testes diversos, que usam o chamado qui-quadrado), z (McNemar e Wilcoxon), H (Kruskal-Wallis), ou r (letra grega rho, utilizada nos testes de correlação, que serão focalizados mais adiante, neste texto). Não-significância estatística (H0). Seja como for, o valor numérico calculado
pelo teste deve ser confrontado com valores críticos, que constam
em tabelas apropriadas a cada teste. Essas tabelas geralmente associam
dois parâmetros, que permitem localizar o valor crítico tabelado:
nível de probabilidades (usualmente 5 % [a
= 0,05], ou 1 % [a = 0,01]), e o número
de graus de liberdade das amostras comparadas.
Significância estatística (H1). Porém, se o valor calculado for igual ou maior
que o tabelado, aceita-se a chamada hipótese alternativa (H1),
ou seja, a hipótese de que as amostras comparadas não podem
ser consideradas iguais, pois o valor calculado supera aquele que se deveria
esperar, caso fossem iguais, lembrando sempre que a igualdade, em Estatística,
não indica uma identidade. Isso quer dizer que pode eventualmente
haver alguma diferença, mas esta não deve ultrapassar determinados
limites, dentro dos quais essa diferença decorre apenas da variação
natural do acaso, típica da variação entre as repetições
do ensaio.
|
|
|