de Geraldo Maia Campos 13. Transformação dos dados amostrais Razões para a transformação dos dados. Quando algum dos requisitos para o emprego da estatística paramétrica — normalidade da distribuição dos erros, homogeneidade das variâncias, e aditividade dos efeitos dos fatores de variação — não puder ser preenchido pelos dados da sua amostra experimental, o pesquisador pode ainda tentar o recurso da transformação dos dados, antes de optar pela aplicação da estatística não-paramétrica. É um recurso que sempre vale a pena tentar, porque a estatística paramétrica é evidentemente mais poderosa que a não-paramétrica. De fato, esta somente foi desenvolvida como um recurso complementar, destinado a suprir a necessidade de testes estatísticos nos casos em que alguma restrição desaconselhava o uso da estatística paramétrica, ou quando a própria natureza dos dados, muitas vezes não exatamente numéricos, vedava a aplicação desta. As transformações mais comumente utilizadas. As transformações diretas dos dados mais comumente utilizadas são: a logarítmica, a logarítmica dos (dados+1), a raíz quadrada dos dados , a raíz quadrada dos (dados + 1, ou mais 1/2), a raíz cúbica dos dados, a transformação angular, a transformação hiperbólica de primeiro grau (ou o inverso dos dados) ou hiperbólica de segundo grau, a transformação percentual, e a transformação em valores de z, já referida quando se comentaram os testes para verificar a normalidade da distribuição dos erros amostrais. A transformação mais indicada. Há sempre uma razão objetiva, em geral
bem definida matematicamente, para se optar por uma ou outra dessas transformações,
tudo dependendo de como ou por que a distribuição amostral
está se deformando e fugindo à normalidade. Só a prática,
entretanto, acaba ensinando o pesquisador a entrever qual a transformação
mais indicada. Todavia, com o advento da informática, essas transformações
se tornaram algo tão corriqueiro e tão rápido de realizar,
que o estaticista, ou o pesquisador, pode tentar todas elas em seqüência,
para ver qual a que produz o melhor resultado, gastando para isso não
mais do que alguns poucos minutos de seu precioso tempo.
Interpretação dos resultados (em dados transformados). O único cuidado que se deve ter, após transformar os dados experimentais, é passar a raciocinar em termos da natureza dos novos dados, por ocasião da discussão e da interpretação dos resultados. Por exemplo: algumas transformações invertem os valores dos dados, como é o caso da própria transformação inversa (ou hiperbólica de primeiro grau), na qual Xi = 1/xi, e da hiperbólica de segundo grau, em que Xi = 1 / xi2. A transformação logarítmica. Não se deve esquecer portanto que, uma vez
transformados os dados em logaritmos, a soma de dados logarítmicos
não tem o mesmo valor que a soma de seus antilogaritmos, mas representa
o produto destes, de modo que a média dos logaritmos não
corresponde ao logaritmo da média de seus antilogaritmos. Na verdade,
o antilogaritmo da média dos logaritmos corresponde à média
geométrica dos nados originais, e não à média
aritmética destes.
|
|
|