Estatística Prática para Docentes e Pós-Graduandos
de Geraldo Maia Campos

6. A tabela geral de dados

    O próprio título deste capítulo já sugere claramente que a tabela com os dados experimentais deva ser abrangente, única e completa. Ou, em outras palavras, todos os dados obtidos devem estar contidos numa tabela única, na qual constem todos os elementos que compõem o fator de variação colocado nas colunas, todos os que compõem as linhas, e todos os que integram os blocos, além, é claro, de todas as repetições.
    A maneira como esses três fatores são distribuídos (como colunas, linhas ou blocos) depende muito do espaço físico disponível, principalmente considerando que modernamente as tabelas são comumente elaboradas em computador, nos quais o espaço é limitado, principalmente no sentido horizontal da tela do monitor, ou seja em relação ao espaço destinado às colunas. Quanto às linhas e blocos, caso seja necessário, podem alongar-se no sentido vertical, podendo passar à página seguinte, e portanto sem qualquer problema de limitação do espaço.
    O ideal, contudo, seria que a tabela geral de dados ocupasse apenas uma página, pois isso permitiria o exame visual do conjunto de dados experimentais todos de uma só vez.
    Isso pode ser conseguido, inclusive em computadores, pela redução do tamanho dos caracteres, o que permite escrever um número maior de caracteres por linha, na tela do monitor, e também no papel quando a tabela é impressa.
    Quando o número de colunas é pequeno, os blocos poderão ser colocados lado a lado (no sentido horizontal, se o espaço permitir, de modo que a tabela terá, verticalmente, a extensão dada pelo número de linhas e de repetições. Se o número de colunas da tabela for muito grande, ocupando uma grande extensão horizontal, inviabilizando a colocação dos blocos lado a lado, estes poderão ser colocados no sentido vertical, um embaixo do outro. Neste caso, a extensão vertical será dada pelo número de linhas multiplicado pelo número de blocos e de repetições.
    Em suma, confeccionar tabelas é, na verdade, uma questão de prática, uma vez que esta acaba habilitando o pesquisador a decidir rapidamente sobre qual a melhor conformação física para qualquer tabela de dados que tenha eventualmente de construir. O que foi dito acima é apenas uma sugestão de como começar, a fim de vir um dia a adquirir essa prática.
    A seguir, estão transcritos alguns modelos de tabelas de dados, identificadas estas por letras maiúsculas. Por exemplo, tecnicamente, não se pode dizer que haja diferença entre as tabelas A, B, C e D.

    A única diferença entre as tabelas A e B reside no fato de as repetições, na tabela B, terem sido divididas em dois grupos de cinco, dentro da mesma coluna, ao invés de um só grupo com todas as dez repetições, como se vê na tabela A.
    A diferença entre essas duas primeiras tabelas (A e B) em relação às duas outras (C e D) está no fato de as repetições nestas últimas terem sido dispostas em linhas, e não em colunas, como nas duas primeiras. Por seu turno, a diferença entre as tabelas C e D está também na sua disposição em dois grupos de cinco repetições para cada linha, na tabela D, e em apenas um grupo com as dez repetições, na tabela C.
    A opção por qualquer desses quatro tipos de tabelas é apenas uma questão de conveniência, tal como a disponibilidade de espaço em função do número de colunas ou de linhas, ou a maior facilidade ou comodidade na introdução dos dados numéricos no computador, ou às vezes até mesmo por simples conveniência estética.
    Porém, do ponto de vista puramente técnico, todos os quatro tipos de tabelas apresentados são aceitáveis para esse modelo matemático de experimentos, que envolve apenas um fator de variação, esteja este colocado em colunas ou em linhas. Todavia, por uma espécie de convenção, é costume dispor os dados em colunas, e não em linhas, quando há apenas um único fator de variação, tal como se fez nas tabelas A e B.
    Mas como ficaria uma tabela que envolvesse tanto colunas como linhas?
    Imagine-se, por exemplo, um modelo experimental que envolvesse quatro Tratamentos aplicados a dois grupos de pacientes (Controle e Tratado), com cinco repetições (pacientes) em cada grupo. Como seria a tabela para esses dados experimentais? Poderia ser assim:

    No caso específico da tabela acima, essa é a configuração mais adequada — com os Tratamentos nas colunas e os grupos experimentais nas linhas. Isto porque, se os Tratamentos estivessem nas linhas e os Grupos experimentais nas colunas, a tabela ficaria muito alongada no sentido vertical, e muito estreita no sentido horizontal, tal como uma lingüiça gráfica a estender-se de cima para baixo — ou seja, antiestética e pouco prática, uma vez que, dependendo do número de repetições, poderia abranger mais de uma página de texto. Mas nada proíbe que qualquer dos fatores de variação possa ser colocado indiferentemente nas colunas ou nas linhas. É uma simples questão de conveniência gráfica. A única exigência é que as repetições fiquem reunidas na célula da tabela que corresponde ao cruzamento de uma linha com uma coluna.
    Contudo, há ainda mais um elemento que pode complicar a elaboração de uma tabela de dados: a existência de blocos, ou seja, de um terceiro fator de variação.
    Quando isso ocorre, cada bloco será uma reedição do modelo para colunas e linhas reproduzido acima, e envolverá tantas novas tabelas (com colunas e linhas) quantos forem os elementos que compõem o fator de variação a que os blocos se referem. Por exemplo: imagine-se que, além dos Tratamentos (A, B, C e D) e dos Grupos experimentais (Controle e Tratado), a pesquisa envolva também três Tempos de observação (1, 3 e 7 dias). Como ficaria a nova tabela de dados, nesse caso? Ainda nesse caso, o critério que vigora é apenas a conveniência gráfica, para decidir qual fator de variação será colocado nas colunas, qual estará nas linhas, e qual ficará nos blocos. É, portanto, pura questão de bom-senso, associado ao bom-gosto, ou ao senso estético de cada um, os quais podem ser comentados e até criticados, mas sem dúvida jamais ensinados.
    Na página seguinte há uma sugestão para a construção da tabela com os três fatores de variação acima mencionados. Essa tabela ilustrativa foi deixada deliberadamente vazia, sem nenhum dado numérico transcrito, com o propósito único de mostrar que uma tabela vazia de dados pode perfeitamente ser elaborada antes mesmo que qualquer dado experimental tenha sido obtido. À medida que a pesquisa vai se desenvolvendo, os dados irão surgindo e serão anotados na tabela vazia, até preenchê-la toda quando do final da pesquisa. Para elaborar a tabela vazia, basta saber — e isso é sempre possível — quantos são os fatores de variação, quantos elementos integram cada um deles, e qual o número de repetições estabelecido.

    Como observação derradeira no que diz respeito às tabelas, e tomando como exemplo a tabela transcrita acima, é preciso esclarecer que se consideram como pertencentes à mesma linha todas as repetições que se referem mesmo Tratamento, incluindo-se aí as repetições de todas as colunas e de todos os blocos desse Tratamento. Da mesma forma, consideram-se como pertencentes à mesma coluna todas as repetições relativas a cada um dos Tempos, independentemente das linhas e dos blocos a que estejam ligadas. E, por fim, pertencem também ao mesmo bloco todas as repetições de cada um dos grupos (Controle e Tratado, no caso da tabela que serve de exemplo), sem considerar as linhas e as colunas de cada grupo.
    Em resumo: cada Tratamento (linha) teria, na verdade, 30 repetições; cada Tempo (coluna) teria 40 repetições; e cada Grupo experimental (blocos Controle e Tratado) teria 60 repetições. O produto do número de elementos de cada fator de variação pelo número de repetições correspondente dá sempre o mesmo número, que é o número total de dados experimentais: 4 x 30 = 120, 3 x 40 = 120; e 2 x 60 = 120.
    Esse conceito de repetições em relação aos fatores de variação é importantíssimo em Estatística, pois é ele que permite avaliar o efeito exercido exclusivamente pelo fator de variação sobre o valor numérico da variável estudada, ou seja, sobre o valor do dado experimental, separando-o dos efeitos determinados pelas chamadas interações, efeitos esses que resultam da associação de cada um dos fatores de variação com os demais, combinação essa que pode muitas vezes alterar o efeito produzido por qualquer dos fatores de variação, quando considerado individualmente (ou separadamente).

Esta página foi elaborada com apoio do Programa Incentivo à Produção de Material Didático do SIAE, Pró-Reitorias de Graduação e Pós-Graduação da USP.