Teste t e significância dos regressores: o que significa rejeitar β = 0
Toda saída de regressão traz, ao lado de cada coeficiente, um teste de significância — e da leitura dele dependem decisões importantes: a variável fica ou sai? O modelo atinge o grau pretendido? O que exatamente significa uma variável "significante a 5%"? Este artigo explica a lógica do teste t dos regressores, os limites que a NBR 14653-2 estabelece para cada grau de fundamentação e o que fazer quando uma variável importante teima em não passar.
A pergunta que o teste responde
Cada coeficiente estimado pelo modelo carrega incerteza: ele foi calculado a partir de uma amostra, e outra amostra do mesmo mercado produziria um número um pouco diferente. O teste t enfrenta a dúvida fundamental: o efeito desta variável é real, ou o coeficiente diferente de zero é apenas acaso amostral?
Formalmente, testa-se a hipótese nula de que o coeficiente verdadeiro é zero (β = 0) — ou seja, de que a variável não tem efeito sobre o valor. O teste calcula a estatística t, que é essencialmente a razão entre o coeficiente estimado e seu erro padrão:
t = coeficiente ÷ erro padrão do coeficiente
A intuição é direta: um coeficiente grande em relação à sua própria incerteza (t elevado, em módulo) dificilmente seria fruto do acaso — e a hipótese nula é rejeitada. Um coeficiente pequeno em relação ao erro padrão (t próximo de zero) é compatível com efeito nenhum — e a variável não se sustenta.
Nível de significância: o risco que se aceita correr
Rejeitar β = 0 nunca é certeza — é decisão sob risco controlado. O nível de significância é a probabilidade de rejeitar a hipótese nula quando ela era verdadeira: concluir que a variável tem efeito quando, na verdade, não tem.
Na prática, a saída do software reporta para cada variável o nível de significância observado (o famoso p-valor): a probabilidade de obter um t tão extremo quanto o calculado se o efeito verdadeiro fosse zero. A regra de decisão: significância observada menor que o limite adotado → variável aceita.
Detalhe técnico que a norma explicita: os limites se referem ao teste bicaudal — o somatório das probabilidades das duas caudas da distribuição. Verifique como seu software reporta (algumas saídas apresentam a significância unicaudal, que corresponde à metade), porque confundir as duas convenções muda o enquadramento.
Os limites da NBR 14653-2 por grau de fundamentação
A norma estabelece o nível de significância máximo admitido para cada regressor, como um dos itens — e item condicionante — da tabela de fundamentação:
| Grau de fundamentação | Significância máxima de cada regressor (bicaudal) | Significância máxima do modelo (teste F) |
|---|---|---|
| Grau III | 10% | 1% |
| Grau II | 20% | 2% |
| Grau I | 30% | 5% |
Duas leituras importantes dessa tabela:
- Vale para todas as variáveis. Uma única variável com significância de 12% limita o item ao Grau II — e, por ser condicionante, trava o enquadramento global do laudo nesse teto, como explicamos no artigo sobre grau de fundamentação e precisão;
- O teste F é outra verificação, não a mesma. O F testa a significância do modelo como um todo (a hipótese de que todos os coeficientes são simultaneamente zero). Modelo com F excelente e variáveis individuais fracas é combinação possível — e é a assinatura clássica de multicolinearidade.
Interpretando direito: o que o teste diz e o que não diz
- Significância não é importância. O teste diz que o efeito é distinguível de zero — não que é grande. Uma variável pode ser altamente significante com efeito economicamente irrelevante (comum em amostras grandes) ou ter efeito relevante mal estimado (comum em amostras pequenas);
- Não passar no teste não prova efeito nulo. Significa que a amostra não teve força para demonstrar o efeito — por poucos dados, pouca variação da característica na amostra, ou redundância com outra variável;
- O teste pressupõe resíduos bem comportados. Com heterocedasticidade ou não normalidade severa, os erros padrão saem distorcidos e as significâncias reportadas perdem o lastro — por isso o checklist de resíduos antecede a leitura dos testes, não o contrário.
Quando a variável importante não passa: o roteiro
A variável que o conhecimento de mercado diz ser relevante veio com significância de 35%. Antes de descartá-la — e antes de aceitar o rebaixamento do grau —, percorra as causas tratáveis:
1. Forma funcional. A relação pode ser curva e o modelo a tratou como reta — o efeito existe, mas mal especificado se dilui. Teste as transformações compatíveis com o comportamento esperado.
2. Multicolinearidade. Se a variável divide informação com outra, ambas saem enfraquecidas. A matriz de correlações e o teste do par suspeito esclarecem.
3. Pouca variação na amostra. Se quase todos os dados têm a mesma característica (todos os imóveis com 2 quartos, distâncias quase iguais), não há contraste para estimar o efeito. É problema de coleta — resolve-se diversificando a pesquisa de dados, não de fórmula.
4. Dados insuficientes na categoria. Para dummies, significância fraca e micronumerosidade costumam andar juntas: o coeficiente apoiado em poucos dados sai com erro padrão enorme.
5. Esgotadas as causas: a variável sai. Se nada disso resolve, a amostra não sustenta o efeito — e mantê-la no modelo compromete o enquadramento sem agregar explicação confiável. Registre no laudo que a variável foi testada e o motivo da exclusão: isso documenta diligência e antecipa o questionamento óbvio do revisor ("por que não considerou X?").
Erros comuns
- Confundir significância unicaudal com bicaudal no enquadramento.
- Declarar Grau III com alguma variável entre 10% e 20% de significância.
- Ler significância como importância econômica do efeito.
- Excluir sumariamente a variável fraca sem investigar forma funcional, colinearidade e amostra.
- Confiar nas significâncias de um modelo cujos resíduos violam os pressupostos.
- Aprovar o modelo pelo teste F ignorando variáveis individuais reprovadas — o enquadramento exige os dois.
Perguntas frequentes
Significância de 10% não é um critério "frouxo" comparado aos 5% da ciência?
Os 5% acadêmicos são convenção de pesquisa, não lei natural. A norma calibrou os limites à realidade das amostras de avaliação — menores e mais ruidosas que as de laboratório — escalonando o rigor pelos graus: 10% para o grau máximo, com tolerâncias maiores nos graus inferiores, compensadas pelos demais itens de fundamentação.
O intercepto (constante) também precisa passar no teste?
A exigência da norma recai sobre os regressores — as variáveis explicativas. O intercepto tem papel estrutural no modelo (e nas dummies, representa a categoria de referência); sua significância individual não é item de enquadramento.
Posso usar significância unicaudal se o sinal esperado é conhecido?
O teste unicaudal existe na estatística, mas o enquadramento normativo se refere ao somatório das duas caudas. Para efeito de grau de fundamentação, trabalhe com a convenção bicaudal — e confira qual delas seu software reporta.
Variável significante com sinal errado: mantenho?
Não — significância não absolve incoerência. Sinal contrário ao comportamento de mercado indica colinearidade, variável faltante ou vício amostral, e o modelo precisa ser revisto. Coeficiente que o avaliador não consegue defender perante o mercado não pertence ao laudo, por melhor que seja seu t.
Conclusão
O teste t responde uma pergunta modesta — este efeito se distingue do acaso? — e o enquadramento da norma a transforma em régua objetiva: 10%, 20% ou 30%, conforme o grau pretendido, para cada variável, sem exceção. A leitura madura do teste evita os dois extremos: nem a fé cega no p-valor (que ignora resíduos, coerência e importância econômica), nem o descarte apressado da variável fraca (que muitas vezes só precisava de outra forma funcional ou de mais dados). Significância se constrói com especificação e amostra — o teste apenas confere.
