Normalidade dos Resíduos em Avaliação Imobiliária | DataWarp

Normalidade dos resíduos: como testar e o que fazer se reprovar

Por que a normalidade dos resíduos importa?

A regressão linear estima coeficientes e calcula intervalos de confiança com base em premissas estatísticas. Uma delas é que os resíduos — a diferença entre o valor observado e o valor estimado pelo modelo — seguem distribuição normal com média zero.

Quando essa premissa é violada, os testes de significância (teste t dos regressores, F global) perdem confiabilidade. Os intervalos de confiança do valor ficam distorcidos, e o campo de arbítrio calculado pode não refletir a real dispersão do mercado. A NBR 14653-2 trata da verificação de normalidade nos itens 8.2.1.2 e 8.2.1.3, e exige que o laudo demonstre o atendimento a esse pressuposto.

O DataWarp gera automaticamente o gráfico de normalidade dos resíduos com todos os indicadores descritos neste artigo — histograma, QQ-plot, teste de Liliefors, mediana, assimetria e curtose — prontos para incluir no laudo.

Como verificar: as três ferramentas principais

1. Histograma dos resíduos padronizados

O histograma é a verificação visual mais direta. O procedimento correto é:

  • Padronizar os resíduos dividindo cada um pelo desvio padrão (resíduo / desvio padrão)
  • Definir o número de classes usando a regra de Sturges (k = 1 + 3,3 × log n) ou a raiz quadrada (k = √n)
  • Centralizar as classes em torno de zero, com amplitude simétrica

No histograma, você espera ver uma forma aproximadamente de sino, simétrica em torno de zero. Assimetrias pronunciadas, caudas pesadas ou múltiplos picos são sinais de problema.

A NBR 14653-2 não especifica o número exato de classes, mas a prática comum de usar 5 classes com meia classe adicional em cada extremo é aceitável para amostras pequenas — desde que as classes fiquem centralizadas e a distribuição seja avaliável visualmente.

2. Gráfico de aderência (QQ-plot)

O QQ-plot compara os quantis dos resíduos observados com os quantis esperados de uma distribuição normal teórica. Se os pontos ficarem próximos à linha diagonal, a normalidade está atendida.

Desvios nas extremidades (caudas) indicam distribuição com caudas mais pesadas que a normal — comum quando há outliers não tratados. Desvios no centro indicam achatamento ou apiculamento da distribuição.

3. Testes estatísticos: Liliefors, mediana, assimetria e curtose

A análise visual é necessária mas não suficiente. Os indicadores estatísticos quantificam o desvio da normalidade e tornam o laudo auditável.

  • Liliefors: variante do teste de Kolmogorov-Smirnov adaptada para resíduos de regressão — situação em que a média e o desvio padrão são estimados da própria amostra, não conhecidos a priori. É mais rigoroso e tecnicamente mais correto que o KS puro nesse contexto. Um p-valor abaixo de 0,05 rejeita a normalidade.
  • Mediana dos resíduos padronizados: deve ser próxima de zero. Valores distantes de zero indicam assimetria sistemática — o modelo subestima ou superestima consistentemente em uma direção.
  • Assimetria (skewness): mede o desvio da simetria em torno da média. Para uma distribuição normal, o valor esperado é zero. Valores acima de +1 ou abaixo de −1 indicam assimetria relevante.
  • Curtose: mede o peso das caudas em relação à normal. O valor esperado para uma distribuição normal é 3 (ou 0 na forma "excess kurtosis"). Curtose alta indica caudas pesadas com mais outliers do que o esperado; curtose baixa indica distribuição mais achatada.
Atenção: com amostras muito grandes, qualquer pequeno desvio da normalidade produz p-valor baixo no teste de Liliefors, mesmo que o desvio seja irrelevante na prática. Com amostras pequenas, o teste tem pouco poder. Use sempre o teste formal em conjunto com a análise visual e os demais indicadores.

O modelo reprovou — e agora?

A violação da normalidade raramente é um sinal de que o modelo deve ser descartado. Na maioria dos casos, ela aponta para algo que pode ser corrigido.

Verifique os outliers primeiro

Resíduos com caudas pesadas (curtose alta) costumam ser causados por poucos dados muito distantes da estimativa. Revise os dados com maiores resíduos padronizados e Distância de Cook elevada. Se houver erros de coleta, corrija ou remova com justificativa. Se forem dados legítimos porém atípicos, verifique se o modelo está capturando adequadamente suas características.

Considere transformações na variável dependente

Quando os valores unitários têm distribuição assimétrica à direita — o que é comum em mercados imobiliários — a transformação logarítmica da variável dependente costuma normalizar os resíduos. Um modelo em log(preço/m²) frequentemente produz resíduos mais normais do que o mesmo modelo em preço/m² direto.

A assimetria (skewness) positiva nos resíduos é um sinal claro de que essa transformação vale ser testada.

Revise a especificação do modelo

Resíduos não normais também podem indicar que o modelo está mal especificado: uma variável relevante foi omitida, uma relação não-linear não foi modelada, ou a forma funcional escolhida não representa bem o mercado. Antes de atribuir o problema à distribuição dos dados, verifique se o modelo está completo.

O que o laudo precisa mostrar

A NBR 14653-2 exige que o laudo demonstre o atendimento aos pressupostos do modelo. Para a normalidade dos resíduos, isso significa apresentar:

  • O histograma dos resíduos padronizados com a curva normal sobreposta
  • O gráfico de aderência (QQ-plot) ou equivalente
  • Os indicadores estatísticos: resultado do teste de Liliefors, mediana dos resíduos padronizados, assimetria e curtose
  • Se houver violação: a justificativa técnica e as medidas adotadas (transformação, remoção de outlier, revisão do modelo)

Apresentar apenas o histograma sem os indicadores estatísticos, ou apenas os números sem análise visual, é insuficiente. Os dois se complementam — os testes detectam desvios que o olho não vê, e os gráficos mostram onde e como o desvio ocorre.

Resumo prático

Ferramenta O que avalia Sinal de problema
Histograma Forma geral da distribuição Assimetria, múltiplos picos, caudas pesadas
QQ-plot Aderência quantil a quantil Pontos afastados da diagonal nas extremidades
Liliefors Teste formal de normalidade p-valor < 0,05
Mediana dos resíduos padronizados Viés sistemático do modelo Valor distante de zero
Assimetria (skewness) Simetria da distribuição Valor acima de +1 ou abaixo de −1
Curtose Peso das caudas Valor muito acima ou abaixo de 3
Causa provável da violação Ação recomendada
Outliers não tratados (curtose alta) Revisar dados com Cook elevado e resíduo alto
Variável dependente assimétrica (skewness positivo) Aplicar transformação logarítmica
Modelo mal especificado Revisar variáveis e forma funcional

Experimente o Datawarp gratuitamente

Acesse a plataforma completa de avaliação imobiliária com inteligência artificial.

Começar agora →
DataWarp Logo DataWarp