R² na avaliação de imóveis: por que coeficiente alto não significa modelo bom

É o número mais olhado — e mais mal interpretado — de toda a saída da regressão. O R² virou, na prática de muitos avaliadores, uma nota do modelo: 0,90 é "ótimo", 0,60 é "fraco", e a modelagem se transforma numa caçada para empurrar o número para cima. Este artigo explica o que o coeficiente de determinação realmente mede, o que ele não mede, e por que alguns dos piores modelos têm os R² mais bonitos.

O que o R² mede

O R² (coeficiente de determinação) mede a proporção da variação da variável dependente que o modelo consegue explicar. Um R² de 0,85 significa: das diferenças de valor entre os imóveis da amostra, 85% são explicadas pelas variáveis do modelo; os 15% restantes ficam nos resíduos — dispersão natural do mercado, características não modeladas, erros de medição.

Ele varia de 0 (o modelo não explica nada além da média) a 1 (ajuste perfeito). E só. O R² é uma medida de ajuste na amostra — não de correção, não de validade, não de capacidade de prever imóveis fora dela.

R² ajustado: o irmão mais honesto

O R² comum tem um vício de fábrica: ele nunca diminui quando se adiciona uma variável ao modelo — qualquer variável, mesmo um ruído sem relação com o mercado, faz o número subir um pouco. Empilhar variáveis infla o R² artificialmente.

O R² ajustado corrige isso penalizando o número de variáveis em relação ao tamanho da amostra: ele só sobe se a variável adicionada explica mais do que custa em graus de liberdade. Por isso:

Para comparar modelos com quantidades diferentes de variáveis, use sempre o ajustado;
Uma distância grande entre R² e R² ajustado é sintoma de modelo carregado de variáveis pouco úteis;
Em amostras pequenas com muitas variáveis, o R² comum vira quase ficção — e a amostra pequena com muitas variáveis já é, por si, um problema de quantidade mínima e micronumerosidade.

O que o R² não diz

Aqui mora o perigo. Um R² alto não garante:

Pressupostos atendidos: o modelo pode ter resíduos heterocedásticos, não normais e com padrão sistemático — e R² de 0,92. Os testes de significância estariam comprometidos do mesmo jeito (o roteiro de verificação está no nosso checklist de análise de resíduos);
Coeficientes interpretáveis: variáveis redundantes inflam o ajuste e destroem a leitura individual dos efeitos — a assinatura da multicolinearidade é justamente o modelo "bom no conjunto" com coeficientes sem sentido;
Ausência de sobreajuste: excluir dados até a amostra ficar comportada, ou ajustar o modelo aos acidentes da amostra, produz R² altíssimo e modelo que não representa o mercado — apenas decora aqueles dados (sobre exclusões, veja quando excluir um dado da amostra);
Coerência econômica: sinal trocado e magnitude absurda convivem tranquilamente com ajuste alto;
Validade fora da amostra: o R² nada diz sobre o comportamento do modelo em extrapolações.

A armadilha da comparação entre y e ln(y)

Detalhe técnico que derruba muita análise: o R² de um modelo com a variável dependente em y não é comparável ao de um modelo com ln(y). São variâncias de variáveis diferentes sendo explicadas — escalas distintas, números incomensuráveis. Escolher entre as duas especificações pelo R² é comparar laranjas com logaritmos de laranja; a decisão correta passa pela análise dos resíduos e pela coerência da especificação, como detalhamos no artigo de transformações de variáveis.

E qual R² é "aceitável"?

A pergunta inevitável — e a resposta incômoda: a NBR 14653-2 não exige R² mínimo. O coeficiente de determinação sequer integra os itens de pontuação do grau de fundamentação, que olha quantidade de dados, significâncias, extrapolação e identificação — nunca o R².

E há uma razão profunda para isso: o R² alcançável é uma característica do mercado, não um mérito do avaliador. Mercados homogêneos (apartamentos padronizados de um mesmo bairro) rendem R² altos com facilidade; mercados heterogêneos (imóveis comerciais variados, terrenos em cidade pequena) têm dispersão natural que nenhuma modelagem honesta elimina. Um R² de 0,70 num mercado difícil pode ser excelente trabalho; um 0,95 num mercado fácil pode ser trivial — ou suspeito.

O reflexo legítimo da dispersão no laudo não é o R²: é a amplitude do intervalo de confiança, capturada pelo grau de precisão. O mercado disperso aparece onde deve aparecer — na precisão reportada — e não numa nota de corte artificial.

O ciclo vicioso da caçada ao R²

Vale nomear o padrão, porque ele é comum:

O avaliador (ou o contratante) fixa mentalmente um R² alvo;
Para alcançá-lo, excluem-se os dados que "atrapalham" — cada exclusão sobe o R² e encolhe a amostra;
Adicionam-se variáveis até o número fechar — cada uma custa graus de liberdade e convida a multicolinearidade;
O resultado: R² de vitrine, amostra mutilada, coeficientes frágeis, micronumerosidade à espreita e um modelo que descreve a amostra editada — não o mercado.

O modelo honesto aceita a dispersão que o mercado tem, reporta a precisão correspondente e mantém os dados legítimos — mesmo os incômodos.

Erros comuns

Usar o R² como critério único (ou principal) de qualidade do modelo.
Comparar R² entre modelos com variável dependente diferente (y vs. ln(y)).
Comparar modelos com números diferentes de variáveis pelo R² comum em vez do ajustado.
Excluir dados legítimos para subir o ajuste.
Rejeitar um modelo sólido por R² "baixo" em mercado naturalmente disperso.
Prometer ao contratante um R² que o mercado local não comporta.

Perguntas frequentes

Existe R² mínimo na norma?

Não. A NBR 14653-2 condiciona o grau de fundamentação a quantidade de dados, significância dos regressores e do modelo, extrapolação e identificação dos dados — o R² não pontua nem condiciona nada.

Por que meu R² caiu quando removi uma variável insignificante?

Porque o R² comum sempre cai (ou estagna) ao remover qualquer variável — é matemático, não informativo. Olhe o R² ajustado: se ele subiu ou ficou estável, a remoção foi saudável.

R² e coeficiente de correlação são a mesma coisa?

São parentes: na regressão, o coeficiente de correlação do modelo é a raiz quadrada do R² (um R² de 0,81 corresponde a correlação de 0,90). Atenção para não confundir essa correlação do modelo com as correlações entre variáveis independentes, que servem ao diagnóstico de multicolinearidade.

Meu contratante exige R² mínimo em normativo interno. E agora?

Exigências contratuais existem e devem ser atendidas — mas com método: amplie e qualifique a pesquisa, melhore a especificação, nunca mutile a amostra. E quando o mercado comprovadamente não comporta o alvo, o caminho profissional é documentar a dispersão do mercado e dialogar com o contratante, não fabricar o número.

Conclusão

O R² responde a uma única pergunta — quanto da variação da amostra o modelo explica — e a prática o promoveu a juiz de tudo. Modelo bom é o que passa no conjunto: resíduos limpos, coeficientes significantes e coerentes, amostra íntegra, enquadramento honesto. Nesse conjunto, o R² é um indicador entre vários, e dos menos decisivos. Desconfie de quem apresenta o modelo pelo R² — e dos modelos cujo R² parece bom demais para o mercado que descrevem.