Tipos de Variáveis em Regressão para Avaliação de Imóveis | DataWarp

Tipos de variáveis em regressão para avaliação de imóveis: quantitativa, qualitativa e dicotômica

Por que classificar a variável corretamente importa

Antes de incluir qualquer variável em um modelo de regressão, é preciso decidir como ela vai ser representada numericamente. Essa decisão não é trivial: tratar uma variável do tipo errado pode distorcer os coeficientes, violar pressupostos do modelo e comprometer a validade do laudo — mesmo que os dados coletados estejam corretos.

A NBR 14653-2 reconhece três grandes categorias de variáveis usadas em modelos de inferência estatística para avaliação imobiliária: quantitativas, qualitativas e dicotômicas. Cada uma exige uma forma diferente de entrada no modelo.

Variável quantitativa

É a variável que representa uma quantidade mensurável em escala numérica contínua ou discreta, onde a diferença entre os valores tem significado real e proporcional. Exemplos típicos em avaliação imobiliária:

  • Área privativa ou área total (m²)
  • Distância a um polo de referência (metros ou km)
  • Idade do imóvel (anos)
  • Número de vagas de garagem

Nesses casos, a diferença entre 80 m² e 100 m² (20 m²) representa exatamente a mesma coisa que a diferença entre 150 m² e 170 m² (também 20 m²). O modelo de regressão pressupõe essa proporcionalidade — é o que permite interpretar o coeficiente como "cada m² adicional altera o valor em X reais".

Variável qualitativa codificada

Aqui está o ponto que costuma gerar confusão técnica. Uma variável qualitativa representa uma característica categórica — padrão construtivo, tipo de acabamento, classificação de localização — sem uma escala numérica natural. Para entrar no modelo, ela precisa ser codificada de alguma forma.

O erro comum é atribuir números sequenciais às categorias (código 1 = padrão baixo, código 2 = padrão médio, código 3 = padrão alto) e tratar essa variável como se fosse quantitativa no modelo de regressão.

O problema: ao tratar o código como número comum, o modelo assume que a diferença entre padrão 1 e 2 é exatamente igual à diferença entre padrão 2 e 3 — e que o efeito é linear e proporcional ao código. Isso raramente reflete a realidade do mercado. A diferença de valor entre padrão baixo e médio pode ser muito maior ou menor do que entre médio e alto.

O tratamento tecnicamente correto para variável qualitativa com mais de duas categorias é transformá-la em um conjunto de variáveis dicotômicas (uma para cada categoria, exceto uma categoria de referência) — não usar o código numérico diretamente como variável quantitativa.

Variável dicotômica (dummy)

A variável dicotômica representa a presença ou ausência de uma característica, assumindo apenas dois valores. É o instrumento correto para capturar categorias qualitativas no modelo sem impor uma falsa proporcionalidade.

Exemplos comuns:

  • Possui ou não vista para o mar (sim/não)
  • Está em condomínio fechado ou não (sim/não)
  • É esquina ou meio de quadra (sim/não)

O artigo como criar variáveis dummy em avaliações imobiliárias detalha o passo a passo de construção dessas variáveis, incluindo o caso de características com mais de duas categorias (que exigem múltiplas dummies).

0 e 1 importam, ou poderia ser qualquer outro par?

Esta é uma dúvida técnica recorrente: existe diferença prática entre codificar a dummy como 0/1, 1/2, ou qualquer outro par de números?

Matematicamente, qualquer par de valores distintos funciona dentro da álgebra da regressão — o modelo vai estimar um coeficiente proporcional à diferença entre os dois códigos escolhidos. Mas a convenção 0/1 não é arbitrária: ela é a única que preserva a interpretação direta do coeficiente.

Com codificação 0/1, o coeficiente da variável dicotômica representa exatamente o efeito médio de "ter" a característica em relação a "não ter" — mantidas as demais variáveis constantes. O intercepto do modelo passa a representar o valor esperado para o grupo codificado como 0 (a categoria de referência).

Se a codificação for 1/2, o coeficiente ainda vai capturar a diferença entre os grupos, mas a interpretação direta do intercepto muda, e a leitura do modelo fica menos intuitiva — sem nenhum ganho técnico em compensação. Por isso, a convenção 0/1 é universalmente adotada na prática estatística e deve ser seguida em avaliação imobiliária, evitando ambiguidade na interpretação dos resultados pelo cliente do laudo ou por um perito que revise o trabalho.

Variável proxy: quando nenhuma das três serve diretamente

Há situações em que a característica relevante não pode ser medida diretamente nem categorizada de forma simples — nesses casos, entra a variável proxy: uma medida indireta que substitui o atributo de interesse por correlação. O artigo variável proxy em avaliação de imóveis explora esse conceito com exemplos práticos, como o uso de índice de mercado para representar a valorização ao longo do tempo.

A proxy não é um quarto tipo fundamental de variável — ela é uma estratégia que usa variáveis quantitativas ou qualitativas para representar indiretamente algo que não está disponível nos dados.

Como decidir o tipo de variável na prática

Pergunta Se a resposta for sim
A característica tem escala numérica natural com distâncias proporcionais? Trate como variável quantitativa
A característica é categórica com apenas duas opções (presença/ausência)? Trate como variável dicotômica (0/1)
A característica é categórica com três ou mais opções, sem ordem proporcional? Crie um conjunto de variáveis dicotômicas, uma por categoria (exceto a de referência)
A característica não pode ser medida diretamente, mas há um indicador correlacionado disponível? Considere uma variável proxy

O que registrar no laudo

Para cada variável incluída no modelo, o laudo deve indicar claramente:

  • O tipo de variável (quantitativa, dicotômica, ou proxy) e a justificativa dessa classificação
  • No caso de dicotômicas: qual categoria foi definida como referência (código 0) e por quê
  • No caso de qualitativas com múltiplas categorias: como foram desdobradas em variáveis dicotômicas
  • A significância estatística de cada variável no modelo final

Um laudo que apresenta uma variável de "padrão construtivo" codificada como 1, 2, 3 e tratada como número na regressão, sem essa conversão para dicotômicas, está sujeito a questionamento técnico — independentemente de o resultado final parecer razoável.

Resumo

Tipo de variável Exemplo Como tratar no modelo
Quantitativa Área, distância, idade Valor numérico direto
Qualitativa (2 categorias) Vista para o mar: sim/não Dicotômica, codificada 0/1
Qualitativa (3+ categorias) Padrão construtivo: baixo/médio/alto Conjunto de dicotômicas, uma categoria de referência
Proxy Índice de mercado representando valorização Variável quantitativa ou qualitativa usada como substituta indireta

Experimente o Datawarp gratuitamente

Acesse a plataforma completa de avaliação imobiliária com inteligência artificial.

Começar agora →
DataWarp Logo DataWarp