Como montar uma pesquisa de dados de mercado para avaliação de imóveis
Nenhum modelo estatístico salva uma pesquisa ruim. A qualidade do laudo de avaliação se decide antes da primeira regressão: na escolha das fontes, na abrangência da coleta, nas variáveis levantadas e no rigor da identificação de cada dado. Este guia organiza o processo de montagem de uma pesquisa de dados de mercado que sustenta o modelo — e resiste à revisão técnica.
O que é um "dado de mercado"?
Para a NBR 14653, dado de mercado é o conjunto de informações sobre uma transação ou oferta de imóvel: suas características físicas e de localização, o valor praticado ou pedido, a fonte da informação e a data. Cada linha da sua planilha de pesquisa é um dado de mercado — e cada coluna, uma variável potencial do modelo.
A pesquisa, portanto, tem duas dimensões de qualidade: a representatividade (os dados retratam o mercado do imóvel avaliando?) e a confiabilidade (as informações de cada dado são verdadeiras e verificáveis?).
Fontes de dados: onde pesquisar
- Portais de anúncios: a fonte mais abundante. Vantagem: volume e variedade; desvantagens: preços de oferta (não de transação), informações declaradas pelo anunciante e anúncios duplicados ou desatualizados;
- Imobiliárias e corretores locais: fonte valiosíssima para transações efetivas e para validar valores pedidos. O contato direto também permite conferir características que o anúncio omite;
- Incorporadoras e loteadoras: tabelas de venda de lançamentos, úteis especialmente em pesquisas para o método involutivo;
- Cartórios e registros (ITBI, escrituras): dados de transações reais, com a ressalva conhecida de possível subdeclaração de valores;
- Bancos de dados próprios: o ativo mais valioso do avaliador experiente. Pesquisas anteriores, devidamente datadas, alimentam trabalhos futuros na mesma região — observada a contemporaneidade;
- Outros avaliadores: a troca de dados entre profissionais é prática consagrada, desde que a fonte original seja preservada e identificável.
Quantos dados coletar?
Mais do que o mínimo da norma. A NBR 14653-2 exige, para o tratamento por regressão, ao menos 3 (k + 1) dados efetivamente utilizados — chegando a 6 (k + 1) para o Grau III de fundamentação, como detalhamos no artigo sobre grau de fundamentação e precisão. Mas a coleta deve mirar bem acima disso, por três motivos:
- Parte dos dados será descartada na triagem (duplicados, inconsistentes, fora do mercado);
- Outliers podem ser excluídos durante a modelagem — e cada exclusão aproxima o modelo do limite mínimo (veja quando excluir um dado da amostra);
- Categorias de variáveis qualitativas precisam dos seus próprios mínimos, sob pena de micronumerosidade.
Regra prática: se o modelo pretendido tem 4 variáveis e o alvo é Grau II — mínimo de 20 dados utilizados —, colete 30 a 40. A folga é o que permite modelar com liberdade.
Quais variáveis levantar em cada dado
Colete mais variáveis do que pretende usar: é muito mais barato anotar uma característica na coleta do que voltar ao dado depois. O conjunto típico:
| Grupo | Exemplos |
|---|---|
| Identificação | Endereço completo, fonte, contato, data da informação, link do anúncio |
| Valor | Preço pedido ou transacionado, condição (oferta/transação), forma de pagamento |
| Físicas | Área (privativa, total, terreno), frente, topografia, idade, padrão construtivo, vagas, quartos |
| Localização | Bairro/zona, distância a polos valorizadores, esquina, posição na quadra |
| Situação | Ocupado/desocupado, documentação, condomínio, andar (apartamentos) |
Atenção crítica à consistência do critério: se um dado usa área privativa e outro usa área total, a variável mais importante do modelo nasce contaminada. Padronize o critério de cada variável antes de coletar — e registre qual foi.
Oferta ou transação?
A norma admite dados de oferta — e na prática eles são a maioria, porque transações efetivas são difíceis de obter. Mas o preço pedido carrega a elasticidade da negociação: tende a ser superior ao preço fechado. Esse viés é tratado tecnicamente (o conhecido fator oferta), e o essencial na pesquisa é registrar a condição de cada dado — oferta ou transação — para que o tratamento posterior seja possível. Misturar os dois sem distinção é erro de coleta que nenhum modelo corrige depois.
Identificação dos dados: o que a fundamentação exige
O item de identificação dos dados de mercado pesa diretamente no grau de fundamentação. Quanto mais completa e conferível a informação, maior o grau atingível:
- Cada dado deve ter fonte identificada e contato que permita verificação;
- Para os graus mais altos, a norma valoriza a conferência das características pelo próprio autor do laudo — idealmente com visita ou foto do dado;
- Guarde evidências: capturas do anúncio com data, registro do telefonema, fotos. Anúncios saem do ar, e o laudo pode ser questionado anos depois.
Triagem: a limpeza antes do modelo
Entre a coleta e a modelagem há uma etapa silenciosa que separa pesquisas profissionais de planilhas problemáticas:
- Remova duplicidades: o mesmo imóvel anunciado em três portais, ou pela imobiliária e pelo proprietário, é um dado — não três;
- Verifique consistência interna: valor unitário calculado, área compatível com a tipologia, preço destoante do padrão do bairro merecem confirmação na fonte antes de entrar na amostra;
- Confirme a contemporaneidade: dados muito antigos exigem tratamento ou descarte; anúncios "encalhados" há mais de um ano costumam estar fora do preço;
- Confira a aderência ao mercado: o dado pertence ao mesmo segmento do avaliando? Um imóvel de leilão ou uma venda entre parentes não retratam o mercado.
Erros comuns
- Coletar apenas o mínimo de dados da norma, sem folga para triagem e exclusões.
- Misturar critérios de área (privativa, total, construída) na mesma variável.
- Não registrar a data e a fonte de cada dado.
- Contar o mesmo imóvel duas vezes por anúncios duplicados.
- Não distinguir dados de oferta e de transação.
- Coletar poucas variáveis e descobrir, na modelagem, que falta exatamente a que explicaria o mercado.
- Concentrar a coleta em uma única fonte ou um único bairro, comprometendo a representatividade.
Perguntas frequentes
Posso usar dados de outra cidade?
Em mercados rarefeitos, dados de praças com comportamento de mercado semelhante podem compor a amostra — com a diferença de localização tratada por variável no modelo (em geral, uma dummy por cidade, como mostramos no artigo de variáveis dummy). O que não se admite é misturar mercados sem qualquer tratamento.
Qual a "validade" de um dado de mercado?
A norma exige contemporaneidade entre os dados e a data de referência da avaliação, sem fixar um prazo único — mercados estáveis toleram dados mais antigos que mercados aquecidos. O essencial é registrar a data de cada dado e justificar no laudo o horizonte adotado.
Anúncio sem endereço completo serve?
Serve mal. Sem localização precisa, as variáveis de localização ficam comprometidas e a identificação do dado não atende aos graus mais altos de fundamentação. Use o contato da fonte para completar a informação — ou descarte.
Quanto tempo leva uma pesquisa bem feita?
É a etapa mais demorada da avaliação — com frequência, mais da metade do tempo total do trabalho. Coleta, conferência na fonte, padronização de critérios e triagem não têm atalho manual; o que existe é organização (banco de dados próprio bem mantido) e automação das etapas repetitivas da coleta, com a conferência permanecendo humana.
Conclusão
A pesquisa de dados é o alicerce invisível do laudo: quando bem feita, ninguém nota; quando mal feita, compromete tudo o que vem depois — modelo, fundamentação e valor. Colete com folga, padronize critérios antes de começar, registre fonte e data de cada dado, distinga oferta de transação e faça a triagem com método. O modelo de regressão apenas revela a qualidade do que entrou nele.
