Dicionário de Dados | Inteligência de Mercado Colliers (AS-IS)
colliers inteligencia-mercado dicionario spec
Dicionário de dados extraído da planilha modelo enviada por Leandro Braga em 24/04/2026, recebida em 25/04 e analisada nesta data. Fonte: colliers_inteligencia_mercado_modelo_dados.xlsx. A planilha veio sem dados sensíveis — apenas estrutura e amostras anonimizadas (ocupantes “A”, “B”, “C”, “D”; proprietários “D”, “E”). Esta versão é as-is (foto fiel do que existe). A versão to-be está em inteligencia-mercado-asis-vs-tobe.
Visão geral
A planilha tem 8 abas, organizadas em 2 segmentos × 4 entidades:
| Segmento | BASE (temporal) | FICHA (estática) | VENDA (transações) | CONTROLE (pesquisa) |
|---|---|---|---|---|
| Office (escritórios corporativos) | BASE OFFICE | FICHA TÉCNICA OFFICE | VENDA OFFICE | CONTROLE OFFICE |
| Logística (condomínios industriais) | BASE LOGÍSTICA | FICHA TÉCNICA LOGÍSTICA | VENDA LOGÍSTICA | CONTROLE LOGÍSTICA |
Granularidade da BASE:
- Office: imóvel × andar × conjunto × trimestre
- Logística: imóvel × galpão × módulo × trimestre
Identificadores observados (inconsistentes — ver dores):
| Aba | Nome do campo de ID | Faixa observada |
|---|---|---|
| BASE OFFICE | ID | 500048 (escritórios começam em 5xxxxx) |
| FICHA TÉCNICA OFFICE | ID | 500048 |
| VENDA OFFICE | ID | 68149 (faixa diferente!) |
| CONTROLE OFFICE | ID | — |
| BASE LOGÍSTICA | ID_Novo | 600186 (logística começa em 6xxxxx) |
| FICHA TÉCNICA LOGÍSTICA | ID_Colliers | 600186 |
| VENDA LOGÍSTICA | (nenhum) | match por nome do imóvel — texto livre |
| CONTROLE LOGÍSTICA | ID_Novo | — |
Integrações externas já presentes:
- SiiLa —
ID_SiiLa,Nome_Empreendimento_SiiLaem FICHA TÉCNICA (Office + Logística). - Buildings —
ID_Buildings,Nome_Empreendimento_Buildingsem FICHA TÉCNICA (Office + Logística). - Fundos imobiliários (CVM) —
Ticker fundo+Saída previstaem CONTROLE OFFICE (não está em CONTROLE LOGÍSTICA).
Segmento 1 — Office (escritórios corporativos)
1.1 BASE OFFICE — BASE OFFICE
Granularidade: uma linha = um conjunto (ou andar inteiro) de um empreendimento, em um trimestre específico. Cardinalidade observada na amostra: 7 linhas (1 imóvel × 7 conjuntos × 1 trimestre).
| # | Coluna | Tipo inferido | Exemplo amostra | Comentário | Crítica |
|---|---|---|---|---|---|
| A | ID | int (PK do imóvel) | 500048 | Liga a FICHA TÉCNICA OFFICE.ID e CONTROLE OFFICE.ID | OK |
| B | Tipo | enum | ”Escritório” | Provável valor único na aba; redundante com nome da aba | Denormalizado |
| C | Mercado | enum | ”São Paulo” | Cidade ou região metropolitana | OK |
| D | Nome_Empreendimento | string | ”Rochaverá Corporate Towers - Torre A (Ebony Tower)“ | Repetido em cada linha do imóvel | Denormalizado |
| E | Região | enum | ”Chucri Zaidan” | Bairro ou sub-mercado dentro da cidade | OK |
| F | Classe | enum | ”A+“ | Categorias: A+, A, B, C (provável) | OK (validar enum) |
| G | Data_de_Entrega | datetime | 2008-08-01 | Data de inauguração do imóvel | Denormalizado (deveria estar só em FICHA) |
| H | STATUS | enum | ”Concluído” | Provavelmente: Concluído, Em construção, Projeto | Denormalizado |
| I | ANDAR | string | ”2”, “3”, “4”, “5” | Pode ser número ou texto (“Térreo”?) | OK |
| J | CONJUNTO | string | ”Andar inteiro”, “54”, “51” | Tipo misto: número (sala) ou texto (“Andar inteiro”) | Tipo misto frágil |
| K | Area_Conjunto | float (m²) | 1420.28 | Área privativa do conjunto | OK |
| L | Trimestre | string | ”2016 1T” | Formato YYYY NT — não-ordenável lexicalmente sem parsing | Formato frágil |
| M | Ocupante | string (anonimizado) | “A”, “B”, “C” | Identificador da empresa ocupante; vazio = vago | OK |
| N | Segmento | enum | (vazio na amostra) | Setor da empresa ocupante (TI, financeiro, etc.) | OK quando preenchido |
| O | Absorção | int (0/1) | (vazio na amostra) | 1 = nova ocupação no trimestre | Derivável de Ocupante vs Ocupante_Devolução |
| P | Devolução | int (0/1) | (vazio na amostra) | 1 = devolução no trimestre | Derivável |
| Q | Preço | float (R$/m²) | (vazio) | Preço de locação por m² | OK |
| R | Condomínio | float (R$/m²) | 28.2 | Condomínio por m² | OK |
| S | IPTU | float (R$/m²) | 7.6 | IPTU por m² | OK |
| T | Proprietário_Grupo | string (anonimizado) | “D” | Grupo proprietário (não fundo individual) | OK |
| U | Ocupante_Devolução | string (anonimizado) | “A”, “B”, “C” | Ocupante anterior (espelho do trimestre passado) | OK; chave para derivar absorção/devolução |
| V | Administração | string | (vazio) | Empresa que administra o imóvel | Conceito separado de proprietário |
| W | Comercialização | string | (vazio) | Empresa exclusivista de comercialização | Pode ser Colliers, JLL, CBRE etc. |
| X | Empresa_Locacao | string | (vazio) | Empresa que efetivou a locação | Conceito misturado com Comercialização? |
Dores específicas desta aba:
- D1: Cada linha replica 7 campos do imóvel (B, C, D, E, F, G, H) — viola normalização. Mudança de nome do empreendimento exige update em N linhas.
- D2:
CONJUNTOmistura tipos (número e texto “Andar inteiro”). - D3:
Trimestreem formato"YYYY NT"não permite ordenação lexicográfica natural. - D4: 4 colunas de “papel comercial” (Proprietário_Grupo, Administração, Comercialização, Empresa_Locacao) sobrepostas — papéis confusos e nem sempre exclusivos.
- D5: Absorção e Devolução são deriváveis (não deveriam ser inputs manuais).
1.2 FICHA TÉCNICA OFFICE — FICHA TÉCNICA OFFICE
Granularidade: uma linha = um imóvel.
| # | Coluna | Tipo inferido | Exemplo amostra | Comentário |
|---|---|---|---|---|
| A | ID | int (PK) | 500048 | Chave primária do imóvel |
| B | Tipo | enum | ”Escritório” | Redundante com a aba |
| C | Mercado | enum | ”São Paulo” | Mesmo campo que BASE |
| D | Nome_Empreendimento | string | ”Rochaverá Corporate Towers - Torre A (Ebony Tower)“ | Nome canônico |
| E | Região | enum | ”Chucri Zaidan” | Bairro/sub-mercado |
| F | Classe | enum | ”A+“ | Categoria do imóvel |
| G | STATUS | enum | ”Concluído” | Status atual |
| H | Area_Total | float (m²) | 25394.59 | Área total do imóvel |
| I | Endereço | string | ”Av. das Nações Unidas, 14171” | Endereço textual |
| J | Lat | float | -23.622785 | Latitude (decimal) |
| K | long | float | -46.700789 | Longitude (decimal) — atenção: nome com caixa baixa |
| L | Pe_Direito | float (m) | (vazio) | Pé direito útil |
| M | Piso | string | (vazio) | Tipo de piso/carga |
| N | CEP | string | ”04794-000” | CEP — string para preservar zeros à esquerda |
| O | Data_de_Entrega | datetime | 2008-08-01 | Inauguração |
| P | Incorporadora | string | ”Tishman Speyer” | Quem desenvolveu |
| Q | Vagas | int | 805 | Número de vagas |
| R | Tipo_de_Estacionamento | enum | ”Coberto” | Coberto / Descoberto / Misto |
| S | Área_do_Terreno | float (m²) | (vazio) | Área do terreno |
| T | Ar_Condicionado | enum | (vazio) | Sim/Não/Tipo |
| U | Distância_SP | enum | (vazio) | Faixa de distância (categórica) |
| V | Cidade | string | (vazio na amostra) | Cidade — diferente de Mercado |
| W | Observação | string | (vazio) | Notas livres |
| X | Situação_do_Imóvel | enum | ”Ativo” | Ativo/Inativo/Demolido |
| Y | ID_SiiLa | int | 500048 | ID externo na SiiLa (mesmo que ID Colliers nesta amostra) |
| Z | Nome_Empreendimento_SiiLa | string | ”Rochaverá Corporate Towers - Torre A (Ebony Tower)“ | Para reconciliação |
| AA | ID_Buildings | int | 52 | ID externo na Buildings |
| AB | Nome_Empreendimento_Buildings | string | ”Rochaverá Corporate Towers - Torre A (Ebony Tower)“ | Para reconciliação |
Observações:
- Já existem chaves de integração com SiiLa e Buildings — duas fontes externas que enriquecem o mercado de Office.
- Em ~5% dos casos (segundo Leandro), o nome diverge entre fontes — daí a necessidade de manter
Nome_Empreendimento_<fonte>como campo separado para auditoria. - Cidade e Mercado podem ser conceitos diferentes (Mercado é praça comercial; Cidade é entidade geográfica) — relação a confirmar.
- Campo
longem caixa baixa contraria convenção doLat.
1.3 VENDA OFFICE — VENDA OFFICE
Granularidade: uma linha = uma transação de venda observada no mercado.
| # | Coluna | Tipo | Exemplo | Comentário |
|---|---|---|---|---|
| A | ID | int | 68149 | Atenção: faixa diferente de BASE/FICHA (que usam 5xxxxx). Provável ID interno de transação. |
| B | Imóvel | string | ”General Polidoro 99” | Nome do imóvel — não usa nome canônico de FICHA |
| C | Endereço | string | ”Rua General Polidoro, 99” | Redundante com FICHA (se fizer match) |
| D | Cidade | string | ”Rio de Janeiro” | — |
| E | Estado | string | ”Rio de Janeiro” | — |
| F | Região | string | ”Orla” | Sub-mercado |
| G | Classe | enum | ”B” | Classe do imóvel transacionado |
| H | Data da Transação | datetime | 2016-01-04 | Data de fechamento |
| I | Preҫo | float (R$) | 160228476 | Atenção: campo “Preҫo” com cedilha cirílica (Ҫ) em vez de Ç latino — typo no header |
| J | Comprador | string (anonimizado) | “C” | Comprador |
| K | Vendedor | string (anonimizado) | “D” | Vendedor |
| L | Área Privativa Transacionada | float (m²) | 10660 | Área da transação |
| M | Preço (R$/m²) | float | 15030.81 | Calculado: I/L |
| N | Cap Rate | float (decimal) | 0.0926 | Taxa de capitalização |
Dores específicas:
- D6: ID em faixa diferente (68149 vs. 500048) — não há chave estrangeira para FICHA TÉCNICA OFFICE; match precisaria ser por endereço/nome.
- D7: Header “Preҫo” com caractere
Ҫ(Cyrilic Es with descender, U+04AA) em vez deÇlatino — quebra de busca/filtro/scripting. - D8:
CidadeeEstadoambos com “Rio de Janeiro” — provável confusão (Estado RJ + Capital RJ vs. coincidência). - D9:
Preço (R$/m²)é calculado mas armazenado como dado (deveria ser fórmula/derivado).
1.4 CONTROLE OFFICE — CONTROLE OFFICE
Granularidade: uma linha = um imóvel + lista de contatos para pesquisa. Amostra: apenas headers (1 linha).
| # | Coluna | Tipo inferido | Comentário |
|---|---|---|---|
| A | ID | int | Liga a FICHA TÉCNICA OFFICE.ID |
| B | Nome_Empreendimento | string | Cópia do nome canônico |
| C | Região | string | Sub-mercado |
| D | Empresa | string | Empresa que fornece a informação (proprietário/administrador/fundo) |
| E | Contato | string | Nome da pessoa-fonte |
| F | Telefone | string | Telefone de contato |
| G | string | E-mail de contato | |
| H | Nome_Buildings | string | Reconciliação manual com Buildings |
| I | Nome_SiiLa | string | Reconciliação manual com SiiLa |
| J | Status | string | Status genérico (a categorizar) |
| K | CONTATO EFETIVO | string/bool | Indicador de contato confirmado |
| L | Status atualização | string | Status do ciclo de pesquisa |
| M | Observação | string | Notas livres |
| N | Data de atualização | datetime | Última atualização |
| O | Ticker fundo | string | Liga a CVM/B3 — ticker do fundo imobiliário (ex: KNRI11) |
| P | Saída prevista (vide observação) | datetime/string | Data prevista de saída do contrato (informação valiosa para prospecção) |
Dores específicas:
- D10: Aba mistura CRM mini (E, F, G — pessoas) com status de pesquisa operacional (J, K, L). São conceitos distintos.
- D11:
Nome_Empreendimento,Região,Nome_Buildings,Nome_SiiLasão redundantes com FICHA TÉCNICA — se a ficha mudar, controle fica desatualizado. - D12:
Saída prevista(informação ouro para prospecção comercial) está como observação livre — não é estrutural.
Segmento 2 — Logística (condomínios industriais)
2.1 BASE LOGÍSTICA — BASE LOGÍSTICA
Granularidade: uma linha = um galpão (ou módulo dentro de galpão) de um empreendimento, em um trimestre. Cardinalidade observada na amostra: 8 linhas (1 empreendimento × 8 galpões/módulos × 1 trimestre).
| # | Coluna | Tipo | Exemplo | Comentário | Crítica |
|---|---|---|---|---|---|
| A | ID_Novo | int | 600186 | Nome diferente do Office (ID lá vs. ID_Novo aqui) | Inconsistência de PK |
| B | Tipo | enum | ”Industrial” | Redundante | Denormalizado |
| C | Mercado | enum | ”São Paulo” | Praça | OK |
| D | Nome_Empreendimento | string | ”GLP Guarulhos” | Nome canônico | Denormalizado |
| E | Região | enum | ”Guarulhos” | Sub-mercado | OK |
| F | Classe | enum | ”A+“ | Classe | OK |
| G | Data_de_Entrega | datetime | 2015-11-01 | Inauguração | Denormalizado |
| H | STATUS | enum | ”Concluído” | Status | Denormalizado |
| I | Galpão | string | ”G.10”, “G.6”, “G.5”, “G.1”, “G.2”, “G.T2” | Identificador do galpão dentro do complexo | OK |
| J | Módulo | string | ”All”, “M.01”, “M.02”, “M.03" | "All” = galpão inteiro; M.NN = módulo. Tipo misto (semântica diferente) | Frágil |
| K | Área_Bruta_Locável | float (m²) | 10911 | ABL do módulo | OK |
| L | Armazenagem | float (m²) | (vazio) | Área de armazenagem | OK |
| M | Mezanino | float (m²) | (vazio) | Área de mezanino | OK |
| N | Apoio / Comum | float (m²) | (vazio) | Áreas de apoio | OK |
| O | Marquise | float (m²) | (vazio) | Marquise | OK |
| P | Trimestre | string | ”2016 1T” | Mesmo formato que Office | OK (frágil) |
| Q | Ocupante | string | ”A”, “B”, “C”, “D” | Empresa ocupante | OK |
| R | Segmento | enum | ”Industrial”, “Transporte e Logística”, “Varejo” | Setor do ocupante | OK |
| S | Absorção | int (0/1) | (vazio) | Derivável | Igual Office |
| T | Devolução | int (0/1) | (vazio) | Derivável | Igual Office |
| U | Preço | float (R$/m²) | (vazio) | Locação por m² | OK |
| V | Condomínio | float (R$/m²) | 2.75 | Condomínio | OK |
| W | IPTU | float (R$/m²) | 1.07 | IPTU | OK |
| X | Proprietário_Grupo | string | ”E” | Grupo proprietário | OK |
| Y | Ocupante_Devolução | string | ”A”, “B”, “C”, “D” | Ocupante anterior | OK |
| Z | Administração | string | (vazio) | Administradora | OK |
| AA | Comercialização | string | (vazio) | Comercializadora | OK |
| AB | Região_Geográfica | enum | ”Sudeste” | Macro-região (Brasil) | OK |
| AC | Preço Ponderado | float | 0 | Hardcoded como 0 — provável cálculo derivado feito no Power BI; aqui aparece como dado | Derivado armazenado como dado |
| AD | Empresa_Locacao | string | (vazio) | Empresa que firmou a locação | OK |
Dores específicas:
- D13: PK chamada
ID_Novoaqui eIDno Office — inconsistência cross-segmento. - D14:
Módulomistura “All” (galpão inteiro) com códigos de módulo (M.01) — semântica frágil; deveria haver coluna separadaTipo_Subdivisao(galpão_inteiro / modulo). - D15:
Preço Ponderado = 0em todos os registros — aparenta ser derivada calculada em Power BI, mas armazenada como coluna de dado (zero é defaulted), causando confusão. - D16: Presença de
RegiãoeRegião_Geográficalado a lado — duas hierarquias geográficas; relação e regra de preenchimento não está documentada.
2.2 FICHA TÉCNICA LOGÍSTICA — FICHA TÉCNICA LOGÍSTICA
| # | Coluna | Tipo | Exemplo | Comentário |
|---|---|---|---|---|
| A | ID_Colliers | int | 600186 | Terceiro nome de PK no mesmo modelo (Office BASE = ID, Logística BASE = ID_Novo, Logística FICHA = ID_Colliers) |
| B | Mercado | enum | ”São Paulo” | — |
| C | Nome_Empreendimento_Colliers | string | ”GLP Guarulhos” | Nome canônico Colliers |
| D | Região | enum | ”Guarulhos” | Sub-mercado |
| E | Classe | enum | ”A+“ | — |
| F | Endereço | string | ”Av. Landri Sales, 1070” | — |
| G | Latitude | float | -23.429828 | Diferente do Office (Lat) |
| H | Longitude | float | -46.380927 | Diferente do Office (long) |
| I | Pe_Direito | float (m) | 12 | Pé direito útil |
| J | Piso | string | (vazio) | Tipo de piso (tons/m²) |
| K | Docas | int | 331 | Número de docas |
| L | Sprinklers | enum | ”Sim” | Sim/Não |
| M | CEP | string | ”07250-000” | — |
| N | Incorporadora | string | ”Global Logistics Properties” | — |
| O | Área_do_Terreno | float (m²) | 1220782.61 | — |
| P | Distância_Capital | enum | ”Até 30 km” | Faixa categórica |
| Q | Cidade | string | ”Guarulhos” | — |
| R | Eficiência_Logística | float (decimal) | 0.78 | Métrica derivada (ABL/Área Total?) já armazenada |
| S | ID_SiiLa | int | 600186 | Reconciliação SiiLa |
| T | Nome_Empreendimento_SiiLa | string | ”GLP Guarulhos” | — |
| U | ID_Buildings | int | 33 | Reconciliação Buildings |
| V | Nome_Empreendimento_Buildings | string | ”GLP Guarulhos” | — |
| W | Situacao_do_Imovel | enum | (vazio) | Ativo/Inativo |
Dores específicas:
- D17: Office usa
Lat/long; Logística usaLatitude/Longitude. Nome da PK éID/ID_Novo/ID_Colliers. Sem padrão. - D18: Office tem
Tipo,Data_de_Entrega,Vagas,Ar_Condicionado,Tipo_de_Estacionamento,Distância_SP,Observação— Logística NÃO tem. Logística temDocas,Sprinklers,Distância_Capital,Eficiência_Logística— Office NÃO tem. Schemas divergentes entre segmentos (parcialmente justificável pela natureza do produto, mas há campos comuns que poderiam ser unificados).
2.3 VENDA LOGÍSTICA — VENDA LOGÍSTICA
| # | Coluna | Tipo | Exemplo | Comentário |
|---|---|---|---|---|
| A | Imóvel | string | ”Galpão Isolado - Avenida das Indústrias” | NÃO HÁ ID — match por texto livre |
| B | Endereço | string | ”Avenida das Indústrias, s/n” | — |
| C | Cidade | string | ”Vinhedo” | — |
| D | Estado | string | ”São Paulo” | — |
| E | Região | string | ”Jundiaí” | Sub-mercado |
| F | Classe | enum | ”C” | — |
| G | Área Total do Imóvel (m²) | float | 132353 | — |
| H | Eficiência do Imóvel | float (%) | 90 | Proporção (não decimal) |
| I | Pé-direito (m) | float | 10 | — |
| J | Carga de Piso (T/m²) | float | 5 | — |
| K | Data da Transação | datetime | 2015-11-25 | — |
| L | Preҫo | float (R$) | 267492379 | Mesmo typo Ҫ (cirílico) que VENDA OFFICE |
| M | Comprador | string | ”A” | — |
| N | Vendedor | string | ”B” | — |
| O | Área Transacionada (m²) | float | 132353 | — |
| P | Preҫo/m² | float | 2021.05 | Typo cirílico de novo + nome diferente de Office (Preço (R$/m²) lá) |
| Q | Cap Rate | float | 11.73 | Em VENDA OFFICE veio como decimal (0.0926); aqui parece percentual (11.73). Inconsistência de unidade. |
Dores específicas:
- D19: CRÍTICO — sem chave estrangeira para FICHA TÉCNICA LOGÍSTICA. Match só é possível por texto livre (nome do imóvel + endereço). Quebra silenciosamente quando há renomeação.
- D20: Cap Rate em formato diferente entre Office (decimal 0.0926 = 9.26%) e Logística (11.73, ambíguo: 11,73% ou 11,73× ?). Sem normalização de unidade.
- D21: Office VENDA tem
Preço (R$/m²); Logística VENDA temPreҫo/m²— typo cirílico recorrente + nomenclatura diferente. - D22: Office VENDA tem
Eficiência do Imóvelausente; Logística VENDA tem. Indicadores físicos do imóvel duplicados entre VENDA e FICHA.
2.4 CONTROLE LOGÍSTICA — CONTROLE LOGÍSTICA
| # | Coluna | Tipo | Comentário |
|---|---|---|---|
| A | ID_Novo | int | Liga a FICHA TÉCNICA LOGÍSTICA.ID_Colliers (mas com nome diferente!) |
| B | Nome_Empreendimento | string | Nome canônico |
| C | Pesquisa_Telefone | string | Telefone do contato |
| D | Pesquisa_Responsável | string | Nome da pessoa-fonte |
| E | Pesquisa_Empresa | string | Empresa fornecedora |
| F | Pesquisa_Email | string | |
| G | Período | string | Período da pesquisa |
| H | Região|Cidade | string | Caractere | (pipe) no nome do header — quebra exportações |
| I | Mercado | enum | Praça |
| J | Nome Buildings | string | Reconciliação Buildings (espaço em vez de _) |
| K | Nome SiiLa | string | Reconciliação SiiLa |
| L | Consideração | string | Notas livres |
| M | Data de Atualização | datetime | Última atualização |
| N | Status Ocupantes | string | Status do levantamento de ocupantes |
| O | Melhor forma de contato | string | Canal preferido (note espaço final no header) |
Dores específicas:
- D23: PK chamada
ID_Novoaqui,ID_Colliersem FICHA — inconsistência interna. - D24: Headers diferem de CONTROLE OFFICE (
Telefonevs.Pesquisa_Telefone,E-mailvs.Pesquisa_Email,Contatovs.Pesquisa_Responsável,Nome_Buildingsvs.Nome Buildings). Sem schema unificado entre segmentos. - D25:
Região\|Cidadecom pipe no nome — sintaxe ruim. - D26:
Melhor forma de contato(com espaço final) — quebra silenciosa em filtros/joins. - D27: NÃO HÁ os campos
Ticker fundoeSaída previstaque existem em CONTROLE OFFICE — perda de informação valiosa de prospecção.
Inconsistências cross-segmento (síntese)
| Aspecto | Office | Logística | Comentário |
|---|---|---|---|
| Nome da PK do imóvel | ID | ID_Novo (BASE/CONTROLE) ou ID_Colliers (FICHA) | 3 nomes para mesma chave |
| Latitude / Longitude | Lat / long | Latitude / Longitude | Convenção quebrada |
| Granularidade comercial | Andar + Conjunto | Galpão + Módulo | Aceitável (semântica diferente) |
| Métrica de área | Area_Conjunto | Área_Bruta_Locável + Armazenagem + Mezanino + Apoio / Comum + Marquise | Logística mais granular |
| Header “Preço” em VENDA | Preҫo (cirílico) | Preҫo (cirílico) | Typo presente em ambas — corrigir antes de qualquer ETL |
| Cap Rate (unidade) | decimal (0.0926) | percentual (11.73) | Normalizar |
| Distância da capital | Distância_SP (Office) | Distância_Capital (Logística) | Mesma semântica, nomes diferentes |
| Integração CVM (fundos) | Ticker fundo em CONTROLE | ausente | Asimetria; potencial perda de info em logística |
Volume e cardinalidade reais (estimado)
- Histórico desde 2016 — 10 anos × 4 trimestres = ~40 períodos.
- Universo Office: ~estimado em 200–500 empreendimentos × média 30 conjuntos/imóvel × 40 trimestres ≈ 240k–600k linhas apenas em BASE OFFICE.
- Universo Logística: ~estimado em 150–300 empreendimentos × média 8 galpões/módulos × 40 trimestres ≈ 48k–96k linhas em BASE LOGÍSTICA.
- Total aproximado base temporal: 290k–700k linhas — bate com o “+600k” mencionado pelo Leandro.
- VENDA: alguns milhares de transações ao longo dos 10 anos.
- FICHA: algumas centenas de imóveis por segmento.
Resumo das 27 dores observadas
Numeradas como D1..D27 ao longo do dicionário. Categorizadas em análise as-is vs. to-be.
| Categoria | Count | Severidade média |
|---|---|---|
| Denormalização | D1, D11 | Alta |
| Inconsistência de schema cross-segmento | D13, D17, D18, D24 | Alta |
| Tipos misturados / formatos frágeis | D2, D3, D14, D20 | Média |
| Falta de chave estrangeira | D6, D19 | Crítica |
| Derivados armazenados como dados | D5, D9, D15 | Média |
| Conceitos sobrepostos / mal modelados | D4, D10, D16 | Alta |
| Erros tipográficos em headers | D7, D21, D25, D26 | Baixa (mas insidiosa) |
| Perda de informação cross-segmento | D27 | Média |
| Sem schema validation | (geral) | Alta |
Ver também
- Spec geral — Inteligência de Mercado Colliers
- Análise as-is vs. to-be
- 04 — discovery inicial
- colliers_inteligencia_mercado_modelo_dados.xlsx — fonte original
Dicionário consolidado por Pedro Villa em 2026-04-25 a partir de análise direta da planilha modelo. Validação cruzada com Leandro Braga prevista para 2026-04-30 17:00.