Relatório Executivo — Inventário de Dados Colliers (SharePoint)
Para: Pedro Villa De: Rafael Rossetto Data: 2026-05-08 Ref: T-005, T-020 — Inventário de dados Colliers/Costal
TL;DR
Varri 138.477 arquivos (371 GB) em 3 bibliotecas SharePoint da Colliers (Research, Cloud Colliers, Anos Anteriores). Extraí headers de 22 planilhas-chave sem ler nenhum dado. Descobri que a Colliers opera com 1 planilha-mãe por vertical de mercado (Escritórios, Logística, Industrial) com estrutura idêntica — o que simplifica muito o Data Lake. Achei problema LGPD real (contatos de proprietários) e confirmei que o pipeline é Buildings → Excel → Power BI com ajuste manual no meio.
§1 — O que foi varrido
| Biblioteca | Divisão | Arquivos | Volume | Foco |
|---|---|---|---|---|
| Research | Inteligência de Mercado | 57.793 | 117 GB | Bases de mercado, Power BI, GIS |
| Cloud Colliers | Project Management (SPS) | 27.716 | 146 GB | Projetos de obra (BNG, SAP, City Gate) |
| Anos Anteriores | CIVAS (Avaliações) | 52.968 | 109 GB | Laudos históricos (2015-2019) |
| Total | 138.477 | 371 GB |
NOTE
Faltam as bibliotecas das áreas comerciais (Avaliações, Office, Industrial). Acesso bloqueado (T-049).
§2 — Árvore de diretórios (macro)
Research - Documents/
└── General/
├── 1. ESCRITÓRIOS/Análise/{Cidade}/{YYYY}/{QT}/ ← séries trimestrais
├── 2. INDUSTRIAL/ANÁLISES/Pesquisa/{YYYY}/{QT}/ ← idem
├── 5. DEMANDAS/{VERTICAL}/{YYYY}/ ← demandas ad-hoc
├── 7. DASHBOARD/ ← Power BI + bases-mãe
│ ├── Apresentação de Mercado/Escritórios/Dados/ → Pesquisa_Escritórios*.xlsx
│ ├── Apresentação de Mercado/Logística/Dados/ → Pesquisa_Logística*.xlsx
│ ├── Inteligência de Mercado/ → Base_IM_Unificada.xlsx
│ └── Capital Markets/ → Analise_FIIs.pbix
├── 11. GIS/ ← ArcGIS/QGIS standalone
├── 16. CAPITAL MARKET REPORT/ ← relatórios de mercado de capitais
└── 22. DATA LAKE/01 CONSOLIDAÇÃO BASES OFFICE/ ← tentativa de centralização (nov/2025)
├── São Paulo/Base_SaoPaulo - Padronizada.xlsx
├── Belo Horizonte/Base_BeloHorizonte - Padronizada.xlsx
├── Brasília/Base_Final.xlsx
└── Porto Alegre/Base_POA_SiiLa.xlsx
Cloud Colliers Brasil - Documents/
├── 355-24-BNG Phase 2-Cloud/ ← maior projeto (BNG, 30 GB)
├── 414-24 - SAP - GC/ ← SAP Global (23 GB, fichas trabalhistas)
├── City Gate/Citygate Itapeva/ ← FM contínuo (82 GB, controles operacionais)
└── RFS_Nokia_Embu/ ← Nokia Embu (2,8 GB)
Anos Anteriores - Documents/
└── CIVAS/
├── Appraisals_2016/ ← 14.442 arq, 25 GB
├── Appraisals 2017-2018/ ← 16.020 arq, 21 GB
├── Appraisals_2019/ ← 9.297 arq, 33 GB
│ └── Pipeline 2019/ ← pipeline diário (30+ snapshots/mês)
└── Laudos 2019/ ← laudos individuais (NUM - Cliente)
§3 — Dicionário de dados (22 candidatos analisados)
Research — Bases de mercado
| Ficha | Arquivo | Abas | Linhas (maior aba) | Entidade principal |
|---|---|---|---|---|
| pesquisa-escritorios-ii | Pesquisa_Escritórios CorporativosII.xlsx | 11 | 750.869 | Transação de Escritório |
| pesquisa-logistica-brasil | Pesquisa_Logística_Brasil.xlsx | — | — | Transação Logística |
| pesquisa-logistica-2t2025 | Pesquisa_Logística_Brasil 2T.xlsx | — | — | Transação Logística (2T) |
| base-im-unificada | Base_IM_Unificada.xlsx | — | — | Consolidado IM |
| pesquisa-origem-destino | Pesquisa Origem Destino.xlsx | — | — | Origem/Destino Office SP |
| disponibilidade-sp | Disponibilidade_SP.xlsx | 4 | 5.148 | Empreendimento Logístico |
| fechamento-industrial-1t26 | Fechamento_Colliers_Industrial-1T26.xls | 1 | 26.843 | Transação Industrial |
Research — DATA LAKE (bases por cidade)
| Ficha | Arquivo | Cidade |
|---|---|---|
| base-sp-padronizada | Base_SaoPaulo - Padronizada.xlsx | São Paulo |
| base-brasilia-final | Base_Final.xlsx | Brasília |
| base-poa-siila | Base_POA_SiiLa.xlsx | Porto Alegre |
| base-bh-buildings | Base_Builings.xlsx | Belo Horizonte |
| base-bh-padronizada | Base_BeloHorizonte - Padronizada.xlsx | Belo Horizonte |
Research — Outros
| Ficha | Arquivo | Tipo |
|---|---|---|
| lista-prospeccao-growth | Lista de Prospecção - Growth.csv | Pipeline comercial |
| historico-indicadores-macro | Histórico de Indicadores Macro.xlsx | Série macro (legado 2021) |
Cloud Colliers — Project Management
| Ficha | Arquivo | Tipo |
|---|---|---|
| lista-mestra-bng-ex | Lista Mestra Projetos - EX - R02.xlsx | Controle de pranchas |
| sap-furniture-list | SAP GRF - Preferred Furniture List.xlsx | Fornecedores SAP Global |
| controle-nf-citygate | Controle de Notas Fiscais.xlsx | NFs City Gate Itapeva |
Anos Anteriores — CIVAS
| Ficha | Arquivo | Tipo |
|---|---|---|
| pipeline-civas-2019 | Pipe 2019 12 30.xlsx | Pipeline comercial CIVAS |
| argus-scipa-iguatemi | Input Argus - SCIPA 2019 v3.xlsx | Modelo financeiro Argus |
| fechamento-modelo-civas | 1. Fechamento Modelo V03.xlsm | Template de laudo (macros) |
| controle-propostas-civas | Controle de Propostas_2019.xlsx | Propostas comerciais |
| lista-laudos-sistema | Lista de laudos a incluir no sistema.xlsx | Cadastro de laudos |
§4 — Achados estratégicos
1. Padrão “1 planilha-mãe por vertical” confirmado
graph LR B[Buildings<br/>sistema externo] -->|export .xls| F[Fechamento<br/>trimestral] F -->|ajuste manual| PM[Planilha-mãe<br/>por vertical] PM -->|alimenta| PBI[Power BI<br/>dashboards] PM --- E[Escritórios<br/>750K linhas] PM --- L[Logística<br/>5K linhas] PM --- I[Industrial<br/>26K linhas]
Implicação: Schema unificado viável para as 3 verticais. Colunas comuns: ID, Tipo, Mercado, Nome_Empreendimento, Região, Classe, Data_de_Entrega, STATUS, Área, Ocupante, Segmento, Preço, Condomínio, IPTU, Proprietário_Grupo.
2. DATA LAKE interno já existe
Leandro Braga já tentou centralizar (nov/2025) — 4 bases padronizadas por cidade em 22. DATA LAKE/01 CONSOLIDAÇÃO BASES OFFICE/. Alinhar antes de propor solução paralela.
3. LGPD real
| Fonte | Dado | Volume |
|---|---|---|
Disponibilidade_SP.xlsx aba Contato | Telefone, Responsável, Email | 902 registros |
Mailings SP.xls + Mailings RJ.xls | Dados de proprietários | 405 MB |
Base_IM_Unificada.xlsx | Possível: Proprietário_Contato, _Email, _Telefone | A confirmar |
4. CIVAS desapareceu pós-2019
Pipeline diário ativo até dez/2019 (30+ snapshots/mês). Zero registros após essa data nas 3 bibliotecas acessíveis. Migrou ou morreu?
5. Person-dependency crítica
Pipeline R (288 .rda) → Python (5 .py) → Power BI (104 .pbix): zero documentação, zero versionamento. Se quem mantém sai, a inteligência de mercado para.
§5 — Próximas ações (ver plano completo)
| Urgência | Ação | Prazo |
|---|---|---|
| 🔴 | Classificação LGPD dos contatos de proprietários | 2026-05-12 |
| 🔴 | Validar 22 fichas com Leandro Braga (30 min) | 2026-05-14 |
| 🔴 | Localizar pipeline CIVAS pós-2019 | 2026-05-12 |
| 🟠 | Agrupar 25 perguntas por interlocutor e agendar sessões | 2026-05-12 |
| 🟠 | Solicitar acesso às bibliotecas restantes (T-049) | 2026-05-12 |
| 🟡 | Formalizar dicionário de dados v1 (schema canônico) | 2026-05-22 |
§6 — Perguntas abertas (25)
Ver lista completa. As mais urgentes:
| # | Pergunta | Para quem |
|---|---|---|
| Q-020 | Base_IM_Unificada tem dados pessoais de proprietários? | Leandro Braga |
| Q-021 | DATA LAKE por cidade é a centralização oficial? Quem mantém? | Leandro Braga |
| Q-019 | ID na BASEFULL é interno Colliers ou do Buildings/SiiLa? | Leandro Braga |
| Q-018 | CIVAS pós-2019 — outra biblioteca ou fim do volume? | Ricardo Betancourt |
| Q-023 | Lista de Prospecção Growth duplica o CRM (RD Station)? | Daniel Jackel |
Fonte: Screener Waves 1–7 executadas em 2026-05-08. Artefatos em 04-referencia/colliers/onedrive-inventario/2026-05-08/.