Relatório Executivo — Inventário de Dados Colliers (SharePoint)

relatorio screener colliers

Para: Pedro Villa De: Rafael Rossetto Data: 2026-05-08 Ref: T-005, T-020 — Inventário de dados Colliers/Costal


TL;DR

Varri 138.477 arquivos (371 GB) em 3 bibliotecas SharePoint da Colliers (Research, Cloud Colliers, Anos Anteriores). Extraí headers de 22 planilhas-chave sem ler nenhum dado. Descobri que a Colliers opera com 1 planilha-mãe por vertical de mercado (Escritórios, Logística, Industrial) com estrutura idêntica — o que simplifica muito o Data Lake. Achei problema LGPD real (contatos de proprietários) e confirmei que o pipeline é Buildings → Excel → Power BI com ajuste manual no meio.


§1 — O que foi varrido

BibliotecaDivisãoArquivosVolumeFoco
ResearchInteligência de Mercado57.793117 GBBases de mercado, Power BI, GIS
Cloud ColliersProject Management (SPS)27.716146 GBProjetos de obra (BNG, SAP, City Gate)
Anos AnterioresCIVAS (Avaliações)52.968109 GBLaudos históricos (2015-2019)
Total138.477371 GB

NOTE

Faltam as bibliotecas das áreas comerciais (Avaliações, Office, Industrial). Acesso bloqueado (T-049).


§2 — Árvore de diretórios (macro)

Research - Documents/
└── General/
    ├── 1. ESCRITÓRIOS/Análise/{Cidade}/{YYYY}/{QT}/   ← séries trimestrais
    ├── 2. INDUSTRIAL/ANÁLISES/Pesquisa/{YYYY}/{QT}/   ← idem
    ├── 5. DEMANDAS/{VERTICAL}/{YYYY}/                 ← demandas ad-hoc
    ├── 7. DASHBOARD/                                  ← Power BI + bases-mãe
    │   ├── Apresentação de Mercado/Escritórios/Dados/  → Pesquisa_Escritórios*.xlsx
    │   ├── Apresentação de Mercado/Logística/Dados/    → Pesquisa_Logística*.xlsx
    │   ├── Inteligência de Mercado/                    → Base_IM_Unificada.xlsx
    │   └── Capital Markets/                            → Analise_FIIs.pbix
    ├── 11. GIS/                                       ← ArcGIS/QGIS standalone
    ├── 16. CAPITAL MARKET REPORT/                     ← relatórios de mercado de capitais
    └── 22. DATA LAKE/01 CONSOLIDAÇÃO BASES OFFICE/    ← tentativa de centralização (nov/2025)
        ├── São Paulo/Base_SaoPaulo - Padronizada.xlsx
        ├── Belo Horizonte/Base_BeloHorizonte - Padronizada.xlsx
        ├── Brasília/Base_Final.xlsx
        └── Porto Alegre/Base_POA_SiiLa.xlsx

Cloud Colliers Brasil - Documents/
├── 355-24-BNG Phase 2-Cloud/     ← maior projeto (BNG, 30 GB)
├── 414-24 - SAP - GC/            ← SAP Global (23 GB, fichas trabalhistas)
├── City Gate/Citygate Itapeva/    ← FM contínuo (82 GB, controles operacionais)
└── RFS_Nokia_Embu/                ← Nokia Embu (2,8 GB)

Anos Anteriores - Documents/
└── CIVAS/
    ├── Appraisals_2016/           ← 14.442 arq, 25 GB
    ├── Appraisals 2017-2018/      ← 16.020 arq, 21 GB
    ├── Appraisals_2019/           ← 9.297 arq, 33 GB
    │   └── Pipeline 2019/         ← pipeline diário (30+ snapshots/mês)
    └── Laudos 2019/               ← laudos individuais (NUM - Cliente)

§3 — Dicionário de dados (22 candidatos analisados)

Research — Bases de mercado

FichaArquivoAbasLinhas (maior aba)Entidade principal
pesquisa-escritorios-iiPesquisa_Escritórios CorporativosII.xlsx11750.869Transação de Escritório
pesquisa-logistica-brasilPesquisa_Logística_Brasil.xlsxTransação Logística
pesquisa-logistica-2t2025Pesquisa_Logística_Brasil 2T.xlsxTransação Logística (2T)
base-im-unificadaBase_IM_Unificada.xlsxConsolidado IM
pesquisa-origem-destinoPesquisa Origem Destino.xlsxOrigem/Destino Office SP
disponibilidade-spDisponibilidade_SP.xlsx45.148Empreendimento Logístico
fechamento-industrial-1t26Fechamento_Colliers_Industrial-1T26.xls126.843Transação Industrial

Research — DATA LAKE (bases por cidade)

FichaArquivoCidade
base-sp-padronizadaBase_SaoPaulo - Padronizada.xlsxSão Paulo
base-brasilia-finalBase_Final.xlsxBrasília
base-poa-siilaBase_POA_SiiLa.xlsxPorto Alegre
base-bh-buildingsBase_Builings.xlsxBelo Horizonte
base-bh-padronizadaBase_BeloHorizonte - Padronizada.xlsxBelo Horizonte

Research — Outros

FichaArquivoTipo
lista-prospeccao-growthLista de Prospecção - Growth.csvPipeline comercial
historico-indicadores-macroHistórico de Indicadores Macro.xlsxSérie macro (legado 2021)

Cloud Colliers — Project Management

FichaArquivoTipo
lista-mestra-bng-exLista Mestra Projetos - EX - R02.xlsxControle de pranchas
sap-furniture-listSAP GRF - Preferred Furniture List.xlsxFornecedores SAP Global
controle-nf-citygateControle de Notas Fiscais.xlsxNFs City Gate Itapeva

Anos Anteriores — CIVAS

FichaArquivoTipo
pipeline-civas-2019Pipe 2019 12 30.xlsxPipeline comercial CIVAS
argus-scipa-iguatemiInput Argus - SCIPA 2019 v3.xlsxModelo financeiro Argus
fechamento-modelo-civas1. Fechamento Modelo V03.xlsmTemplate de laudo (macros)
controle-propostas-civasControle de Propostas_2019.xlsxPropostas comerciais
lista-laudos-sistemaLista de laudos a incluir no sistema.xlsxCadastro de laudos

§4 — Achados estratégicos

1. Padrão “1 planilha-mãe por vertical” confirmado

graph LR
    B[Buildings<br/>sistema externo] -->|export .xls| F[Fechamento<br/>trimestral]
    F -->|ajuste manual| PM[Planilha-mãe<br/>por vertical]
    PM -->|alimenta| PBI[Power BI<br/>dashboards]
    
    PM --- E[Escritórios<br/>750K linhas]
    PM --- L[Logística<br/>5K linhas]
    PM --- I[Industrial<br/>26K linhas]

Implicação: Schema unificado viável para as 3 verticais. Colunas comuns: ID, Tipo, Mercado, Nome_Empreendimento, Região, Classe, Data_de_Entrega, STATUS, Área, Ocupante, Segmento, Preço, Condomínio, IPTU, Proprietário_Grupo.

2. DATA LAKE interno já existe

Leandro Braga já tentou centralizar (nov/2025) — 4 bases padronizadas por cidade em 22. DATA LAKE/01 CONSOLIDAÇÃO BASES OFFICE/. Alinhar antes de propor solução paralela.

3. LGPD real

FonteDadoVolume
Disponibilidade_SP.xlsx aba ContatoTelefone, Responsável, Email902 registros
Mailings SP.xls + Mailings RJ.xlsDados de proprietários405 MB
Base_IM_Unificada.xlsxPossível: Proprietário_Contato, _Email, _TelefoneA confirmar

4. CIVAS desapareceu pós-2019

Pipeline diário ativo até dez/2019 (30+ snapshots/mês). Zero registros após essa data nas 3 bibliotecas acessíveis. Migrou ou morreu?

5. Person-dependency crítica

Pipeline R (288 .rda) → Python (5 .py) → Power BI (104 .pbix): zero documentação, zero versionamento. Se quem mantém sai, a inteligência de mercado para.


§5 — Próximas ações (ver plano completo)

UrgênciaAçãoPrazo
🔴Classificação LGPD dos contatos de proprietários2026-05-12
🔴Validar 22 fichas com Leandro Braga (30 min)2026-05-14
🔴Localizar pipeline CIVAS pós-20192026-05-12
🟠Agrupar 25 perguntas por interlocutor e agendar sessões2026-05-12
🟠Solicitar acesso às bibliotecas restantes (T-049)2026-05-12
🟡Formalizar dicionário de dados v1 (schema canônico)2026-05-22

§6 — Perguntas abertas (25)

Ver lista completa. As mais urgentes:

#PerguntaPara quem
Q-020Base_IM_Unificada tem dados pessoais de proprietários?Leandro Braga
Q-021DATA LAKE por cidade é a centralização oficial? Quem mantém?Leandro Braga
Q-019ID na BASEFULL é interno Colliers ou do Buildings/SiiLa?Leandro Braga
Q-018CIVAS pós-2019 — outra biblioteca ou fim do volume?Ricardo Betancourt
Q-023Lista de Prospecção Growth duplica o CRM (RD Station)?Daniel Jackel

Fonte: Screener Waves 1–7 executadas em 2026-05-08. Artefatos em 04-referencia/colliers/onedrive-inventario/2026-05-08/.