Plano de Ação — Pós-Screener (Inventário de Dados Colliers)
Gerado em 2026-05-08 após conclusão das Waves 1–7 do Screener. Referência: Consolidado · Perguntas · Gaps · Handoff
Resumo executivo
O Screener varreu 138.477 arquivos (371,5 GB) em 3 bibliotecas SharePoint e gerou 22 fichas dict-prep com headers de candidatos a dicionário de dados. O inventário confirmou empiricamente 5 hipóteses do assessment e revelou 6 novos gaps.
Métricas finais
| Métrica | Valor |
|---|---|
| Arquivos inventariados | 138.477 |
| Volume total | 371,5 GB |
| Bibliotecas varridas | 3 (Research, Cloud Colliers, Anos Anteriores) |
| Fichas dict-prep | 22 (20 executor + 2 orquestrador) |
| Perguntas geradas | 25 (Q-001 a Q-025) |
| Gaps enriquecidos | 5 (G-008, G-020, G-026, G-036, G-052) |
| Gaps novos | 5 (G-057 a G-061) |
Ações imediatas (sprint-semana-4)
🔴 Críticas
| # | Ação | Owner | Prazo | Dependência |
|---|---|---|---|---|
| A1 | Classificação LGPD dos contatos de proprietários — Disponibilidade_SP (aba Contato, 902 registros) + Mailings SP/RJ (405 MB). Validar se são PF ou PJ; aplicar controles de acesso se PF | Rafael + Pedro + Michael | 2026-05-12 | G-057, Q-020 |
| A2 | Validar 22 fichas dict-prep com Leandro Braga — marcar sessão de 30 min para percorrer entidades (Empreendimento, Transação, Contrato) e confirmar chaves primárias | Pedro + Leandro Braga | 2026-05-14 | G-026, T-129 |
| A3 | Localizar pipeline CIVAS pós-2019 — perguntar a Ricardo Betancourt se migrou para outra biblioteca ou se processo morreu | Rafael | 2026-05-12 | G-061, Q-015, Q-018 |
🟠 Altas
| # | Ação | Owner | Prazo | Dependência |
|---|---|---|---|---|
| A4 | Consolidar as 25 perguntas em pauta de reunião — agrupar por interlocutor e agendar sessões: Leandro Braga (Q-010/11/13/19/20/21), Ricardo Betancourt (Q-014/15/17/18/22/24), Daniel Jackel (Q-012/23), Michael (Q-006/016/007) | Rafael | 2026-05-12 | — |
| A5 | Documentar pipeline analítico — mapear quem mantém os 288 .rda + 104 .pbix + 5 .py. Se for 1 pessoa = risco crítico de person-dependency | Rafael + Leandro Braga | 2026-05-16 | G-059, Q-013 |
| A6 | Solicitar acesso às bibliotecas restantes — Avaliações, Office, Industrial. O Screener cobriu 3/N bibliotecas; faltam as das áreas comerciais | Rafael | 2026-05-12 | T-049, G-008 |
| A7 | Remover .msi/.exe do SharePoint Research — encaminhar lista para Michael/TI como anomalia de governança | Rafael | 2026-05-12 | G-060, Q-012 |
🟡 Médias
| # | Ação | Owner | Prazo |
|---|---|---|---|
| A8 | Publicar fichas dict-prep na 04-referencia — copiar as 22 fichas de screener/outputs/2026-05-08_dict-prep/ para 04-referencia/colliers/onedrive-inventario/2026-05-08/dict-prep/ | Rafael (executor) | 2026-05-10 |
| A9 | Atualizar T-005 e T-020 com status de conclusão parcial e link para consolidado | Rafael | 2026-05-10 |
| A10 | Unpin dos 22 arquivos — rodar pin-candidates.ps1 -Unpin para liberar espaço em disco | Rafael | 2026-05-10 |
Ações de médio prazo (onda 1)
| # | Ação | Owner | Prazo |
|---|---|---|---|
| A11 | Formalizar dicionário de dados v1 — a partir das 22 fichas, criar schema canônico (entidade × atributo × tipo × fonte) em 01-colliers/specs/ | Pedro + Leandro Braga | 2026-05-22 |
| A12 | Screener v2 nas bibliotecas comerciais — repetir Waves 1–6 quando T-049 for resolvido | Rafael | pós T-049 |
| A13 | Mapear relações cross-arquivo — ID Colliers ↔ ID SiiLa ↔ ID Buildings; confirmar se é 1:1 ou N:1 | Pedro + Leandro Braga | 2026-05-22 |
| A14 | Propor Bronze/Silver/Gold para MI — usando fichas como base, desenhar camadas do Data Lake para Escritórios + Logística + Industrial | Pedro | 2026-05-30 |
| A15 | Avaliar migração do DATA LAKE SharePoint — bases por cidade (nov/2025) sugerem tentativa de centralização interna; alinhar com estratégia Anouk para não duplicar | Pedro + Leandro Braga | 2026-05-22 |
Achados estratégicos (para briefing com Pedro)
1. Padrão “1 planilha-mãe por vertical”
A Colliers mantém uma planilha-mãe por vertical de mercado com estrutura idêntica:
- Escritórios →
Pesquisa_Escritórios CorporativosII.xlsx(750K linhas, 11 abas) - Logística →
Disponibilidade_SP.xlsx(5K linhas) +Pesquisa_Logística_Brasil.xlsx(34 MB) - Industrial → via Fechamento trimestral (26K linhas)
Implicação: O Data Lake pode ser modelado com 1 schema unificado para as 3 verticais, variando apenas atributos específicos (Docas/Sprinklers para Industrial, Pe_Direito para Escritórios).
2. Pipeline confirmado: Buildings → Fechamento.xls → Planilha-mãe → Power BI
O Fechamento trimestral (Fechamento_Colliers_Industrial-1T26.xls) confirma que o dado vem do Buildings (sistema externo) como .xls, passa por ajuste manual (colunas “Anterior” vs “Posterior”), e alimenta a planilha-mãe. Esse é o ponto exato de intervenção do Bronze.
3. DATA LAKE interno já iniciado (nov/2025)
As bases Base_SaoPaulo - Padronizada.xlsx, Base_BeloHorizonte - Padronizada.xlsx, etc. (todas mod nov/2025) em 22. DATA LAKE/01 CONSOLIDAÇÃO BASES OFFICE/ sugerem que Leandro já tentou centralizar. Alinhar com ele antes de propor solução paralela.
4. LGPD é problema real, não teórico
A aba Contato do Disponibilidade_SP.xlsx tem 902 registros com telefone, email e nome de responsáveis. Os Mailings SP/RJ somam 405 MB de dados de proprietários. Classificação formal é urgente.
5. CIVAS desapareceu pós-2019
A biblioteca Anos Anteriores para em 2019. O pipeline diário de laudos (30+ versões por mês) simplesmente não existe após essa data. Ou migrou para outra biblioteca que não temos acesso, ou o volume CIVAS caiu drasticamente.
Ver também
- consolidado — relatório consolidado das 3 bibliotecas
- perguntas-screening — 25 perguntas operacionais
- Gaps — registro canônico (G-057 a G-061 novos)
- SCREENER-HANDOFF — plano de execução do screener