Data Lakehouse Colliers — Definição V0
Arquitetura base derivada do inventário de dados (Waves 1–7 + E1–E5) e descobertas de stakeholders (REMS, Orçamentação). V0 = estrutura suficiente para começar a construir — não é o desenho final.
Arquivos desta pasta
| Arquivo | Conteúdo |
|---|---|
| 01-visao-geral.md | Diagrama de arquitetura + domínios de dados |
| 02-source-mapping.md | Mapeamento fonte → camada do lake |
| 03-storage-schema.md | Estrutura de pastas e convenções de nomenclatura |
| 04-classificacao-acesso.md | Classificação de dados e matriz de acesso |
| 05-governanca.md | Checklist de governança, qualidade e linhagem |
| 06-roadmap.md | Roadmap de implementação faseado |
Premissas adotadas (V0)
- Cloud: AWS (S3 + VPC + IAM)
- Engine: Databricks + Delta Lake (decisão anterior confirmada)
- Multi-tenant:
tenantcomo chave composta — CTS e Costal isolados logicamente - Orquestração: Databricks Workflows (fase inicial), Airflow futuro
- BI: Power BI (já em uso pela Colliers IM via SQL Server)
- Ingestão primária: Sienge (ERP) via APIs BULK + Webhooks; Smart Colliers via REST API