Data Lakehouse Colliers — Definição V0

Arquitetura base derivada do inventário de dados (Waves 1–7 + E1–E5) e descobertas de stakeholders (REMS, Orçamentação). V0 = estrutura suficiente para começar a construir — não é o desenho final.


Arquivos desta pasta

ArquivoConteúdo
01-visao-geral.mdDiagrama de arquitetura + domínios de dados
02-source-mapping.mdMapeamento fonte → camada do lake
03-storage-schema.mdEstrutura de pastas e convenções de nomenclatura
04-classificacao-acesso.mdClassificação de dados e matriz de acesso
05-governanca.mdChecklist de governança, qualidade e linhagem
06-roadmap.mdRoadmap de implementação faseado

Premissas adotadas (V0)

  1. Cloud: AWS (S3 + VPC + IAM)
  2. Engine: Databricks + Delta Lake (decisão anterior confirmada)
  3. Multi-tenant: tenant como chave composta — CTS e Costal isolados logicamente
  4. Orquestração: Databricks Workflows (fase inicial), Airflow futuro
  5. BI: Power BI (já em uso pela Colliers IM via SQL Server)
  6. Ingestão primária: Sienge (ERP) via APIs BULK + Webhooks; Smart Colliers via REST API

Ver também