Data Lakehouse Colliers — Classificação de Dados e Acesso
Leitura de 3 min
Classificação de Dados e Matriz de Acesso
Classificação por dataset
Dataset
Domínio
Camada
Classificação
Justificativa
sps/sienge/purchase_orders
SPS
Bronze/Silver
Confidencial
Custos e margens (linha vermelha: BDI)
sps/sienge/sales_contracts
SPS
Bronze/Silver
Confidencial
Valores de contrato com cliente
sps/sienge/budget_baseline
SPS
Bronze/Silver
Confidencial
Custos unitários e margens
sps/sharepoint/documents_restricted
SPS
Bronze
Restrito
ASO/EPI — dados de saúde de trabalhadores (LGPD)
sps/unit_costs
SPS
Silver
Confidencial
CPUs e histórico de precificação
rems/smart_colliers/residents_pii
REMS
Bronze
Restrito
CPF, endereço, contato de condôminos (LGPD)
rems/smart_colliers/boletos
REMS
Bronze/Silver
Confidencial
Dados bancários e financeiros
rems/smart_colliers/delinquency
REMS
Bronze/Silver
Confidencial
Situação financeira de condôminos
rems/financial_monthly
REMS
Silver
Confidencial
Receita/despesa por empreendimento
rems/building_health
REMS
Gold
Interno
KPIs operacionais agregados
im/offices_market
IM
Silver
Interno
Dados de mercado — não sensíveis
im/market_dashboard
IM
Gold
Público
Publicado para clientes Colliers
civas/appraisals
CIVAS
Silver
Confidencial
Laudos com valores de imóveis e metodologia
corp/emails
Corp
Bronze
Confidencial
Comunicações internas
corp/teams
Corp
Bronze
Confidencial
Mensagens Teams
cross/ai_feature_store
Cross
Gold
Interno
Features para agentes — sem PII
ext/construction_indexes
Ext
Silver
Público
INCC, CUB — dados públicos
Escala de classificação
Nível
Descrição
Controles mínimos
Público
Dados publicados ou publicáveis externamente
Leitura aberta dentro da plataforma
Interno
Dados operacionais sem PII e sem margens
RBAC por divisão
Confidencial
Custos, contratos, dados financeiros, laudos
RBAC por projeto/função + column masking
Restrito
PII sensível (LGPD), dados de saúde, biometria
Tokenização + audit log + DLP + acesso nominado
Matriz RBAC por perfil
Perfil
Bronze
Silver
Gold
Notas
Admin (Anouk/TI)
R/W todos
R/W todos
R/W todos
Acesso total + configuração
Data Engineer
R/W no domínio
R/W no domínio
Leitura
Escrita limitada ao domínio do squad
Analista de Dados
❌
Leitura (sem Restrito)
Leitura
Sem acesso a Bronze bruto
Gestor / Diretor
❌
❌
Leitura (Gold do seu domínio)
Apenas dashboards e relatórios
PM / Engenheiro de Campo
❌
❌
Leitura (SPS Gold)
Apenas KPIs do próprio projeto
Financeiro
❌
Leitura (FIN + REMS)
Leitura
Acesso a dados financeiros
Jurídico
❌
Leitura (contratos por projeto)
❌
Acesso por projeto + aprovação
Agentes IA (Costal)
❌
Leitura via semantic layer
Leitura
Service account por agente; sem PII
Power BI (service account)
❌
❌
Leitura (Gold público/interno)
Apenas Gold; sem acesso a dados brutos
Política de mascaramento (Silver)
Campo
Origem
Técnica
Perfil com acesso ao dado real
cpf / cnpj
REMS condôminos
Hash SHA-256 irreversível
Financeiro (nominado)
email
REMS condôminos, Graph API
Mascaramento parcial a***@***.com
Admin, Jurídico
telefone
REMS condôminos
Mascaramento parcial (11) 9****-****
Admin
nome_completo
REMS condôminos, RH
Mascaramento parcial João S.
Admin, Financeiro
bdi_percentual
SPS orçamentos
Mascaramento total
Gestores SPS, Diretoria
margem_bruta
SPS contratos
Mascaramento total
Diretoria, Financeiro
valor_contrato
SPS + REMS
Mascaramento por projeto
PM responsável + Diretor
aso_ficha
SPS documentos trabalhistas
Acesso bloqueado (Restrito)
RH nominado
PII Handling — Fluxo LGPD
Bronze:
→ PII armazenado criptografado (AWS KMS — Customer Managed Key)
→ Acesso apenas por Data Engineers + Admin
→ DLP scan automático na ingestão (AWS Macie)
→ Dados de condôminos isolados em path /residents_pii/
Silver:
→ PII substituído por versão mascarada/tokenizada
→ Coluna _raw removida; coluna _masked exposta
→ Audit log habilitado em todas as leituras de campos sensíveis
Gold:
→ NUNCA conter PII raw nem tokenizado
→ Apenas agregados (ex: taxa de inadimplência %, não lista de inadimplentes)
→ Revisão obrigatória antes de publicação em dashboard
Direito de exclusão (LGPD Art. 18)
Estratégia: soft-delete com deleted_at + hard-delete no próximo ciclo de compactação.
Solicitação de exclusão registrada em corp/lgpd_requests
Script de exclusão identifica todas as ocorrências via Unity Catalog lineage
Bronze: arquivo original arquivado em cold storage por prazo legal (se aplicável)
Silver: registro marcado com is_deleted = true, campos PII nulificados
Gold: rebuild da tabela afetada excluindo o registro