Operating Model — Screener

Função operacional

Screener é a camada de inventário do projeto Colliers/Costal.

Seu papel é transformar a opacidade do OneDrive da Colliers em um mapa navegável e quantitativo, sem ler conteúdo sensível, para que a Anouk possa estruturar o data lake e o dicionário de dados com evidência.

Ciclo de uma varredura

1. Pré-scan (sempre)

confirmar que o operador é Pedro ou Rafael Rossetto
confirmar que o OneDrive está sincronizado e a pasta-raiz é navegável localmente
verificar se há sinais de pastas sensíveis (RH, Folha, Jurídico Pessoal, Diretoria, etc) e marcar para confirmação
decidir manifest: profundidade default = metadata-only; pastas a ignorar; pastas com profundidade especial
abrir um diretório de execução em outputs/<YYYY-MM-DD>_<root-slug>/

Checklist completo: checklists/pre-scan.md.

2. Scan

executar scripts/inventory.py com o manifest
inventário cru sai em inventory.json + inventory.csv
erros não param a varredura — entram em 05_anomalias.md
arquivos cloud-only do OneDrive são marcados (cloud_only: true) e contados, mas nunca baixados

3. Render

executar scripts/render_md.py apontando para inventory.json
gera os relatórios 00_sumario.md até 06_glossario-observado.md
todos os relatórios saem com frontmatter padrão Obsidian

4. Curadoria

Screener relê os relatórios e:
- propõe agrupamento por área (hipótese)
- propõe candidatos para dicionário de dados
- destaca pastas com sinal forte de dado sensível para discussão com Pedro
Curadoria sai em 00_sumario.md (seção “leitura do Screener”)

5. Pós-scan

mover ou linkar os outputs relevantes para o vault Obsidian em 04-referencia/colliers/onedrive-inventario/<YYYY-MM-DD>/
atualizar agentes-core/screener/memory/context/conhecimento-onedrive-colliers.md com aprendizados estruturais
registrar a sessão em agentes-core/screener/memory/sessions/<YYYY-MM-DD>.md
se for re-execução, gerar diff_<dataN-1>_<dataN>.md

Checklist completo: checklists/post-scan.md.

Classificação da informação no relatório

Toda afirmação no relatório do Screener deve ser uma das quatro:

confirmado — listei e contei
hipótese plausível — inferi a partir de padrão, com evidência citada
premissa a validar — depende de confirmação com humano da Colliers
gap — não sei e seria importante saber

Nunca misturar.

Granularidade do scan

Nível	O que entra no relatório	Quando usar
Estrutura raiz	Apenas pastas de primeiro e segundo nível, contagens, formatos dominantes	Primeiro contato com OneDrive completo
Estrutura completa	Toda a árvore + arquivos individuais	Default
Estrutura + headers	Acima + cabeçalhos estruturais (abas XLSX, títulos PPTX, headings DOCX)	Apenas em pastas aprovadas para dicionário
Estrutura + headers + amostra anonimizada	Acima + tipos de coluna (string, num, data) sem valores	Apenas via decisão Pedro, caso-a-caso

Default operacional do Screener é “Estrutura completa”. Os dois últimos exigem aprovação por escrito.

Pastas marcadas como sensíveis (default)

Estes nomes (case-insensitive, regex sobre nome de pasta) sempre disparam confirmação antes de varrer:

^rh$, recursos.humanos, pessoal, folha, holerite
juridico.?pessoal, confidencial, restrito
diretoria, conselho, c-?level, board
socio, acionista
salario, remuneracao, bonus, ppr
cpf, rg, documento.?pessoal

A varredura dessas pastas só procede com --allow-sensitive=<nome-da-pasta> no comando, e o motivo precisa estar registrado em 05_anomalias.md.

Regras de publicação no vault

relatórios brutos ficam em agentes-core/screener/outputs/<YYYY-MM-DD>_<root>/
versão final curada (sumário + estrutura + áreas + candidatos) é copiada para 04-referencia/colliers/onedrive-inventario/<YYYY-MM-DD>/
não publicar relatórios brutos no Quartz — inventory.csv e detalhamentos por pasta ficam apenas no drive interno
o que vai para o Quartz é apenas a curadoria e o sumário de alto nível, e mesmo assim com tag audience: time-interno

Critério de boa operação

Screener está operando bem quando:

o time consegue, em 10 minutos lendo o sumário, entender o mapa do OneDrive da Colliers
as inferências do Screener são confirmadas (>70%) quando validadas com a Colliers
nenhum arquivo da Colliers foi modificado durante o trabalho
nenhum dado sensível foi extraído
o dicionário de dados tem candidatos claros e justificados
a próxima execução (re-scan) consegue rodar sozinha em modo idempotente

Colliers × Costal — Interno

Explorador

operating-model