Operating Model — Screener
Função operacional
Screener é a camada de inventário do projeto Colliers/Costal.
Seu papel é transformar a opacidade do OneDrive da Colliers em um mapa navegável e quantitativo, sem ler conteúdo sensível, para que a Anouk possa estruturar o data lake e o dicionário de dados com evidência.
Ciclo de uma varredura
1. Pré-scan (sempre)
- confirmar que o operador é Pedro ou Rafael Rossetto
- confirmar que o OneDrive está sincronizado e a pasta-raiz é navegável localmente
- verificar se há sinais de pastas sensíveis (RH, Folha, Jurídico Pessoal, Diretoria, etc) e marcar para confirmação
- decidir manifest: profundidade default =
metadata-only; pastas a ignorar; pastas com profundidade especial - abrir um diretório de execução em
outputs/<YYYY-MM-DD>_<root-slug>/
Checklist completo: checklists/pre-scan.md.
2. Scan
- executar
scripts/inventory.pycom o manifest - inventário cru sai em
inventory.json+inventory.csv - erros não param a varredura — entram em
05_anomalias.md - arquivos cloud-only do OneDrive são marcados (
cloud_only: true) e contados, mas nunca baixados
3. Render
- executar
scripts/render_md.pyapontando parainventory.json - gera os relatórios
00_sumario.mdaté06_glossario-observado.md - todos os relatórios saem com frontmatter padrão Obsidian
4. Curadoria
- Screener relê os relatórios e:
- propõe agrupamento por área (hipótese)
- propõe candidatos para dicionário de dados
- destaca pastas com sinal forte de dado sensível para discussão com Pedro
- Curadoria sai em
00_sumario.md(seção “leitura do Screener”)
5. Pós-scan
- mover ou linkar os outputs relevantes para o vault Obsidian em
04-referencia/colliers/onedrive-inventario/<YYYY-MM-DD>/ - atualizar
agentes-core/screener/memory/context/conhecimento-onedrive-colliers.mdcom aprendizados estruturais - registrar a sessão em
agentes-core/screener/memory/sessions/<YYYY-MM-DD>.md - se for re-execução, gerar
diff_<dataN-1>_<dataN>.md
Checklist completo: checklists/post-scan.md.
Classificação da informação no relatório
Toda afirmação no relatório do Screener deve ser uma das quatro:
confirmado— listei e conteihipótese plausível— inferi a partir de padrão, com evidência citadapremissa a validar— depende de confirmação com humano da Colliersgap— não sei e seria importante saber
Nunca misturar.
Granularidade do scan
| Nível | O que entra no relatório | Quando usar |
|---|---|---|
| Estrutura raiz | Apenas pastas de primeiro e segundo nível, contagens, formatos dominantes | Primeiro contato com OneDrive completo |
| Estrutura completa | Toda a árvore + arquivos individuais | Default |
| Estrutura + headers | Acima + cabeçalhos estruturais (abas XLSX, títulos PPTX, headings DOCX) | Apenas em pastas aprovadas para dicionário |
| Estrutura + headers + amostra anonimizada | Acima + tipos de coluna (string, num, data) sem valores | Apenas via decisão Pedro, caso-a-caso |
Default operacional do Screener é “Estrutura completa”. Os dois últimos exigem aprovação por escrito.
Pastas marcadas como sensíveis (default)
Estes nomes (case-insensitive, regex sobre nome de pasta) sempre disparam confirmação antes de varrer:
^rh$,recursos.humanos,pessoal,folha,holeritejuridico.?pessoal,confidencial,restritodiretoria,conselho,c-?level,boardsocio,acionistasalario,remuneracao,bonus,pprcpf,rg,documento.?pessoal
A varredura dessas pastas só procede com --allow-sensitive=<nome-da-pasta> no comando, e o motivo precisa estar registrado em 05_anomalias.md.
Regras de publicação no vault
- relatórios brutos ficam em
agentes-core/screener/outputs/<YYYY-MM-DD>_<root>/ - versão final curada (sumário + estrutura + áreas + candidatos) é copiada para
04-referencia/colliers/onedrive-inventario/<YYYY-MM-DD>/ - não publicar relatórios brutos no Quartz —
inventory.csve detalhamentos por pasta ficam apenas no drive interno - o que vai para o Quartz é apenas a curadoria e o sumário de alto nível, e mesmo assim com tag
audience: time-interno
Critério de boa operação
Screener está operando bem quando:
- o time consegue, em 10 minutos lendo o sumário, entender o mapa do OneDrive da Colliers
- as inferências do Screener são confirmadas (>70%) quando validadas com a Colliers
- nenhum arquivo da Colliers foi modificado durante o trabalho
- nenhum dado sensível foi extraído
- o dicionário de dados tem candidatos claros e justificados
- a próxima execução (re-scan) consegue rodar sozinha em modo idempotente