Agente: Screener
agente inventario discovery colliers data-lake
Codinome: Screener Papel: Rastreador de pastas e arquivos do OneDrive da Colliers Escopo: inventário read-only de estrutura, formatos e metadata para alimentar dicionário de dados e arquitetura do lake Status: Concepção (pronto para go-live assim que Michael liberar acesso ao OneDrive)
Resumo
Screener é o agente responsável pelo trabalho de inventário de dados do OneDrive da Colliers. Quando o Michael (TI Colliers) liberar nosso acesso, Pedro e Rafael Rossetto vão usar o Screener para mapear como cada área da Colliers organiza seu trabalho, em quais formatos os dados vivem e o que existe pasta a pasta.
O Screener não substitui especialistas de domínio. Ele gera insumos estruturados em .md para que o time da Anouk possa pensar com clareza sobre como evoluir a arquitetura e a engenharia de dados (lake, dicionário, ondas de agentes, integração com PowerBI/Sienge/etc).
O Screener é radicalmente read-only. Não modifica, não apaga, não copia conteúdo sensível para fora do contexto de trabalho.
Objetivo
- Mapear a estrutura completa de pastas do OneDrive da Colliers (top-down, recursivo).
- Catalogar arquivos por formato (xlsx, pptx, docx, pdf, png, etc), tamanho, data de modificação e profundidade.
- Produzir um relatório
.mdpor pasta de primeiro nível, com perfil quantitativo, padrões de nomenclatura observados e hipóteses de uso. - Identificar arquivos-candidatos para virar fonte do dicionário de dados (ex: planilhas que servem de base após o PowerBI).
- Permitir que o time evolua a arquitetura do lake com velocidade, em cima de evidência e não de achismo.
Modos do agente
- Scanner — varredura inicial de uma pasta-raiz, gera inventário bruto em JSON + relatório
.md - Curador — relê o inventário e propõe agrupamentos, hipóteses de uso por área e candidatos para dicionário de dados
- Diff — compara duas execuções para detectar o que mudou (útil quando rodarmos de novo após semanas)
- Dictionary-prep — para uma pasta aprovada, gera ficha de candidatos para o dicionário de dados (sem ler conteúdo sensível)
Arquivos principais
| Arquivo | Função |
|---|---|
system-prompt.md | Prompt principal do Screener |
operating-model.md | Modelo operacional (como conduzir uma varredura) |
security-guardrails.md | Política dura de read-only, anti-exfiltração e anti-modificação |
runbook.md | Guia passo-a-passo para Pedro/Rafael rodarem o Screener no terminal com Claude Code |
checklists/pre-scan.md | Checklist antes de iniciar uma varredura |
checklists/post-scan.md | Checklist após gerar o inventário |
skills/folder-inventory/SKILL.md | Skill principal: varredura e relatório por pasta |
skills/data-dictionary-prep/SKILL.md | Skill secundária: preparação de fichas para dicionário |
scripts/inventory.py | Script Python read-only que faz a varredura |
scripts/render_md.py | Converte o JSON de inventário em relatórios .md |
scripts/manifest.example.yaml | Manifest de exemplo (escolha de profundidade por pasta) |
memory/MEMORY.md | Índice da memória do agente |
Outputs vivos
Cada execução do Screener gera arquivos em outputs/<data>_<pasta-raiz>/:
| Arquivo | Uso |
|---|---|
00_sumario.md | Visão geral da varredura: contagens, formatos, top pastas, top extensões |
01_estrutura.md | Árvore de pastas com profundidade, contagem de arquivos e bytes por nó |
02_formatos.md | Distribuição por extensão, com tamanhos médios e exemplos |
03_areas/<area>.md | Um relatório por pasta de primeiro nível (área provável) |
04_candidatos-dicionario.md | Lista de planilhas/arquivos candidatos para dicionário de dados |
05_anomalias.md | Arquivos sem extensão, duplicados aparentes, nomes problemáticos |
06_glossario-observado.md | Termos recorrentes nos nomes de pastas/arquivos (insumo de glossário) |
inventory.json | Inventário cru (machine-readable) — input das próximas execuções |
inventory.csv | Mesmo inventário em CSV para análise no R/Python/Excel |
Regras essenciais
- O Screener é read-only. Nunca abre, modifica, renomeia, move ou deleta arquivos.
- Nunca copia conteúdo de arquivos para fora do projeto — apenas metadata (caminho, tamanho, data, extensão).
- Nunca extrai dados pessoais, financeiros ou estratégicos da Colliers durante o inventário.
- Em modo padrão, o Screener não abre arquivos — só usa
os.state listing. - A profundidade “metadata + headers” só pode ser ativada por pasta específica via manifest, com aprovação explícita de Pedro.
- O OneDrive sincronizado pode ter arquivos online-only (placeholders). O Screener detecta e lista mas nunca força download.
Ver também
-
Axios — agente de governança que vai consumir os outputs do Screener